向光电要算力，向认知科学要算法，2066年AI或取代人类任务

2020-09-03由戚国庆发布于科技

中国人工智能学会理事长、国务院参事、中国工程院院士戴琼海

【导读】作为人工智能的先行者，微软小冰已升级到第八代，倡导并推广新型人人交互模式。交互是人类社会发展的重要驱动力，随着对现有交互瓶颈的不断突破，新形式的人工智能交互将无处不在，并对人类社会及商业行为产生深远影响。未来已来，人工智能应该怎么往前走？算法和算力该怎么解决？人和AI 将怎样共处？日前，中国人工智能学会理事长、国务院参事、中国工程院院士戴琼海分享了“人工智能的几点思考”。

新算力：不仅向物理要，还要向脑科学、光电计算、存算一体等要

跨学科交叉是人工智能时代的典型标志，比如潘云鹤院士提及的认知视觉和认知表达，都是典型的跨学科研究。人工智能技术海纳百川，比如计算机视觉、自然语言理解、机器人和逻辑推理等，且在医疗、电子、金融等行业都发挥了巨大作用。下面我将从三个层面浅析一下人工智能时代的几个问题：第一个是算力；第二个是算法；第三个是人与AI 怎样相处？

首先，是算力。1956 年Rosenblatt 的感知机只包含了512 个计算单元就能做数据分类。但人工智能发展过程中一直受到算力的困扰，直到GordonMoore 提出了集成电路芯片上所集成的晶体管数量每18 个月翻一番，为后来的几十年芯片技术的发展指明了方向。1999 年，NVIDIA 发布了GPU 进行并行的数据处理，使得人工智能向更加广阔的领域发展。2012 年，Alex 使用AlexNet 进行GPU加速，开启了深度网络应用的先河。接下来就是众所周知的谷歌AlphaGo，拥有5000 个GPU，训练40 天，就可以打遍天下无敌手，说明并行计算、专用芯片对人工智能具有重要的推动作用。

Rosenblatt于1958年发布感知器算法，即使用单个神经元、单层网络进行监督学习（目标结果已知），并且输入数据线性可分

我们再看看现有技术的发展。流媒体视频占全球互联网下行流量的58%，2019 年8 月国内互联网的终端数已经突破了20 亿，这些数据都需要巨大的算力支撑。

但是算力的提升速度已经不再遵循摩尔定律了。从第一台计算机出现到后来的几十年，芯片算力基本符合摩尔定律。但随着时间的推移，芯片上晶体管的密度增长已经不再遵循摩尔定律，于是国际科技巨头都开始发力，比如谷歌的TPU 和中国的地平线、寒武纪都是将设计神经网络专用芯片来提升算力。但这些芯片都是专用的，无法满足通用人工智能的发展需要。

我以前常说，理学思维，工科实践。物理要求什么？比如量子力学、量子计算。众所周知，英特尔、谷歌在处理特定任务时，发现量子计算速度远高于现在的计算机。随着有效量子比特的数量不断增加，他们希望（尤其谷歌）在量子计算领域成为霸主。但现实是经过物理学家们的分析，其中许多问题尚未解决，比如如何长时间保持足够的量子比特的相干性，这是一个重要问题；同时在这个时间内做出足够的超高精度量子的逻辑计算也是一个难题。

因此，在未来的一段时间里要想完全用量子计算提升算力，是完全实现不了的。于是，人们提出了存算一体的架构，提升它的算力。所以，人工智能时代走入了交叉时代，除了向物理要算力，还要向脑科学要算力，比如类脑计划，希望通过模拟脑科学里的机理提升算力；不仅如此，还要向物理的边界、光电计算要算力；同样还有也要向存算一体、光电+ 要算力。

向光电计算要算力，目前国际上已作出三个贡献，能使计算中心小型化

如何从光电计算要算力？普林斯顿大学的教授做过一个理论分析，进行神经网络计算的构架，从理论上推算，它能提升三个数量级的算力，同时功耗也能降低6 个数量级。功耗现在也是提升算力要考虑的一个重要问题。光电计算能够给这方面带来巨大的福利，使得算力提升三个数量级，功耗还能下降6 个数量级。目前这方面的研究工作已经起步。

光电计算并不是一个新东西，它和人工智能一样，也是20 世纪50 年代诞生的。只是计算的计算机半导体、硅基的芯片就已经满足需求，所以研究者就渐渐减少了在这方面的研究。尤其是在1990 年贝尔实验室用砷化钾做了一个光学开关来控制计算机的原型，由于当时对算力的需求较小，所以芯片就可以解决。而现在随着人工智能对芯片的极致要求，从2017—2019 年，很多机构都对光电计算的研究作出了重要贡献，比如三维受控的衍射的传播时间，以及全并行的光速计算。通过研究能够很快识别一个文字，因为光是不需要电的，所以这种光计算不需要耗电就可以做到以可控高维的光场传播，从而实现高速高效并行的计算。因此构建光电计算的架构，成为现在解决算力的一个重要研究方向。

1990年1月29日，美国贝尔实验室宣布研制出世界第一台光计算机

光学作为新的计算途径，它带来的最重要的变革，一是范式变革；二是算力提升；三是功耗下降。正因其诸多优点使得国内外很多研究机构都开展了相关研究。目前国际上作出的贡献有三个，麻省理工做的干涉神经网络架构非常不错；明斯特大学和剑桥是留相片材料，做脉冲的架构；清华大学是用衍射神经网络做架构。三种不同的方案都各有优势，也各有不足。光电计算的算力能提供3 个数量级，使无人系统更快、更小、更智能。希望大家关注这个方向。

光电智能芯片最重要的特点是什么？是它们对庞大的计算中心小型化。我们现在的计算中心都要消耗很大的电能，如果使用光电计算就能节省许多电能。第二，纳秒级目标感知与识别。纳秒级的感知目标与识别非常快，现在使用相机拍摄，要转成电，然后再计算。试想如若它是直接光进到相机就计算了，那么速度就变得非常快。因此光电智能芯片对新基建里的工业互联网、计算机视觉、大数据分析和光通讯都有重要的支撑作用。这是对算力的一个探讨、一个思路。

新算法：从脑科学到人工智能的认知科学是一条未来研究道路

第二是算法。现有人工智能仅实现了简单的初级视觉感知功能。在初级视觉感知信息处理与高级认知智能过程中，性能远不如人脑，人脑具有物理学习和数据的抽象能力。有些学者认为深度学习存在极大的危机，BP 算法有很大局限性，需要推倒重来，需要再次从大脑的认知机理模型中寻找灵感。

新一代认知智能作为现在算法上国际上最重要的结合点。众所周知，1969 年BP 算法的雏形是从控制里面来的，是从最优控制理论中产生、采集的。直到1989 年卷积神经网络诞生。认知和神经科学家首次将BP 算法引入到多重神经网络，构建了认知计算模型。再到2015 年的计算模型。由此可以看出BP 算法是深度学习使用最为广泛的，但是它仍存在很多问题。

从1958 年开始研究的卷积神经网络来看，1981 年的诺贝尔奖得主发现人的视觉是分层的，有高层的视觉分层，也发现视觉系统卷积的特性。于是1980 年日本学者提到简单复杂的细胞概念，提出了新的认知机理。David Marr 认为，人对视觉信息的表征和处理的计算研究得出了一个重要的结论，视觉和感知效应的关系。2007年Tomaso Poggio 提出了H-MAX 模型。2012 年Alex 的贡献开启了人工智能的黄金时代，得到了广泛的应用。通过算法的历史分析，就能预测未来。

卷积神经网络常用来分析视觉图像，其创始人是著名的计算机科学家Yann LeCun

最近几家机构的研究都取得了突破，一是2019 年报道的施路平教授；一是2020 年报道的已经起到了重大作用的吴华强研究类脑的存储一体的芯片。因此，中国在这方面的研究应该在国际上处于并跑的阶段。

关于人工智能理论的推算我们做了一个对应和比较，即如何利用脑机器启发人工智能新理论，实际上是作为新一代人工智能发展的一个重要途径。我们把它们进行类比、对照，说明什么？很多人工智能专家都借鉴了脑科学的一些机理来响应人工智能应该怎么往前走？这个算法应该怎么解决？怎么具体解决？

认知科学一个是多模态的回路观测，要观测脑科学里的东西。我们认为，从脑科学通过认知科学的研究到达人工智能，这就是走另外一条途径，叫做从脑科学到人工智能，这即是我们所说的未来希望的一条道路，也是研究人工智能新算法的一条道路。我们希望认知科学就是这道桥梁。

极限交互：在危险的场景里，形成未来人-AI- 物融合社会的发展

第三，人和AI 怎样共处。众所周知，AI 赋能人类，而不是成为人类，更不是取代人类。因此，人工智能与人类和谐发展，需要考虑人工智能与人类之间协同安全、隐私和公平的问题。最终实现以人为本、服务于人的目标。目前孙富春老师和吴飞老师在负责“未来的人工智能安全教育和它与人类的合作的调研”的课题，调研完成后准备和美国人工智能学会、欧洲人工智能学会讨论人类命运共同体的话题。

以人为本、服务于人类要探索也回避不了四个问题，分别是伦理、隐私、协同和安全。人和AI 要有交互，人和自然界也要交互。极限交互是什么意思？在危险的场景，我们希望通过AI 和AI 交互，AI 和场景交互，人类和AI 交互，即我们看不见的、看不清的、听不见的、触摸不到的，我们称之极限交互。AI 交互实现颠覆性用户体验，提高人类认知和改造世界的能力。这就是说极限交互的特点。

我们和AI 怎么交互？比如通过虚拟现实这样的一个接口来进行交互。虚拟/ 增强现实、自然交互技术，这就是未来信息获取与交互的一种方式，它能拓展人类的能力，改变产品形态和服务模式，也能推动认知、智能与文化艺术的变革，促进未来人-AI- 物融合社会的发展。这即是我们所说的一个特征。

虚拟现实艺术是以虚拟现实（VR）、增强现实（AR）等人工智能技术作为媒介手段加以运用的艺术形式

我们现在开会都线上开展，很多机构都在开发线上虚拟线下，如《王牌特工》中所展示的。这时就相当于一种极限环境。我2020年年底可能就有望见到。所以，这即是我们所说的沉浸式AI 交互。这样就可以实现全息智能教学。比如智能精准的推荐、线上泛在接入、真人的全息授课、沉浸交互课件。根据今年的AI 研究发展，AR 眼镜最轻可以达到50 克，此前AR 眼镜很重，所以发展不起来。未来AI 驱动的混合现实，赋能教学、生产、设计和交流，包括工业设计都可以在此开展，这是未来AI 交互的一种重要的工具，也是人和AI 之间交互的一个重要的途径。

带有预测性的愿景：从2016年到2066年，智能驱动未来，AI逐渐达到人类水平

脑机接口、人机融合、人机“共生永存”，包括意识存储的概念，能不能永远存在机器人身上或者存储到一个地方。这都是未来发生的事，但未来已来，现在脑机接口发展非常快，我们经常说的脑疾病，比如阿尔茨海默症、癫痫病。如果找到了这样的病理特征时，我们有两种再生方法。如果知道神经元的种类，可以用其他的神经元修复这种生物的修复方法，把这些神经元修复好；还有一种用我们超材料代替这些神经元的活跃程度。如果能做得不错，脑子就能够保持高度清晰，人类寿命延长50 年是一个很正常的事情。

智能驱动未来，我们有更聪明的“大脑”、更灵巧的“手”、更明亮的“眼睛”、更灵敏的“耳朵”。智能光电芯片、知识驱动、数据驱动、认知驱动，这是智能驱动的一个大的未来。从这里可以看出，人工智能逐渐达到人类水平。从时间表2016 年开始，一直规划到2066 年，所有人类的任务都取代了，机器AI 都能够把它完成。当然这是我们的愿景，这个愿景是带有预测性质的，也带有一定的基础讨论。

编辑：袁琭璐

责任编辑：李念

综合自中国人工智能学会、快科技