2022-01-07 17:40

IEEEFellow李世鹏：人工智能与机器人前沿研究之思考

来源：AI科技评论

作者：维克多

编辑：青暮

2021年12月9日，由粤港澳大湾区人工智能与机器人联合会、雷峰网合办的第六届全球人工智能与机器人大会（GAIR 2021）在深圳正式启幕，140余位产学领袖、30位Fellow聚首，从AI技术、产品、行业、人文、组织等维度切入，以理性分析与感性洞察为轴，共同攀登人工智能与数字化的浪潮之巅。

大会次日，思尔实验室主任、前深圳市人工智能与机器人研究院执行院长、国际欧亚科学院院士、IEEE Fellow李世鹏在GAIR大会上做了《人工智能与机器人前沿研究之思考》的演讲。

李世鹏博士，IEEE Fellow，国际欧亚科学院院士。历任深圳市人工智能与机器人研究院首席科学家和执行院长、科大讯飞集团副总裁及讯飞研究院联席院长、微软亚洲研究院创始成员与副院长。李院士在多媒体、IoT及AI等领域颇具影响力。他拥有203项美国专利并发表了330多篇被引用了的论文（H指数：82）。被Guide2Research列为世界顶尖1000名计算机科学家之一。培养出四位MIT TR35创新奖的获得者。是（科技部）新一代人工智能产业技术创新战略联盟发起人之一及联合秘书长。

在演讲中，李世鹏介绍并展望了人工智能与机器人前沿研究方向，他指出：未来机器学习突破深度学习的数据瓶颈或许可以借助认知科学的方法得到突破，学习范式可从依靠“大数据”转变成依靠“大规则”；人机协作也要进化为人机“谐”作，只有将耦合、交互、增强、互补等目标纳入研究方向，才能实现人机的无缝连接。

以下是演讲全文，AI科技评论做了不改变原意的整理：

今天的演讲题目是《人工智能与机器人前沿研究之思考》，分为三个部分，先谈人工智能和机器人研究全景，然后聚焦研究方向，包括机器学习、运动智能、人机谐作、群体协作；最后进行总结。

人工智能相关研究的关键元素有三个：人、机器人/物联网以及AI。之所以将机器人和物联网归为一类，是因为这两者是物理世界和虚拟世界的接口。如果三个元素两两之间发生联系就会形成一个新的学科，例如机器人和AI相结合会产生智能体，AI和人类相结合会产生人机耦合以及增强智能，而机器人和人类相融合会形成增强机体。随着人工智能与机器人领域的发展，研究对象不再局限在单个智能体，而是越来越多地对多个智能体的协作进行研究，例如人类社会群体如何更好地相融合？如何设计出能够精妙协作的机器群体？

总体而言，我认为重要的基本研究方向是：机器学习、运动智能、人机谐作、群体协作。

聚焦方向之机器学习

机器学习的发展离不开深度学习加持，它给行业带来许多研究成果，并赋能了语音识别、人脸识别、物体识别、自动驾驶等方面，推动人工智能产业高速发展。

虽然成果颇丰，但成也萧何败也萧何。深度学习依赖于大数据，其瓶颈也在于大数据。例如国内的智能语音技术尽管处于行业领先，但仍依赖技术积累和数据积累。现在想要让深度学习发挥巨大威力，仍然需要大量数据的加持，如果想让深度学习从一个领域扩展到另一个领域，也少不了数据支撑。

如何突破？研究者已经探索了多条路径，其中一个解决方案是：扩展深度学习框架。例如优化深度学习算法、知识图谱+深度学习、专家系统+深度学习等等。另一条路径是因果推理，其目标是借助人类举一反三的能力，期望超越数据之间的相关性，进而探索数据之间的因果性，从而得到数据之间的逻辑推理。

第三条路径是类脑计算，从生物学角度，探索人脑认知元素和机制，以仿真方法再现人类大脑。

个人认为认知科学是突破深度学习框架的着力点。理由是人类认知过程有两点需要我们去进一步借鉴：生而知之、学而知之。

生而知之是指部分认知能力与生俱来，新生儿的脑神经有很多先天的连接。它给我们的启示是：现在的大多深度学习算法，大部分都是从零开始训练，而没有充分或者高效利用先验知识或者已有模型。如何利用“现有知识”是深度学习的下一个热门方向。

学而知之是指大部分认知能力是后天学习到的，尤其是早期学习。通过学习脑神经建立了更多的连接。孩子很多能力，包括感知、应对、语言、读写和理解，甚至分析问题和解决问题的思路和能力在很小时候已经基本定型；以后基本都是知识的积累。这意味着脑神经元很早的时候就连接定型成一个元模型，剩下的是只是利用这个元模型去解决具体领域的问题。这个与当前的大规模预训练模型有着惊人的相似之处。

学而知之的另一层次是：人类学习过程依靠多源的、多传感的、多模态的、多角度的数据，例如视觉、听觉、嗅觉、触觉和语境等联合信息，而今天的深度学习依靠大都是一段语音、一张照片，因此，未来AI模型的输入数据可能不仅是单一的数据，而是多个信号源的融合。如何模仿人类学习的过程，这是认知科学对深度学习的另一个启示。

再者，人类学习过程是一个从样本示例到原理归纳的过程，而不是仅停留在样本示例层面；目前深度学习却都是停留在样本层面。那么，未来是否能够构造类人的机器学习框架，无论输入什么样的数据，只要逻辑相通，都会收敛到一致的模型？

突破深度学习的数据瓶颈，可以尝试构建规则的众包系统，让人类教机器学习过程，其目的不是输入数据，而是让机器学习规则。由于我们试图从日常的活动中学习规则，这种规则普通人都可以标注示教，这就打破了以前专家系统地需要“专家”的局限。这种从“大数据”过渡到“大规则”模型构建方式显然也更符合人类的认知。

聚焦方向之运动智能

众所周知，在机器人领域，波士顿动力公司的产品最“像人”，如上动图，机器人跳舞丝毫看不出生硬的感觉。但受计算资源、能量、运动控制的限制，它只能运行几十分钟。其实，波士顿动力机器人的运行方式是基于电机驱动，存在很多缺点，例如刚性运动、自重比较大、反应速度和灵活性的矛盾以及耗能大。

对比人类和其他动物的运行方式，肌肉、骨骼、传感和神经的结合可以在低能耗情况下，实现灵活运行。这给研究者的启示是，机器人的运行系统应该像人一样满足：高效、灵活、精确、鲁棒、刚柔并济、轻量、自适应等指标。当前的运动智能可能在某一个维度表现优秀，但综合考量仍然有很多缺点。

因此，运动智能的一个重要研究方向是：仿生。仿照动物的运动智能，例如运动控制采用逼近反馈式，运动过程视变化随时灵活调整。

如果说机器人是靠“内力”驱动，而医疗微纳米机器人是“外力”研究方向的代表。例如依靠磁力，小机器人精确地将药物从一个管道运送到另一个管道。

聚焦方向之人机谐作

在人机谐作层面，区别于协作，“谐作”代表人机协作中的耦合、交互、增强、互补、协作、和谐等意思。人机谐作的目标是：不需要告诉机器人类的意图，机器就能领会，从而达到人机的无缝连接。

在达成人机谐作的过程中，重点研究人机自然交互、感知及增强。具体可能包括：生物特征检测和识别、人机接口、脑机接口、语音识别、动作识别、表情识别、语言理解、意图理解、体态感知、无隙增强，以及在扩展现实与远程现实的延伸等等。

人机增强智能方面，今天的机器学习框架大都是基于大数据的深度学习框架，肯定会遇到机器智能处理不了的情景。这对于某些高风险领域，例如自动驾驶、金融等来说是致命的。

针对这一问题，当前的解决方案是“人类接管”。这会涉及三个核心问题：

核心问题1：机器智能如何感知自己处理不了一些情况，而主动要求人来接管？

核心问题2：什么时候人类可以完全放手给机器自主完成任务？

核心问题3：什么样的人机交互设计能充分发挥人和机器各自的长处，同时又无需非必要地麻烦对方？

三个核心问题如果无法解决，会导致一些困境。例如，以自动驾驶为例，目前安全员并不是开了“自动”功能就一劳永逸，仍然需要时时监测路况与路线，一刻都不能分神。这其实增加了安全员的负担，因为在没有自动驾驶的时候，人类对自己的驾驶环境会有一定的预测，而机器驾驶的情况人类无法预测。

人机增强机体也属于人机谐作的一个领域，能够帮助人类增强物理机体能力，完成一些人类自身体力完不成的事情。但机器可能过于复杂，需要人类培训后才能操作。人机增强机体的未来目标是实现人与机器和谐共处，操控起来如同人类的自己的器官一样自然。其中，涉及的核心研究课题包括：机器感知人的意图、人的姿态、理解人的自然语言命令、肢体语言等等，从而让机器以最适合人类接受、恰到好处的平滑方式帮助人解决问题。

聚焦方向之群体协作

目前单智能体已经可以完成许多任务，但如何发挥每个智能体集合起来的威力？这涉及群体协作的研究方向。在仓储场景下，存在许多抓取分类的机器人，如果能够有效调度，那么必将大大提高工作效率。

当前主流的调度方式是中心化的控制方式，但面对成千上万的规模的智能体，则需要非中心化的控制，允许智能体之间存在自主行为，在相互协作的同时，还能“做自己的事”。即单独的有智能可独立行动的智能体，通过协作而达到的更高效的群体/系统智能和行为。

智能体群体协作目前涉及的规则包括，群体行为模型和激励机制、群体智能协同决策。这一方面，蚂蚁是我们的学习对象。另外，在自动驾驶方面，越来越多自主驾驶机器人出现，它们之间如何做到协同感知和协同控制也是当今热门话题。

上述四个方面属于基础性的研究，任何一个领域出现了突破，那将对其领域以及下游应用而言都是革命性的突破，也将带来工业数智化原创技术的创新，会让我们在竞争中占领优势地位!

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）大脑研究计划，构建互联网（城市）大脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

上一篇：神十三航天员完成手控遥操作交会对接试验
下一篇：CES的亮点：折叠屏这么卷！

美方“黑名单”伸向中国人工智能企业，如何破局？

直新闻：周四美国再将36家中国实体列入实体清单，同时将25家中国实体从“未经验证清单”移出，管先生，这一进一出意味着什么？特约评论员管姚：把世界经济尤其是高精..

平安银行机器人安安，银行机器人安安是真的吗？

大家好，小编来为大家解答平安银行机器人安安这个问题，银行机器人安安是真的吗很多人还不知道，现在让我们一起来看看吧！财务人员要具备哪些能力？一、专业胜任能力及职业道德素质良好的专业理论知识，是我们财务人员从业必备的基本武器;丰富的实践经验是我们财务人员进阶的横梯。虽然，后者并不是每..

小度ai学习机，小度AI机器人？

大家好，关于小度ai学习机很多朋友都还不太明白，不知道是什么意思，那么今天我就来为大家分享一下关于小度AI机器人的相关知识，文章篇幅可能较长，还望大家耐心阅读，希望本篇文章对各位有所帮助！小度学习机充满电玩多长时间5至6小时。正常只要充电3至4个小时，就可以待机12个小时左右，用来视频学习..

优优u05机器人多少钱，U05机器人

大家好，今天来给大家分享优优u05机器人多少钱的相关知识，通过是也会对U05机器人相关问题来为大家分享，如果能碰巧解决你现在面临的问题的话，希望大家别忘了关注下本站哈，接下来我们现在开始吧！杭州商用零售导购机器人哪家比较好点？1、国辰机器人——迎宾服务机器人主要功能：国辰迎宾服务机器..

扫地机器人有用吗扫地机器人有用吗?

扫地机器人是一种具有自动吸尘的家器，也可以说是一种智能电器。下面，我们来看看扫地机器人是否有用吧。操作方法01识别垃圾扫地机器人是通过红外线传感应识别地面上的垃圾..

太多次“请您接管车辆”，真的是人工智能

这辆小鹏P5我们不仅要聊它的驾驶品质，更要看看它的智能辅助驾驶究竟好不好用。如果视频无法播放，长按下图，点击“识别二维码”，或关注微信公众号：大飙车小鹏P5全系标配..

欧尚Z6上市燃油混动全覆盖，9.99万起即可拿下“汽车机器人”

自开启全面向乘用车转型的征程后，长安欧尚汽车接连推出欧尚X7、欧尚X5和欧尚X7PLUS等诸多爆款车型，在竞争激烈的SUV市场中开辟出了一片天地。而在今年初，汽车机器人欧尚Z..

GPP人工智能辅助识别和全病程管理项目获得成功

由中国罕见病联盟皮肤罕见病专业委员会发起，行业各界共同建设的“GPP人工智能辅助识别和全病程管理项目”取得了成果：泛发性脓疱型银屑病（GPP）人工智能辅助识别工具于6..

海南试驾汽车机器人欧尚Z6，好看皮囊里还有什么亮点？

在汽车圈里，号称互联网汽车很多，但第一个号称汽车机器人的只有长安欧尚Z6，到底有多智能？如今中国品牌电动汽车主打智能的越来越多，欧尚Z6除智能外，开起来怎么样？费油..

神通机器人教育：2022年第一季度亏损同比缩窄，续亏125.8万港元

8月5日，神通机器人教育（08206.HK）发布公告，截至2022年6月30日止三个月第一季度业绩，集团录得综合收益约187.1港元，同比减少约71.0%；第一季度亏损同比缩窄，续亏125.8..

机器人精准“除瘤”她的肾脏终于保住了

达芬奇手术机器人是近年逐渐进入大家视野的一个手术操作系统，由外科医生控制台、床旁机械臂系统、成像系统三部分组成。其特点是可取代外科医生的手进行精细化操作。其设计..

创造“汽车机器人”新物种？集度需要在更高维度打造全新卖点

集度要想开创“智能汽车3.0时代”，就要超越特斯拉建构的框架，在更高的维度上打造完全不同的卖点，这个卖点不是智能座舱和智能驾驶，而是基于AI的更高级的人机交互。集度..

长安欧尚搞了台15万级的“汽车机器人”？

有没有想过，花15万元能买一台“汽车机器人”？在汽车智能化飞速发展的这几年，汽车丰富的智能化功能给车主带来了很多便利性，同时也让人觉得有点“科幻”。而在近期，长安..

工业机器人价格是多少，nachi工业机器人价格

今天给各位分享工业机器人价格是多少的知识，其中也会对nachi工业机器人价格进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！工业机器人要多少钱一台？工业机器人很多种类型的，如喷涂，焊接，打磨，上料，打螺丝等等，而且还分型号，每种机器人每种型号价格都不一样，一般来..

本文由人工智能学家来源发布

IEEEFellow李世鹏：人工智能与机器人前沿研究之思考

人工智能机器人

评论问答