扎心了,机器都比我会学




能自动避开障碍物的无人驾驶的汽车,在无聊时供我们“调戏”的智能手机语音助手,能比亲朋好友还懂我们所爱的推荐算法…不知道你是否已经注意到,人工智能技术早已渗透进我们的生活的方方面面,我们现在身处的时代,正以前所未有的速度接近下一次技术革命,而开启下一次技术革命大门的钥匙就藏身于人工智能的广阔蓝海中。

Part.1

机器学习,也得先打好基础

面对自动开启关闭的家用电器、和智能音箱对谈的时候,也许你会对于它们的贴心智能大呼不可思议,机器是如何读懂我们想法的呢?事实上,我们目前的人工智能基本都是基于机器学习技术实现的。

机器学习,顾名思义,就是让机器具有学习的能力,而学习能力正是普通机器与人工智能的分水岭。让我们回到1765年詹姆斯·瓦特改良蒸汽机的时代,无论春夏秋冬,这台开启了人类第一次工业革命的机器只会日以继夜地重复着一个动作,任何人看到这台机器的时候都不会把它与“智能”二字联系起来。随着科技的进步,人们设计了许多更为复杂的机器,但它们仍然不具备基本的智能。

这种情况一直持续到20世纪50年代,计算机理论发展迅速,机器学习终于登上了历史的舞台。机器学习的基本思想其实并不复杂,我们通过对算法输入大量数据进行训练,让算法生成模型来实现对其潜在规律的揭示和对未来情况的预测。试想,从明天开始,你试图对家门口路过的洒水车的行为进行预测,前六天,你发现洒水车每天都会五点准时路过,此时你自然而然形成了一个简单的认识(模型):洒水车每天五点都会路过。如果第七天是周日,洒水车放假了(但你并不清楚),你发现洒水车没有再像往常一样路过,此时意味着之前的模型并非是完全准确的,于是又过了一周,洒水车仍然是前六天每天五点到,周日不再出现,你便可以通过新数据来纠正模型,从而更加接近事实。

这个过程和我们的学习过程是一样的,一开始,我们的机器就像一张白纸,一无所知,正如同第一天之前我们也不知道洒水车会来,但这不重要,当我们试图给具有机器学习能力的机器输入数据的时候,一切都变得与众不同了,假设上面故事的主角是一个十分懒惰的人,他不愿意自己去动脑筋思考洒水车什么时候来,于是他希望让机器学习帮助自己预测洒水车的行为,他把每一天洒水车的行为数据输入到算法中,这个过程我们称之为“训练”,通过大量的数据训练,我们的机器学习算法对于洒水车行为的预测将会越来越准。

图1 机器学习过程与人类学习过程异同

Part.2

“三年高考五年模拟”,机器也躲不过题海战术

有了数据之后,我们还需要选择合适的“学习方法”才能让AI学得更快更好。你可能已经或多或少听到过一些与机器学习有关的名词,但却一头雾水,比如监督学习,强化学习等等,实际上这些都是描述机器学习过程中不同的训练方法,往往适用于不同的情况。

例如,我们希望让一个算法学会辨认猫和狗,如果我们提前给算法看大量猫狗的照片,并且告诉它这张照片是猫还是狗,那么这就叫监督学习(Supervised Learning);如果我们给算法大量猫狗的照片,但是不告诉它哪些是猫哪些是狗,而让算法自动寻找猫和狗的差异,这就叫非监督学习(Unsupervised Learning);如果让算法不断地做选择题,每次都让算法看图后选择是猫还是狗,答对奖励加分,答错惩罚扣分,算法在试图尽量得分,规避扣分的情况下经过大量训练便会自己“进化”出正确辨认猫狗的能力,这就是强化学习(Reinforcement Learning)。

所以看到这里你大概应该能猜到我们是如何让机器学习工作了,正是通过大量的数据训练,机器才能拥有如此强大的能力,即使Alpha Go背后的科学家们并不是围棋大师,甚至完全不会围棋,也能让Alpha Go战胜世界冠军,而这在传统的机器身上是不可能发生的,因为它的所有行为都是设计者提前编写好的,因此它无法实现超出设计者认知的行为。

Part.3

机器学习:并非无懈可击

看到这里,也许你想问:“那么,机器学习是否意味着我们离人工智能时代已经近在咫尺了呢?”

很可惜,我们距离真正的强人工智能还有很大的差距,这是因为当前的基于数据的人工智能算法在很多时候是具有很大局限性的。比如,一个接受长期辨识猫狗训练的AI 可能会把吉娃娃错认为猫,也有可能会把无毛猫误认为狗,这主要是因为机器学习得到的结果好坏与训练数据是高度相关的,如果训练AI用的数据是偏颇的,比如训练用的猫的照片基本都是有毛长尾猫,狗的照片基本都是大型犬,那么这样训练得到的AI 将很容易在辨识某些其他种类的猫狗时犯错。

目前的AI更致命的问题在于,很多时候,由于机器学习的可解释性缺陷,其是一个黑箱过程,我们无法解释它到底是根据什么特征做出判断,我们人类在学习辨认猫狗的时候,往往会把判断特征集中在猫狗身上的某些关键部位,但一个通过图像训练得到的AI,即使结果正确率很高,但却有可能把某些判断特征放在环境上,显然这是不合理的。这样的特征导致AI的应用存在潜在的风险,例如一个自动驾驶AI如果我们不能判断出它是根据什么做出驾驶决策,那么即使它在推广前的测试中无比安全,也可能在现实中出现的复杂路况中犯致命错误,去年3月份发生在美国的一场车祸就是因为辅助自动驾驶系统错误地把卡车的白色车厢识别为了天空,导致汽车径直撞了上去。

有趣的是,这也从另一个角度为我们阐明了一个道理:题海战术虽然有用,但并不高效,而且会导致潜在错误,要想从根本上学习新知,就要运用到因果逻辑,从根本上搞清楚事物的来龙去脉,而这也正是科学家们目前希望在人工智能身上实现的。

Part.4

实现因果逻辑,机器还需努力

贝叶斯网络的创始人,图灵奖得主朱迪亚·珀尔认为,让人工智能实现本质飞跃的关键就藏在每一个人的大脑中,上天赐予我们人类的最为强大的武器——因果逻辑。

珀尔把因果思维分成三个等级:第一个等级是关联,与之对应的是观察的能力,这是我们目前的基于数据的弱人工智能所处于的级别;第二个等级是干预,对应控制变量实施行动的能力,即能够借助干预来获得认知;第三个等级是反事实,对应想象的能力。幸运的是,我们所有人都处在第三层级,想象给予了我们通过想象构建反事实——即虚构的世界的能力来建构认知,例如著名的电梯思想实验引导爱因斯坦在一个世纪前将狭义相对论推广到具有加速度的非惯性系中。

图2 珀尔的“因果阶梯”

(图片来源于朱迪亚·珀尔的著作《为什么:关于因果关系的新科学》)

关联和因果的区别在于,关联是数据间最表层的信息,也即是相关性。例如,数据表明,一年中的温度与犯罪率有相关性,温度低的时候犯罪率更高,如果我们把这些数据输入只懂得分析关联性的AI,它在预测犯罪率的时候便容易犯错。比如春节期间犯罪率上升的原因主要是因为春节期间小偷的活动变得频繁,而春节一般是温度最低的时候,因此如果仅仅从关联的角度分析数据,我们将会得到气温降低导致犯罪率上升的结果。假如我们用这个AI去预测一个没有春节文化的国家的恶犯罪率,或者是一个气温异常的年份的犯罪率的时候,显然会得到错误的结论。

但是从因果的角度出发,我们不仅要分析数据之间的关联性,还要判断其内部的逻辑链条,比如,当温度全年保持不变,犯罪率是否还会变化?如果得到的答案是“是”,那么我们便认为除了温度还有其它的影响因素,比如去年由于疫情,春节人员流动降低,虽然冬天温度仍照常下降,但犯罪率却没有随之变化了,那么我们便认为春节人员流动才是导致犯罪率变化的主要原因。

珀尔认为,从机器学习上升到因果学习的一个重要渠道是引入“干预”(do)算子,P(A|B)与P(A|do B)完全不同的。其缘由在于,“干预”与“观测”本质上有根本的不同,例如:观测到公鸡打鸣和强制让公鸡打鸣是完全不同的两件事,我们目前的算法可以很容易回答公鸡打鸣和太阳升起这两件事之间的相关性,可是它却很难正确回答强制让公鸡打鸣时是否也会太阳升起。珀尔认为,只接受被动观测数据的人工智能是无法攀登上第二级阶梯回答与干预有关的问题的,也就无从理解“公鸡打鸣”与“太阳升起”这两件事之间的因果关系,因为因果关系的确认需要进行控制变量实验,而这样的实验本身是建立在干预上的。也许你会问,如果观测到维度足够大,获得足够充分的数据是否可以代替干预呢?实际上我们很难保证数据范围与实际测试环境的一致,更困难的地方在于很多时候无法先验地知道数据本身是否是完备的,这就导致无论我们用多么巨量的数据去训练得到的算法都有可能因为数据与测试环境的不完全一致而出错,这被称为OOD(Out of Distribution)问题,就连图灵奖得主Yoshua Bengio也认为OOD泛化是当前人工智能最急需解决的一个问题。

看到这里,你大概能知道为什么我们离想象中的人工智能还差得很远,因为我们目前构建的人工智能,别说拥有第三层级的想象力了,其甚至连判断因果的能力都没有。很幸运的是,科学家们已经认识到,因果学习是让人工智能实现下一次飞跃的关键了,许多科学家相继投入了因果机的理论研究当中,例如清华大学的崔鹏教授提出了将因果推理与机器学习相结合的稳定学习(Stable Learning)来改进OOD泛化问题,CMU的黄碧薇博士利用因果发现在时间序列的非稳态数据上实现了更精准的预测。我相信,伴随着技术的发展,人工智能技术一定会越来越可靠,并且造福人类!

参考文献:

1. 【惨烈!特斯拉再次撞上白色卡车,两名乘客急送ICU】https://mp.weixin.qq.com/s/2OSlB4-zvwFJE0HMIvNeAw

2. Zheyan Shen, Peng Cui, Tong Zhang, and Kun Kuang. Stable learning via sample reweighting. In AAAI, pages 5692–5699, 2020.

3. Huang, et al., Causal Discovery and Forecasting in Nonstationary Environments with State-Space Models, ICML, 2019.

4. BAREINBOIM E, PEARL J. A general algorithm for deciding transportability of experimental results [J]. Journal of causal Inference, 2013, 1(1):107-134.

5. J. Pearl, “The Seven Tools of Causal Inference with Reflections on Machine Learning,” Communications of ACM, 62(3): 54-60, March 2019

6. 【崔鹏:稳定学习——挖掘因果推理和机器学习的共同基础】

https://mp.weixin.qq.com/s/f-rI5W6tc6qOzthbzK4oAw

7. Pearl, J., Mackenzie, D. (2018). The book of why : the new science of cause and effect. First edition. New York, NY: Basic Books, Hachette Book Group.

来源:中科院之声

本文已获转载授权,如需转载请联系原作者

文章仅代表作者观点,不代表中国科普博览立场


转载注明出处 未经授权不得转载

转载授权、合作、投稿事宜,联系webmaster@kepu.net.cn

中国科普博览是中科院科普云平台,由中科院计算机网络信息中心主办,依托中科院高端科学资源,致力于传播前沿科学知识,提供趣味科教服务。

点这里告诉我你在看

很多朋友对于全自动凉皮机器全套多少钱和自动化凉皮机多少价格不太懂,今天就由小编来为大家分享,希望可以帮助到大家,下面一起来看看吧!想买一台小型凉皮机可是不知道小型凉皮机的价格是多少?按照2019年行情,家用小型的凉皮机一般是2760-26800元不等。大中小型 一般为220v的为主 ,占地..

大家好,今天来为大家解答关于什么是内存这个问题的知识,还有对于什么是内存的逻辑地址物理地址和机器地址也是一样,很多人还不知道是什么意思,今天就让我来为大家分享这个问题,现在让我们一起来看看吧!什么是内存?内存有什么用?内存(Memory)是计算机的重要部件之一,也称内存储器和主存储器,它..

大家好,关于木炭机器价格很多朋友都还不太明白,不知道是什么意思,那么今天我就来为大家分享一下关于木炭机器价格多少的相关知识,文章篇幅可能较长,还望大家耐心阅读,希望本篇文章对各位有所帮助!木炭机全套多少钱做木炭需要烘干·废碎·输送等辅助设备。木炭机整套设备价格不一,从两三万元到几..

很多朋友对于什么机器和什么机器填动词不太懂,今天就由小编来为大家分享,希望可以帮助到大家,下面一起来看看吧!二年级什么机器,怎么填空?1、(搬开)机器。2、(打开)机器。3、(关闭)机器。4、(移动)机器。5、(购买)机器。填空词语释义:1、打开,拼音是dǎ kāi,汉语词语,指改变关..

很多朋友对于硅胶机器多少钱一台和硅胶成型机价格不太懂,今天就由小编来为大家分享,希望可以帮助到大家,下面一起来看看吧!投资一个硅胶厂需多少钱如果要开一家加工厂的话,具体它的流程就是小山药选址,然后在建厂房,然后在到工商局。去办执照,这样的话就可以了,然后一般价钱的话,需要200万就..

很多朋友对于机器废铁一般多少钱一斤和机器废铁一般多少钱一斤呢不太懂,今天就由小编来为大家分享,希望可以帮助到大家,下面一起来看看吧!废铁多少钱一公斤?2022年09月21日)今日黑龙江废铁回收价格查询_最新黑龙江废铁价格投稿人农民谈金市2022-09-21(2022年09月21日)今日黑龙江废铁回收价格查..

▲10分钟全程纪录版▲3分钟精华省流版这是我做过的里程最长、挑战最大的油耗测试。从乌鲁木齐到且末,穿过天山,跨过吐鲁番,越过塔克拉玛干,全程40度以上高温,还遇到七..

大家好,小编来为大家解答美缝机器多少钱一台这个问题,电动美缝机器多少钱一台很多人还不知道,现在让我们一起来看看吧!一台缝纫机多少钱?根据2019年12月10日的缝纫机价格情况来看,市面上的缝纫机价格大致在1200元~25000元之间不等。缝纫机的具体价格需要根据不同品牌、不能作用、不同技术等来决定..

今天给各位分享李元霸与宇文成都的知识,其中也会对李元霸与宇文成都比力气进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!隋唐第一杰李元霸与第二杰宇文成都,实力差距有多大?隋唐共有十三条武力非凡的好汉,其中赵王李元霸和天宝大将军宇文成都分列第一和第二,两人的实力..

一刚刚,机器人索菲亚的创造者、美国人工智能大牛大卫·汉森博士郑重宣布:2045年,人类将可以与和类似索菲亚这样的机器人结婚。对,就是那个可以和人类对话,并做出微笑、..

机器之心原创作者:泽南从自动驾驶到推荐系统,机器学习的开发现在都可以用统一的平台完成了。不同机器学习任务,用统一的平台实现,速度成倍提升,GPU 调度 0&n..

从整体上看,全球安防市场需求均出现萎靡的态势,国内安防千万级项目市场规模有所降低,平安城市及雪亮工程项目开始进入存量更新及优化阶段。同时,大数据、云计算、人工智..

点击题目下方辣妈时尚范,轻松学会美容瘦身,时尚搭配!说起钟丽缇,大家都是知道的,因为她年龄真的是很大了,估计很多人叫她阿姨都已经可以了,因为确实是这样的年龄,已..

越来越多的企业组织开始应用人工智能(Artificial Intelligence,缩写AI)和机器学习(Machine Learning,缩写ML)项目,保护这些项目变得日益重要。IBM和Mornin..

大家好,小编来为大家解答童程童美和卡巴相比这个问题,卡巴机器人和童程童美对比很多人还不知道,现在让我们一起来看看吧!少儿编程培训机构前10有哪些?少儿编程培训机构前10有童程童美、卡巴、编程猫等。如需学习少儿编程推荐选择童程童美,该机构的课程体系不仅完善而且非常精细,整个课程体系涵盖..

澎湃新闻见习记者 曹伊湄 记者 郑浩导盲犬纺云。本文图片均为澎湃新闻见习记者 曹伊湄 图8月30日,14岁的导盲犬“纺云”和“塔章”有了给它们安..

点击题目下方辣妈时尚范,轻松学会美容瘦身,时尚搭配!很多明星被别人抓拍的照片其实显得整个人就会比较的真实,而且刘涛这一次在电视剧里面整个人的造型感觉也是比较符合..

本文由 中国科普博览 来源发布

扎心了,机器都比我会学

评论问答