MIT新研究:过去80年,算法效率提升到底有多快?


来源:MIT,新智元

编辑:David
【导读】随着摩尔定律走向终结,靠提升计算机硬件性能可能越发难以满足海量计算的需要,未来的解决之道在于提升算法的效率。MIT的这篇新论文总结了过去80年来,算法效率的提升究竟有多快。
提起算法,它有点像计算机的父母,它会告诉计算机如何理解信息,而计算机反过来可以从算法中获得有用的东西。
算法的效率越高,计算机要做的工作就越少。对于计算机硬件的所有技术进步,以及备受争议的摩尔定律的寿命问题来说,计算机硬件的性能只是问题的一方面。
而问题另一方面则在硬件之外:算法的效率问题。如果算法的效率提升了,对同一计算任务需要的算力就会降低。
虽然算法效率问题可能不太受关注,但你是否注意到,经常使用的搜索引擎是否突然变快了十分之一,而在大型数据集中活动,就感觉就像在泥泞中跋涉一样艰难缓慢。
这些都与算法效率有关。
近日,麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的科学家提出疑问:算法效率的提升速度到底有多快?
关于这个问题,现有数据大部分是叙事性的,其中很大一部分是面向特定算法的案例研究,再把这些研究结果加以推广。
面对实证研究数据的不足,研究团队主要利用了来自 57 部教科书和 1110 多篇研究论文的数据,以追溯算法效率提升的历史。
其中有些论文的结论中直接给出了新的算法有多高效,有的论文则需要作者使用“伪代码”(对算法基本细节的简单描述)进行重构。
研究人员总共研究了 113 个“算法系”,即解决计算机科学教科书中最重要的同一问题的算法集。他们对每个算法族的历史进行了回顾,跟踪每次针对某一问题提出的新算法,并特别注意更高效的算法。

图1 算法发现和改进。(a) 每十年发现的新算法系的数量。(b) 已知算法系的比例每十年都有所提高。(c) 首次发现时算法系的渐近时间复杂度分类。(d) 同一时间复杂度的算法转换到另一个时间复杂度的每年平均概率(反应算法系复杂度提升的平均水平)。在(c)和(d)中“n3”的时间复杂度表示超过多项式级,但不到指数级。

最早的算法系可追溯到上世纪40年代,每个算法系平均有 8 个算法,按时间顺序效率逐步提升。为了共享这一发现,团队还创建了“算法维基”页面(Algorithm-Wiki.org)。
研究人员绘制了图表,标识这些算法族效率提升的速度,重点关注算法分析最多的特征——这些特征往往决定了解决问题的速度有多快(用计算机术语说,就是“最坏情况下的时间复杂度”)。
图 2 算法系的相对效率提升,使用渐近时间复杂度的变化计算。参考线是SPECInt 基准性能。(a) 与该系列中的第一个算法(n = 100 万)相比,四个算法系的历史改进。(b) 算法改进对“最近邻搜索”算法系列的输入大小 (n)的敏感度。为了便于比较算法改进效果随时间的变化,在图(b) 中将算法系和硬件基准的起始时间段对齐。
结果显示,变数很大,但也发现了关于计算机科学变革性算法效率提升的重要信息。即:
对于大型计算问题,43% 的算法系的效率提升带来的收益,不低于摩尔定律带来的收益。
在 14% 的问题中,算法效率提升的收益远超硬件性能提升的收益。

对于大数据问题,算法效率提升收益特别大,因此近年来,这一效果与摩尔定律相比越来越明显。

当算法系从指数复杂度过渡到多项式复杂度时,情况出现了最大的变化。
所谓指数复杂度算法,就像一个人猜密码锁的密码一样。如果密码盘上只有一位数,那么任务很简单。如果像自行车锁一样,表盘是4位数,估计你的自行车很难有人偷得走,但仍然可以一个个试。如果是表盘是50位的,就几乎不可能破解了,需要的步骤太多了。
图3 基于渐近时间复杂度计算的110个算法系效率提升的年平均速度分布,其中问题规模为:(a) n = 1000,(b) n = 100万,(c) n = 10亿。硬件性能提升线表示从 1978 年到 2017 年,SPECInt 基准性能的平均年增长率
这类问题也是计算机面对的难题,随着问题的规模越来越大,很快就会超过计算机的处理能力,这个问题光靠摩尔定律是解决不了的。
解决之道在于找到多项式复杂度的算法。
研究人员表示,随着摩尔定律终结这个话题越来越多地被提及,我们需要将未来的解决方案的重点放在算法的效率提升上。
图4 前导常数在算法性能提升中的重要性评价
研究结果表明,从历史上看,算法效率的提升带来的收益是巨大的。不过二者之间存在着频度的差异,摩尔定律带来的提升是平滑而缓慢的,而算法效率的提升是阶梯式的跃进,但出现没那么频繁。
本文通讯作者尼尔·汤普森说:
这是业界第一篇说明算法效率提升速度的论文。通过我们的分析,可以得出算法改进后,使用同样的算力可以完成多少任务。
随着问题的规模不断增大,比如达到数十亿或数万亿个数据点,算法效率的提升带来的收益,比硬件性能的提升更重要,而且重要得多。
在我们开始逐步为算力不足发愁的时代,在摩尔定律越来越显出疲态的今天,这一发现可能为未来解决超大型计算问题开辟一条新的思路。

参考链接:

https://news.mit.edu/2021/how-quickly-do-algorithms-improve-0920

https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=arnumber=9540991

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

这种场景,是不是曾出现在你的生活中?↓↓↓↓↓晚上睡觉前,想刷几分钟短视频就睡。结果爱看的内容越来越多,怎么也刹不住,一不留神一个小时就过去了。想买一件商品,在..

将主要动作优先锻炼1将关键动作放在首位进行锻炼,能够保持最优秀的身体状态着重对需要的位置进行刺激,无论是动作次数、组数、完成度都是可以获得更出色的效果。多使用复..

你知道从癌细胞变成肿瘤,究竟有多快?北京大学第三医院危重医学科副主任医师薄世宁在短视频平台的个人账号“@薄世宁医生”上发布了一则来自清华大学医学院免疫学教授张明..

01要闻听我说6月份股债市场融资效率提升进入6月份,稳经济一揽子政策措施逐步落地生效,股权和债券融资效率持续提升,资本市场稳经济大盘“压舱石”作用愈加凸显。数据统计..

北京时间6月14日,中超第4轮泰山队与长春亚泰的赛前发布会进行,主帅郝伟携陈蒲参加发布会,郝伟透露了费莱尼的最新状态情况,也直面了得分效率低的问题。泰山队前3轮2胜1..

北京时间5月29日,在4-1击败独行侠之后,勇士已经提前进入总决赛静待自己的对手了。总决赛将于6月3日进行,勇士最近迎来了一段宝贵的休息时间,最近两天是勇士的假期,后续..

客户行业 电信行业问题类型组织成本与组织效率【客户评价】为了提高公司的组织运行效率,提高客户满意度,我们聘请了北京华恒智信人力资源顾问有限公司进行组织结构设..

–大众汽车乘用车品牌CEO贝瑞德(Ralf Brandstätter)先生表示:“与2020年相比,我们的盈利能力、抗风险能力和效率都显著提高。基于ACCELERATE战略,我们再次加快了..

在新的课程改革背景下,教师要更新教育模式,将新知识、新思想运用到体育教学中来,从而提高体育课堂教学的有效性。主要分析了小学体育课堂教学存在的问题,从而提出一些有..

很多工厂往往有这样的现象出现:工厂内几乎每个人都很忙,几乎每个部门都忙不过来,但最终整体效率低下。而且也很难找出原因,不知该如何改善?本文从八个方面分析原因:—..

小伙伴们好啊,今天老祝和大家分享一组关于排序的实用技巧,点滴积累,也能提高工作效率。1、按数值大小排序按数值大小排序,应该是日常工作中最多见的一种操作了,要对哪..

机器之心原创作者:张倩内存不够只能割肉买 DRAM?英特尔:很多时候大可不必。人们常说,新一代的人工智能浪潮是由数据、算法和算力来驱动的。最近几年模型参数的爆炸..

对争分夺秒、全力备战中考的各位考生来说,熬夜是家常便饭。而很多时候,熬夜却并没有出成果,反而导致了第二天的哈欠连天,学习没有效率,形成恶性循环。那么,有哪些学习..

常用的“天干地支”小知识中国自古便有十天干与十二地支,简称“干支”,取意于树木的干和枝。十天干即:甲、乙、丙、丁、戊(wù)、己、庚、辛、壬(rén)、癸(guǐ)..

大家好,今天本篇文章就来给大家分享买房贷款分期利息怎么算法,以及买房贷款分期计算方式对应的知识和见解,内容偏长哪个,大家要耐心看完哦,希望对各位有所帮助,不要忘了收藏本站喔。贷款买房的利息是多少?如何计算?;     众所周知,贷款买房是现下很多人买房的方式,如果购房者选择了贷款买..

数字经济时代,算力如同农业时代的水利、工业时代的电力一样重要。无论是传统产业的升级,还是新兴产业的孕育,都需要依靠强劲的算力来支撑。总之,算力就是生产力,如若没..

文 |王世民来源|YouCore(ID:YouCore)现在职场人在工作很忙时,就特别期待放假,特别是小长假。我们总期待假期里,可以有大段时间,学习自己想学的内容,看自己想..

你遇到过这样的问题吗?做课件需要很长时间,找不到资源?不会用“工具”,教学没新意?课堂死气沉沉,沉闷没乐趣?不知道学生掌握情况,没有改进方向?相信这些也是一直困..

编辑:钟立磊聊起智能家居,目前拥有三大生产制造园区、超过170万台月产能以及超2000万全球用户的乐橙,是一个绝对绕不开的品牌。源自大华的技术能力,使其在家庭安防与智..

导读受疫情蔓延影响,上海市发布《关于鼓励企业(单位)灵活采取居家办公等措施的倡议书》,倡议企业轮流上岗、错峰上下班、弹性工作制、居家在线办公。这也让远程办公成为..

本文由 人工智能学家 来源发布

MIT新研究:过去80年,算法效率提升到底有多快?

评论问答