2022-07-23 05:01

知识分享|语音识别技术，聆听人工智能世界的声音

随着科技的飞奔

让机器听懂人类语言

已从梦想跨入现实

实现如此科幻的一幕

需要人机交互中重要技术——

语音识别技术

通过利用深度学习技术进行自然语言的深度理解，一直是人们关注的焦点。听音乐不需要自己查找，开灯不需要动手，空调能听懂你的心声……这些场景在很多影视作品中有所表现，也代表了很多人脑海中“智慧生活”的概念。基于此，在人工智能发展的热潮中，自然语言处理成为了各大企业和科研机构角逐的战场。

弘和集团深耕人工智能领域，在人工智能技术产品创新和产业领域应用场景扩展中不断更迭，通过产业智能化改造，语音识别技术融入，可助力产业实现远程信息处理、多模块交互、实时播报、AI识别、交互式语音相应等应用场景功能。

语音识别系统模型由声学模型和语言模型两个部分组成，声学模型对应于语音到音素的概率计算，语言模型对应于音素到文字的概率计算。

语音识别是一项融合多学科知识的前沿技术，覆盖了数学与统计学、声学与语言学、计算机与人工智能等基础学科和前沿学科，是实现人工智能的关键环节。

70年代，语音识别主要集中在小词汇量、孤立词识别方面，使用的方法也主要是简单的模板匹配方法，即首先提取语音信号的特征构建参数模板，然后将测试语音与参考模板参数进行。进入80年代后，研究思路发生了重大变化，从传统的基于模板匹配的技术思路开始转向基于统计模型（HMM）的技术思路。基于 GMM-HMM 框架，研究者提出各种改进方法，如动态贝叶斯方法、区分性训练方法、自适应训练方法、HMM/NN 混合模型方法等。这些方法都对语音识别研究产生了深远影响，并为下一代语音识别技术的产生做好了准备。

2006年，Hinton提出深度置信网络（DBN），促使了深度神经网络（DNN）研究的复苏。2011 年底，微软研究院的俞栋、邓力又把 DNN 技术应用在了大词汇量连续语音识别任务上，大大降低了语音识别错误率。从此语音识别进入DNN-HMM时代。DNN-HMM主要是用DNN模型代替原来的GMM模型，对每一个状态进行建模，DNN带来的好处是不再需要对语音数据分布进行假设，将相邻的语音帧拼接又包含了语音的时序结构信息，使得对于状态的分类概率有了明显提升，同时DNN还具有强大环境学习能力，可以提升对噪声和口音的鲁棒性。

语音识别的端到端方法主要是代价函数发生了变化，但神经网络的模型结构并没有太大变化。总体来说，端到端技术解决了输入序列的长度远大于输出序列长度的问题。端到端技术主要分成两类：一类是CTC方法，另一类是Sequence-to-Sequence方法。传统语音识别DNN-HMM架构里的声学模型，每一帧输入都对应一个标签类别，标签需要反复的迭代来确保对齐更准确。端到端技术的突破，不再需要HMM来描述音素内部状态的变化，而是将语音识别的所有模块统一成神经网络模型，使语音识别朝着更简单、更高效、更准确的方向发展。

2021年，工业和信息化部批复组建国家智能语音创新中心等4家国家制造业创新中心，将围绕多语种语音识别、语音合成、语义理解和专用人工智能语音芯片等研发方向，构建集共性技术研发、测试验证、中试孵化和成果转移转化于一体的创新平台，提升我国智能语音行业技术水平和产品竞争力。

随着各种深度神经网络以及端到端技术的兴起，声学模型是近几年非常热门的方向，业界都纷纷发布自己新的声学模型结构，刷新各个数据库的识别记录。由于中文语音识别的复杂性，国内在声学模型的研究进展相对更快一些，主流方向是更深更复杂的神经网络技术融合端到端技术。

随着科技发展趋势和我国政策推动，

人工智能、5G、云计算等技术

将得到进一步加速发展

随着语音识别技术的不断迭代和利用

科技革新引导的创新型发展

人工智能助力产业智能化加速

未来将无限可期！

*参考资料来源：

《语音识别技术简史》中国科学院研究生院工学博士-陈孝良

上一篇：急裁员、缓招聘，巨头们开始勒紧腰带
下一篇：CameraIQ：76%消费者曾体验AR，49%愿意分享AR广告

大家好，今天来给大家分享世界名犬排行榜的相关知识，通过是也会对世界名犬排行榜排名相关问题来为大家分享，如果能碰巧解决你现在面临的问题的话，希望大家别忘了关注下本站哈，接下来我们现在开始吧！世界十大名狗最凶悍的世界十大名犬1、无声斗犬日本土佐、起源用途：斗犬、用途：伴侣..

中国油价处在世界什么水平？_国内油价谁决定

2022年3月31日24时，我国成品油价格迎来了今年的七连涨，国家发改委发布消息，国内汽、柴油价格（标准品，下同）每吨均提高110元。这对于本就不富裕的我们更是雪上加霜。那..

网坛爆大冷：世界第一被横扫

15年前的声音和画面我们从未忘却

世界有多少个国家，世界有多少个国家分别是什么名字

本篇文章给大家谈谈世界有多少个国家，以及世界有多少个国家分别是什么名字对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。全世界有多少个国家？; 01 197个全世界内一共有233个国家和地区，国家总数量为197个，其中亚洲内的国家为48个，欧洲内的国家为44个，..

以创新精神和开放姿态与世界同行

表示声音的词语有_表示声音的词语有叮咚

中小学生作文积累：形容各种声音的词汇大全，孩子们用对了，作文内容会丰富多彩！小升初：形容各种声音的词汇大全小升初：形容各种声音的词汇大全小升初：形容各种声音的词..

完美世界影视董事长去世年仅48岁_完美世界影视文化有限公司老板

3月28日，完美世界发布公告称：廉洁因身体原因，申请辞去公司联席首席执行官职务，辞职后，廉洁将继续在公司下属子公司担任相关职务。遗憾的是，就在28日傍晚，廉洁因病在..

好友称巴厘岛命案死者正环游世界

本文由弘和人工智能来源发布

知识分享|语音识别技术，聆听人工智能世界的声音

人工智能世界

评论问答