知识分享|语音识别技术,聆听人工智能世界的声音



随着科技的飞奔
让机器听懂人类语言
已从梦想跨入现实
实现如此科幻的一幕
需要人机交互中重要技术——
语音识别技术

通过利用深度学习技术进行自然语言的深度理解,一直是人们关注的焦点。听音乐不需要自己查找,开灯不需要动手,空调能听懂你的心声……这些场景在很多影视作品中有所表现,也代表了很多人脑海中“智慧生活”的概念。基于此,在人工智能发展的热潮中,自然语言处理成为了各大企业和科研机构角逐的战场。
弘和集团深耕人工智能领域,在人工智能技术产品创新和产业领域应用场景扩展中不断更迭,通过产业智能化改造,语音识别技术融入,可助力产业实现远程信息处理、多模块交互、实时播报、AI识别、交互式语音相应等应用场景功能。



语音识别系统模型由声学模型和语言模型两个部分组成,声学模型对应于语音到音素的概率计算,语言模型对应于音素到文字的概率计算。

语音识别是一项融合多学科知识的前沿技术,覆盖了数学与统计学、声学与语言学、计算机与人工智能等基础学科和前沿学科,是实现人工智能的关键环节。




70年代,语音识别主要集中在小词汇量、孤立词识别方面,使用的方法也主要是简单的模板匹配方法,即首先提取语音信号的特征构建参数模板,然后将测试语音与参考模板参数进行。进入80年代后,研究思路发生了重大变化,从传统的基于模板匹配的技术思路开始转向基于统计模型(HMM)的技术思路。基于 GMM-HMM 框架,研究者提出各种改进方法,如动态贝叶斯方法、区分性训练方法、自适应训练方法、HMM/NN 混合模型方法等。这些方法都对语音识别研究产生了深远影响,并为下一代语音识别技术的产生做好了准备。

2006年,Hinton提出深度置信网络(DBN),促使了深度神经网络(DNN)研究的复苏。2011 年底,微软研究院的俞栋、邓力又把 DNN 技术应用在了大词汇量连续语音识别任务上,大大降低了语音识别错误率。从此语音识别进入DNN-HMM时代。DNN-HMM主要是用DNN模型代替原来的GMM模型,对每一个状态进行建模,DNN带来的好处是不再需要对语音数据分布进行假设,将相邻的语音帧拼接又包含了语音的时序结构信息,使得对于状态的分类概率有了明显提升,同时DNN还具有强大环境学习能力,可以提升对噪声和口音的鲁棒性。

语音识别的端到端方法主要是代价函数发生了变化,但神经网络的模型结构并没有太大变化。总体来说,端到端技术解决了输入序列的长度远大于输出序列长度的问题。端到端技术主要分成两类:一类是CTC方法,另一类是Sequence-to-Sequence方法。传统语音识别DNN-HMM架构里的声学模型,每一帧输入都对应一个标签类别,标签需要反复的迭代来确保对齐更准确。端到端技术的突破,不再需要HMM来描述音素内部状态的变化,而是将语音识别的所有模块统一成神经网络模型,使语音识别朝着更简单、更高效、更准确的方向发展。




2021年,工业和信息化部批复组建国家智能语音创新中心等4家国家制造业创新中心,将围绕多语种语音识别、语音合成、语义理解和专用人工智能语音芯片等研发方向,构建集共性技术研发、测试验证、中试孵化和成果转移转化于一体的创新平台,提升我国智能语音行业技术水平和产品竞争力。


随着各种深度神经网络以及端到端技术的兴起,声学模型是近几年非常热门的方向,业界都纷纷发布自己新的声学模型结构,刷新各个数据库的识别记录。由于中文语音识别的复杂性,国内在声学模型的研究进展相对更快一些,主流方向是更深更复杂的神经网络技术融合端到端技术。



随着科技发展趋势和我国政策推动,
人工智能、5G、云计算等技术
将得到进一步加速发展
随着语音识别技术的不断迭代和利用
科技革新引导的创新型发展
人工智能助力产业智能化加速
未来将无限可期!



*参考资料来源:
《语音识别技术简史》中国科学院研究生院工学博士-陈孝良


大家好,今天来给大家分享世界名犬排行榜的相关知识,通过是也会对世界名犬排行榜 排名相关问题来为大家分享,如果能碰巧解决你现在面临的问题的话,希望大家别忘了关注下本站哈,接下来我们现在开始吧!世界十大名狗 最凶悍的世界十大名犬1、无声斗犬日本土佐、起源用途:斗犬、用途:伴侣..

2022年3月31日24时,我国成品油价格迎来了今年的七连涨,国家发改委发布消息,国内汽、柴油价格(标准品,下同)每吨均提高110元。这对于本就不富裕的我们更是雪上加霜。那..

本篇文章给大家谈谈世界有多少个国家,以及世界有多少个国家分别是什么名字对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。全世界有多少个国家?;     01      197个      全世界内一共有233个国家和地区,国家总数量为197个,其中亚洲内的国家为48个,欧洲内的国家为44个,..

中小学生作文积累:形容各种声音的词汇大全,孩子们用对了,作文内容会丰富多彩!小升初:形容各种声音的词汇大全小升初:形容各种声音的词汇大全小升初:形容各种声音的词..

3月28日,完美世界发布公告称:廉洁因身体原因,申请辞去公司联席首席执行官职务,辞职后,廉洁将继续在公司下属子公司担任相关职务。遗憾的是,就在28日傍晚,廉洁因病在..

本文由 弘和人工智能 来源发布

知识分享|语音识别技术,聆听人工智能世界的声音

评论问答