语音识别技术_物理前沿-查字典物理网

语音识别的研究工作大约开始于上世纪50年代，当时ATT的Bell实验室实现了第一个可识别十个英文数字的语音识别系统——Audry系统。

20世纪60年代，计算机的应用推动了语音识别的发展。这一时期的重要成果是提出了动态规划（DP）和线性预测分析技术（LP），其中后者较好地解决了语音信号产生模型的问题，对语音识别的发展产生了深远影响。

20世纪70年代，语音识别领域取得了突破。在理论上，LP技术得到进一步发展，动态时间归正技术（DTW）基本成熟，特别是提出了矢量量化（VQ）和隐马尔可夫模型（HMM）理论。在实践上，实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。

20世纪80年代，语音识别研究进一步走向深入，其显著特征是HMM模型和人工神经元网络（ANN）在语音识别中的成功应用。HMM模型的广泛应用应归功于AT＆T的Bell实验室Rabiner等科学家的努力，他们把原本艰涩的HMM纯数学模型工程化，从而为更多研究者了解和认识。采用ANN和HMM模型建立的语音识别系统，性能相当。

进入20世纪90年代，随着多媒体时代的来临，迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Apple、AT＆T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资。

我国语音识别研究工作一直紧跟国际水平，国家也给予了高度重视。鉴于中国未来庞大的市场，国外也非常重视汉语语音识别的研究。美国、新加坡等地聚集了一批来自大陆、台湾、香港等地的学者，研究成果已达到相当高水平。因此，国内除了要加强理论研究外，更要加快从实验室演示系统到商品的转化。

语音识别系统可有不同的分类方式。

（1）根据对说话人说话方式的要求，可以分为孤立字（词）语音识别系统，连接字语音识别系统以及连续语音识别系统。

（2）根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。

（3）根据词汇量大小，可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。

不同的语音识别系统，虽然具体实现细节有所不同，但所采用的基本技术相似。

语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外，还涉及到语音识别单元的选取等问题。

【语音识别技术】相关文章：

★ 路易斯·巴斯德

★ 2015年初三物理练习题信息的传递

★ 2015年初三物理杠杆同步练习题及答案