飞扬范文网
当前位置 首页 >工作计划 >

语音识别技术及应用综述

发布时间:2022-03-14 15:11:27 浏览数:

(中国人民解放军通信指挥学院,湖北 武汉 430010)
摘 要:文章介绍了语音识别技术的一般概念、分类 方法和基本原理,从应用领域角度重点介绍了在军事领域、公共事业领域和其他领域内的应 用情况。
关键词:语音识别;识别原理;特征提取;语音识别应用
中图分类号:TN912.34  文献标识码:A  文章编号: 1007—6921(2009)15—0070—02

与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。近20 年来 ,语音识别技术取得显著进步,开始从实验室走向市场,被认为是2000年~2010年间信息技 术领域十大重要的科技发展技术之一。
1 语音识别技术简述
1.1 语音识别技术的起源和概念

语音识别起源于20世纪50年代AT&T贝尔实验室的Audry系统,它第一次实现了10个英文数字 的语音识别,这是语音识别研究工作的开端。1959年,J.W.Rorgie和C.D.Forgie采用数字计 算机识别英文元音及孤立字,开始了计算机语音识别的研究工作。语音识别技术与语音合成 技术结合使人们能够摆脱键盘的束缚,取而代之的是以语音输入这样便于使用的、自然的、 人性化的输入方式,它正逐步成为信息技术中人机接口的关键技术。

所谓语音识别技术就是让计算机(或机器)通过识别和理解过程把人类的语音信号转变为相 应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。语音识别技术的终极 目标就是研制出1台能听懂任何人、任何内容的讲话的机器,但是要想实现计算机与人类之 间的语音交流变得和人与人之间的对话那么自如、方便,其难度相当大,甚至超过“人类登 上月球”的难度。
1.2 语音识别系统的分类

语音识别系统会有不同的系统设计和实现,因而会有不同的应用范围及限制。它的分类种类 也很多,现在举出几个大家比较重要的分类方式。

按发音方式分为孤立词、连接词和连续语音的语音识别系统。语音识别系统可能要求说话者 以单字、单词、或是短语为发音单位,其间就必须要略微停顿,否则识别就会有问题。以前 的语音识别系统,几乎都是以单字或单词为单位的孤立语音识别系统,随着连续语音识别技 术渐趋成熟,连续词和连续语音这个最自然的说话方式,将成为语音识别系统的主流。按词 汇量大小分为小词表、中词表和大词表以及无限词汇量语音识别系统。如果语音识别系统只 为你进行电话拔号,那它只要能听懂10个数字就行了,这属于小词汇量语音识别系统;如果 它是为你自动转接话务,那它还应识别单位名、人名和时间等成千上百的词和字,这属于中 等词汇量语音识别系统;如果它是把1篇口述的演讲报告转换成为文字,这属于大词汇量语 音识别系统。按说话人适应范围分为特定人、限定人和非特定人语音识别系统。特定人系统 是指系统在使用前必须由用户输入大量的发音数据、对其进行训练。非特定人系统则试图达 到在系统构建成功之后,用户需要事先输入大量的训练数据,即可使用的目的。
1.3 语音识别原理

语音识别其基本原理就是将输入的语音,经过处理后,将其和语音模型库进行比较,从而得到 识别结果,具体原理见图1。

该图中语音输入就是将话筒和电话等语音输入设备采集的语音进行原始输入;数字化预处理 包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响等; 特征提取模块用于提取语音中反映本质特征的声学参数,常用的特征有短时平均幅度、短时 平均跨零率、线性预测系数、基音频率、倒谱和共振峰等。在训练阶段,将特征参数进行一 定的处理后,为每个词条建立一个模型,保存为模板库。在识别阶段,语音信号经过相同的 通道得到语音特征参数,生成测试模板,与参考模板进行匹配,基于一定的判别规则(例如 构词规则、语法规则、语义规则等)将匹配分数最高的参考模板作为识别结果。同时在模式 匹配和判别时还可以在很多专家的帮助下,提高识别的准确率。
1.4 语音识别流程

现在社会上有很多不同种类的语音识别系统,它们的具体实现细节有所不同,但所应用的识 别过程大致相似,具体流程见图2。

首先要确定语音识别单元的选取。语音识别单元有单词、音节和音素三种,单词单元广泛应 用于中小词汇语音识别系统,音素单元多见于英语语音识别的研究中,音节单元一般用于大 词汇量汉语语音识别。然后在特征提取中去除语音中对识别无关紧要的冗余信息,目前应用 广泛的有基于线性预测分析技术提取的倒谱参数和基于感知线性预测分析提取的感知线性预 测倒谱。接着采用适当的语音识别方法,通过对确定的语音特征进行模型训练得到语音模板 库,然后对待识别的输入语音信号的特征与模板库进行模式匹配,最后通过友好的人机界面 将识别结果输出。
2 语音识别技术的应用

按照不同的特点可以将语音识别进行各种方式的分类,这里按照应用领域的不同可以将语音 识别技术分为应用在军事领域、公共事业领域和在其他领域。
2.1 语音识别技术在军事领域内的应用

随着军队现代化建设水平的提高和新战争形态的出现,最近10年内语音识别技术军事化 应用非常广泛。目前研究比较多的有语音识别技术在智能武器装备开发领域的应用、在军事 作战文书自动化过程中的应用、在军事测试设备的应用和军队智能话务台的应用等。
2.2 语音识别技术在公共事业领域内的应用

语音识别技术在公共事业领域内的应用具有重要意义,其应用范围也在进一步扩展。如在公 安系统中的应用、在智能话务中的应用、在数字图书馆检索系统中的应用、在医疗系统中的 应用和在人工邮件分拣过程中的应用等。下面着重介绍语音识别在公安工作中的应用。

语音识别在公安系统中的应用主要体现在侦查工作、抓捕工作和取证工作中。某些案件中, 在受案和侦查的初始阶段,公安机关所能掌握的线索可能只有一段录音,而提取嫌疑人的语 音特征,通过语音识别和说话内容分析,对说话人身份进行判断,是侦查工作的重要突破口。 公安部门在进行抓捕罪犯过程中经常会遇到线索不多、对犯罪嫌疑人了解不足,这样容易发 生抓错人的现象,而利用语音识别技术可以先通过技术监听设备实现对犯罪嫌疑人窝点进行 监听,对要抓捕的人进行语音识别确认,并初步判断房间内人员数量和拥有武器情况。录音 作为视听资料的一种,是《民事诉讼法》规定的7种法定证据形式之一。语音识别和语音资 料的司法鉴定,在绑架案、敲诈案、贪污受贿案、财产纠纷案和恶意扰乱社会秩序的案件中 也是重要的取证手段。
2.3 语音识别在其他领域中的应用

语音识别与我们的日常生活息息相关,已广泛应用于教育领域、商业领域和服务性领域中。 就教育领域而言,语音识别技术的最直接的应用就是帮助用户更好地练习语言技巧。如一家 美国公司开发了一套《Talk to Me》,当用户跟着计算机说完一句话后,计算机会同时显示 标准发音和用户发音的波形比照图,用户可以反复对比倾听来体会这种差异来提高学习效率 。目前语音识别技术在外语口语学习中已经出现了不少成熟的成果和产品,表1就是一些比 较典型的基于语音识别技术的外语口语学习系统。

就娱乐领域来讲,也可以激发出许多的新应用。通过电话进行电视MTV点播时,可以直接 说出哪个歌手的哪首歌,电视台就接受语音输入而播放相应的曲目。对于网络卡拉OK,用户 拥有类似“播客”的空间,可以自娱自乐或者组织多人飚歌,利用语音识别技术可以对用户 的演唱和原音进行旋律比对,给用户演唱进行打分。这种打分可以实现个人的演唱水平评估 ,也可以实现网络演唱比赛评分。
3 结束语

语音识别技术是非常重要的人机交互技术,应用语音的自动理解和翻译,可消除人类相互交 往的语言障碍,事实证明大量的语音识别产品已经进入市场和服务领域。人们已经习惯通过 电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,语音识别技术和电子 商务的结合使我们可以足不出户就能够“逛”商场,购买到我们所需要的东西。可以预计, 在未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费 电子产品等各个领域。
[参考文献]
[1] 朱民雄,闻新,黄健群,等.计算机语音技术[M].北京:北京航空航天大学出版 社,2002.
[2] 赵力.语音信号处理[M]. 北京:机械工业出版社,2003215~240.
[3] 何好义.计算机语音识别技术及其应用[J].大众科技,2005,(6).
[4] 易克初,田斌,付强.语音信号处理[M].北京:国防工业出版社,2003:160~19 7.
[5] 张成海,张铎.现代自动识别技术与应用[M].北京:清华大学出版社, 2003.
[6] 陈方,高升.语音识别技术及发展[J].电信科学,1996,(12).
[7] 杨大利,徐明星,吴文虎.语音识别特征参数选择方法研究[J].计算机研究与 发展, 2003,(7).
[8] 聂敏.语音识别技术及关键技术[J].微波与卫星通信, 1999,(4).

相关热词搜索: 综述 语音识别 技术