《数字语音处理及MATLAB仿真.rar第一章.ppt》由会员分享,可在线阅读,更多相关《数字语音处理及MATLAB仿真.rar第一章.ppt(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2/17/2023数字语音处理及MATLAB仿真 张雪英编著1数字语音处理及数字语音处理及MATLAB仿真仿真太原理工大学信息工程学院太原理工大学信息工程学院张雪英编著张雪英编著CollegeofInformationEngineering,TaiyuanUniversityofTechnology2/17/2023数字语音处理及MATLAB仿真 张雪英编著22/17/20232课程总括课程性质课程性质1 课程目的和任务课程目的和任务 2课程重点课程重点 3课程难点课程难点 42/17/2023数字语音处理及MATLAB仿真 张雪英编著3课程性质课程性质 语音信号处理是通信、电子信息专业的选语
2、音信号处理是通信、电子信息专业的选修课程,主要用于现代通信和电子信息领域,修课程,主要用于现代通信和电子信息领域,其主要前修专业基础课程为信号与系统和数字其主要前修专业基础课程为信号与系统和数字信号处理。信号处理。2/17/2023数字语音处理及MATLAB仿真 张雪英编著4课程目的和任务课程目的和任务 通通过过本本课课程程的的学学习习理理解解语语音音发发声声和和听听觉觉机机理理及及其其数数字字模模型型;掌掌握握语语音音信信号号处处理理的的基基本本概概念念、原原理理和和方方法法,为为以以后后的的学学习习提提供供理理论论依依据据;掌掌握握语语音音信信号号的的短短时时时时域域分分析析和和频频域域分
3、分析析方方法法,并并且且能能够够用用MatlabMatlab语语言言编编程程实实现现对对实实际际语语音音信信号号进进行行的的处处理理;熟熟悉悉语语音音信信号号处处理理的的应应用用领领域域,并并了了解解该该领领域域的的新新理理论论、新新技技术术和和发发展展趋趋势势,为为今今后后的的进一步学习和工作打下坚实的基础。进一步学习和工作打下坚实的基础。2/17/2023数字语音处理及MATLAB仿真 张雪英编著5课程重点课程重点语语音音信信号号的的产产生生和和语语音音信信号号数数字字模模型型。短短时时能能量量、平平均均过过零零率率、自自相相关关的的意意义义,以以及及这这些些特特征征 参参 量量 在在 语
4、语 音音 信信 号号 中中 的的 应应 用用,并并 且且 会会 用用MATLAB实实现现。短短时时频频域域分分析析的的两两种种解解释释以以及及实实现现、LPC的的基基本本原原理理以以及及与与语语音音模模型型的的关关系系、自自适适应应量量化化的的PCM,自自适适应应预预测测编编码码原原理理以以及及前前馈馈和和反反馈馈的的主主要要区区别别,另另外外增增量量调调制制中中所所造造成成的的失失真真以以及及失失真真补补偿偿。矢矢量量量量化化原原理理、LBG算算法法以及实验以及实验。2/17/2023数字语音处理及MATLAB仿真 张雪英编著6课程难点课程难点 语语音音信信号号的的产产生生和和激激励励、端端
5、点点检检测测和和基基音音周周期期的的估估计计、用用数数学学公公式式来来证证明明短短时时频频谱谱是是如如何何反反映映整整个个语语音音信信号号的的频频谱谱的的、LPC方方程程组组解解法法、自自适适应应预预测测编编码码原原理理、LBG算算法法以以及及实实验验中中的的分分帧帧和基音周期检测。和基音周期检测。2/17/2023数字语音处理及MATLAB仿真 张雪英编著7第第1 1章章 绪论绪论1.1 概述概述11.2语音信号处理的发展语音信号处理的发展21.3 语音信号处理的应用及新方向语音信号处理的应用及新方向31.4 语音信号处理过程的总体结构语音信号处理过程的总体结构41.5 MATLAB在数字语
6、音信号处在数字语音信号处 理中的应用理中的应用 52/17/2023数字语音处理及MATLAB仿真 张雪英编著8语语音音信信号号处处理理是是一一门门新新兴兴的的边边缘缘学学科科,是是语语音音学学与与数数字字信信号号处处理理两两个个学学科科相相结结合合的的产产物物。它它和和认认知知科科学学、心心理理学学、语语言言学学、计计算算机机科科学学、模模式式识识别别和和人工智能等学科有着紧密的联系。人工智能等学科有着紧密的联系。语音信号处理的目的:语音信号处理的目的:得到某些语音特征参数得到某些语音特征参数以便高效地传输或存储;以便高效地传输或存储;通过某种处理运算以达到某种用途的要求通过某种处理运算以达
7、到某种用途的要求。1.1概述概述2/17/2023数字语音处理及MATLAB仿真 张雪英编著9语音信息的交换大致上可以分为三大类:语音信息的交换大致上可以分为三大类:(1)人与人之间的语言通信:)人与人之间的语言通信:包括语音压缩与编码、语音增强等。包括语音压缩与编码、语音增强等。(2)第一类人机语言通信问题:)第一类人机语言通信问题:语音合成,机器讲话、人听话的研究。语音合成,机器讲话、人听话的研究。(3)第二类人机语言通信问题:)第二类人机语言通信问题:语音识别和理解语音识别和理解语音识别和理解:人讲话、机器听话的情况。语音识别和理解:人讲话、机器听话的情况。2/17/2023数字语音处理
8、及MATLAB仿真 张雪英编著10突破进展突破进展系统论述语言系统论述语言产生的声学理论产生的声学理论语谱图仪问世语谱图仪问世 语谱图语谱图语音,语音合成语音,语音合成1.2语音信号处理的发展语音信号处理的发展计算机计算机1贝尔电话贝尔电话的发明的发明 3用声学方法对元音和用声学方法对元音和歌唱进行了研究歌唱进行了研究 2第一个第一个声码器声码器 1876年年1939年年19世纪世纪60年代年代 420世纪世纪40年代年代1948年年67基础研究方面基础研究方面 技术应用领域技术应用领域 52/17/2023数字语音处理及MATLAB仿真 张雪英编著111.2语音信号处理的发展语音信号处理的发
9、展1语音合成语音合成3语音编码语音编码2语音识别语音识别语音编码语音编码2/17/2023数字语音处理及MATLAB仿真 张雪英编著121.2.1语语音合成音合成 以以语语言信息言信息压缩压缩、存、存储为储为主要目的主要目的对语对语音信音信号数字模型号数字模型进进行研究,同行研究,同时时研究音素、音研究音素、音节节、词词组组与句子的与句子的发发音音规则规则。最。最终终恢复出自然流恢复出自然流畅畅的的语语音来。例如文音来。例如文语转换语转换系系统统(Text-to-speech)。语语音音分析与合成将分析与合成将赋赋予予计计算机算机说话说话的功能。也是的功能。也是进进行行话话音音编码编码、语语音
10、音识别识别研究的基研究的基础础。2/17/2023数字语音处理及MATLAB仿真 张雪英编著131.2.2语语音音编码编码 语音编码的目的:语音编码的目的:在在保保证证一一定定语语音音质质量量的的前前提提下下,尽尽可可能能降降低低编码比特率,以节省频率资源。编码比特率,以节省频率资源。2/17/2023数字语音处理及MATLAB仿真 张雪英编著141.2.2 语音编码 语音编码与文本到语音转换两个主要区别语音编码与文本到语音转换两个主要区别 一一、前前者者是是人人与与人人之之间间的的话话音音交交流流,要要保保留留说说话话人人的的声声音音特特征征。后后者者是是文文本本到到声声音音的的转转换换即即
11、计算机发声。它可以是标准播音员或其它声音。计算机发声。它可以是标准播音员或其它声音。二二、前前者者不不仅仅对对压压缩缩率率和和音音质质有有要要求求,而而且且要要求求较较低低的的编编、解解码码延延迟迟。而而后后者者对对处处理理帧帧长长没没有什么太严格的限制。有什么太严格的限制。2/17/2023数字语音处理及MATLAB仿真 张雪英编著151.2.3语音识别语音识别 研研究究如如何何使使计计算算机机能能够够听听懂懂人人类类的的语语言言。以以汉汉语语语语音音为为例例:汉汉语语约约有有400400个个音音节节,加加上上声声调调约约12001200个个音音调调节节,把把这这些些语语音音信信号号的的特特
12、征征存存储储到到计计算算机机内内,并并与与计计算算机机接接收收到到的的汉汉语语发发音音进进行行比比较较,找找到到特特征征相相同同的的音音节节或或音音调调节节,这这个个过过程程就就是是语语音音识识别别。将将识识别别出出的的音音节节序序列列转转换换成成文文字字,就就是是语语言言理理解解。许许多多算算法法将将理理解解过过程程溶溶入入到到识识别别中中来来提提高高识识别别的的准准确确性性。因因此此可可以以将将语语音音识识别别与与理理解解归入同一类应用。归入同一类应用。2/17/2023数字语音处理及MATLAB仿真 张雪英编著16语音识别研究领域包括:语音识别研究领域包括:(1 1)根根据据对对说说话话
13、人人说说话话方方式式的的要要求求,可可以以分分为为孤孤立立字字语语音音识识别别系系统统,连连接接字字语语音音识识别别系系统统以以及连续语音识别系统。及连续语音识别系统。(2 2)根根据据对对说说话话人人的的依依赖赖程程度度可可以以分分为为特特定定人和非特定人语音识别系统。人和非特定人语音识别系统。(3 3)根根据据词词汇汇量量大大小小,可可以以分分为为小小词词汇汇量量、中中等等词词汇汇量量、大大词词汇汇量量以以及及无无限限词词汇汇量量语语音音识识别别系统。系统。2/17/2023数字语音处理及MATLAB仿真 张雪英编著171.3 语音信号处理的应用及新方向语音技术的应用领域语音技术的应用领域
14、包包括括语语音音识识别别、说说话话人人的的鉴鉴别别和和确确认认、语语种种的的鉴鉴别别和和确确认认、关关键键词词检检测测和和确确认认、语语音音合合成成、语语音音编码等。编码等。但但其其中中最最具具有有挑挑战战性性和和最最富富有有应应用用前前景景的的为为语语音音识别技术。识别技术。一:语音信号处理的应用一:语音信号处理的应用2/17/2023数字语音处理及MATLAB仿真 张雪英编著181.说话人识别技术的应用说话人识别技术的应用安全加密、银行信息电话查询服务安全加密、银行信息电话查询服务公安机关破案和法庭取证方面公安机关破案和法庭取证方面在在声声控控应应用用中中,识识别别输输入入的的语语音音内内
15、容容,并并根根据据内内容容来来执执行行相相应应的的动动作作,这这包包括括了了声声控控电电话话转转换换、声声控控语语音音拨拨号号系系统统、声声控控智智能能玩玩具具、信信息息网网络络查查询询、家家庭庭服服务务、宾宾馆馆服服务务、旅旅行行社社服务系统、医疗服务、股票查询服务和工业控制等。服务系统、医疗服务、股票查询服务和工业控制等。2/17/2023数字语音处理及MATLAB仿真 张雪英编著191.说话人识别技术的应用说话人识别技术的应用在在电电话话与与通通信信系系统统中中,智智能能语语音音接接口口正正在在把把电电话话机机从从一一个个单单纯纯的的服服务务工工具具变变成成为为一一个个服服务务的的“提供
16、者提供者”和生活和生活“伙伴伙伴”。目目前前,自自动动口口语语分分析析、用用户户交交换换机机、电电话话机机、手手机机已已经经包包含含了了语语音音识识别别拨拨号号功功能能,还还有有语语音音记记事事本本、语语音音智智能能玩玩具具等等产产品品也也包包含含了了语语音音识识别别与与语语音音合合成成功功能能。人人们们可可以以通通过过电电话话网网络络用用语语音音识识别别口口语语对话系统查询有关的机票、旅游、银行信息。对话系统查询有关的机票、旅游、银行信息。2/17/2023数字语音处理及MATLAB仿真 张雪英编著202.语音合成的应用语音合成的应用公公交交汽汽车车上上的的自自动动报报站站、各各种种场场合合
17、的的自自动动报报时时、自自动动报报警警、手手机机查查询询服服务务和和各各种种文文本本校校对对中中的的语语音音提提示示、在在电电信信声声讯讯服服务务:如如股股票票、售售后后服服务务、车车站站查查询询等等信信息息;也也可可用用于于基基于于微微型型机机的的办办公公、教教学学、娱娱乐乐等等智智能能多多媒媒体体软软件件,例例如如语语言言学学习习、教教学学软软件件、语语音音玩玩具具、语语音音书书籍籍等等;也也可可与与语语音音合合成成技技术术与与机机器器翻翻译译技技术术结结合合,实实现现语语音音翻翻译等。译等。2/17/2023数字语音处理及MATLAB仿真 张雪英编著213.语音编码的应用语音编码的应用在
18、在移移动动通通信信、卫卫星星通通信信、军军事事保保密密通通信信、信信息息高速公路和高速公路和IP电话通信中的应用。电话通信中的应用。在在个个人人移移动动通通信信、语语音音存存储储、多多媒媒体体通通信信、数数字数据网字数据网(DDN)中的应用。中的应用。未未来来的的ISDN、卫卫星星通通信信、移移动动通通信信、微微波波接接力通信和信息高速公路以及保密电话等中的应用。力通信和信息高速公路以及保密电话等中的应用。2/17/2023数字语音处理及MATLAB仿真 张雪英编著22二、二、语语音信号音信号处处理的新方向理的新方向(1)基基于于语语音音的的信信息息检检索索。网网络络技技术术及及数数字字图图书
19、书馆馆技技术术的的发发展展,基基于于语语音音识识别别的的信信息息检检索索技技术术正正成成为为研究研究热热点。点。(2)基基于于语语音音识识别别的的广广播播新新闻闻的的自自动动文文摘摘技技术术的的研研究究。由由于于广广播播、电电视视中中的的发发音音较较为为标标准准规规范范,在在识识别别中中避避免免了了说说话话人人发发音音上上的的不不规规范范,有有利利于于语语音音识识别别系系统统性能的提高。性能的提高。2/17/2023数字语音处理及MATLAB仿真 张雪英编著23二、二、语语音信号音信号处处理的新方向理的新方向(3)VoIP技技术术。是通。是通过过TCP/IP网网络络,而不是,而不是传统传统的的
20、电话电话网网络络来来传输语传输语音的新的通信方式,通常称之音的新的通信方式,通常称之为为IP电话电话技技术术。在网。在网络络上上对压缩对压缩的的语语音数据以数据包音数据以数据包的形式的形式进进行行传输传输和和识别识别。(4)语语音音训练训练与校正技与校正技术术。现现在越来越多的人希望在越来越多的人希望掌握其他非母掌握其他非母语语语语言,以便方便的言,以便方便的进进行交流。因此行交流。因此语语言学言学习习机已成机已成为为当今外当今外语语学学习习者的有利工具。者的有利工具。2/17/2023数字语音处理及MATLAB仿真 张雪英编著24二、二、语音信号处理的新方向语音信号处理的新方向(5)语种识别
21、。是近年来新出现的研究方向,通过)语种识别。是近年来新出现的研究方向,通过分析处理一个语音片断来判别其所属语音的种类,分析处理一个语音片断来判别其所属语音的种类,本质上属于语音识别的研究范畴。本质上属于语音识别的研究范畴。(6)基于语音的情感处理研究。在人与人的交流中,)基于语音的情感处理研究。在人与人的交流中,除了语音信息外,非语言信息也起着重要的作用。除了语音信息外,非语言信息也起着重要的作用。为了使人机交流更自然、更人性化,基于语音的情为了使人机交流更自然、更人性化,基于语音的情感处理研究也是非常必要的。感处理研究也是非常必要的。2/17/2023数字语音处理及MATLAB仿真 张雪英编
22、著251.4语音信号处理过程的总体结构语音信号处理过程的总体结构图图1.1信号处理和加工的一般示意图信号处理和加工的一般示意图信号提取与利用信号提取与利用信号变换信号变换信号表示信号表示观察与测量观察与测量信号源信号源信息加工和处理的一般流程如图信息加工和处理的一般流程如图1.1所示所示 2/17/2023数字语音处理及MATLAB仿真 张雪英编著26语音输入语音输入预处理预处理数字化数字化特征提取特征提取合成合成传输传输参考模式库参考模式库模式匹配模式匹配识别结果识别结果压缩处理压缩处理识别识别训练训练语音识别语音识别解压缩解压缩存储存储语音输出语音输出图图1.2 语音处理过程的结构框图语音
23、处理过程的结构框图语音处理过程的结构框图语音处理过程的结构框图2/17/2023数字语音处理及MATLAB仿真 张雪英编著271.5MATLAB在数字语音信号处在数字语音信号处理中的应用理中的应用数数字字语语音音信信号号处处理理是是将将数数字字信信号号处处理理与与语语音音学学相相结结合合,解解决决现现代代通通信信领领域域中中人人与与人人、人人与与机机器器之之间的信息交流的学科。间的信息交流的学科。MATLAB是是一一种种功功能能强强大大、效效率率高高、交交互互性性好的计算机高级语言。好的计算机高级语言。近近年年来来MATLAB已已成成为为学学习习语语音音信信号号处处理理和和进行研究工作的仿真软
24、件工具。进行研究工作的仿真软件工具。2/17/2023数字语音处理及MATLAB仿真 张雪英编著28MATLAB在数字语音信号中的几方面应用:在数字语音信号中的几方面应用:(1)通通过过MATLAB可可以以对对数数字字化化的的语语音音信信号号进进行时频域分析。行时频域分析。(2)通通过过MATLAB可可以以对对数数字字化化的的语语音音信信号号进进行估计和判别。行估计和判别。(3)通通过过利利用用MATLAB编编程程对对语语音音信信号号进进行行处处理理本本书书中中的的程程序序实实例例均均用用MATLAB语语言言编编写写,供供大家上机实践时参考。大家上机实践时参考。2/17/2023数字语音处理及
25、MATLAB仿真 张雪英编著29数字语音信号处理研究内容数字语音信号处理研究内容涉及三方面相互密切配合的任务和课题:涉及三方面相互密切配合的任务和课题:1.应应用用2.基基础础理理论论和算法和算法3.硬件系硬件系统统2/17/2023数字语音处理及MATLAB仿真 张雪英编著30 1.应应用方面用方面 通通信信产产业业起起源源于于1874年年电电话话的的发发明明。从从那那时时起,通信起,通信产业产业大致大致发发生了三次重大生了三次重大变变革。革。(1)第第一一次次变变革革产产生生于于七七十十年年代代初初。1972年年CCITT组组织织公公布布了了第第一一个个语语音音编编码码标标准准G.711。
26、即即对对数数PCM编编码码,由由此此开开始始,数数字字程程控控交交换换网网络络逐逐步淘汰了步淘汰了传统传统的模的模拟拟交交换传输换传输方式。方式。2/17/2023数字语音处理及MATLAB仿真 张雪英编著31 (2 2)第第二二次次重重大大变变革革产产生生于于八八十十年年代代末末。19881988年年欧欧共共体体1313个个国国家家数数字字移移动动特特别别工工作作组组(GSM)(GSM)制制定定了了采采用用长长时时预预测测规规则则码码激激励励的的编编码码标标准准(13k(13k bps bps RPE-LTP)RPE-LTP)。19891989年年美美国国蜂蜂窝窝通通信信工工业业协协会会(C
27、ITA)(CITA)宣宣布布了了北北美美数数字字移移动动通通信信话话音音编编码码标标准准(8K(8K bpsbps矢矢量量和和激激励励VSELP)VSELP)。从从而而确确立立了了全全球球范范围围第第二二个个传传输输网网移移动通信产业的崛起。动通信产业的崛起。2/17/2023数字语音处理及MATLAB仿真 张雪英编著32 (3)第第三三次次变变革革发发生生在在世世纪纪之之交交。以以新新兴兴的的计计算算机机因因特特网网为为基基础础的的信信息息高高速速公公路路在在全全世世界界范范围围迅迅速速发发展展。如如何何在在INTERNET网网上上有有效效地地传传输输话话音音成成为为产产业业界界关关注注的的
28、焦焦点点。IP电电话话将将使使因因特特网网成成为为第第三三个个话话音音通通信信传传输输网网。目目前前IP电电话话所所用用的的话话音音编编码码标标准准有有、G.728、G.729等等。这这些些标标准准各各有有长长短短。人人们们正正在在努努力力研研究究适适合合IP电电话话的的新新的的编编码码算算法法。低低延延迟迟、低低码码率率、低低复复杂杂性性、高高音音质质的的话话音音编码编码算法将是未来算法将是未来IP电话电话网网络络的奠基石。的奠基石。2/17/2023数字语音处理及MATLAB仿真 张雪英编著332.基基础础理理论论和算法方面和算法方面从以下方面从以下方面进进行:行:(1)语语音音产产生的机
29、理(生的机理(发发音)和感知机理(听)音)和感知机理(听)涉涉及及心心理理学学、语语音音学学、语语言言学学、认认知知学学、神神经经生生理学等。理学等。(2)将)将语语音作音作为为一种信号来一种信号来处处理理常常用用方方法法:数数字字滤滤波波器器(FIR、IIR);快快速速付付里里叶叶变变换换(FFT);线线性性预预测测编编码码(LPC);同同态态信信号号处处理等。理等。新的方法:神新的方法:神经经网网络络、矢量量化、子波、矢量量化、子波变换变换等等2/17/2023数字语音处理及MATLAB仿真 张雪英编著343.硬件方面硬件方面 硬硬件件系系统统主主要要体体现现在在内内存存容容量量和和计计算算速速度度上上。语语 音音 信信 号号 处处 理理 器器 的的 运运 算算 速速 度度 一一 般般 为为1020MIPS(MillionInstructionsPerSecond),有有的的可可达达50MIPS或或100MIPS,对对语语音音识识别别要要求求的的存存贮贮量量达到若干达到若干MB。实时语音语音处理系统的两种实现方式:实时语音语音处理系统的两种实现方式:A.主从式:主机内插上一块或多块主从式:主机内插上一块或多块DSP处理板。处理板。B.脱脱机机工工作作方方式式:通通用用DSP芯芯片片及及辅辅助助芯芯片片构构成。成。