语音信号处理实验教学大纲.docx

上传人:太** 文档编号:72783207 上传时间:2023-02-13 格式:DOCX 页数:19 大小:47.66KB
返回 下载 相关 举报
语音信号处理实验教学大纲.docx_第1页
第1页 / 共19页
语音信号处理实验教学大纲.docx_第2页
第2页 / 共19页
点击查看更多>>
资源描述

《语音信号处理实验教学大纲.docx》由会员分享,可在线阅读,更多相关《语音信号处理实验教学大纲.docx(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、语音信号处理实验教学大纲目录一、课程简介2二、课程实验教学的目的、任务与要求2三、实验方式与基本要求2四、实验项目设置3五、教材3六、实验报告要求3七、考试(考核)方式3八、使用说明3语音信号处理课程实验项目14语音信号处理课程实验项目26语音信号处理课程实验项目39语音信号处理课程实验项目413语音信号处理课程实验项目519X“(”)= e- Z yk)x(n-k)ejwkk=f(3)假定%(/)= hWM-攵)/%Af( 4 )则可以得到x“(*)=X(*)(5)同样,不同的窗口函数,将得到不同的傅立叶变换式的结果。由上式可见,短时傅立叶 变换有两个变量:n和川,所以它既是时序n的离散函数

2、,乂是角频率3的连续函数。与 离散傅立叶变换逼近傅立叶变换一样,如令/二2兀k/N,则得离散的短时傅立叶吧如下:X“(eKN)= x(k) =8Z x(m)做n- 母一”由3 ,(0 W k (0,&) 一1(4)(6)显然,误差越接近于零,线性预测的准确度在均方误差最小的意义上为最佳,由此可以 计算出预测系数。通过LPC分析,由若干帧语音可以得到若干组LPC参数,每组参数形成一个描绘该帧语 音特征的矢量,即LPC特征矢量。由LPC特征矢量可以进一步得到很多种派生特征矢量,例 如线性预测倒谱系数、线谱对特征、部分相关系数、对数面积比等等。不同的特征矢量具有 不同的特点,它们在语音编码和识别领域

3、有着不同的应用价值。2自相关法在最佳线性预测中,若用下式定义的时间平均最小均方准则代替式的集合平均最小 均方准则,即令1 N+p-lc- e2 () = minN n=0事实上就是短时自相关函数,因而R(i-k) = k)R(A) = S(),S(-&)根据平稳随机信号的自相关性质,可得= 1,2 乂= 0,1 (8)(9)(10)(8)(9)(10)由式,可得:(11)/e=a(o)Z4R(a)Jt=l综上所述,可以得到如下矩阵形式:RR(i)、以、AR(O)尺(尸-2)a2R(2):*=R(3)Rg)R(P-2)R(。)4/1(12)值得注意的是,自相关法在计算预测误差时,数据段s(),s

4、,S5-1)的两端都需 要加P个零取样值,因而可造成谱估计失真。特别是在短数据段的情况下,这一现实更为严 重。另外,当预测系数量化时,有可能造成实际系统的不稳定。自相关解法主要有杜宾算法、格型算法和舒尔算法等几种高效递推算法。3协方差法如果在最佳线性预测中,用下式定义的时间平均最小均方准则代替(3)式的集合平均最 小均方准则,则可得到类似的方程:1 N-1 =一工 J()= min(13)可以看出,这里的数据段两端不需要添加零取样值。在理论上,协方差法计算出来的预 测系数有可能造成预测误差滤波器的不稳定,但在实际上当每帧信号取样足够多时,其计算 结果将与自相关法的结果很接近,因而稳定性一般是能

5、够保证的(当然这种方法也有量化效 应可能引起不稳定的缺点)。协方差解法的最大优点在于不存在自相关法中两端出现很大预测误差的情况,在N和P 相差不大时,其参数估值比臼相关法要精确的多。但是在语音信号处理时,往往取N在200 左右。此时,自相关法具有较大误差的段落在整个语音段中所占的比例很小,参数估值也是 比较准确的。在这种情况下,协方差法误差较小的优点就不再突出,其缺乏高效递推算法的 缺点成为了制约因素。所以,在语音信号处理中往往使用高效的自相关法。4全极点声道模型将线性预测分析应用于语音信号处理,不仅是为了利用其预测功能,更因为它提供了一 个非常好的声道模型。将式(2)所示的方程看成是滤波器在

6、语音信号激励下的输入输出方程,则该滤波器称为 预测误差滤波器,其e(n)是输出误差。变换到z域,P阶预测误差滤波器的系统函数为(14)(14)”(z) = l + qz可以看出,如果将预测误差e(n)作为激励信号,使其通过预测误差滤波器的逆滤波器H(Z),即H(z) = = 7(15)则H(Z)的输出为语音信号s(n),也就是说,H(Z)在预测误差e(n)的激励卜.可以合成语 音。因此,H(Z)被称为语音信号的全极点模型,也称为语音合成器。该模型的参数就是P 阶线性预测的预测系数。,(:=L *P)。因为预测误差含有语音信号的基音信息,所以对于浊音,模型的激励信号源是以基音周 期重复的单位脉冲

7、;对于清音,激励信号源c(n)是自噪声。语音信号的全极点模型是一种 很重要的声道模型,是许多应用和研究的基础。5 LPCC如果声道特性H(Z)用式(14)所示的全极点模型表示,有(z) =(z) =(16)S(z)二 1 在) + %-” n=l式中,S(z)和I(z)分别为语音信号$“和激励源4的Z变换。对人的听觉来说,浊音是最重 要的语音信号。对于浊音,模型的激励信号源e(n)是以基音周期重复的单位脉冲,此时有 ,(z) = 1o可得上的z变换S(z)为S(z) = -1 + 武”(17)式中,4( = 1,2,P)为p阶线性预测系数。根据倒谱的定义,对具有最小相位特征的语音信号,,有(1

8、8)(18)lnS(z) = C(z) = XVn n-l式中,为语音信号的倒谱。将式(16)代入式(17),并对两边Z求导,得G = 4M n)(19)根据上式即可由线性预测系数通过递推得到倒谱系数,将这样得到的倒谱称为线性预测 倒谱系数。6结合语音帧能量构成LPC组合参数由于人能从声音的音色、频高等各种信息中感知说话人的个性,因此可以想象,利用特 征的有效组合可以得到比较稳定的识别性能。一般来说,如果组合的各参量之间相关性不大, 则会更有效一些,因为它们分别反映了语音信号中的不同特征。多年来,人们对组合参数在 说话人识别中的应用进行了大量研究。实验证明,组合参数可以提高系统的识别性能。组合

9、参数虽然可以提高系统的性能,但很显然,无论是在特征参数提取环节,还是在模 型训练和模型匹配环节都使运算量有所增加。在特征参数提取环节,要计算i种以上的特征 参数。在模型训练和模型匹配环节,由于组介参数特征矢量的维数较多,使运算或杂度有所 增加。运算量的增加会使系统的识别速度受到影响。为使运算量问题得到较好的解决,所以可以由LPC参数与语音帧能量构成组合参数,能 够在运算量增加不明显的情况下改进系统的性能。语音帧能量是指一帧语音信号的能量,它等于该帧语音样值的平方和。选取与语音帧能 量构成组合参数主要有以下考虑:1)语音帧能量是语音信号最基本的短时参数之一,它表 征一帧语音信号能量的大小,是语音

10、信号一个重要的时域特征;2)由一帧语音求出的语音 帧能量是一个标量值,与其它参量构成组合参数不会使原特征矢量的维数明显增加,特征矢 量的维数越少,则需要的运算复杂度越小,另外,获取语音帧能量的运算并不复杂;3)语 音帧能量与LPC参数之间的相关性不大,它们反映的是语音信号的不同特征,应该有较好的 效果。7模型增益G模型的激励信号GH)表示为:G”一岑-(20 ) 预测误差e(n)如式(2),这样当实际的预测系数与模型系数相等时,有(n) = Ge(n)这说明激励信号正比于误差信号,其比例常数等于模型增益G。通常假设误差信号的能 量等于输入激励信号的能量,因此可以得到:N-ljV-Id/M=o(

11、22)对于式中的激励信号),主要分为浊音和清音两种情况。其中为浊音时,考虑到此时实 际的激励信号为声门脉冲,因此可以将激励信号表示为二时的单位抽样。为了保证这个 假设成立,要求分析的区间应该大致和语音基因周期的长度相等。当语音为清音时,我们假 定激励信号4”)为一个零均值、单位方差的平稳白噪声过程。采用自相关解法时,浊音的模型增益为E“=R(0)-SjR“(i) = G2*=(23)清音计算模型增益的公式和浊音相同。五、实验内容应用LPC原理,对一语音信号进行LPC分析,编写Matlab程序实现对原始语音LPC分 析,估计线性预测系数以及LPC的推演参数,并利用所求的相关参数估计语音的端点、清

12、浊 音判断、基因周期、共振峰等。六、实验方法与步骤(1)熟悉理论内容(2)确定原始语音信号及采样频率(3)通过查阅资料,分组讨论自行编写并调试程序。七、实验要求1 .记录、整理实验结果,并对结果进行分析,以论文形式撰写实验研究报告(按照标准 科技论文形式完成),可用word文档形式提交实验报告。2 .教师指导讲评,总结实验收获,讨论最优化的特征分析程序编写方法。八、场地、设备与器材计算机实验室:1. PC机1台;2. MATLAB7.X环境语音信号处理课程实验项目5九、实验项目名称及实验项目编号基于VQ的特定人孤立词语音识别的研究,055123-05十、课程名称及课程编号语音信号处理,0551

13、23十一、实验目的通过本实验使学生:(1)掌握掌握矢量量化及语音识别的原理和方法(2)会利用已学的相关语音特征,构建语音特征矢量(3)能够利用VQ技术,编写训练VQ码表的程序(4)能够利用所学的语音识别技术,编程实现基于矢量量化的特定人孤立词语音识别十二、实验原理本实验是基于课程第四章矢量化技术、第五章隐马尔可夫模型、第九章语音识别作为主 要理论基础而设计的。本实验的准备知识:教材第四章、第五章、第九章内容.矢量量化(Vector Quanlizalion)是一种极其重要的信号压缩方法,是自70年代末才 发展起来的。它广泛应用于语音编码、语音识别与合成、图象压缩等领域。VQ在语音信号 处理中占

14、有十分重要的地位。许多重要的研究课题中,特别是低速语音编码和语音识别的研 究中,YQ都起着非常重要的作用。量化可以分为两大类:类是标量量化,另类是矢量量化。标量量化是将取样后的信 号值逐个地进行量化,而矢量量化是将若干个取样信号分成一组,即构成一个矢量,然后对 此矢量一次进行量化。当然,矢量量化压缩数据的同时也有信息的损失,但这仅取决于量化 的精度。矢量量化是标量量化的发展,可以说,凡是要用量化的地方都可以应用矢量量化。1矢量量化1)基本原理矢量量化的过程是:将语音信号波形的K个样点的每一帧,或者有K个参数的每一参数 帧,构成K维空间中的一个矢量,然后对这个矢量进行量化。通常所说的标量量化,也

15、可以 说是K=1的一维矢量量化。矢量量化的过程与标量晟化相似。在标最量化时,在一维的零至 无大值之间设置若干个量化阶梯,当某输入信号的幅度值落在某相邻的两个量化阶梯之间时, 就被量化为两阶梯的中心值。而在矢量量化时,将K维无限空间划为M个区域边界,然后将 输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。2)、失真测度设计矢量量化器的关键是编码器的设计,而译码器的工作仅是一个简单的查表过程。在课程名称:语音信号处理课程编号:055134英文名称:Speech signal processing课程性质:非独立设课课程属性:专业应开实验学期:第6学期学时学分:课程总学时-

16、48实验学时-16课程总学分一-3实验学分一一实验者类别:本科生适用专业:电子信息工程类先修课程:概率论与数理统计、数字信号处理、信号与系统一、课程简介语音信号处理课程是电子信息类学科的一门专业课,是研究应用数字信号处理技术 对语音信号进行处理的一门新兴交叉性学科。主要讲授语音信号处理基础、语音信号分析、 语音编码、语音合成、语音识别和增强的基础理论、技术和方法。通过本课程的学习,使学 生系统掌握语音信号处理的原理技术和实现方法,了解前沿、新兴技术在语音信号处理中的 应用以及学科最新的研究成果与进展,为进一步在相关领域开展研究和开发工作奠定基础。 二、课程实验教学的目的、任务与要求语音信号处理

17、是目前发展最为迅速的信息科学技术之一,其研究设计一系列前沿课题, 且处于迅速发展之中,属于应用学科。因此要学好这门课除了要有坚实的理论知识作为基础, 还要加强理论与实际相联系的应用能力的培养和训练。因此,为了深入理解语音信号数字处 理的基础理论、算法原理、研究方法和难点,根据数字语音信号处理教学大纲,结合课程建 设的需求,编排了五个实验,其中1基础性实验,3个综合型实验,1个综合性设计实验。 教师在讲授过程中可以针对某一个实验进行延伸,比如说,语音端点的检测、语音共振峰提 取、基于HMM或DTW的有限词汇或大词汇的特定人、非特定人的语音识别、识别率的提高(如 何提高有噪环境下的识别率)、以及编

18、码问题等;学生在实验过程中也可以延伸学习,创新 学习,可深入思考如何将有关的方法在嵌入式系统或DSP下的实现问题等。三、实验方式与基本要求实验方式:学生一人一机,独立实验,注意记录实验数据与结果分析。基本要求:实验前,学生要认真预习实验任务,了解实验目的和实验内容;实验时,要 认真上机,认真实践和设计,做好观察分析和记录:实验后,按要求编写实验报告。 编码的过程中,需要引入失真测度的概念。失真是将输入信号矢量用码书的重构矢量来表征 时的误差或所付出的代价。而这种代价的统计平均值(平均失真)描述了矢量量化器的工作 特性。在矢量量化器的设计中,失真测度的选择是很重要的。失真测度选用的合适与否,直接

19、 影响系统的性能。要使所选择的失真测度有实际意义,必须具备以下几个条件:在主观评价 上有意义,即最小的失真应该对应与好的主观语言质量;易于处理,即在数学上易r实现, 这样可以用于实际的矢量量化器的设计;平均失真存在并且可以计算。2 LBG算法算法是由Linde, Buzo和Gray在1980年首次提出的,常称为LBG算法。它是标量量化 器中Lioyd算法的多维推广。整个算法实际上就是反复迭代的过程,既用初始码书寻找最佳 码书的迭代过程。它由对初始码书进行迭代优化开始,一直到系统性能满足要求或者不再有 明显的改进为止。这种算法既可以用于已知信号源概率分布的场合,也可以用于未知信号源概率分布的场

20、合,但此时要知道它的一系列输出值(称为训练序列)。由于通常语音信号的概率分布随着 各种应用场合的不同,不可能事先统计过,因而无法知道它的概率分布。所以目前多用训练 序列来设计码书和矢量量化器。3语音识别语音识别是研究使机器能够准确地听出人的语音内容的问题,即准确的识别所说的语音。 语音识别是近二三十几年发展起来的新兴学科,在计算机、信息处理、通信与电子系统、自 动控制等领域中有着广泛的应用。运用语音识别技术,人们设计了各种语音识别系统。有的已经应用于实际,有的还处在 研究阶段。其中对孤立词的以别,研究的最早也最成熟,目前,对孤立词的识别无论是小词 汇量还是大词汇量,无论是与讲话者有关还是与讲话

21、者无关,在实验室中的正识率已经达到 95%以上。这种系统存在的问题最少,因为单词之间有停顿,可以使识别问题简单化;且单词之间 的端点检测比较容易;单词之间的协同发音影响也可以减至最低;对孤立词的发音都比较认 真。由于此系统本身用途广泛,且其许多技术对其他类型系统有通用性并易于推广,所以稍 加补充一”知识就可用于其他类型系统(如在识别部分加用适当语义信息等,则可用于连续 语音识别中)。采用矢量量化技术主要用于减少计算量,应用于特征处理可减少特征的类型 从而减少计算量,也可以推广应用到摸板的归并压缩。其主要工作就是聚类,即在特征空间 中合理的拟定一组点(称为一组聚类中心或码本),每个中心称为码字。

22、于是特征空间中任 一点均可按最小距离准则用码本之来代表。不管用何种语音识别方法,主要过程由两部分组成,一是训练,一是识别。在进行训练 时,用观察的序列训练得到参考模型集,每一个模型对应于摸板中的一个单词。在进行识别 时,为每一个参考模型计算出产生测试观察的概率,且测试信号(即输入信号)按最大概率 被识别为某个单词。要实现上面的隐马尔可夫模型,模型的输入信号必须取自有限字母集中的离散序列,也 就是说,必须将连续的语音信号变为有限离散的序列。例如若模型的输入信号为LPC参数这 样的矢量信号,那么用矢量量化完成上述的识别过程是非常合适的。十三、实验内容利用编程实现基于矢量晟化的特定人孤立词语音识别。

23、十四、实验方法与步骤(1)熟悉理论内容和实验要求(2)通过查阅资料,设计实验流程。(3)分组讨论自行完成编写并调试程序。十五、实验要求1 .记录、整理实验结果,并对结果进行分析,以论文形式撰写实验研究报告(按照标准 科技论文形式完成),可用word文档形式提交实验报告。2 .教师指导讲评,总结实验收获,讨论最优化的特征分析程序编写方法。十六、场地、设备与器材计算机实验室:1. PC机1台;2. MATLAB7.X环境四、实验项目设置注:烟幽:L演示,2的证,3综合/,L设H砒泞5其他 娘坳0: 1.挣出2专业端出3专业4其2 雌麻1.必笏2选为B其它序号实验编号实验项目名称实验内容提要实验时数

24、实验类型实验类别实验要求每组人数101Mat lab语音信号处理基础及语音信号采集熟悉Mat lab开发环境 掌握语音信号采集方法2演示升必专业必修1202语音信号时域分析掌握语音信号时域特征分析原理, 编写程序设计实现语音信号的时域 特征分析。4综合专业必修1303语音信号频域特征分析掌握语音信号频域特征分析原理, 编写程序设计实现语音信号的领域 特征分析8综合专业必修1401语音信号的LPC分析应用LPC原理,编写Matlab程序设 计实现对原始语音LPC分析8综合专业必修1505基于VQ的特定人孤立词语 音识别的研究基于理论完成基于VQ的特定人孤立 词语音识别的研究10设计研究专业必修1

25、ui+32五、教材(讲义、指导书):语音信号处理(第二版),赵力,机械工业出版社,2009.参考书:1、语音信号处理(修订版)胡航编著,哈尔滨工业大学出版社2002.2、语音信号处理易克初主编国防工业出版社2000.3、语音信号处理韩纪庆、张磊、郑毅然编著,清华大学出版社2004.4、离散时间语音信号处理一原理与应用,美Thomas F.Quaticri著,赵胜辉等译,电子工业出版社,2004.六、实验报告要求每个实验均按统一格式编写实验报告。七、考试(考核)方式实验检查和实验报告。八、使用说明本教学大纲适用于电子信息类专业,按照课堂讲授进度可适当调节或增删实验内容。附件:语音信号处理课程实验

26、项目1一、实验项目名称及实验项目编号Mat lab语音信号处理基础及语音信号采集,055123-01二、课程名称及课程编号语音信号处理,055123三、实验目的通过本实验使学生:(1)熟悉Mat lab开发环境(2) 了解应用Mat lab处理语音信号的编程的一般方法(3)熟悉语音信号特点并掌握语音信号的采集方法四、实验原理本实验是基于课程第二章语音信号处理基础知识和第三章语音信号的数字化与预处理 作为理论基础而设计的。本实验的准备知识:教材第二章及第三章的3. 1、3. 2节.1、MATLAB 7.x的工作环境主要由命令窗(Command Window)、图形窗(Figure Window)

27、和文本编辑窗(File Editor)组成。2、变景创建及赋值方法a.直接输入法:矩阵元素必须用括住;矩阵元素必须用逗号或空格分隔;在内矩阵的行与行之间必须用分号分隔。b.逗号和分号的作用:逗号和分号可作为指令间的分隔符,matlab允许多条语句在同 一行出现。分号如果出现在指令后,屏幕上将不显示结果。c.用mallab函数创建矩阵。3、Matlab编程的一般方法4、语音的录入与打开:(a) y, fs, bits=wavrcad(,Blip, N1 N2);用于读取语音,采样值放在向量y中, fs表示采样频率(Hz), bits表示采样位数。N1 N2表示读取从N1点到N2点的 值(若只有个

28、N的点则表示读取前N点的采样值)。(b) sound(x, fs, bits);用于对声音的回放。向量y则就代表了一个信号(也即一个 复杂的“函数表达式”)也就是说可以像处理一个信号表达式一样处理这个声音信 号。五、实验内容熟悉Matlab语音信号处理开发环境,利用Windows语音采集工具按要求采集语音信号。六、实验方法与步骤(1)通过操作熟悉Yallab开发环境。(2)语音信号的采集利用晅ndows语音采集工具采集语音信号,将数据保存wav格式。采集一组浊音 信号和一组清音信号,信号的长度大于3s。七、实验要求1 .记录、整理实验结果,并对结果进行分析。可用word文档形式提交实验报告。2

29、 .设计内容作为考查内容,贯穿在实验中进行评价。八、场地、设备与器材计算机实验室:1. PC机1台;2. MATLAB7.X环境语音信号处理课程实验项目2一、实验项目名称及实验项目编号语音信号时域分析,055123-02二、课程名称及课程编号语音信号处理,055123三、实验目的通过本实验使学生:(1)掌握语音信号时域分析的基本原理与方法(2)掌握一种语音信号基音周期提取方法(3)掌握短时过零率计算方法(4)学会应用Mat lab对语音信号进行时域分析的编程方法四、实验原理本实验是基于课程第三章3. 3节语音信号的时域分析作为理论基础而设计的。本实验的准备知识:教材第三章的3. 3节.语音信号

30、是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音 识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目 的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换 域等处理方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进行分析,提取 的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。1.短时过零率:短时内,信号畤越横轴的情况,对于连续信号,观察语音时域波形通过横轴的情况:对 于离散信号,相邻的采样值具有不同的代数符号,也就是样点改变符号的次数。对于语音信号,是宽带非平稳信号,应考察其短时平均过零率

31、。1 N-1= - Z |sgn| (/)-sgn x(m-1)(2 m=O其中sgn.为符号函数sgn(x(n)= 1 x(n)0sgn(x(n)=-l x(n) 0短时平均过零的作用(a)区分清/浊音:浊音平均过零率低,集中在低频端;清音平均过零率高,集中在高频端。(b)从背景噪声中找出是否有语音,以及语音的起点。2.基音周期基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音 周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多 个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码, 发音系统疾病诊断、听觉残障

32、者的语音指导等。因为汉语是一种有调语言,基音的变化模式 称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提 取和估计对汉语更是一个十分重要的问题。由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同一个 人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基 音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:声门激励 信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些 清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。声道共振峰有时会严重 影响激励信号的谐波结构

33、,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信 息并不容易。语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过 零点受共振峰的结构、噪声等的影响。基音周期变化范围大,从老年男性的50Hz到儿童 和女性的450Hz,接近三个倍频程,给基音检测带来了一定的困难。由于这些困难,所以迄 今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应 用领域和各种环境条件情况下都能获得满意的检测结果。尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题, 为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(P

34、PA)、平均幅 度差函数(AMDF)法、并行处理技术、倒谱法、SIFT、谱图法、小波法等等。五、实验内容本实验要求掌握时域特征分析原理,并利用己学知识,编写程序求解语音信号的短时过 零率、短时能量、短时自相关特征,分析实验结果,并能掌握借助时域分析方法所求得的参 数分析语音信号的基音周期及共振峰。利用Windows语音采集工具按要求采集语音信号,并 利用短时相关函数计算语音信号的基音周期,并计算机其短时过零率。六、实验方法与步骤(1)语音信号的采集利用Windows语音采集工具采集语音信号,将数据保存wav格式。采集一组浊音信号和一组清音信号,信号的长度大于3so(2)采用短时相关函数计算语音

35、信号浊音基音周期,考虑窗长度对基音周期计算的影响。采用倒谱法求语音信号基音周期。(3)计算短时过零率,清音和浊音的短时过零率有何区别。七、实验要求1 .记录、整理实验结果,并对结果进行分析。可用word文档形式提交实验报告。2 .设计内容作为考查内容,贯穿在实验中进行评价。八、场地、设备与器材计算机实验室:1. PC机1台;2. LATLAB7.x环境语音信号处理课程实验项目3一、实验项目名称及实验项目编号语音信号频域特征分析,055123-03二、课程名称及课程编号语音信号处理,055123三、实验目的通过本实验使学生:(1)掌握傅里叶分析的原理(2)会利用已学的知识,编写程序估计短时谱、倒

36、谱,画出语谱图,并分析实验结果 (3)借助频域分析方法所求得的参数分析语音信号的基音周期或共振峰。(3)学会应用Mat lab分析语音信号频域特征的编程方法四、实验原理本实验是基于课程第三章3.4节语音信号的频域分析作为理论基础而设计的。本实验的准备知识:教材第二章及第三章的3. 4、3.6、3.7、3.8、3. 9节.信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可 以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分 析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明 信号的各项红物理现象。由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激 励的线性系统的输出。输出频谱是声道系统频率响应与激励源频谱的乘积。声道系统的频率 响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信 号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而 可以采用短时分析法。1、短时傅立叶变换由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为:X“ (*)= 田一 rri)ejwm阳=()其中是实窗口函数序列,n表示某一语音信号帧。令n-m=k,则得到kj(2)于是可以得到

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁