数字语音处理及MATLAB仿真张雪英.pptx

上传人:莉*** 文档编号:87370435 上传时间:2023-04-16 格式:PPTX 页数:52 大小:612.57KB
返回 下载 相关 举报
数字语音处理及MATLAB仿真张雪英.pptx_第1页
第1页 / 共52页
数字语音处理及MATLAB仿真张雪英.pptx_第2页
第2页 / 共52页
点击查看更多>>
资源描述

《数字语音处理及MATLAB仿真张雪英.pptx》由会员分享,可在线阅读,更多相关《数字语音处理及MATLAB仿真张雪英.pptx(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、5.1 概述 同态处理方法是一种设法将非线性问题转化为线性问题来进行处理的方法,它能将两个信号通过乘法合成的信号,或通过卷积合成的信号分开。由卷积结果求得参与卷积的各信号分量称为“解卷积”或简称“解卷”。对语音信号进行同态分析后,将得到语音信号的倒谱参数,因此同态分析也称为倒谱分析或同态处理。第1页/共52页5.2 叠加原理和广义叠加原理 对于一个线性系统来说,其输入输出的关系服从叠加原理。设输入信号x(n)由两个信号分量x1(n)、x2(n)的和构成,系统输出为y(n),则有 其中L表示线性算子。第2页/共52页 叠加原理:如果输入信号是若干基元信号的线性组合,则系统输出是各个对应系统线性组

2、合。通过模仿普通线性系统的叠加原理,我们能定义一类系统,它服从广义叠加原理,其中加法可由卷积代替。即:卷积同态系统:具有上式所示性质的系统。第3页/共52页5.3 卷积同态系统第4页/共52页典型卷积同态系统由三部分组成:典型卷积同态系统由三部分组成:特征系统特征系统D、线性系统、线性系统L及逆特征系统及逆特征系统 。第5页/共52页 特征系统D*:其输入是若干信号的卷积组合,而输出为若 干信号的加法组合。特征系统D*有下述性质:普通线性系统:普通线性系统:服从一般的叠加原理,如下式表示:服从一般的叠加原理,如下式表示:第6页/共52页特征系统D*的逆系统:它将信号的加法组合变换回卷积组合。逆

3、特征系统有下述性质:第7页/共52页 按照卷积定理,时域上是两个信号的卷积,则其z变换是两个信号z变换的乘积,即:其z变换为:利用z变换表示,卷积组合可变为乘法组合。第8页/共52页 利用对数特性,可将乘法组合变为加法组合,再进行逆z变换,输出信号仍为加法组合,这就构成了卷积同态系统的特征系统D*。有 第9页/共52页下面是两系统框图:下面是两系统框图:第10页/共52页对卷积同态系统的逆特征系统有 第11页/共52页5.4 复倒谱和倒谱定义设信号x(n)的z变换为X(z)=zx(n),其对数为 那么 的逆z变换可写成 取 ,上两式可分别写为 第12页/共52页 如果对 的绝对值取对数,得 则

4、求出的倒频谱c(n)为实倒谱,简称为倒谱,即 上式要求相角为的连续奇函数。信号的复倒谱定义式:信号的复倒谱定义式:第13页/共52页复倒谱的性质 z变换的一般形式为:其中ak、的绝对值皆小于1;A是一个非负实系数。因此,和 项对应于单位圆内的零点和极点;和 项对应于单位圆外的零点和极点;和 分别表示单位圆内和单位圆外的零点数目;和 分别表示单位圆内和单位圆外的极点数目;因子 表示时间原点的移动。第14页/共52页 于是,X(z)的复对数是 在计算复倒谱的过程中一般要去掉 ,因此,在讨论复倒谱的性质时将这一项略去。第15页/共52页 可以证明复倒谱具有如下形式:可以证明复倒谱具有如下形式:第16

5、页/共52页性质1:即使x(n)可以满足因果性、稳定性、甚至持续期有限的条件,一般而言复倒谱也是非零的,而且在正负n两个方向上都是无限伸展的。性质2:复倒谱是一个有界衰减序列,其界限为 其中:是 、的最大绝对值,是一个常数。性质3:如果在单位圆外无极点和零点,则有 这种信号称为“最小相位”信号复倒谱的重要性质:复倒谱的重要性质:第17页/共52页 一个序列的傅里叶变换的实部就等于该序列偶部的傅里叶变换,因为是倒频谱c(n)的傅里叶变换,所以 容易证明 因此,为了求得最小相位序列的复倒谱,可以先计算其倒谱c(n),然后用上式求 。第18页/共52页 最小相位序列的另一个重要结论:复倒谱可由输入信

6、号经过递推计算得到,递推公式是 性质4:X(z)在单位圆内没有极点或零点时,可以得到与此类似的结论。这种信号称为“最大相位”信号,在此情况下有 第19页/共52页再考虑n0的情形,可得 和最小相位序列的情形相同,也能得到一个复倒谱的递推公式,其形式为 第20页/共52页 性质5:如果输入信号为一串如下冲激信号:其z变换是 复倒谱 只在Np的各整数倍点上不为零,这意味着 也是一个间隔为Np 的冲激串。第21页/共52页例如,设p(n)为 则 这表明 是一个冲激串,冲激之间的间隔为N,即有 重要结果:对于一串间隔均匀的冲激,它的复倒谱也是一串均匀间隔的冲激,而且其间隔相同。第22页/共52页5.5

7、 复倒谱的几种计算方法 在复倒谱分析中,z变换后得到的是复数,所以取对数时要进行复对数运算。这时存在相位的多值性问题,称为“相位卷绕”。第23页/共52页则其傅里叶变换为 对上式取复对数为 则其幅度和相位分别为 设信号为设信号为第24页/共52页 上式中,虽然 ,的范围均在 之内,但 的值可能超过 范围。计算机处理时总相位值只能用其主值 表示,然后把这个相位主值“展开”,得到连续相位。所以存在情况:(k为整数)此时即产生了相位卷绕。下面介绍几种避免相位卷绕求复倒谱的方法。第25页/共52页最小相位信号法 限制条件:被处理的信号想x(n)必须是最小相位信号。实际上许多信号就是最小相位信号,或可以

8、看作是最小相位信号。语音信号的模型就是极点都在z平面单位圆内的全极点模型,或者极零点都在z平面单位圆内的极零点模型。第26页/共52页 设信号x(n)的z变换为X(z)=N(z)/D(z),则有 根据z变换的微分特性有 若x(n)是最小相位信号,则 必然是稳定的因果序列。第27页/共52页 由Hilbert变换的性质可知,任一因果复倒谱序列都可分解为偶对称分量和奇对称分量之和:其中 这两个分量的傅里叶变换分别为 的傅里叶变换的实部和虚部。第28页/共52页 从而可得 此即复倒谱的性质3,也就是说一个因果序列可由其偶对称分量来恢复。如果引入一个辅助因子g(n),上式可写作 其中 第29页/共52

9、页最小相位信号法求复倒谱原理框图如下:图5.5 最小相位信号法求复倒谱原理框图第30页/共52页递归法 条件:仅限于是最小相位信号的情况。根据z变换的微分特性得 对上式求逆z变换,根据z变换的微分特性,有 所以 第31页/共52页设x(n)是最小相位序列,而最小相位信号序列一定为因果序列,所以有由于 及 ,可得递推公式递归运算后由复倒谱定义第32页/共52页可知如果x(n)是最大相位序列,则变为其中,。第33页/共52页倒谱的MATLAB实现 实验所用的语音样本是用Cooledit在普通室内环境下录制的女声“我到北京去”,采样频率为8kHz,单声道。倒谱程序见教材,运行结果如图。第34页/共5

10、2页050100150200250300350400-0.500.5截取的语音段样点数幅度-200-150-100-50050100150200-0.500.5截取语音的倒谱样点数幅度倒谱程序运行结果图倒谱程序运行结果图第35页/共52页5.6 语音的倒谱分析及应用语音的倒谱分析原理 浊音语音段可以看作是一个周期冲激串激励一个线性非时变系统产生的。同样,清音语音段可以看作是由随机噪声激励一个线性非时变系统产生的。则浊音语音段可以表示为 第36页/共52页由于所以而 的z变换为 第37页/共52页对清音,它的一段可以表示为其z变换为 第38页/共52页 语音分析的根本任务是解卷积,即求出反映声道

11、系统特性的 或 ,同态解卷系统是解决这一问题的有力手段。根据语音产生模型,(或 )的复倒谱 (或 )具有如下形式 第39页/共52页这里的倒谱窗可定义为 如果要保存激励分量,选择倒谱窗为其中 。倒谱窗在对数幅度谱域起平滑作用。第40页/共52页 在语音识别的特征提取中,则常用一种半个正弦波或类似的两头小中间大的倒谱窗来处理,其效果更好一些。这样的加权倒谱窗有多种形式,其中一种典型的形式为这样得到的倒谱系数,称为加权倒谱系数。这样得到的倒谱系数,称为加权倒谱系数。第41页/共52页 语音倒谱分析系统方法已用到语音分析与综合上,根据倒谱的低时部分计算声道冲激响应,还可根据倒谱判别清音或浊音,估计浊

12、音基音周期等,在语音综合时,以声道冲激响应和准周期冲激或噪声序列相卷积来合成语音,也可根据倒谱来估计声道滤波器的极点和零点。第42页/共52页语音的倒谱应用 1基音检测 语音的倒谱是将语音的短时谱取对数后再进行IDFT得到的,所以浊音信号的周期性激励反映在倒谱上是同样周期的冲激。借此,可从倒谱波形中估计出基音周期。一般把倒谱波形中第二个冲激,认为是对应激励源的基频。下面给出一种倒谱法求基音周期的框图及流程图如下两页。第43页/共52页 第44页/共52页第45页/共52页图图5.10 倒谱法求浊音的基音周期倒谱法求浊音的基音周期第46页/共52页图图5.11 清音的倒谱清音的倒谱第47页/共52页 2共振峰检测 倒谱将基音谐波和声道的频谱包络分离开来。对倒谱进行低时窗选,通过语音倒谱分析系统的最后一级,进行DFT后的输出即为平滑后的对数模函数,这个平滑的对数谱显示了特定输入语音段的谐振结构,即谱的峰值基本上对应于共振蜂频率,对平滑过的对数谱中的峰值进行定位,即可估计共振峰。原理框图及流程图如下页。第48页/共52页第49页/共52页第50页/共52页图图5.14 共振峰检测程序运行结果共振峰检测程序运行结果第51页/共52页感谢您的观看!第52页/共52页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁