《第四章小波变换.doc》由会员分享,可在线阅读,更多相关《第四章小波变换.doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流第四章小波变换.精品文档.语音增强算法研究p584.1小波理论4.1.1小波变换的定义4.1. 2小波去噪原理.4.2小波包变换语音增强方法4.2.1 小波包变换语音增强方法原理4 2. 2 Bark尺度小波包分解4.2.3闽值函数4.2.4 实验仿真4.3小波包变换和听觉掩蔽效应的语音增强方法4.3. 1小波包变换和听觉掩蔽效应的语音增强方法原理4.3. 2实验仿真第四章 小波包语音增强算法 小波(Wavelets)分析的起源可以追溯到20世纪初,在20世纪80年代后期开始形成一个新兴的数学分支。小波变换是调和分析这一数学领域半个世纪以来的
2、工作结晶,是傅里叶变换发展史上的里程碑式的进展,近些年来成为国外众多学者共同关注的热点。它在傅里叶变换的基础上发展而来,但又有极大不同。传统的信号处理方法是建立在傅立叶变换的基础上,而傅立叶分析使用的是一种全局的变换,要么完全在时域,要么完全在频域,因此无法表达信号的时频局域性质,而这种性质恰恰是非平稳信号(如语音信号)最根本和最关键的性质。小波分析是建立在泛函分析、傅立叶分析、样条分析及调和分析基础上的新的分析处理工具它又称为多分辨分析,在时域和频域同时具有良好配局部化特性,常被誉为信号分析的“数学显微镜”。小波变换在时频两域都具有表征信号局部特征的能力,它克服了短时傅立叶变换固定分辨率的缺
3、点,在信号的高频部分,可以获得较好的时间分辨率,在信号的低频部分可以获得较高的频率分辨率,这就使指小波变换具有对信号的自适应性。它能有效地从信号中提取信息,通过伸缩和平移等运算功能对信号进行多尺度细化分析。小波分析是目前国际上公认的信号信息获取与处班领域的高新技术,是信号处理的前沿课题,其中小波去噪也是小波分析的主要应用之一,对语音增强的研究不可避免的要利用小波这一有效工具。 小波包变换理论是20世纪80年代中后期逐渐成熟并发展起来的,由于可同时进行时域和频域分析,具有时频局部化和变分辨特征,而且小波函数的选取也很灵活,因此在语音增强中得到了广泛的应用。这就使得小波包变换在信号处理方面有许多独
4、到的优点,特别适用于像信号处理,图象处理,量子场论,地震探测,话音识别与增强,雷达,机器视觉以及数字电视等科技领域31-354.1小波理论4.1.1小波变换的定义其中,为给定的一个基本函数,式中a,b均为常数,且a0。给定平方可积的信号x(t , ,则的小波变换(wavelet transform,WT)定义为:式中,a,b和t均是连续变量。因此此式又称为连续小波变换(CWT)。信号的小波变换 (a,b)是a和b的函数,b是时移,a是尺度因子。又称为基本小波,或母小波。是母小波经移位和伸缩所产生的一组函数,称之为小波基函数,或简称小波基。母小波可以是实函数,也可以是复函数。若是实信号,也是实信
5、号,则也是实函数,反之,为复函数。在(5-l)式中,时移b的作用是确定对分析的时间位置,也即时间中心。尺度因子a的作用是把基本小波作伸缩。由变成,当a1时,a越大,则的时域支撑范围(即时域宽度)较之变得越大;反之,当a1时,a越小,则的宽度越窄。这样,a和b联合起来确定了对分析的中心位置及分析的时间宽度。这样,(5-2)式的小波变换可以理解为用一组分析宽度不断变化的基函数对作分析,这一变化正好适应了对信号分析时在不同频率范围需要不同的分辨率这一基本要求。(5-2)式中的因子是为了保证在不同的尺度a时,始终能和母函数有蓍相同的能量,即:令,则dt=adt,这样,上式右边的积分即等于。令的傅里叶变
6、换为 , 的傅里叶变换为,由傅里叶变换的性质:的傅里叶变换为:由Parseval定理,(5-2)式可重新表达为:此式即为小波变换的频域表达式36。5.1.2小波去噪原理假设观察信号式中,是纯净语音信号,是噪声序列。假定是零均值且服从高斯分布的随机序列,对(5-5)式两边做小波变换,根据小波变换的性质,有:即两个信号和的小波变换等于各个信号小波变换的和。再令u (t)是零均值、独立同分布的平稳随机信号,记。显然:是的协方差矩阵。令是小波变换矩阵,对于正交小波变换,它是正交阵。分别令x和s是对应s(t)和u(t)的向量,向量X, S和U分别是x(t) , s(t)和u(t)的小波变换,即:由于X
7、=S+U。令P是U的协方差矩阵,由于:所以:因为W是正交阵,且。 由此,可得到一个重要的结论:平稳白噪声的正交小波变换仍然是平稳的白噪声。由此结论可知,对于加法性噪声模型,经正交小波变换后,最大程度地去除了的相关性,其能量将集中在少数的小波系数上,这些系数即是信号经小波变换后在各个尺度下的模极大值。但是,噪声经正交小波变换后仍然是白噪声,因此,其小波系数仍然是不相关的,它们将分布在各个尺度下的所有时间轴上。这一结论即为抑制噪声提供了理论依据,即在小波变换的各个尺度下保留那些模极大值点,而将其他点置零,或是最大程度地减小,然后利用处理后的小波系数做小波反变换,即可达到抑制噪声的目的。5.2小波包
8、变换语音增强方法5.2.1小波包变换语音增强方法原理 在小波变换中,由于多分辨分析只是对低频部分作进一步分解,高频部分则不再分解。小波包分析能将频带进行多层次划分,对多分辨分析没有细分的高频部分进一步分解,并能够根据被分析信号的特征,自适应地选择相应频带,使之与信号频谱相匹配,从而提高了时一频分辨率37。假设带噪语音信号可以表示为:其中,是含有噪声的语音信号,是没有叠加噪声的语音信号,是方差为的高斯白噪声。 对信号进行N层离散小波包分解,得到一组小波包分解系数,由两部分组成:一部分是对应的小波包系数,记为,另一部分是对应的小波包系数,记为对于每一个小波包分解系数,选择一个当的阈值,并对系数进行
9、阈值量化,得出估计小波系数,使得尽量小。5.2.2 Bark尺度小波包分解Barkhausen等学者依据人耳的掩蔽效应的实验结果,提出了频率群的概念。即将基底膜分解为许多的小段,每一小段称为一个频率群。在20-16000Hz范围内共有24个频率群。同一频率群的声音在大脑中是叠加在一起进行评价的,具有一致的心理声学特征。按频率由低到高,将频率群顺序编号,将编号定义为32新的频率单位Bark。若记Bark域的频率变量为z,赫兹(Hertz)域频率变量为,则有:Bark域的频率描述充分反映了人耳的听觉特性,因此在语音处理方面得到了大量应用。根据小波包的函数空间正交剖分理论,可以构造与人耳Bark域频
10、率描述相似的小波包分解结构,称之为“Bark尺度小波包分解”。常规方法是模拟人耳的24个频率群,对于8kHz采样的语音信号,选取1至17个频率群,得到的每个子带的中心频率相差1Bark。试验证实,如果对Bark域进行进一步分解,使每个子带的中心频率相差减至,对语音的描述会更加细致,也不会导致较大的计算量。因此,本论文采用的小波包分解树结构如图5-1所示,共68个子频带38-41。5.2.3阈值函数 在小波阈值去噪理论中42-44,阈值函数的选取和阈值的确定是两个最基本的问题。目前存在的阈值函数主要是硬阈值函数和软阈值函数。但由于硬阈值函数整体不连续,直接导致了会在去噪后的信号中出现突变的震荡点
11、,当噪声水平较高时,这种现象尤为明显。软阈值函数虽然整体连续性好,但是由于当小波系数较大时,处理过的系数与原系数之间总存在恒定的偏差,这将直接影响重构信号与真实信号的逼近程度,给重构信号带来不可避免的误差。考虑到软、硬阈值函数存在的缺陷,人们提出了各种基于这两种基本阈值函数的改进的阈值函数。 小波阈值在去噪过程中起到了决定性的作用。如果太小,那么,施加阈值以后的小波系数中将包含过多的噪声分量,达不到去噪的目的;反之,如果太大,那么将去除一部分信号的分量,从而使由小波系数重将后的信号产生过大的失真。因此,在实际工作中,估计阈值的大小尤为关键。常用的估计阀值的阀值函数为硬阈值函数45和软阈值函数4
12、6: 但是,由于硬阈值函数整体不连续,直接导致了会在去噪后的信号中出现突变的震荡点,当噪声水平较高时尤为明显。软阈值函数虽然整体连续性好,但是由于当小波系数较大时,处理过的系数与原系数之间总存在恒定的偏差,这将直接影响重构信号与真实信号的逼近程度。文献36提出了一种改进的阀值函数能够有效减少失真,其阀值函数:一种改进的阀值函数公式为:小波包变换语音增强方法原理图:小波包变换的语音增强算法的具体步骤为:步骤1:对带噪语音分帧。步骤2:采用5阶Daubechies小波进行Bark尺度小波包分解,得到每一级的小波包分解系数。步骤3:用小波系数在各尺度下绝对值的中值估算噪声方差。步骤4:利用通用阀值计
13、算每一级的节点阀值,并对该节点的小波包分解系数进行采用公式(5-15)的处理,更新小波包系数。步骤5:进行小波包重建,重叠相加恢复原始数据帧长度的增强语音。5.2.4实验仿真用MATLAB对Bark尺度小波包变换语音增强方法进行实验仿真:1. 实验所用数据:语音取自863语音库,噪声为NOISEX. 92数据库的高斯白噪声和火车噪声,语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%。2.仿真所选标准:波形图,语谱图。3.仿真结果如下:5.3小波包变换和听觉掩蔽效应的语音增强方法5.3.1小波包变换和听觉掩蔽效应的语音增强方法原理 小波包变换理论是20世纪80年代中后期逐渐成熟并
14、发展起来的,由于可同时进行时域和频域分析,具有时频局部化和变分辨特征,而且小波函数的选取也很灵活,因此在语音增强中得到了广泛的应用。但是,增强后不可避免地伴有一定程度的音乐噪声,影响了增强效果。掩蔽效应通过模拟人耳的感知,能够掩蔽同时进入听觉系统的较小噪声信号。优点是可以有效地抑制音乐噪声,缺点是性能受限于对背景噪声功率谱估计的准确性,且计算量较大,运行速度较慢。为了抑制音乐噪声和提高运算速度,本文提出一种基于小波包变换和听觉掩蔽效应的语音增强算法,同时具备了小波包变换和掩蔽效应两种方法的优点。仿真结果表明,该算法在信噪比和听觉舒适度上都取得了较好的效果。小波包变换和听觉掩蔽效应的语音增强方法
15、原理图:感知滤波器的作用是在信号频谱失真最小的情况下使残差噪声的频谱能量小于掩蔽阈值。感知滤波器应满足:其中,为背景噪声功率谱密度,为噪声掩蔽阈值。的具体形式为:基于小波包变换和听觉掩蔽效应的语音增强算法的步骤为:步骤1:对带噪语音信号用小波包分解的方法进行去噪处理,得到增强后的语音信号,并进行分帧得到。步骤2:用Johnston掩蔽模型计算掩蔽阀值T。步骤3:使增强语音和掩蔽阀值T经过感知滤波器进行滤波,得到步骤4:经过帧重叠相加得到增强语音。5.3.2实验仿真 用MATLAB对小波包变换和听觉掩蔽效应的语音增强方法进行实验仿真:1.实验所用数据: 语音取自863语音库,噪声为NOISEX.
16、 92数据库的高斯白噪声和火车噪声,语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%。2.仿真所选标准:波形图,语谱图,信噪比,PESQ值,坂仓距离。3.仿真结果如下: 首先,在纯净语音中加入5dB高斯白噪声作为带噪语音,采用基于小波包变换和听觉掩蔽效应的语音增强算法(本文算法),比较传统的小波包变换增强算法,增强后仿真结果如下:4.结果分析 图5-6和图5-7分别为增强后的波形图和语谱图。其中,(a)为纯净语音;(b)为添加5dB白噪声后的带噪语音;(c)为采用小波包变换语音增强方法后的增强语音。(d)为采用小波包变换和掩蔽效应语音增强方法后的增强语音。从时域波形图及频域语谱
17、图的比较结果可以发现,带噪语音采用本文算法增强后,增强语音和原始语音在波形图和语谱图上非常接近,噪声得到了明显的抑制,增强效果明显优于传统小波包变换的增强算法。其次,采用在纯净语音中分别加入高斯白噪声,全局信噪比为OdB,5dB,10dB的带噪语音作为测试对象。比较小波包变换和听觉掩蔽效应的语音增强方法和传统小波包变换的增强算法,增强后语音质量性能的评估采用信噪比SNR和语音质量感知评估PESQ,PESQ是ITU-T的P.862标准,用来评价增强后语音的试听效果。PESQ得分在4.5到-0.5之间,得分越高表示语音质量越好。实验结果如表5-1示:从实验结果可以看出,在各种信噪比下采用小波包变换
18、和听觉掩蔽效应的语音增强方法比传统小波包方法,在信噪比和PESQ上都有很大提高,并且在信噪比较小的情况下,增强效果更加明显。通过主观听测表明:采用传统小波包方法增强后伴有明显的音乐噪声,而采用该方法增强后音乐噪声得到了明显地抑制,取得了较好的增强效果。5.4子空间和小波包变换的语音增强方法5.4.1子空间与小波包变换的语音增强方法原理子空间与小波包变换的语音增强方法原理图为:子空间与小波包变换的语音增强方法具体步骤为:步骤1:带噪语音进行KL,变换,得到子空间域中的带噪语音的特征向量U和特征值。步骤2:采用最小值跟踪算法更新带噪语音特征值,得到估计噪声特征值。步骤3:采用小波包变换方法更新带噪
19、语音特征值得到。步骤4:带噪语音特征值减去噪声特征值,得到纯净语音特征值估计值,可以得到时域约束估计器(TDC)增益G。步骤5:由KL逆变换可得最优估计器。由式可得纯净语音的估计。5.4.2实验仿真 用MATLAB对子空间与小波包变换的语音增强方法进行实验仿真:1.实验所用数据: 语音取自863语音库,噪声为NOISEX. 92数据库的高斯白噪声和火车噪声,语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%。2.仿真所选标准:波形图,语谱图,信噪比,PESQ值,GUI语音增强性能测试界面。3.仿真结果如下: 首先在纯净语音中加入SdB高斯白噪声作为带噪语音,采用子空间与小波包变换
20、的语音增强方法得到增强后仿真结果如下:4.结果分析由波形图,语谱图,信噪比,PESQ值都可以明显看出:采用子空间与小波包变换的语音增强方法效果明显好于传统小波包变换方法。在波形图的比较中,传统小波包变换方法得到的增强语音虽然和原始语音基本接近,但还伴有许多音乐噪声和残留噪声;采用子空间与小波包变换的语音增强方法得到的增强语音波形图比传统小波包变换方法更加接近于原始语音,说明该方法效果明显优于传统小波包变换方法;在语谱图的对比中,该方法得到的增强语音深色部分轮廓和原始语音更加接近,说明增强效果比传编小波包变换方法要好;在非语音部分该方法得到的增强语音颜色明显比带噪语音要深一些,说明音乐噪声己得到
21、很好的抑制。从PESQ值的比较中可以看出,该方法要好于传统小波包变换方法,并且随着信噪比的减小,该方法得到的PESQ值比传统小波包变换方法有增大趋势。主观听测表明该方法得到的增强语音和原始语音听觉感受基本一致。5. GUI语音增强性能测试界面:如图5-13为GUI语音增强性能测试界面。该界面中,在“请选择语音增强算法”一栏中选择相应的算法,点击“开始”按钮,即可得到如右侧所示的分别为原始语音,带噪语音,增强语音波形图比较。在界面左侧,可以同时得到pESQ值,坂仓距离,增强前信噪比,增强后信噪比这些参数。另外,点击“播放原始带噪语音”“播放增强后的语音”可以从主观听觉上比较使用该方法得到的增强语音和原始语音。使用该界面可以从客观和主观上测试语音增强方法的增强效果。