语音编码第7章.ppt-淘文阁

资源描述

《语音编码第7章.ppt》由会员分享，可在线阅读，更多相关《语音编码第7章.ppt（62页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、7.17.1概述概述7.27.2语音信号压缩编码原理语音信号压缩编码原理&系统压缩评价系统压缩评价7.37.3语音信号的波形编码语音信号的波形编码7.47.4语音信号的参数编码语音信号的参数编码7.57.5语音信号的混合编码语音信号的混合编码7.67.6现代通信中的语音信号编码现代通信中的语音信号编码19701970年代起，国外就开始研究年代起，国外就开始研究计计算机网算机网络络上的上的语语音通音通信，主要是基于信，主要是基于ARPANETARPANET网网络络平台平台进进行研究行研究19741974年，首次分年，首次分组语组语音音实验实验是在美国西海岸南加州大是在美国西海岸南加州大学和学和东

2、东海岸的林肯海岸的林肯实验实验室室间进间进行，数行，数码码率率为为9.6kb/s 9.6kb/s 19751975年年1 1月，美国月，美国实现实现使用使用LPCLPC声声码码器的分器的分组语组语音音电话电话会会议议 19801980年代，集中在局域网上的年代，集中在局域网上的语语音通信，最早的音通信，最早的实验实验是由英国是由英国剑桥剑桥大学于大学于19821982年在年在10Mb/s10Mb/s的的剑桥环剑桥环形网上形网上进进行的行的第第第第1 1 1 1章章章章绪论绪论绪论绪论1.3 1.3 语音编码发展概况语音编码发展概况19881988年，美国公布了一个年，美国公布了一个4.8kb

3、/s4.8kb/s的的码码激励激励线线性性预测预测编码编码（CELPCELP）语语音音编码标编码标准算法准算法进进入入19901990年代，随着年代，随着InternetInternet的的兴兴起和起和语语音音编码编码技技术术的的发发展，展，IPIP分分组语组语音通信技音通信技术获术获得了突破性的得了突破性的进进展。如网展。如网络络游游戏戏，语语音聊天，音聊天，IPIP电话电话技技术术19901990年代中期，出年代中期，出现现了很多被广泛使用的了很多被广泛使用的语语音音编码编码国国际标际标准，如数准，如数码码率率为为5.3/6.4kb/s5.3/6.4kb/s的的G.723.1G.723.1

4、、数、数码码率率为为8kb/s8kb/s的的G.729G.729等等目前，主要集中在目前，主要集中在4kbit/s4kbit/s码码率以下的高音率以下的高音质质、低延、低延迟迟的声的声码码器，提高在噪声信道中低器，提高在噪声信道中低码码率率编码编码器的性器的性能能第第第第1 1 1 1章章章章绪论绪论绪论绪论1.3 1.3 语音编码发展概况语音编码发展概况第第第第1 1 1 1章章章章绪论绪论绪论绪论1.4 1.4 语音合成发展概况语音合成发展概况19391939年，贝尔实验室利用共振峰原理制作出第一年，贝尔实验室利用共振峰原理制作出第一个电子语音合成器个电子语音合成器19601960年

5、，年，G.FantG.Fant系统地阐述了语音产生的理论，系统地阐述了语音产生的理论，推动了语音合成技术的进步推动了语音合成技术的进步19681968年，第一个完整的年，第一个完整的TTSTTS系统得以实现系统得以实现19801980年，年，D.D.KlattKlatt设计出串设计出串/并联混合型共振峰并联混合型共振峰合成器合成器19801980年代，基音同步叠加的波形拼接方法年代，基音同步叠加的波形拼接方法PSOLA PSOLA 被提出被提出第第第第1 1 1 1章章章章绪论绪论绪论绪论1.4 1.4 语音合成发展概况语音合成发展概况2020世纪末，提出了可训练的语音合成方法世纪末，提出了

6、可训练的语音合成方法基基于于HMM HMM 的合成方法的合成方法目前，语音合成系统具有了很高的可懂度，但自目前，语音合成系统具有了很高的可懂度，但自然度还不尽人意然度还不尽人意说话说话人人识别识别说话说话人日志人日志语语种辨种辨识识语语音音转换转换语语音音隐隐藏藏语语音情感音情感识别识别语语音增音增强强语语音搜索音搜索Speaker Recognition，又又称称声声纹纹识识别别、话话者者识识别别。通通过过对对语语音音信信号号的的分分析析和和处处理理，提提取取代代表表说说话话人人个个性性信信息息的的特特征征，计计算算机机就就能能够够自自动动地地鉴鉴别别说说话话人人的的身身份份。主主要要分分为

7、为：Speaker Identification和和Speaker Verification。Speech Retrieval，一一种种新新颖颖的的搜搜索索技技术术，代代替替原原来来的的键键盘盘或或手手写写输输入入，用用户户可可以以使使用用语语音进行检索和查询。音进行检索和查询。Speech Hiding，利利用用语语音音信信号号中中存存在在的的冗冗余余及及人人类类感感知知系系统统的的特特性性，在在不不影影响响原原始始语语音音信信息息感感知知质质量量的的前前提提下下，把把额额外外的的信息隐藏到原始语音中的一种技术。信息隐藏到原始语音中的一种技术。Emotion Recognition，计计算算

8、机机对对语语音音信信号号进进行行分分析析和和处处理理，从从而而得得出出说说话话人人的的情情感状态（愤怒、悲伤、高兴、恐惧等）。感状态（愤怒、悲伤、高兴、恐惧等）。Voice Conversion，将将A话话者者的的语语音音转转换换为为具具有有B话话者者发发音音特特征征的的语语音音，且保持语音内容不变。且保持语音内容不变。Speech Enhancement，当当语语音音信信号号被被各各种种各各样样的的噪噪声声干干扰扰、甚甚至至淹淹没没后后，从从噪噪声声背背景景中中提提取取有有用用的的语语音音信信号号，抑抑制制、降低噪声干扰的技术降低噪声干扰的技术。第第第第1 1 1 1章章章章绪论绪论绪论绪

9、论1.5 1.5 语音处理的其他分支语音处理的其他分支Language Identification，通通过过分分析析处处理理一一个个语语言言片片段段从从而而判判别别其其属属于于哪哪种语言。种语言。Speaker Diarization，主要解决：，主要解决：“谁谁在在说话说话”和和“在什么在什么时时候候说话说话”两个两个问题问题。前者通。前者通过过说话说话人人识别识别技技术术来来检测检测，后者由，后者由说话说话人分割人分割和和说话说话人聚人聚类类技技术术来来检测检测。语音编码概述v语音编码定义v语音编码历史重要事件v语音编码分类v语音编码标准情况v语音编码应用领域语音编码定义v语音编码（语音

10、编码（Speech CodingSpeech Coding）属于信源编码的范畴。减少传输码率（或存储量）属于信源编码的范畴。减少传输码率（或存储量），达到提高传输（或存储）效率的目的。，达到提高传输（或存储）效率的目的。语音编码在通信史上一直都扮演着极为重要的角语音编码在通信史上一直都扮演着极为重要的角色。色。语音编码历史事件语音编码历史事件v18761876年贝尔发明电话机年贝尔发明电话机v19371937年年A.H.ReevesA.H.Reeves 提出提出脉码调制脉码调制（PCMPCM），语音编），语音编码得到了迅速的发展。码得到了迅速的发展。v2020世纪世纪5050年代后期，着重于

11、线性语音源系统生成模年代后期，着重于线性语音源系统生成模型，包括线性慢时变系统，周期脉冲激励序列与随型，包括线性慢时变系统，周期脉冲激励序列与随机激励。机激励。v2020世纪六七十年代，世纪六七十年代，VLSIVLSI技术与数字信号处理理论技术与数字信号处理理论的发展为语音编码技术开辟了新的道路，语音分析的发展为语音编码技术开辟了新的道路，语音分析合成采用了短时傅立叶变换，变换编码与子带编码，合成采用了短时傅立叶变换，变换编码与子带编码，基于线性预测的编码技术进一步得到发展。新的编基于线性预测的编码技术进一步得到发展。新的编码技术纷纷产生，如余弦分析合成技术，多带激励码技术纷纷产生，如余弦分析

12、合成技术，多带激励声码器，声码器，LPCLPC中的多脉冲与矢量激励，中的多脉冲与矢量激励，矢量量化矢量量化。v2020世纪世纪9090年代中期，速率为年代中期，速率为4 48Kbps8Kbps的波形与混合的波形与混合编码器，如编码器，如QCELPQCELP，EVRCEVRC，AMRAMR 和和SMV4,SMV4,在语音质量在语音质量上，与早期速率为上，与早期速率为64Kbps64Kbps的的PCMPCM波形编码器已十分接波形编码器已十分接近。近。v20062006年，年，ITUITU制定了新的宽带嵌入式语音编制定了新的宽带嵌入式语音编/解码方解码方案案G.729.1G.729.1v200820

13、08年，年，G.718,G.718,嵌入式语音编码标准嵌入式语音编码标准语音编码分类语音编码分类按编码方法按编码方法波形编码波形编码：重建语音时域信号的波形与原语音信号尽量保持一致。：重建语音时域信号的波形与原语音信号尽量保持一致。vPCM,ADM,ADPCM,APC,ASBC,ATCPCM,ADM,ADPCM,APC,ASBC,ATC参数编码：参数编码：通过建立语音信号的产生模型，提取其特征参数来编码，通过建立语音信号的产生模型，提取其特征参数来编码，波形上不要求与原信号匹配，又称声码器技术。波形上不要求与原信号匹配，又称声码器技术。LPCLPC 混合编码混合编码：有机结合以上两种编码方式，

14、基于语音产生模型的假定：有机结合以上两种编码方式，基于语音产生模型的假定并采用分析合并技术。并采用分析合并技术。按编码速率按编码速率按编码语音带宽按编码语音带宽按编码信号所在域按编码信号所在域三种编码方式的比较三种编码方式的比较波形编码参数编码混合编码编码信息波形模型参数综合比特率9.664Kbps2.49.6Kbps2.416Kbps优点适应能力强，语音质量好有效降低了编码比特率语音质量明显提高缺点随着量化粗糙语音质量下降合成语音质量低，处理复杂度高编码速率明显上升典型代表自适应差分编码调制（ADPCM）LPC-10、LPC-10E MPLPCRPE-LPCCELP语音编码分类语音编码分类按

15、编码方法按编码方法按编码速率按编码速率高速高速,32kb/s,32kb/s以上以上中高速，中高速，1632kb/s1632kb/s中速，中速，4.816kb/s4.816kb/s低速，低速，1.24.8kb/s1.24.8kb/s超低速，超低速，1.2kb/s0.850.85u浊音语音段的准周期性浊音语音段的准周期性u声道形状及其变化的缓慢性声道形状及其变化的缓慢性u静止系数静止系数（即语音间隙性）（即语音间隙性）:0.6:0.6v 频域频域冗余冗余u从长时间来看，语音信号的功率谱密度具有从长时间来看，语音信号的功率谱密度具有强烈的非平坦型，存在着固定的冗余度。而强烈的非平坦型，存在着固定的

16、冗余度。而且高频能量通常较低，恰好对应于时域上的且高频能量通常较低，恰好对应于时域上的相邻样本相关性。相邻样本相关性。图图7-27-2u从短时功率谱密度来看，语音信号在不同频从短时功率谱密度来看，语音信号在不同频率交替出现峰值（共振峰）与谷值。整个功率交替出现峰值（共振峰）与谷值。整个功率谱的细节基于基音频率形成高次谐波结构。率谱的细节基于基音频率形成高次谐波结构。语音编码依据之二：人的听觉特点语音编码依据之二：人的听觉特点n人类听觉系统存在着掩蔽效应，即高声压级人类听觉系统存在着掩蔽效应，即高声压级单音会明显掩蔽临近频率声音。单音会明显掩蔽临近频率声音。n对于不同频段的声音，人耳的敏感程度不

17、尽对于不同频段的声音，人耳的敏感程度不尽相同相同(可闻阈可闻阈)图图2-152-15。n人类对于语音信号的周期性（即音调）极为人类对于语音信号的周期性（即音调）极为敏感，但对信号的相位却充耳不闻，这与理敏感，但对信号的相位却充耳不闻，这与理论分类存在差异。论分类存在差异。语音编码的极限v语音的音素大约是128256个,通常的说话速度每秒平均发出10个音素,信息熵v英语,每个字母7bits,每个单词7个字母，每分钟125个单词，信息率为v压缩极限速率80100bps语音编码中的几项关键技术语音编码中的几项关键技术线性预测线性预测线性预测传送整个反应过程变化的参数，其出发点线性预测传送整个反应过

18、程变化的参数，其出发点在于跟踪波形的产生过程而非波形本身。基于全极在于跟踪波形的产生过程而非波形本身。基于全极点模型假设，使得语音信号编码的比特率得到有效点模型假设，使得语音信号编码的比特率得到有效的降低。的降低。语音信号中存在的两点相关性语音信号中存在的两点相关性l样点间的短时相关性样点间的短时相关性l相邻基音周期之间的长时相关性相邻基音周期之间的长时相关性激励发生器 1 P（z）1 A（z）合成语音合成语音语音信号合成模型图示语音信号合成模型图示其中信号源为预测余量信号，其中信号源为预测余量信号，1/P(z)为长时预测滤波器，为长时预测滤波器，1/A(z)为短时预测滤波器。为短时预测滤

19、波器。语音信号的短时相关性可用一个全极语音信号的短时相关性可用一个全极点模型来描述，其传输函数点模型来描述，其传输函数H H（z z）为：）为：短时预测系数短时预测系数滤波器阶数滤波器阶数而滤波器而滤波器是语音信号长时相关性的模型，是语音信号长时相关性的模型，其一般形式为：其一般形式为：延时参数（基音周期）延时参数（基音周期）长时预测系数长时预测系数合成分析合成分析合成分析原理合成分析原理合成分析在编码器中加入综合器，并将其与分析合成分析在编码器中加入综合器，并将其与分析器结合从而产生与译码器端相同的语音，而后根据器结合从而产生与译码器端相同的语音，而后根据误差原理调整使得误差最小化。误差

20、原理调整使得误差最小化。合成分析背景合成分析背景 16Kbps16Kbps以下的高质量语音编码在当今得到的极大以下的高质量语音编码在当今得到的极大关注，使得传统的量化方法对误差最小化已无能为关注，使得传统的量化方法对误差最小化已无能为力。因此，合成分析的方法被引入。力。因此，合成分析的方法被引入。感觉加权滤波器感觉加权滤波器产生背景：理论与现实的出入产生背景：理论与现实的出入对于低码率（对于低码率（4 416Kbps）的语音编码，理论上的语音编码，理论上的最小均方误差（的最小均方误差（MMSEMMSE）在实际应用时却因为人的）在实际应用时却因为人的听觉特点而障碍重重。在这种背景下，根据人耳掩

21、听觉特点而障碍重重。在这种背景下，根据人耳掩蔽效应设计的感觉加权滤波器得到了广泛的应用。蔽效应设计的感觉加权滤波器得到了广泛的应用。在实际应用中，共振峰处的噪声相对于能量较低在实际应用中，共振峰处的噪声相对于能量较低处的频段更加不易被察觉，故高能量段处的误差要处的频段更加不易被察觉，故高能量段处的误差要求不高。因此，感觉加权滤波器求不高。因此，感觉加权滤波器被提出，用以被提出，用以衡量语音间的误差。衡量语音间的误差。此时，只需此时，只需在高频段处较小，低频段处较大，在高频段处较小，低频段处较大，就可以升高不敏感的高频段处误差同时降低较敏感就可以升高不敏感的高频段处误差同时降低较敏感的低频段

22、处误差，从而达到目的。的低频段处误差，从而达到目的。抽样频率抽样频率重建语音傅立叶变换重建语音傅立叶变换原始语音傅立叶变换原始语音傅立叶变换误差表示误差表示其传递函数为：其传递函数为：的作用就是使实际信号误差的谱呈现与语音信的作用就是使实际信号误差的谱呈现与语音信号类似的包络形状，从而在掩蔽效应的作用下在主观号类似的包络形状，从而在掩蔽效应的作用下在主观听觉上产生较好的效果。听觉上产生较好的效果。加权因子加权因子预测系数预测系数语音压缩系统的性能评判指标语音压缩系统的性能评判指标较为重要的性能评价准则较为重要的性能评价准则l编码速率（比特率），决定了编码器工作时占用的信道编码速率（比特率

23、），决定了编码器工作时占用的信道带宽，要求尽可能降低。带宽，要求尽可能降低。l编码器的完健性，要求良好。编码器的完健性，要求良好。l编码器的时延，要求最小化。编码器的时延，要求最小化。l误码容限，要求保持较高值。误码容限，要求保持较高值。l算法复杂度（包括运算复杂度与内存要求），影响硬件算法复杂度（包括运算复杂度与内存要求），影响硬件成本，尽可能降低。成本，尽可能降低。l算法可扩展性，越高越好。算法可扩展性，越高越好。评测方法评测方法主观评价主观评价可懂度评价（可懂度评价（DRT得分）得分）音质评价音质评价平均意见得分（平均意见得分（MOS）判断满意度测量（判断满意度测量（DAM）客观评价客

24、观评价适用于低适用于低比特率语比特率语音编码质音编码质量的评价量的评价计算较简单，但没有计算较简单，但没有考虑实际情况，故考虑实际情况，故适用于高比特率适用于高比特率语音编码质量的语音编码质量的评价评价 7.3 7.3 语音信号的波形编码语音信号的波形编码v波形编码波形编码波形编码是语音编码系统在早期所广泛采用的方波形编码是语音编码系统在早期所广泛采用的方法，它把语音信号当成普通的波形信号来处理从而保持原波法，它把语音信号当成普通的波形信号来处理从而保持原波形形状。形形状。波形编码适应能力强，合成语音质量好，但比特率过高，波形编码适应能力强，合成语音质量好，但比特率过高，编码的效率也不

25、尽如人意。编码的效率也不尽如人意。v几种典型的波形编码：几种典型的波形编码：l脉冲编码调制（脉冲编码调制（PCMPCM）l自适应预测编码自适应预测编码l自适应增量调制（自适应增量调制（ADMADM）l自适应差分脉冲编码调制（自适应差分脉冲编码调制（ADPCMADPCM）l子带编码（子带编码（SBCSBC）脉冲编码调制脉冲编码调制形式一：均匀形式一：均匀PCMPCM 最简单最原始的波形编码方式，没有运用压缩技术，产生最简单最原始的波形编码方式，没有运用压缩技术，产生的比特率也极高，故在当今运用极少。的比特率也极高，故在当今运用极少。形式二：非均匀形式二：非均匀PCMPCM 将信号进行非线性变换后

26、再均匀量化，变换后信号具有均将信号进行非线性变换后再均匀量化，变换后信号具有均匀概率密度分布。编码时常采用对数变换压缩（译码时指数匀概率密度分布。编码时常采用对数变换压缩（译码时指数扩展）。扩展）。非线性非线性压缩压缩均匀量化均匀量化编码编码解码解码非线性非线性扩张扩张非线性压缩扩张的非均匀量化器非线性压缩扩张的非均匀量化器vA A律压缩扩张技术（中国标准）律压缩扩张技术（中国标准）v 律压缩扩张技术（北美及日本标准）律压缩扩张技术（北美及日本标准）形式三：自适应形式三：自适应PCM 无论是均匀或是非均匀无论是均匀或是非均匀PCMPCM，量化间隔总是随着量化器的确，量化间隔总是随着量化器的确

27、定而固定。而自适应定而固定。而自适应PCMPCM引入的自适应幅值变化概念使得量化误引入的自适应幅值变化概念使得量化误差可以匹配于输入信号方差，或是量化器增益差可以匹配于输入信号方差，或是量化器增益G G可以随着幅值而可以随着幅值而变化，从而使信号能量在量化前恒定。变化，从而使信号能量在量化前恒定。Q【】编码器解码器匹配自适应匹配自适应编码器Q【】X解码器+匹配自适应匹配自适应两两种种自自适适应应方方法法的的原原理理按照自适应参数划分按照自适应参数划分Q【】编码器解码器自适应系统Q【】编码器自适应系统解码器自适应系统后后馈馈自自适适应应前前馈馈自自适适应应其中，其中，或或自适应预测编码自适

28、应预测编码LPC计算-预测器系数预测器系数发端发端收端收端自适应预测编码器（自适应预测编码器（APCAPC）利用线性预测）利用线性预测来改进编码中的量化器性能，根据信号量化来改进编码中的量化器性能，根据信号量化噪声比的定义：噪声比的定义：信号平均能量信号平均能量预测误差平均能量预测误差平均能量量化噪声平均能量量化噪声平均能量由此可知引用线性预测后，由此可知引用线性预测后，SNR可得到成功的改善。可得到成功的改善。自适应增量调制（自适应增量调制（ADMADM）增量调制的基本方案：增量调制的基本方案：增量调制方式将下一个语音信号与当前语音信号增量调制方式将下一个语音信号与当前语音信号比较，如

29、果高与当前值则系统则编码比较，如果高与当前值则系统则编码1 1，否则系统编，否则系统编码码0.0.自适应增量调制的工作方式：自适应增量调制的工作方式：自适应增量调制随输入波形自适应的改变量化阶自适应增量调制随输入波形自适应的改变量化阶梯的大小，在信号平均斜率大时自动增大量化阶梯，梯的大小，在信号平均斜率大时自动增大量化阶梯，反之减小。反之减小。自适应差分脉冲编码调制（自适应差分脉冲编码调制（ADPCMADPCM）差分脉冲编码调制（差分脉冲编码调制（DPCMDPCM）：）：不同于不同于DMDM的一位编码，的一位编码，DPCMDPCM多位量化对两个采样多位量化对两个采样之间的差分信号利用多位量化进

30、行编码，使信息量得之间的差分信号利用多位量化进行编码，使信息量得到压缩的同时降低了信道负载。到压缩的同时降低了信道负载。+量量化化+预测预测发送端发送端+预预测测接收端接收端+但采用固定的高阶预测，改善效果并不明显，于是，高阶自但采用固定的高阶预测，改善效果并不明显，于是，高阶自适应预测作为相应的解决方式被提出，自适应预测器随着语音适应预测作为相应的解决方式被提出，自适应预测器随着语音特征变化不断更新预测系数，从而获得更高的预测增益。特征变化不断更新预测系数，从而获得更高的预测增益。-量化量化预测系数预测系数自适应自适应+预测预测后向自适应预测编码结构框图：后向自适应预测编码结构框图：

31、后向自适应预测作为后向自适应预测作为ADPCM的常用编码方的常用编码方式，所采用的是序贯随机梯度算法，其预测系式，所采用的是序贯随机梯度算法，其预测系数满足：数满足：其中其中N为预测器阶数。为预测器阶数。为较少传输误码的影响，可加入衰减因子，并为较少传输误码的影响，可加入衰减因子，并采用符号梯度法简化硬件，于是又有：采用符号梯度法简化硬件，于是又有：子带编码（子带编码（SBCSBC）子带编码原理：子带编码原理：子带编码属于频域编码，它首先将语音信号通过带通子带编码属于频域编码，它首先将语音信号通过带通滤波器分割为若干频带（子带），而后对子带信号进行滤波器分割为若干频带（子带），而后对子带信号进

32、行频谱平移变为基带信号，再利用奈奎斯特速率抽样，最频谱平移变为基带信号，再利用奈奎斯特速率抽样，最后进行编码处理后进行编码处理。子带编码优点：子带编码优点：l分带后可去除信号相关性，获得与时域一样的效果。分带后可去除信号相关性，获得与时域一样的效果。l不同子带拥有不同比特数，可获得更佳主观听音质量。不同子带拥有不同比特数，可获得更佳主观听音质量。l各子带间量化噪音相互独立互不干扰。各子带间量化噪音相互独立互不干扰。而而SBCSBC在应用中一般采用整数带方法，即：在应用中一般采用整数带方法，即：由带通信号采样定理可知，在由带通信号采样定理可知，在时，子时，子带信号不会发生混叠，可以直接进行对其

33、采样带信号不会发生混叠，可以直接进行对其采样。子带分带数目越大，编码增益也会越大，实际子带分带数目越大，编码增益也会越大，实际应用中应用中SBC一般采用一般采用48个子带。个子带。对已经采样的输入信号，抽取可实现频谱搬移，对已经采样的输入信号，抽取可实现频谱搬移，合成时通过插值恢复。合成时通过插值恢复。带通带通抽取抽取编译码编译码插值插值带通带通第第k个通道工作原理个通道工作原理为减少混叠造成的失真，需要极高阶的滤波器，而此为减少混叠造成的失真，需要极高阶的滤波器，而此时采用正交镜像滤波器组时采用正交镜像滤波器组(QMFB)既可解决失真问题，既可解决失真问题，阶数要求也可得到降低。阶数要

34、求也可得到降低。+其输入输出关系为：其输入输出关系为：其中，其中，理论上需满足：理论上需满足：我们一般希望其满足理想条件：我们一般希望其满足理想条件：自适应变换编码（自适应变换编码（ATCATC）编码原理：编码原理：自适应变换编码利用正交变换将信号由时域变换到另外一个自适应变换编码利用正交变换将信号由时域变换到另外一个域，使变换域系数密集化，从而使信号相邻样本间冗余度得域，使变换域系数密集化，从而使信号相邻样本间冗余度得到降低。到降低。正交变换正交变换DCTDCT的优点：的优点：l频域变换明显，较易控制量化噪声频率范围。频域变换明显，较易控制量化噪声频率范围。l兼顾性能与计算量，不需要传输特征

35、矢量。兼顾性能与计算量，不需要传输特征矢量。l变换效率高于变换效率高于DFTDFT，且在频域区的畸变更小。，且在频域区的畸变更小。基于基于DCTDCT的种种优势，当今自适应变换编码的正交变换普遍的种种优势，当今自适应变换编码的正交变换普遍采用采用DCTDCT。N N点点DCTDCT的正变换为：的正变换为：令令为为X X的填充率，最终可得的填充率，最终可得X X的的DCTDCT为：为：其中，其中，为为DFTDFT变换，变换，满足满足:7.4 7.4 语音信号的参数编码语音信号的参数编码v参数编码针对语音信号的特征参数来编码，只适用于语音信参数编码针对语音信号的特征参数来编码，只适用于语音信号

36、。实际应用中一般采用的实现设备是号。实际应用中一般采用的实现设备是线性预测声码器线性预测声码器。线性预测线性预测分析器分析器编码器编码器音调音调检测器检测器线性预测线性预测合成器合成器解码器解码器信道LPC声码器框图LPCLPC参数的变换与量化参数的变换与量化反射系数反射系数：对反射系数的值在对反射系数的值在【-1-1，1 1】区间一般进行非线性量化，区间一般进行非线性量化，另外比特数分配应递减。另外比特数分配应递减。数面积比：数面积比：针对对数面积比的方式是最为有效的编码方式，很适合针对对数面积比的方式是最为有效的编码方式，很适合数字编码与传输：数字编码与传输：其中其中Ai为面积函数，通

37、过上式可知为面积函数，通过上式可知幅度均匀分布，可幅度均匀分布，可以采用均匀量化。以采用均匀量化。当代参数编码技术简介当代参数编码技术简介变帧率变帧率LPCLPC声码器声码器为降低为降低LPCLPC声码器的速率，应用了变帧速率编码声码器的速率，应用了变帧速率编码（VFRVFR）技术的变帧率）技术的变帧率LPCLPC声码器应运产生。通过付声码器应运产生。通过付出编码解码复杂化与时延出现的代价，变帧率出编码解码复杂化与时延出现的代价，变帧率LPCLPC声声码器可明显降低传输数码率同时保持音质。码器可明显降低传输数码率同时保持音质。LPCLPC-10-10编码器编码器 LPC-10LPC-10利

38、用简单的二元激励取代余量信号，在利用简单的二元激励取代余量信号，在2.4kbps2.4kbps的速率上得到了清晰的合成语音，在当代长的速率上得到了清晰的合成语音，在当代长期被作为标准算法使用。但因为激励信号选取的影期被作为标准算法使用。但因为激励信号选取的影响，抗噪能力与自然度仍不尽如人意。响，抗噪能力与自然度仍不尽如人意。7.5 7.5 语音信号的混合编码语音信号的混合编码v 20 20世纪世纪8080年代后期，综合了参数编码低比特率与波形编码高语音质量年代后期，综合了参数编码低比特率与波形编码高语音质量优点的混合编码得到广泛的使用。它在假定语音产生模型的同时将模型优点的混合编码得到广泛的使

39、用。它在假定语音产生模型的同时将模型参数编码，吸收了两者的优点。参数编码，吸收了两者的优点。合成编码方法（合成编码方法（LPASLPAS）是目前得到最广泛研究的语音编码算法，它通）是目前得到最广泛研究的语音编码算法，它通过线性预测确定系统参数，并通过闭环或分析过线性预测确定系统参数，并通过闭环或分析-合成方法确定激励序列。合成方法确定激励序列。激励选择g感知加权MSE码激励线性预测编码（）码激励线性预测编码（）因其自身的良好抗噪性多次复接能力与高质量因其自身的良好抗噪性多次复接能力与高质量的合成语音而被广泛运用。不同于的二元激励，的合成语音而被广泛运用。不同于的二元激励，采用矢量量化对信号编码

40、，编码时只传送最佳码矢量的采用矢量量化对信号编码，编码时只传送最佳码矢量的下标，占用比特数大大降低。下标，占用比特数大大降低。合成滤波器随机码本自适应码本随机码矢量增益自适应码矢量增益输出码激励模型码本误差最小化索引CELP编码器示意图 CELP模型编码仍基于语音的短时特性，采用模型编码仍基于语音的短时特性，采用LAPS与矢与矢量量化。在编码类型上，既采用了类似声源模型的语音合成量量化。在编码类型上，既采用了类似声源模型的语音合成方法，又做了波形的最佳匹配，所以同时具有参数编码与波方法，又做了波形的最佳匹配，所以同时具有参数编码与波形编码的特征，故称为混合编码。形编码的特征，故称为混合编码。7

41、.6 7.6 现代通信中的语音信号编码方法现代通信中的语音信号编码方法v现代通信下的语音服务现代通信下的语音服务在通信技术蓬勃发展信息至上观念深入人心的今天，在通信技术蓬勃发展信息至上观念深入人心的今天，传统的或是窄带已不能满足移动通信传统的或是窄带已不能满足移动通信业务量的需求。第三代移动通信系统引入了更高的业务量的需求。第三代移动通信系统引入了更高的传输速率业务，其中语音服务仍为主要业务。传输速率业务，其中语音服务仍为主要业务。v算法算法目前的系统中，基于算法的目前的系统中，基于算法的算法在语音质量与比特速率间取得了很好的平衡，算法在语音质量与比特速率间取得了很好的平衡，且适用于变速率编码

42、，抗干扰能力也令人满意，从而得且适用于变速率编码，抗干扰能力也令人满意，从而得到了极为广泛的应用。到了极为广泛的应用。共振峰合成滤波器自适应码本固定码本随机码矢量增益自适应码矢量增益基音周期固定码本索引语音合成示意图不同于传统的模型对原始信号的逼近，采不同于传统的模型对原始信号的逼近，采用了广义，即对时域变形后的残差信号进行逼近，用了广义，即对时域变形后的残差信号进行逼近，经过更加复杂的计算后，使语音质量得到明显的改善。经过更加复杂的计算后，使语音质量得到明显的改善。信号处理参数短时残差/速率编码/速率编码数码率判别长时延迟估计增益采样信号编码器示意图滤波，降噪解码器示意图帧误差检测后向滤波器解码合成语音

展开阅读全文