《数字通信技术精品文稿.ppt》由会员分享,可在线阅读,更多相关《数字通信技术精品文稿.ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数字通信技术数字通信技术第1页,本讲稿共52页第2页,本讲稿共52页2.4 2.4 语音编码的合成分析方法语音编码的合成分析方法第3页,本讲稿共52页已知已知s(n)s(n),求,求x(n)x(n)的过程,称为的过程,称为分析分析。已知已知x(n)x(n),求,求s(n)s(n)的过程,称为的过程,称为综合综合(合成)。(合成)。LPCLPCLPCLPC声码器原理上的主要缺陷:声码器原理上的主要缺陷:声码器原理上的主要缺陷:声码器原理上的主要缺陷:发端只有分析过程,没有合成过程,是一个开环发端只有分析过程,没有合成过程,是一个开环系统;系统;激励模型过于简单。激励模型过于简单。一、合成分析法一
2、、合成分析法4第4页,本讲稿共52页 合合合合成成成成分分分分析析析析法法法法(AbSAbS,Analysis-By-SynthesisAnalysis-By-Synthesis)的的基基本本思思想:想:用合成来指导分析。用合成来指导分析。将将合合成成器器引引入入编编码码系系统统,使使之之与与分分析析器器相相结结合合,在在编编码码器器中中产产生生与与译译码码器器完完全全一一致致的的合合成成语语音音,将将此此合合成成语语音音与与原原始始语语音音相相比比较较,根根据据一一定定的的误误差差准准则则调调整整计计算算分分析析器器的的各各个个参参数数,使使两两者者之之间间的的误误差差达达到到最最小小。然然
3、后后将将误误差差最最小小时时的的语语音参数传送到接收端,得到高质量的合成语音。音参数传送到接收端,得到高质量的合成语音。一、合成分析法一、合成分析法5第5页,本讲稿共52页在在LPCLPC基基础础上上采采用用AbSAbS的的编编码码方方法法。AbS-LPCAbS-LPC编编码码器器包包括括三个基本部分:三个基本部分:时变滤波器(包括时变滤波器(包括LPCLPC和基音滤波器)和基音滤波器)基于感知的最小化处理;基于感知的最小化处理;激励信号;激励信号;二、AbS-LPC编码器6第6页,本讲稿共52页AbS-LPC编码器与译码器二、二、AbS-LPC编码器编码器激励信号产生编码端基音合成滤波器LP
4、C合成滤波器解码端输出语音误差最小优化的激励基音合成滤波器LPC合成滤波器误差-+原始语音7第7页,本讲稿共52页二、二、AbS-LPC编码器编码器合成分析编码方法的合成分析编码方法的特点特点:发端是一个闭环系统;发端是一个闭环系统;对激励信号没有明显的分类,由闭环系统选择与对激励信号没有明显的分类,由闭环系统选择与原原始语音误差最小的激励信号,使得合成语音质量始语音误差最小的激励信号,使得合成语音质量比比传统的传统的LPCLPC声码器好得多。声码器好得多。8第8页,本讲稿共52页1 1、时变滤波器时变滤波器时变滤波器由时变滤波器由LPCLPC合成滤波器合成滤波器和和基音合成滤波器基音合成滤波
5、器级连组成。级连组成。LPCLPC合成滤波器实现语音的短时预测;合成滤波器实现语音的短时预测;基音合成滤波器实现语音的长时预测。基音合成滤波器实现语音的长时预测。二、二、AbS-LPC编码器编码器9第9页,本讲稿共52页二、二、AbS-LPC编码器编码器语音的短时预测语音的短时预测语音的短时预测语音的短时预测 短时预测(利用一帧时段内前短时预测(利用一帧时段内前P P个样值预测当前个样值预测当前的样值)可以用全极点模型描述,其传输函数为:的样值)可以用全极点模型描述,其传输函数为:其中,其中,H H(Z Z)称为称为LP LP 综合滤波器;综合滤波器;A A(Z Z)被称为被称为LP LP 分
6、分析滤波器。预测系数析滤波器。预测系数a ai i 是逐帧(帧长是逐帧(帧长202030ms30ms)更新。)更新。10第10页,本讲稿共52页语音的长时预测语音的长时预测语音的长时预测语音的长时预测 长时预测(利用前几个子帧的参数预测当前子帧长时预测(利用前几个子帧的参数预测当前子帧的参数)可以用全极点模型描述,其传输函数为的参数)可以用全极点模型描述,其传输函数为1/1/P P(Z Z):二、二、AbS-LPC编码器编码器11第11页,本讲稿共52页二、二、AbS-LPC编码器编码器 延时参数延时参数 D D 为基音周期,为基音周期,b bi i是语音信号的长时预测系是语音信号的长时预测系
7、数,可以从语音信号中直接提取这两个参量,也可以从去数,可以从语音信号中直接提取这两个参量,也可以从去除了短时相关性所得的余量信号中提取。除了短时相关性所得的余量信号中提取。预测系数个数预测系数个数 i i 取取1 1(q=r=0q=r=0)3 3(q=r=q=r=1 1)之间,预测逐子帧(子帧长)之间,预测逐子帧(子帧长5 510ms10ms)更新。)更新。12第12页,本讲稿共52页 在语音谱中,能量较高的频段(如共振峰处)的噪声相在语音谱中,能量较高的频段(如共振峰处)的噪声相对于能量较低频段的噪声不易被感知,在度量原始语音与合对于能量较低频段的噪声不易被感知,在度量原始语音与合成语音之间
8、的误差时可以计入这一因素,在语音能量高的频成语音之间的误差时可以计入这一因素,在语音能量高的频段,允许二者的误差大一些,反之则小一些,为此在计算二段,允许二者的误差大一些,反之则小一些,为此在计算二者误差时,引入频域感觉加权滤波器者误差时,引入频域感觉加权滤波器W W(f)(f)。2 2、感觉加权滤波器、感觉加权滤波器 感觉加权滤波器:感觉加权滤波器:感觉加权滤波器:感觉加权滤波器:是根据人的听觉特性对预测残差信是根据人的听觉特性对预测残差信号进行处理,以产生较好的主观听觉效果。号进行处理,以产生较好的主观听觉效果。二、二、AbS-LPC编码器编码器13第13页,本讲稿共52页 fs是抽样速率
9、,分别是原始信号与合成语音的傅里叶变换。在e达到最小值时,在整个积分域内保持常数值。误差定义为:二、二、AbS-LPC编码器编码器在能量大的语音频段内使在能量大的语音频段内使W W(f f)小,而能量较小的小,而能量较小的频段使频段使W W(f f)较大,从而可提高前者的误差能量而降低后较大,从而可提高前者的误差能量而降低后者的误差能量。者的误差能量。14第14页,本讲稿共52页感觉加权滤波器W(f)在Z 域的表达式为:=0=01 1,它控制共振峰区域误差的增加程度。,它控制共振峰区域误差的增加程度。当当 =1=1时,时,W W(Z Z)=1)=1,此时不进行加权。,此时不进行加权。当当 =0
10、=0时时,W W(Z Z)等等于于语语音音的的P P阶阶全全极极点点模模型型谱谱的的倒倒数数,由由此此得得到到误误差差信信号号频频谱谱的的能能量量分分布布与与语语音音信信号号频频谱谱的的能能量量分分布布变变化化一一致致,但但此此时时听听觉觉效效果果不不好好,其其原原因因在在于于人人耳耳对对语语音音的共振峰更敏感,相应地对其信噪比要求也更高。的共振峰更敏感,相应地对其信噪比要求也更高。二、二、AbS-LPC编码器编码器实际听音结果表明:实际听音结果表明:8kHz采样频率下,采样频率下,的经验值为的经验值为0.8。15第15页,本讲稿共52页感觉加权滤波器的频率特性二、二、AbS-LPC编码器编码
11、器16第16页,本讲稿共52页3 3、激励信号源、激励信号源 激励信号是激励信号是AbS-LPCAbS-LPC模型的输入,包含不能由时变滤模型的输入,包含不能由时变滤波器谱模型表征的残差结构,如超出长时线性预测范围波器谱模型表征的残差结构,如超出长时线性预测范围的相关性就不能由长时线性预测包含,激励信号还包括的相关性就不能由长时线性预测包含,激励信号还包括不能用确定方法有效表征的随机结构。采用不能用确定方法有效表征的随机结构。采用AbSAbS方法的声方法的声码器都用激励信号源的种类命名。例如:码器都用激励信号源的种类命名。例如:(1 1)多脉冲线性预测编码()多脉冲线性预测编码(MP-LPCM
12、P-LPC)(2 2)规则脉冲激励)规则脉冲激励长时预测编码(长时预测编码(RPE-LTP-LPCRPE-LTP-LPC)(3 3)码本激励线性预测编码()码本激励线性预测编码(CELPCELP)二、二、AbS-LPC编码器编码器17第17页,本讲稿共52页2.5 2.5 几种混合编码方法介绍几种混合编码方法介绍第18页,本讲稿共52页 用用一一种种稀稀疏疏的的脉脉冲冲序序列列作作为为激激励励,不不再再提提取取基基音音。无无论论是是清清音音还还是是浊浊音音,都都是是用用一一帧帧中中的的有有限限多多个个脉脉冲冲,以最优估计的幅度和位置,作为激励信号源。以最优估计的幅度和位置,作为激励信号源。一、
13、多脉冲激励一、多脉冲激励LPCMP-LPCMP-LPCMP-LPCMP-LPC的原理:的原理:的原理:的原理:合成语音有较好的自然度,而且有一定的抗噪声能合成语音有较好的自然度,而且有一定的抗噪声能力,从算法上避开了提取基音这一难题,但算法较复杂力,从算法上避开了提取基音这一难题,但算法较复杂,运算量较大。,运算量较大。商用标准:商用标准:INMARSAT-AeroINMARSAT-Aero系统的语音编码标准,系统的语音编码标准,9.6kb/s9.6kb/s。MP-LPCMP-LPCMP-LPCMP-LPC的特点:的特点:的特点:的特点:19第19页,本讲稿共52页 用用等等间间距距、幅幅度度
14、变变化化的的脉脉冲冲作作为为激激励励,每每个个子子帧帧(5ms5ms)估估计计一一次次最最佳佳激激励励脉脉冲冲,对对脉脉冲冲的的幅幅度度以以及及第第一一个个脉脉冲冲的的位位置置进进行行编编码码,并并且且与与LPLP参参数数的的编编码码一一起起送送入入信信道。道。在在GSMGSM标标准准中中,每每个个子子帧帧(5ms5ms)激激励励源源有有4040个个脉脉冲冲(样样点点),共共有有1313个个非非零零脉脉冲冲,非非零零脉脉冲冲的的间间距距相相等等,非非零零脉脉冲冲间间有有两两个个零零值值样样点点,第第一一个个非非零零脉脉冲冲出出现现位位置置有有4 4种可能,分别在第种可能,分别在第1 1、2 2
15、、3 3、4 4样点处。样点处。二、规则脉冲激励编码二、规则脉冲激励编码LPC RPE-LTP-LPCRPE-LTP-LPCRPE-LTP-LPCRPE-LTP-LPC的原理的原理的原理的原理20第20页,本讲稿共52页 RPE-LTP-LPCRPE-LTP-LPCRPE-LTP-LPCRPE-LTP-LPC编码框图编码框图编码框图编码框图二、规则脉冲激励编码二、规则脉冲激励编码LPC预加重分帧自相关Schur迭代对数面积比LAR编码器LPC分析滤波器反射系数插值LAR解码器长时分析长时参数编码器长时参数解码器+加权滤波器+RPE相位选择Z-NAPCM编码器APCM解码器RPE相位恢复xmcM
16、c xmaxcbcNcLARcS0(n)S(n)ACFLARd(n)预处理LPC分析短时预测长时预测RPE编码信号参数输出参数注释:e(n)21第21页,本讲稿共52页 RPE-LTP-LPCRPE-LTP-LPCRPE-LTP-LPCRPE-LTP-LPC解码框图解码框图解码框图解码框图二、规则脉冲激励编码二、规则脉冲激励编码LPC22第22页,本讲稿共52页二、规则脉冲激励编码二、规则脉冲激励编码LPC参 数比特数8个LPC分析参数LARC364个长时预测系数bc84个长时预测延时NC284个激励序列相位MC84个子帧最大非零样值 xmaxc2452个RPE非零样值xmc156总 计260
17、LAR(i)参数序号(即i的值)1,23,45,67,8编码比特数6543GSMGSMGSMGSM编码方案每帧传输的比特分配编码方案每帧传输的比特分配编码方案每帧传输的比特分配编码方案每帧传输的比特分配23第23页,本讲稿共52页二、规则脉冲激励编码二、规则脉冲激励编码LPC 13kb/s 13kb/s REP-LTPREP-LTP采采用用主主观观加加权权最最小小均均方方误误差差准准则则逼逼近近原始语音波形,具有波形编码特点。原始语音波形,具有波形编码特点。采采用用长长时时预预测测、对对数数量量化化比比等等一一系系列列措措施施,使使其其在在13kb/s13kb/s的的速速率率上上得得到到相相当
18、当好好的的语语言言编编码码质质量量,其其MOSMOS分为分为3.83.8分。分。REP-LTP-LPCREP-LTP-LPCREP-LTP-LPCREP-LTP-LPC的特点的特点的特点的特点24第24页,本讲稿共52页二、规则脉冲激励编码二、规则脉冲激励编码LPCREP-LTP-LPCREP-LTP-LPCREP-LTP-LPCREP-LTP-LPC的特点(续)的特点(续)的特点(续)的特点(续)它的抗误码性能较好。若不加纠错,则Pe=10-3时语音质量基本不下降,Pe=10-2时语音质量有所下降,但MOS分仍可达到3.0;加纠错后,在22.8kb/s的速率上,Pe=10-1时语音质量下降不
19、多。编解码延迟约30ms,加纠错后为80ms。非语音信号编码效果不太理想,传送数据的效果也不理想。25第25页,本讲稿共52页 CELP:在预先设计的一组激励序列矢量码本中按一定准则搜索每一个子帧的最佳码矢量作为激励信号,对滤波器的参数以及码本的标号和增益进行编码。三、三、码本激励码本激励LPCCELPCELPCELPCELP原理原理原理原理26第26页,本讲稿共52页三、三、码本激励码本激励LPC码本长时预测短时预测感觉加权滤波器均方运算码码本本号号长时预测系数短时预测系数 图图图图2-30 CELP2-30 CELP编码原理框图编码原理框图编码原理框图编码原理框图s(n)s(n)的估值d(
20、n)e(n)CELPCELP编码器原理框图编码器原理框图编码器原理框图编码器原理框图27第27页,本讲稿共52页三、三、码本激励码本激励LPCCELPCELPCELPCELP编码的特点编码的特点编码的特点编码的特点 运用线性预测技术,构造声道模型;运用线性预测技术,构造声道模型;运用矢量量化技术构成高效的残差激励;运用矢量量化技术构成高效的残差激励;运用合成分析法和感觉加权进行闭环搜索,从码运用合成分析法和感觉加权进行闭环搜索,从码本中搜索出最佳码矢量,作为激励信号。本中搜索出最佳码矢量,作为激励信号。28第28页,本讲稿共52页 CELPCELP的的码码本本,是是将将预预测测误误差差信信号号
21、可可能能出出现现的的各各种种样样值值的的编编码码组组合合按按一一定定规规则则排排列列存存储储在在存存储储器器中中,就就像像字字典典一一样样,每每一一个个样样值值的的编编码码组组合合有有一一个个地地址址码码。收收、发发双双方方各各有一个同样的码本。有一个同样的码本。发发端端预预测测出出误误差差信信号号后后,在在本本方方的的码码本本中中搜搜索索出出与与该该残差信号最接近的码矢量的地址码,将地址码传输到收方。残差信号最接近的码矢量的地址码,将地址码传输到收方。收收方方根根据据收收到到的的地地址址码码在在己己方方的的码码本本中中找找出出相相应应码码矢矢量加到滤波器上,得到重建的话音。量加到滤波器上,得
22、到重建的话音。由由于于传传输输的的是是码码本本的的地地址址码码,大大大大地地减减少少传传输输的的比比特特数,从而降低编码速率。数,从而降低编码速率。关于关于关于关于CELPCELPCELPCELP的码本(的码本(的码本(的码本(1 1 1 1)三、三、码本激励码本激励LPC29第29页,本讲稿共52页CELPCELP一般建有两个码本:一般建有两个码本:自适应码本:自适应码本:码字逼近语音的长时周期性(基音)结构;码字逼近语音的长时周期性(基音)结构;固定的随机码本:固定的随机码本:码字逼近语音经短时、长时预测后的残码字逼近语音经短时、长时预测后的残差信号。差信号。如如果果码码本本编编得得好好,
23、码码本本中中的的码码字字与与实实际际的的误误差差信信号号极极为为接接近近,同同时时码码本本中中码码字字又又少少,就就可可以以以以较较低低的的编编码码速速率率得到较好的话音质量。得到较好的话音质量。利利用用AbSAbS闭闭环环系系统统以以及及码码本本搜搜索索算算法法可可以以得得到到最最佳佳自自适适应应码码矢矢量量及及其其最最佳佳增增益益g ga a、最最佳佳随随机机码码矢矢量量及及其其最最佳佳增增益益g gs s。两者加权相加后即为。两者加权相加后即为CELPCELP激励源。激励源。关于关于关于关于CELPCELPCELPCELP的码本(的码本(的码本(的码本(2 2 2 2)三、三、码本激励码
24、本激励LPC30第30页,本讲稿共52页三、三、码本激励码本激励LPC G.728(LD-CELP)G.728(LD-CELP),16k/s16k/s;G.729(CS-ACELP)G.729(CS-ACELP),8kb/s8kb/s;IS54IS54、IS95IS95(VSELPVSELP、QCELPQCELP),),7.95kb/s7.95kb/s、8.5kb/s;8.5kb/s;FS-1016 FS-1016(CELPCELP),),4.8kb/s4.8kb/s。商用标准商用标准商用标准商用标准31第31页,本讲稿共52页FS-1016FS-1016FS-1016FS-1016编码器结构
25、图编码器结构图编码器结构图编码器结构图三、三、码本激励码本激励LPCMSPE准则准则32第32页,本讲稿共52页 8kHz8kHz采样,帧长采样,帧长240240个样点(个样点(30ms30ms),一帧内有),一帧内有4 4个个子帧(子帧(6060个样点,个样点,7.5ms7.5ms),每帧发送),每帧发送144144个比个比特。特。采用采用AbSAbS闭环系统,发端有闭环系统,发端有1010阶短时线性预测、阶短时线性预测、长长时时自自适适应应码码本本搜搜索索、随随机机码码本本搜搜索索,感感觉觉加加权权滤滤波器。波器。发送的参数是每帧的发送的参数是每帧的1010个个LSFLSF参数(参数(34
26、bits34bits););每每子帧的自适应码本标号(偶数子帧子帧的自适应码本标号(偶数子帧6bits6bits,奇数,奇数 子子帧帧8bits 8bits)及增益()及增益(5bits5bits)、随机码本标号、随机码本标号(9bits9bits)及增益()及增益(5bits5bits)。)。FS-1016 4.8kb/sFS-1016 4.8kb/sFS-1016 4.8kb/sFS-1016 4.8kb/s的的的的CELPCELPCELPCELP声码器的特点声码器的特点声码器的特点声码器的特点三、三、码本激励码本激励LPC33第33页,本讲稿共52页三、三、码本激励码本激励LPC关于关于
27、关于关于QCELPQCELPQCELPQCELP QUALCOMM公司于1993年研制成功了采用QCELP(QUALCOMM CELP)专利声码器算法的全双工话音编译码器Q4400/Q4401声码器。Q4400声码器可提供固定速率和可变速率两种工作声码器可提供固定速率和可变速率两种工作模式。固定速率模式有模式。固定速率模式有4.0kb/s、4.8kb/s、8.0kb/s和和9.6kb/s四种速率供用户选择。而变速率模式则四种速率供用户选择。而变速率模式则可根据输入信号的能量从可根据输入信号的能量从800b/s到到9600b/s自动地调自动地调整最佳速率,每次调整间隔为一个帧长(整最佳速率,每次
28、调整间隔为一个帧长(20ms)。)。34第34页,本讲稿共52页三、三、码本激励码本激励LPC Q4400声码器与其它话音编码器的质量比较2.4bps10kbps 16kbps64kbpsQ4400声码器 波形编码器 长话质量近长话质量话音质量数据速率关于关于关于关于QCELPQCELPQCELPQCELP35第35页,本讲稿共52页 IMBEIMBE(Improved Improved MBEMBE):1991:1991年年定定为为 “INMARSAT-INMARSAT-M M”系统的语音编码标准。系统的语音编码标准。DVSI(Digital DVSI(Digital Voice Voice
29、 System System Inc.)Inc.)提提 出出 的的 AMBE AMBE(Advanced(Advanced MBEMBE)算算法法,进进一一步步改改进进了了合合成成语语音音的的质质量量和和鲁棒性。被选为鲁棒性。被选为INMARSAT ICO INMARSAT ICO 系统和系统和 “铱铱”系系统统的的语音编码标准。语音编码标准。四、多带激励四、多带激励LPC 美国MIT大学林肯实验室1988年提出了多带激励MBE(Multi-Band Excitation)语音编码方案,MBE在2.4kb/s-4.8kb/s速率上能合成出音质比传统声码器好得多的语音,而且具有较好的自然度和容忍
30、环境噪声的能力。36第36页,本讲稿共52页 传传统统声声码码器器的的缺缺陷陷是是将将全全频频带带的的语语音音简简单单地地由由清清浊浊音音和和基基音音周周期期表表示示,导导致致合合成成语语音音自自然然度度差差。对对于于“干干净净”的的语语音音信信号号,LPCLPC声声码码器器这这种种二二元元激激励励模模型型能能够够在在2.4kb/s 2.4kb/s 甚甚至至更更低低的的速速率率上上给给出出可可懂懂度度相相当当高高的的合合成成语语音音。但但是是对对于于含含有有噪噪声声的的语语音音信信号号,由由于于无无法法准准确确地地提提取取语语音音参参数数,LPCLPC声声码码器性能严重恶化。器性能严重恶化。事
31、事实实上上许许多多语语音音段段既既含含有有周周期期分分量量,又又含含有有非非周周期期分分量量。这这种种特特性性在在频频谱谱上上的的表表现现是是:在在某某些些频频段段的的语语音音谱谱呈呈现现周周期期谱的特征,而在某些频段上则呈现噪声谱的特征。谱的特征,而在某些频段上则呈现噪声谱的特征。四、多带激励四、多带激励LPC传统声码器的缺陷传统声码器的缺陷传统声码器的缺陷传统声码器的缺陷37第37页,本讲稿共52页CELP以语音线性预测模型为基础,对残差信号采用了矢量量化,搜索过程用A-B-S方法,并采取感觉加权均方误差最小判决准则,在4.816kb/s 的速率范围内获得了巨大的成功。然而当速率进一步降低
32、时,由于没有足够的比特表示激励矢量,残差信号的量化将产生较大的误差,致使合成语音信号的质量迅速下降。四、多带激励四、多带激励LPC传统声码器的缺陷(续)传统声码器的缺陷(续)传统声码器的缺陷(续)传统声码器的缺陷(续)38第38页,本讲稿共52页 将语音谱在整个频带内按基音谐波频率为中心,将语音谱在整个频带内按基音谐波频率为中心,以以基音频率为带宽划分为若干个频带;基音频率为带宽划分为若干个频带;对每个频带根据频谱特征分别进行清浊音判决,对每个频带根据频谱特征分别进行清浊音判决,形形成多带激励谱。成多带激励谱。整个激励谱由基音频率和它的谐波以及一组清浊整个激励谱由基音频率和它的谐波以及一组清浊
33、音音判决参数表示,较好地反映了语音信号的特征。判决参数表示,较好地反映了语音信号的特征。合成语音时,根据各带的清合成语音时,根据各带的清/浊音参数采用不同浊音参数采用不同 的的激励信号合成语音,最后将分带合成信号相加形激励信号合成语音,最后将分带合成信号相加形成全带合成语音。成全带合成语音。四、多带激励四、多带激励LPC多带激励语音模型多带激励语音模型多带激励语音模型多带激励语音模型39第39页,本讲稿共52页 MBEMBE以多带激励代替以多带激励代替LPCLPC中的二元激励,无论是浊音、清中的二元激励,无论是浊音、清音、还是过渡音,在编码过程中都要提取三种参数:音、还是过渡音,在编码过程中都
34、要提取三种参数:基音频率(或基音周期);基音频率(或基音周期);按基音频率的各次谐波分带后每个频带的谱包络参数按基音频率的各次谐波分带后每个频带的谱包络参数(可以近似地认为每个分带内的谱包络保持不变);(可以近似地认为每个分带内的谱包络保持不变);每个频带的每个频带的U/VU/V判决信息。判决信息。四、多带激励四、多带激励LPC多带激励语音分析算法多带激励语音分析算法多带激励语音分析算法多带激励语音分析算法40第40页,本讲稿共52页四、多带激励四、多带激励LPC同时提取这三个参数所涉及的计算量相当大。通常采用一种次同时提取这三个参数所涉及的计算量相当大。通常采用一种次优的算法分两步来完成参数
35、的提取。优的算法分两步来完成参数的提取。首先确定基音频率和每个分带的谱包络参数,提取这些参数时可以采用与A-B-S类似的方法。然后再对每个分带进行U/V判决。41第41页,本讲稿共52页 美美国国电电信信工工业业协协会会(TIATIA)为为了了选选择择北北美美陆陆地地移移动动通通信信系系统统的的语语音音编编码码标标准准,对对工工作作在在7.2kbps7.2kbps速速率率上上的的四四种种声声码码器器的的语语音音质质量量进进行行了了测测试试。测测试试结结果果见见下下图图。在在7.2kbps7.2kbps的的 IMBEIMBE算算 法法 中中,含含 有有 4.4kbps4.4kbps的的 语语 音
36、音 编编 码码,2.8kbps2.8kbps的的差差错错控控制制编编码码。测测试试条条件件是是不不同同的的误误码码率率和和不不同的运动速度。同的运动速度。四、多带激励四、多带激励LPCMBEMBEMBEMBE性能评估性能评估性能评估性能评估42第42页,本讲稿共52页四、多带激励四、多带激励LPC IMBEIMBE与其它声码器的语音质量比较测试与其它声码器的语音质量比较测试43第43页,本讲稿共52页 19931993年年美美国国国国防防部部语语音音信信号号数数字字处处理理协协会会(DDVPCDDVPC)开开始始选选择择新新的的美美国国国国防防部部2.4kb/s2.4kb/s标标准准,于于19
37、961996年年3 3月月最最终终选选用用TITI公公司司和和ASPASP公公司司联联合合推推出出的的混混合合激激励励线线性性预预测测(MELP-MELP-Mixed-Mixed Excitation Excitation Linear Linear PredictionPrediction)声声码码器器取取代代旧旧标标准准FS-1015.FS-1015.MELPMELP声声码码器器的的采采样样率率为为8kHz8kHz,每每180180个个样样点点为为一一帧帧,帧帧长为长为22.5ms22.5ms,每帧量化比特为,每帧量化比特为54bits54bits,总的速率为,总的速率为2.4kb/s2.
38、4kb/s。五、混合激励五、混合激励LPC44第44页,本讲稿共52页 以混合激励代替基本以混合激励代替基本LPCLPC模型的二元激励,将周期脉模型的二元激励,将周期脉冲激励源和白噪声源混合作为激励信号,较准确地冲激励源和白噪声源混合作为激励信号,较准确地描述过渡帧和弱浊音帧的激励信号。描述过渡帧和弱浊音帧的激励信号。吸取吸取MBEMBE算法的分带思想,在各个子带上对混合比例算法的分带思想,在各个子带上对混合比例进行控制。进行控制。改进周期脉冲信号源的合成,将改进周期脉冲信号源的合成,将LPCLPC残差信号进行傅残差信号进行傅立叶变换,提取基音谐波分量,量化后传到对端用立叶变换,提取基音谐波分
39、量,量化后传到对端用于合成周期脉冲激励,提高了激励信号与原始残差于合成周期脉冲激励,提高了激励信号与原始残差的匹配程度。的匹配程度。MELPMELPMELPMELP声码器的特点声码器的特点声码器的特点声码器的特点五、混合激励五、混合激励LPC45第45页,本讲稿共52页 引引入入非非周周期期脉脉冲冲的的概概念念。对对于于弱弱浊浊音音,不不使使用用周周期期脉脉冲冲参参与与合合成成激激励励,而而是是使使用用非非周周期期脉脉冲冲(在在原原有有周周期期脉脉冲冲的的基基础础上上加加25%25%的的随随机机抖抖动动),更更符符合合语语音信号的准周期性。音信号的准周期性。对对合合成成的的混混合合激激励励信信
40、号号进进行行自自适适应应谱谱增增强强,使使得得合合成语音在波形上与原始语音在共振区有更好的匹配。成语音在波形上与原始语音在共振区有更好的匹配。对对合合成成语语音音进进行行脉脉冲冲整整形形滤滤波波,降降低低合合成成语语音音的的蜂蜂 鸣效果,使语音更连贯、更自然。鸣效果,使语音更连贯、更自然。五、混合激励五、混合激励LPC46第46页,本讲稿共52页MELPMELPMELPMELP编解码框图编解码框图编解码框图编解码框图五、混合激励五、混合激励LPC47第47页,本讲稿共52页浊音清音基音周期值77LSFs2525增益(每帧两个)5+35+3残差谐波谱的傅立叶系数8带通声音强度4非周期标志1纠错码
41、13同步比特11每帧比特数5454五、混合激励五、混合激励LPCMELPMELPMELPMELP编码比特分配编码比特分配编码比特分配编码比特分配48第48页,本讲稿共52页 2.4kb/s2.4kb/s的的MELPMELP声声码码器器的的质质量量大大大大超超过过LPC-10LPC-10声声码码器器,基基本本达达到到CELPCELP(FS-1016 FS-1016,4.8kb/s 4.8kb/s)的的水水平平。在在抗抗噪噪声声性性能能方方面面甚甚至至比比CELPCELP还还高高,接接近近CVSDCVSD(16kb/s 16kb/s)的的质质量量,是是一一种种较较理理想想的的低低速速率率语语音音编
42、编码码算算法。法。五、混合激励五、混合激励LPCMELPMELPMELPMELP声码器的性能声码器的性能声码器的性能声码器的性能49第49页,本讲稿共52页语音信号的波形编码、参数编码、混合编码的定语音信号的波形编码、参数编码、混合编码的定义,对语音编码信号性能的评价方法义,对语音编码信号性能的评价方法 语音信号的采样和量化语音信号的采样和量化语音信号波形编码的实现方法语音信号波形编码的实现方法语音模型和语音模型和LPCLPC声码器声码器语音信号的合成分析编码语音信号的合成分析编码几种混合编码方法介绍几种混合编码方法介绍主要内容:本章小结本章小结50第50页,本讲稿共52页作业与思考题教材:P50,2.16、2.17、2.18、2.19、2.2051第51页,本讲稿共52页 谢谢 谢!谢!第52页,本讲稿共52页