《移动通信6.pdf》由会员分享,可在线阅读,更多相关《移动通信6.pdf(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2010-10-12西安电子科技大学信息科学研究所1第3章语音编码2(6)2010-10-12西安电子科技大学信息科学研究所2上次课内容3.1 引言?一、语音编码的基本概念?二、语音质量评价?三、语音编码技术的进展与现状2010-10-12西安电子科技大学信息科学研究所33.2 波形编码一、时间量化和抽样定理?对连续语音信号v(t)在时间轴的离散间隔点上进行波形抽样就完成了时间量化。?抽样信号在时间域上已经离散离散化了,即在有限时间段内为有限个值,但是,其幅度仍为连续连续变量。?时间量化是通过抽样保持电路抽样保持电路完成的,2010-10-12西安电子科技大学信息科学研究所42010-10-1
2、2西安电子科技大学信息科学研究所5抽样定理?在接收端要从抽样信号重建模拟信号的条件重建模拟信号的条件由抽样定理给出。?抽样定理表明,若时间连续信号xa(t)的能量有限,且为带限信号,其最高频率为Fm,?则间隔为Ts=1/2 Fm的离散样值序列xa(nT)包含有原信号xa(t)的所有频谱分量频谱分量。因此,从样值序列xa(nT)中可以恢复恢复出原信号xa(t)。2010-10-12西安电子科技大学信息科学研究所6奈奎斯特间隔?Ts称为奈奎斯特间隔奈奎斯特间隔,是恢复原信号所必须的抽样间隔;称为奈奎斯特抽样速率,是带限信号最高频率Fm的两倍。?例:?一般语音频率范围为3003400 Hz?则抽样频
3、率至少为6800 Hz?PCM标准中规定抽样频率为8000 Hz。2010-10-12西安电子科技大学信息科学研究所7二、幅度量化?信号的抽样值在时间上离散,在幅度幅度上仍是连续模拟量。?将抽样值在幅度上离散化,即将幅度用有限个电平来表示,这样的过程称为幅度量化幅度量化。?为了表达简洁,通常将模拟语音信号xa(t)的抽样值xa(nT)表示成x(n)。?量化和编码总是联系在一起。将样值用有限种幅度的集合有限种幅度的集合来表示为量化,再将各个幅度用有限种符号的集合有限种符号的集合来表示就是编码。2010-10-12西安电子科技大学信息科学研究所8量化与编码?样值序列x(n)通过量化器Q 后成为量化
4、样值序列,再映射成码字序列,就完成了编码。?语音信号的幅度为随机变量,幅值有限。实测表明,幅度接近于伽玛分布伽玛分布或拉普拉斯分布拉普拉斯分布。幅度范围:?超过者仅占0.35。?幅度量化方法:将整个幅度范围划分成有限个分层有限个分层,对落入某个分层的所有样值赋于相同的量化值。?分层间隔称为量化阶距量化阶距,是一个重要参数。()4xx n2010-10-12西安电子科技大学信息科学研究所92010-10-12西安电子科技大学信息科学研究所10均匀量化和非均匀量化?幅值量化可分为均匀量化均匀量化和非均匀量化非均匀量化。前者为常量,后者是可变的。?幅度量化又分为瞬时量化和自适应量化。?瞬时量化瞬时量
5、化是对信号瞬时抽样值独立独立进行量化,不受其前后样值的影响,即量化是无记忆无记忆的。?自适应量化自适应量化的基本思想是让量化阶距量化阶距进行与输入信号方差相适应的变化变化,这就需要对输入信号幅度进行估计估计。因而,对每一样值的量化处理都要根据前后若干样值来进行。2010-10-12西安电子科技大学信息科学研究所11(1)均匀量化?均匀量化的电平分层是等间隔的。设量化器的输入信号为输出为,则对于均匀量化器有下述关系式?式中,为量化阶距,i为分层的编号。?下图(a)为“上升中点”型量化器,具有相同数目的正负电平,且与原点对称,不含“0”量化电平。(b)为“水平中点”型量化器,负电平比正电平多一个,
6、含有“0”量化电平。ixix=1iixx2010-10-12西安电子科技大学信息科学研究所122010-10-12西安电子科技大学信息科学研究所13量化阶距与电平数?均匀量化器的两个参数为量化阶距量化阶距和电平数目电平数目。若码字为B位二进制数,则电平数目通常选择2B。和B的选择应使量化值能覆盖输入样本的幅度范围。?假设x(n)的概率密度函数是对称的,则有?式中,Xmax是x(n)模的最大值。max22BX=2010-10-12西安电子科技大学信息科学研究所14量化噪声?量化过程必然引入量化误差,在讨论量化效应时,量化误差是很重要的。量化后抽样值可表示为?式中,e(n)为量化误差量化误差或量化
7、噪声量化噪声。对于均匀量化,通常有?只有0.35的样值会产生大于的误差()()()x nx ne n=+()22e n22010-10-12西安电子科技大学信息科学研究所15简单统计模型?采用一个量化噪声的简单统计模型简单统计模型来进行分析,假设如下:量化噪声是平稳的白噪声过程;量化噪声与输入信号不相关;在每个量化分层中,量化噪声的分布是均匀的。?实验表明,对于语音信号来说,若足够小,则上述统计模型是成立的2010-10-12西安电子科技大学信息科学研究所16量化信噪比量化信噪比量化信噪比定义为在满足量化噪声的简单统计模型简单统计模型的情况下可得222222()()SNR()()xnenxnE
8、 xnenE en=2max3 4SNRBxX=2010-10-12西安电子科技大学信息科学研究所17用分贝表示的量化信噪比?考虑到语音信号幅度的特点,设,则有?也就是说,码字中每一位码元对信噪比贡献6 dB。?成立的条件是:?量化噪声的简单统计模型成立;?量化阶距足够小;?量化器动态范围与信号峰-峰值相匹配max10SNR(dB)64.7720logxXB=+max4xX=SNR67.2B=2010-10-12西安电子科技大学信息科学研究所18(2)非均匀量化?均匀量化信噪比与信号幅度有较大的相关性较大的相关性,是均匀量化的缺点。通常希望量化的信噪比与信号电平无关,采用非均匀量化可做到这点。
9、?为了使量化信噪比与信号电平无关,量化电平应采用对数形式分布。也就是说,对输入信号的对数进行量化对输入信号的对数进行量化。?编码器中,输入信号首先用对数函数进行幅度压扩幅度压扩,然后再进行量化与编码。在解码器中,解码后的信号用指数函数进行相反的变换。2010-10-12西安电子科技大学信息科学研究所19对数编解码器的原理方框图2010-10-12西安电子科技大学信息科学研究所20对数量化的信噪比?采用对数压扩量化对数压扩量化,可实现对信号幅度的不敏感性。可以证明在一定条件下,对数量化的信噪比为?上式表明,在一定条件下量化信噪比与信号方差无关,只取决于量化阶距。?对数编解码器是具有理想特性理想特
10、性的,实现它需要无限多数量的量化电平无限多数量的量化电平,因而是不现实的。21SNRe=2212e=2010-10-12西安电子科技大学信息科学研究所21(a)律压扩特性?实际系统中,采用某些近似对数压缩特性近似对数压缩特性。通常使用的压扩特性有两种:律和A律。?输入信号x(n)经律压扩律压扩后的输出信号y(n)为?式中,F表示压缩函数,为参数。律压扩特性的输入/输出关系如图所示()maxmax()ln 1()()sgn()ln 1x nXy nF x nXx n=+2010-10-12西安电子科技大学信息科学研究所22律压扩特性2010-10-12西安电子科技大学信息科学研究所23量化信噪比
11、的特点?律量化的SNR与的依赖关系较弱,并且当增大时,依赖关系更弱。?下图给出=100,不同B值时,律和均匀量化器SNR的比较。?由图可知,在=100情况下,当,SNR的变化在2 dB以内。maxxXmax8 30 xX2010-10-12西安电子科技大学信息科学研究所242010-10-12西安电子科技大学信息科学研究所25参数的物理意义?律压扩特性中,参数的物理意义是最大量化阶距与最小量化阶距之比,即()()maxmin=2010-10-12西安电子科技大学信息科学研究所26(b)A律压扩特性?A律采用两段近似方法两段近似方法,其表达式为参数A的物理意义为最大量化阶距与最小量化阶距之比,即
12、maxmax()()1lnx nAXy nXA=+max0()Xx nAmaxmax()1ln()1lnx nAXy nXA+=+()()maxminAAA=maxmax()Xx nXA2010-10-12西安电子科技大学信息科学研究所27?A律在小信号附近可有24 dB的信噪比提升,而当信号样值x(n)接近Xmax时,信噪比要损失14.7 dB。因此,A律量化的动态范围比均匀量化有较大改善。?A律和律的压缩特性都通过原点并近似于对数函数。?A律在小信号段(即1/A以下)是用通过零点的直线段近似的。2010-10-12西安电子科技大学信息科学研究所28三、实用波形编码系统(1)脉冲编码调制(P
13、CM)?脉冲编码调制(PCM)是最早提出的语音编码方法,?PCM优点是技术简单、无时延,基本语音编码方式,?对信号波形进行抽样、量化和编码,构成PCM信号,2010-10-12西安电子科技大学信息科学研究所29?一般语音信号的带宽为3003400 Hz,通常采用的抽样速率为,如果采用8 bit量化,则单路语音编码的比特速率为64 Kb/s。?国际电报电话咨询委员会(CCITT)的建议G.711 中,规 定 以 15 段 折 线 近 似 的段 折 线 近 似 的律律(=255)和13段折线近似的段折线近似的A律律(A=87.56)作为国际标准。?下表给出13段折线近似的段折线近似的A律律的编解码
14、表。s8000Hzf=2010-10-12西安电子科技大学信息科学研究所30A律(A=87.56)编解码表输入幅度范围 量阶()段落码(s)电平码(l)量化电平号 解 码 幅 度 01 12 M 1516 1 000 0000 0001 M 1111 0 1 M 15 0.5 1.5 M 15.5 1617 M 3132 1 001 0000 M 1111 16 M 31 16.5 M 31.5 3234 M 6264 2 010 0000 M 1111 32 M 47 32 M 63 6468 M 124128 4 011 0000 M 1111 48 M 63 66 M 126 2010-
15、10-12西安电子科技大学信息科学研究所31A律(A=87.56)编解码表(续)输入幅度范围 量阶()段落码(s)电平码(l)量化电平号 解 码 幅 度 128130 M 248256 8 100 0000 M 1111 64 M 79 132 M 252 256272 M 496512 16 101 0000 M 1111 80 M 95 264 M 504 512544 M 9921024 32 110 0000 M 1111 96 M 11 528 M 1008 10241088 M 19842048 64 111 0000 M 1111 112 M 127 1056 M 2016 20
16、10-10-12西安电子科技大学信息科学研究所32?表中给出的是信号正值的编码,负值编码绝对值与此表相同。整个信号动态范围共分13个段落,量化阶距不同,并且有2的倍数关系。?每个段落内为均匀分层量化,共16层。?每样值用8 比特编码:b1b2b3b4b5b6b7b8。?b1为符号位符号位,1代表负值,0代表正值。?b2b3b4称为段落码段落码,代表落段s,值为07。?b5b6b7b8代表每个段落内均匀分层的位置段落内均匀分层的位置,其值为015。2010-10-12西安电子科技大学信息科学研究所33编码规则段落内量化阶距的规则为s=0,1;s264 Kb/s PCM编码的信噪比可达38 dB。
17、主观评定等级MOS为4.5,语音质量是相当好的。()1sgn12xb=2 3 410sb b b=5 6 7 810lb b b b=()1s=()12ss=2010-10-12西安电子科技大学信息科学研究所34(2)增量调制(M)?对输入信号与预测样值的差值输入信号与预测样值的差值进行量化编码。?抽样速率远高于信号的奈奎斯特速率,相邻值有很大相关性,能从以前样值预测输入样值。?增量调制系统采用简单的1 bit量化器量化器。这样,M的比特速率就等于抽样速率。1 bit量化器的样值为二电平,量化阶距是固定的。输入样值x(n)和预测样值的差值为d(n),d(n)的量化值为,对其编码,得到c(n)。
18、()()()d nx nx n=%()d n%2010-10-12西安电子科技大学信息科学研究所35增量调制编码表预测器用积分电路实现,即对以前所有的进行累积相加,得为使预测信号可以跟踪上输入信号的变化,必须满足下式,即式中,T为抽样周期,为量化阶距。()d n()%d n()c n 正值 0 负值 1 ()()nkx nd n=%ad()maxdtx tT2010-10-12西安电子科技大学信息科学研究所36实用技术?若上述条件不满足(即所谓过载过载),则产生较大的量化误差,称为过载失真噪声。当满足不过载条件时,信号失真在的范围内。?线性增量调制的量化阶距不变,当信号幅度下降时,量化信噪比将
19、成比例下降,因而固定量阶的线性增量调制性能较差。?为扩大动态范围,应将量化阶距进行自适应调整,实现自适应增量调制自适应增量调制。?其中连续可变斜率增量调制(连续可变斜率增量调制(CVSD)已实用化,性能也较好。速率为32 kHz时,主观评分已达4.3分,相当于7位PCM。(,)2010-10-12西安电子科技大学信息科学研究所373.3 参 量 编 码?波形编码的语音质量较高,实现简单,但速率较高占频带较宽,因而影响通信系统的容量。?寻求低速高质低速高质的语音编码方法一直是数字通信领域的一个重要研究课题。?一个重要概念:对反映语音信号特征语音信号特征的参量进行编码与传输而不是对信号的时域波形本
20、身,即所谓参量编码,可降低编码信号的速率。?参量编码的基础是语音信号特征参数的提取与语音信号的恢复,涉及语音产生的物理模型。2010-10-12西安电子科技大学信息科学研究所38一、语音信号产生模型及其特征参数?人的发音系统由声带、声道及次声门系统构成。?声道的截面积可变化,取决于舌、唇等器官的位置。?次声门系统由肺、气管等级联,产生语音能量来源。?简化的发音系统如图所示。2010-10-12西安电子科技大学信息科学研究所39浊音与清音?浊音浊音又称为有声音有声音:气流通过声门时,如果声带振动声带振动产生一个准周期的空气脉冲激励声道,就得到浊音。?浊音波形具有明显准周期性准周期性。声带振动的频
21、率称为基音频率基音频率fb,周期为基音周期基音周期Tp,基音频率fb一般在70300 Hz的范围内,相当于Tp为315 ms。基音周期Tp是语音信号的主要特征之一。?清音清音又称无声音无声音:声道在某处发生收缩,迫使空气以高速冲过一收缩部位而产生湍流,就得到清音。发清音时声带不振动声带不振动,此时是由湍流建立的宽带噪声源宽带噪声源激励着声道。清音波形类似于噪声,如图(c)所示。2010-10-12西安电子科技大学信息科学研究所402010-10-12西安电子科技大学信息科学研究所41声道的无损声管模型?声道包括口腔和鼻腔,相当于一个非均匀截面非均匀截面的管道管道。当产生声音的气流顺着这个管道传
22、播时,其频谱特征就由管道的选择性管道的选择性所改变?声道的谐振频率称为共振峰频率共振峰频率,简称共振峰,其中第一共振峰第一共振峰就是上面提到的基音频率基音频率fb。?声道截面面积与声道长度方向之间的依赖关系为声道的面积函数面积函数,声道谐振特性主要取决于其面积函数。?实际声道可以用一个级联的无损声管级联的无损声管来表示。当选用较多数量的短管级联,使得各管的截面积逼近声道的面积函数时,就可以期望级联声管的谐振频率接近于声道的谐振频率。2010-10-12西安电子科技大学信息科学研究所42由N个等长无损声管级联的系统的传递函数为:1()1NkkkGV zz=2010-10-12西安电子科技大学信息
23、科学研究所43语音产生模型?无损声管模型等效为时变线性数字滤波器时变线性数字滤波器,滤波器极点对应声道振峰频率,增益参数G和滤波器系数都随时间变化,且依赖于面积函数。?终端等效终端等效的概念:当线性系统的一组参数被控制之后其输出就具有所希望的语音特征,而这组参量是和实际语音产生过程有关的。?语音信号具有慢变化特征慢变化特征:其激励和声道的特征在1020 ms时间内保持不变。?语音产生模型包括激励源、声道和反映嘴唇处声辐射影响的部分,如图所示。2010-10-12西安电子科技大学信息科学研究所442010-10-12西安电子科技大学信息科学研究所45语音特征参数?激励源分为浊音激励和清音激励,用
24、浊音浊音/清音开关清音开关进行控制。?在浊音段浊音段,激励由冲激序列发生器和声门脉冲模型G(z)级联构成,前者产生周期为Tp的单位冲激响应,后者为波形成形系统。?在清音段清音段,激励模型为一个随机噪声源及控制清音激励强度的增益参数。?声道模型声道模型为时变线性系统,辐射模型为R(z)。?语音特征参数特征参数有:基音周期、共振峰频率、语音强度、清音/浊音判决及时变滤波器参数等。2010-10-12西安电子科技大学信息科学研究所46特征参量的提取?提取方法是基于数字信号处理的理论和技术。?语音信号的准平稳特性准平稳特性,即在1020 ms的短时间内认为语音的特征参数不变。可将语音信号分成短的时间段
25、,在各段内进行参量提取。?基音提取问题包括两个方面:首先进行浊音/清音判决,再确定浊音段语音波形的周期Tp。?浊音浊音/清音判决清音判决或称基音检测,就是判决一个时间段是浊音段还是清音段,这就要利用浊音和清音在时域和频域上的差别。2010-10-12西安电子科技大学信息科学研究所47清音/浊音判决?浊音信号具有准周期准周期性,频谱有峰值,即基音及其谐波。浊音信号有较强的相关性。清音信号的波形近似于噪声近似于噪声,没有准周期性,其频谱没有明显的峰值,时域中也不存在相关性。?基音提取的方法很多,可分为三类。?利用语音信号的时域特征,如自相关函数法;?利用语音信号的频域特征,主要是利用浊音频谱的峰值
26、特征;?综合利用语音信号频域与时域特征,如线性预测技术等。2010-10-12西安电子科技大学信息科学研究所48二、线性预测编码(LPC)?线性预测编码(线性预测编码(LPC)在发送端,进行语音分析;在接收端,进行语音合成。?进行语音分析和语音合成时,信号分成帧。?语音分析包括:基音提取基音提取,包括清音/浊音,判决和基音周期Tp。短时线性分析短时线性分析,提取线性滤波器系数及增益G。?预加重预加重目的是增强频谱高频共振峰,使语音短时谱及余量频谱变平坦,提高参数估值精度。?加平滑窗口平滑窗口目的是实现逐帧分析时平滑衔接。2010-10-12西安电子科技大学信息科学研究所492010-10-12
27、西安电子科技大学信息科学研究所50线性预测分析的概念?线性预测分析的基本概念是一个语音抽样能够用过去若干个语音抽样的线性组合来逼近一个语音抽样能够用过去若干个语音抽样的线性组合来逼近。?通过使在有限时间内的实际语音抽样与线性预测抽样之间的差值平方和最小差值平方和最小,能够惟一确定一组预测器参数。这里预测器参数实际上就是线性组合中所用的加权系数。?线性预测分析是基于语音产生模型。将完整模型中的辐射、声道及声门激励的效应用一个时变数字滤波器来表示,则可得到简化语音产生模型简化语音产生模型,它适用于线性预测分析的讨论。2010-10-12西安电子科技大学信息科学研究所51简化语音产生模型2010-1
28、0-12西安电子科技大学信息科学研究所52线性预测器设语音抽样信号为s(n),则p阶线性预测器的输出为式中,为预测器参数。可以证明,时变数字滤波器的传输函数为1()()pkks ns nk=1()1pkkkGH zz=2010-10-12西安电子科技大学信息科学研究所53预测误差及最小均方误差准则?预测误差e(n)定义为?线性预测分析采用最小均方误差准则最小均方误差准则,基本问题是从某一段语音信号中求出一组预测器系数,使得在该 段 中 语 音 波 形 的 短 时 均 方 预 测 误 差 最 小。?式中,是抽样点n附近语音段,1()()()()()pkke ns ns ns ns nk=%k22
29、1()()()pnnnknmmkEe ms ms mk=()()ns ms nm=+2010-10-12西安电子科技大学信息科学研究所54?显然,只要令(i=1,2,p),就能求?得En达到最小的各个值。由此可得方程组:?式中相关函数?先解出相关函数相关函数,再求出最佳预测器系数最佳预测器系数。这两步计算都比较复杂,主要方法有自相关法,协方差法等。0niE=i1(,)(,0),1,2,pknnki kiip=L(,)()()nnnmi ks mi s mk=2010-10-12西安电子科技大学信息科学研究所55增益?语音产生模型中的另一个重要参数是增益G。可以证明,G可由下式求出?式中,包含数
30、字滤波器的冲激响应的自相关函数,即21(0)()pnknkGRR k=0()()()nnR mh n h mn=+2010-10-12西安电子科技大学信息科学研究所56语音合成?在接收端,在一个语音段内,将接收到的特征参数,包括基音周期T,浊音/清音判决,增益,线性滤波器系数作用于该语音产生模型,就可以得到合成语音。?在合成器中为了消除合成语音的空洞、单薄感,需要进行插值插值。?在浊音段,采用基音同步综合,就是在每个基音周期的起始处都改变控制参数,而非同步综合是在每一帧改变参数一次。为了实现基音同步综合,需要对控制参数进行内插以得到每个基音周期起始处的参数值。2010-10-12西安电子科技大学信息科学研究所57合成器中的数字滤波器(IIR)?有两种:全极点网络全极点网络和格型网络格型网络。前者简单且易于实现,但需要很高的计算精度,且对于参数变化较敏感。后者可对参数进行内插且仍保持滤波器稳定,同时这对参数的变化不敏感。?格型网络滤波器与无损声管级联构成的声道模型是等效。声管模型中反射系数反射系数为?可以证明,格型网络滤波器中的部分相关系数部分相关系数ki与ri是等效的,因而又称ki为反射系数。11iiiiiAArAA+=+