《语音编码技术.教学提纲.ppt》由会员分享,可在线阅读,更多相关《语音编码技术.教学提纲.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、语音编码技术.第六章第六章 语音编码技术语音编码技术n6.1 概概 述述n 6.1.1 语音编码技术语音编码技术n 6.1.2 语音评价语音评价n6.2 语音波形编码语音波形编码n 6.2.1 语音波形编码概述语音波形编码概述n 6.2.2 脉冲编码调制脉冲编码调制n6.3参量编码参量编码n 6.3.1 参量编码的基本原理参量编码的基本原理n 6.3.2 线性预测线性预测n6.4 激励线性预测和矢量编码激励线性预测和矢量编码n 6.4.1 激励源和混合编码激励源和混合编码n 6.4.2 规则脉冲激励长期预测编码规则脉冲激励长期预测编码n 6.4.3 矢量量化编码矢量量化编码n 6.4.4 码激
2、励线性预测编码码激励线性预测编码n 6.4.5 矢量和激励线性预测编码矢量和激励线性预测编码2020/6/2126.1 概概 述述n6.1.1 语音编码技术语音编码技术移动通信对语音编码的要求是:移动通信对语音编码的要求是:(1)编码的速率要适合在移动信道内传输,纯编码速率应低编码的速率要适合在移动信道内传输,纯编码速率应低于于16kbit/s。(2)在一定编码速率下语音质量应尽可能高,即解码后的复在一定编码速率下语音质量应尽可能高,即解码后的复原语音的保真度要高,主观评分原语音的保真度要高,主观评分MOS(Mean Opinion Score)应不低于)应不低于3.5分(按长途语音质量要求)
3、。分(按长途语音质量要求)。(3)编解码时延要短,总时延不得超过编解码时延要短,总时延不得超过65ms。(4)要能适应衰落信道的传输,即抗误码性能要好,以保持要能适应衰落信道的传输,即抗误码性能要好,以保持较好的语音质量。较好的语音质量。(5)算法的复杂程度要适中,应易于大规模电路集成。算法的复杂程度要适中,应易于大规模电路集成。2020/6/213u语音编码:语音编码:移动通信数字化的基础移动通信数字化的基础 第第1/2代蜂窝系统的根本区别代蜂窝系统的根本区别u语音编码的意义:语音编码的意义:q提高通话质量提高通话质量(数字化数字化+信道编码纠错信道编码纠错)q提高频谱利用率提高频谱利用率(
4、低码率编码低码率编码)q提高系统容量提高系统容量(低码率、语音激活技术低码率、语音激活技术)u移动通信对语音编码的要求:移动通信对语音编码的要求:q编码速率低,语音质量好编码速率低,语音质量好q有较强的抗噪声干扰和抗误码的性能有较强的抗噪声干扰和抗误码的性能q编译码延时小、总延时在编译码延时小、总延时在65ms以内以内q编译码器复杂度低,便于大规模集成化编译码器复杂度低,便于大规模集成化q功耗小,便于应用于手持机功耗小,便于应用于手持机2020/6/2146.1.2 语音评价语音评价n客观评定方法用客观测量的手段来评价语音编码的质量,常用的方法客观评定方法用客观测量的手段来评价语音编码的质量,
5、常用的方法有信噪比、加权信噪比、平均分段信噪比等。有信噪比、加权信噪比、平均分段信噪比等。n主观评定方法是主观评定等级(主观评定方法是主观评定等级(Subjective Opinion Scale),或称平),或称平均评定得分(均评定得分(MOS)。)。MOS得分采用五级评分标准,其方法是由数得分采用五级评分标准,其方法是由数十名试听者在相同信道环境中试听并给予评分,然后对评分进行统计十名试听者在相同信道环境中试听并给予评分,然后对评分进行统计处理,求出平均得分。处理,求出平均得分。质量等级质量等级 分数分数 收听注意力等级收听注意力等级 优优 5可完全放松,不需要注意力可完全放松,不需要注意
6、力 良良 4需要注意,但不需要明显集需要注意,但不需要明显集中注意力中注意力 满意满意(正常正常)3中等程度的注意力中等程度的注意力 差差 2需要集中注意力需要集中注意力 劣劣 1即使努力去听,也很难听懂即使努力去听,也很难听懂表表6.1 主观评定等级主观评定等级2020/6/215语音编码技术分类语音编码技术分类2020/6/216语音编码技术分类语音编码技术分类u波形编码波形编码:将时域模拟话音的波形信号经过采样、量化和编:将时域模拟话音的波形信号经过采样、量化和编码形成数字语音信号码形成数字语音信号q 编码速率较高:编码速率较高:16k64kq包括:包括:PCM、ADPCM、M、CVSD
7、M、APC等等q占用较高带宽,适合有线占用较高带宽,适合有线u参量编码参量编码:基于人类语音的产生机理建立数学模型,根据输:基于人类语音的产生机理建立数学模型,根据输入语音得出模型参数并传输,在收端恢复。入语音得出模型参数并传输,在收端恢复。q编码速率较低:编码速率较低:1.2k4.8kbpsq包括各种线性预测编码(包括各种线性预测编码(LPC)方法和余弦声码器等)方法和余弦声码器等q语音质量中等,不满足商用要求语音质量中等,不满足商用要求u混合编码混合编码:波形编码:波形编码+参量编码(参量编码(LPAS)q包括包括GSM的的RPE-LPC编码和编码和VSELP编码编码2020/6/217用
8、于移动通信的语音编码用于移动通信的语音编码2020/6/218语音编码标准语音编码标准uG.711 PCM(64kbps)uG.721 ADPCM(32kbps)uG.722 7kHz带宽带宽64kbps速率内的音频编码速率内的音频编码uG.723 6.3k/5.6k双速率多媒体语音编码双速率多媒体语音编码uG.728 16kbps语音编码语音编码LD-CELPuG.729 8kbps多媒体语音编码多媒体语音编码2020/6/219语音编码的发展语音编码的发展u极低速率语音编码,极低速率语音编码,600bpsu高保真语音编码高保真语音编码u自适应多速率语音编码自适应多速率语音编码u新的编码分析
9、技术:新的编码分析技术:n非线性预测非线性预测n多精度时频分析技术(子波分析技术)多精度时频分析技术(子波分析技术)n高阶统计分析技术高阶统计分析技术 2020/6/21106.2 语音波形编码语音波形编码人的语音频带范围为人的语音频带范围为3003400Hz(一般为(一般为03400Hz)。)。波形编码是直接在时间域上将模拟的语音信号变换为数字波形编码是直接在时间域上将模拟的语音信号变换为数字信号。图信号。图6.2示出了语音波形数字编码的原理框图。示出了语音波形数字编码的原理框图。图图6.2 语音波形编码原理图语音波形编码原理图波形编码包括两个基本过程:抽样和量化,而这两个波形编码包括两个基
10、本过程:抽样和量化,而这两个过程也是所有语音编码的基础。过程也是所有语音编码的基础。6.2.1 语音波形编码概述语音波形编码概述2020/6/21116.2.2 脉冲编码调制脉冲编码调制n脉冲编码调制(脉冲编码调制(PCM:Pulse Coded Modulati-on)定义定义:直接将样值编码为信号的方法直接将样值编码为信号的方法.图图6.3 PCM的组成的组成 在有线数字通信中,常用在有线数字通信中,常用64kbit/s PCM码传输数字语音码传输数字语音信号。对于无线传输来说,由于受频带的限制,必须采用信号。对于无线传输来说,由于受频带的限制,必须采用低速率、高质量的编码技术方法,所以,
11、在数字峰窝网中低速率、高质量的编码技术方法,所以,在数字峰窝网中的有线无线接口处,要进行的有线无线接口处,要进行64kbit/s PCM码与其他编码体码与其他编码体制的转换。制的转换。2020/6/2112 模数转换要经过抽样、量化和编码三个步骤。脉冲编码调制脉冲编码调制PCM基本原理基本原理2020/6/2113 模拟信源预滤波器抽样器波形编码器量化、编码x(t)x(n)模拟信源重建滤波器抽样保持,低通波形解码器数字信道脉冲编码调制脉冲编码调制(PCM)简称脉码调制。简称脉码调制。包括三个过程:抽样、量化、编码。包括三个过程:抽样、量化、编码。抽样是把连续时间模拟信号转换成离散时间连续幅度的
12、抽抽样是把连续时间模拟信号转换成离散时间连续幅度的抽样信号;样信号;量化是把离散时间连续幅度的抽样信号转换成离散时间离量化是把离散时间连续幅度的抽样信号转换成离散时间离散幅度的数字信号;散幅度的数字信号;编码是将量化后的信号编码形成一个二进制码组输出。编码是将量化后的信号编码形成一个二进制码组输出。3.23.23.93.92.82.83.43.41.21.24.24.2模拟话音模拟话音模拟话音模拟话音采样时钟采样时钟采样时钟采样时钟PAM PAM 信号信号信号信号PCM PCM 信号信号信号信号采样电路采样电路量化和编码量化和编码 数字化数字化数字化数字化声音声音声音声音l 话音信道带宽话音信
13、道带宽 2倍话音最大频率倍话音最大频率)l 量化级数:量化级数:256级级 (8位二进制码表示位二进制码表示)l 数据率:数据率:8000次次/s*8bit=64Kb/s 每路每路PCM信号的速率信号的速率=64000bps例:语音信号要在数字线路上传输,必须将语音信号转换成数字信号。这需要例:语音信号要在数字线路上传输,必须将语音信号转换成数字信号。这需要经过三个步骤:采样、量化、编码。编码后的信号称为经过三个步骤:采样、量化、编码。编码后的信号称为PCM(Pulse Coded Modulation)信号(脉码调制信号)信号(脉码调制信号)2020/6/2115PCM转换过程举例 原始信号
14、原始信号 PAMPAM脉冲脉冲 PCM PCM 脉冲脉冲 (有量化误差)(有量化误差)011100011011001100011100011011001100 PCM PCM 输出输出输出输出3.23.23.93.92.82.83.43.41.21.24.24.23 34 43 33 31 14 40110111001000110110110110010011001002020/6/2116 PCM编码原理编码原理 常见的常见的PCM二进制码组有三种:二进制码组有三种:自然二进制码组自然二进制码组NBC;-十进制正整数的二进制表示。十进制正整数的二进制表示。折折叠叠二二进进制制码码组组FBC;
15、-左左边边第第一一位位表表示示正正负负号号,“1”表表示正。示正。格格雷雷二二进进制制码码组组RBC;特特点点:任任何何相相邻邻电电平平的的码码组组只只有有一一位发生变化。位发生变化。量化值序号自然二进制码折叠二进制码格雷码15141312111098111111101101110010111010100110001111111011011100101110101001100010001001101110101110111111011100765432100111011001010100001100100001000000000001001000110100010101100111010001
16、01011101100010001100010000三种码组三种码组 对于对于NBC:码组第一位出错,幅度误差为最大幅度的:码组第一位出错,幅度误差为最大幅度的1/2倍;倍;对于对于FBC:码组第一位出错,小信号的失真误差要小得多;:码组第一位出错,小信号的失真误差要小得多;对于对于RBC:码组中一位出错,误差幅度只相差一个量化间隔。:码组中一位出错,误差幅度只相差一个量化间隔。6.3 参参 量量 编编 码码n6.3.1 参量编码的基本原理参量编码的基本原理图图6.4 语音产生模型语音产生模型在图在图6.4所示的模型中,包括了三个部分:激励源、声道所示的模型中,包括了三个部分:激励源、声道模型
17、和辐射模型,正好模拟了人的发声器官中喉、声道模型和辐射模型,正好模拟了人的发声器官中喉、声道和嘴。和嘴。1.语音信号的产生模型语音信号的产生模型2020/6/21196.3.1 参量编码的基本原理参量编码的基本原理n声道模型声道模型V(Z)是离散时域的声道传输函数,它在大多)是离散时域的声道传输函数,它在大多数情况下是一个全极点函数数情况下是一个全极点函数辐射模型辐射模型R(Z)与嘴形有关,可以表示成一个固定的模型函数)与嘴形有关,可以表示成一个固定的模型函数2.特征参量的提取特征参量的提取常用的短时处理技术包括加窗技术、基音周期估计等。常用的短时处理技术包括加窗技术、基音周期估计等。2020
18、/6/21206.3.2 线性预测线性预测n2.线性预测编码线性预测编码线性预测技术用于语音编码就构成线性预测编码(线性预测技术用于语音编码就构成线性预测编码(LPC:Linear Prediction Coding)。图)。图6.5是是LPC的原理框图。的原理框图。图图6.5 LPC声码器声码器2020/6/2121线性预测编码的基本原理线性预测编码的基本原理u原理原理:模型化人类语音信号产生的机制模型化人类语音信号产生的机制,提取模型参数提取模型参数,并且只传输模型的参数并且只传输模型的参数.u语音信号的产生模型语音信号的产生模型:n语音的产生语音的产生,声带和声道声带和声道n不同语音产生
19、的原因不同语音产生的原因:声音激励源和声道不同声音激励源和声道不同n声音分类声音分类:浊音和清音浊音和清音u发声过程发声过程n口腔和鼻腔形成时变滤波器口腔和鼻腔形成时变滤波器2020/6/21224.2.2 4.2.2 浊音和清音浊音和清音2020/6/2123语音产生模型语音产生模型u语音模型的建立:语音模型的建立:1、产生激励,、产生激励,2、响应、响应u模型参数:基音,共振峰频率及强度,清浊音判决模型参数:基音,共振峰频率及强度,清浊音判决n低码率编码低码率编码l 码率降低有限码率降低有限l 合成的语音波形失去了自然度和音质合成的语音波形失去了自然度和音质2020/6/2124不同激励语
20、音合成模型不同激励语音合成模型u长时延相关滤波器:产生浊音的音调结构,即频谱的精细结构,而短时延相关滤波器则用来恢复语音的短时频包络。u在发端引入合成装置,合成/分析法2020/6/21254.2.5 4.2.5 自适应多速率语音编码(自适应多速率语音编码(AMRAMR)u为什么研究为什么研究AMR编码编码?qWCDMA将支持多媒体业务将支持多媒体业务,并支持电路交换、分组并支持电路交换、分组交换方式交换方式q移动信道的变化,系统不能工作在最佳的信源和信移动信道的变化,系统不能工作在最佳的信源和信道编码速率。如道编码速率。如GSM,固定速率编码,固定速率编码n信道质量差时,信道编码不足以纠正传
21、输错误,此时应改进信道编码,信道质量差时,信道编码不足以纠正传输错误,此时应改进信道编码,减小信源编码,提高语音质量减小信源编码,提高语音质量n信道质量好时,增加信源编码速率,提高语音质量信道质量好时,增加信源编码速率,提高语音质量uAMR的概念的概念是是:以更智能的方式解决信源编码以更智能的方式解决信源编码和信道编码的速率匹配问题和信道编码的速率匹配问题,实际的语音编码实际的语音编码速率将取决于信道条件速率将取决于信道条件2020/6/21264.2.5 4.2.5 自适应多速率语音编码(自适应多速率语音编码(AMRAMR)nAMR是一种单个集成的语音编码器,他是固定的是一种单个集成的语音编码器,他是固定的信源速率模式,从信源速率模式,从4.7512.2kbps2020/6/2127此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢