数字音频技术.ppt-淘文阁

资源描述

《数字音频技术.ppt》由会员分享，可在线阅读，更多相关《数字音频技术.ppt（39页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数字音频技术现在学习的是第1页，共39页音音频频信号信号现在学习的是第2页，共39页6.1.1 音音频频信号的特点信号的特点1、声音信号的形式、声音信号的形式声音在物理学上称之为声波，是通过一定介质（如空气、声音在物理学上称之为声波，是通过一定介质（如空气、水等）传播的一种连续振动的波。水等）传播的一种连续振动的波。声源所引起的空气压力变化，被耳朵的耳膜所检测，然后声源所引起的空气压力变化，被耳朵的耳膜所检测，然后产生电信号刺激大脑的听觉神经，从而使人们能感觉到声音产生电信号刺激大脑的听觉神经，从而使人们能感觉到声音的存在。的存在。语音信号：语音信号：语言的物质载体，具有复杂的语法和语义，难

2、于语言的物质载体，具有复杂的语法和语义，难于识别。识别。非语音信号：非语音信号：音乐，自然界的声音，信息量低，识别简单。音乐，自然界的声音，信息量低，识别简单。现在学习的是第3页，共39页音音频频信号信号1、声音信号的形式、声音信号的形式在自然界，声波与水波一样都是一种振动波在自然界，声波与水波一样都是一种振动波现在学习的是第4页，共39页音音频频信号信号用声音录制软件记录的英文单词用声音录制软件记录的英文单词”Hello”语音的实际波形。语音的实际波形。现在学习的是第5页，共39页音音频频信号信号2、模拟音频信号的物理特征、模拟音频信号的物理特征频率：体现音调的高低，单位频率：体现音调的高低

3、，单位Hz幅度：体现声音的强弱，单位幅度：体现声音的强弱，单位dB谐波：体现音色的优美程度。谐波：体现音色的优美程度。可听可听频率带宽频率带宽（音频）：（音频）：20Hz20kHz现在学习的是第6页，共39页音音频频信号信号频带频带带宽应用应用抽样频率抽样频率窄带语音窄带语音300Hz3.4kHz3.1 kHz电话通信电话通信8kHz宽带语音宽带语音54Hz 7kHz7kHz电话会议、视频会电话会议、视频会议议16kHz数字音频广播数字音频广播（）信号（）信号20Hz 15kHz15kHz声音广播和电视伴声音广播和电视伴音广播音广播32kHz高保真立体声音高保真立体声音频信号频信号20Hz 2

4、0kHz20kHzVCD、DVD、CD唱片、唱片、HDTV伴音伴音44.1kHz或48kHz按声音所占频带区分音频信号：按声音所占频带区分音频信号：现在学习的是第7页，共39页音音频频信号信号2、模拟音频信号的物理特征、模拟音频信号的物理特征现在学习的是第8页，共39页音音频频信号信号2、模拟音频信号的物理特征、模拟音频信号的物理特征现在学习的是第9页，共39页音音频频信号信号次声波次声波人耳可听域人耳可听域超声波超声波20Hz20,000Hz20,000Hz 20,000Hz女性语音150Hz 150Hz 10,000Hz10,000Hz电话语音200Hz 200Hz 3,400Hz3,40

5、0Hz调幅广播(AM)50Hz 50Hz 7,000Hz7,000Hz调频广播(FM)20Hz 20Hz 15,000Hz15,000Hz高级音响10Hz 10Hz 40,000Hz40,000Hz男性语音100Hz 100Hz 9,000Hz9,000Hz声声源源种种类类频频带带宽宽度度现在学习的是第10页，共39页音音频频信号信号2、模拟音频信号的物理特征、模拟音频信号的物理特征现在学习的是第11页，共39页6.1.2 音音频频信号的数字化信号的数字化借助于借助于A/DA/D或或D/AD/A转换器，模拟信号和数字信号可以互相转换转换器，模拟信号和数字信号可以互相转换现在学习的是第12

6、页，共39页6.1.2 音音频频信号的数字化信号的数字化现在学习的是第13页，共39页6.1.2 音音频频信号的数字化信号的数字化1、声音信息的冗余度、声音信息的冗余度幅度分布的非均匀性幅度分布的非均匀性样值间的相关性样值间的相关性周期间的相关性周期间的相关性话音间隙冗余话音间隙冗余现在学习的是第14页，共39页6.1.2 音音频频信号的数字化信号的数字化2、听觉的掩蔽效应、听觉的掩蔽效应在安静的环境中人耳刚能够感觉到的最小声音强度成为静掩蔽门在安静的环境中人耳刚能够感觉到的最小声音强度成为静掩蔽门限。限。图6-1 静掩蔽门限曲线图当有一个强度为70dB、频率为1kHz的纯音出现时，与静掩蔽门

7、限曲线混合，形成新的同掩蔽门限曲线.现在学习的是第15页，共39页6.1.2 音音频频信号的数字化信号的数字化2、听觉的掩蔽效应、听觉的掩蔽效应1)频谱掩蔽效应频谱掩蔽效应图6-2 同掩蔽门限曲线图现在学习的是第16页，共39页6.1.2 音音频频信号的数字化信号的数字化2、听觉的掩蔽效应、听觉的掩蔽效应2)时间掩蔽效应时间掩蔽效应声压强度大的声音信号出现之前和之后的短暂时间内已存在声压强度大的声音信号出现之前和之后的短暂时间内已存在的弱音信号也会被强音信号掩蔽掉，分别称为前掩蔽的弱音信号也会被强音信号掩蔽掉，分别称为前掩蔽(20ms)(20ms)和后掩蔽和后掩蔽(100200ms)(1002

8、00ms)。现在学习的是第17页，共39页6.1.3 音音频压缩编码频压缩编码方法方法1、依据：、依据：声音信息中存在着多种冗余声音信息中存在着多种冗余听觉器官的不敏感性听觉器官的不敏感性采样的标本中存在着相关性采样的标本中存在着相关性2、压缩算法通常应能满足下列需求：压缩算法通常应能满足下列需求：压缩倍数高，压缩后的数据率低；压缩倍数高，压缩后的数据率低；解码后的信号失真小，质量高；解码后的信号失真小，质量高；算法简单，执行速度快，延迟时间短；算法简单，执行速度快，延迟时间短；编码器、解码器的成本低。编码器、解码器的成本低。现在学习的是第18页，共39页6.1.3 音音频压缩编码频压缩编

9、码方法方法简单地说，压缩就是设法降低码率，使有限的传输信道简单地说，压缩就是设法降低码率，使有限的传输信道能有效加以利用。目前常用的音频压缩编码方法分为以能有效加以利用。目前常用的音频压缩编码方法分为以下三类：下三类：1、波形压缩编码方法、波形压缩编码方法2、分析合成编码法、分析合成编码法3、混合编码压缩方法、混合编码压缩方法现在学习的是第19页，共39页6.1.3 音音频压缩编码频压缩编码方法方法1、波形压缩编码方法、波形压缩编码方法原理：依据人类的听觉心理，去除冗余。特点：码率较高，且可高质量还原声音信号。压缩编码方法：DPCM、ADPCM 现在学习的是第20页，共39页6.1.3 音音频

10、压缩编码频压缩编码方法方法2、分析合成编码法、分析合成编码法原理：利用电学模型和电器参数模拟发音器官，提取原理：利用电学模型和电器参数模拟发音器官，提取必要的模型参数和激励信号。必要的模型参数和激励信号。特点：数据量小，计算量大，保真难度大，适合于窄带应用特点：数据量小，计算量大，保真难度大，适合于窄带应用场合（电话通信）。场合（电话通信）。现在学习的是第21页，共39页6.1.3 音音频压缩编码频压缩编码方法方法、混合编码压缩方法、混合编码压缩方法混合编码压缩波形压缩法分析合成编码法混合编码压缩波形压缩法分析合成编码法常用技术：以线性预测构成声道模型，传送预测参数常用技术：以线性预测构成声道

11、模型，传送预测参数同时也传送预测误差信息。同时也传送预测误差信息。现在学习的是第22页，共39页6.1.3 音音频压缩编码频压缩编码方法方法音乐信号常用的编码技术：音乐信号常用的编码技术：熵编码熵编码自适应变换编码（频域编码）自适应变换编码（频域编码）心理声学模型心理声学模型子带压缩子带压缩现在学习的是第23页，共39页音音乐乐信号常用的信号常用的编码编码技技术术熵编码熵编码原理：根据信息出现概率的分布特性进行编码。原理：根据信息出现概率的分布特性进行编码。特点：压缩编码过程中不丢失信息，能够完全恢复原始信息，特点：压缩编码过程中不丢失信息，能够完全恢复原始信息，无损压缩。无损压缩。常用方法：

12、霍夫曼编码和算术编码。常用方法：霍夫曼编码和算术编码。现在学习的是第24页，共39页音音乐乐信号常用的信号常用的编码编码技技术术自适应变换编码自适应变换编码原理：利用正交变换，把音频信号由时域变换到另一个域，原理：利用正交变换，把音频信号由时域变换到另一个域，对变换域系数量化，可压缩码率。对变换域系数量化，可压缩码率。特点：采用自适应比特分配和自适应量化技术对频域数据进特点：采用自适应比特分配和自适应量化技术对频域数据进行量化。行量化。现在学习的是第25页，共39页音音乐乐信号常用的信号常用的编码编码技技术术心里声学模型心里声学模型原理：对信息量加以压缩，同时利用人耳的掩蔽效应使失真尽可原理：

13、对信息量加以压缩，同时利用人耳的掩蔽效应使失真尽可能不被察觉。能不被察觉。特点：利用高压比效应，给不同频率的信号分配不同的量化比特特点：利用高压比效应，给不同频率的信号分配不同的量化比特数，使噪声能量地狱人耳听力阈值。数，使噪声能量地狱人耳听力阈值。现在学习的是第26页，共39页音音乐乐信号常用的信号常用的编码编码技技术术子带压缩技术子带压缩技术原理：将信号分解为若干子频带内的分量之和，对各子带分原理：将信号分解为若干子频带内的分量之和，对各子带分量根据不同的分布特性采取不同的压缩策略以降低码率。量根据不同的分布特性采取不同的压缩策略以降低码率。特点：划分多个子带，各频带内噪声受到限制，不会相

14、互干特点：划分多个子带，各频带内噪声受到限制，不会相互干扰，动态分配比特数，压缩效率高。扰，动态分配比特数，压缩效率高。现在学习的是第27页，共39页6.2 模模拟电视拟电视的数字音的数字音频频技技术术（数字丽音）特点：可用于地面广播及卫星电视广播，可传送立体声和双语节目，传送声音动态范围大、音质好、信噪比高、串音小。现在学习的是第28页，共39页-6.3 高保真音高保真音频频信号信号压缩编码标压缩编码标准准现在学习的是第29页，共39页MUSICAM（掩蔽型自适应通用子带综合编码和复用）特点：利用人的听觉特性，把声音分成多个子带，以不同的量化特性对各子带加以量化。MUSICAM压缩编码过程可

15、分为四个阶段：6.3.1 MUSICAM现在学习的是第30页，共39页图12-8 MUSICAM的编、解码原理方框图 (a)编码器；(b)解码器1.时间/频率映射：分割成32个子带，并进行FFT计算。2.求出各子带的掩蔽门限的估值：确定最大电平，产生比例因子；确定掩蔽门限，自适应分配比特，压缩数据.3.对各子带进行量化编码:根据各自带的掩蔽阈值及分配的量化比特数进行量化编码。4.按帧打包形成码流：将压缩的数据、比例因子和比特分配信息符合打包到一起，形成实际码流。6.3.1 MUSICAM现在学习的是第31页，共39页 MPEG强调人的听觉心理声学模型的利用。可利用估计听觉掩蔽阈值、量化精度、尺

16、度化等各种压缩手段进行压缩编码。6.3.2 MPEG音音频压缩编码标频压缩编码标准准MPEG系统的基系统的基本框架本框架层次层次，用混合带通滤波器提高频率分配率，用混合带通滤波器提高频率分配率，采用非均匀量化、自适应分段和量化值熵编码采用非均匀量化、自适应分段和量化值熵编码技术。每通道技术。每通道64k bit/s.层次层次，采用自适应的比特分配，子带低频量化精度，采用自适应的比特分配，子带低频量化精度为为4bit，中频段为，中频段为3bit，高频段为，高频段为2bit；比例因子为；比例因子为6bit；高保真度码率为高保真度码率为128k bit/s.层次层次，将音频信号输入按一定格式固定分割

17、成，将音频信号输入按一定格式固定分割成32个子带，子带系数的量化精度为个子带，子带系数的量化精度为4bit，比例因子，比例因子为为6bit，单声道码率为，单声道码率为192k bit/s.现在学习的是第32页，共39页6.3.2 MPEG音音频压缩编码标频压缩编码标准准层次号层次号层次层次层次层次层次层次在比较好的质量下每声道的数码率（kbit/s）19212864压缩比1:3.61:5.61:11编码特点子带编码子带编码子带编码+变换编码频谱分辨率32个子带32个子带32个子带（每个子带18条）特征基本（简单）算法最佳编码滤波器组和熵编码的联合应用应用VCDDABDVB-CDVB-S计算机多

18、媒体通过ISDN传送声音广播节目MPEG-1音频编码三个编码层次主要技术特点音频编码三个编码层次主要技术特点现在学习的是第33页，共39页6.3.2 MPEG音音频压缩编码标频压缩编码标准准MPEG音频层次音频层次的简化帧格式的简化帧格式MPEG音频层次音频层次的简化帧格式的简化帧格式帧头帧头CRC音频数据音频数据AD系统32位纠错校验16位分配位SBS选择SCFSI尺度因子子带取样（SBS）附加数据帧头帧头CRC音频数据音频数据AD系统32位纠错校验16位分配位SBS尺度因子子带取样（SBS）附加数据现在学习的是第34页，共39页6.3.2 MPEG音音频压缩编码标频压缩编码标准准子带分析滤

19、波器比特分配心理声学模型帧打包量化&编码数据流数据流32 32 子带子带边信息编码声音比特码流声音比特码流2 x32-192kb/s2 x32-192kb/s2 x 768 kb/s2 x 768 kb/s多相滤波器组：将 PCM 样本变换到 32 个子带的频域信号心理声学模型(Psychoacoustic Model)：计算信号中不可听觉感知的部分比特分配器：根据心理声学模型的计算结果，为每个子带信号分配比特数装帧：产生 MPEG-I 兼容的比特流现在学习的是第35页，共39页AC-3编码杜比AC-3编码是美国数字电视系统采用的音频编码方式，是与MPEG/Audio不同的编码格式，故不能实现

20、对MPEG/Audio的后向兼容，不过其它功能与MPEG/Audio大致相同。如就同步来说，因为含有MPEG系统的时间标志，故可与MPGE视频同步。AC-3系统的方框图如图12-9所示。6.3.3 杜比杜比AC-3数字音数字音频编码频编码现在学习的是第36页，共39页图6-11 AC-3编码器方框图6.3.3 杜比杜比AC-3数字音数字音频编码频编码谱包络（指数）编码尾数量化比特分配分析滤波器组AC-3帧格式形成PCM音频指数尾数比特分配信息AC-3码流编码的谱包络现在学习的是第37页，共39页6.4 数字音数字音频频广播广播音频广播的三个阶段：音频广播的三个阶段：1.调幅广播调幅广播(AM)2.调频广播调频广播(FM)3.数字音频广播数字音频广播DAB传送中波和短波频段窄，高音不丰富，音色较差频带较宽，声音比较丰富、逼真杂音较小以数字技术为基础可获得与原始信息相同质量的节目内容现在学习的是第38页，共39页6.4.1 数字音频广播的特点数字音频广播的特点DAB与模拟广播（AM/FM）相比有很多优点：音质纯净，声音质量高抗干扰能力强频带利用率高业务多样化，声色俱全、图文并茂多种数据业务，可实现交互功能现在学习的是第39页，共39页

展开阅读全文