《音频处理技术》PPT课件.ppt-淘文阁

资源描述

《《音频处理技术》PPT课件.ppt》由会员分享，可在线阅读，更多相关《《音频处理技术》PPT课件.ppt（156页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、普通高等教育普通高等教育“十一五十一五”国家级规划教材国家级规划教材多媒体技术及应用多媒体技术及应用赵英良赵英良冯博琴冯博琴崔舒宁崔舒宁清华大学出版社2009第第2章章音频处理技术音频处理技术1制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心简述简述n音频是多媒体技术中媒体的一种，由于音频音频是多媒体技术中媒体的一种，由于音频信号是一种连续变化的模拟信号，而计算机信号是一种连续变化的模拟信号，而计算机只能处理和记录二进制的数字信号，因此，只能处理和记录二进制的数字信号，因此，音频信号必须经过一定的变化和处理，变成音频信号必须经过一定的变化和处理，变成二进制数据后

2、才能送到计算机进行编辑和存二进制数据后才能送到计算机进行编辑和存储。储。2制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心2.1 声音的基本特性声音的基本特性 n音频信号所携带的信息大体上可分为语音、音频信号所携带的信息大体上可分为语音、音乐和音响三类。音乐和音响三类。u语音是指具有语言内涵和人类约定的特殊媒体；语音是指具有语言内涵和人类约定的特殊媒体；u音乐是规范的符号化了的声音；音乐是规范的符号化了的声音；u而音响指其他自然声音，如动物的叫声、机器的而音响指其他自然声音，如动物的叫声、机器的轰鸣声、风雨雷电声等轰鸣声、风雨雷电声等 3制作：西安交通大学制作：西安交

3、通大学计算机教学实验中心计算机教学实验中心1.音频信号的特征音频信号的特征 u机械振动或气流扰动引起周围弹性媒质发生波动，产生声波。产生机械振动或气流扰动引起周围弹性媒质发生波动，产生声波。产生声波的物体为声源声波的物体为声源(如人的声带、乐器等如人的声带、乐器等)，声波所及的空间范围称，声波所及的空间范围称为声场。声波传到人耳，经过人类听觉系统的感知就是为声场。声波传到人耳，经过人类听觉系统的感知就是声音声音。u声波可以用一条连续的曲线来表示，它在时间和幅度上都是连续的，声波可以用一条连续的曲线来表示，它在时间和幅度上都是连续的，称为称为模拟音频信号模拟音频信号。u在任一时刻，声波可以分解

4、成一系列正弦波的线性叠加：在任一时刻，声波可以分解成一系列正弦波的线性叠加：4制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心正弦波正弦波5制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心声音的物理特性声音的物理特性n周期周期/频率频率/带宽带宽 u两个相邻波之间的时间长度为两个相邻波之间的时间长度为周期周期T，单位为秒；单位为秒；u每秒钟声源振动的次数称为每秒钟声源振动的次数称为频率频率f，单位单位Hz；f=1/Tu描述组成复合信号的频率范围，称为描述组成复合信号的频率范围，称为带宽带宽。t振幅周期6制作：西安交通大学制作：西安交通大学

5、计算机教学实验中心计算机教学实验中心（1）声音的物理特性）声音的物理特性 n频率频率/周期周期/带宽带宽 u单位时间内声源振动的次数或空气中气压疏密变单位时间内声源振动的次数或空气中气压疏密变化的次数，称为声源的频率化的次数，称为声源的频率f，单位赫兹单位赫兹(Hz)u频带宽度或称之为带宽，它描述组成复合信号的频带宽度或称之为带宽，它描述组成复合信号的频率范围频率范围 7制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心u虽然高于虽然高于20kHz频率的声音人耳听不到，但由于频率的声音人耳听不到，但由于人的声学心理特性，可感觉到它的存在。因此，人的声学心理特性，可感觉到

6、它的存在。因此，有的音响产品的工作频率上限为有的音响产品的工作频率上限为50kHz，甚至调甚至调音台的最高工作频率设计到音台的最高工作频率设计到100kHz。u声音信号可被分解和复合，可以从中抽出若干个声音信号可被分解和复合，可以从中抽出若干个单一的正弦信号，也可以用若干个单一的正弦信单一的正弦信号，也可以用若干个单一的正弦信号来合成任意波形的复合信号，如合成语音和合号来合成任意波形的复合信号，如合成语音和合成音乐等成音乐等 8制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心声压和声强声压和声强u声波在空气媒质中是以空气中的分子振动形成疏密而传声波在空气媒质中是以空气

7、中的分子振动形成疏密而传播。它造成空气中的气压发生大小变化，相当于在无声播。它造成空气中的气压发生大小变化，相当于在无声波下空气中的气压上叠加一个变化的压强，叠加上的压波下空气中的气压上叠加一个变化的压强，叠加上的压强称为声压，记作强称为声压，记作P。单位有帕斯卡（单位有帕斯卡（Pa）和微巴和微巴（bar）。）。u引起人耳刚能听到声音时的声压称为引起人耳刚能听到声音时的声压称为可听阈可听阈u声波是由能量来维持传播的。如扬声器纸盆的振动是由声波是由能量来维持传播的。如扬声器纸盆的振动是由电能转换而来，因此声波有能量。电能转换而来，因此声波有能量。u单位时间内通过垂直于声波传播方向的单位面积内的声

8、单位时间内通过垂直于声波传播方向的单位面积内的声波能量为声场中某点的波能量为声场中某点的声强声强，记作，记作I，单位为瓦米单位为瓦米2（Wm2）。）。u声强与声压最大值的平方成正比关系。声强与声压最大值的平方成正比关系。9制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心u在无线电技术中常引用分贝在无线电技术中常引用分贝(dB)来表征电压、电来表征电压、电流、功率或放大器的放大能力。流、功率或放大器的放大能力。u在声学中引用分贝来表示声压或声强的变化程度在声学中引用分贝来表示声压或声强的变化程度。因为人的听觉神经的刺激程度不与刺激量大小成因为人的听觉神经的刺激程度不与刺

9、激量大小成正比，而是按刺激量以正比，而是按刺激量以10为底的对数增长为底的对数增长 10制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心11制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心动态范围动态范围 u声音的动态范围指声音的最大声压级和最小声压级之间声音的动态范围指声音的最大声压级和最小声压级之间的差值。的差值。u每种声源的动态范围依据各自的特性有所不同。每种声源的动态范围依据各自的特性有所不同。w如女声的动态范围为如女声的动态范围为2550dB，w男声为男声为3050dB，w交响乐队的动态范围大于交响乐队的动态范围大于100dB。u动

10、态范围不仅用来表示一个声源产生的最大声压级与最动态范围不仅用来表示一个声源产生的最大声压级与最小声压级之间的差值，录音设备或记录声音的载体小声压级之间的差值，录音设备或记录声音的载体(磁带、磁带、光盘、硬盘光盘、硬盘)同样可用动态范围表示能够处理信号电平的同样可用动态范围表示能够处理信号电平的范围。范围。w如磁带的动态范围为如磁带的动态范围为50dB60dB，wCD光盘光盘96dB，w磁光盘录放音机磁光盘录放音机105dB。12制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心u动态范围可以用信号的相对强度表示：动态范围可以用信号的相对强度表示：信号的动态范围信号的动态

11、范围=20lg(信号的最大强度信号的最小信号的最大强度信号的最小强度强度)(dB)u其中的信号可以用电压或功率衡量。其中的信号可以用电压或功率衡量。u因为是一种比例关系，故只要采用相同的度量单因为是一种比例关系，故只要采用相同的度量单位，其结果都是一致的。位，其结果都是一致的。13制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心频谱频谱 u物体在一定位置的附近作来回往复的运动，称为物体在一定位置的附近作来回往复的运动，称为简谐振动。简谐振动。u简谐振动会产生一个特定音调的纯音，听起来感简谐振动会产生一个特定音调的纯音，听起来感觉单薄。觉单薄。u乐器很少产生单一频率的纯

12、音，而是复音。乐器很少产生单一频率的纯音，而是复音。u复音的产生基于物体的复杂振动，可以分解为许复音的产生基于物体的复杂振动，可以分解为许多不同振幅和不同频率的简谐振动多不同振幅和不同频率的简谐振动(即看成简谐即看成简谐振动的叠加振动的叠加)。u简谐振动的振幅按频率排列的图形称为频谱简谐振动的振幅按频率排列的图形称为频谱。频。频谱可一目了然地看出复杂振动的频率结构。谱可一目了然地看出复杂振动的频率结构。14制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心u钢琴（基频为钢琴（基频为253Hz）的复音频谱的复音频谱 15制作：西安交通大学制作：西安交通大学计算机教学实验

13、中心计算机教学实验中心（2）声音的心理学特性）声音的心理学特性 n从声学心理角度，声音的三个要素是音调、从声学心理角度，声音的三个要素是音调、响度和音色。它们与声波的频率、声压和频响度和音色。它们与声波的频率、声压和频谱结构对应。谱结构对应。n音调音调u人对声音频率的感觉表现为音调的高低，在音乐人对声音频率的感觉表现为音调的高低，在音乐中称为音高。音调与基频的对数（中称为音高。音调与基频的对数（20lg）成）成线线性关系，单位为美（性关系，单位为美（mei）。）。基频越低，给人的基频越低，给人的感觉越低沉。基频频率增加一倍，音乐上称提高感觉越低沉。基频频率增加一倍，音乐上称提高了一个八度了一

14、个八度 16制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心频率与音调的关系频率与音调的关系 17制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心响度响度 u响度是人耳对声音强弱的感觉响度是人耳对声音强弱的感觉程度程度u虽然响度与衡量声音强弱的声虽然响度与衡量声音强弱的声压有一定关系，但与声压的大压有一定关系，但与声压的大小并不完全一致，也就是说声小并不完全一致，也就是说声压大的感觉不一定响。压大的感觉不一定响。n 由于人的由于人的外耳具有一定的耳道长度，耳道会对某段频外耳具有一定的耳道长度，耳道会对某段频率产生共鸣，使灵敏度提高。因此人耳

15、听到声音的响度率产生共鸣，使灵敏度提高。因此人耳听到声音的响度与声音的频率有关。描述响度、声压以及声源频率之间与声音的频率有关。描述响度、声压以及声源频率之间的关系曲线称为等响度曲线。的关系曲线称为等响度曲线。n 从曲线看出，当音量开到使声压级为从曲线看出，当音量开到使声压级为80 dB时，就可时，就可做到高低频声音丰满做到高低频声音丰满 18制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心音色音色n音色又称音品。通常说法是：声音的音调和音色又称音品。通常说法是：声音的音调和响度以外的音质差异叫做音色。响度以外的音质差异叫做音色。n声音的音色取决于该声音的频谱结构或是

16、频声音的音色取决于该声音的频谱结构或是频谱包络（声波曲线）。谱包络（声波曲线）。n高次谐波越丰富高次谐波越丰富,音色就越有明亮感和穿透力。音色就越有明亮感和穿透力。此外，音色还与诸多其他因素有关，如听音此外，音色还与诸多其他因素有关，如听音条件等。条件等。n它是一个主观量，常用柔和、刺耳、饱满等它是一个主观量，常用柔和、刺耳、饱满等词描述。词描述。19制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心掩蔽效应掩蔽效应n称听不到的声音为称听不到的声音为被掩蔽声被掩蔽声，而起掩蔽作用的声音，而起掩蔽作用的声音为为掩蔽声掩蔽声。n掩蔽效应的实质是掩蔽声的出现使人耳听觉的等响掩

17、蔽效应的实质是掩蔽声的出现使人耳听觉的等响度曲线的最小可听阈抬高。度曲线的最小可听阈抬高。n掩蔽效应的一般规律是强音压低音、低频率声音压掩蔽效应的一般规律是强音压低音、低频率声音压高频率。高频率。n利用掩蔽效应可以用有用信号去掩蔽无用的声信号，利用掩蔽效应可以用有用信号去掩蔽无用的声信号，只需要把无用声音的声压级降低到掩蔽阈以下即可。只需要把无用声音的声压级降低到掩蔽阈以下即可。n在数字音频处理中，还可以利用掩蔽效应去掉人耳在数字音频处理中，还可以利用掩蔽效应去掉人耳听不到的那部分信号进行声音数据的压缩。听不到的那部分信号进行声音数据的压缩。20制作：西安交通大学制作：西安交通大学计算机教学

18、实验中心计算机教学实验中心方位感方位感 n人凭借双耳在一定声学环境内能够对声源定位，这人凭借双耳在一定声学环境内能够对声源定位，这种能力来自于声源发出的声波到达双耳间的强度差、种能力来自于声源发出的声波到达双耳间的强度差、时间差以及耳廓时间差以及耳廓(外耳外耳)的阻挡。的阻挡。n声源到达听者耳朵的声音有两个，其中一个声音直声源到达听者耳朵的声音有两个，其中一个声音直接到达，而另一个由于人头部遮蔽，需绕过头部才接到达，而另一个由于人头部遮蔽，需绕过头部才能到达。称前者为直达声，而后者为绕射声。能到达。称前者为直达声，而后者为绕射声。n若有两个声源，增大其中一个声源的强度，由于该若有两个声源，增大

19、其中一个声源的强度，由于该声音源发出的直达声或绕射声的声压大于另一个声声音源发出的直达声或绕射声的声压大于另一个声源，双耳将会产生声压级差。使听者感受的声源源，双耳将会产生声压级差。使听者感受的声源（声像）位置向强度较大的声源方向移，使人感受（声像）位置向强度较大的声源方向移，使人感受到声音的立体感。到声音的立体感。21制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心空间感空间感 n一个声源发出的声音同时向各个方向散开，其发散一个声源发出的声音同时向各个方向散开，其发散的角度取决于声源所具有的指向性，发散的声波有的角度取决于声源所具有的指向性，发散的声波有一小部分直接

20、传给听者，而大部分会被空间表面反一小部分直接传给听者，而大部分会被空间表面反射，然后到达听者。由于直接和经反射到达听者的射，然后到达听者。由于直接和经反射到达听者的两个声音途径存在差别（取决于环境）而带来时间两个声音途径存在差别（取决于环境）而带来时间差。当时间差超过一定数量时，听者会听到先后到差。当时间差超过一定数量时，听者会听到先后到达的两个声音，从而产生达的两个声音，从而产生回音回音。经多次反射，造成。经多次反射，造成余声余声。即使声源已停止发声，但听者仍能听到声音。即使声源已停止发声，但听者仍能听到声音存在。存在。n回声与余音的感觉可使听者感受出房间体积大小、回声与余音的感觉可使听者感

21、受出房间体积大小、房间高低及内表面结构上的差异，这便是房间高低及内表面结构上的差异，这便是空间感空间感。22制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心2.音频信号的质量指标音频信号的质量指标 n(1)频带宽度频带宽度 u音频信号所包含的谐波分量越丰富，音色越好。音频信号所包含的谐波分量越丰富，音色越好。在广播通信和数字音响系统中，以声音信号所包在广播通信和数字音响系统中，以声音信号所包含的谐波分量的频率范围来衡量声音的质量，即含的谐波分量的频率范围来衡量声音的质量，即带宽。带宽。不同质量的声音的频带对比示意图不同质量的声音的频带对比示意图 23制作：西安交通大学

22、制作：西安交通大学计算机教学实验中心计算机教学实验中心(2)动态范围动态范围 n动态范围越大，说明音频信号强度的相对变动态范围越大，说明音频信号强度的相对变化范围越大，音响效果越好。化范围越大，音响效果越好。n动态范围一般用动态范围一般用dB为单位来计量。为单位来计量。uFM广播的动态范围约广播的动态范围约60dB，uAM广播的动态范围约广播的动态范围约40dB。uCDDA的动态范围约的动态范围约100dB，u数字电话约数字电话约50dB。24制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心(3)信噪比信噪比 n信噪比信噪比SNR(Signal Noise Rati

23、o)是有用信号与噪声是有用信号与噪声之比的简称，即有用信号的平均功率与噪声的平均之比的简称，即有用信号的平均功率与噪声的平均功率之比功率之比 n信噪比大，在一定程度上能够掩蔽噪声，从而获得信噪比大，在一定程度上能够掩蔽噪声，从而获得较好的声音效果。较好的声音效果。n信噪比不仅是声音设备的性能指标，在声音的录制信噪比不仅是声音设备的性能指标，在声音的录制和播放时，也要注意环境噪声。录制时应尽可能减和播放时，也要注意环境噪声。录制时应尽可能减小环境噪音。输出时应使音量适当大，以减少环境小环境噪音。输出时应使音量适当大，以减少环境噪音对听音的影响。噪音对听音的影响。n一般话筒和音箱的信噪比在一般话筒

24、和音箱的信噪比在75dB以上。声卡的信噪以上。声卡的信噪比在比在8595dB。25制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心22 数字音频数字音频 n1.声音的数字化声音的数字化 u数字化就是将连续信号变成离散信号。数字化就是将连续信号变成离散信号。u对音频信号，首先在时间上离散，取有限个时间对音频信号，首先在时间上离散，取有限个时间点，称为点，称为采样采样。u然后在幅度上离散，取有限个幅度值，称为然后在幅度上离散，取有限个幅度值，称为量化量化。u再将得到的数据表示成计算机容易识别的格式，再将得到的数据表示成计算机容易识别的格式，称为称为编码编码。26制作：西安

25、交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心(1)PCM编码编码 nPCM是一种把模拟信号转换成数字信号的最基本的编码方法，是一种把模拟信号转换成数字信号的最基本的编码方法，它主要包括采样、量化和编码它主要包括采样、量化和编码3个过程。个过程。u采样采样是每隔一定的时间测量一次声音信号的幅值，把时间连续的模拟是每隔一定的时间测量一次声音信号的幅值，把时间连续的模拟信号转换成时间离散、幅度连续的采样信号。如果采样的时间间隔信号转换成时间离散、幅度连续的采样信号。如果采样的时间间隔相等，这种采样称为均匀采样相等，这种采样称为均匀采样；u量化量化是按是按“四舍五入四舍五入”或其他

26、方法将采样得到的数值限定在几个有限或其他方法将采样得到的数值限定在几个有限的数值中，将采样信号转换成时间离散、幅度离散的数字信号；的数值中，将采样信号转换成时间离散、幅度离散的数字信号；u编码编码（coding）是将量化后的信号转换成一个二进制码组输出。比是将量化后的信号转换成一个二进制码组输出。比如，量化得到的数据中只会出现两个数值如，量化得到的数据中只会出现两个数值51和和80，则只用一位二进，则只用一位二进制的数表示即可，用制的数表示即可，用0表示表示51，用，用1表示表示80。若量化级别为。若量化级别为256（有（有256级量化数据），则可用级量化数据），则可用8位二进制数表示，这种编

27、码方法称为位二进制数表示，这种编码方法称为自自然编码然编码。27制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心模拟声音信号的采样和量化过程示意模拟声音信号的采样和量化过程示意 28制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心n例例2.1 设一个连续信号的波形可以表示为设一个连续信号的波形可以表示为 n设采样频率为设采样频率为21Hz，-10，10内的量化间内的量化间隔取为隔取为1，试计算出该信号，试计算出该信号0到到1秒内的量化数秒内的量化数据据(p29)。u。29制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中

28、心n设采样频率为设采样频率为21Hz，-10，10内的量化间内的量化间隔取为隔取为1，试计算出该信号，试计算出该信号0到到1秒内的量化数秒内的量化数据。据。n在在0-1秒内，取秒内，取21个采样点。在个采样点。在1、1/20、2/20、19/20、1秒时刻采样，将采样得秒时刻采样，将采样得到的数值取整，即得到量化数据。到的数值取整，即得到量化数据。30制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心表表2-1 连续波形的数字化连续波形的数字化序号序号采样点采样点采样数据采样数据量化量化值值序号序号采样点采样点采样数据采样数据量化值量化值 0 0.00

29、9.41421 9 11 0.55 -9.37474 -9 1 0.05 -7.66754 -8 12 0.60 4.73547 5 2 0.10 1.30867 1 13 0.65 -2.56445 -3 3 0.15 1.07930 1 14 0.70 0.40759 0 4 0.20 -3.46729 -3 15 0.75 6.34915 6 5 0.25 8.93433 9 16 0.80 -9.36672 -9 9 0.45 -1.63831 -2 20 1.00 4.40090 410 0.50 7.89216 8 31制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机

30、教学实验中心n对于对于CDDA，采样频率为，采样频率为44.1kHz，即每秒，即每秒取取44100个点。幅度的取值范围是限制在个点。幅度的取值范围是限制在216=65 536以内，量化间隔为以内，量化间隔为1，即量化幅度，即量化幅度可以取可以取65 536个不同的值，计算机中用个不同的值，计算机中用16位位的存储空间就可以表示一个量化后的数值。的存储空间就可以表示一个量化后的数值。动态范围为动态范围为201g(216)96dB32制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心PCM编码原理编码原理 n编码的过程首先用一组脉冲采样时钟信号与输入的编码的过程首先用一组脉

31、冲采样时钟信号与输入的模拟音频信号相乘，相乘的结果就是离散时间信号，模拟音频信号相乘，相乘的结果就是离散时间信号，然后对采样后的信号幅值进行量化。然后对采样后的信号幅值进行量化。n量化过程由量化器来完成。对经量化器量化过程由量化器来完成。对经量化器AD（模模/数）变换后的信号再进行编码，即把量化的信号电数）变换后的信号再进行编码，即把量化的信号电平转换成二进制码组，就得到了离散的二进制数据平转换成二进制码组，就得到了离散的二进制数据序列序列x(n)，n计算机对量化后的二进制数据可以用文件的形式存计算机对量化后的二进制数据可以用文件的形式存储、编辑和处理，并可还原成原始的模拟信号播放。储、编辑和

32、处理，并可还原成原始的模拟信号播放。还原的过程称为解码，它是还原的过程称为解码，它是AD变换的逆过程，即变换的逆过程，即DA(数数/模模)变换变换 33制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心PCM编码示意图编码示意图 PCM编码示意图编码示意图 34制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心(2)均匀量化和分均匀量化均匀量化和分均匀量化 u量化时，如果采用相等的量化间隔对采样得到的量化时，如果采用相等的量化间隔对采样得到的信号作量化，那么这种量化称为信号作量化，那么这种量化称为均匀量化均匀量化。均匀。均匀量化采用相同的量化采用

33、相同的“等分尺等分尺”来度量采样得到的幅来度量采样得到的幅度，也称为度，也称为线性量化线性量化.缺点缺点:不能充分利用为不能充分利用为适应幅度大的输适应幅度大的输入信号，增加的入信号，增加的样本的位数样本的位数.35制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心u非线性量化的思想是大的输入信号采用大的量化非线性量化的思想是大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔，间隔，小的输入信号采用小的量化间隔，u这样就可以在满足精度要求的情况下用较少的位这样就可以在满足精度要求的情况下用较少的位数来表示。声音数据还原时，采用相同的规则。数来表示。声音数据还原时

34、，采用相同的规则。36制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心n在非线性量化中，采样输入信号幅度和量化输出数在非线性量化中，采样输入信号幅度和量化输出数据之间定义了两种对应关系：一种称为据之间定义了两种对应关系：一种称为律压扩算律压扩算法；一种成为法；一种成为A律压扩算法。律压扩算法。n非均匀量化的实现方法通常是将抽样值通过压缩再非均匀量化的实现方法通常是将抽样值通过压缩再进行均匀量化。所谓压缩就是实际上是对大信号进进行均匀量化。所谓压缩就是实际上是对大信号进行压缩而对小信号进行较大的放大的过程。信号经行压缩而对小信号进行较大的放大的过程。信号经过这种非线性压

35、缩电路处理后，改变了大信号和小过这种非线性压缩电路处理后，改变了大信号和小信号之间的比例关系，使大信号的比例基本不变或信号之间的比例关系，使大信号的比例基本不变或变得较小，而小信号相应地按比例增大，即变得较小，而小信号相应地按比例增大，即“压大压大补小补小”。37制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心律压扩律压扩 n律律(-Law)压扩主要用在北美和日本等地压扩主要用在北美和日本等地区的数字电话通信中，按下面的式子确定量区的数字电话通信中，按下面的式子确定量化输入和输出的关系化输入和输出的关系 (3)38制作：西安交通大学制作：西安交通大学计算机教学实验中

36、心计算机教学实验中心(4)A律律(A-Law)nA律律(A-Law)压扩主要用在欧洲和中国大陆等压扩主要用在欧洲和中国大陆等地区的数字电话通信中，按下面的式子确定地区的数字电话通信中，按下面的式子确定量化输入和输出的关系量化输入和输出的关系 39制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心举例举例n对于采样频率为对于采样频率为8kHz，样本精度为样本精度为13位、位、14位位或者或者16位的输入信号，使用位的输入信号，使用律压扩编码或者使律压扩编码或者使用用A律压扩编码，经过律压扩编码，经过PCM编码器之后每个样本编码器之后每个样本需需8位二进制存储，输出的数据率

37、为位二进制存储，输出的数据率为64 kb/s。n这个数据就是这个数据就是CCITT推荐的推荐的G.711标准：标准：话音频话音频率脉冲编码调制率脉冲编码调制。40制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心2.数字音频的技术指标数字音频的技术指标 n(1)采样频率采样频率u采样频率是指一秒钟采样的次数。采样频率越高，采样频率是指一秒钟采样的次数。采样频率越高，单位时间内采集的样本数越多，得到波形越接近单位时间内采集的样本数越多，得到波形越接近于原始波形，音质就越好。于原始波形，音质就越好。u根据奈奎斯特根据奈奎斯特(Harry Nyquist)采样理论：采样理论：

38、如果如果采样频率高于输入信号最高频率的两倍，重放时采样频率高于输入信号最高频率的两倍，重放时就能从采样信号序列无失真地重构原始信号就能从采样信号序列无失真地重构原始信号。例例如，电话话音的信号频率约为如，电话话音的信号频率约为3.4 kHz，若采样若采样频率选为频率选为8kHz，就能无失真地重放原始声音。就能无失真地重放原始声音。41制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心n采样的采样的3个常用频率分别为个常用频率分别为u11.025kHzAM广播广播u22.05kHz FM广播广播u44.1kHz CD高保真音质声音高保真音质声音n现在声卡的采样频率一般为现

39、在声卡的采样频率一般为48kHz甚至甚至96kHz。42制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心（2）采样精度采样精度 n采样精度用每个声音样本的位数表示，也叫采样精度用每个声音样本的位数表示，也叫样本精样本精度度或或量化位数量化位数。它反映度量声音波形幅度的精度。它反映度量声音波形幅度的精度。u例如，每个声音样本用例如，每个声音样本用16位表示，则量化样本值在位表示，则量化样本值在065535的整数范围内，它的精度是输入信号的的整数范围内，它的精度是输入信号的1/65536 n采样精度决定了模拟信号数字化以后的动态范围采样精度决定了模拟信号数字化以后的动态范

40、围。u若以若以8位量化，则其波形的幅值可分为位量化，则其波形的幅值可分为28=256等份，等效等份，等效的动态范围为的动态范围为20lg(256)=48dB。若以若以16位采样，则可位采样，则可分为分为216=65536等份，等效动态范围为等份，等效动态范围为20lg(65536)=96dB。n采样精度影响到声音的质量采样精度影响到声音的质量u位数越多，声音的质量越高，而需要的存储空间也越多；位数越多，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。位数越少，声音的质量越低，需要的存储空间越少。43制作：西安交通大学制作：西安交通大学计算机教学实验中心计

41、算机教学实验中心（3）声道数）声道数 u单单声声道道(mono)信信号号一一次次产产生生一一组组声声波波数数据据。如如果果一一次次产产生两组声波数据，则称其为双声道或立体声生两组声波数据，则称其为双声道或立体声(stereo)。u双双声声道道在在硬硬件件中中占占两两条条线线路路，一一条条是是左左声声道道，一一条条是是右右声道。声道。u立立体体声声不不仅仅音音质质、音音色色好好，而而且且能能产产生生逼逼真真的的空空间间感感。但立体声数字化后所占空间比单声道多一倍。但立体声数字化后所占空间比单声道多一倍。u除除采采样样频频率率、采采样样精精度度、声声道道数数影影响响声声音音质质量量外外，声声音音录

42、录制制时时环环境境噪噪声声、声声卡卡内内部部噪噪声声以以及及采采样样数数据据丢丢失失等等都都会会造造成成声声音音质质量量的的下下降降。实实际际收收听听时时，音音响响（功功率率放放大大器、扬声器等）的质量对音质的表现也起很大作用器、扬声器等）的质量对音质的表现也起很大作用44制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心（4）音频数据传输率）音频数据传输率 u音频信号数字化后，产生大量数据音频信号数字化后，产生大量数据 u产生数据的速度或播放声音时需要传输数据的速产生数据的速度或播放声音时需要传输数据的速度影响声音的播放质量。数据传输率用每秒钟传度影响声音的播放质量。

43、数据传输率用每秒钟传输的数据位数表示，记为输的数据位数表示，记为bps（bit per second）。）。未经压缩的数字音频数据传输率为未经压缩的数字音频数据传输率为:w数据传输率数据传输率(bits)=采样频率采样频率(Hz)量化位数量化位数(bit)声道数声道数 45制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心声音质量和数字化指标声音质量和数字化指标质量质量采样频率采样频率(kHz)样本精度样本精度(bit)单道声单道声/立体声立体声数据率数据率(kB/s)(未压缩未压缩)频率范围频率范围电话电话*88单道声单道声82003 400 HzAM11.0258

44、单道声单道声11.0507 000HzFM22.05016立体声立体声88.22015 000HzCD44.116立体声立体声176.42020 000 HzDAT4816立体声立体声192.02020 000 Hz46制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心n例例2.22.2 高保真立体声数字音频的量化位数为高保真立体声数字音频的量化位数为1616，试计算其，试计算其数据传输率数据传输率 u解：高保真立体声数字音频采样频率为解：高保真立体声数字音频采样频率为44.1kHz44.1kHz，双声道，其数据传输率为双声道，其数据传输率为 u数据传输率数据传输率=4

45、4.1(kHz)16(bit)2(channel)=1411.2(kbps)=44.1(kHz)16(bit)2(channel)=1411.2(kbps)n如果采用如果采用PCMPCM编码，数字音频文件所占用的空编码，数字音频文件所占用的空间可用如下的公式计算间可用如下的公式计算(数据量数据量)：u音频数据量（音频数据量（ByteByte）=数据传输率数据传输率持续时间持续时间8(bit/Byte)8(bit/Byte)n其中数据量以字节其中数据量以字节(Byte)(Byte)为单位；数据传输率以每秒比特为单位；数据传输率以每秒比特(bps)(bps)为单位；持续时间以秒为单位；持续时间以秒

46、(s)(s)为单位。为单位。47制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心n例例2.32.3 计算计算1 1分钟未经压缩的高保真立体声数分钟未经压缩的高保真立体声数字声音文件的大小。字声音文件的大小。u解：高保真立体声数字音频采样频率为解：高保真立体声数字音频采样频率为44.1kHz44.1kHz，1616位量化，双声道，其数据传输率为：位量化，双声道，其数据传输率为：u数据传输率数据传输率=44.1(kHz)16(bit)2(channel)=1411.2(kbps)=44.1(kHz)16(bit)2(channel)=1411.2(kbps)u1 1分钟这

47、样的声音文件的大小为分钟这样的声音文件的大小为 u音频数据量音频数据量=1411.2=1411.2（kb/skb/s）6060（s s）/8(bit/Byte)=10458kB/8(bit/Byte)=10458kBn未经压缩的未经压缩的4 4分钟的歌曲文件约分钟的歌曲文件约42M42M数据，数据，128M128M的的MP3MP3播放器只能存放播放器只能存放3 3首这样的歌曲首这样的歌曲 48制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心（5）编码）编码算法与音频数据压缩比算法与音频数据压缩比 u未压缩的音频数据量非常大，因此在编码的时候未压缩的音频数据量非常大，因

48、此在编码的时候常常要采用压缩的方式。常常要采用压缩的方式。u实际上，编码的作用一是记录数字数据，二是采实际上，编码的作用一是记录数字数据，二是采用一定的算法来压缩数据以减少存储空间和提高用一定的算法来压缩数据以减少存储空间和提高传输效率。传输效率。u压缩编码的基本指标之一就是压缩比，一般为数压缩编码的基本指标之一就是压缩比，一般为数据压缩前后的数据量之比据压缩前后的数据量之比49制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心n采用不同的数字化指采用不同的数字化指标实际标实际上也是上也是进进行了不同比例行了不同比例的数据的数据压缩压缩。u如果如果PCMPCM编码编码采

49、用采用4bit4bit量化量化对对CDCD音音质质信号信号压缩压缩，其，其压缩压缩比比为为4:14:1。这这种情况下，用来种情况下，用来记录记录幅幅值值的比特位越少，的比特位越少，编码编码后数据量就越小，后数据量就越小，压缩压缩比越比越大大。但。但压缩压缩比越比越大大，丢丢掉的掉的信息就会越多，信号信息就会越多，信号还还原后失真就越大。原后失真就越大。(对有损压缩对有损压缩)n压缩压缩算法包括有算法包括有损压缩损压缩和无和无损压缩损压缩；u有有损压缩损压缩解解压压后数据不能完全复原，要后数据不能完全复原，要丢丢失一部分信息。失一部分信息。u无无损压缩损压缩不不丢丢失任何信息，能失任何信息，能较

50、较好地复原原始信号好地复原原始信号50制作：西安交通大学制作：西安交通大学计算机教学实验中心计算机教学实验中心3.3.数字音频文件格式数字音频文件格式 n数字声音文件格式是数字音频在磁盘文件中的存放数字声音文件格式是数字音频在磁盘文件中的存放形式，相同的数据可以有不同的文件格式，而不同形式，相同的数据可以有不同的文件格式，而不同的数据也可以有相同的文件格式的数据也可以有相同的文件格式.u(1)WAVEWAVE文件格式文件格式 wWAVEWAVE文件是一种通用的音文件是一种通用的音频频数据文件，文件数据文件，文件扩扩展名展名为为“WAVWAV”，WindowsWindows系系统统和一般的音和

展开阅读全文