声音及其处理幻灯片.ppt-淘文阁

资源描述

《声音及其处理幻灯片.ppt》由会员分享，可在线阅读，更多相关《声音及其处理幻灯片.ppt（102页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、声音及其处理声音及其处理第1页，共102页，编辑于2022年，星期五声音处理技术声音处理技术1 声音概念声音概念2 音频编码与文件类型音频编码与文件类型3 音频获取技术音频获取技术4 音频编辑软件音频编辑软件5 MIDI原理与应用原理与应用第2页，共102页，编辑于2022年，星期五1 声音概念声音概念1.1 声音信号声音信号1.2 听觉感知特征听觉感知特征1.3 多声道声音多声道声音第3页，共102页，编辑于2022年，星期五1.1 声音信号声音信号声声音音是是压压力力发发生生快快速速变变化化的的现现象象，空空气气的的大大气气压压力力保保持持着着恒恒定定不不变变的的某某种种状状态态时时就就没

2、没有有声声音音了了。压压力力变变化化传传播播到到我我们们的的耳耳朵朵时，我们就听到了声音。时，我们就听到了声音。当当空空气气压压力力发发生生百百万万分分之之一一的的变变换换时时人人的的耳耳朵朵就就能能听听到到声声音音，空空气气的的震震荡荡快快于于每每秒秒2020次次、且且慢慢于于每每秒秒2 2万万次次时时，人人耳耳可可以以感感知知其其振动，听到声音。振动，听到声音。第4页，共102页，编辑于2022年，星期五1.1 声音信号声音信号空气的振动引发声波，声波进入人耳，到达鼓膜，使鼓膜发生振动。空气的振动引发声波，声波进入人耳，到达鼓膜，使鼓膜发生振动。鼓膜的振动通过耳小骨和淋巴液传递到鼓膜的振动

3、通过耳小骨和淋巴液传递到“基底膜基底膜”，最终引起有毛，最终引起有毛细胞的纤毛振动，变成神经细胞信号。这种信号传递到大脑，我们细胞的纤毛振动，变成神经细胞信号。这种信号传递到大脑，我们便感知到了声音信号。大脑对声音信号进行解读，人就获得了听觉便感知到了声音信号。大脑对声音信号进行解读，人就获得了听觉信息。信息。第5页，共102页，编辑于2022年，星期五人耳的结构第6页，共102页，编辑于2022年，星期五1.1 声音信号声音信号空气的振动引发声波，声波进入人耳，到达鼓膜，使鼓膜发生振空气的振动引发声波，声波进入人耳，到达鼓膜，使鼓膜发生振动。鼓膜的振动通过耳小骨和淋巴液传递到动。鼓膜的振动

4、通过耳小骨和淋巴液传递到“基底膜基底膜”，最终引，最终引起有毛细胞的纤毛振动，变成神经细胞信号。这种信号传递到大脑，起有毛细胞的纤毛振动，变成神经细胞信号。这种信号传递到大脑，我们便感知到了声音信号。大脑对声音信号进行解读，人就获得了我们便感知到了声音信号。大脑对声音信号进行解读，人就获得了听觉信息。听觉信息。第7页，共102页，编辑于2022年，星期五1.1 声音信号声音信号正在发声的物体叫声源，声源产生声波。正在发声的物体叫声源，声源产生声波。声波是纵波。声波是纵波。只含有一种震荡频率的波产生的声音叫单音。只含有一种震荡频率的波产生的声音叫单音。更更过过情情况况下下，许许多多不不同同频频率

5、率、不不同同幅幅度度的的声声波波同同时时存存在在，发发生叠加，这样的声波产生的声音是复合音。生叠加，这样的声波产生的声音是复合音。第8页，共102页，编辑于2022年，星期五声音的波形 1.1 声音信号声音信号第9页，共102页，编辑于2022年，星期五1.1 声音信号声音信号声声波波具具有有普普通通波波的的物物理理特特征征，可可以以发发生生折折射射、反反射射、衍衍射射等等物理过程。物理过程。声波具有连续性，是模拟信号。声波具有连续性，是模拟信号。第10页，共102页，编辑于2022年，星期五1.1 声音信号声音信号声音的基本听觉特征有三：声音的基本听觉特征有三：响度(loudness)音调(

6、pitch)音色(music quality)第11页，共102页，编辑于2022年，星期五1.1 声音信号声音信号响响度度是是人人主主观观上上感感觉觉声声音音的的大大小小，由由声声波波的的振振幅幅决决定定，振振幅幅越越大大响度越大。响度的单位是分贝响度越大。响度的单位是分贝(dB)(dB)。当当声声音音弱弱到到人人耳耳刚刚刚刚能能听听到到时时的的声声音音响响度度为为“听听阈阈”，听听阈阈是是随随频频率率而而改改变变的的，不不同同频频率率的的听听阈阈值值不不同同。另另一一种种极极端端的的情情况况是是声声音音太太响，使人耳感到疼痛。响，使人耳感到疼痛。当当声声音音的的频频率率为为3-5KHz3-

7、5KHz时时，听听阈阈数数值值最最小小。此此时时人人耳耳对对声声音音非非常常敏感。敏感。第12页，共102页，编辑于2022年，星期五1.1 声音信号声音信号人耳可听最小响度曲线第13页，共102页，编辑于2022年，星期五1.1 声音信号声音信号音音调调是是声声音音的的高高低低，由由频频率率决决定定同同时时也也与与声声音音强强度度有有关关。人人耳耳听听觉范围是觉范围是202020000 Hz20000 Hz，人的发声频率约为，人的发声频率约为858511000Hz11000Hz。对一定强度的纯音，音调随频率的升降而升降；对一定强度的纯音，音调随频率的升降而升降；对对一一定定频频率率的的纯纯

8、音音、低低频频纯纯音音，音音调调随随声声强强增增加加而而下下降降，高高频频纯纯音音的音调随强度增加而上升。的音调随强度增加而上升。第14页，共102页，编辑于2022年，星期五1.1 声音信号声音信号低低于于2000Hz2000Hz纯纯音音的的音音调调随随强强度度的的增增加加而而下下降降，高高于于3000Hz3000Hz纯纯音音的音调随强度的增加而上升。的音调随强度的增加而上升。音调的单位是美音调的单位是美(mel)(mel)。取取频频率率1000Hz1000Hz、声声压压级级为为4040分分贝贝的的纯纯音音的的音音调调作作标标准准，称称为为10001000美美。另另由由一一个个纯纯音音，听听

9、起起来来音音调调高高一一倍倍，称称为为20002000美美，调调子子低低一一倍倍的的称称为为500500美美，由由此此可可建建立立起起整整个个可可听听频频率率内内的的音音调调标度。标度。第15页，共102页，编辑于2022年，星期五1.1 声音信号声音信号音调还与声音持续时间长短有关。音调还与声音持续时间长短有关。非非常常短短促促(毫毫秒秒级级或或更更短短)的的纯纯音音，只只能能听听到到像像打打击击或或弹弹指指那那样样的的“喀嚓喀嚓”一响，感觉不出音调。一响，感觉不出音调。持持续续时时间间10-5010-50毫毫秒秒时时，听听起起来来觉觉得得音音调调是是由由低低到到高高连连续续变变化化的。的。

10、超过超过5050毫秒时，音调就稳定不变了。毫秒时，音调就稳定不变了。乐乐音音(复复音音)的的音音调调更更复复杂杂些些，一一般般可可认认为为主主要要由由基基音音的的频频率率来来决决定。定。第16页，共102页，编辑于2022年，星期五1.1 声音信号声音信号音音调调控控制制就就是是人人为为地地改改变变信信号号里里高高、低低频频成成分分的的比比重重，以以满满足足听听者者的的爱爱好好、渲渲染染某某种种气气氛氛、达达到到某某种种效效果果、补补偿偿扬扬声器系统及放音场所的音响不足等目标。声器系统及放音场所的音响不足等目标。第17页，共102页，编辑于2022年，星期五1.1 声音信号声音信号音音色色：发

11、发音音体体振振动动的的基基本本频频率率称称基基音音，此此外外还还伴伴随随有有许许多多更高频率的、振幅较小的声音谐波，称泛音。更高频率的、振幅较小的声音谐波，称泛音。泛音的多寡及泛音之间的相对强度决定了特定的音色。泛音的多寡及泛音之间的相对强度决定了特定的音色。音色是音乐中极为吸引人、能直接触动感官的重要表现手段。音色是音乐中极为吸引人、能直接触动感官的重要表现手段。人耳具有很好的区分音色的能力。人耳具有很好的区分音色的能力。第18页，共102页，编辑于2022年，星期五1.1 声音信号声音信号音音色色不不同同，即即使使在在同同一一音音高高和和同同一一声声音音强强度度的的情情况况下下，也也能区分

12、出是不同的声音。能区分出是不同的声音。可可以以认认为为声声音音包包含含乐乐音音和和噪噪音音，乐乐音音由由源源音音和和节节拍拍构构成成，源源音音的的特特征征有有音音调调、响响度度和和音音色色，音音色色由由纯纯音音、变变换换和和混混合合方方式式决决定。定。第19页，共102页，编辑于2022年，星期五1.1 声音信号声音信号波波形形和和音音色色密密切切相相关关，确确定定的的波波形形具具有有确确定定的的音音色色。而而同同一一种种音色可能有多种波形。音色可能有多种波形。两两个个截截然然不不同同的的波波形形，但但频频谱谱却却是是一一样样的的，因因为为频频谱谱关关系系不不表表示示波波形的相位。形的相位。人

13、人的的听听觉觉对对相相位位没没有有感感觉觉，所所以以这这两两种种不不同同波波形形声声音音听听上上去去可可能能是一样的。是一样的。第20页，共102页，编辑于2022年，星期五1.1 声音信号声音信号声音质量的评价是一个很困难的问题。声音质量两种基本的度量声音质量的评价是一个很困难的问题。声音质量两种基本的度量方法：客观质量度量和主观质量度量。方法：客观质量度量和主观质量度量。声音客观质量主要用信噪比（声音客观质量主要用信噪比（Signal to Noise RatioSignal to Noise Ratio，SNRSNR）来度量。）来度量。主观质量评价最常用的方法是主观质量评价最常用的方法是

14、MOSMOS（Mean Opinion ScoreMean Opinion Score，平均意，平均意见得分）。见得分）。第21页，共102页，编辑于2022年，星期五1.2听觉感知特征听觉感知特征人的听觉系统非常复杂人的听觉系统非常复杂人耳听觉感知还受到心理因素的很大影响。人耳听觉感知还受到心理因素的很大影响。人耳对响度、音高的感知特征和掩蔽效应可以直接应用于声人耳对响度、音高的感知特征和掩蔽效应可以直接应用于声音数据的压缩编码过程。音数据的压缩编码过程。第22页，共102页，编辑于2022年，星期五1.2听觉感知特征听觉感知特征1 1对响度的感知对响度的感知声音的响度就是声音的强弱。声音的

15、响度就是声音的强弱。在物理上，声音的响度使用达因在物理上，声音的响度使用达因/平方厘米平方厘米(声压声压)或瓦特或瓦特/平方厘平方厘米米(声强声强)的单位进行客观测量。的单位进行客观测量。心理上主观感觉声音强弱使用响度级心理上主观感觉声音强弱使用响度级“phon”phon”或或“sone”sone”来度量。来度量。以上这两种感知声音强弱的测量概念完全不同，但又有一定的以上这两种感知声音强弱的测量概念完全不同，但又有一定的联系。联系。听阈：当声音弱到人的耳朵刚刚可闻时的声音强度。听阈：当声音弱到人的耳朵刚刚可闻时的声音强度。痛阈：声音强到使人耳感到疼痛。痛阈：声音强到使人耳感到疼痛。在在“听阈听

16、阈频率频率”曲线和曲线和“痛阈痛阈频率频率”曲线之间的区域是人耳的曲线之间的区域是人耳的听觉范围。听觉范围。第23页，共102页，编辑于2022年，星期五“听阈听阈频率频率”曲线曲线第24页，共102页，编辑于2022年，星期五1.2听觉感知特征听觉感知特征2.2.对音高的感知对音高的感知客观上用频率来表示声音的音高，其单位是客观上用频率来表示声音的音高，其单位是HzHz。主观感觉的音高单。主观感觉的音高单位则是位则是“Mel”Mel”。测量音高时以测量音高时以40dB40dB声强为基准，并由主观感觉来确定。声强为基准，并由主观感觉来确定。测量主观音高时，让实验者听两个声强级为测量主观音高时，

17、让实验者听两个声强级为40dB40dB的纯音，固的纯音，固定其中一个纯音的频率，调节另一个纯音的频率，直到他感到后定其中一个纯音的频率，调节另一个纯音的频率，直到他感到后者的音高为前者的两倍，就标定这两个声音的音高差为两倍。者的音高为前者的两倍，就标定这两个声音的音高差为两倍。第25页，共102页，编辑于2022年，星期五“音高音高频率频率”曲线曲线第26页，共102页，编辑于2022年，星期五1.2听觉感知特征听觉感知特征3 3声音的掩蔽效应声音的掩蔽效应（1 1）频域掩蔽）频域掩蔽对于频率相近的声音，响度高的阻碍另一个响度较低声音的听对于频率相近的声音，响度高的阻碍另一个响度较低声音的听觉

18、感知的现象，称为频域掩蔽效应。觉感知的现象，称为频域掩蔽效应。（2 2）时域掩蔽）时域掩蔽当声音与其回声之间时间差很小时，回声是听不到的。这说明，在当声音与其回声之间时间差很小时，回声是听不到的。这说明，在时间上相邻的声音之间有掩蔽现象，称为时域掩蔽。时间上相邻的声音之间有掩蔽现象，称为时域掩蔽。第27页，共102页，编辑于2022年，星期五频域隐蔽频域隐蔽第28页，共102页，编辑于2022年，星期五时域掩蔽时域掩蔽第29页，共102页，编辑于2022年，星期五1.2听觉感知特征听觉感知特征（3 3）声音感知特性与）声音感知特性与MPEGMPEG声音编码声音编码MPEGMPEG声音编码指声音

19、编码指MPEG-1 AudioMPEG-1 Audio、MPEG-2 AudioMPEG-2 Audio和和MPEG-2 AACMPEG-2 AAC声音声音编码。编码。MPEGMPEG声音编码进行数据压缩编码的主要依据是人耳朵的听觉特声音编码进行数据压缩编码的主要依据是人耳朵的听觉特性，据此建立性，据此建立“心理声学模型心理声学模型”。心理声学模型的一个基本依据是听觉系统中存在一个听觉阈值电心理声学模型的一个基本依据是听觉系统中存在一个听觉阈值电平，低于这个电平的声音信号听不见平，低于这个电平的声音信号听不见(即响度太小的声音听不见即响度太小的声音听不见)，因此就可以把这部分声音信号去掉。，因

20、此就可以把这部分声音信号去掉。心理声学模型的另一个基本依据是听觉掩饰特性，据此对听觉心理声学模型的另一个基本依据是听觉掩饰特性，据此对听觉阈值电平进行自适应调节。声音压缩算法确立这种特性的模型，阈值电平进行自适应调节。声音压缩算法确立这种特性的模型，用以消除声音数据的冗余，实现数据压缩。用以消除声音数据的冗余，实现数据压缩。第30页，共102页，编辑于2022年，星期五1.3 多声道声音多声道声音人类的耳朵能够判别出声波到达左右耳的相对时差和音强，能人类的耳朵能够判别出声波到达左右耳的相对时差和音强，能够判别声音的来源。够判别声音的来源。对于多声道声音，不仅能产生更多的声音细节，还能感知到音源

21、对于多声道声音，不仅能产生更多的声音细节，还能感知到音源的位置、位置移动、变化、音源距离等情况，有关声音在声场空的位置、位置移动、变化、音源距离等情况，有关声音在声场空间中产生的效果，也称为三维音效。间中产生的效果，也称为三维音效。多声道系统之所以能够产生如此的听音效果是由人耳听音特征和耳多声道系统之所以能够产生如此的听音效果是由人耳听音特征和耳轮结构所决定的。轮结构所决定的。人的双耳在听到声音的同时，还能识别出某个声源与人的左右耳距人的双耳在听到声音的同时，还能识别出某个声源与人的左右耳距离的差异造成的时间差异，识别出声音到达左右耳时的强度差别。离的差异造成的时间差异，识别出声音到达左右耳时

22、的强度差别。第31页，共102页，编辑于2022年，星期五1.3 多声道声音多声道声音耳间时间差和耳间强度差是人耳声音定位的主要线索。耳间时间差和耳间强度差是人耳声音定位的主要线索。三维音效产生过程中耳廓也起到了重要作用。三维音效产生过程中耳廓也起到了重要作用。实际应用中，常见的多声道音频系统是实际应用中，常见的多声道音频系统是5.15.1声道和声道和7.17.1声道系统。声道系统。第32页，共102页，编辑于2022年，星期五1.3 多声道声音多声道声音5.1声道系统声道系统第33页，共102页，编辑于2022年，星期五1.3 多声道声音多声道声音7.1声道系统声道系统第34页，共102页，

23、编辑于2022年，星期五1.3 多声道声音多声道声音3 3环绕音效环绕音效环绕音效使聆听者感到声音是来自四面八方的，聆听者获得环绕音效使聆听者感到声音是来自四面八方的，聆听者获得被四面八方的声音包围的感觉。被四面八方的声音包围的感觉。环绕音效大多都是用于观赏电影之用。环绕音效大多都是用于观赏电影之用。DVDDVD需要需要5.15.1声道系统要将影片中的音场效果表现出来。声道系统要将影片中的音场效果表现出来。电子游戏中使用电子游戏中使用5.15.1声道系统产生音效来实现定位等声道系统产生音效来实现定位等3 3维音效。维音效。Dolby Digital 5.1Dolby Digital 5.1，即

24、杜比数码是美国杜比实验室开发的环绕，即杜比数码是美国杜比实验室开发的环绕音效技术。音效技术。第35页，共102页，编辑于2022年，星期五1.3 多声道声音多声道声音DTS(Digital Theater System)DTS(Digital Theater System)数字剧院系统也是广为应用的多声道数字剧院系统也是广为应用的多声道音效技术。音效技术。THXTHX是美国导演乔治是美国导演乔治.卢卡斯提出的电影院声音播放技术标准。卢卡斯提出的电影院声音播放技术标准。第36页，共102页，编辑于2022年，星期五1.3 多声道声音多声道声音Hi-FiHi-Fi高保真系统高保真系统Hi-Fi(H

25、igh-Fidelity)Hi-Fi(High-Fidelity)高保真是指高保真是指“与原来的声音高度相似地重与原来的声音高度相似地重放声音放声音”，目前尚没有严格定义。，目前尚没有严格定义。Hi-FiHi-Fi无止境。无止境。第37页，共102页，编辑于2022年，星期五2 音频编码与文件类型音频编码与文件类型2.1 音频编码音频编码2.2 常见音频文件格式常见音频文件格式第38页，共102页，编辑于2022年，星期五2.1 音频编码音频编码1.MPEG-11.MPEG-1音频编码音频编码MPEG-1MPEG-1音频编码依靠心理声学模型进行数据压缩编码音频编码依靠心理声学模型进行数据压缩编

26、码MPEG-1MPEG-1将声音中听不清或听不到的那些声音信息所对应的数据去除将声音中听不清或听不到的那些声音信息所对应的数据去除掉，使得声音数据得以压缩。掉，使得声音数据得以压缩。心理声学模型对数据压缩率和编码后的声音质量起着关键作用。心理声学模型对数据压缩率和编码后的声音质量起着关键作用。MPEG-1MPEG-1是有损音频压缩编码是有损音频压缩编码MPEG-1MPEG-1编码器编码器(数据压缩数据压缩)、解码器、解码器(解压缩、播放解压缩、播放)可以使用硬可以使用硬件或软件实现。件或软件实现。第39页，共102页，编辑于2022年，星期五2.1 音频编码音频编码2 2MPEG-2MPEG-

27、2音频编码音频编码MPEG-2MPEG-2标准委员会定义了两种音频数据压缩编码，一种为标准委员会定义了两种音频数据压缩编码，一种为MPEG-MPEG-2 Audio2 Audio，另一种为，另一种为MPEG-2 AACMPEG-2 AAC。MPEG-2 AudioMPEG-2 Audio与与MPEG-1 AudioMPEG-1 Audio兼容兼容MPEG-2 AAC(Advanced Audio Coding)MPEG-2 AAC(Advanced Audio Coding)与与MPEG-1MPEG-1声音编码不兼容，声音编码不兼容，又称为非后向兼容又称为非后向兼容MPEG-2 NBC(Non

28、-BC)MPEG-2 NBC(Non-BC)标准。标准。AACAAC标准定义了三种配置：基本配置、低复杂性配置和可变采样率标准定义了三种配置：基本配置、低复杂性配置和可变采样率配置。配置。第40页，共102页，编辑于2022年，星期五2.1 音频编码音频编码3 3MPEG-4MPEG-4音频编码音频编码MPEG-4 AudioMPEG-4 Audio标准可集成从话音到高质量的多通道声音，从自标准可集成从话音到高质量的多通道声音，从自然声音到合成声音。然声音到合成声音。（1 1）自然声音编码）自然声音编码（2 2）参数编码器）参数编码器（3 3）编码激励的线性预测编码器）编码激励的线性预测编码器

29、CELPCELP（4 4）T/FT/F编码器编码器（5 5）新型的结构音频标准）新型的结构音频标准(合成语音编码合成语音编码)（6 6）合成）合成/自然混合编码自然混合编码第41页，共102页，编辑于2022年，星期五2.1 音频编码音频编码Dolby AC-3Dolby AC-3编码编码杜比公司杜比公司19681968年成立，年成立，DolbyDolby音频数据编码是他的核心技术和产品。音频数据编码是他的核心技术和产品。Dolby AC3Dolby AC3编码的动态范围至少可达编码的动态范围至少可达20bit20bit，频响范围为，频响范围为20Hz-20Hz-20kHz0.3dB20kHz

30、0.3dB，低音通道的频响范围为，低音通道的频响范围为20-120Hz 0.3dB20-120Hz 0.3dB。采样。采样频率可为频率可为32kHz32kHz、44kHz44kHz或或48kHz48kHz，比特率可变。典型值为，比特率可变。典型值为384 384 kbps(5.1kbps(5.1声道家用数字环绕声系统声道家用数字环绕声系统)和和192kbps(192kbps(双声道立体声双声道立体声系统系统)，最高为，最高为640kbps640kbps。第42页，共102页，编辑于2022年，星期五2.2 常见音频文件格式常见音频文件格式1 1WAVWAV文件格式文件格式由微软和由微软和IBM

31、IBM开发的开发的WAVWAV文件格式在广泛应用于文件格式在广泛应用于WindowsWindows系统中，系统中，其影响力从其影响力从WindowsWindows伊始至今。伊始至今。WAVWAV格式可以存储多种不同编码格式可以存储多种不同编码的声音数据，但常用于存放的声音数据，但常用于存放1-21-2声道的声道的PCMPCM编码声音数据，不进编码声音数据，不进行压缩编码，可以保持原始数据的最好音质。行压缩编码，可以保持原始数据的最好音质。第43页，共102页，编辑于2022年，星期五2.2 常见音频文件格式常见音频文件格式2 2MP3MP3文件格式文件格式MP3MP3文件格式是现今应用最多的文

32、件格式，是专门用于存储文件格式是现今应用最多的文件格式，是专门用于存储MP3MP3编码声音数据的文件格式。在编码声音数据的文件格式。在MP3MP3文件格式中加入了文件格式中加入了ID3V1ID3V1和和ID3V2ID3V2标签，借以提供版权声明。标签，借以提供版权声明。MP3MP3歌曲文件内不带有歌词。可以在外部配合一个文本格式的歌词文歌曲文件内不带有歌词。可以在外部配合一个文本格式的歌词文件，两个文件配合，可以使音频播放软件边唱边同步显示歌词内容。件，两个文件配合，可以使音频播放软件边唱边同步显示歌词内容。歌词文件常见的是歌词文件常见的是LrcLrc格式。格式。第44页，共102页，编辑于2

33、022年，星期五2.2 常见音频文件格式常见音频文件格式3.WMA(Windows Media Audio)3.WMA(Windows Media Audio)文件格式文件格式20002000年，随着年，随着Windows Media Player7Windows Media Player7的发布，微软将的发布，微软将ASFASF改造为改造为WMAWMA和和WMVWMV格式。格式。WMAWMA成为了是微软使用的自有音频文件格式。成为了是微软使用的自有音频文件格式。WMAWMA支持流媒体支持流媒体应用方式，支持可变码流率技术，支持有损和无损数据压缩编应用方式，支持可变码流率技术，支持有损和无损数

34、据压缩编码技术，支持微软的码技术，支持微软的DRM DRM 内容数字版权加密保护技术。内容数字版权加密保护技术。WMAWMA数据压缩比为数据压缩比为18:118:1，高于，高于MP3MP3。使用使用Windows Media PlayerWindows Media Player程序可以进行程序可以进行WMAWMA格式声音信息的压格式声音信息的压缩编码和播放，也可以在其它应用软件中进行压缩编码和播放。缩编码和播放，也可以在其它应用软件中进行压缩编码和播放。第45页，共102页，编辑于2022年，星期五2.2 常见音频文件格式常见音频文件格式 CDA CDA文件格式文件格式CDACDA文件格式只是

35、一种习惯的说法。文件格式只是一种习惯的说法。CDCD唱片中的声音按照音轨的方式记录在唱片中的声音按照音轨的方式记录在CDCD光盘上，其设计的应用光盘上，其设计的应用方式与计算机系统无关，更不存在文件格式之说了。方式与计算机系统无关，更不存在文件格式之说了。在在Windows XPWindows XP等操作系统中，微软将等操作系统中，微软将CDCD唱片的每一个音轨名映射唱片的每一个音轨名映射为一个文件名，其文件类型为为一个文件名，其文件类型为.CDA.CDA，实际上这只是一个指向，实际上这只是一个指向CDCD音轨的地址指针。音轨的地址指针。CDCD唱片中的声音数据不可能进行文件方式的任何操作，只

36、能唱片中的声音数据不可能进行文件方式的任何操作，只能直接读出来播放，或用抓音轨的方式将其复制到计算机中。直接读出来播放，或用抓音轨的方式将其复制到计算机中。第46页，共102页，编辑于2022年，星期五2.2 常见音频文件格式常见音频文件格式5 5APEAPE和和FLACFLAC文件格式文件格式APEAPE和和FLACFLAC都是无损压缩音频文件格式，两者压缩比基本相同，都是无损压缩音频文件格式，两者压缩比基本相同，大约是一半，编码速度相差无几，压缩技术都是开源的，是免大约是一半，编码速度相差无几，压缩技术都是开源的，是免费的技术。费的技术。APEAPE是是Monkeys AudioMonke

37、ys Audio软件提供的文件格式。软件提供的文件格式。FLACFLAC是基于是基于UnixUnix系统内核而开发的自由音频压缩编码，免费开系统内核而开发的自由音频压缩编码，免费开放格式的源码，支持多数操作系统，提供开发工具。放格式的源码，支持多数操作系统，提供开发工具。使用使用Monkeys AudioMonkeys Audio、foobar2000foobar2000、千千静听等可以制作和播、千千静听等可以制作和播放这些文件。放这些文件。第47页，共102页，编辑于2022年，星期五2.2 常见音频文件格式常见音频文件格式6 6MIDIMIDI文件格式文件格式专用于存储专用于存储MIDIM

38、IDI音乐乐谱编码的文件格式。其数据可以经过代音乐乐谱编码的文件格式。其数据可以经过代码转换后，用于手机铃声。码转换后，用于手机铃声。第48页，共102页，编辑于2022年，星期五3音频获取技术音频获取技术3.1录音机获取音频录音机获取音频3.2音频文件转换音频文件转换第49页，共102页，编辑于2022年，星期五3.1录音机获取音频录音机获取音频利用利用WindowsWindows的录音机应用程序可获取数字化音频。在录制声音前，的录音机应用程序可获取数字化音频。在录制声音前，首先进行准备工作，在首先进行准备工作，在WindowsWindows控制面板中找到控制面板中找到“声音和音频设备声音和

39、音频设备”属性对话框，选中属性对话框，选中“将音量图标放入任务栏将音量图标放入任务栏”，并去除，并去除“静音静音”。然后，点击设备音量中然后，点击设备音量中“高级高级”按钮，在按钮，在“音量控制音量控制”窗口中选窗口中选“选项选项”-“”-“属性属性”-“”-“麦克风麦克风”(”(否则不能进行话筒录音否则不能进行话筒录音)，并，并取消取消“静音静音”设置。设置。第50页，共102页，编辑于2022年，星期五3.1录音机获取音频录音机获取音频选中选中“麦克风麦克风”第51页，共102页，编辑于2022年，星期五3.1录音机获取音频录音机获取音频“声音和音频设备声音和音频设备”属性对话框属性对话框

40、第52页，共102页，编辑于2022年，星期五3.1录音机获取音频录音机获取音频1 1启动录音程序启动录音程序第53页，共102页，编辑于2022年，星期五3.1录音机获取音频录音机获取音频2 2录音操作录音操作启动启动“录音机录音机”程序后，单击程序后，单击“录制录制”按钮就可以开始录音，按钮就可以开始录音，录音结束或单击录音结束或单击“停止停止”按钮，打开另存文件窗口，选择文按钮，打开另存文件窗口，选择文本路径，输入文件名，按确定按钮结束录音操作。单击本路径，输入文件名，按确定按钮结束录音操作。单击“伯伯方方”按钮就可以播放录制的声音文件。按钮就可以播放录制的声音文件。第54页，共102页

41、，编辑于2022年，星期五3.1录音机获取音频录音机获取音频3.3.录音参数设置录音参数设置通过选择声音质量可以确定采样参数通过选择声音质量可以确定采样参数第55页，共102页，编辑于2022年，星期五3.1录音机获取音频录音机获取音频直接选择确定采样参数直接选择确定采样参数第56页，共102页，编辑于2022年，星期五3.1录音机获取音频录音机获取音频选择声音编码的种类选择声音编码的种类第57页，共102页，编辑于2022年，星期五3.1录音机获取音频录音机获取音频声音的合成声音的合成在使用录音机程序录制多个音频素材文件后，常常需要将素材文在使用录音机程序录制多个音频素材文件后，常常需要将素

42、材文件进行混合和拼接。件进行混合和拼接。WindowsWindows“录音机录音机”程序提供了将两个或程序提供了将两个或多个多个WAVWAV文件混合和拼接的功能。文件混合和拼接的功能。如要将两个如要将两个WAVWAV文件拼接成更长的声音文件的操作与混音操作文件拼接成更长的声音文件的操作与混音操作类似，只需在播放一个音频文件的适当位置，单击类似，只需在播放一个音频文件的适当位置，单击“停止停止”按钮，然后选择按钮，然后选择“编辑编辑”“”“插入文件插入文件”命令，在弹出的窗命令，在弹出的窗口中选择拼接的音乐文件，单击确定按钮就可以将这个声音口中选择拼接的音乐文件，单击确定按钮就可以将这个声音文件

43、从当前位置插入到第一个声音文件中。重复此操作，可文件从当前位置插入到第一个声音文件中。重复此操作，可以将多个音频文件拼接到一起。以将多个音频文件拼接到一起。第58页，共102页，编辑于2022年，星期五3.2音频文件转换音频文件转换1 1Windows Media PlayerWindows Media Player对音频数据进行编码压缩时需要使用一个高音质的音源，对音频数据进行编码压缩时需要使用一个高音质的音源，CDCD光盘光盘中的高保真声音非常适合使用。中的高保真声音非常适合使用。抓音轨抓音轨Exact Audio CopyExact Audio Copy软件的主界面。软件的主界面。第59

44、页，共102页，编辑于2022年，星期五EAC软件主界面软件主界面第60页，共102页，编辑于2022年，星期五3.2音频文件转换音频文件转换Windows Media PlayerWindows Media Player抓音轨，并编码为抓音轨，并编码为WMAWMA文件的操作步骤如下：文件的操作步骤如下：第第1 1步，勾选要抓取的音轨。步，勾选要抓取的音轨。第61页，共102页，编辑于2022年，星期五3.2音频文件转换音频文件转换第第2 2步，选择编码种类步，选择编码种类第62页，共102页，编辑于2022年，星期五3.2音频文件转换音频文件转换第第3 3步，选择码流率。步，选择码流率。第6

45、3页，共102页，编辑于2022年，星期五3.2音频文件转换音频文件转换第第4 4步，在主菜单中的步，在主菜单中的“翻录翻录”项下项下第64页，共102页，编辑于2022年，星期五3.2音频文件转换音频文件转换第第5 5步，点击步，点击“开始翻录开始翻录”按钮，即可启动抓音轨和编码过程。按钮，即可启动抓音轨和编码过程。第第6 6步，为了下一步工作需要，再将同一音轨制作成步，为了下一步工作需要，再将同一音轨制作成WAVWAV格式的文件。格式的文件。第65页，共102页，编辑于2022年，星期五3.2音频文件转换音频文件转换2 2LameLame程序应用程序应用LameLame编码器程序是编码器程

46、序是MP3MP3编码器引擎。编码器引擎。除固定码流率编码除固定码流率编码CBR(Constant BitRate)CBR(Constant BitRate)外，外，LameLame还可以进行还可以进行动态码流率动态码流率VBR(Variable Bitrate)VBR(Variable Bitrate)和平均码流率和平均码流率ABR(Average ABR(Average Bitrate)Bitrate)编码。编码。在开始编码前还可以输入在开始编码前还可以输入ID3ID3版权信息标签，这些信息编码后一版权信息标签，这些信息编码后一起存入起存入MP3MP3文件中。如选择文件中。如选择VBRVBR

47、动态码流率编码，则动态码流率编码，则MP3MP3文件播文件播放时会在一些播放软件窗口中可以看到其码流率在不断变化放时会在一些播放软件窗口中可以看到其码流率在不断变化(例如例如winampwinamp程序程序)。第66页，共102页，编辑于2022年，星期五第67页，共102页，编辑于2022年，星期五3.2音频文件转换音频文件转换3.APE3.APE和和FLACFLAC编码程序编码程序Monkeys AudioMonkeys Audio或或AWMA WorkshopAWMA Workshop可实现音频数据无损压缩可实现音频数据无损压缩编码操作，可压缩为编码操作，可压缩为APEAPE或或FLAC

48、FLAC编码格式文件。编码格式文件。Monkeys AudioMonkeys Audio软件可进行软件可进行APEAPE编码和编码和APEAPE格式文件播放。格式文件播放。AWMA WorkshopAWMA Workshop软件提供的参数设置功能，实现软件提供的参数设置功能，实现APEAPE和和FLACFLAC无损编无损编码，也可以用来进行其它数据压缩编码操作。码，也可以用来进行其它数据压缩编码操作。第68页，共102页，编辑于2022年，星期五Monkey s Audio程序程序第69页，共102页，编辑于2022年，星期五AWMA Workshop程序程序第70页，共102页，编辑于202

49、2年，星期五4 音频编辑软件音频编辑软件1Audition基本操作基本操作2 Audition高级操作高级操作3 Audition应用示例应用示例第71页，共102页，编辑于2022年，星期五1Audition基本操作基本操作数字音频编辑是非线性编辑。数字音频编辑是非线性编辑。非线性编辑是相对于模拟声音信号的编辑过程非线性编辑是相对于模拟声音信号的编辑过程(线性编辑线性编辑)而而言的，是依靠计算机技术、数字处理技术而实现音频编辑技言的，是依靠计算机技术、数字处理技术而实现音频编辑技术、方法和应用过程。术、方法和应用过程。第72页，共102页，编辑于2022年，星期五1Audition基本操作基

50、本操作1 1非线性编辑非线性编辑(Nonlinear Edit(Nonlinear Edit）非线性编辑系统的技术理论涉及到计算机软硬件技术，数字信非线性编辑系统的技术理论涉及到计算机软硬件技术，数字信号处理技术，多媒体技术等。非线性编辑在计算机技术的支持号处理技术，多媒体技术等。非线性编辑在计算机技术的支持下，充分运用数字处理技术的研究成果，其编辑效果变换无穷，下，充分运用数字处理技术的研究成果，其编辑效果变换无穷，多姿多彩的得到应用。多姿多彩的得到应用。第73页，共102页，编辑于2022年，星期五1Audition基本操作基本操作非线性编辑系统特点如下：非线性编辑系统特点如下：从原理看，

展开阅读全文