音频信息处理技术.ppt

上传人:豆**** 文档编号:57946137 上传时间:2022-11-06 格式:PPT 页数:68 大小:3.32MB
返回 下载 相关 举报
音频信息处理技术.ppt_第1页
第1页 / 共68页
音频信息处理技术.ppt_第2页
第2页 / 共68页
点击查看更多>>
资源描述

《音频信息处理技术.ppt》由会员分享,可在线阅读,更多相关《音频信息处理技术.ppt(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、音频信息处理技术音频信息处理技术本章导读音频信息处理技术是多媒体信息处理的主要技术之一,音频信息处理技术是多媒体信息处理的主要技术之一,它使计算机具备了录音、声音编辑、语音合成、声音播放它使计算机具备了录音、声音编辑、语音合成、声音播放等功能。在等功能。在MPC中,可以通过声音传递信息、制造效果、中,可以通过声音传递信息、制造效果、营造气氛及演奏音乐等。目前的音频信息处理技术主要包营造气氛及演奏音乐等。目前的音频信息处理技术主要包括模拟声音信号的数字化、数据压缩编码、数字音效处理、括模拟声音信号的数字化、数据压缩编码、数字音效处理、音频文件存储、传输、播放等内容。音频文件存储、传输、播放等内容

2、。本章主要介绍声音信本章主要介绍声音信号及其数字化的基本概念、音频卡的组成及其工作原理、号及其数字化的基本概念、音频卡的组成及其工作原理、数字音频的采集与编辑、数字音频的采集与编辑、MIDI音乐以及几个常用的音频处音乐以及几个常用的音频处理软件等内容,理软件等内容,并以并以AdobeAudition3.0版本为例,详细版本为例,详细介绍音频信息编辑处理的具体方法。介绍音频信息编辑处理的具体方法。http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/www.

3、zg- http:/ http:/www.skf- http:/www.nsk- http:/www.fag- http:/ http:/www.ntn- http:/ http:/ http:/ http:/ http:/ http:/www.xunchi- http:/ http:/ http:/ http:/ http:/ http:/ http:/www.ort- 4.1 音频基础知识音频基础知识 4.2 4.2 音质标准与评价音质标准与评价4.3 4.3 音频的数字化与编码音频的数字化与编码4.4 4.4 音频卡音频卡4.5 4.5 数字音频的采集与编辑数字音频的采集与编辑4.6 M

4、IDI4.6 MIDI音乐音乐4.1 4.1 音频基础知识音频基础知识4.1.1 4.1.1 声音的物理特征声音的物理特征 声音声音是由物体振动产生的,并以是由物体振动产生的,并以声波形式声波形式通过介质(如通过介质(如空气、水、金属等)传播。物理上,声音可以用空气、水、金属等)传播。物理上,声音可以用一条连续曲一条连续曲线线来表示,来表示,,如图如图4-1 4-1。物体振动的最大位移称为。物体振动的最大位移称为振幅振幅A A,声,声波中两个连续波峰(或波谷)之间的距离称为波中两个连续波峰(或波谷)之间的距离称为周期周期T T,周期,周期的倒数的倒数1/T1/T即为即为频率频率f f,以,以赫

5、兹(赫兹(HzHz)为单位,频率为单位,频率反映了单位时间(反映了单位时间(1 1秒)物秒)物体振动的次数。体振动的次数。图图4-1 4-1 声波的振幅与频率声波的振幅与频率TAt0 声音按频率可分为三类:声音按频率可分为三类:音频、次声、超声音频、次声、超声 l 低于低于20Hz20Hz的声音称为次声的声音称为次声l 频率范围在频率范围在20Hz20Hz20kHz20kHz范范围的可听声音称为音频,围的可听声音称为音频,其中人说话发出的语音信号的其中人说话发出的语音信号的频率范围是频率范围是300Hz300Hz3kHz3kHzl 频率高于频率高于20kHz20kHz的称为超音的称为超音频(或

6、超声)频(或超声)15 20 300 3k 20k 50k f(Hz)音频信号音频信号语音信号语音信号超声信号超声信号次声信号次声信号图图4-2 4-2 不同声音信号的频率范围不同声音信号的频率范围 可听的音频声音又可分为可听的音频声音又可分为语音、乐音、效果音、合语音、乐音、效果音、合成音、噪音(声)成音、噪音(声)等五种。等五种。4.1.2 4.1.2 音频三要素音频三要素 音频有三个主要属性,分别是音频有三个主要属性,分别是音调、音强音调、音强和和音色音色,它们,它们既反映了音频信号的基本特征,也是人感受声音信号的三个既反映了音频信号的基本特征,也是人感受声音信号的三个主要因素,因此又被

7、称为音频三要素。主要因素,因此又被称为音频三要素。音调音调:又称音高,反映声音的高低程度,由声音信号的:又称音高,反映声音的高低程度,由声音信号的频率大小所决定。频率越大,音调越高;频率越小,音调越频率大小所决定。频率越大,音调越高;频率越小,音调越低。低。音强音强:又称响度,反映声音的大小或强弱,由振幅和声:又称响度,反映声音的大小或强弱,由振幅和声源距离共同决定。振幅越大,距离越小,音强(响度)越大。源距离共同决定。振幅越大,距离越小,音强(响度)越大。音色音色:又称音质,反映声音的品质,它由振动物体(声:又称音质,反映声音的品质,它由振动物体(声源)的材料、结构、状态等自身因素决定,表现

8、为声源的频源)的材料、结构、状态等自身因素决定,表现为声源的频带宽度。带宽度。4.1.3 4.1.3 数字音频的三种形式数字音频的三种形式 音频(音频(AudioAudio)是指频率在)是指频率在20Hz20Hz20kHz20kHz范围内的可听声范围内的可听声音,是多媒体信息中的一种媒体类型音,是多媒体信息中的一种媒体类型听觉类媒体。听觉类媒体。目前多媒体计算机中的音频主要有目前多媒体计算机中的音频主要有波形音频、波形音频、CDCD音频和音频和MIDIMIDI音乐音乐3 3种形式。种形式。1 1、波形音频:、波形音频:是由外部声音源通过数字化过程采集到多媒体计算机中是由外部声音源通过数字化过程

9、采集到多媒体计算机中的所有声音形式。可通过编辑(裁剪、合成、效果等)、编的所有声音形式。可通过编辑(裁剪、合成、效果等)、编码压缩、存储、传输以及还原播放等方式进行处理。在波形码压缩、存储、传输以及还原播放等方式进行处理。在波形音频中,有一类特殊的声音需要特别提到,即人的语音。语音频中,有一类特殊的声音需要特别提到,即人的语音。语音是波形声音中人的说话声音,具有内在的语言学、语音学音是波形声音中人的说话声音,具有内在的语言学、语音学的内涵。的内涵。2 2、CDCD音频音频 CD-CD-音频(音频(CD-AudioCD-Audio)是存储在音乐)是存储在音乐CDCD光盘中的数字音光盘中的数字音频

10、,可以通过频,可以通过CD-ROMCD-ROM驱动器读取并采集到多媒体计算机系驱动器读取并采集到多媒体计算机系统中,并以波形音频的相应形式存储、传输和处理。统中,并以波形音频的相应形式存储、传输和处理。3 3、MIDIMIDI音乐音乐 也称也称MIDIMIDI音频。它将音乐符号化并保存在音频。它将音乐符号化并保存在MIDIMIDI文件中,文件中,并通过音乐合成器产生相应的声音波形来还原播放。并通过音乐合成器产生相应的声音波形来还原播放。音频是时间的函数,具有很强的前后相关性,所以实音频是时间的函数,具有很强的前后相关性,所以实时性是音频处理的基本要求。时性是音频处理的基本要求。4.1.4 4.

11、1.4 数字音频的文件格式数字音频的文件格式音频文件通常分为两大类:音频文件通常分为两大类:声音文件声音文件 和和 MIDIMIDI文件文件下表介绍几种常用的音频文件格式及后缀名:下表介绍几种常用的音频文件格式及后缀名:序号序号音频文件名称音频文件名称后缀名后缀名1 1WaveWave文件文件 .WAV.WAV 2 2AIFFAIFF文件文件 .AIF/.AIFF.AIF/.AIFF 3 3AudioAudio文件文件 .AU.AU 4 4 Sound Sound文件文件 .SND.SND 5 5VoiceVoice文件文件 .VOC.VOC 6 6 Mpeg Mpeg音频文件音频文件 .MP

12、1/.MP2/.MP3.MP1/.MP2/.MP3 7 7RealAudioRealAudio文件文件 .RA/.RM/.RAM.RA/.RM/.RAM 8 8Windows Media AudioWindows Media Audio文件文件 .WMA/.ASF/.ASX/.WAX.WMA/.ASF/.ASX/.WAX 9 9MIDIMIDI文件文件 .MID/.RMI/.CMI/.CMF.MID/.RMI/.CMI/.CMF 1010ModuleModule文件文件 .MOD/.S3M/.XM/.MTM/.FAR/.KAR/.MOD/.S3M/.XM/.MTM/.FAR/.KAR/4.1.

13、5 4.1.5 音频处理工具软件简介音频处理工具软件简介 音频工具软件在内容上主要指处理数字音频和音频工具软件在内容上主要指处理数字音频和MIDIMIDI乐谱的乐谱的各种工具软件,在功能上包括各种工具软件,在功能上包括音频采集、编辑、合成、编码压音频采集、编辑、合成、编码压缩以及缩以及MIDIMIDI乐谱的创作、编辑、发布等环节乐谱的创作、编辑、发布等环节。按照音频处理的基本过程,通常可把音频工具软件分为:按照音频处理的基本过程,通常可把音频工具软件分为:1 1、MIDIMIDI制作软件制作软件 2 2、音频处理软件、音频处理软件 3 3、音频压缩软件、音频压缩软件 4 4、音乐、音乐CDCD

14、刻录软件刻录软件4.2 4.2 音质标准与评价音质标准与评价4.2.1 4.2.1 音质等级标准音质等级标准 音质音质是指音频信号经传输、处理后所再现的声音质量是指音频信号经传输、处理后所再现的声音质量(保真度)。(保真度)。等级等级频率范围频率范围音质音质高端高端DVDDVD0 048kHz48kHz顶级顶级标准标准DVDDVD0 024kHz24kHzCD-DACD-DA音质音质10Hz10Hz20kHz20kHz高高FMFM广播音质广播音质20Hz20Hz15kHz15kHz较高较高AMAM广播音质广播音质50Hz50Hz7kHz7kHz中中电话音质电话音质200Hz200Hz3.4kH

15、z3.4kHz低低4.2.2 4.2.2 音质客观评价音质客观评价 客观评价客观评价是指通过检测仪器测量音频信号的技术指标来进是指通过检测仪器测量音频信号的技术指标来进行声音质量评价,主要技术指标有:频带宽度、动态范围和信行声音质量评价,主要技术指标有:频带宽度、动态范围和信噪比等。噪比等。理论上,理论上,声音信号是由许多频率不同的分量信号组合而成声音信号是由许多频率不同的分量信号组合而成的复合信号,因此,声音的频带宽度特指复合声音信号的频率的复合信号,因此,声音的频带宽度特指复合声音信号的频率范围,范围越大,频带越宽,可包含的音频信号(谐波)越丰范围,范围越大,频带越宽,可包含的音频信号(谐

16、波)越丰富,因而声音质量就越高。富,因而声音质量就越高。实际上实际上,再现声音(特别是乐音)的质量与所用的播放设,再现声音(特别是乐音)的质量与所用的播放设备和场地条件有关。高质量的音频信号要通过高品质的音响设备和场地条件有关。高质量的音频信号要通过高品质的音响设备在较好的音响环境中,才能再现出高质量的音响效果。对于备在较好的音响环境中,才能再现出高质量的音响效果。对于音响设备而言,主要关注音响设备而言,主要关注失真度、频响、瞬态响应、信噪比、失真度、频响、瞬态响应、信噪比、声道分离度、声道平衡度声道分离度、声道平衡度等指标。等指标。4.2.3 4.2.3 音质主观评价音质主观评价 主观评价是

17、指通过人聆听各种声音而产生的好恶感觉来进主观评价是指通过人聆听各种声音而产生的好恶感觉来进行声音质量评价。行声音质量评价。1 1、语音质量评价方法、语音质量评价方法 常用的主观评价方法有:常用的主观评价方法有:平均主观分法,失真平均主观分平均主观分法,失真平均主观分法,判断满意度测量法法,判断满意度测量法等。等。ITU-TP800ITU-TP800标准中定义的标准中定义的MOSMOS,它将语音质量分为,它将语音质量分为5 5级,如表级,如表所示:所示:等级等级音质音质主观感觉主观感觉5 5优优未察觉失真未察觉失真4 4良良刚察觉失真,但不讨厌刚察觉失真,但不讨厌3 3中中察觉失真,稍微讨厌察觉

18、失真,稍微讨厌2 2差差讨厌,但不令人反感讨厌,但不令人反感1 1劣劣极其讨厌,令人反感极其讨厌,令人反感 2 2、乐音质量评价、乐音质量评价 乐音音质的优劣取决于多种因素,如乐音音质的优劣取决于多种因素,如声源特性、音响器声源特性、音响器材的信号特性、声场特性、听觉特性材的信号特性、声场特性、听觉特性等。因此,对音响设等。因此,对音响设备再现的乐音音质的准确评价难度较大。备再现的乐音音质的准确评价难度较大。主观评价乐音音质,一般是通过再现乐音的响度、音调主观评价乐音音质,一般是通过再现乐音的响度、音调和音色的变化及其组合来评价音质的,和音色的变化及其组合来评价音质的,几种典型的听感:几种典型

19、的听感:定位感定位感 ,空间感,空间感 ,层次感,层次感 ,厚度,厚度感感 ,立体感,立体感 。除此之外,还有力度感、亮度感、临场感、。除此之外,还有力度感、亮度感、临场感、软硬感、松紧感、宽窄感等许多评价音质的听感。软硬感、松紧感、宽窄感等许多评价音质的听感。4.3 4.3 音频的数字化与编码音频的数字化与编码 计算机在处理音频信号之前,计算机在处理音频信号之前,必须将模拟的声音信号数字化,形必须将模拟的声音信号数字化,形成数字音频。具体过程包括:成数字音频。具体过程包括:采样采样、量化、编码、量化、编码。4.3.1 4.3.1 采样与采样频率采样与采样频率 采样是每间隔一段时间读采样是每间

20、隔一段时间读取一次声音信号幅度,使声音取一次声音信号幅度,使声音信号在时间上被离散化,如图信号在时间上被离散化,如图4-24-2所示。采样的主要参数是所示。采样的主要参数是采样频率采样频率 。采样频率采样频率:是指将模拟声音波形数字化时,每秒钟所抽取:是指将模拟声音波形数字化时,每秒钟所抽取声波幅度样本的次数,其计算单位是声波幅度样本的次数,其计算单位是kHz(kHz(千赫兹千赫兹)。如图。如图4-34-3是模拟声音信号数字化时的采样图示。是模拟声音信号数字化时的采样图示。一般来讲,采样频率一般来讲,采样频率越高声音失真越小,用于越高声音失真越小,用于存储数字音频的数据量也存储数字音频的数据量

21、也越大。越大。采样频率的高低是根采样频率的高低是根据据声音信号本身的最高频声音信号本身的最高频率和采样定理率和采样定理决定的。决定的。图图4-3 4-3 声音信号采样声音信号采样 采样定理采样定理:在进行模拟:在进行模拟/数字信号的转换过程中,当采数字信号的转换过程中,当采样频率样频率f fs s大于信号中最高频率大于信号中最高频率f fmaxmax的的2 2倍时,即倍时,即f fs s=2f=2fmaxmax,采,采样之后的数字信号完整地保留了原始信号中的信息。采样定样之后的数字信号完整地保留了原始信号中的信息。采样定理又叫奈奎斯特定理(理又叫奈奎斯特定理(Nyquist theoryNyq

22、uist theory)。)。表表4-4 4-4 不同音质数字音频的常用采样率不同音质数字音频的常用采样率采样率采样率音质音质频率范围频率范围8,000 Hz8,000 Hz电话电话0 04,000 Hz4,000 Hz11,025 Hz11,025 Hz低于低于AMAM广播广播0 05,512 Hz5,512 Hz22,050 Hz22,050 Hz接近接近FMFM广播广播0 011,025 Hz11,025 Hz32,000 Hz32,000 Hz优于优于FMFM广播广播0 016,000 Hz16,000 Hz44,100 Hz44,100 HzCD-DACD-DA0 022,050 H

23、z22,050 Hz48,000 Hz48,000 Hz标准标准DVDDVD0 024,000 Hz24,000 Hz96,000 Hz96,000 Hz高端高端DVDDVD0 048,000 Hz48,000 Hz4.3.2 4.3.2 量化与量化位数量化与量化位数 量化量化就是把采样得到的声音信号幅度转换为数字值,就是把采样得到的声音信号幅度转换为数字值,是声音信号在幅度上被离散化。是声音信号在幅度上被离散化。量化位数量化位数n n定义了每个采样点的数据范围(定义了每个采样点的数据范围(0 02 2n n-1-1),),也叫量化等级,量化等级的多少决定了声音的动态范围。也叫量化等级,量化等

24、级的多少决定了声音的动态范围。图图4-4 4-4 量化位数与动态范围量化位数与动态范围 4.3.2 4.3.2 量化与量化位数量化与量化位数表表4-5 4-5 不同音质的量化位数、量化范围、动态范围不同音质的量化位数、量化范围、动态范围量化位数量化位数音质音质量化等级量化等级动态范围动态范围8 8位位电话电话25625648 dB48 dB1616位位CDCD65,53665,53696 dB96 dB2424位位DVDDVD16,777,21616,777,216144 dB144 dB3232位位顶级顶级4,294,967,2964,294,967,296192 dB192 dB4.3.3

25、 4.3.3 声道声道声道个数是声道个数是反映音频数字化质量的另一个因素。反映音频数字化质量的另一个因素。单声道:单声道:采集声音数据时,仅采集一个声波的数据采集声音数据时,仅采集一个声波的数据双声道(立体声)双声道(立体声):采集两个声波数据:采集两个声波数据多声道(环绕立体声)多声道(环绕立体声):采集两个以上声波数据:采集两个以上声波数据声道数越多,再现出的音响效果就越好。声道数越多,再现出的音响效果就越好。4.3.4 4.3.4 音频采样的数据量音频采样的数据量数字音频的数据量主要取决于两个因素:数字音频的数据量主要取决于两个因素:u音质因素音质因素:由采样频率、量化位数和声道数:由采

26、样频率、量化位数和声道数3 3个个参数决定。参数决定。u时间因素:时间因素:单位时间的数据量可用下式表示:单位时间的数据量可用下式表示:fcbs8v=v=v v:为单位时间的数据量(:为单位时间的数据量(KbpsKbps)fc:为采样频率(:为采样频率(kHzkHz)b b:为量化位数(:为量化位数(bitbit)s s:为声道数:为声道数4.3.5 4.3.5 音频数据编码音频数据编码音频数据压缩方法分类音频数据压缩方法分类PCMPCM为脉冲调制编码,为脉冲调制编码,DPCMDPCM为差分脉冲调制编码,为差分脉冲调制编码,ADPCMADPCM为自适应差分脉冲调制编码为自适应差分脉冲调制编码,

27、VSELPVSELP为矢量和激励线性预测编码,为矢量和激励线性预测编码,MPLPCMPLPC为多脉冲激励线性预测编码,为多脉冲激励线性预测编码,CELPCELP为码本激励线性预测编码。为码本激励线性预测编码。4.3.6 4.3.6 音频编码标准音频编码标准 1 1、一般语音音质的音频压缩标准、一般语音音质的音频压缩标准u特点:特点:音质低,能听到声音就可以音质低,能听到声音就可以u应用:应用:各类提示音各类提示音u压缩标准:压缩标准:CCITT A LawCCITT A Law CCITT Law CCITT Law 低采样率或低量化位数的低采样率或低量化位数的PCM PCM 2 2、电话音质

28、的音频压缩标准、电话音质的音频压缩标准u频率范围频率范围:300Hz:300Hz3.4kHz3.4kHz,用标准的,用标准的PCMPCM编码。编码。u压缩标准:压缩标准:G G系列音频压缩标准系列音频压缩标准uG G系列音频压缩标准利用的技术系列音频压缩标准利用的技术:线性预测技术线性预测技术 矢量量化技术矢量量化技术 综合分析技术综合分析技术u典型的算法典型的算法:ADPCMADPCM CELP CELP LD-CELP LD-CELP(短时延码本激励线性预测编码)(短时延码本激励线性预测编码)RPE-LTPRPE-LTP(长时线性预测规则码激励)(长时线性预测规则码激励)VSELPVSEL

29、P(矢量和激励线性预测编码)(矢量和激励线性预测编码)标准标准参数说明参数说明G.711G.711PCMPCM编码,采样速率编码,采样速率8kHz8kHz,量化位数,量化位数8Bit8Bit,比特流速率,比特流速率为为64kb/s64kb/s。使用非线性量化技术。使用非线性量化技术G.721G.721ADPCMADPCM编码:每个数值差分用编码:每个数值差分用4 4位编码,采样率为位编码,采样率为8kHz8kHz,比特流被转换为,比特流被转换为32kbps32kbpsG.723G.723SB-ADPCMSB-ADPCM编码(有损压缩),比特流被转换为编码(有损压缩),比特流被转换为5.35.3

30、 6.3kbps6.3kbps之间之间G.728G.728LD-CELPLD-CELP编码,比特流被转换为编码,比特流被转换为16kbps16kbps,带宽限于,带宽限于3.4kHz3.4kHz;音质与;音质与G.721G.721标准相当标准相当表表4-6 4-6 电话音质的音频编码标准电话音质的音频编码标准3 3、AMAM广播音质的音频压缩标准广播音质的音频压缩标准u频率范围频率范围:50Hz:50Hz7kHz 7kHz u压缩标准:压缩标准:ITUITU制定的制定的G.722G.722标准标准 uG.722G.722标准采用的算法:标准采用的算法:SB-ADPCMSB-ADPCM(子带(子

31、带ADPCMADPCM)uSB-ADPCMSB-ADPCM算法:算法:将现有的带宽分成两个独立的子带将现有的带宽分成两个独立的子带信道,使输入信号进入滤波器组分成高子带信号和低信道,使输入信号进入滤波器组分成高子带信号和低子带信号,然后分别进行子带信号,然后分别进行ADPCMADPCM编码,最后进入混合器编码,最后进入混合器形成输出码流形成输出码流 4 4、高保真立体声音频压缩标准、高保真立体声音频压缩标准u包括包括:CD-DACD-DA以上音质、以上音质、FMFM广播音质广播音质uFMFM广播音质频率范围广播音质频率范围:20Hz20Hz15kHz15kHz uCD-DACD-DA音频信号的

32、频率范围:音频信号的频率范围:50Hz50Hz20kHz20kHz u压缩标准:压缩标准:1 1)MPEG1MPEG1,MPEG2MPEG2的的layer1layer1、2 2、3 3,MPEG 4 AACMPEG 4 AAC音频编码,杜比音频编码,杜比AC-3AC-3等等。用于数字广播、数字电视广。用于数字广播、数字电视广播、消费电子产品、音频信息的存储和下载等。播、消费电子产品、音频信息的存储和下载等。2 2)ITU-T G.722.1ITU-T G.722.1、3GPP AMR-WB+3GPP AMR-WB+和和3GPP 2 3GPP 2 4GV-WB 4GV-WB。用于像用于像3G3G

33、通信这样的高音质低码率应用场合。通信这样的高音质低码率应用场合。4.4 4.4 音频卡音频卡 4.4.1 4.4.1 音频卡的功能音频卡的功能u 录制和播放数字声音文件录制和播放数字声音文件u 控制音量和混音效果控制音量和混音效果u 声音文件的压缩与解压缩声音文件的压缩与解压缩u MIDIMIDI接口与音乐合成接口与音乐合成 4.4.2 4.4.2 音频卡的组成与工作原理音频卡的组成与工作原理图图4-6 4-6 音频卡的一般组成与结构示意图音频卡的一般组成与结构示意图DSPDSP音频输出音频输出放大器放大器麦克风麦克风MicMic线路输入线路输入Line inLine in音乐合成器音乐合成器

34、系统总系统总线接口线接口CDCD输入输入混合信号混合信号处理器处理器MIDIMIDI与游与游戏接口戏接口系统总线系统总线放大器放大器 音频卡的主要功能部件音频卡的主要功能部件:功率放大器、混合信号处理:功率放大器、混合信号处理器、器、DSPDSP数字信号处理器、音乐合成器以及相关的外围接口数字信号处理器、音乐合成器以及相关的外围接口等。等。声音的合成与处理声音的合成与处理:由:由DSPDSP数字声音处理器、音乐合成数字声音处理器、音乐合成器及器及MIDIMIDI接口控制器组成接口控制器组成,主要任务是完成声波信号的模主要任务是完成声波信号的模/数、数数、数/模转换,利用调频技术控制声音的音调、

35、音色和幅模转换,利用调频技术控制声音的音调、音色和幅度。度。混合信号处理器及功率放大器混合信号处理器及功率放大器:内置数字:内置数字/模拟混音器,模拟混音器,混音器的声源可以是混音器的声源可以是MIDIMIDI信号、信号、CDCD音频、线性输入、话筒音频、线性输入、话筒以及以及PCPC机的扬声器等,可以选择输入一个声源或将几个不机的扬声器等,可以选择输入一个声源或将几个不同声源进行混合录音。同声源进行混合录音。4.4.3 4.4.3 音频卡的音频卡的I/OI/O接口接口图图4-7音频卡的外围接口连接示意图音频卡的外围接口连接示意图4.4.3 4.4.3 音频卡的音频卡的I/OI/O接口接口图图

36、4-8支持支持5.1环绕的声卡插口环绕的声卡插口4.5 4.5 数字音频的采集与编辑数字音频的采集与编辑 一般的数字音频采集首先需要选择和设置恰当的采样参一般的数字音频采集首先需要选择和设置恰当的采样参数,然后再开始录音采集,最后再使用相应的编辑软件对录数,然后再开始录音采集,最后再使用相应的编辑软件对录制的音频数据进行剪辑和效果处理。制的音频数据进行剪辑和效果处理。4.5.1 4.5.1 录音采集录音采集u 选择采样参数选择采样参数u 调整输入音频的频响调整输入音频的频响u 检测输入音频的强度检测输入音频的强度 u 开始录音开始录音图图4-9 4-9 设置录音参数设置录音参数1 1、选择采样

37、参数、选择采样参数 首先要根据实际情况选择最佳的采样参数,做到音质与首先要根据实际情况选择最佳的采样参数,做到音质与数据量的折中考虑,避免采样过程中出现存储空间不足的现数据量的折中考虑,避免采样过程中出现存储空间不足的现象发生。象发生。CDCD音质、音质、电话质量电话质量收音质量收音质量Default Quality Default Quality 2 2调整输入音频的频响调整输入音频的频响 表表4-7 各频段参数对音质的影响各频段参数对音质的影响频段频段频率范围频率范围音质影响音质影响低频低频202060Hz60Hz空间感。提升低频共振(嗡),降落空虚;空间感。提升低频共振(嗡),降落空虚;

38、6060100Hz100Hz浑厚感。提升轰鸣浑厚感。提升轰鸣(轰轰),降落无力;,降落无力;100100150Hz150Hz丰满度。提升浑浊、降落单薄;丰满度。提升浑浊、降落单薄;中频低段中频低段150150300Hz300Hz声音力度、男声力度。提升声音硬、无特色,降落软、飘;声音力度、男声力度。提升声音硬、无特色,降落软、飘;中频中频300300500Hz500Hz语音主要音区,提升语音单调、降落语音空洞;语音主要音区,提升语音单调、降落语音空洞;5005001KHz1KHz人声基音、声音廓,提升语音前凸、降落语音收缩感;人声基音、声音廓,提升语音前凸、降落语音收缩感;1k1k2kHz2k

39、Hz通透感、顺畅感,提升有跳跃感、降落通透感、顺畅感,提升有跳跃感、降落 松散;松散;中频上段中频上段2k2k3kHz3kHz对明亮度最敏感,提升声音硬,不自然;对明亮度最敏感,提升声音硬,不自然;3k3k4kHz4kHz穿透力,提升穿透力,提升 咳音;咳音;4k4k5kHz5kHz乐器表面响度,提升乐器距离近、降落乐器表面响度,提升乐器距离近、降落 乐器距离远;乐器距离远;高频高频5k5k6kHz6kHz语言的清晰度,提升声音锋利、易疲劳;语言的清晰度,提升声音锋利、易疲劳;6k6k8kHz8kHz明亮度、透明度,明亮度、透明度,提升齿音重、降落提升齿音重、降落 声音黯淡;声音黯淡;8k8k

40、10kHz10kHzS S音,影响音色的清晰度和透明度;音,影响音色的清晰度和透明度;极高频极高频10k10k12kHz12kHz高频泛音,光泽;高频泛音,光泽;12k12k16kHz16kHz高频泛音,光彩;高频泛音,光彩;16k16k20kHz20kHz色彩色彩 提升有神秘感;提升有神秘感;3 3、检测输入音频的强度、检测输入音频的强度 在在Win2KWin2K环境下,可通过环境下,可通过“音量控制音量控制”对话框来检测、调对话框来检测、调节进入计算机的音源强度。节进入计算机的音源强度。打开打开WindowsWindows下的音量控制台,选择菜单栏中的下的音量控制台,选择菜单栏中的“选项选

41、项”“属性属性”命令打开命令打开“属性属性”对话框。对话框。图图4-10 4-10 音量控制台音量控制台 在在“属性属性“对话框中的音量调节选项中选择对话框中的音量调节选项中选择“录音录音”,在显示音量控制栏中选中麦克风等选项,如图,在显示音量控制栏中选中麦克风等选项,如图4-114-11所示。所示。在弹出的录音控制台中选中麦克风或线路输入或在弹出的录音控制台中选中麦克风或线路输入或CDCD音频,使相应的音源有效,如图音频,使相应的音源有效,如图4-124-12所示。所示。图图4-11“属性属性”对话框对话框图图4-12录音控制对话框录音控制对话框4 4、开始录音、开始录音图图4-11录音机操

42、作面板录音机操作面板4.5.2 4.5.2 抓取抓取CDCD、VCDVCD和和DVDDVD音轨音轨 获取数字音频的另一个快捷途径就是从不同的多媒体产品中获取数字音频的另一个快捷途径就是从不同的多媒体产品中直接抓取音轨信息,并转换压缩成所需的音频格式。直接抓取音轨信息,并转换压缩成所需的音频格式。WaveLab5.0版版:抓取音乐抓取音乐CD、DVD中的音轨中的音轨“豪杰超级解霸豪杰超级解霸”软件软件:抓取音乐:抓取音乐CD、VCD或或DVD光盘等光盘等格式音轨格式音轨豪杰超级解霸豪杰超级解霸9.0版版:可从:可从DVD、VCD、RM/RMVB、AVI、MPG、MV等音视频混合的媒体中提取音频信

43、息,并保存为一种等音视频混合的媒体中提取音频信息,并保存为一种称为称为DAC高音质压缩格式或高音质压缩格式或WAV、MP3格式的声音文件格式的声音文件 注意:在使用抓取音轨来采集数字音频时,应该遵守有关法注意:在使用抓取音轨来采集数字音频时,应该遵守有关法律规定,取得相应的使用权,避免以后出现知识产权纠纷。律规定,取得相应的使用权,避免以后出现知识产权纠纷。4.5.3 4.5.3 编辑数字音频编辑数字音频 音频编辑一般包括音频编辑一般包括音频内容剪切音频内容剪切、合成合成以及以及音质和效果音质和效果的编辑的编辑等方面。等方面。多音轨(多音轨(Multiple TracksMultiple Tr

44、acks)切边(切边(TrimmingTrimming)拼接和组合(拼接和组合(Splicing and AssemblySplicing and Assembly)音量调节(音量调节(Volume AdjustmentsVolume Adjustments)格式转换(格式转换(Format ConversionFormat Conversion)重采样或降低采样率(重采样或降低采样率(Resampling or Down samplingResampling or Down sampling)淡进淡出(淡进淡出(Fade-ins and Fade-outsFade-ins and Fade-

45、outs)均衡(均衡(EqualizationEqualization)时间拉伸(时间拉伸(Time StretchingTime Stretching)数字信号处理(数字信号处理(Digital Signal Processing-DSPDigital Signal Processing-DSP)4.6 MIDI4.6 MIDI音乐音乐4.6.1 4.6.1 什么是什么是MIDIMIDI MIDI MIDI(Musical Instrument Digital InterfaceMusical Instrument Digital Interface)乐器数)乐器数字接口字接口。它是由。它是

46、由YamahaYamaha、RolandRoland等公司在等公司在19831983年联合提出并不年联合提出并不断发展确定的数字音乐的国际标准,它规定了电子乐器和多媒断发展确定的数字音乐的国际标准,它规定了电子乐器和多媒体计算机之间进行连接的硬件及数据通信协议,是多媒体计算体计算机之间进行连接的硬件及数据通信协议,是多媒体计算机所支持的又一种声音产生方法机所支持的又一种声音产生方法MIDIMIDI方法。方法。MIDIMIDI方法方法就是将数字式电子乐器的弹奏过程记录下来,如就是将数字式电子乐器的弹奏过程记录下来,如选的是什么乐器,弹下哪一个键,用了多大力气,持续了多长选的是什么乐器,弹下哪一个

47、键,用了多大力气,持续了多长时间等。时间等。MIDIMIDI格式的数字化文件格式的数字化文件可以看作是乐谱的数字化描述,它可以看作是乐谱的数字化描述,它记录的不再是声音的波形,而是乐器的种类以及音阶的高低、记录的不再是声音的波形,而是乐器的种类以及音阶的高低、长短、强弱、速度等因素,这些被称为长短、强弱、速度等因素,这些被称为MIDIMIDI消息,存储为消息,存储为MIDIMIDI文件。文件。4.6.2 MIDI4.6.2 MIDI设备的配置与连接设备的配置与连接 一件乐器只要包含了能处理一件乐器只要包含了能处理MIDIMIDI信息的微处理器以及相信息的微处理器以及相关的硬件接口,就可以认为是

48、一台关的硬件接口,就可以认为是一台MIDIMIDI设备设备。两台两台MIDIMIDI设备之间可以通过设备之间可以通过接口发送信息接口发送信息而进行相互通而进行相互通信。信。一台一台MIDIMIDI设备可以有设备可以有1 13 3个端口个端口:uMIDI In MIDI In 接口接口:接收来自其它:接收来自其它MIDIMIDI设备上的设备上的MIDIMIDI信息;信息;uMIDI OutMIDI Out接口接口:用来输出本设备生成的:用来输出本设备生成的MIDIMIDI信息;信息;u MIDI ThruMIDI Thru接口:接口:将从将从MIDI InMIDI In端口传来的信息发送到另端口

49、传来的信息发送到另一台相联的一台相联的MIDIMIDI设备上。设备上。接收设备的接收设备的MIDI InMIDI In连接器内常采用连接器内常采用光电耦合器光电耦合器实现收、发实现收、发设备之间的电气隔离。设备之间的电气隔离。MIDIMIDI信息采用信息采用异步串行方式传输异步串行方式传输,传输速率为,传输速率为31.2531.25KbpsKbps。在进行在进行MIDIMIDI通信时,用户可以通过标准的通信时,用户可以通过标准的MIDIMIDI电缆电缆来相互连来相互连接各端口。如图接各端口。如图4-144-14所示。所示。图图4-14 MIDI4-14 MIDI与游戏接口电缆与游戏接口电缆MI

50、DIMIDI接口接口游戏接口游戏接口InIn和和OutOut图图4-14 4-14 多媒体计算机与多媒体计算机与MIDIMIDI设备连接示意图设备连接示意图 MIDIMIDI软件软件(音(音序器)是用于记录、序器)是用于记录、编辑和播放编辑和播放MIDIMIDI文文件的一种软件,其件的一种软件,其作用相当于是作用相当于是MIDIMIDI乐器的一台多轨磁乐器的一台多轨磁带录音机。带录音机。MIDI MIDI设备可以配备设备可以配备电子键盘、合成器、音序器(电子键盘、合成器、音序器(MIDIMIDI软件)软件)以及扬声器或音箱以及扬声器或音箱等。等。MIDIMIDI键盘键盘主要用于产生主要用于产生

展开阅读全文
相关资源
相关搜索

当前位置:首页 > pptx模板 > 企业培训

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁