《第5章音频处理技术课件.ppt》由会员分享,可在线阅读,更多相关《第5章音频处理技术课件.ppt(62页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第1页第第5章章 音频处理技术音频处理技术本章概述 本章的学习目标主要内容第2页本章概述本章概述l声音是携带信息的非常重要的媒体。声音是携带信息的非常重要的媒体。l在多媒体计算机系统中,通过声音可以传递信息、在多媒体计算机系统中,通过声音可以传递信息、制造效果、营造气氛及演奏音乐等。制造效果、营造气氛及演奏音乐等。l音频处理技术是多媒体技术研究的重要内容之一音频处理技术是多媒体技术研究的重要内容之一, 主要包括模拟声音信号数字化、音频文件存储、主要包括模拟声音信号数字化、音频文件存储、传输、播放、数字音效处理等内容。传输、播放、数字音效处理等内容。l本章主要介绍声音信号及其数字化的基本概念、本
2、章主要介绍声音信号及其数字化的基本概念、音频卡的组成及其工作原理、数字音频的采集与音频卡的组成及其工作原理、数字音频的采集与编辑、编辑、MIDI音乐以及几个常用的音频处理软件等音乐以及几个常用的音频处理软件等内容,并以内容,并以Adobe Audition 3.0为例,详细介绍为例,详细介绍编辑处理声音文件的具体方法。编辑处理声音文件的具体方法。第3页本章的学习目标本章的学习目标l理解音频的基本知识理解音频的基本知识l掌握常用的音频文件格式掌握常用的音频文件格式l理解音频数字化过程理解音频数字化过程l熟练掌握音频的采集及处理熟练掌握音频的采集及处理 第4页主要内容主要内容5.1 音频基本知识音
3、频基本知识5.2 音频数字化音频数字化5.3 音频文件格式音频文件格式5.4 数字音频的采集数字音频的采集5.5 常用音频工具软件常用音频工具软件5.6 基于基于Adobe Audition的音频处理的音频处理5.7 本章小结本章小结第5页5.1 音频基本知识音频基本知识l声音的物理特征声音的物理特征l音频相关概念音频相关概念第6页声音的物理特征声音的物理特征l人的耳朵所感觉到的空气分子的振动就是人的耳朵所感觉到的空气分子的振动就是声音信号,它通常用一种连续的波形来表声音信号,它通常用一种连续的波形来表示。示。声波的振幅与频率声波的振幅与频率波形的最大位移称为振波形的最大位移称为振幅幅A,反映
4、音量。波形,反映音量。波形中两个连续波峰中两个连续波峰(或波或波谷谷)之间的距离称为周之间的距离称为周期期T。周期的倒数。周期的倒数1/T即即为频率为频率f,以赫兹,以赫兹(Hz)为单位。为单位。第7页声音的物理特征声音的物理特征l频率反映了声音的音调,声音按频率可分频率反映了声音的音调,声音按频率可分为三类:为三类:低于低于20Hz的声音称为次声的声音称为次声频率范围在频率范围在20Hz20kHz范围的可听声称为音范围的可听声称为音频频频率高于频率高于20kHz的声音称为超音频的声音称为超音频(或超声或超声)第8页声音的物理特征声音的物理特征l振幅和频率不变的声音为纯音,纯音一般都是用振幅和
5、频率不变的声音为纯音,纯音一般都是用专用电子设备产生的。专用电子设备产生的。l在自然界中,语音、乐声等大多数不是纯音,它在自然界中,语音、乐声等大多数不是纯音,它们都是由不同的振幅和频率组成的复音。们都是由不同的振幅和频率组成的复音。l在复音中最低频一般是一个常数,称为基频,基在复音中最低频一般是一个常数,称为基频,基频是决定声音音调的基本因素。复音中的其他频频是决定声音音调的基本因素。复音中的其他频率通常称为谐音。率通常称为谐音。l基频和谐音组合后,即可形成不同音质和音色的基频和谐音组合后,即可形成不同音质和音色的声音。音色是辨别声音的特征,通过音色能区分声音。音色是辨别声音的特征,通过音色
6、能区分自然界不同的声源。若在传播过程中谐音有所损自然界不同的声源。若在传播过程中谐音有所损失,则可能改变原声源的特征而发生畸变。失,则可能改变原声源的特征而发生畸变。第9页音频相关概念音频相关概念 从处理方式看,目前多媒体计算机中的音频主要从处理方式看,目前多媒体计算机中的音频主要有波形音频、有波形音频、CD音频和音频和MIDI音乐音乐3种形式:种形式:l波形音频波形音频所谓波形音频,就是由外部声音源通过数字化过程采所谓波形音频,就是由外部声音源通过数字化过程采集到多媒体计算机中的所有声音形式,如讲话录音、集到多媒体计算机中的所有声音形式,如讲话录音、流行歌曲、自然界的各种声音等,可通过编辑流
7、行歌曲、自然界的各种声音等,可通过编辑(裁剪、裁剪、合成、效果等合成、效果等)、编码压缩、存储以及还原播放等方式、编码压缩、存储以及还原播放等方式进行处理。进行处理。在波形音频中,人的语音有一类特殊的声音。语音具在波形音频中,人的语音有一类特殊的声音。语音具有内在的语言学、语音学的内涵,例如发音习惯、语有内在的语言学、语音学的内涵,例如发音习惯、语气等。多媒体计算机可以利用特殊的方法分析、研究、气等。多媒体计算机可以利用特殊的方法分析、研究、抽取语音的相关特征,实现对不同语音的分辨、识别抽取语音的相关特征,实现对不同语音的分辨、识别以及通过文字合成语音波形等。以及通过文字合成语音波形等。第10
8、页音频相关概念音频相关概念lCD音频音频CD音频音频(CD-Audio)是存储在音乐是存储在音乐CD光盘中的数字音光盘中的数字音频,可以通过频,可以通过CD-ROM驱动器读取并采集到多媒体计驱动器读取并采集到多媒体计算机系统中,然后以波形音频的相应形式进行存储和算机系统中,然后以波形音频的相应形式进行存储和处理。处理。lMIDI音乐音乐MIDI音乐是一种十分规范的音乐形式,也称音乐是一种十分规范的音乐形式,也称MIDI音频。音频。它将音乐符号化并保存在它将音乐符号化并保存在MIDI文件中,然后通过音乐文件中,然后通过音乐合成器产生相应的声音波形来还原播放。合成器产生相应的声音波形来还原播放。第
9、11页主要内容主要内容5.1 音频基本知识音频基本知识5.2 音频数字化音频数字化5.3 音频文件格式音频文件格式5.4 数字音频的采集数字音频的采集5.5 常用音频工具软件常用音频工具软件5.6 基于基于Adobe Audition的音频处理的音频处理5.7 本章小结本章小结第12页5.2 音频数字化音频数字化l音频是时间的函数,声音信号是振幅随时间连续变化的模音频是时间的函数,声音信号是振幅随时间连续变化的模拟信号。在计算机处理音频信号之前,必须将声音的模拟拟信号。在计算机处理音频信号之前,必须将声音的模拟信号进行数字化,形成数字音频。信号进行数字化,形成数字音频。l数字化的具体过程包括采
10、样、量化和编码数字化的具体过程包括采样、量化和编码3个环节。采样个环节。采样和量化完成模拟信号的数字化表示,编码实现数字音频的和量化完成模拟信号的数字化表示,编码实现数字音频的标准化和数据压缩。标准化和数据压缩。l数字化后的音频质量取决于采样频率、量化位数以及编码数字化后的音频质量取决于采样频率、量化位数以及编码压缩算法等因素。压缩算法等因素。音频数字化过程第13页5.2 音频数字化音频数字化l 采样与采样频率采样与采样频率l 量化与量化级量化与量化级l 声道声道l音频采样的数据量音频采样的数据量l音频数据编码音频数据编码第14页采样与采样频率采样与采样频率l所谓采样就是每间隔一段时间读取一次
11、声音信号所谓采样就是每间隔一段时间读取一次声音信号幅度,使声音信号在时间上被离散化。幅度,使声音信号在时间上被离散化。l采样的主要参数是采样频率。采样的主要参数是采样频率。l采样频率采样频率(Sampling Rate)是指将模拟声音波形是指将模拟声音波形数字化时,每秒钟所抽取声波幅度样本的次数,数字化时,每秒钟所抽取声波幅度样本的次数,其计算单位是其计算单位是kHz(千赫兹千赫兹)。l一般来说,采样频率越高,声音失真越小,但用一般来说,采样频率越高,声音失真越小,但用于存储数字音频的数据量也越大。于存储数字音频的数据量也越大。l采样频率的高低是根据声音信号本身的最高频率采样频率的高低是根据声
12、音信号本身的最高频率和奈奎斯特采样定理和奈奎斯特采样定理(Nyquist theory)决定的。决定的。 第15页采样与采样频率采样与采样频率l奈奎斯特采样定理:设连续信号奈奎斯特采样定理:设连续信号 的频谱的频谱为为 ,以采样间隔,以采样间隔T采样得到离散信号采样得到离散信号 ,如果满足:当如果满足:当 时,时, 是截止频率,是截止频率, 或或 则可以由离散信号则可以由离散信号 完全确定完全确定连续信号连续信号 。当采样频率等于。当采样频率等于 时,时,即即 ,称,称 为奈奎斯特频率。为奈奎斯特频率。l奈奎斯特采样定理指出,采样频率不应低于声音奈奎斯特采样定理指出,采样频率不应低于声音信号最
13、高频率的两倍,这样才能把离散的数字音信号最高频率的两倍,这样才能把离散的数字音频还原为原来的声音。频还原为原来的声音。)(tx)( fx)(nTxcff cf)2/(1Tfc)(nTx)(tx)2/(1T)2/(1cfT )2/(1TfNNf第16页采样与采样频率采样与采样频率l音频的频率范围大约在音频的频率范围大约在20Hz20kHz之间,根据之间,根据采样理论,为了保证声音不失真,采样频率应在采样理论,为了保证声音不失真,采样频率应在40kHz左右。左右。l常用的音频采样率有常用的音频采样率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz(CD音
14、音质质)、48kHz等。等。l采样频率越高,数字音频的音质就越接近原声。采样频率越高,数字音频的音质就越接近原声。第17页量化与量化级量化与量化级l量化就是把采样得到的声音信号幅度转换为数字量化就是把采样得到的声音信号幅度转换为数字值,是声音信号在幅度上被离散化。值,是声音信号在幅度上被离散化。l量化位数是每个采样点能够表示的数据范围,量量化位数是每个采样点能够表示的数据范围,量化位数越多,所得到的量化值越接近原始波形的化位数越多,所得到的量化值越接近原始波形的采样值。采样值。l常用的量化位数有常用的量化位数有8位、位、16位、位、24位。位。l量化位数越高音质越好,数据量也越大。量化位数越高
15、音质越好,数据量也越大。第18页量化与量化级量化与量化级l在多媒体中,对于音频,量化位数可采用在多媒体中,对于音频,量化位数可采用16位,位,对应有对应有65536个量化级;对于语音编码,量化位个量化级;对于语音编码,量化位数可采用数可采用8位,对应有位,对应有256个量化级。个量化级。l量化级的大小决定了声音的动态范围,即被记录量化级的大小决定了声音的动态范围,即被记录和重放的声音最高与最低之间的差值。和重放的声音最高与最低之间的差值。l量化时,每个采样数据均被四舍五入到最接近的量化时,每个采样数据均被四舍五入到最接近的整数,如果波形幅度超过了可用的最大位,波形整数,如果波形幅度超过了可用的
16、最大位,波形的顶部和底部将会被削去,这就是削峰。在量化的顶部和底部将会被削去,这就是削峰。在量化过程中可能会出现噪声,削峰有可能会造成声音过程中可能会出现噪声,削峰有可能会造成声音严重失真。严重失真。第19页声道声道l反映音频数字化质量的另一个因素是声道个数。反映音频数字化质量的另一个因素是声道个数。l记录声音时,如果每次生成一个声波的数据,称记录声音时,如果每次生成一个声波的数据,称为单声道。为单声道。l每次生成两个声波数据,称为双声道每次生成两个声波数据,称为双声道(立体声立体声)。l每次生成两个以上声波数据,称为多声道每次生成两个以上声波数据,称为多声道(环绕立环绕立体声体声)。第20页
17、音频采样的数据量音频采样的数据量l数字音频的采样数据量主要取决于两个因数字音频的采样数据量主要取决于两个因素:素:一是音质因素,它是由采样频率、量化位数和一是音质因素,它是由采样频率、量化位数和声道数声道数3个参数决定的。采样频率越高、量化个参数决定的。采样频率越高、量化位数越多、声道数越多,数字音频的音质就越位数越多、声道数越多,数字音频的音质就越好,反之就越差;好,反之就越差;二是时间因素,采样时间越长,数据量越大。二是时间因素,采样时间越长,数据量越大。第21页音频采样的数据量音频采样的数据量l单位时间的数据量可用下式表示:单位时间的数据量可用下式表示:l 为单位时间的数据量为单位时间的
18、数据量(Kbps), 为采样频率为采样频率(kHz), 为量化位数为量化位数(bit), 为声道数。具体为声道数。具体计算时,需要将单位时间的数据量计算时,需要将单位时间的数据量 与采样时与采样时间间 相乘,并注意采样频率的单位换算。例如,相乘,并注意采样频率的单位换算。例如,对于对于22.05kHz的采样频率,量化位数为的采样频率,量化位数为8位二进位二进制位,单声道制位,单声道10秒钟的采样数据量为秒钟的采样数据量为22.0510008101/8=220500(B)。8sbfvcvcfbstv第22页1分钟声音所需的存储空间分钟声音所需的存储空间 第23页音频数据编码音频数据编码l数字音频
19、的数据量是非常大的,所以音频处理的关键问题数字音频的数据量是非常大的,所以音频处理的关键问题就是要对音频数据进行压缩编码。就是要对音频数据进行压缩编码。l在多媒体计算机系统中,采样量化后的数字音频信号要经在多媒体计算机系统中,采样量化后的数字音频信号要经过编码压缩后才能以音频文件的形式存储或传输,而播放过编码压缩后才能以音频文件的形式存储或传输,而播放音频文件是通过解码器还原后再将音频信号输出。音频文件是通过解码器还原后再将音频信号输出。l为了对音频数据进行有效的压缩,需从采样数据中去除数为了对音频数据进行有效的压缩,需从采样数据中去除数据冗余,同时保证音频质量在许可的可控范围内。据冗余,同时
20、保证音频质量在许可的可控范围内。l人们从音频数据的可能冗余出发,分析研究了不同形式的人们从音频数据的可能冗余出发,分析研究了不同形式的音频数据冗余形式,在统计归纳的基础上,构造了一系列音频数据冗余形式,在统计归纳的基础上,构造了一系列的数据模型,即编码算法,从不同角度实现对音频数据的的数据模型,即编码算法,从不同角度实现对音频数据的有效压缩。有效压缩。第24页音频数据编码音频数据编码l音频数据压缩编码的方法有多种,可分为无损压音频数据压缩编码的方法有多种,可分为无损压缩和有损压缩两大类。缩和有损压缩两大类。无损压缩主要包含各种熵编码。无损压缩主要包含各种熵编码。有损压缩则可分为波形编码、参数编
21、码和同时利用多有损压缩则可分为波形编码、参数编码和同时利用多种技术的混合编码。种技术的混合编码。波形编码是在模拟音频数字化波形编码是在模拟音频数字化(抽样和量化抽样和量化)的过程中,的过程中,根据人耳的听觉特性进行编码,并使编码后的音频信根据人耳的听觉特性进行编码,并使编码后的音频信号与原始信号的波形尽可能匹配,实现数据的压缩。号与原始信号的波形尽可能匹配,实现数据的压缩。波形编码的特点是适应性强,音频质量好,在较高码波形编码的特点是适应性强,音频质量好,在较高码率的条件下可以获得高质量的音频信号,既适合于高率的条件下可以获得高质量的音频信号,既适合于高质量的音频信号,也适合于高保真语音和音乐
22、信号,质量的音频信号,也适合于高保真语音和音乐信号,但波形编码压缩比不大。但波形编码压缩比不大。第25页音频数据编码音频数据编码参数编码把音频信号表示参数编码把音频信号表示成参数编码把音频信号表示参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,并对这些信息进行编码,型参数和激励信号的信息,并对这些信息进行编码,最后在输出端合成原始信号。其目的是重建音频,保最后在输出端合成原始信号。其目的是重建音频,保持原始音频的特性。常用的音频参数有线性预测系数、持原始音频的特性。常用的音频参数有线性预测系数、滤波器组
23、等。参数编码的压缩率很大,但计算量大,滤波器组等。参数编码的压缩率很大,但计算量大,保真度不高,适合于一般语音信号保真度不高,适合于一般语音信号(电话音质电话音质)的编码。的编码。混合编码介于波形编码和参数编码之间,集中了这两混合编码介于波形编码和参数编码之间,集中了这两种方法的优点,可在较低的码率上得到较高的音质。种方法的优点,可在较低的码率上得到较高的音质。第26页主要内容主要内容5.1 音频基本知识音频基本知识5.2 音频数字化音频数字化5.3 音频文件格式音频文件格式5.4 数字音频的采集数字音频的采集5.5 常用音频工具软件常用音频工具软件5.6 基于基于Adobe Audition
24、的音频处理的音频处理5.7 本章小结本章小结第27页5.3 音频文件格式音频文件格式常用的音频文件格式有:常用的音频文件格式有:lWAV格式格式lMP3格式格式lWMA格式格式lMIDI格式格式lCD-DA格式格式lAudio格式格式lRealAudio格式格式lAIFF格式格式第28页音频文件格式音频文件格式lWAV格式格式(.wav)WAV声音格式文件也叫波形声音格式文件也叫波形(WAVE)声音文件,是微软声音文件,是微软公司推出的格式,是公司推出的格式,是Windows所使用的标准数字音频。所使用的标准数字音频。WAV格式存储的采样数据可以用来重现实际声音的波格式存储的采样数据可以用来重
25、现实际声音的波形,这些数据不经过压缩,所有不会失去任何记录信形,这些数据不经过压缩,所有不会失去任何记录信息,音质是最好的,数据体积最大。息,音质是最好的,数据体积最大。Windows录音机就是将原始的声音信号存储为录音机就是将原始的声音信号存储为WAV格格式,大多数压缩格式的声音文件都是在式,大多数压缩格式的声音文件都是在WAV格式的基格式的基础上经过数据的重新编码来压缩其数据量的。础上经过数据的重新编码来压缩其数据量的。第29页音频文件格式音频文件格式lMP3格式格式(.mp3)MP3的全称是的全称是MPEG-1 Layer3音频文件。音频文件。MPEG-1是动态视频压缩标准,其中的声音部
26、分称是动态视频压缩标准,其中的声音部分称MPEG-1音频音频层,它根据压缩质量和编码复制程度划分为三层,即层,它根据压缩质量和编码复制程度划分为三层,即Layer1,Layer2和和Layer3,分别对应,分别对应MP1,MP2和和MP3三种声音文件,并三种声音文件,并且根据不同的用途,使用不同层次的编码。且根据不同的用途,使用不同层次的编码。MPEG音频编码的层次越高,对应的编码越复杂,压缩率也越高。音频编码的层次越高,对应的编码越复杂,压缩率也越高。MP1和和MP2的压缩率分别为的压缩率分别为4:1和和6:18:1,而,而MP3的压缩率则高的压缩率则高达达10:112:1。虽然它是一种有损
27、压缩方式,但它以极小的声音失真换取了较高虽然它是一种有损压缩方式,但它以极小的声音失真换取了较高的压缩比,使得的压缩比,使得MP3不仅在不仅在Internet上广泛传播,而且可以轻而上广泛传播,而且可以轻而易举地下载到便携式数字音频设备中播放。易举地下载到便携式数字音频设备中播放。第30页音频文件格式音频文件格式lWMA格式格式(.wma/.asf/.asx/.wax)WMA(Windows Media Audio)是微软推出的一种音频是微软推出的一种音频压缩格式,它采用流式压缩技术,以减少数据流量但压缩格式,它采用流式压缩技术,以减少数据流量但保持音质的方法来达到比保持音质的方法来达到比MP
28、3压缩率更高的目的,压压缩率更高的目的,压缩率一般都可以达到缩率一般都可以达到1:18左右。左右。WMA支持音频流支持音频流(Stream)技术,适合在网络上在线播技术,适合在网络上在线播放,兼顾了保真度和网络传输需求,成为放,兼顾了保真度和网络传输需求,成为Internet上的上的主要流格式之一主要流格式之一 。第31页音频文件格式音频文件格式lMIDI格式格式(.mid/.rmi/.cmi/.cmf)MIDI(Musical Instrument Digital Interface)文件是国文件是国际际MIDI协会开发的乐器数字接口文件,采用数字方式协会开发的乐器数字接口文件,采用数字方式
29、对乐器所奏出来的声音进行记录。对乐器所奏出来的声音进行记录。MIDI音频与波形音频完全不同,它不对声波进行采样、音频与波形音频完全不同,它不对声波进行采样、量化与编码,而是讲电子乐器键盘的演奏信息量化与编码,而是讲电子乐器键盘的演奏信息(包括键包括键名、力度、时间长短等名、力度、时间长短等)记录下来,这些信息成为记录下来,这些信息成为MIDI信息,是乐谱的一种数字式描述。信息,是乐谱的一种数字式描述。对应于一段音乐的对应于一段音乐的MIDI文件,不记录任何声音信息,文件,不记录任何声音信息,而只是包含一系列产生音乐的而只是包含一系列产生音乐的MIDI消息。播放时只需消息。播放时只需从中读出从中
30、读出MIDI消息,生成所需的乐器声音波形,经放消息,生成所需的乐器声音波形,经放大处理即可输出。大处理即可输出。MIDI文件通常比声音文件小得多。文件通常比声音文件小得多。 第32页音频文件格式音频文件格式lCD-DA格式格式(.cda)CD-Digital Audio(CD-DA)文件是标准光盘文件。这种文件是标准光盘文件。这种格式的文件数据量大、音质好。在格式的文件数据量大、音质好。在Windows操作系统操作系统中可使用中可使用CD播放器进行播放。大多数播放软件都可以播放器进行播放。大多数播放软件都可以播放播放CD格式的文件。格式的文件。lAudio格式格式(.au)Audio文件是文件
31、是SUN公司推出的一种数字音频格式,是公司推出的一种数字音频格式,是为为UNIX系统开发,和系统开发,和WAV非常相像,在大多数的音频非常相像,在大多数的音频编辑软件中支持这种音乐格式。编辑软件中支持这种音乐格式。第33页音频文件格式音频文件格式lRealAudio格式格式(.ra/.rm/.ram)RealAudio是一种流式音频是一种流式音频(Streaming Audio)文件格文件格式,主要适用于在网络上的在线音乐欣赏,它包含在式,主要适用于在网络上的在线音乐欣赏,它包含在Real Networks公司所制定的音频、视频压缩规范公司所制定的音频、视频压缩规范RealMedia中,主要用
32、于在低速率的广域网上实时传中,主要用于在低速率的广域网上实时传输音频信息。输音频信息。lAIFF格式格式(.aif/.aiff)AIFF(Audio Interchange File Format)是是APPLE公司公司开发的一种音频文件格式,被开发的一种音频文件格式,被MACINTOSH平台及其平台及其应用程序所支持。应用程序所支持。第34页主要内容主要内容5.1 音频基本知识音频基本知识5.2 音频数字化音频数字化5.3 音频文件格式音频文件格式5.4 数字音频的采集数字音频的采集5.5 常用音频工具软件常用音频工具软件5.6 基于基于Adobe Audition的音频处理的音频处理5.7
33、 本章小结本章小结第35页5.4 数字音频的采集数字音频的采集l录音采集录音采集l抓取抓取CD、VCD和和DVD音轨音轨l电子合成音乐电子合成音乐第36页录音采集录音采集l1.选择采样参数选择采样参数在自行录制音频文件即采集音频之前,除了要有合适在自行录制音频文件即采集音频之前,除了要有合适的环境和音源外,还需要聘请专业创作人员、音响工的环境和音源外,还需要聘请专业创作人员、音响工程师,租用录音设备等。程师,租用录音设备等。还要根据具体情况和用途确定适当的采样参数。如果还要根据具体情况和用途确定适当的采样参数。如果采样参数选的太低,会导致音质差,因为声音采样的采样参数选的太低,会导致音质差,因
34、为声音采样的采样点太少,难以超过录制过程中固有的噪声水平;采样点太少,难以超过录制过程中固有的噪声水平;如果采样参数太高,虽然音质有了保证,但会产生巨如果采样参数太高,虽然音质有了保证,但会产生巨大的数据量。大的数据量。一段音频只能有一个采样率,而且在录制过程中不能一段音频只能有一个采样率,而且在录制过程中不能修改,所以采集数字音频时首先要根据实际情况选择修改,所以采集数字音频时首先要根据实际情况选择最佳的采样参数,做到音质与数据量的折中考虑,避最佳的采样参数,做到音质与数据量的折中考虑,避免采样过程中出现存储空间不足的现象发生。免采样过程中出现存储空间不足的现象发生。 第37页录音采集录音采
35、集在在Windows XP操作系统中,提供了录音参数的选择操作系统中,提供了录音参数的选择设置功能,其中的音质选择分为设置功能,其中的音质选择分为CD音质、电话质量、音质、电话质量、收音质量和收音质量和Default Quality等等4种,每种音质可选择不种,每种音质可选择不同的参数。同的参数。声音选定声音选定lCD音质的具体参数为音质的具体参数为PCM编码格式,采样频编码格式,采样频率为率为44.100kHz,16位量位量化位数,双声道立体声。化位数,双声道立体声。这组录音参数每秒将产生这组录音参数每秒将产生172KB的数据量。的数据量。lPCM为脉冲编码调制编为脉冲编码调制编码。码。第3
36、8页录音采集录音采集l2.检测输入音频的强度检测输入音频的强度为了防止录音过程中出现失真,需用在录音前进行输为了防止录音过程中出现失真,需用在录音前进行输入音频强度的检测。入音频强度的检测。如果输入强度太低,音量太小,录制结果就会夹杂许如果输入强度太低,音量太小,录制结果就会夹杂许多噪音。如果输入强度过高,音量太大以至于超出允多噪音。如果输入强度过高,音量太大以至于超出允许的范围,录制就会产生失真。许的范围,录制就会产生失真。如果在如果在Windows XP环境下,可通过环境下,可通过“音量控制音量控制”窗窗口来检测、调节进入计算机的音源强度。口来检测、调节进入计算机的音源强度。具体的操作步骤
37、为:双击任务栏上的扬声器,打开具体的操作步骤为:双击任务栏上的扬声器,打开“音量控制音量控制”窗口,将音量调节设置成录音模式,然窗口,将音量调节设置成录音模式,然后确保录音源后确保录音源(麦克风或线路输入等麦克风或线路输入等)被选定。被选定。第39页录音采集录音采集(1) 音量控制对话框音量控制对话框(2) 属性对话框属性对话框(3)音音源源设设置置第40页录音采集录音采集l3.开始录音开始录音在做好以上工作后,就可以使在做好以上工作后,就可以使用用Windows系统中的系统中的“录音机录音机”工具或专门的音频处理软件来工具或专门的音频处理软件来录音。录音。系统中提供的录音机程序只能系统中提供
38、的录音机程序只能录制录制60s的音频数据。如果要录的音频数据。如果要录制更长时间的数字音频,可使制更长时间的数字音频,可使用专门的音频处理软件,不仅用专门的音频处理软件,不仅能够录制任意时长的音频文件,能够录制任意时长的音频文件,还可以提供更为灵活多样的编还可以提供更为灵活多样的编码格式。码格式。录音机界面录音机界面第41页抓取抓取CD、VCD和和DVD音轨音轨l从不同的多媒体产品中直接抓取音轨信息,并转换压缩成从不同的多媒体产品中直接抓取音轨信息,并转换压缩成所需的音频格式是获取数字音频的另一个快捷途径。所需的音频格式是获取数字音频的另一个快捷途径。l一般的音频工具软件都具有直接抓取音乐一般
39、的音频工具软件都具有直接抓取音乐CD的功能。的功能。lWindows自带的自带的Windows Media Player。lWaveLab软件既可直接抓取音乐软件既可直接抓取音乐CD又可以抓取音乐又可以抓取音乐DVD中的音轨。中的音轨。l豪杰超级解霸软件提供了全面的音轨抓取能力,可直接抓豪杰超级解霸软件提供了全面的音轨抓取能力,可直接抓取音乐取音乐CD、VCD或或DVD光盘等格式音轨,也可从光盘等格式音轨,也可从DVD、VCD、RM/RMVB、AVI、MPG、MV等音视频混合的媒等音视频混合的媒体中提取音频信息,并保存为体中提取音频信息,并保存为DAC或或WAV、MP3格式的格式的声音文件。声
40、音文件。第42页电子合成音乐电子合成音乐l什么是什么是MIDIMIDI(Musical Instrument Digital Interface)即乐器数即乐器数字接口。它是在音乐合成器、乐器和计算机之间交换字接口。它是在音乐合成器、乐器和计算机之间交换音乐信息、播放和录制音乐的一种标准协议。音乐信息、播放和录制音乐的一种标准协议。MIDI标标准确定了将计算机与电声乐器、录音设备连接起来所准确定了将计算机与电声乐器、录音设备连接起来所需的电缆线、硬件及通信协议。需的电缆线、硬件及通信协议。从从20世纪世纪80年代初期开始,年代初期开始,MIDI已经逐步被音乐家和已经逐步被音乐家和作曲家广泛接受
41、和使用。作曲家广泛接受和使用。MIDI是乐器和计算机使用的标准语言,是一套指令,是乐器和计算机使用的标准语言,是一套指令,它指示乐器即它指示乐器即MIDI设备要做什么,怎么做,如演奏音设备要做什么,怎么做,如演奏音符、加大音量、生成音响效果等。符、加大音量、生成音响效果等。第43页电子合成音乐电子合成音乐l什么是什么是MIDI当需要播放时,从相应的当需要播放时,从相应的MIDI文件中读出文件中读出MIDI消息,消息,通过音乐合成器产生相应的声音波形,经过放大后,通过音乐合成器产生相应的声音波形,经过放大后,再由扬声器输出。再由扬声器输出。MIDI乐谱播放的质量取决于最终用户的乐谱播放的质量取决
42、于最终用户的MIDI设备。设备。利用利用MIDI技术将电子合成器、电子节奏机技术将电子合成器、电子节奏机(电子鼓机电子鼓机)和和其他电子音源与序列器连接在一起即可演奏模拟出气其他电子音源与序列器连接在一起即可演奏模拟出气势雄伟、音色变化万千的音响效果,又可将演奏中的势雄伟、音色变化万千的音响效果,又可将演奏中的多种按键数据存储起来,极大的改善了音乐演奏的能多种按键数据存储起来,极大的改善了音乐演奏的能力和条件。力和条件。与其他的声音文件相比,与其他的声音文件相比,MIDI音乐文件所占的存储空音乐文件所占的存储空间非常小,特别适合于音乐创作及长时间播放音乐的间非常小,特别适合于音乐创作及长时间播
43、放音乐的需要。需要。第44页电子合成音乐电子合成音乐l制作制作MIDI音乐音乐MIDI是制作原创音乐最快捷、最方便、最灵活的工具。是制作原创音乐最快捷、最方便、最灵活的工具。制作一段原创的制作一段原创的MIDI音乐还需要对音乐有一定的了解,音乐还需要对音乐有一定的了解,并投入一定的时间。并投入一定的时间。为了制作为了制作MIDI音乐,需要构建一套系统,即多媒体计音乐,需要构建一套系统,即多媒体计算机中的声卡需要带一个声音合成器算机中的声卡需要带一个声音合成器(Sound Synthesizer)即即MIDI电子乐器、一个电子乐器、一个MIDI键盘,这样键盘,这样才具备创作才具备创作MIDI音乐
44、的基础条件。音乐的基础条件。第45页电子合成音乐电子合成音乐l制作制作MIDI音乐音乐MIDI电子乐器通过电子乐器通过MIDI接口与计算机相连,计算机通接口与计算机相连,计算机通过音序器软件来采集过音序器软件来采集MIDI电子乐器发出的一系列指令。电子乐器发出的一系列指令。这些指令可记录到以这些指令可记录到以.mid为扩展名的为扩展名的MIDI文件中。文件中。在计算机上音序器可对在计算机上音序器可对MIDI文件进行编辑和修改。文件进行编辑和修改。最后将最后将MIDI指令送往音乐合成器,由音乐合成器将指令送往音乐合成器,由音乐合成器将MIDI指令符号进行解释并产生波形,然后通过声音发指令符号进行
45、解释并产生波形,然后通过声音发生器送往扬声器播放出来。生器送往扬声器播放出来。第46页电子合成音乐电子合成音乐MIDI音乐产生过程音乐产生过程第47页电子合成音乐电子合成音乐l播放播放MIDI音乐:声卡播放音乐:声卡播放MIDI音乐最常用的方法音乐最常用的方法有两种,即频率调制有两种,即频率调制(Frequency Modulation,FM)合成与波表合成。合成与波表合成。FM是运用声音振荡的原理对是运用声音振荡的原理对MIDI进行合成处理的,由进行合成处理的,由于技术本身的局限,很难制出逼真的真实乐器的音色,于技术本身的局限,很难制出逼真的真实乐器的音色,听上去有很强的人工合成的痕迹。听上
46、去有很强的人工合成的痕迹。波表波表(WaveTable)合成是将各种真实乐器所能发出的所合成是将各种真实乐器所能发出的所有声音有声音(包括各个音域、声调包括各个音域、声调)录制下来,存储在声卡的录制下来,存储在声卡的ROM中,称为硬波表。播放时,根据中,称为硬波表。播放时,根据MIDI文件记录的文件记录的乐曲信息向硬波表发出指令,从表格中逐一找出对应乐曲信息向硬波表发出指令,从表格中逐一找出对应的声音信息,经过合成、加工后回放出来。由于它采的声音信息,经过合成、加工后回放出来。由于它采用的是真实乐器的采样,所以效果好于用的是真实乐器的采样,所以效果好于FM。第48页电子合成音乐电子合成音乐l由
47、于由于MIDI与设备有关,同用户使用的播放硬件设与设备有关,同用户使用的播放硬件设备的质量有很大差异。备的质量有很大差异。l目前,目前,MIDI是为多媒体项目创建原始音乐素材的是为多媒体项目创建原始音乐素材的最佳途径,使用最佳途径,使用MIDI能够带来所希望得到的灵活能够带来所希望得到的灵活性和创新。性和创新。l当当MIDI音乐创作完成且能够用于多媒体项目时,音乐创作完成且能够用于多媒体项目时,应该将其转换成数字音频数据来准备发布。应该将其转换成数字音频数据来准备发布。第49页主要内容主要内容5.1 音频基本知识音频基本知识5.2 音频数字化音频数字化5.3 音频文件格式音频文件格式5.4 数
48、字音频的采集数字音频的采集5.5 常用音频工具软件常用音频工具软件5.6 基于基于Adobe Audition的音频处理的音频处理5.7 本章小结本章小结第50页5.5 常用音频工具软件常用音频工具软件lAdobe AuditionAdobe Audition是一个专业音频编辑和混合是一个专业音频编辑和混合环境,功能强大,控制灵活,使用它可以录制、环境,功能强大,控制灵活,使用它可以录制、混合、编辑和控制数字音频文件。混合、编辑和控制数字音频文件。也可轻松创建音乐、制作广播短片、修复录制也可轻松创建音乐、制作广播短片、修复录制缺陷。缺陷。通过与通过与Adobe视频应用程序的智能集成,还可视频应
49、用程序的智能集成,还可将音频和视频内容结合在一起。将音频和视频内容结合在一起。第51页5.5 常用音频工具软件常用音频工具软件lGoldWaveGoldWave是一个集声音编辑、播放、录制和转换的是一个集声音编辑、播放、录制和转换的音频工具,它体积小巧,但功能却很强。音频工具,它体积小巧,但功能却很强。可打开可打开WAV、OGG、VOC、IFF、AIF、AFC、AU、SND、MP3、MAT、DWD、SMP、VOX、SDS、AVI、MOV等格式的音频文件,也可以从等格式的音频文件,也可以从CD、VCD、DVD或其它视频文件中提取声音。或其它视频文件中提取声音。软件内含丰富的音频处理特效,从一般特
50、效如多普勒、软件内含丰富的音频处理特效,从一般特效如多普勒、回声、混响、降噪到高级的公式计算。回声、混响、降噪到高级的公式计算。它能将编辑好的文件存成它能将编辑好的文件存成WAV、AU、SND、RAW、AFC等格式,可以不经由声卡直接抽取等格式,可以不经由声卡直接抽取SCSI CD ROM中的音乐来录制编辑,能够支持以动态压缩保存中的音乐来录制编辑,能够支持以动态压缩保存MP3文件。文件。第52页5.5 常用音频工具软件常用音频工具软件lAll EditorAll Editor不仅是一款超级强大的录音工具,还是一个不仅是一款超级强大的录音工具,还是一个专业的音频编辑软件。专业的音频编辑软件。提