《第2章多媒体创作PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第2章多媒体创作PPT讲稿.ppt(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第2章多媒体创作第1页,共85页,编辑于2022年,星期一第二章第二章 数字音频处理数字音频处理 读者学习本章应重点理解波形音频、读者学习本章应重点理解波形音频、MIDI等常见数字音频的含义、特点及其在计等常见数字音频的含义、特点及其在计算机中的实现方法;理解音频格式的种算机中的实现方法;理解音频格式的种类、音频卡的原理;了解类、音频卡的原理;了解WAV音频低级格音频低级格式分析,能利用式分析,能利用GoldWave进行简单的音频进行简单的音频处理;理解音频编码的一般原理。处理;理解音频编码的一般原理。本章建议学时数:本章建议学时数:6学时。学时数较少学时。学时数较少时可将时可将WAV音频低级
2、格式分析不讲。纯应音频低级格式分析不讲。纯应用专业音频编码也可不讲。用专业音频编码也可不讲。第2页,共85页,编辑于2022年,星期一第第 1 1 课课 在本次课中,我们将从数字音频的在本次课中,我们将从数字音频的概念出发结合声音的特点介绍数字音频概念出发结合声音的特点介绍数字音频在计算机中的实现,在计算机中的实现,音频卡的工作原音频卡的工作原理理。第3页,共85页,编辑于2022年,星期一1.1.上一课回顾上一课回顾2 2.授课内容授课内容本次授课内容属于:本次授课内容属于:第二章第二章 1 1、2 2、3 3节节第4页,共85页,编辑于2022年,星期一1 1 概述概述 一般认为,人的声音
3、是由声道产生,当人说话一般认为,人的声音是由声道产生,当人说话时,在声道里会产生两种类型声音;时,在声道里会产生两种类型声音;一、声音媒体的特征一、声音媒体的特征自然界的声音信号究其本质是一种机械振动,自然界的声音信号究其本质是一种机械振动,是一种在空气中随时间而变化的压力信号。是一种在空气中随时间而变化的压力信号。二、语音媒体二、语音媒体第5页,共85页,编辑于2022年,星期一 第一种类型声音为浊音,为准周期脉冲,各股第一种类型声音为浊音,为准周期脉冲,各股空气之间的间隔称为音调周期空气之间的间隔称为音调周期;第二种类型为清音第二种类型为清音,它是由空气通过声道时,受它是由空气通过声道时,
4、受声道某些部分的压缩而引起,具有更大的随机性声道某些部分的压缩而引起,具有更大的随机性第6页,共85页,编辑于2022年,星期一理想化的话音波形及频谱如下:理想化的话音波形及频谱如下:第7页,共85页,编辑于2022年,星期一 音调与语音的频率有关,音强即声音音调与语音的频率有关,音强即声音的大小,取决于声波的幅度,音色则是的大小,取决于声波的幅度,音色则是由混入基音的泛音所决定由混入基音的泛音所决定2 2结论结论 人的听觉范围最低可达人的听觉范围最低可达2020HzHz,最高可达最高可达2020kHzkHz 语音包含三要素:音调、音强、音色语音包含三要素:音调、音强、音色第8页,共85页,编
5、辑于2022年,星期一三三人的听觉感知机理特征人的听觉感知机理特征:人耳对不同频段的声音的敏感程度不同;人耳对不同频段的声音的敏感程度不同;人耳对语音信号的相位变化不敏感。人耳对语音信号的相位变化不敏感。人的听觉具有掩蔽效应。这便是强音掩蔽弱人的听觉具有掩蔽效应。这便是强音掩蔽弱音,包括同时掩蔽和异时掩蔽两种类型;音,包括同时掩蔽和异时掩蔽两种类型;第9页,共85页,编辑于2022年,星期一四、数字音频四、数字音频 自然界的声音信号究其本质是一种机自然界的声音信号究其本质是一种机械振动,对信号进行处理一般需进行变械振动,对信号进行处理一般需进行变换,对声音信号主要有两种变换器:麦换,对声音信号
6、主要有两种变换器:麦克风,将声音的压力变化信号转换成电克风,将声音的压力变化信号转换成电压信号;喇叭,将电压信号转换成声音压信号;喇叭,将电压信号转换成声音的压力变化信号。的压力变化信号。第10页,共85页,编辑于2022年,星期一 传统电子技术采用模拟音频电子技术处理传统电子技术采用模拟音频电子技术处理声音信号:它以模拟电压的幅度表示声音的声音信号:它以模拟电压的幅度表示声音的强弱,但计算机只认识数字信号强弱,但计算机只认识数字信号 在计算机中,所有信息均以数字表示。在计算机中,所有信息均以数字表示。声音信号也用一系列的数字表示,称为数声音信号也用一系列的数字表示,称为数字音频。字音频。将模
7、拟音频转换为数字音频需经采样、将模拟音频转换为数字音频需经采样、量化两个步骤。量化两个步骤。第11页,共85页,编辑于2022年,星期一五五 音频数字化原理音频数字化原理 把把模模拟拟音音频频信信号号转转换换成成有有限限个个数数字字表表示示的的离离散序列,即音频数字化。散序列,即音频数字化。音音频频数数字字化化需需经经历历采采样样、量量化化、编编码码三三个过程个过程第12页,共85页,编辑于2022年,星期一 音频信号事实上是连续信号,或称连续时间函数音频信号事实上是连续信号,或称连续时间函数x(t)x(t)。用计算机处理这些信号首先必须先对连续信用计算机处理这些信号首先必须先对连续信号进行采
8、样,即按一定的时间间隔(号进行采样,即按一定的时间间隔(T T)取值,得取值,得到到x(nT)x(nT)(n n为整数)。为整数)。T T称为采样周期,称为采样周期,1/1/T T称称为采样频率。称为采样频率。称x(nT)x(nT)为离散信号,其过程如图为离散信号,其过程如图2-2-2-32-3所示。所示。1 1采样采样 采样过程事实上是一个抽样过程。离散信号采样过程事实上是一个抽样过程。离散信号x(nT)x(nT)是从是从连续信号连续信号x(t)x(t)上取出一部分,那么用上取出一部分,那么用x(nT)x(nT)能够能够唯一地恢复出唯一地恢复出x(t)x(t)吗?吗?第13页,共85页,编辑
9、于2022年,星期一 采采样样定定理理告告诉诉我我们们,若若连连续续信信号号x(t)x(t)的的频频谱谱为为x(f)x(f),按按采采样样时时间间间间隔隔T T采采样样取取值值得得到到x(nT)x(nT),如果满足:如果满足:当当|f|fcf|fc时,时,fcfc是截止频率是截止频率 T 1/T 1/(2fc2fc)或或 fcfc 1/1/(2T2T)则可以由离散信号则可以由离散信号x(nT)x(nT)唯一地恢复出唯一地恢复出x(t)x(t)。常用音频采样频率有:常用音频采样频率有:8 8kHzkHz,11.025kHz11.025kHz,22.05kHz22.05kHz,16kHz16kHz
10、,37.8kHz37.8kHz,44.1kHz44.1kHz,48kHz48kHz第14页,共85页,编辑于2022年,星期一2量化量化 由于计算机中只能用由于计算机中只能用0 0和和1 1两个数值表示数据,两个数值表示数据,连续信号连续信号x(t)x(t)经采样变成离散信号经采样变成离散信号x(nT)x(nT)仍需用有仍需用有限个限个0 0和和1 1的序列来表示的序列来表示x(nT)x(nT)的幅度。我们把用的幅度。我们把用有限个数字有限个数字0 0和和1 1表示某一电平范围的模拟离散表示某一电平范围的模拟离散电压信号称为量化。电压信号称为量化。第15页,共85页,编辑于2022年,星期一
11、量量化化过过程程是是一一个个A/DA/D转转换换的的过过程程。在在量量化化过过程程中中,一一个个重重要要的的参参数数便便是是量量化化位位数数,这这不不仅仅决决定定着着声声音音数数据据经经数数字字化化后后的的失失真真度度,更更决决定定着着声声音音数数据据数数据据量量的的大大小小。存存储储数数字字音音频频数据的比特率为:数据的比特率为:I=BI=Bf fs s(比特比特/秒)秒)(2-2-12-2-1)f fs s是采样频率是采样频率 B B是每个样值的比特数是每个样值的比特数第16页,共85页,编辑于2022年,星期一 如如果果量量化化值值是是均均匀匀的的,则则称称为为均均匀匀量量化化,反反之之
12、,则为非均匀量化。则为非均匀量化。在在实实际际使使用用上上,常常常常采采用用均均匀匀量量化化。对对非非均均匀匀量化,可先均匀量化然后用软件进行变换。量化,可先均匀量化然后用软件进行变换。一一般般而而言言,量量化化将将产产生生一一定定的的失失真真,因因此此,量量化化过过程程中中每每个个样样值值的的比比特特数数直直接接决决定定着着量量化化的的精精度。度。声卡的位数事实上便是指量化过程中每个样值的声卡的位数事实上便是指量化过程中每个样值的比特位数,主要有比特位数,主要有8 8位、位、1616位、位、3232位位 几几个等级。个等级。第17页,共85页,编辑于2022年,星期一 有格式的数据才能表达信
13、息的含义。有格式的数据才能表达信息的含义。在实际使用中,主要有在实际使用中,主要有MicrosoftMicrosoft公司为公司为WindowsWindows操作系统定义的数字音频格式操作系统定义的数字音频格式-WaveWave文文件格式,件格式,CreativeCreative公司为公司为DosDos操作系统定义的数操作系统定义的数字音频格式字音频格式-VocVoc文件格式,文件格式,MIDIMIDI规范定义的规范定义的MIDIMIDI标准等标准等3 3 编码并格式化编码并格式化 由于音频数据数据量极大(由于音频数据数据量极大(MIDIMIDI音频例外),因此,在音频例外),因此,在格式化前
14、总是对其进行编码。格式化前总是对其进行编码。第18页,共85页,编辑于2022年,星期一 音音频频信信号号经经数数字字化化以以后后以以文文件件形形式式存存放放于于计计算算机中,当需要声音时计算机将其反格式化并输出。机中,当需要声音时计算机将其反格式化并输出。在在计计算算机机中中,数数字字音音频频可可分分为为波波形形音音频频、语语音和音乐。音和音乐。何为波形音频?何为波形音频?对对声声音音进进行行直直接接数数字字化化处处理理所所得得到到的的结结果果称称为为波波形形音音频频,是是对对外外界界连连续续声声音音波波形形进进行行采采样样并并量量化化的结果。的结果。六、数字音频的输出六、数字音频的输出第1
15、9页,共85页,编辑于2022年,星期一 在在计计算算机机中中,声声音音产产生生有有两两种种方方法法:一一是是录录音音/重放,二是声音合成。重放,二是声音合成。若若采采用用第第一一种种方方法法,首首先先要要把把模模拟拟语语音音信信号号转转换换成成数数字字序序列列,编编码码后后,暂暂存存于于存存储储设设备备中中(录录音音),需需要要时时,再再经经解解码码,重重建建声声音音信信号号(重重放放)。用用这这种种方方法法处处理理产产生生的的声声音音称称为为波波形形音音频频,可可获获得得高高音音质质的的声声音音,并并能能保保留留特特定定人人或或乐乐器器的的特特色色。美美中中不不足足是是所所需需的的存存储储
16、空空间间较大。较大。第20页,共85页,编辑于2022年,星期一 第第二二种种方方法法是是一一种种基基于于声声音音合合成成的的声声音音产产生生技术,包括语音合成、音乐合成两大类。技术,包括语音合成、音乐合成两大类。语语音音合合成成亦亦称称文文-语语转转换换,它它能能把把计计算算机机中中的的文字转换成连续自然的语音流。文字转换成连续自然的语音流。第21页,共85页,编辑于2022年,星期一 若采用这种方法进行语音输出,应先建立语音参若采用这种方法进行语音输出,应先建立语音参数数据库、发音规则库,需要输出语音时,系统按数数据库、发音规则库,需要输出语音时,系统按需求先合成语音单元,再按语音学规则或
17、语言学规需求先合成语音单元,再按语音学规则或语言学规则,连接成自然的语流。则,连接成自然的语流。第二种方法是解决计算机声音输出的最佳方案,第二种方法是解决计算机声音输出的最佳方案,但第二种方法涉及多个科技领域,走向实用有很多但第二种方法涉及多个科技领域,走向实用有很多难点。难点。目前普遍应用的是音乐合成目前普遍应用的是音乐合成第22页,共85页,编辑于2022年,星期一 综综上上所所述述,数数字字音音频频在在计计算算机机中中实实现现需需经经历历音音频频数数字字化化、数数字字音音频频在在计计算算机机中中输输出出两两个个过过程程。在这个实现过程中,音频卡是完成此过程的关键。在这个实现过程中,音频卡
18、是完成此过程的关键。第23页,共85页,编辑于2022年,星期一七七 音频卡工作原理简介音频卡工作原理简介 处处 理理 音音 频频 信信 号号 的的PCPC插插 卡卡 是是 音音 频频 卡卡(Audio Audio CardCard),又称声音卡(简称声卡)。),又称声音卡(简称声卡)。音音频频卡卡分分类类有有多多种种方方法法,根根据据数数据据采采样样量量化化的的位位数来分,通常可分为数来分,通常可分为8 8位、位、1616位、位、3232位等几个等级。位等几个等级。第24页,共85页,编辑于2022年,星期一(一)音频卡的主要功能有:(一)音频卡的主要功能有:1 1音频的录制与播放音频的录制
19、与播放2 2音频文件的编辑与合成音频文件的编辑与合成3 3MIDIMIDI接口和音乐合成接口和音乐合成4 4文语转换和语音识别文语转换和语音识别第25页,共85页,编辑于2022年,星期一(二)(二)音频卡的原理与组成音频卡的原理与组成第26页,共85页,编辑于2022年,星期一第27页,共85页,编辑于2022年,星期一八本课重点与难点八本课重点与难点 重点:数字音频在计算机中实现重点:数字音频在计算机中实现 难点:音频数字化原理难点:音频数字化原理九九 习题习题 2-2 4 2-2 4、5 2-4 15 2-4 1 第28页,共85页,编辑于2022年,星期一下下 课课第29页,共85页,
20、编辑于2022年,星期一第第 2 2 课课 本次课主要介绍本次课主要介绍计算机中的三种常计算机中的三种常见声音见声音,WAVWAV波形音频格式及其处理技波形音频格式及其处理技术。术。学时数较少时可不介绍学时数较少时可不介绍WAVWAV波形音频波形音频格式。格式。第30页,共85页,编辑于2022年,星期一一一 计算机中的三种常见声音计算机中的三种常见声音 目目前前,计计算算机机中中主主要要有有三三种种常常见见声声音音:WAVEWAVE波形音频、波形音频、MIDIMIDI音频和音频和CDCD音频。音频。波波形形音音频频是是应应用用最最广广泛泛的的一一种种数数字字音音频频形形式式,流流行行的的格格
21、式式有有:WAVWAV文文件件格格式式、VOCVOC文文件件格格式式及及MP3,MP3,WMA,WMA,OGG,OGG,MP3pro,MP3pro,AAC,AAC,VQF,VQF,ASFASF等等有有损压缩编码格式。损压缩编码格式。第31页,共85页,编辑于2022年,星期一 WAVWAV波波形形音音频频是是MicrosoftMicrosoft公公司司为为WindowsWindows操操作作系系统统定定义义的的数数字字音音频频格格式式,VOCVOC文文件件是是CreativeCreative公司为公司为DosDos操作系统定义的数字音频格式。操作系统定义的数字音频格式。WAVWAV文文件件、V
22、OCVOC文文件件均均是是声声音音录录制制完完成成后后的的原原始始音音频频格格式式,一一般般不不压压缩缩,因因此此所所占占存存储储空空间间较较大大,尤其不适合于网络传输与发布。尤其不适合于网络传输与发布。第32页,共85页,编辑于2022年,星期一其数据量计算公式如下(单位:字节其数据量计算公式如下(单位:字节/秒):秒):如如1 1分分钟钟的的CDCD音音质质、1616位位立立体体声声音音频频数数据据,其其数数据量为:据量为:第33页,共85页,编辑于2022年,星期一 MP3MP3全全称称是是MPEG MPEG Audio Audio Laye-3Laye-3,具具有有较较高高的的压压缩缩
23、效效率率。VBR(VBR(可可变变编编码码率率)和和ABR(ABR(平平均均编编码码率率)压压缩编码方式引入后,缩编码方式引入后,MP3MP3文件已具有较理想的音质。文件已具有较理想的音质。WMAWMA全全称称Windows Windows Media Media AudioAudio,相相对对于于MP3MP3的的最最大特点就是有极强的可保护性。大特点就是有极强的可保护性。MP3 MP3、WMAWMA均是目前网络上流行的声音媒体格式。均是目前网络上流行的声音媒体格式。第34页,共85页,编辑于2022年,星期一 CDCD音音频频具具有有悠悠久久的的历历史史和和丰丰富富的的资资源源,以以光光盘盘
24、为为载载体体,按按照照音音轨轨组组织织声声音音数数据据。CDCD音音频频记记录录的的依依旧旧是是声声音音的的波波形形,不不过过它它不不是是按按照照文文件件方方式存储组织。式存储组织。第35页,共85页,编辑于2022年,星期一 MIDIMIDI是是 Musical Musical Instrument Instrument Digitial Digitial InterfaceInterface的的缩缩写写,是是音音乐乐与与计计算算机机结结合合的的产产物物,是是一一项项工工业业产产品品的的产产物物,泛泛指指数数字字音音乐乐的的国国际际标标准。准。通俗地说,通俗地说,MIDIMIDI文件记录的是
25、音乐的乐谱。文件记录的是音乐的乐谱。MIDIMIDI给给出出了了在在计计算算机机中中得得到到音音乐乐声声音音的的另另外外一一种种方方法法,且且这这种种方方法法极极为为节节省省空空间间,但但关关键键是是MIDIMIDI音音乐乐作作为为一一种种媒媒体体应应能能记记录录这这些些音音乐乐的的符符号号,相相应应的设备能够产生和解释这些符号。的设备能够产生和解释这些符号。第36页,共85页,编辑于2022年,星期一 必必须须指指出出的的是是,虽虽然然波波形形音音频频能能够够实实现现全全部部的的声声音音,但但MIDIMIDI音音频频、CDCD音音频频亦亦是是不不可可代代替替,这这是是由其本质差异所决定的。由
26、其本质差异所决定的。第37页,共85页,编辑于2022年,星期一 WAV WAV 声音是声音是MicrosoftMicrosoft公司为公司为WindowsWindows操作系统定义的数字音频格式,它是波操作系统定义的数字音频格式,它是波形音频的一种;形音频的一种;二二 WAVWAV声音及其应用声音及其应用 要理解要理解WAVWAV文件格式,首先应了解文件格式,首先应了解WindowsWindows操作系统操作系统RIFFRIFF文件格式。文件格式。RIFF RIFF(Resource Interexchange File Resource Interexchange File FormatF
27、ormat)文件格式是文件格式是IBM/MicrosoftIBM/Microsoft公司为公司为WindowsWindows操作系统定义的资源交换文件操作系统定义的资源交换文件 格式。格式。第38页,共85页,编辑于2022年,星期一 RIFFRIFF文件格式规定文件的基本结构是块,文件格式规定文件的基本结构是块,每个块的前四个字节为块名,接着四个字节每个块的前四个字节为块名,接着四个字节为块数据区大小,块的末尾为第二个四个字为块数据区大小,块的末尾为第二个四个字节规定的数据区大小的数据。节规定的数据区大小的数据。在在WindowsWindows操作系统中,绝大多数文件均操作系统中,绝大多数文
28、件均符合符合RIFFRIFF文件格式,文件格式,WAVWAV文件便是其中之一。文件便是其中之一。RIFFRIFF文件格式认为,文件的基本结构是块;文件格式认为,文件的基本结构是块;第39页,共85页,编辑于2022年,星期一 【例例2.4.12.4.1】分析分析“Windows XP Windows XP 登录音登录音.wav.wav”文件的头数十字节数据内容?文件的头数十字节数据内容?00000000h:52 49 46 46 F8 E6 02 00 00000000h:52 49 46 46 F8 E6 02 00 57 41 56 45 66 6D 74 20 57 41 56 45 6
29、6 6D 74 20 00000010h:10 00 00 00 01 00 02 00 00000010h:10 00 00 00 01 00 02 00 22 56 00 00 88 58 01 00 22 56 00 00 88 58 01 0000000020h:04 00 10 00 64 61 74 61 00000020h:04 00 10 00 64 61 74 61 D4 E6 02 00 00 00 00 00 D4 E6 02 00 00 00 00 0000000030h:00 00 00 00 03 00 01 00 00000030h:00 00 00 00 03
30、00 01 00 07 00 05 00 0F 07 00 05 00 0F 第40页,共85页,编辑于2022年,星期一(1 1)最左边的最左边的8 8个数字表示数据在文件中的位置,每个数字表示数据在文件中的位置,每个数据占个数据占1 1个字节,数据中的每个字母占个字节,数据中的每个字母占4 4个二进制个二进制位。具体分析时,对照位。具体分析时,对照2.4.12.4.1小节定义的表格及小节定义的表格及C C结构,结构,逐组分析上面数据的含义。逐组分析上面数据的含义。第41页,共85页,编辑于2022年,星期一 对照表对照表2.4.1:2.4.1:52 52 49 49 46 46 4646表
31、表示示块块名名,数数据据类类型型为为字字符符,用用ASCASC码表示为码表示为“RIFFRIFF”F8 F8 E6 E6 02 02 0000为为“RIFFRIFF”块块长长度度,数数据据类类型型为为long intlong int,用十进制表示为,用十进制表示为190,200190,200(对对数数值值型型数数据据,计计算算机机中中的的存存储储顺顺序序为为:低低位位在在前前,高高位位在在后后,F8 F8 E6 E6 02 02 0000表表示示1616进进制制数数:2E6 2E6 F8F8),190,200+8=190,208190,200+8=190,208为为“Windows Windo
32、ws XP XP 登登录录音音.wav.wav”文文件件实实际际长长度度;紧紧接接其其后后为为“RIFFRIFF”块块数数据。据。第42页,共85页,编辑于2022年,星期一(2 2)“RIFFRIFF”块块数数据据前前四四个个字字节节57 57 41 41 56 56 4545用用ASCASC码码表表示示为为“WAVEWAVE”,紧紧接接其其后后有有两两个个RIFFRIFF格格式式数据块,其块名分别为:数据块,其块名分别为:“fmt fmt”、“datadata”。(3 3)第第一一个个块块为为“fmt fmt”块块,66 66 6D 6D 74 74 2020用用ASCASC码码表表示示为
33、为“fmt fmt”,10 10 00 00 00 00 0000为为“fmt fmt”块块长长度度(“fmtfmt”块块名名后后的的4 4个个字字节节许许多多实实际际WAVWAV文文件件并并不不严严格格按按照照“fmtfmt”块块长长度度定定义义),用用十十进进制制表表示示为为1616,它它表示后面表示后面1616字节为字节为“fmt fmt”块数据。块数据。第43页,共85页,编辑于2022年,星期一(4 4)“fmt fmt”块块数数据据具具体体含含义义定定义义见见WAVEFORMATWAVEFORMAT,对对照照着着WAVEFORMATWAVEFORMAT结结构构,可可以以看看出出,“
34、Windows Windows XP XP 登登录录音音.wav.wav”为为PCM PCM 编编码码格格式式,22.050 22.050 kHzkHz,16 16 位,位,立体声立体声WAVWAV声音格式文件。声音格式文件。(5 5)该该WAVWAV文文件件没没有有“factfact”块块,“fmt fmt”块块数数据据后后面面为为“datadata”块块,64 64 61 61 74 74 6161用用ASCASC码码表表示示为为“datadata”,D4 D4 E6 E6 02 02 0000为为“datadata”块块长长度度,用用十十进进制制表示为表示为190164190164。第4
35、4页,共85页,编辑于2022年,星期一必必须须指指出出的的是是,“datadata”块块包包含含的的数数字字化化波波形形声声音音数数据据,其其存存放放格格式式依依赖赖于于“fmt fmt”块块指指定定的的格格式式种种类类,单单声声道道样样本本一一般般连连续续存存放放,多多声声道道样样本本一一般般交交替替存放,存放实例如表存放,存放实例如表2.4.32.4.3所示。所示。第45页,共85页,编辑于2022年,星期一 有了有了WAVWAV文件最低级的格式分析,便可以编程文件最低级的格式分析,便可以编程访问访问WAVWAV文件的数据块并进行相应的数据处理,此处文件的数据块并进行相应的数据处理,此处
36、不再另举实例。不再另举实例。三三 通过通过MCIMCI接口使用接口使用WAVWAV文件文件 对多媒体程序开发,对多媒体程序开发,WindowsWindows操作系统将低级驱动操作系统将低级驱动与高级编程相分离,将各种常见媒体定义为多媒体与高级编程相分离,将各种常见媒体定义为多媒体设备,为其编写了低级驱动程序(或由所对应的多设备,为其编写了低级驱动程序(或由所对应的多媒体设备厂商提供),并在低级驱动程序的基础上媒体设备厂商提供),并在低级驱动程序的基础上定义了诸如定义了诸如openopen、stopstop、endend等类似的高级函数接等类似的高级函数接口,称为口,称为MCIMCI(Media
37、 Control Media Control InterfaceInterface)多媒体控制接口。多媒体控制接口。第46页,共85页,编辑于2022年,星期一 在在WindowsWindows系系统统中中,WAVWAV文文件件的的多多媒媒体体设设备备名名为为waveaudiowaveaudio,可可以以通通过过阅阅读读system.inisystem.ini文文件件的的mcimci段得到验证。段得到验证。对对MCIMCI高级函数的调用,高级函数的调用,WindowsWindows系统为其定义了系统为其定义了两种方式:两种方式:1.1.多媒体设备消息方式多媒体设备消息方式 在具体实现上,通过调
38、用在具体实现上,通过调用Windows API Windows API mciSendCommandmciSendCommand函数来实现。函数来实现。2.2.多媒体设备命令字符串方式多媒体设备命令字符串方式 在具体实现上,通过调用在具体实现上,通过调用Windows API Windows API mciSendString mciSendString函数来实现。函数来实现。第47页,共85页,编辑于2022年,星期一 3.3.为方便编程,为方便编程,WindowsWindows提供了一种更为简洁的提供了一种更为简洁的方式,其播放方式,其播放SOUNDER.WAVSOUNDER.WAV文件的
39、程序如下:文件的程序如下:sndPlaySound(sounder.wav,SND_SYNC);sndPlaySound(sounder.wav,SND_SYNC);4.4.高级控件方法高级控件方法第48页,共85页,编辑于2022年,星期一四四 WAVWAV声音的编辑与处理声音的编辑与处理 WAVWAV文文件件为为常常用用音音频频格格式式文文件件,得得到到了了几几乎乎所所有有音音频频处处理理软软件件(如如MediaStudioMediaStudio、WaveStudioWaveStudio、GoldWaveGoldWave、CoolEditCoolEdit等)的支持。等)的支持。下下面面以以
40、GoldWave GoldWave 5.125.12汉汉化化版版为为例例介介绍绍数数字字音音频频编辑与处理的基本知识编辑与处理的基本知识第49页,共85页,编辑于2022年,星期一 GoldWaveGoldWave是是一一个个功功能能强强大大的的专专业业数数字字音音频频编编辑辑软软件件,支支持持几几乎乎所所有有的的数数字字音音频频格格式式,具具有有精精密密的的过过滤滤器器、多多种种专专业业的的音音频频效效果果,通通过过表表达达式式求求值值程程序序,理理论论上上可可以以制制造造任任意意声声音音,支支持持从从简简单单的的声声调调到到复复杂杂的的过过滤滤器器,内内置置的的表表达达式式有有电电话话拨拨
41、号号音音的的声声调、波形和效果等,其工作界面如图调、波形和效果等,其工作界面如图2-4-12-4-1所示所示第50页,共85页,编辑于2022年,星期一 1 1格式转换格式转换GoldWaveGoldWave支支持持几几乎乎所所有有的的数数字字音音频频文文件件格格式式,可可完完成成不不同同类类型型文文件件之之间间的的转转换换,如如将将WAVWAV文文件件转转换换为为mp3mp3格格式式;也也可可完完成成同同一一类类型型文文件件不不同同制制作作格格式式之之间间的转换。具体实现方法如下:的转换。具体实现方法如下:启启动动GoldWaveGoldWave,打打开开待待进进行行格格式式转转换换的的文文
42、件件并并单单击击“文文件件”-“另另存存为为”,在在弹弹出出的的“另另存存为为”任任务务窗窗格格中中,选择你的目标文件保存类型及属性即可。选择你的目标文件保存类型及属性即可。演示演示CDCD抓音轨、抓音轨、mp3mp3制作等制作等第51页,共85页,编辑于2022年,星期一 2.2.波形编辑波形编辑 在图在图2-4-22-4-2所示所示GoldWaveGoldWave工作界面中,屏幕工作界面中,屏幕中央的上下波形便是打开的数字音频文件的具体中央的上下波形便是打开的数字音频文件的具体的数据波形,上面区域对应左声道波形,下面区的数据波形,上面区域对应左声道波形,下面区域对应右声道波形,可利用域对应
43、右声道波形,可利用GoldWaveGoldWave直接对声音直接对声音波形进行编辑,以达到所需要的效果。波形进行编辑,以达到所需要的效果。第52页,共85页,编辑于2022年,星期一 (1 1)波形选择)波形选择 选择要进行操作的波形是波形编辑的第一步。选择要进行操作的波形是波形编辑的第一步。选择具体波形的方法有多种,如鼠标拖动选择。选择具体波形的方法有多种,如鼠标拖动选择。也可在波形图上用鼠标右键确定选择波形的开始和也可在波形图上用鼠标右键确定选择波形的开始和结束标记,参考界面如图结束标记,参考界面如图2-4-32-4-3所示。所示。图中,选中的波形以较亮的颜色并配以蓝色底图中,选中的波形以
44、较亮的颜色并配以蓝色底色显示,未选中的波形以较淡的颜色并配以黑色色显示,未选中的波形以较淡的颜色并配以黑色底色显示底色显示第53页,共85页,编辑于2022年,星期一 (2 2)波形的插入与混入)波形的插入与混入 波形的插入是指在当前打开的音频文件的当前位置波形的插入是指在当前打开的音频文件的当前位置前插入另一段音频波形。波形的混入是指把当前打开前插入另一段音频波形。波形的混入是指把当前打开的音频文件的当前位置之后的音频数据段与另一个音的音频文件的当前位置之后的音频数据段与另一个音频数据段二者合成一个音频数据段。频数据段二者合成一个音频数据段。第54页,共85页,编辑于2022年,星期一 在在
45、GoldWaveGoldWave中实现方法如下:中实现方法如下:选择用于插入的音频数据段,将其复制到剪贴板。选择用于插入的音频数据段,将其复制到剪贴板。打开需要插入的音频文件,选择某个需要插入的波打开需要插入的音频文件,选择某个需要插入的波形段,将复制到剪贴板的音频数据段粘贴到当前段形段,将复制到剪贴板的音频数据段粘贴到当前段即可。即可。在上面的操作中,选择快捷图标混音,实现的是两在上面的操作中,选择快捷图标混音,实现的是两个音频数据段的混音操作。个音频数据段的混音操作。第55页,共85页,编辑于2022年,星期一 (3 3)其它编辑功能)其它编辑功能 常常见见的的音音频频波波形形编编辑辑方方
46、法法有有:回回音音、反反向向、剪剪裁裁等等。在在GoldWaveGoldWave中中实实现现这这些些操操作作也也是是非非常常简简单单,选选择择具具体体的的波波形形段段,选选择择相相应应快快捷捷图图标标即可。即可。利利用用上上面面的的编编辑辑操操作作,不不难难想想象象,将将一一段段录录制制好好的的人人的的说说话话声声音音经经GoldWaveGoldWave编编辑辑处处理理之之后后,达达到到与与说说话话人人本本来来含含义义完完全全相相反反的的效效果果并并非非不不可可能能的。的。第56页,共85页,编辑于2022年,星期一(4 4)其它效果其它效果 利利用用GoldWaveGoldWave对对声声音
47、音做做诸诸如如拷拷贝贝、删删除除、剪剪裁裁等等处处理理当当然然是是最最常常用用的的编编辑辑操操作作,但但如如果果你你想想对对一一段段声声音音进进行行更更精精密密的的处处理理的的时时候候,这这些些功功能能显显然然是是远远远远不不够够的的。GoldWaveGoldWave还还具具有有强强大大的的非非线线性性编编辑辑能能力力,可可实实现现对对波波形形的的特特殊殊效效果果,其其效效果果菜单如图菜单如图2-4-42-4-4所示所示第57页,共85页,编辑于2022年,星期一上机应用题上机应用题1 1请用请用UltraEdit-32UltraEdit-32文字文字/HEX/HEX编辑软件对照编辑软件对照【
48、例例2.4.12.4.1】分析光盘分析光盘N2N2目录下的目录下的“Windows XP Windows XP 登录音登录音.wav.wav”文件文件2 2请用请用GoldWaveGoldWave编辑编辑“Windows XP Windows XP 登录音登录音.wav.wav”声声音文件,具体要求如下:音文件,具体要求如下:(1 1)将其音频波形平坦处音量加大到与非平坦处可以比将其音频波形平坦处音量加大到与非平坦处可以比拟拟(2 2)只保留左声道音频数据,右声道复制一些背景音乐只保留左声道音频数据,右声道复制一些背景音乐(3 3)适当剪裁适当剪裁 第58页,共85页,编辑于2022年,星期一
49、下下 课课第59页,共85页,编辑于2022年,星期一第第3 课课 本次课介绍本次课介绍PCMPCM编码原理及其实现。编码原理及其实现。纯应用专业本课也可不讲,以保证网页设纯应用专业本课也可不讲,以保证网页设计内容的学时数计内容的学时数第60页,共85页,编辑于2022年,星期一1.上一课回顾上一课回顾2.授课内容授课内容 本次授课内容属于:第二章本次授课内容属于:第二章 5 5、6 6节节第61页,共85页,编辑于2022年,星期一引言:引言:编编码码的的目目的的总总是是在在于于压压缩缩数数据据,而而音音频频数数据据存存在压缩的基础。这主要体现在以下几个方面:在压缩的基础。这主要体现在以下几
50、个方面:1.1.时域信息具有较大冗余时域信息具有较大冗余 2.2.频域信息存在冗余频域信息存在冗余 3.3.人的听觉具有其自身的特点人的听觉具有其自身的特点第62页,共85页,编辑于2022年,星期一音频编码的分类如下:音频编码的分类如下:(1 1)基于音频数据的统计特性进行编码,其)基于音频数据的统计特性进行编码,其典型技术是波形编码;典型技术是波形编码;(2 2)基于音频数据的声学参数进行编码。)基于音频数据的声学参数进行编码。(3 3)基于人的听觉特性进行编码。)基于人的听觉特性进行编码。第63页,共85页,编辑于2022年,星期一一、一、PCM编码的含义编码的含义 PCMPCM编码原理