第2章多媒体创作优秀PPT.ppt

上传人:石*** 文档编号:52240633 上传时间:2022-10-22 格式:PPT 页数:85 大小:7.24MB
返回 下载 相关 举报
第2章多媒体创作优秀PPT.ppt_第1页
第1页 / 共85页
第2章多媒体创作优秀PPT.ppt_第2页
第2页 / 共85页
点击查看更多>>
资源描述

《第2章多媒体创作优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第2章多媒体创作优秀PPT.ppt(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第2章多媒体创作现在学习的是第1页,共85页第二章第二章 数字音频处理数字音频处理 读者学习本章应重点理解波形音频、读者学习本章应重点理解波形音频、MIDI等常见数字音频的含义、特点及其在计算等常见数字音频的含义、特点及其在计算机中的实现方法;理解音频格式的种类、机中的实现方法;理解音频格式的种类、音频卡的原理;了解音频卡的原理;了解WAV音频低级格式分音频低级格式分析,能利用析,能利用GoldWave进行简单的音频处理;进行简单的音频处理;理解音频编码的一般原理。理解音频编码的一般原理。本章建议学时数:本章建议学时数:6学时。学时数较少时学时。学时数较少时可将可将WAV音频低级格式分析不讲。

2、纯应音频低级格式分析不讲。纯应用专业音频编码也可不讲。用专业音频编码也可不讲。现在学习的是第2页,共85页第第 1 1 课课 在本次课中,我们将从数字音频的在本次课中,我们将从数字音频的概念出发结合声音的特点介绍数字音概念出发结合声音的特点介绍数字音频在计算机中的实现,频在计算机中的实现,音频卡的工作原音频卡的工作原理理。现在学习的是第3页,共85页1.1.上一课回顾上一课回顾2 2.授课内容授课内容本次授课内容属于:本次授课内容属于:第二章第二章 1 1、2 2、3 3节节现在学习的是第4页,共85页1 1 概述概述 一般认为,人的声音是由声道产生,当人说话一般认为,人的声音是由声道产生,当

3、人说话时,在声道里会产生两种类型声音;时,在声道里会产生两种类型声音;一、声音媒体的特征一、声音媒体的特征自然界的声音信号究其本质是一种机械振动,是自然界的声音信号究其本质是一种机械振动,是一种在空气中随时间而变化的压力信号。一种在空气中随时间而变化的压力信号。二、语音媒体二、语音媒体现在学习的是第5页,共85页 第一种类型声音为浊音,为准周期脉冲,各股第一种类型声音为浊音,为准周期脉冲,各股空气之间的间隔称为音调周期空气之间的间隔称为音调周期;第二种类型为清音第二种类型为清音,它是由空气通过声道时,它是由空气通过声道时,受声道某些部分的压缩而引起,具有更大的随机受声道某些部分的压缩而引起,具

4、有更大的随机性性现在学习的是第6页,共85页理想化的话音波形及频谱如下:理想化的话音波形及频谱如下:现在学习的是第7页,共85页 音调与语音的频率有关,音强即声音音调与语音的频率有关,音强即声音的大小,取决于声波的幅度,音色则是的大小,取决于声波的幅度,音色则是由混入基音的泛音所决定由混入基音的泛音所决定2 2结论结论 人的听觉范围最低可达人的听觉范围最低可达2020HzHz,最高可达最高可达2020kHzkHz 语音包含三要素:音调、音强、音色语音包含三要素:音调、音强、音色现在学习的是第8页,共85页三三人的听觉感知机理特征人的听觉感知机理特征:人耳对不同频段的声音的敏感程度不同;人耳对不

5、同频段的声音的敏感程度不同;人耳对语音信号的相位变化不敏感。人耳对语音信号的相位变化不敏感。人的听觉具有掩蔽效应。这便是强音掩蔽弱人的听觉具有掩蔽效应。这便是强音掩蔽弱音,包括同时掩蔽和异时掩蔽两种类型;音,包括同时掩蔽和异时掩蔽两种类型;现在学习的是第9页,共85页四、数字音频四、数字音频 自然界的声音信号究其本质是一种机械自然界的声音信号究其本质是一种机械振动,对信号进行处理一般需进行变换,振动,对信号进行处理一般需进行变换,对声音信号主要有两种变换器:麦克风,对声音信号主要有两种变换器:麦克风,将声音的压力变化信号转换成电压信号;将声音的压力变化信号转换成电压信号;喇叭,将电压信号转换成

6、声音的压力变化喇叭,将电压信号转换成声音的压力变化信号。信号。现在学习的是第10页,共85页 传统电子技术采用模拟音频电子技术处理传统电子技术采用模拟音频电子技术处理声音信号:它以模拟电压的幅度表示声音的声音信号:它以模拟电压的幅度表示声音的强弱,但计算机只认识数字信号强弱,但计算机只认识数字信号 在计算机中,所有信息均以数字表示。声在计算机中,所有信息均以数字表示。声音信号也用一系列的数字表示,称为数字音频。音信号也用一系列的数字表示,称为数字音频。将模拟音频转换为数字音频需经采样、将模拟音频转换为数字音频需经采样、量化两个步骤。量化两个步骤。现在学习的是第11页,共85页五五 音频数字化原

7、理音频数字化原理 把把模模拟拟音音频频信信号号转转换换成成有有限限个个数数字字表表示示的离散序列,即音频数字化。的离散序列,即音频数字化。音音频频数数字字化化需需经经历历采采样样、量量化化、编编码码三三个个过程过程现在学习的是第12页,共85页 音频信号事实上是连续信号,或称连续时间音频信号事实上是连续信号,或称连续时间函数函数x(t)x(t)。用计算机处理这些信号首先必须先用计算机处理这些信号首先必须先对连续信号进行采样,即按一定的时间间隔对连续信号进行采样,即按一定的时间间隔(T T)取值,得到取值,得到x(nT)x(nT)(n n为整数)。为整数)。T T称为采样称为采样周期,周期,1/

8、1/T T称为采样频率。称称为采样频率。称x(nT)x(nT)为离散信号,为离散信号,其过程如图其过程如图2-2-32-2-3所示。所示。1 1采样采样 采样过程事实上是一个抽样过程。离散信号采样过程事实上是一个抽样过程。离散信号x(nT)x(nT)是是从连续信号从连续信号x(t)x(t)上取出一部分,那么用上取出一部分,那么用x(nT)x(nT)能够能够唯一地恢复出唯一地恢复出x(t)x(t)吗?吗?现在学习的是第13页,共85页 采采样样定定理理告告诉诉我我们们,若若连连续续信信号号x(t)x(t)的的频频谱谱为为x(f)x(f),按按采采样样时时间间间间隔隔T T采采样样取取值值得得到到

9、x(nT)x(nT),如果满足:如果满足:当当|f|fcf|fc时,时,fcfc是截止频率是截止频率 T 1/T 1/(2fc2fc)或或 fcfc 1/1/(2T2T)则可以由离散信号则可以由离散信号x(nT)x(nT)唯一地恢复出唯一地恢复出x(t)x(t)。常用音频采样频率有:常用音频采样频率有:8 8kHzkHz,11.025kHz11.025kHz,22.05kHz22.05kHz,16kHz16kHz,37.8kHz37.8kHz,44.1kHz44.1kHz,48kHz48kHz现在学习的是第14页,共85页2量化量化 由于计算机中只能用由于计算机中只能用0 0和和1 1两个数值

10、表示数据,两个数值表示数据,连续信号连续信号x(t)x(t)经采样变成离散信号经采样变成离散信号x(nT)x(nT)仍需用有仍需用有限个限个0 0和和1 1的序列来表示的序列来表示x(nT)x(nT)的幅度。我们把用有的幅度。我们把用有限个数字限个数字0 0和和1 1表示某一电平范围的模拟离散电表示某一电平范围的模拟离散电压信号称为量化。压信号称为量化。现在学习的是第15页,共85页 量量化化过过程程是是一一个个A/DA/D转转换换的的过过程程。在在量量化化过过程程中中,一一个个重重要要的的参参数数便便是是量量化化位位数数,这这不不仅仅决决定定着着声声音音数数据据经经数数字字化化后后的的失失真

11、真度度,更更决决定定着着声声音音数数据据数数据据量量的的大大小小。存存储储数数字字音音频频数数据据的的比比特率为:特率为:I=BI=Bf fs s(比特比特/秒)秒)(2-2-12-2-1)f fs s是采样频率是采样频率 B B是每个样值的比特数是每个样值的比特数现在学习的是第16页,共85页 如如果果量量化化值值是是均均匀匀的的,则则称称为为均均匀匀量量化化,反反之之,则则为非均匀量化。为非均匀量化。在在实实际际使使用用上上,常常常常采采用用均均匀匀量量化化。对对非非均均匀匀量量化化,可先均匀量化然后用软件进行变换。可先均匀量化然后用软件进行变换。一一般般而而言言,量量化化将将产产生生一一

12、定定的的失失真真,因因此此,量量化化过过程中每个样值的比特数直接决定着量化的精度。程中每个样值的比特数直接决定着量化的精度。声卡的位数事实上便是指量化过程中每个样值声卡的位数事实上便是指量化过程中每个样值的比特位数,主要有的比特位数,主要有8 8位、位、1616位、位、3232位位 几个等级。几个等级。现在学习的是第17页,共85页 有格式的数据才能表达信息的含义。有格式的数据才能表达信息的含义。在实际使用中,主要有在实际使用中,主要有MicrosoftMicrosoft公司为公司为WindowsWindows操作系统定义的数字音频格式操作系统定义的数字音频格式-WaveWave文文件格式,件

13、格式,CreativeCreative公司为公司为DosDos操作系统定义的数操作系统定义的数字音频格式字音频格式-VocVoc文件格式,文件格式,MIDIMIDI规范定义的规范定义的MIDIMIDI标准等标准等3 3 编码并格式化编码并格式化 由于音频数据数据量极大(由于音频数据数据量极大(MIDIMIDI音频例外),因此,在音频例外),因此,在格式化前总是对其进行编码。格式化前总是对其进行编码。现在学习的是第18页,共85页 音音频频信信号号经经数数字字化化以以后后以以文文件件形形式式存存放放于于计计算算机机中中,当当需需要要声声音音时时计计算算机机将将其其反反格格式式化化并并输输出。出。

14、在在计计算算机机中中,数数字字音音频频可可分分为为波波形形音音频频、语语音音和音乐。和音乐。何为波形音频?何为波形音频?对对声声音音进进行行直直接接数数字字化化处处理理所所得得到到的的结结果果称称为为波波形形音音频频,是是对对外外界界连连续续声声音音波波形形进进行行采采样样并并量化的结果。量化的结果。六、数字音频的输出六、数字音频的输出现在学习的是第19页,共85页 在在计计算算机机中中,声声音音产产生生有有两两种种方方法法:一一是是录音录音/重放,二是声音合成。重放,二是声音合成。若若采采用用第第一一种种方方法法,首首先先要要把把模模拟拟语语音音信信号号转转换换成成数数字字序序列列,编编码码

15、后后,暂暂存存于于存存储储设设备备中中(录录音音),需需要要时时,再再经经解解码码,重重建建声声音音信信号号(重重放放)。用用这这种种方方法法处处理理产产生生的的声声音音称称为为波波形形音音频频,可可获获得得高高音音质质的的声声音音,并并能能保保留留特特定定人人或或乐乐器器的的特特色色。美美中中不不足足是是所所需需的的存存储储空空间较大。间较大。现在学习的是第20页,共85页 第第二二种种方方法法是是一一种种基基于于声声音音合合成成的的声声音音产产生技术,包括语音合成、音乐合成两大类。生技术,包括语音合成、音乐合成两大类。语语音音合合成成亦亦称称文文-语语转转换换,它它能能把把计计算算机机中中

16、的文字转换成连续自然的语音流。的文字转换成连续自然的语音流。现在学习的是第21页,共85页 若采用这种方法进行语音输出,应先建立语音若采用这种方法进行语音输出,应先建立语音参数数据库、发音规则库,需要输出语音时,系参数数据库、发音规则库,需要输出语音时,系统按需求先合成语音单元,再按语音学规则或语统按需求先合成语音单元,再按语音学规则或语言学规则,连接成自然的语流。言学规则,连接成自然的语流。第二种方法是解决计算机声音输出的最佳方案,第二种方法是解决计算机声音输出的最佳方案,但第二种方法涉及多个科技领域,走向实用有很但第二种方法涉及多个科技领域,走向实用有很多难点。多难点。目前普遍应用的是音乐

17、合成目前普遍应用的是音乐合成现在学习的是第22页,共85页 综综上上所所述述,数数字字音音频频在在计计算算机机中中实实现现需需经经历历音音频频数数字字化化、数数字字音音频频在在计计算算机机中中输输出出两两个个过过程程。在在这这个个实实现现过过程程中中,音音频频卡卡是是完完成成此此过过程程的关键。的关键。现在学习的是第23页,共85页七七 音频卡工作原理简介音频卡工作原理简介 处处理理音音频频信信号号的的PCPC插插卡卡是是音音频频卡卡(Audio Audio CardCard),又称声音卡(简称声卡)。),又称声音卡(简称声卡)。音音频频卡卡分分类类有有多多种种方方法法,根根据据数数据据采采样

18、样量量化化的的位位数来分,通常可分为数来分,通常可分为8 8位、位、1616位、位、3232位等几个等级。位等几个等级。现在学习的是第24页,共85页(一)音频卡的主要功能有:(一)音频卡的主要功能有:1 1音频的录制与播放音频的录制与播放2 2音频文件的编辑与合成音频文件的编辑与合成3 3MIDIMIDI接口和音乐合成接口和音乐合成4 4文语转换和语音识别文语转换和语音识别现在学习的是第25页,共85页(二)(二)音频卡的原理与组成音频卡的原理与组成现在学习的是第26页,共85页现在学习的是第27页,共85页八本课重点与难点八本课重点与难点 重点:数字音频在计算机中实现重点:数字音频在计算机

19、中实现 难点:音频数字化原理难点:音频数字化原理九九 习题习题 2-2 4 2-2 4、5 2-4 15 2-4 1 现在学习的是第28页,共85页下下 课课现在学习的是第29页,共85页第第 2 2 课课 本次课主要介绍本次课主要介绍计算机中的三种常见计算机中的三种常见声音声音,WAVWAV波形音频格式及其处理技术。波形音频格式及其处理技术。学时数较少时可不介绍学时数较少时可不介绍WAVWAV波形音频波形音频格式。格式。现在学习的是第30页,共85页一一 计算机中的三种常见声音计算机中的三种常见声音 目目前前,计计算算机机中中主主要要有有三三种种常常见见声声音音:WAVEWAVE波波形音频、

20、形音频、MIDIMIDI音频和音频和CDCD音频。音频。波波形形音音频频是是应应用用最最广广泛泛的的一一种种数数字字音音频频形形式式,流流行行的的格格式式有有:WAVWAV文文件件格格式式、VOCVOC文文件件格格式式及及MP3,MP3,WMA,WMA,OGG,OGG,MP3pro,MP3pro,AAC,AAC,VQF,VQF,ASFASF等等有有损损压压缩缩编编码码格式。格式。现在学习的是第31页,共85页 WAVWAV波波形形音音频频是是MicrosoftMicrosoft公公司司为为WindowsWindows操操作作系系统统定定义义的的数数字字音音频频格格式式,VOCVOC文文件件是是

21、CreativeCreative公公司为司为DosDos操作系统定义的数字音频格式。操作系统定义的数字音频格式。WAVWAV文文件件、VOCVOC文文件件均均是是声声音音录录制制完完成成后后的的原原始始音音频频格格式式,一一般般不不压压缩缩,因因此此所所占占存存储储空空间间较较大,尤其不适合于网络传输与发布。大,尤其不适合于网络传输与发布。现在学习的是第32页,共85页其数据量计算公式如下(单位:字节其数据量计算公式如下(单位:字节/秒):秒):如如1 1分分钟钟的的CDCD音音质质、1616位位立立体体声声音音频频数数据据,其其数数据量为:据量为:现在学习的是第33页,共85页 MP3MP3

22、全全称称是是MPEG MPEG Audio Audio Laye-3Laye-3,具具有有较较高高的的压压缩缩效效率率。VBR(VBR(可可变变编编码码率率)和和ABR(ABR(平平均均编编码码率率)压压缩缩编码方式引入后,编码方式引入后,MP3MP3文件已具有较理想的音质。文件已具有较理想的音质。WMAWMA全全称称Windows Windows Media Media AudioAudio,相相对对于于MP3MP3的最大特点就是有极强的可保护性。的最大特点就是有极强的可保护性。MP3MP3、WMAWMA均均是是目目前前网网络络上上流流行行的的声声音音媒媒体体格格式。式。现在学习的是第34页

23、,共85页 CDCD音音频频具具有有悠悠久久的的历历史史和和丰丰富富的的资资源源,以以光光盘盘为为载载体体,按按照照音音轨轨组组织织声声音音数数据据。CDCD音音频频记记录录的的依依旧旧是是声声音音的的波波形形,不不过过它它不不是是按按照照文文件件方方式式存存储储组织。组织。现在学习的是第35页,共85页 MIDIMIDI是是 Musical Musical Instrument Instrument Digitial Digitial InterfaceInterface的的缩缩写写,是是音音乐乐与与计计算算机机结结合合的的产产物物,是是一一项项工工业业产产品品的的产产物物,泛泛指指数数字字

24、音音乐乐的的国国际际标准。标准。通俗地说,通俗地说,MIDIMIDI文件记录的是音乐的乐谱。文件记录的是音乐的乐谱。MIDIMIDI给给出出了了在在计计算算机机中中得得到到音音乐乐声声音音的的另另外外一一种种方方法法,且且这这种种方方法法极极为为节节省省空空间间,但但关关键键是是MIDIMIDI音音乐乐作作为为一一种种媒媒体体应应能能记记录录这这些些音音乐乐的的符符号号,相应的设备能够产生和解释这些符号。相应的设备能够产生和解释这些符号。现在学习的是第36页,共85页 必必须须指指出出的的是是,虽虽然然波波形形音音频频能能够够实实现现全全部部的的声声音音,但但MIDIMIDI音音频频、CDCD

25、音音频频亦亦是是不不可可代代替替,这这是是由其本质差异所决定的。由其本质差异所决定的。现在学习的是第37页,共85页 WAV WAV 声音是声音是MicrosoftMicrosoft公司为公司为WindowsWindows操作系统定义的数字音频格式,它是波操作系统定义的数字音频格式,它是波形音频的一种;形音频的一种;二二 WAVWAV声音及其应用声音及其应用 要理解要理解WAVWAV文件格式,首先应了解文件格式,首先应了解WindowsWindows操作系统操作系统RIFFRIFF文件格式。文件格式。RIFF RIFF(Resource Interexchange File Resource

26、Interexchange File FormatFormat)文件格式是文件格式是IBM/MicrosoftIBM/Microsoft公司为公司为WindowsWindows操作系统定义的资源交换文件操作系统定义的资源交换文件 格式。格式。现在学习的是第38页,共85页 RIFFRIFF文件格式规定文件的基本结构是块,文件格式规定文件的基本结构是块,每个块的前四个字节为块名,接着四个字节每个块的前四个字节为块名,接着四个字节为块数据区大小,块的末尾为第二个四个字为块数据区大小,块的末尾为第二个四个字节规定的数据区大小的数据。节规定的数据区大小的数据。在在WindowsWindows操作系统中

27、,绝大多数文件均操作系统中,绝大多数文件均符合符合RIFFRIFF文件格式,文件格式,WAVWAV文件便是其中之一。文件便是其中之一。RIFFRIFF文件格式认为,文件的基本结构是块;文件格式认为,文件的基本结构是块;现在学习的是第39页,共85页 【例例2.4.12.4.1】分析分析“Windows XP Windows XP 登录音登录音.wav.wav”文件的头数十字节数据内容?文件的头数十字节数据内容?00000000h:52 49 46 46 F8 E6 02 00 00000000h:52 49 46 46 F8 E6 02 00 57 41 56 45 66 6D 74 20 5

28、7 41 56 45 66 6D 74 20 00000010h:10 00 00 00 01 00 02 00 00000010h:10 00 00 00 01 00 02 00 22 56 00 00 88 58 01 00 22 56 00 00 88 58 01 0000000020h:04 00 10 00 64 61 74 61 00000020h:04 00 10 00 64 61 74 61 D4 E6 02 00 00 00 00 00 D4 E6 02 00 00 00 00 0000000030h:00 00 00 00 03 00 01 00 00000030h:00

29、00 00 00 03 00 01 00 07 00 05 00 0F 07 00 05 00 0F 现在学习的是第40页,共85页(1 1)最左边的最左边的8 8个数字表示数据在文件中的位置,每个个数字表示数据在文件中的位置,每个数据占数据占1 1个字节,数据中的每个字母占个字节,数据中的每个字母占4 4个二进制位。个二进制位。具体分析时,对照具体分析时,对照2.4.12.4.1小节定义的表格及小节定义的表格及C C结构,逐组结构,逐组分析上面数据的含义。分析上面数据的含义。现在学习的是第41页,共85页 对照表对照表2.4.1:2.4.1:52 52 49 49 46 46 4646表表示

30、示块块名名,数数据据类类型型为为字字符符,用用ASCASC码表示为码表示为“RIFFRIFF”F8 F8 E6 E6 02 02 0000为为“RIFFRIFF”块块长长度度,数数据据类类型型为为long intlong int,用十进制表示为,用十进制表示为190,200190,200(对对数数值值型型数数据据,计计算算机机中中的的存存储储顺顺序序为为:低低位位在在前前,高高位位在在后后,F8 F8 E6 E6 02 02 0000表表示示1616进进制制数数:2E6 2E6 F8F8),190,200+8=190,208190,200+8=190,208为为“Windows Windows

31、 XP XP 登登录录音音.wav.wav”文文件件实实际际长长度度;紧紧接接其其后后为为“RIFFRIFF”块块数据。数据。现在学习的是第42页,共85页(2 2)“RIFFRIFF”块块数数据据前前四四个个字字节节57 57 41 41 56 56 4545用用ASCASC码码表表示示为为“WAVEWAVE”,紧紧接接其其后后有有两两个个RIFFRIFF格格式数据块,其块名分别为:式数据块,其块名分别为:“fmt fmt”、“datadata”。(3 3)第第一一个个块块为为“fmt fmt”块块,66 66 6D 6D 74 74 2020用用ASCASC码码表表示示为为“fmt fmt

32、”,10 10 00 00 00 00 0000为为“fmt fmt”块块长长度度(“fmtfmt”块块名名后后的的4 4个个字字节节许许多多实实际际WAVWAV文文件件并并不不严严格格按按照照“fmtfmt”块块长长度度定定义义),用用十十进进制制表表示示为为1616,它表示后面,它表示后面1616字节为字节为“fmt fmt”块数据。块数据。现在学习的是第43页,共85页(4 4)“fmt fmt”块块数数据据具具体体含含义义定定义义见见WAVEFORMATWAVEFORMAT,对对照照着着WAVEFORMATWAVEFORMAT结结构构,可可以以看看出出,“Windows Windows

33、 XP XP 登登录录音音.wav.wav”为为PCM PCM 编编码码格格式式,22.050 22.050 kHzkHz,16 16 位,位,立体声立体声WAVWAV声音格式文件。声音格式文件。(5 5)该该WAVWAV文文件件没没有有“factfact”块块,“fmt fmt”块块数数据据后后面面为为“datadata”块块,64 64 61 61 74 74 6161用用ASCASC码码表表示示为为“datadata”,D4 D4 E6 E6 02 02 0000为为“datadata”块块长长度度,用用十十进进制表示为制表示为190164190164。现在学习的是第44页,共85页必必

34、须须指指出出的的是是,“datadata”块块包包含含的的数数字字化化波波形形声声音音数数据据,其其存存放放格格式式依依赖赖于于“fmt fmt”块块指指定定的的格格式式种种类类,单单声声道道样样本本一一般般连连续续存存放放,多多声声道道样样本本一一般般交交替存放,存放实例如表替存放,存放实例如表2.4.32.4.3所示。所示。现在学习的是第45页,共85页 有了有了WAVWAV文件最低级的格式分析,便可以编文件最低级的格式分析,便可以编程访问程访问WAVWAV文件的数据块并进行相应的数据处理,文件的数据块并进行相应的数据处理,此处不再另举实例。此处不再另举实例。三三 通过通过MCIMCI接口

35、使用接口使用WAVWAV文件文件 对多媒体程序开发,对多媒体程序开发,WindowsWindows操作系统将低级驱动操作系统将低级驱动与高级编程相分离,将各种常见媒体定义为多媒体与高级编程相分离,将各种常见媒体定义为多媒体设备,为其编写了低级驱动程序(或由所对应的多设备,为其编写了低级驱动程序(或由所对应的多媒体设备厂商提供),并在低级驱动程序的基础上媒体设备厂商提供),并在低级驱动程序的基础上定义了诸如定义了诸如openopen、stopstop、endend等类似的高级函数接口,等类似的高级函数接口,称为称为MCIMCI(Media Control InterfaceMedia Contr

36、ol Interface)多多媒体控制接口。媒体控制接口。现在学习的是第46页,共85页 在在WindowsWindows系系统统中中,WAVWAV文文件件的的多多媒媒体体设设备备名名为为waveaudiowaveaudio,可可以以通通过过阅阅读读system.inisystem.ini文文件件的的mcimci段得到验证。段得到验证。对对MCIMCI高级函数的调用,高级函数的调用,WindowsWindows系统为其定义了两系统为其定义了两种方式:种方式:1.1.多媒体设备消息方式多媒体设备消息方式 在具体实现上,通过调用在具体实现上,通过调用Windows API Windows API

37、mciSendCommandmciSendCommand函数来实现。函数来实现。2.2.多媒体设备命令字符串方式多媒体设备命令字符串方式 在具体实现上,通过调用在具体实现上,通过调用Windows API Windows API mciSendString mciSendString函数来实现。函数来实现。现在学习的是第47页,共85页 3.3.为方便编程,为方便编程,WindowsWindows提供了一种更为简洁的方提供了一种更为简洁的方式,其播放式,其播放SOUNDER.WAVSOUNDER.WAV文件的程序如下:文件的程序如下:sndPlaySound(sounder.wav,SND_S

38、YNC);sndPlaySound(sounder.wav,SND_SYNC);4.4.高级控件方法高级控件方法现在学习的是第48页,共85页四四 WAVWAV声音的编辑与处理声音的编辑与处理 WAVWAV文文件件为为常常用用音音频频格格式式文文件件,得得到到了了几几乎乎所所 有有 音音 频频 处处 理理 软软 件件(如如 MediaStudioMediaStudio、WaveStudioWaveStudio、GoldWaveGoldWave、CoolEditCoolEdit等)的支持。等)的支持。下下面面以以GoldWave GoldWave 5.125.12汉汉化化版版为为例例介介绍绍数数

39、字字音音频编辑与处理的基本知识频编辑与处理的基本知识现在学习的是第49页,共85页 GoldWaveGoldWave是是一一个个功功能能强强大大的的专专业业数数字字音音频频编编辑辑软软件件,支支持持几几乎乎所所有有的的数数字字音音频频格格式式,具具有有精精密密的的过过滤滤器器、多多种种专专业业的的音音频频效效果果,通通过过表表达达式式求求值值程程序序,理理论论上上可可以以制制造造任任意意声声音音,支支持持从从简简单单的的声声调调到到复复杂杂的的过过滤滤器器,内内置置的的表表达达式式有有电电话话拨拨号号音音的的声声调调、波波形形和和效效果果等等,其其工工作界面如图作界面如图2-4-12-4-1所

40、示所示现在学习的是第50页,共85页 1 1格式转换格式转换GoldWaveGoldWave支支持持几几乎乎所所有有的的数数字字音音频频文文件件格格式式,可可完完成成不不同同类类型型文文件件之之间间的的转转换换,如如将将WAVWAV文文件件转转换换为为mp3mp3格格式式;也也可可完完成成同同一一类类型型文文件件不不同同制制作作格格式式之间的转换。具体实现方法如下:之间的转换。具体实现方法如下:启启动动GoldWaveGoldWave,打打开开待待进进行行格格式式转转换换的的文文件件并并单单击击“文文件件”-“另另存存为为”,在在弹弹出出的的“另另存存为为”任任务务窗窗格格中,选择你的目标文件

41、保存类型及属性即可。中,选择你的目标文件保存类型及属性即可。演示演示CDCD抓音轨、抓音轨、mp3mp3制作等制作等现在学习的是第51页,共85页 2.2.波形编辑波形编辑 在图在图2-4-22-4-2所示所示GoldWaveGoldWave工作界面中,屏幕工作界面中,屏幕中央的上下波形便是打开的数字音频文件的具体中央的上下波形便是打开的数字音频文件的具体的数据波形,上面区域对应左声道波形,下面区的数据波形,上面区域对应左声道波形,下面区域对应右声道波形,可利用域对应右声道波形,可利用GoldWaveGoldWave直接对声音直接对声音波形进行编辑,以达到所需要的效果。波形进行编辑,以达到所需

42、要的效果。现在学习的是第52页,共85页 (1 1)波形选择)波形选择 选择要进行操作的波形是波形编辑的第一步。选择要进行操作的波形是波形编辑的第一步。选择具体波形的方法有多种,如鼠标拖动选择。选择具体波形的方法有多种,如鼠标拖动选择。也可在波形图上用鼠标右键确定选择波形的开始也可在波形图上用鼠标右键确定选择波形的开始和结束标记,参考界面如图和结束标记,参考界面如图2-4-32-4-3所示。所示。图中,选中的波形以较亮的颜色并配以蓝色底图中,选中的波形以较亮的颜色并配以蓝色底色显示,未选中的波形以较淡的颜色并配以黑色色显示,未选中的波形以较淡的颜色并配以黑色底色显示底色显示现在学习的是第53页

43、,共85页 (2 2)波形的插入与混入)波形的插入与混入 波形的插入是指在当前打开的音频文件的当前波形的插入是指在当前打开的音频文件的当前位置前插入另一段音频波形。波形的混入是指把位置前插入另一段音频波形。波形的混入是指把当前打开的音频文件的当前位置之后的音频数据当前打开的音频文件的当前位置之后的音频数据段与另一个音频数据段二者合成一个音频数据段。段与另一个音频数据段二者合成一个音频数据段。现在学习的是第54页,共85页 在在GoldWaveGoldWave中实现方法如下:中实现方法如下:选择用于插入的音频数据段,将其复制到剪贴选择用于插入的音频数据段,将其复制到剪贴板。打开需要插入的音频文件

44、,选择某个需要插板。打开需要插入的音频文件,选择某个需要插入的波形段,将复制到剪贴板的音频数据段粘贴入的波形段,将复制到剪贴板的音频数据段粘贴到当前段即可。到当前段即可。在上面的操作中,选择快捷图标混音,实现的是两在上面的操作中,选择快捷图标混音,实现的是两个音频数据段的混音操作。个音频数据段的混音操作。现在学习的是第55页,共85页 (3 3)其它编辑功能)其它编辑功能 常常见见的的音音频频波波形形编编辑辑方方法法有有:回回音音、反反向向、剪剪裁裁等等。在在GoldWaveGoldWave中中实实现现这这些些操操作作也也是是非非常常简简单,选择具体的波形段,选择相应快捷图标即可。单,选择具体

45、的波形段,选择相应快捷图标即可。利利用用上上面面的的编编辑辑操操作作,不不难难想想象象,将将一一段段录录制制好好的的人人的的说说话话声声音音经经GoldWaveGoldWave编编辑辑处处理理之之后后,达达到到与与说说话话人人本本来来含含义义完完全全相相反反的的效效果果并并非非不不可可能能的。的。现在学习的是第56页,共85页(4 4)其它效果其它效果 利利用用GoldWaveGoldWave对对声声音音做做诸诸如如拷拷贝贝、删删除除、剪剪裁裁等等处处理理当当然然是是最最常常用用的的编编辑辑操操作作,但但如如果果你你想想对对一一段段声声音音进进行行更更精精密密的的处处理理的的时时候候,这这些些

46、功功能能显显然然是是远远远远不不够够的的。GoldWaveGoldWave还还具具有有强强大大的的非非线线性性编编辑辑能能力力,可可实实现现对对波波形形的的特特殊殊效效果果,其效果菜单如图其效果菜单如图2-4-42-4-4所示所示现在学习的是第57页,共85页上机应用题上机应用题1 1请用请用UltraEdit-32UltraEdit-32文字文字/HEX/HEX编辑软件对照编辑软件对照【例例2.4.12.4.1】分析光盘分析光盘N2N2目录下的目录下的“Windows XP Windows XP 登录音登录音.wav.wav”文件文件2 2请用请用GoldWaveGoldWave编辑编辑“W

47、indows XP Windows XP 登录音登录音.wav.wav”声音声音文件,具体要求如下:文件,具体要求如下:(1 1)将其音频波形平坦处音量加大到与非平坦处可将其音频波形平坦处音量加大到与非平坦处可以比拟以比拟(2 2)只保留左声道音频数据,右声道复制一些背景音乐只保留左声道音频数据,右声道复制一些背景音乐(3 3)适当剪裁适当剪裁 现在学习的是第58页,共85页下下 课课现在学习的是第59页,共85页第第3 课课 本次课介绍本次课介绍PCMPCM编码原理及其实现。编码原理及其实现。纯应用专业本课也可不讲,以保证网页设纯应用专业本课也可不讲,以保证网页设计内容的学时数计内容的学时数

48、现在学习的是第60页,共85页1.上一课回顾上一课回顾2.授课内容授课内容 本次授课内容属于:第二章本次授课内容属于:第二章 5 5、6 6节节现在学习的是第61页,共85页引言:引言:编编码码的的目目的的总总是是在在于于压压缩缩数数据据,而而音音频频数数据据存存在在压压缩缩的基础。这主要体现在以下几个方面:的基础。这主要体现在以下几个方面:1.1.时域信息具有较大冗余时域信息具有较大冗余 2.2.频域信息存在冗余频域信息存在冗余 3.3.人的听觉具有其自身的特点人的听觉具有其自身的特点现在学习的是第62页,共85页音频编码的分类如下:音频编码的分类如下:(1 1)基于音频数据的统计特性进行编

49、码,其典)基于音频数据的统计特性进行编码,其典型技术是波形编码;型技术是波形编码;(2 2)基于音频数据的声学参数进行编码。)基于音频数据的声学参数进行编码。(3 3)基于人的听觉特性进行编码。)基于人的听觉特性进行编码。现在学习的是第63页,共85页一、一、PCM编码的含义编码的含义 PCMPCM编码原理在第二节数字音频在计算机中编码原理在第二节数字音频在计算机中的实现已经涉及过,的实现已经涉及过,PCMPCM编码的过程事实编码的过程事实上是将连续模拟信号变成离散的幅度信上是将连续模拟信号变成离散的幅度信号、再把离散的幅度信号变成离散的数号、再把离散的幅度信号变成离散的数字信号的过程,这也就

50、是音频数字化的字信号的过程,这也就是音频数字化的过程。过程。其原理如图。其原理如图。现在学习的是第64页,共85页 在上述在上述PCMPCM编码过程中,若以大于两倍的信号最编码过程中,若以大于两倍的信号最大频率采样,在采样过程中不产生失真。大频率采样,在采样过程中不产生失真。在量化过程中,有一定数量的误差或失真引入在量化过程中,有一定数量的误差或失真引入到样本中,这种误差称为量化噪声。到样本中,这种误差称为量化噪声。一般情况下,我们总是希望量化噪声尽量小,输一般情况下,我们总是希望量化噪声尽量小,输入信号的动态范围应予以保证。在这种情况下,我入信号的动态范围应予以保证。在这种情况下,我们总是采

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁