《第3章声音媒体精选文档.ppt》由会员分享,可在线阅读,更多相关《第3章声音媒体精选文档.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第3章声音媒体本讲稿第一页,共四十页第第3 3章章 声音媒体声音媒体 教学目标教学目标 了解声音的相关特征了解声音的相关特征 掌握音频信号的数字化过程掌握音频信号的数字化过程 熟悉声音文件的格式熟悉声音文件的格式 了解了解MIDIMIDI的音乐合成的音乐合成 了解音频卡的功能及其应用了解音频卡的功能及其应用本讲稿第二页,共四十页第第3 3章章 声音媒体声音媒体 3.13.1声音的有关概念声音的有关概念声音是通过空气传播的一种连续的波。声音是通过空气传播的一种连续的波。声音的概念声音的概念 声音的分类声音的分类噪音噪音 音频信号音频信号 语音语音 音乐音乐 音效音效本讲稿第三页,共四十页第第3
2、3章章 声音媒体声音媒体 声音的三要素声音的三要素 3.1 3.1声音的有关概念声音的有关概念 在任一时刻,模拟声波信号曲线都可以分解为一系列正在任一时刻,模拟声波信号曲线都可以分解为一系列正弦波的线性叠加。弦波的线性叠加。其中其中0 0 称为基频或基音称为基频或基音(最低的音波最低的音波);n*0n*0称为称为00的的n n次谐波分量或称为泛音,次谐波分量或称为泛音,其频率是基频的整数倍。其频率是基频的整数倍。本讲稿第四页,共四十页第第3 3章章 声音媒体声音媒体 声音的三要素声音的三要素 3.1 3.1声音的有关概念声音的有关概念 音调(单位为美(音调(单位为美(melmel):又称为音高
3、或音准,:又称为音高或音准,指人耳对声音高低的主观感觉。指人耳对声音高低的主观感觉。音高大小主要取决于声波基频的高低音高大小主要取决于声波基频的高低 ,其关系式:,其关系式:音高音高=Klgf=Klgf各乐器的基频范围:各乐器的基频范围:钢琴钢琴 :27275 541364136赫赫 交响乐交响乐 :303060006000赫赫 民族乐器民族乐器 :505045004500赫赫 本讲稿第五页,共四十页第第3 3章章 声音媒体声音媒体 声音的三要素声音的三要素 3.1 3.1声音的有关概念声音的有关概念 音色:声音的感觉特性,指的是声音的特色。音色:声音的感觉特性,指的是声音的特色。取决于泛音的
4、取决于泛音的频谱频谱。也就是物体振动所形成的音波波纹的。也就是物体振动所形成的音波波纹的曲折形式不同,即由混入基音的泛音所决定的。曲折形式不同,即由混入基音的泛音所决定的。音强音强 :声音的强弱或声音的响亮程度(单位是分贝:声音的强弱或声音的响亮程度(单位是分贝(db)(db))。)。声音的振幅决定声音的音强。声音的振幅决定声音的音强。正常人听觉的强度范围为正常人听觉的强度范围为0db0db140db 140db 本讲稿第六页,共四十页f0f0为基频(红色),为基频(红色),fifi=i i*f f 为谐频(蓝色)为谐频(蓝色)本讲稿第七页,共四十页声压声压(Pa)(Pa)声强声强(W/m2)
5、(W/m2)声功率声功率(W)(W)声级声级(dB)(dB)环境环境2*102*102 210102 210102 2140140飞机发动机飞机发动机(3m)(3m)2*102*101 11 11 1120120痛阈痛阈2*102*100 01010-2-21010-2-2100100织布机房织布机房2*102*10-1-11010-4-41010-4-48080汽车汽喇叭汽车汽喇叭2*102*10-2-21010-6-61010-6-66060交谈交谈(1m)(1m)2*102*10-3-31010-8-81010-8-84040安静室内安静室内2*102*10-4-41010-10-101
6、010-10-102020轻声耳语轻声耳语2*102*10-5-51010-12-121010-12-120 0听阈听阈宁静声宁静声 微弱声微弱声正常声正常声响音声响音声极响声极响声普通声普通声0-200-20分贝分贝 很静、几乎感觉不到;很静、几乎感觉不到;20-4020-40分贝分贝 安静、犹如轻声絮语;安静、犹如轻声絮语;40-6040-60分贝分贝 一般、普通室内谈话;一般、普通室内谈话;60-7060-70分贝分贝 吵闹、有损精神;吵闹、有损精神;70-9070-90分贝分贝 很吵、神经细胞受到破坏;很吵、神经细胞受到破坏;90-10090-100分贝分贝 吵闹加剧、听力受损;吵闹加
7、剧、听力受损;100-120100-120分贝分贝 难以忍受、一分钟即暂时致聋;难以忍受、一分钟即暂时致聋;120120分贝以上分贝以上 极度聋或全聋。极度聋或全聋。本讲稿第八页,共四十页 3.2 3.2音频信号音频信号 第第3 3章章 声音媒体声音媒体音频音频人类听觉所感知范围内的频率,也称声频。人类听觉所感知范围内的频率,也称声频。音频音频(Audio):(Audio):频率范围是频率范围是20Hz20Hz20KHz20KHz的声音信号(人耳能听的声音信号(人耳能听到)到)次声波次声波(subsonic)(subsonic):频率低于:频率低于20Hz20Hz的信号(亚音)的信号(亚音)超
8、声波超声波(ultrasonic)(ultrasonic):频率高于:频率高于20KHz20KHz的信号(超音频)的信号(超音频)本讲稿第九页,共四十页 3.2 3.2音频信号音频信号 第第3 3章章 声音媒体声音媒体音频音频人类听觉所感知范围内的频率,也称声频。人类听觉所感知范围内的频率,也称声频。声源种类声源种类频率范围频率范围下限频率下限频率上限频率上限频率男性语音男性语音100HZ100HZ9000HZ9000HZ女性语音女性语音150HZ150HZ10000HZ10000HZ电话语音电话语音200HZ200HZ3400HZ3400HZ调幅广播调幅广播50HZ50HZ7000HZ700
9、0HZ调频广播调频广播20HZ20HZ15000HZ15000HZ专业音响专业音响10HZ10HZ40000HZ40000HZ本讲稿第十页,共四十页 3.2 3.2音频信号音频信号 第第3 3章章 声音媒体声音媒体 音频信号的质量指标音频信号的质量指标 :1.1.频带宽度:指复合信号的频率范围。频带宽度:指复合信号的频率范围。本讲稿第十一页,共四十页 3.2 3.2音频信号音频信号 第第3 3章章 声音媒体声音媒体 2.2.动态范围:音频信号的最大强度和最小强度之比。动态范围:音频信号的最大强度和最小强度之比。3.3.信噪比信噪比 (SNRSNR)SNRSNR=类别类别昼间昼间夜间夜间适用区域
10、适用区域0 050dB50dB40dB40dB疗养区、高级别墅区、高级宾馆区等特别需疗养区、高级别墅区、高级宾馆区等特别需要安静的区域要安静的区域1 155dB55dB45dB45dB以居住、文教机关为主的区域以居住、文教机关为主的区域2 260dB60dB50dB50dB居住、商业、工业混杂区居住、商业、工业混杂区3 365dB65dB55dB55dB工业区工业区4 470dB70dB55dB55dB城市中的道路交能干线道路两侧区域,穿越城市中的道路交能干线道路两侧区域,穿越城区的内河航道两侧区域城区的内河航道两侧区域我国我国城市环境噪声标准城市环境噪声标准 本讲稿第十二页,共四十页 3.3
11、 3.3模拟信号与数字信号模拟信号与数字信号 第第3 3章章 声音媒体声音媒体 模拟信号模拟信号从时间上以及幅值上都连续变化的信从时间上以及幅值上都连续变化的信号称为模拟信号。号称为模拟信号。本讲稿第十三页,共四十页 3.3 3.3模拟信号与数字信号模拟信号与数字信号 第第3 3章章 声音媒体声音媒体 数字信号数字信号在时间上和幅值上都是离散(不连续)在时间上和幅值上都是离散(不连续)的信号称为数字信号。的信号称为数字信号。本讲稿第十四页,共四十页第第3 3章章 声音媒体声音媒体 3.3 3.3模拟信号与数字信号模拟信号与数字信号 .音频信号的动态范围音频信号的动态范围传统的模拟音响设备的动态
12、范围传统的模拟音响设备的动态范围60 dB60 dB数字音响设备的动态范围约数字音响设备的动态范围约96dB96dB.噪声容限噪声容限 (对噪声的承受能力)(对噪声的承受能力)数字信号的噪声容限比较高数字信号的噪声容限比较高 .与计算机的兼容性与计算机的兼容性 为什么要数字化为什么要数字化本讲稿第十五页,共四十页第第1 1章章 网站建设基础知识网站建设基础知识第第3 3章章 声音媒体声音媒体 3.4 3.4声音信号数字化声音信号数字化 采样:将声音信号在时间上进行采样:将声音信号在时间上进行离散化处理。离散化处理。量化:对采样后的声音信号的量化:对采样后的声音信号的振幅值进行离散化处理。振幅值
13、进行离散化处理。编码:将量化后的数字化声音编码:将量化后的数字化声音信息,用一个二进制数码序列来信息,用一个二进制数码序列来表示叫做编码。表示叫做编码。声音信号数字化的过程声音信号数字化的过程本讲稿第十六页,共四十页第第3 3章章 声音媒体声音媒体本讲稿第十七页,共四十页第第3 3章章 声音媒体声音媒体 3.5 3.5数字化声音的技术指标数字化声音的技术指标 单位时间内的采样次数,用单位时间内的采样次数,用fsfs表示表示.采样频率的选择:采样频率的选择:采样频率采样频率CDCD电话话音电话话音AMAMFMFMDATDATFs(kHz)Fs(kHz)44.144.18 811.02511.02
14、522.05022.0504848根据奈奎斯特理论:采样频率根据奈奎斯特理论:采样频率fsfs必须高于必须高于被采样信号所含最高频率的两倍被采样信号所含最高频率的两倍:fs2fmaxfs2fmax或者或者 TsTmin/2TsTmin/2 与采样精度和采样后的数据量大小有关与采样精度和采样后的数据量大小有关与被测信号的变化速度有关与被测信号的变化速度有关本讲稿第十八页,共四十页第第1 1章章 网站建设基础知识网站建设基础知识第第3 3章章 声音媒体声音媒体 3.5 3.5数字化声音的技术指标数字化声音的技术指标 模拟声音信号量化后表示的二进制位数。模拟声音信号量化后表示的二进制位数。量化精度越
15、高,动态范围越大,声音质量越高。量化精度越高,动态范围越大,声音质量越高。例:例:16bit16bit(0 06553665536)和)和8bit8bit常用的采样精度为常用的采样精度为8bit8bit、12 bit12 bit、16bit16bit、20bit20bit、24bit24bit等。等。量化精度(量化精度(bpsbps)均匀量化均匀量化非均匀量化非均匀量化 又称线性量化,是又称线性量化,是采用相等的量化间隔采用相等的量化间隔对采样信号进行量化。对采样信号进行量化。量化间隔不相等,大的量化间隔不相等,大的信号采用大的量化间隔,信号采用大的量化间隔,小的信号采用小的量化间小的信号采用
16、小的量化间隔。隔。本讲稿第十九页,共四十页第第3 3章章 声音媒体声音媒体 3.5 3.5数字化声音的技术指标数字化声音的技术指标 声音通道的个数称为声道数,是声音通道的个数称为声道数,是 指一指一次同时产生的声波组数。次同时产生的声波组数。声道数声道数单声道、立体声、准立体声、单声道、立体声、准立体声、4.14.1 声道、声道、5.15.1声道等。声道等。编码算法编码算法数据率及数据文件格式数据率及数据文件格式数据率为每秒数据率为每秒bitbit数,它与信息在计算机中的实时传输有直数,它与信息在计算机中的实时传输有直接关系,其大小与采样指标和压缩方法有关。接关系,其大小与采样指标和压缩方法有
17、关。数据率采样频率(数据率采样频率(HzHz)量化位数(量化位数(bitbit)声道数声道数 (bit/sbit/s)本讲稿第二十页,共四十页第第3 3章章 声音媒体声音媒体 3.6 3.6数字化声音的存储量及质量数字化声音的存储量及质量 数字音频文件的存储量数字音频文件的存储量存储量存储量=采样频率采样频率量化位数量化位数/8/8声道数声道数声音持续时间声音持续时间例:例:CDCD唱片所用的采样频率为唱片所用的采样频率为44.144.1kHzkHz,量化位数为,量化位数为1616位,位,双声道,一张双声道,一张6060分钟的分钟的CDCD唱片所占用存储空间约为:唱片所占用存储空间约为:44.
18、144.1kHz16kHz16位位22声道声道/83600/83600秒秒=?KB=KB=?MBMB 本讲稿第二十一页,共四十页声音质量和数字化指标声音质量和数字化指标质质 量量 采样频率采样频率 样本精度样本精度 声道数声道数数据传输率数据传输率频率范围频率范围电话电话8 88 8单声道单声道64.064.020020034003400AMAM11.02511.0258 8单声道单声道88.288.2505070007000FMFM22.05022.0501616立体声立体声705.6705.620201500015000CDCD44.144.11616立体声立体声1411.21411.22
19、0202000020000DATDAT48481616立体声立体声1536.01536.020202000020000第第3 3章章 声音媒体声音媒体本讲稿第二十二页,共四十页第第3 3章章 声音媒体声音媒体 3.6 3.6音频文件的格式音频文件的格式 数字音频的数据类型数字音频的数据类型波形数据波形数据MIDIMIDI数据数据声波通过声声波通过声/电和电和A/DA/D而得到的量化后的而得到的量化后的采样数据。采样数据。MIDIMIDI是乐器和计算机之间交是乐器和计算机之间交换音乐信息所使用的一种标准换音乐信息所使用的一种标准语言,只是一些指令。语言,只是一些指令。MIDI 本讲稿第二十三页,
20、共四十页第第3 3章章 声音媒体声音媒体 3.6 3.6音频文件的格式音频文件的格式 数字音频的文件格式数字音频的文件格式 .WAVWAV文件文件:记录声音的波形:记录声音的波形 ,支持存储各种采样频率,支持存储各种采样频率和样本精度的声音数据,并支持声音数据的压缩;声音和样本精度的声音数据,并支持声音数据的压缩;声音质量好;文件体积大,多用于存储简短的声音片断。质量好;文件体积大,多用于存储简短的声音片断。MPEGMPEG音频文件音频文件.MP1/.MP2/.MP3.MP1/.MP2/.MP3/.MP4/.MP4:是有损压:是有损压缩,压缩比可达缩,压缩比可达1 1:1010甚至甚至1 1:
21、1212;音频文件能够在音质丢;音频文件能够在音质丢失很小的情况下把文件压缩到更小的程度;在网络可失很小的情况下把文件压缩到更小的程度;在网络可视电话通信方面应用广泛。视电话通信方面应用广泛。本讲稿第二十四页,共四十页第第3 3章章 声音媒体声音媒体 3.6 3.6音频文件的格式音频文件的格式 数字音频的文件格式数字音频的文件格式 RealAudioRealAudio文件文件.RA/.RM/.RAM.RA/.RM/.RAM:是在非常低的带宽下提供好的音质,:是在非常低的带宽下提供好的音质,让用户能在线聆听,需使用让用户能在线聆听,需使用RealPlayerRealPlayer。CD Audio
22、CD Audio音乐音乐CDCD.CDA.CDA:唱片采用的格式:唱片采用的格式 ,又叫,又叫 “红皮书红皮书”格式;声音纯正、高保真;缺点是无法编辑,文件长度太大。格式;声音纯正、高保真;缺点是无法编辑,文件长度太大。Window Media PlayerWindow Media Player文件文件 .WMA WMA:压缩率一般都可以达到:压缩率一般都可以达到1 1:1818左右左右 ,音质可与音质可与CDCD媲美。媲美。本讲稿第二十五页,共四十页第第3 3章章 声音媒体声音媒体 3.6 3.6音频文件的格式音频文件的格式 数字音频的文件格式数字音频的文件格式 MIDIMIDI文件文件.M
23、ID/.RMI.MID/.RMI:MIDIMIDI是乐器数字接口是乐器数字接口的英文缩写,是数字音乐的英文缩写,是数字音乐/电子合成乐器的统一国际标电子合成乐器的统一国际标准。准。在在MIDIMIDI文件记录乐曲演奏的过程中的一系列指令,文件记录乐曲演奏的过程中的一系列指令,而不是乐曲本身的数据,这些指令包括使用什么而不是乐曲本身的数据,这些指令包括使用什么MIDIMIDI设备的音色、声音的强弱、声音持续多长时间设备的音色、声音的强弱、声音持续多长时间等。等。本讲稿第二十六页,共四十页第第3 3章章 声音媒体声音媒体 3.6 3.6音频文件的格式音频文件的格式 MIDI术语术语 MIDIMID
24、I文件是记录存储文件是记录存储MIDIMIDI信息的标准文件格式,一个信息的标准文件格式,一个MIDIMIDI文件包括音符、定文件包括音符、定时、通道选择指示信息。音符包括有关键字(乐符的键位)、通道号、音时、通道选择指示信息。音符包括有关键字(乐符的键位)、通道号、音高(低、中、高音)、音长(节拍)、音量、速度、乐器的配置等。高(低、中、高音)、音长(节拍)、音量、速度、乐器的配置等。MIDIMIDI文件文件MIDIMIDI指令或消息指令或消息 指令是对乐谱的数字描述也称作消息。消息就是乐谱的数字描述。指令是对乐谱的数字描述也称作消息。消息就是乐谱的数字描述。本讲稿第二十七页,共四十页第第3
25、 3章章 声音媒体声音媒体 3.6 3.6音频文件的格式音频文件的格式 合成器的通道是一个独立的信息传输路线,将单个物理通道(可以理解为数据合成器的通道是一个独立的信息传输路线,将单个物理通道(可以理解为数据传输电缆)分成传输电缆)分成1616个逻辑通道,每个通道相当一个逻辑上的合成器,可以个逻辑通道,每个通道相当一个逻辑上的合成器,可以充当一种乐器。充当一种乐器。通道(通道(ChannelsChannels)多音色多音色 是合成器同时支持的最多音符数是合成器同时支持的最多音符数,也是指一次演奏多个音符的能力。也是指一次演奏多个音符的能力。复音(复音(PuyphongPuyphong)指同时演
26、奏几种不同乐器时发出的声音。指同时演奏几种不同乐器时发出的声音。本讲稿第二十八页,共四十页第第3 3章章 声音媒体声音媒体 3.7 3.7电子乐器数字接口电子乐器数字接口(MIDI)(MIDI)系统系统 MIDIMIDI音频系统构成音频系统构成MIDIMIDI键盘键盘MIDIMIDI接口接口音序器音序器MIDIMIDI文件文件合成器合成器扬声器扬声器音频卡音频卡计算机计算机本讲稿第二十九页,共四十页第第3 3章章 声音媒体声音媒体 MIDI设备配置设备配置 MIDIMIDI端口端口音序器音序器MIDIMIDI键盘键盘合成器合成器MIDIMIDI设备就是处理设备就是处理MIDIMIDI信息所需的
27、硬件设备,其信息所需的硬件设备,其基本组成包括:基本组成包括:本讲稿第三十页,共四十页第第3 3章章 声音媒体声音媒体 MIDIMIDI端口端口MIDIMIDI键盘键盘可以有一至三个可以有一至三个MIDIMIDI端口,分别称为端口,分别称为MIDI InMIDI In、MIDI MIDI OutOut、MIDI ThruMIDI Thru。是用于是用于MIDIMIDI乐曲演奏的,所产生的仅仅是乐曲演奏的,所产生的仅仅是MIDIMIDI音乐消息,从而由音序器录制生成音乐消息,从而由音序器录制生成MIDIMIDI文件。文件。本讲稿第三十一页,共四十页第第3 3章章 声音媒体声音媒体 音序器音序器合
28、成器合成器一种允许一种允许MIDIMIDI数据被捕获数据被捕获,存储存储,编辑编辑,组合和重奏的装置。组合和重奏的装置。音序器有以硬件形式提供的,目前大多为软件音序器。音序器有以硬件形式提供的,目前大多为软件音序器。合成器解释合成器解释MIDIMIDI文件中的指令符号文件中的指令符号,生成所需要生成所需要的声音波形的声音波形,经放大后由扬声器输出经放大后由扬声器输出,声音的效果比较丰富声音的效果比较丰富.合成器的合成方式有两种合成器的合成方式有两种:本讲稿第三十二页,共四十页第第3 3章章 声音媒体声音媒体本讲稿第三十三页,共四十页第第3 3章章 声音媒体声音媒体本讲稿第三十四页,共四十页第第
29、3 3章章 声音媒体声音媒体 合成器合成器1.1.频率(频率(FMFM)调制合成器:用电子波形来产生声音的合)调制合成器:用电子波形来产生声音的合成器。音效差不能模拟人和动物的声音。成器。音效差不能模拟人和动物的声音。2.2.波表合成器:将乐器的声音样本存储在波形表中,播放波表合成器:将乐器的声音样本存储在波形表中,播放时取出,产生声音。时取出,产生声音。硬波表合成方式的数字声硬波表合成方式的数字声音样本被保存在音样本被保存在ROMROM内或内或RAM(RAM(可动态更换可动态更换)内。内。软波表合成方式的数字化软波表合成方式的数字化样本保存于系统主存中样本保存于系统主存中,合合成运算靠成运算
30、靠CPUCPU完成。完成。本讲稿第三十五页,共四十页人工通过控制面板来调制音色的硬件合成器人工通过控制面板来调制音色的硬件合成器 集音源、音序器、集音源、音序器、MIDIMIDI键盘于一身的合成器键盘于一身的合成器第第3 3章章 声音媒体声音媒体本讲稿第三十六页,共四十页第第3 3章章 声音媒体声音媒体 MIDIMIDI文件的特点文件的特点 数据量小数据量小配音方便配音方便编辑灵活编辑灵活表现力弱表现力弱 3.8.13.8.1音频卡的功能音频卡的功能音频信号录制与播放音频信号录制与播放 音频信号编辑与合成音频信号编辑与合成MIDIMIDI接口和音乐合成接口和音乐合成文语转换与语音识别文语转换与
31、语音识别 本讲稿第三十七页,共四十页音频卡的结构与性能音频卡的结构与性能MIDI/GAME口口音频混合芯片音频混合芯片PCI接口接口数字音频处理芯片数字音频处理芯片I/O插口插口CDIN子卡接口子卡接口晶振晶振第第3 3章章 声音媒体声音媒体3.8.23.8.2音频卡的结构与性能音频卡的结构与性能本讲稿第三十八页,共四十页第第3 3章章 声音媒体声音媒体 DSPDSP(数字信号处理器)是音频卡的核心,负责主(数字信号处理器)是音频卡的核心,负责主要的控制运算工作,声卡绝大多数功能都来源于它,要的控制运算工作,声卡绝大多数功能都来源于它,其性能基本上决定了音频卡的类型、档次和大部分性其性能基本上
32、决定了音频卡的类型、档次和大部分性能。能。DSPDSP(数字信号处理器)(数字信号处理器)混合信号处理器(混音器)混合信号处理器(混音器)声卡上的混音器芯片可以对以下音源进行声卡上的混音器芯片可以对以下音源进行混合:数字化声音混合:数字化声音(DAC)(DAC),调频,调频FMFM合成音乐合成音乐(FM)CD(FM)CD音频音频(CD-ROM)(CD-ROM),线路输入,线路输入(AUX)(AUX),话筒输入,话筒输入(MIC)(MIC)及及PCPC声音输出声音输出(SPK)(SPK)。本讲稿第三十九页,共四十页第第3 3章章 声音媒体声音媒体 MIDI MIDI音乐合成器音乐合成器外围接口外围接口早期的声卡采用早期的声卡采用ISAISA总线接口,目前声卡的总线接总线接口,目前声卡的总线接口一般都已采用口一般都已采用PCIPCI接口。接口。总线接口和控制器总线接口和控制器I/OI/O接口接口CD-ROMCD-ROM驱动器接口与驱动器接口与CDCDININ音频接口音频接口连接子卡的接口连接子卡的接口 本讲稿第四十页,共四十页