《《音频技术基础》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《音频技术基础》PPT课件.ppt(98页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章音频技术基础音频技术基础多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University 人类从外界获得的信息大约有人类从外界获得的信息大约有16%是从耳朵得到的。是从耳朵得到的。在多媒体技术中,音频信息占有在多媒体技术中,音频信息占有很重要的地位,比如在视频会议系统很重要的地位,比如在视频会议系统中中,音频信息的优先级最高。音频信息的优先级最高。了解音频信息的相关知识对更进了解音频信息的相关知识对更进一步掌握多媒体技术是很重要的。一步掌握多媒体
2、技术是很重要的。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University一切能发出声音的物体称为一切能发出声音的物体称为声源声源。声音是由于声源的振动。声音是由于声源的振动而产生的,由于声源的振动,借助于它们周围的介质,而产生的,由于声源的振动,借助于它们周围的介质,把这种振动以机械波的形式由近及远地传向远方,把这种振动以机械波的形式由近及远地传向远方,这就这就是是声波声波。声波传入人耳,致使耳膜也产生振动,这种振动声波传入人耳,致使耳膜也产生振动,
3、这种振动被传导到听觉神经,人们就产生了被传导到听觉神经,人们就产生了“声音声音”的感觉。我们的感觉。我们日常听到的声音是一种日常听到的声音是一种模拟信号模拟信号.声学基础知识声学基础知识声学基础知识声学基础知识 声音定义声音定义声音定义声音定义声音是振动波,具有振幅、周期和频率声音是振动波,具有振幅、周期和频率声音是振动波,具有振幅、周期和频率声音是振动波,具有振幅、周期和频率.声音的质量声音的质量声音的质量声音的质量简称音质。音质与频率范围成正比,频率范围越宽音质越好简称音质。音质与频率范围成正比,频率范围越宽音质越好简称音质。音质与频率范围成正比,频率范围越宽音质越好简称音质。音质与频率范
4、围成正比,频率范围越宽音质越好.声音具有连续性和过程性,数据前后相关,数据量大,具有实时性声音具有连续性和过程性,数据前后相关,数据量大,具有实时性声音具有连续性和过程性,数据前后相关,数据量大,具有实时性声音具有连续性和过程性,数据前后相关,数据量大,具有实时性.声音的连续时基性声音的连续时基性声音的连续时基性声音的连续时基性 声音三要素声音三要素声音三要素声音三要素(1)(1)音调音调音调音调 (高低高低高低高低)(2)(2)音强音强音强音强 (强弱强弱强弱强弱)(3)(3)音色音色音色音色 (特质特质特质特质)多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息
5、科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University声音的三要素v音调:(高低高低高低高低)与声音的频率有关,频率快则声 音高,频率慢则声音低。v音强:(强弱强弱强弱强弱)又称响度,取决于声音的振幅,也即振幅的大小和强弱。v音色:(特质特质特质特质)由混入基音的谐音决定。每个基音都有其固定频率,和不同音强的谐音混合,使得每个声音具有特殊的音色效果。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zho
6、u University声音的频率范围声音的频率范围 多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University模拟波信号有三个要素:模拟波信号有三个要素:基线、周期和振幅基线、周期和振幅。振幅振幅即波形的最高点(或最低点)与基线间的距离,它表示了声音音量即波形的最高点(或最低点)与基线间的距离,它表示了声音音量的大小。的大小。周期周期是波形中两个相邻波峰之间的距离,它表示完成一次振动过程所需是波形中两个相邻波峰之间的距离,它表示完成一次振动过程所需的
7、时间,的时间,其大小体现了振动的速度。其大小体现了振动的速度。频率频率是周期的倒数,周期越短,频是周期的倒数,周期越短,频率越高。频率的单位为赫兹率越高。频率的单位为赫兹(Hz)。人的耳朵只能感觉到振动频率在人的耳朵只能感觉到振动频率在20Hz到到20 000 Hz之间的声波,超出此范之间的声波,超出此范围的振动波不能引起听觉器官的感觉。围的振动波不能引起听觉器官的感觉。其中,人耳对其中,人耳对400-4000HZ的声波最敏感。的声波最敏感。次声波次声波次声波次声波人耳可听域人耳可听域人耳可听域人耳可听域超声波超声波20Hz 2020,000Hz20,000Hz 20,000Hz女女性性语语音
8、音150Hz 150Hz 10,000Hz 10,000Hz电电话话语语音音200Hz 200Hz 3,400Hz 3,400Hz调调 幅幅 广广 播播(AM)50Hz 50Hz 7,000Hz 7,000Hz调调 频频 广广 播播(FM)20Hz 20Hz 15,000Hz 15,000Hz高高级级音音响响10Hz 10Hz 40,000Hz 40,000Hz男男性性语语音音100Hz 100Hz 9,000Hz 9,000Hz声声声声源源源源种种种种类类类类频频频频带带带带宽宽宽宽度度度度多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰
9、州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University 频带宽度频带宽度 声音质量等级与信号带宽的关系声音质量等级与信号带宽的关系 电话电话AM AM 广播广播FM FM 广播广播CDCDDADA10 20 50 200 3.4K 7K 15K 22K f(Hz)10 20 50 200 3.4K 7K 15K 22K f(Hz)多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University音频信号特性分析音频
10、信号特性分析音频信号特性分析音频信号特性分析 时域特性时域特性起始起始稳定稳定结束结束 频域特性频域特性声音信号由正弦分量组成声音信号由正弦分量组成周期、非周期周期、非周期频谱分析频谱分析线状谱、连续谱线状谱、连续谱声音信号的描述声音信号的描述声波频率、声压、声强声波频率、声压、声强人耳对声音的感觉通过人耳对声音的感觉通过声压声压或或声压级声压级描述描述非线性非线性 听阈(听阈(1kHz):):210-5Pa 0dB 痛阈:痛阈:20 Pa 120dB多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou
11、UniversityLan zhou University声音的强度声音的强度 在在1kHz1kHz频率的正弦波中,能被人耳察觉的最频率的正弦波中,能被人耳察觉的最弱声压大约是弱声压大约是2 21010-5-5PaPa,这个最弱音已经作,这个最弱音已经作为国际标准的参照声。为国际标准的参照声。描述声音强度的量值是采用描述声音强度的量值是采用分贝分贝表示表示:分贝分贝是指两个相同的物理量(例是指两个相同的物理量(例A1A1和和A0A0)之比,)之比,取以取以1010为底的对数并乘以为底的对数并乘以1010(或(或2020)。)。N=10*lg(A1/A0)N=10*lg(A1/A0)分贝符号为分
12、贝符号为“dB”“dB”。N N是被量度量的是被量度量的“级级”,也被称为声压级。,也被称为声压级。A1A1是被量度量。是被量度量。A0A0是基准量,是基准量,多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University如果如果210210-5-5PaPa被看作被看作0dB(0dB(声压级声压级)那么在特别安静的环境中,单独检测:那么在特别安静的环境中,单独检测:动物的呼吸声大约动物的呼吸声大约20dB20dB人们正常的谈话声约人们正常的谈话声约60dB
13、60dB汽车的喇叭声约汽车的喇叭声约100dB100dB飞机起飞的声音约飞机起飞的声音约120 dB120 dB120dB120dB以上的强度可使人产生痛苦的感觉。以上的强度可使人产生痛苦的感觉。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University人耳听觉特性人耳听觉特性人耳听觉特性人耳听觉特性 人耳对声音强弱的感觉特性人耳对声音强弱的感觉特性人耳对声音强弱的感觉特性人耳对声音强弱的感觉特性人耳对声音强弱的感觉不与声压成正比,而与声压级成正比。人
14、耳对声音强弱的感觉不与声压成正比,而与声压级成正比。安静的环境和嘈杂的环境中人耳可以分辨的声音不同。安静的环境和嘈杂的环境中人耳可以分辨的声音不同。掩蔽掩蔽:一个频率声音的听阈由于另一个声音的存在而上升的现象。:一个频率声音的听阈由于另一个声音的存在而上升的现象。掩蔽效应掩蔽效应:复合声音信号中,响度较低的声音频率分量被高者淹没。:复合声音信号中,响度较低的声音频率分量被高者淹没。响度是听觉判断声音强弱的属性响度是听觉判断声音强弱的属性主观,主观,响度响度与声压级有一定关系:声压级每增加与声压级有一定关系:声压级每增加10dB10dB,响度增加,响度增加1 1倍。倍。响度和响度级响度和响度级响
15、度和响度级响度和响度级 人耳听觉的掩蔽效应人耳听觉的掩蔽效应人耳听觉的掩蔽效应人耳听觉的掩蔽效应多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University 声音质量评价声音质量评价声音质量评价声音质量评价我们经常会对某一位歌手的歌声发表意见,并与其他歌手进行比较,我们经常会对某一位歌手的歌声发表意见,并与其他歌手进行比较,这其实是在对声音的质量进行评价。这其实是在对声音的质量进行评价。声音质量的度量有两种基本方法:客观质量度量、主观质量的度量。声音质量
16、的度量有两种基本方法:客观质量度量、主观质量的度量。声波的声波的测量与分析传统的方法是先用机电换能器把声波转换为相应测量与分析传统的方法是先用机电换能器把声波转换为相应的电信号,然后用电子仪表放大到一定的电压级进行测量与分析。由于的电信号,然后用电子仪表放大到一定的电压级进行测量与分析。由于计算技术的发展,使许多计算和测量工作都使用了计算机或程序实现。计算技术的发展,使许多计算和测量工作都使用了计算机或程序实现。这些带计算机处理系统的高级声学测量仪器,能完成下列一些测量工作:这些带计算机处理系统的高级声学测量仪器,能完成下列一些测量工作:评价值的测量评价值的测量响度和响度级,噪音级,清晰度指数
17、,噪音评价数。响度和响度级,噪音级,清晰度指数,噪音评价数。声源的测量声源的测量频谱的时间变化,声功率,指向性,效率,频谱特征,频谱的时间变化,声功率,指向性,效率,频谱特征,幅值分布等。幅值分布等。音质的测量音质的测量混响时间,隔音量,吸音量。混响时间,隔音量,吸音量。声音客观质量的度量方法声音客观质量的度量方法多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University声测量的基本仪器是声测量的基本仪器是声级计声级计。声级计是一种能对声。声级计是一种
18、能对声音作出类似人耳的反应的仪器,同时,它能进行客音作出类似人耳的反应的仪器,同时,它能进行客观而可重复的声压和声级测量。声压测量的好处很观而可重复的声压和声级测量。声压测量的好处很多:它能帮助音乐厅提高音响效果;能对烦扰声音多:它能帮助音乐厅提高音响效果;能对烦扰声音进行精密的、科学的分析。声级测量还能明确地告进行精密的、科学的分析。声级测量还能明确地告诉我们什么声音会引起听力损害,并提醒人们采用诉我们什么声音会引起听力损害,并提醒人们采用适当的听力保护措施。因此,声测量是不可少的。适当的听力保护措施。因此,声测量是不可少的。度量声音客观质量的一个主要指标是信噪比度量声音客观质量的一个主要指
19、标是信噪比SNRSNR(Signal to Noise RationSignal to Noise Ration)。其单位是分贝)。其单位是分贝(dB)(dB)。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University 声音主观质量的度量声音主观质量的度量声音主观质量的度量声音主观质量的度量 采用客观标准方法很难真正评定某种编码器的采用客观标准方法很难真正评定某种编码器的质量,在实际评价中,主观的质量度量比客观质量质量,在实际评价中,主观的质量度量比
20、客观质量的度量更为恰当和合理。通常是对某编码器的输出的度量更为恰当和合理。通常是对某编码器的输出的声音质量进行评价,例如播放一段音乐,记录一的声音质量进行评价,例如播放一段音乐,记录一段话,然后重放给实验者听,再由实验者进行综合段话,然后重放给实验者听,再由实验者进行综合评定。可以说,人的感觉机理最具有决定意义。当评定。可以说,人的感觉机理最具有决定意义。当然,可靠的主观度量值是较难获得的。然,可靠的主观度量值是较难获得的。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan
21、zhou University 平均判分(平均判分(Mean Opinion Score-MOSMean Opinion Score-MOS)过程是召集一)过程是召集一批实验者,请每个实验者对某个编解码器的输出进行质量批实验者,请每个实验者对某个编解码器的输出进行质量判分,采用类似于考试的五级分制,不同的判分,采用类似于考试的五级分制,不同的MOSMOS分对应的分对应的质量级别和失真级别见下表。质量级别和失真级别见下表。声音主观质量的度量方法声音主观质量的度量方法MOSMOS质量级别质量级别失真级别失真级别5 5优优(Excellent)(Excellent)不察觉不察觉4 4良良(Good)
22、(Good)刚察觉但不可厌刚察觉但不可厌3 3中中(Fair)(Fair)察觉及稍微可厌察觉及稍微可厌2 2差差(Poor)(Poor)可厌可厌(但不令人反感但不令人反感)1 1劣劣(Unacceptable)(Unacceptable)极可厌极可厌(令人反感令人反感)多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University数字化声音数字化声音数字化声音数字化声音用声音录制软件记录的英文单词用声音录制软件记录的英文单词“Hello”的语音实际波形的语
23、音实际波形多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou Universityu模拟信号很容易受到电子干扰,因此随着技术的发展,声音信号就模拟信号很容易受到电子干扰,因此随着技术的发展,声音信号就逐渐过渡到了数字存储阶段,逐渐过渡到了数字存储阶段,A/DA/D转换和转换和D/AD/A转换技术便应运而生。转换技术便应运而生。uA A:“Analog”Analog”(类比、模拟)(类比、模拟)uD D:“Digital”Digital”(数字、数码)(数字、数码)u
24、A/DA/D转换就是把模拟信号转换成数字信号的过程,模拟电信号变为了转换就是把模拟信号转换成数字信号的过程,模拟电信号变为了由由“0”0”和和“1”1”组成的组成的BitBit信号。信号。u这样做的好处是显而易见的,声音存储质量得到了加强,数字化的这样做的好处是显而易见的,声音存储质量得到了加强,数字化的声音信息使计算机能够进行识别、处理和压缩,这也就是为什么如今声音信息使计算机能够进行识别、处理和压缩,这也就是为什么如今磁带逐渐被淘汰,磁带逐渐被淘汰,CDCD唱片却趋于流行的原因。唱片却趋于流行的原因。u A/DA/D转换的一个关键步骤是转换的一个关键步骤是声音的采样和量化声音的采样和量化,
25、得到数字音频信号,得到数字音频信号,它在时间上是不连续的离散信号。它在时间上是不连续的离散信号。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University借助于借助于A/DA/D或或D/AD/A转换器,模拟信号和数字信号可以互相转换转换器,模拟信号和数字信号可以互相转换 8 8位可编程位可编程A/DA/D转换芯片转换芯片多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan
26、zhou UniversityLan zhou University 声音采样声音采样声音采样声音采样 声音数字化声音数字化声音数字化声音数字化(模模模模/数转换数转换数转换数转换)声音采样声音采样声音采样声音采样11011100 1100110111011100 11001101把声音把声音把声音把声音(模拟量模拟量模拟量模拟量)按照固定时间间隔,转换成有限个数字表示的离散序列按照固定时间间隔,转换成有限个数字表示的离散序列按照固定时间间隔,转换成有限个数字表示的离散序列按照固定时间间隔,转换成有限个数字表示的离散序列 声音重放声音重放声音重放声音重放 声音模拟化声音模拟化声音模拟化声音模拟
27、化(数数数数/模转换模转换模转换模转换)声音重放声音重放声音重放声音重放1101110011011100把数字化声音转换成模拟量,经过音响单元重放出来把数字化声音转换成模拟量,经过音响单元重放出来把数字化声音转换成模拟量,经过音响单元重放出来把数字化声音转换成模拟量,经过音响单元重放出来 设备和软件设备和软件设备和软件设备和软件(1)(1)声音适配器声音适配器声音适配器声音适配器(声卡声卡声卡声卡)8bit)8bit、16bit16bit、128bit 128bit¥80.00 80.003800.003800.00(2)(2)声卡驱动软件以及各种声音处理软件声卡驱动软件以及各种声音处理软件声
28、卡驱动软件以及各种声音处理软件声卡驱动软件以及各种声音处理软件人耳听到的声音是一种具有振幅、周期(频率)的声波,计算机人耳听到的声音是一种具有振幅、周期(频率)的声波,计算机人耳听到的声音是一种具有振幅、周期(频率)的声波,计算机人耳听到的声音是一种具有振幅、周期(频率)的声波,计算机要处理这种声波,可以通过话筒把机械振动转变成相应的电信号,要处理这种声波,可以通过话筒把机械振动转变成相应的电信号,要处理这种声波,可以通过话筒把机械振动转变成相应的电信号,要处理这种声波,可以通过话筒把机械振动转变成相应的电信号,这也是一种连续的模拟信号。模拟信号的幅度,表示声音的强弱。这也是一种连续的模拟信号
29、。模拟信号的幅度,表示声音的强弱。这也是一种连续的模拟信号。模拟信号的幅度,表示声音的强弱。这也是一种连续的模拟信号。模拟信号的幅度,表示声音的强弱。计算机只能处理数字量,不能处理这种模拟量,只有把这种模拟计算机只能处理数字量,不能处理这种模拟量,只有把这种模拟计算机只能处理数字量,不能处理这种模拟量,只有把这种模拟计算机只能处理数字量,不能处理这种模拟量,只有把这种模拟量转换成数字量,计算机才有可能处理声音,这种转换就是模量转换成数字量,计算机才有可能处理声音,这种转换就是模量转换成数字量,计算机才有可能处理声音,这种转换就是模量转换成数字量,计算机才有可能处理声音,这种转换就是模/数数数数
30、转换(转换(转换(转换(A/DA/D转换),它是由模转换),它是由模转换),它是由模转换),它是由模/数转换电路实现的。数转换电路实现的。数转换电路实现的。数转换电路实现的。声音经声音经A/D转换后得到的数字声音信号交给计算机处理,转换后得到的数字声音信号交给计算机处理,处理后的数据需经过数处理后的数据需经过数/模(模(D/A)转换电路,还原成)转换电路,还原成模拟信号,再进行放大输出到喇叭或耳机,变成人耳能模拟信号,再进行放大输出到喇叭或耳机,变成人耳能够听到的声音。够听到的声音。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州
31、大学兰州大学 Lan zhou UniversityLan zhou University从模拟到数字声源声波传声器模拟电信号数字声音多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University声音的数字化原理声音的数字化原理v 模拟声音信号是个连续量,可能由许多具有不同模拟声音信号是个连续量,可能由许多具有不同振幅和频率的正弦波组成。振幅和频率的正弦波组成。v 计算机获取实际声音信号的过程就是声音的数字计算机获取实际声音信号的过程就是声音的数字化的处理
32、过程。化的处理过程。v 右图表示了模拟声音右图表示了模拟声音数字化的三个步骤:数字化的三个步骤:采样、量化和编码采样、量化和编码。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University数字音频的处理数字音频的处理数字音频的处理数字音频的处理 采样采样采样采样(Sampling)、采样频率、采样频率、采样频率、采样频率采样是将连续变化的模拟音频信号变成计算机能处理的采样是将连续变化的模拟音频信号变成计算机能处理的离散化数字信号的第一步。离散化数字信号
33、的第一步。每隔一定时间,对模拟音频信号的幅值进行采样测试,每隔一定时间,对模拟音频信号的幅值进行采样测试,得到离散的幅值,并用该值表示两次采样之间的模拟幅得到离散的幅值,并用该值表示两次采样之间的模拟幅值。单位时间采样的次数称为采样频率。值。单位时间采样的次数称为采样频率。采样频率越高,所得到的离散幅值的数据点就越逼近于采样频率越高,所得到的离散幅值的数据点就越逼近于连续音频信号,同时采样所得到的数据量也越大。多媒连续音频信号,同时采样所得到的数据量也越大。多媒体电脑中支持的采样频率通常为体电脑中支持的采样频率通常为44.1kHz、22.05kHz 及及11.025 kHz,8 kHz。多媒体
34、通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou Universityt模拟输入模拟输入t t0 0t t0 0采样时钟采样时钟量化,编码量化,编码0 0t tX(0)X(1)X(n)X(0)X(1)X(n)多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University声音的采样声音在数字化后的波形图声音在数字化后的波形图多媒体通信
35、技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University标准采样频率采样频率采样次数/s声音质量8KHz8000电话音质11.025KHz11025AM音质22.05KHz22050FM音质44.1KHz44100CD音质48KHz48000DAT音质说明:说明:DATDAT指数字录音带格式(指数字录音带格式(Digital audio typeDigital audio type)多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息
36、科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University采样定理:奈奎斯特理论认为:数字采样频率的大小奈奎斯特理论认为:数字采样频率的大小由声音信号本身的最高频率决定。指出:进由声音信号本身的最高频率决定。指出:进行无损的数字化转换,采样频率至少是所采行无损的数字化转换,采样频率至少是所采信号所含最高频率的信号所含最高频率的2 2倍。倍。fs=2f声音类型带 宽采样频率(kHz)电话语音200Hz3.4kHz8调幅广播50Hz7kHz11.025调频广播20Hz15kHz22.050CD20Hz20kHz44.1多媒体通信技术
37、:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University 量量量量 化化化化(Quantization)采样所得到的数据是一定的离散值,将这些离散值用若采样所得到的数据是一定的离散值,将这些离散值用若干二进制的位来表示,这一过程称为量化。干二进制的位来表示,这一过程称为量化。用用8位二进制表示十进制整数,只能表示出位二进制表示十进制整数,只能表示出0255之间之间的整数值。也就是的整数值。也就是256个量化级。量化级对应的二进制个量化级。量化级对应的二进制位数称为
38、位数称为量化位数量化位数。虽然量化位数越多,对原始波形的。虽然量化位数越多,对原始波形的模拟越细腻,声音的音质就越好,但数据量也越大。模拟越细腻,声音的音质就越好,但数据量也越大。量化即是将采样所得到的信号振幅值用一组二进制脉冲量化即是将采样所得到的信号振幅值用一组二进制脉冲序列来表示。离散化的数据经量化变成二进制表示一般序列来表示。离散化的数据经量化变成二进制表示一般会损失一些精度,这主要是因为计算机只能表示有限的会损失一些精度,这主要是因为计算机只能表示有限的数值。数值。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州
39、大学 Lan zhou UniversityLan zhou University均匀量化均匀量化如果采用相等的量化间隔对采样得到的信号作量如果采用相等的量化间隔对采样得到的信号作量化,那么这种量化称为均匀量化。均匀量化就是化,那么这种量化称为均匀量化。均匀量化就是采用相同的采用相同的“等分尺等分尺”来度量采样得到的幅度,来度量采样得到的幅度,也称为线性量化。也称为线性量化。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University非均匀量化非均匀量化
40、-非线性量化的基本想法是,对输入信号进行量非线性量化的基本想法是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,如图所示。这样就可入信号采用小的量化间隔,如图所示。这样就可以在满足精度要求的情况下用较少的位数来表示。以在满足精度要求的情况下用较少的位数来表示。声音数据还原时,采用相同的规则。声音数据还原时,采用相同的规则。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou Universi
41、ty在非线性量化中,采样输入信号幅度和量在非线性量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,一化输出数据之间定义了两种对应关系,一种称为种称为 律压扩律压扩(companding)(companding)算法,另一算法,另一种称为种称为A A律压扩算法。律压扩算法。律压扩律压扩 律律(-Law)-Law)压扩压扩(G.711)(G.711)主要用在北美和主要用在北美和日本等地区的数字电话通信中日本等地区的数字电话通信中A A律压扩律压扩A A律律(A-Law)(A-Law)压扩压扩(G.711)(G.711)主要用在欧洲和中主要用在欧洲和中国大陆等地区的数字电话通信中国大陆等
42、地区的数字电话通信中多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou Universityv量化噪声:量化误差,随阶距变大而增加。v量化位数/采样精度(字长):表示采样值的二进制位数(比特数),决定了采样值的精度。例如:vv量化位数量化位数16 bit16 bit,可以表示可以表示6553665536个不同量化个不同量化值,精度(值,精度(阶距阶距)1/655361/65536。vv量化位数量化位数8 bit8 bit,可以表示可以表示256256个不同量化值,个
43、不同量化值,精度(精度(阶距阶距)1/2561/256。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University 动态范围动态范围(Dynamic Range)(Dynamic Range)2 0lg 2 0lg(信号的最大强度(信号的最大强度/最小强度)(最小强度)(dBdB)信噪比信噪比(Signal to Noise Ratio,SNR)(Signal to Noise Ratio,SNR)-有用信号的能量和噪声能量的比。有用信号的能量和噪声能
44、量的比。-常用单位:常用单位:dBdB 衡量信号质量的标准:衡量信号质量的标准:多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University量化位量化位数数幅值幅值动态范围动态范围(dB(dB)效果效果8 82562564848数字电话数字电话161664K64K9696CD-DACD-DA6060FMFM广播广播4040AMAM广播广播 量化位与动态范围量化位与动态范围多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与
45、工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University根据抽样理论可知,一个数字信源的信噪比大约根据抽样理论可知,一个数字信源的信噪比大约等于采样精度乘以等于采样精度乘以6 6分贝。分贝。8 8位的数字系统其信噪比只有位的数字系统其信噪比只有4848分贝,分贝,1616位的数字系统的信噪比可达位的数字系统的信噪比可达9696分贝,分贝,信噪比低会出现背景噪声以及失真。信噪比低会出现背景噪声以及失真。因此,量化位数越多,保真度越好。因此,量化位数越多,保真度越好。量化位与信噪比量化位与信噪比多媒体通信技术:音频技术基础多媒体通信技术
46、:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University在多媒体电脑中,要对音频进行处理,必须在在多媒体电脑中,要对音频进行处理,必须在PC机上添加机上添加一块声卡。一块声卡。声卡声卡是多媒体升级套件中的核心部件之一,是多媒体升级套件中的核心部件之一,其其外形与插在计算机主机箱内的其他硬件插板相仿,也是一外形与插在计算机主机箱内的其他硬件插板相仿,也是一块可以插在扩展槽内的电路板,但包含有完成音频处理功块可以插在扩展槽内的电路板,但包含有完成音频处理功能的电子元件。能的电子元件。声卡声卡通过
47、一秒内对声音进行上千次的采样、阅读,把模拟通过一秒内对声音进行上千次的采样、阅读,把模拟声波转换成数字信息、数字化的声音存储在波形文件中。声波转换成数字信息、数字化的声音存储在波形文件中。当声音被记录时,声卡中的模当声音被记录时,声卡中的模/数转换器把模拟声波转换成数转换器把模拟声波转换成数字数据;当声音重放时,声卡中的数数字数据;当声音重放时,声卡中的数/模转换器把波形文模转换器把波形文件里的数字数据变成模拟波形输出。件里的数字数据变成模拟波形输出。声音的压缩声音的压缩声音的压缩声音的压缩多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州
48、大学兰州大学兰州大学 Lan zhou UniversityLan zhou University多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University声音文件数据量的计算v影响数字化声音质量的因素主要有三个,即影响数字化声音质量的因素主要有三个,即 采样频率采样频率,量化精度量化精度和和声道个数声道个数。v声道数:指一次采样所记录产生的声音波形个数。单声道只有一个数据流,立体声的数据流至少在单声道只有一个数据流,立体声的数据流至少在两个以上。两个
49、以上。由于立体声声音具有多声道、多方向的特征,由于立体声声音具有多声道、多方向的特征,因此,声音的播放在时间和空间性能方面都能显因此,声音的播放在时间和空间性能方面都能显示更好的效果,但相应数据量将成倍增加。示更好的效果,但相应数据量将成倍增加。多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University数字声音相关的参数质量采样频率(kHz)量化精度单道声/立体声数据率(kb/s)频率范围(kHz)电话88单道声642003400AM11.0258单道
50、声88507000FM22.05016立体声705.62015000CD44.116立体声1411.22020000DAT4816立体声15362020000多媒体通信技术:音频技术基础多媒体通信技术:音频技术基础信息科学与工程学院信息科学与工程学院兰州大学兰州大学兰州大学兰州大学 Lan zhou UniversityLan zhou University声音文件所需的存储空间可用下式来计算:声音文件所需的存储空间可用下式来计算:采样率越大,数字信号越接近模拟信号,但所要求的存储采样率越大,数字信号越接近模拟信号,但所要求的存储空间也越大。空间也越大。量化位数越多,所得的量化值越接近原始波形