《005音频压缩.ppt》由会员分享,可在线阅读,更多相关《005音频压缩.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、四川交通职业技术学院 计算机工程系2012.10Audio Compression第五第五讲讲 音音频压缩频压缩lAUAU音音频编辑 四川交通职业技术学院计算机工程系声声波性波性质音音频特性特性采采样量化量化压缩编码编辑发布布音音频编辑是非常是非常烦琐的工作,要做好音的工作,要做好音频编辑,对声声波性波性质、人、人类听听觉特性、音特性、音频信信号数号数字化字化过程的了解和程的了解和应用都是必不可少的。用都是必不可少的。对声声音的良好感音的良好感觉四川交通职业技术学院计算机工程系l回顾几个重要的概念问题AU的振幅问题声道和音轨采样频率和声音频率量化位数和声音分辨率可变码率和恒定码率四川交通职业技
2、术学院计算机工程系lAU振幅问题lAudition 第十课 振幅,削波,分贝数四川交通职业技术学院计算机工程系lAU振幅问题四川交通职业技术学院计算机工程系l声压:声波在空气传播过程中,引起空气质点振动,使空气发生疏密变化,导致空气压强变化叫声压。l声压级:四川交通职业技术学院计算机工程系四川交通职业技术学院计算机工程系l回顾几个重要的概念问题AU的振幅问题声道和音轨采样频率和声音频率量化位数和声音分辨率可变码率和恒定码率四川交通职业技术学院计算机工程系l声道和音轨四川交通职业技术学院计算机工程系l回顾几个重要的概念问题AU的振幅问题声道和音轨采样频率和声音频率量化位数和声音分辨率可变码率和恒
3、定码率四川交通职业技术学院计算机工程系l采样频率和声音频率l在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中最高频率fmax的2倍时(fs.max=2fmax),采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的510倍;采样定理又称奈奎斯特定理。采样定理说明采样采样定理说明采样频率与信号频谱之频率与信号频谱之间的关系,是连续间的关系,是连续信号离散化的基本信号离散化的基本依据。依据。四川交通职业技术学院计算机工程系l回顾几个重要的概念问题AU的振幅问题声道和音轨采样频率和声音频率量化位数和声音分辨率可变码率和恒定码率四川交通职业技术学
4、院计算机工程系lAU中的分辨率参数就是量化位数四川交通职业技术学院计算机工程系l回顾几个重要的概念问题AU的振幅问题声道和音轨采样频率和声音频率量化位数和声音分辨率可变码率和恒定码率四川交通职业技术学院计算机工程系l码率的计算码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是kbps即千位每秒。例,采样率11.025kHz,量化位数8bit,那么码率为:l811.025l而位的量化位数可以量化(即)个级别的声音四川交通职业技术学院计算机工程系l与几乎所有的编码格式重视的都是如何用最低的码率达到最少的失真,围绕这个核心衍生出来的cbr(固定码率)与vbr(可变码率)。就是压缩率不是恒定
5、的,而是随着音源的复杂和简单而变化,可以在保证音质的前题下最大限度的节省空间四川交通职业技术学院计算机工程系恒定码率(CBR)就是我们常谈到的MP3码率,大多数MP3都采用这种方式,数值越高声音质量越好。变长码率(VBR),音频文件是以8320kbPs的可变码率进行压缩,得到相对小的文件来节约存储空间。总体来说,恒定码率的MP3文件体积较大,但效果最好。如果不在乎空间并且要最大限度保护音质的话选择高编码率的CBR,如 CBR320,折中的办法是选择VBR192。四川交通职业技术学院计算机工程系解码编码计算机算机音音频四川交通职业技术学院计算机工程系1.重要问题回顾2.音频压缩编码技术3.音频编
6、码技术标准四川交通职业技术学院计算机工程系l对于不同类型的音频信号而言,其信号带宽是不同的,如:l电话音频信号(200Hz3.4kHz)l调幅广播音频信号(50Hz 7kHz)l调频广播音频信号(20Hz 15kHz)l激光唱盘音频信号(10Hz 20kHz)v音频压缩编码技术音频压缩编码技术四川交通职业技术学院计算机工程系几种音频业务的动态范围 音质效果 AM广播 FM广播 数字电话 CDDA 动态范围(dB)40 60 50 100 v音频压缩编码技术音频压缩编码技术四川交通职业技术学院计算机工程系量化位数和动态范围比较 量化位 等份 动态范围(dB)应用 8 256 48-50 数字电话
7、 16 65536 96-100 CD-DA v音频压缩编码技术音频压缩编码技术四川交通职业技术学院计算机工程系v音频压缩编码技术音频压缩编码技术随随着着对音音频信信号号音音质要求的增加,信要求的增加,信号号频率范率范围逐逐渐增加,要求描述信增加,要求描述信号号的的数数据量也就据量也就随随之增加,之增加,从从而而带来来处理理这些些数数据的据的时间和和传输、存、存储这些些数数据据的容量增加,因此多媒体音的容量增加,因此多媒体音频压缩技技术是多媒体技是多媒体技术实用化的用化的关关键之一。之一。四川交通职业技术学院计算机工程系v音频压缩编码技术音频压缩编码技术编码的作用其一是采用一定的格式来纪录数字
8、数据,其二是采用一定的算法来压缩数字数据以减少存贮空间和提高传输效率。压缩算法包括有损压缩和无损压缩;有损压缩指解压后数据不能完全复原,要丢失一部分信息。压缩编码的基本指标之一就是压缩比,它通常小于1。压缩越多,信息丢失越多、信号还原后失真越大。根据不同的应用,应该选用不同的压缩编码算法。编码算法四川交通职业技术学院计算机工程系v音频压缩编码技术音频压缩编码技术音频数字压缩编码算法及其特性 l音频信号的压缩编码采用了在数据编码中介绍的一些技术。一般来说,主要有以下几种主要类型:1.熵2.波形3.参数4.混合5.感知四川交通职业技术学院计算机工程系1.重要问题回顾2.音频压缩编码技术3.音频编码
9、技术标准四川交通职业技术学院计算机工程系1.重要问题回顾2.音频压缩编码技术3.音频编码技术标准四川交通职业技术学院计算机工程系频率范围频率范围300Hz3.4kHz基本参数基本参数采用标准的脉冲编码调制采用标准的脉冲编码调制(PCM),),当采样频率为当采样频率为8kHz,进行,进行8bit量化时,量化时,所得数据速率为所得数据速率为64kbit/s技术标准技术标准G.723:一种一种ITU-T 推荐标准推荐标准H.324:一个:一个ITU-T 标准。它在模拟电标准。它在模拟电话线(话线(POTS)上提供了点对点的数)上提供了点对点的数据、视频和音频会议。据、视频和音频会议。50Hz7kHz
10、G.722标准是采用标准是采用16kHz采样,采样,14bit量化,信号数量化,信号数据速率为据速率为224kbits用用G.722标准可以在窄带综合服务数标准可以在窄带综合服务数据网据网N-ISDN中的一个中的一个B信道上传送调信道上传送调幅广播质量的音频信号。幅广播质量的音频信号。50Hz20kHz44.1kHz采样频率,采样频率,16bit量化,数据速率每声道达量化,数据速率每声道达705kbitsISO/IEC标准组织成立了标准组织成立了ISO/IES JTC1/SC29/WG11,即,即MPEG(活动(活动图像专家组)系列图像专家组)系列v音频压缩编码技术标准音频压缩编码技术标准电话
11、质量电话质量 调幅广播调幅广播质量质量 高保真度高保真度立体声立体声 四川交通职业技术学院计算机工程系v音频压缩编码技术标准音频压缩编码技术标准l电话质量脉冲编码调制(Pulse Code Modulation)是一种对模拟信号数字化的取样技术,将模拟语音信号变换为数字信号的编码方式,特别是对于音频信号。PCM 对信号每秒钟取样 8000 次;每次取样为 8 个位,总共 64 kbps。l适应低速率语音通信的要求 l较强的抗干扰能力 其他语音相关标准 四川交通职业技术学院计算机工程系频率范围频率范围300Hz3.4kHz基本参数基本参数采用标准的脉冲编码调制采用标准的脉冲编码调制(PCM),)
12、,当采样频率为当采样频率为8kHz,进行,进行8bit量化时,量化时,所得数据速率为所得数据速率为64kbit/s技术标准技术标准G.723:一种一种ITU-T 推荐标准推荐标准H.324:一个:一个ITU-T 标准。它在模拟电标准。它在模拟电话线(话线(POTS)上提供了点对点的数)上提供了点对点的数据、视频和音频会议。据、视频和音频会议。50Hz7kHzG.722标准是采用标准是采用16kHz采样,采样,14bit量化,信号数量化,信号数据速率为据速率为224kbits用用G.722标准可以在窄带综合服务数标准可以在窄带综合服务数据网据网N-ISDN中的一个中的一个B信道上传送调信道上传送
13、调幅广播质量的音频信号。幅广播质量的音频信号。50Hz20kHz44.1kHz采样频率,采样频率,16bit量化,数据速率每声道达量化,数据速率每声道达705kbitsISO/IEC标准组织成立了标准组织成立了ISO/IES JTC1/SC29/WG11,即,即MPEG(活动(活动图像专家组)系列图像专家组)系列v音频压缩编码技术标准音频压缩编码技术标准电话质量电话质量 调幅广播调幅广播质量质量 高保真度高保真度立体声立体声 四川交通职业技术学院计算机工程系l调幅广播质量采用子带编码方法,将输入音频信号经滤波器分成高子带和低子带两个部分,分别进行ADPCM编码,再混合形成输出码流。l自适应差分
14、脉冲编码调制(ADPCM),是对信号和它的预测值的差分信号进行量化,同时再根据邻近差分信号的特性自适应改变量化参数,从而提高压缩比,又能保持一定信号质量。lADPCM对中等电话质量要求的信号能进行高效编码,而且可以在调幅广播和交互式激光唱盘音频信号压缩中应用。v音频压缩编码技术标准音频压缩编码技术标准四川交通职业技术学院计算机工程系频率范围频率范围300Hz3.4kHz基本参数基本参数当采样频率为当采样频率为8kHz,进行,进行8bit量化时,所得数据速量化时,所得数据速率为率为64kbit/s技术标准技术标准G.723:一种一种ITU-T 推荐标准推荐标准H.324:一个:一个ITU-T 标
15、准。它在模拟电标准。它在模拟电话线(话线(POTS)上提供了点对点的数)上提供了点对点的数据、视频和音频会议。据、视频和音频会议。50Hz7kHzG.722标准是采用标准是采用16kHz采样,采样,14bit量化,信号数量化,信号数据速率为据速率为224kbits用用G.722标准可以在窄带综合服务数标准可以在窄带综合服务数据网据网N-ISDN中的一个中的一个B信道上传送调信道上传送调幅广播质量的音频信号。幅广播质量的音频信号。50Hz20kHz44.1kHz采样频率,采样频率,16bit量化,数据速率每声道达量化,数据速率每声道达705kbitsISO/IEC标准组织成立了标准组织成立了IS
16、O/IES JTC1/SC29/WG11,即,即MPEG(活动(活动图像专家组)系列图像专家组)系列v音频压缩编码技术标准音频压缩编码技术标准电话质量电话质量 调幅广播调幅广播质量质量 高保真度高保真度立体声立体声 四川交通职业技术学院计算机工程系l高保真立体声压缩的必要性l动态范围可达100dB,频响范围可达20Hz20KHz。因此,声音数字化后的信息量也非常大,例如把声道环绕立体声数字化,按每声道取样频率48KHz,每样值18bits 表示,则数字化后的数据码率为:648KHz18bits5.184Mbit/s,即使是两声道立体声,数字化后码率也达到1.5Mbps 左右,而电视图像信号数字
17、压缩后码率大约为1.5Mbps10Mbps。l因此,相对而言声音未经数字压缩的码率就太高了,为了更有效地利用宝贵的信道资源,必须对声音进行数字压缩编码。v音频压缩编码技术标准音频压缩编码技术标准四川交通职业技术学院计算机工程系lMPEG的由来l由于有必要确定一套通用的视频和声音编码方案,ISO/IEC标准组织成立了ISO/IES JTC1/SC29/WG11,即MPEG(活动图像专家组)。该小组负责比较和评估几种低码速率数字声音编码技术,以产生一套国际标准,用于活动图像、相关声音信息及其结合,和用数字存储媒体(DSM)存储与重现。lMPEG针对的DSM包括CD-ROM、DAT、磁光盘和电脑磁盘
18、。基于MPEG的压缩技术还将用于多种通信信道,如:ISDN、局域网和广播。四川交通职业技术学院计算机工程系v音频压缩编码技术标准音频压缩编码技术标准lMPEG-1制定于1992年,为工业级标准而设计,可适用于不同带宽的设备,如CD-ROM、Video-CD、CD-i。l它可针对SIF标准分辨率(对于NTSC制为352X240;对于PAL制为352X288)的图象进行压缩,传输速率为1.5Mbits/sec,每秒播放30帧,具有CD(指激光唱盘)音质,质量级别基本与VHS相当。lMPEG的编码速率最高可达4-5Mbits/sec,但随着速率的提高,其解码后的图象质量有所降低。MPEG-1MPEG
19、-1绝大多数的VCDVCD采用MPEG-1格式压缩。MPEG-1也被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL),视频点播(VOD),以及教育网络等。同时,MPEG-1也可被用做记录媒体或是在INTERNET上传输音频。四川交通职业技术学院计算机工程系lMP3MP3lMPEG-1音频第一和第二层次编码是将输入音频信号进行采样频率为48kHz,44.1kHz,32kHz的采样,经滤波器组将其分为32个子带,同时利用人耳屏蔽效应,根据音频信号的性质计算各频率分量的人耳屏蔽门限,选择各子带的量化参数,获得高的压缩比。lMPEG-1第三层次是在上述处理后再引入辅助子带,非均匀量化和熵
20、编码技术,再进一步提高压缩比。MPEG音频压缩技术的数据速率为每声道32448kbits,适合于CDDA光盘应用。四川交通职业技术学院计算机工程系v音频压缩编码技术标准音频压缩编码技术标准MPEG-2制定于1994年,设计目标是高级工业标准的图象质量以及更高的传输率。MPEG-2所能提供的传输率在3-10Mbits/sec间,其在NTSC制式下的分辨率可达720X486,MPEG-2也可提供并能够提供广播级的视像和CD级的音质。MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道(DVD可有8种语言配音的原因)。由于MPEG-2在设计时的巧妙处理,使得大多
21、数MPEG-2解码器也可播放MPEG-1格式的数据,如VCD。MPEG-1MPEG-2MPEG-2做为DVD的指定标准外,还应用在HDTV(高清晰电视广播)和一些高要求的视频编辑、处理方面,如用于为广播,有线电视网,电缆网络以及卫星直播(DirectBroadcastSatellite)提供广播级的数字视频。四川交通职业技术学院计算机工程系lMPEG-3lMPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。l(MPEG-3要求传输速率在20Mbits/sev-40Mbits/sec间,但这将使画面有轻度扭曲)。lMPEG-2的另一特点是,
22、其可提供一个较广的范围改变压缩比,以适应不同画面质量,存储容量,以及带宽的要求。按压缩比大小的 不同分成五个档次(profile),每一个档次又按图像清晰度的不同分成四种图像格式,或称为级别(levell对于最终用户来说,由于现存电视机分辨率限制,MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显,到是其音频特性(如加重低音,多伴音声道等)更引人注目。四川交通职业技术学院计算机工程系MPEG-2多声道 四川交通职业技术学院计算机工程系lAC-3编码 lAC-3(Audio Code Number 3)是Dolby公司的数字声音数据压缩算法,MPEG-2音频支持它。lAC-
23、3的主要特点是利用人的听觉系统特性来压缩声音数据,并支持5个声道(左、中、右、左环绕、右环绕和0.1 kHz以下的低音音效声道),声音样本的精度为20比特,每个声道的采样率可以是 32kHz,44.1kHz或者 48kHz。四川交通职业技术学院计算机工程系v音频压缩编码技术标准音频压缩编码技术标准MPEG-4 Audio标准(ISO/IEC 14496-3)可集成从话音到高质量的多通道声音,从自然声音到合成声音更加注重多媒体系统的交互性和灵活性。这个标准主要应用于视像电话、视像电子邮件等,对传输速率要求较低,在48006400bits/s之间,分辨率为176144。MPEG4利用很窄的带宽,通
24、过帧重建技术、数据压缩,以求用最少的数据获得最佳的图像质量。利用MPEG4的高压缩率和高的图像还原质量可以把DVD里面的MPEG2视频文件转换为体积更小的视频文件。经过这样处理,图像的视频质量下降不大但体积却可缩小几倍,。MPEG-1MPEG-4MPEG-4的特点是其更适于交互交互AVAV服服务以及远程监控。可以很方便地用CDROM来保存DVD上面的节目。另外,MPEG4在家庭摄影录像、网络实时影像播放也大有用武之地。四川交通职业技术学院计算机工程系v音频压缩编码技术标准音频压缩编码技术标准MPEG-7 Audio 标准(ISO/IEC 15938-3)提供了音频描述工具。MPEG7并不是一种
25、压缩编码方法,其正规的名字叫做多媒体内容描述接口,其目的是生成一种用来描述多媒体内容的标准,可以被传送给设备和电脑程序,或者被设备或电脑程序查取。建立MPEG-7标准的出发点是依靠众多的参数对图象与声音实现分类,并对它们的数据库实现查询,就象我们今天查询文本数据库那样。MPEG-1MPEG-7可应用于数字图书馆,例如图象编目、音乐词典等;多媒体查询服务,如电话号码簿等;广播媒体选择,如广播与电视频道选取;多媒体编辑,如个性化的电子新闻服务、媒体创作等。四川交通职业技术学院计算机工程系v音频压缩编码技术标准音频压缩编码技术标准l计算机中采用数字音乐合成技术,主要采用两种方法:l频率 调制合成法(
26、Frequenncy Modulation Synthesis)lFM合成是通过硬件产生正弦信号,再经处理合成音乐。合成的方式是将波形组合在一起,理论上可以有无限多组波形。l波表合成法(Wavetable Synthesis,也称为乐音样本合成法)l将每种真实乐器发出的声音抽样,加以适当的处理后存储成声音样本(音色文件),记录在合成器的内存当中,需要时,调用相应样本来合成该乐器的乐音。这就是波表合成(图05-07-2)。内存器的容量越大,合成效果越好,价格也越贵。Wavetable的声音播放会比较真实,而且可以做比较多的音效变化。四川交通职业技术学院计算机工程系lMIDIl电子乐器数字接口(M
27、IDI,musical instrument digital interface)是用于在电子乐器(例如音乐合成器(music synthesizers)或乐器(musical instruments))之间以及电子乐器和计算机之间交换音乐信息的一种标准协议,是音乐与计算机结合的产物。从20世纪80年代初期形成标准,并逐步被音乐家和作曲家广泛接受和使用,现已成为电脑音乐的代名词。l我们可以从广义上将其理解为电子合成器、电脑音乐的统称,包括协议、设备等等相关的含义。四川交通职业技术学院计算机工程系MIDI规范规定,MIDI键盘为128键(比标准88键钢琴多21个低音符和19个高音符),编号为01
28、27。MIDI消息可以描述每个音符的信息,包括对应的键号,按键的持续时间、音量和力度。MIDI接收器中有16个通道,它们可以同时向声音合成器传送16路不同的通信,好像指挥16个乐器演奏一样。MIDI消息可以指出什么音符发给哪个通道,并对各通道进行各种控制。每一个通道在逻辑上分别对应着一个合成器,该合成器可以产生128种不同乐器的声音,也称为不同合成器的“程序”。为某个通道选择某种乐器就必须预先为其设定对应的程序号。哪种乐器使用何种程序可以自行定义,因此同一MIDI文件使用不同的合成器播放时可能产生不同的效果。四川交通职业技术学院计算机工程系v音频压缩编码技术标准音频压缩编码技术标准WAVE文件和MIDI文件的比较 MIDI WAVE 文件内容 MIDI指令 数字音频数据 音源 MIDI乐器 Mic磁带CD唱盘音响 容量 小 与音质成正比 效果 与声卡质量有关 与编码指标有关 适用性 易编辑声源受限数据量很小 不易编辑声源不限数据量大 四川交通职业技术学院计算机工程系47