《第4章多媒体创作.ppt》由会员分享,可在线阅读,更多相关《第4章多媒体创作.ppt(79页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多媒体技术与网页设计多媒体技术与网页设计多媒体技术与网页设计多媒体技术与网页设计主主 编编 :陈陈 新新 龙龙第四章第四章 多媒体数据压缩与存储技术多媒体数据压缩与存储技术 读者学习本章应重点掌握数据压缩的读者学习本章应重点掌握数据压缩的含义、基本途径与方法;理解熵函数的含义、基本途径与方法;理解熵函数的概念,概念,Huffman编码、预测编码的基本编码、预测编码的基本理论;理解理论;理解JPEG、MPEG的含义及其的含义及其编码过程;理解编码过程;理解CD-ROM中二进制数据中二进制数据的表示方法,物理格式与逻辑格式;理的表示方法,物理格式与逻辑格式;理解解CD-ROM与与DVD-ROM的异
2、同,能利的异同,能利用刻录软件制作光盘。用刻录软件制作光盘。本章建议学时数:本章建议学时数:8学时。学时数较学时。学时数较少时可适当调整本章内容。少时可适当调整本章内容。第第1 课课 在本次课中,我们将介绍多媒体在本次课中,我们将介绍多媒体数据压缩的一般知识及其实现压缩的数据压缩的一般知识及其实现压缩的一般途径。一般途径。一、数据压缩的含义一、数据压缩的含义 我们先来看一个典型的数字传输系统模型我们先来看一个典型的数字传输系统模型:如图示,一个数字传输系统包括信源编码、如图示,一个数字传输系统包括信源编码、信道编码、调制、传输、解调、信道解码、信信道编码、调制、传输、解调、信道解码、信源解码几
3、个过程。源解码几个过程。信源编码主要解决有效性问题。信源编码主要解决有效性问题。信道编码主要是解决可靠性问题。信道编码主要是解决可靠性问题。信源编码的目的便是数据压缩,它构成了信源编码的目的便是数据压缩,它构成了数据压缩的基础。数据压缩的基础。什么是数据压缩呢什么是数据压缩呢?数据压缩就是以最少的数码表示信源所发数据压缩就是以最少的数码表示信源所发出的信号,减少容纳给定消息集合或数据采样出的信号,减少容纳给定消息集合或数据采样集合的信号空间集合的信号空间。二、数据压缩的必要性二、数据压缩的必要性 从传输的角度来看:从传输的角度来看:数字电话传输率最低,按数字电话传输率最低,按律或律或A A律律
4、PCMPCM编码,编码,其数码率为其数码率为64kbps64kbps;一路;一路PALPAL制式彩色电视信号制式彩色电视信号经数字化以后,其数码率大于经数字化以后,其数码率大于100Mbps100Mbps,若要实,若要实现实时传输,至少需要占用上述的数字话路现实时传输,至少需要占用上述的数字话路16001600个以上;采用电信新业务,宽带个以上;采用电信新业务,宽带ISDNISDN(2M2M带宽)传输,至少需要占用上述的数字话路带宽)传输,至少需要占用上述的数字话路5050个以上。个以上。从存储的角度来看:从存储的角度来看:一张一张CD-ROMCD-ROM光盘仅能保存不到一分钟的数字光盘仅能保
5、存不到一分钟的数字视频,多媒体数据其数据量之大可见一斑。视频,多媒体数据其数据量之大可见一斑。三、数据压缩的可能性三、数据压缩的可能性1 1 空间冗余空间冗余2 2 时间冗余时间冗余3 3 结构冗余结构冗余4 4 知识冗余知识冗余5 5 视觉冗余视觉冗余6 6 图像区域相同性冗余图像区域相同性冗余7 7 纹理的统计冗余纹理的统计冗余四、数据压缩的历史四、数据压缩的历史 数据压缩技术几乎是与通信系统的发展数据压缩技术几乎是与通信系统的发展同时发展。同时发展。19481948年,香侬的经典论文年,香侬的经典论文“通信的数学通信的数学原理原理”中首次提到信息率中首次提到信息率-失真函数概念,失真函数
6、概念,19591959年他又进一步确立了率失真理论,从而年他又进一步确立了率失真理论,从而奠定了信源编码的理论基础。奠定了信源编码的理论基础。五、数据压缩的过程五、数据压缩的过程 对模拟信号进行压缩可分为采样、量化、对模拟信号进行压缩可分为采样、量化、编码三个过程编码三个过程。1 1采样采样 多媒体数据压缩是指数字信号压缩,对模多媒体数据压缩是指数字信号压缩,对模拟信号进行压缩的第一步是采样,采样完成拟信号进行压缩的第一步是采样,采样完成模拟信号的离散化模拟信号的离散化。如果采样满足采样定律,那么,数据率和如果采样满足采样定律,那么,数据率和信噪比取决于代表每个样值的比特位数,这信噪比取决于代
7、表每个样值的比特位数,这便是量化问题便是量化问题。2 2量化量化 用有限个数字用有限个数字0 0和和1 1表示某一电平范围的模表示某一电平范围的模拟离散电压信号称为量化。拟离散电压信号称为量化。以有限个离散值近似表示无限个连续值一以有限个离散值近似表示无限个连续值一定会产生误差,这种误差称为量化误差,由此造定会产生误差,这种误差称为量化误差,由此造成的失真称为量化失真。成的失真称为量化失真。对于给定取样数据,进行量化并设计量化对于给定取样数据,进行量化并设计量化器时主要考虑两个因素:器时主要考虑两个因素:给定量化电平数给定量化电平数J J,希望量化失真最小;,希望量化失真最小;给定量化噪声或失
8、真要求,希望量化电给定量化噪声或失真要求,希望量化电平数平数J J最少。最少。量化器可分为标量量化和矢量量化两大类。量化器可分为标量量化和矢量量化两大类。3 3标量量化标量量化 标量量化(标量量化(Scale QuantizationScale Quantization,SQSQ)也称无记忆量化、零记忆量化,它每次)也称无记忆量化、零记忆量化,它每次只量化一个模拟取样值且本次量化结果不影只量化一个模拟取样值且本次量化结果不影响下一次量化。响下一次量化。(1 1)均匀量化均匀量化 设设xaxaL L,a am m 为量化器输入信号幅值,为量化器输入信号幅值,p p(x x)为其概率密度函数,则有
9、)为其概率密度函数,则有:均匀量化为非最佳量化均匀量化为非最佳量化 (2 2)最佳量化)最佳量化最佳量化可按均方误差最小来定义最佳量化可按均方误差最小来定义 4 4矢量量化矢量量化 大多数实际信号各样值之间总是相互关联、彼此不独立。大多数实际信号各样值之间总是相互关联、彼此不独立。如果能进一步利用这些相关性,无疑能进一步提高压缩效率。如果能进一步利用这些相关性,无疑能进一步提高压缩效率。这种量化器称为带记忆的量化器,如这种量化器称为带记忆的量化器,如DPCMDPCM。带记忆的量化器。带记忆的量化器也称矢量量化(也称矢量量化(Vector QuantizationVector Quantizat
10、ion,简写,简写VQVQ)。)。给定给定N NK K个信号样值组成信源序列个信号样值组成信源序列xixi,每,每K K个数据分为一组,个数据分为一组,N NK K个信号样值分为个信号样值分为N N个个K K维维随机矢量,构成信源空间随机矢量,构成信源空间X X X=X1 X=X1,X2 X2,XN XN(X X在在K K维维欧几里德空间欧几里德空间RKRK中)。中)。再把再把RK RK 无遗漏地划分成无遗漏地划分成J=2 n J=2 n 个互不相个互不相交的子空间交的子空间R1 R1,R2 R2,RNRN 在每一个子空间在每一个子空间RiRi中找一个代表矢量中找一个代表矢量YiYi,令恢复矢
11、量集令恢复矢量集Y=Y1 Y=Y1,Y2 Y2,YJ YJ Y Y也叫输出空间,码书或码本,也叫输出空间,码书或码本,Yi Yi 称为码矢称为码矢(code vectorcode vector)或码字()或码字(code wordcode word),),Y Y内内矢量的数目矢量的数目J J,则叫码书长度。,则叫码书长度。当矢量量化器输入任意矢量当矢量量化器输入任意矢量XjXj R RK K时,它时,它首先判断首先判断XjXj 属于哪个子空间,然后输出该子属于哪个子空间,然后输出该子空间空间RiRi 的代表矢量的代表矢量Yi Yi YYi Yi Y R RK K ,i=1i=1,2 2,JJ。
12、一句话,矢量量化过程就是用。一句话,矢量量化过程就是用Yi Yi 代表代表Xi Xi。矢量量化原理如图矢量量化原理如图4-24-2示:示:六、数据压缩的的种类六、数据压缩的的种类多媒体数据压缩方法的分类方法有多媒体数据压缩方法的分类方法有:依有无失真可分为依有无失真可分为:有损压缩和无损压缩有损压缩和无损压缩依其作用域在空间域或频率域可分为依其作用域在空间域或频率域可分为:空间方法、变换方法和混合方法空间方法、变换方法和混合方法。依是否自适应可分为依是否自适应可分为:自适应压缩编码和非自适应压缩编码自适应压缩编码和非自适应压缩编码另外,还有一种分类方法广为人们接受,那便是按照多另外,还有一种分
13、类方法广为人们接受,那便是按照多媒体数据压缩算法的分类方法。按照多媒体数据压缩算法的媒体数据压缩算法的分类方法。按照多媒体数据压缩算法的不同多媒体数据压缩可分为以下几类:不同多媒体数据压缩可分为以下几类:PCMPCM编码:固定、自适应;编码:固定、自适应;预测编码:预测编码:DPCMDPCM、M M;变换编码:傅里叶、离散余弦(变换编码:傅里叶、离散余弦(DCTDCT)、离散正弦)、离散正弦(DSTDST)、小波变换等;)、小波变换等;统计编码:哈夫曼、算术、统计编码:哈夫曼、算术、LZWLZW、游程长度、游程长度电视编码:帧内编码、帧间编码;电视编码:帧内编码、帧间编码;其他编码:矢量量化、
14、子带编码其他编码:矢量量化、子带编码。七、压缩系统性能的评估七、压缩系统性能的评估一般情况下,压缩系统的性能可从以下几一般情况下,压缩系统的性能可从以下几个方面进行评估:个方面进行评估:1 1信号质量信号质量2 2比特率比特率3 3编码解码速度编码解码速度八、数据压缩的基本途径八、数据压缩的基本途径1 1、自信息函数、自信息函数一个离散信源的输出可用序列集合一个离散信源的输出可用序列集合 XtXt;t=0t=0,11,22,来表示,集合中每个元素来表示,集合中每个元素XtXt取自有限符号集取自有限符号集合合Am=A1Am=A1,A2 A2,Am Am 中的一个。我们假定符号中的一个。我们假定符
15、号Aj Aj 出现的概率为:出现的概率为:P P(A Aj j )=pjpj j=1 j=1,2 2,m m那么,必有那么,必有 0pj1 pj=10pj1 pj=1则符号则符号AjAj的自信息量(也称自信息函数)定义为:的自信息量(也称自信息函数)定义为:I I(A Aj j)=-log=-logr rp pj j r=2r=2时相应的单位称为比特(时相应的单位称为比特(bitbit););r=er=e时相应的单位称为奈特(时相应的单位称为奈特(NatNat););r=10r=10时相应的单位称为哈特(时相应的单位称为哈特(HartHart)2 2、自信息函数的含义、自信息函数的含义 自信息
16、函数是度量信息不确定性的多少的函自信息函数是度量信息不确定性的多少的函数。必然发生的事件概率为数。必然发生的事件概率为1 1,自信息函数值为,自信息函数值为0 0,小概率事件自信息函数值大,这就是因为它,小概率事件自信息函数值大,这就是因为它们在信息不确定性上的差异。们在信息不确定性上的差异。3 3、熵函数的含义、熵函数的含义 我们把自信息量的概率平均值,即随机变量我们把自信息量的概率平均值,即随机变量I I(AjAj)的数学)的数学期望值,叫作信息熵或简称熵(期望值,叫作信息熵或简称熵(EntropyEntropy)。)。单位为单位为bit/bit/字符。通常,公式字符。通常,公式4-4-1
17、010所定义的所定义的H H(X X)也称一阶熵。)也称一阶熵。已经证明,已经证明,H H(X X)为离散无记忆)为离散无记忆信源进行无失真编码的极限。信源进行无失真编码的极限。4 4实例:实例:【例例4 42 21 1】某信源有以下五个符号,其某信源有以下五个符号,其出现概率如下:出现概率如下:求其其信息熵求其其信息熵?5 5、数据压缩的途径、数据压缩的途径数据压缩的途径之一:数据压缩的途径之一:设法改变信源的概率分布使其尽可能地非设法改变信源的概率分布使其尽可能地非均匀,再用最佳编码方法使平均码长逼近信均匀,再用最佳编码方法使平均码长逼近信源的熵。源的熵。数据压缩的途径之二:数据压缩的途径
18、之二:联合信源的冗余度也寓于信源间的相关性联合信源的冗余度也寓于信源间的相关性之中。去除它们之间的相关性,使之成为或之中。去除它们之间的相关性,使之成为或差不多成为不相关信源,是数据压缩的又一差不多成为不相关信源,是数据压缩的又一途径。途径。九、本课重点、难点九、本课重点、难点重点:熵函数的定义及数据压缩的途重点:熵函数的定义及数据压缩的途径径难点:矢量量化、最佳量化难点:矢量量化、最佳量化思考练习思考练习请解释标量量化与矢量量化的本质区请解释标量量化与矢量量化的本质区别?别?请解释信息熵的本质为何?请解释信息熵的本质为何?下下 课!课!第第 2 课课 在本次课中,我们将介绍在本次课中,我们将
19、介绍JPEGJPEG基本系基本系统的实现。统的实现。一、一、JPEGJPEG概述概述 JPEGJPEG是是Joint Photographic Experts Joint Photographic Experts GroupGroup的英文缩写,中文翻译的英文缩写,中文翻译“联合图像联合图像专家组专家组”,该专家组研制开发的该专家组研制开发的“连续连续色调、多级灰度、静止图像的数字图像色调、多级灰度、静止图像的数字图像压缩算法压缩算法”(JPEGJPEG算法)。算法)。19911991年,年,JPEGJPEG算法被确定为国际标准,全称为算法被确定为国际标准,全称为“多灰度连续色调静止图像的数字
20、压缩编多灰度连续色调静止图像的数字压缩编码码”标准(简称为标准(简称为JPEGJPEG标准)。标准)。二、二、JPEGJPEG标准的主要内容标准的主要内容1 1、JPEGJPEG的目的:的目的:(1 1)开发的算法在图像压缩率方面达到或接近当前的科学)开发的算法在图像压缩率方面达到或接近当前的科学水平。水平。(2 2)开发的算法可实际应用于任何一类数字图像源。)开发的算法可实际应用于任何一类数字图像源。(3 3)对开发的算法,其计算复杂程度可调。)对开发的算法,其计算复杂程度可调。2 2、JPEGJPEG算法要点如下:算法要点如下:(1 1)基本系统()基本系统(baseline system
21、baseline system)(2 2)扩展系统()扩展系统(extended systemextended system)(3 3)独立的信息保持型()独立的信息保持型(losslesslossless)压缩)压缩三、三、JPEGJPEG基本系统涉及的几种编码方法基本系统涉及的几种编码方法 (1 1)DCTDCT变换变换 DCTDCT变换便是通过变换改变信源的概率分变换便是通过变换改变信源的概率分布使其尽可能地非均匀,再结合最佳编码方法布使其尽可能地非均匀,再结合最佳编码方法进行编码从而达到压缩的目的。进行编码从而达到压缩的目的。离散余弦变换是傅里叶变换的一种特殊离散余弦变换是傅里叶变换的
22、一种特殊情况。包括一维离散余弦变换和二维离散余弦情况。包括一维离散余弦变换和二维离散余弦变换两种形式。变换两种形式。二维离散偶余弦正变换(二维离散偶余弦正变换(FDCTFDCT)公式定义)公式定义见见P90P90页页4-2-64-2-6 DCT DCT变换参考实例变换参考实例 (2 2)HuffmanHuffman编码编码 1 1理论理论 定理:在变长编码中,对出现概率定理:在变长编码中,对出现概率大的信源赋予短码字,对出现概率小的大的信源赋予短码字,对出现概率小的信源赋予长码字。如果码字长度严格按信源赋予长码字。如果码字长度严格按照所对应符号出现概率大小的逆序排列,照所对应符号出现概率大小的
23、逆序排列,则编码结果平均码字长度一定小于其它则编码结果平均码字长度一定小于其它排列方式排列方式。2 2编码步骤:编码步骤:将信源符号出现概率依大小按递减顺序排列;将信源符号出现概率依大小按递减顺序排列;将两个最小的概率进行组合相加,并继续这一步骤,始将两个最小的概率进行组合相加,并继续这一步骤,始终将较高的概率分支放在上部,直到概率达到终将较高的概率分支放在上部,直到概率达到1.01.0为止;为止;对每对组合中的上边一个指定为对每对组合中的上边一个指定为1 1,下边一个指定为,下边一个指定为0 0(或相反,上边一个指定为(或相反,上边一个指定为0 0,下边一个指定为,下边一个指定为1 1);)
24、;画出由每个信源符号概率到画出由每个信源符号概率到1.01.0处的路径,记下沿路径处的路径,记下沿路径的的1 1和和0 0;对于每个信源符号都写出对于每个信源符号都写出1 1、0 0序列,则从右到左就得到序列,则从右到左就得到HuffmanHuffman编码。编码。3 3编码实例:编码实例:【例例4 42 22 2】某信源有以下五个符号,某信源有以下五个符号,其出现概率如下:其出现概率如下:求其求其HuffmanHuffman编码?编码?四、四、JPEGJPEG基本系统编码原理基本系统编码原理 JPEGJPEG基本系统编码框图(单个分量)如图基本系统编码框图(单个分量)如图4-104-10所示
25、:所示:(1 1)图像变换)图像变换 首先应对图像进行变换,将整个图像分成若干个首先应对图像进行变换,将整个图像分成若干个8888的子的子块。块。(2 2)FDCTFDCT变换变换 对上一步的各对上一步的各8888的子块单独进行的子块单独进行FDCTFDCT变换,将空间域的变换,将空间域的图像数据变换到频率域。图像数据变换到频率域。(3 3)根据视觉特性设计的自适应量化)根据视觉特性设计的自适应量化 一个一个8888的子块经过的子块经过FDCTFDCT变换后,空间域的图像数据变成变换后,空间域的图像数据变成了频率域的系数。根据人的视觉特性,人眼对不同的频率分量了频率域的系数。根据人的视觉特性,
26、人眼对不同的频率分量具有不同的视觉敏感性,所以,可对不同的频率分量进行不同具有不同的视觉敏感性,所以,可对不同的频率分量进行不同粗造程度的量化。粗造程度的量化。JPEGJPEG推荐了两个量化表,具体如推荐了两个量化表,具体如P97P97(4 4)“Z”Z”型展开型展开(5 5)熵编码)熵编码 D=“SSSS”+D=“SSSS”+附加位附加位 对对DCDC系数,其编码方法如下:系数,其编码方法如下:“SSSS”SSSS”表示表示DCDC系数差值的幅度范围,共分为系数差值的幅度范围,共分为1616类,见类,见表表4.34.3;由;由DCDC系数原始值,可查出其分类,由其分类,可从表系数原始值,可查
27、出其分类,由其分类,可从表4.44.4中查出其变长编码中查出其变长编码 附加位用于唯一地规定该类中一个具体的差值幅度,对原附加位用于唯一地规定该类中一个具体的差值幅度,对原始值始值00,附加位,附加位=原始值。对原始值原始值。对原始值00,附加位,附加位=原始值原始值-1-1的最的最低低B B位。位。对每一个非零的对每一个非零的ACAC系数,系数,D D中的中的“SSSS”SSSS”由由T T确定表示,确定表示,附加位同附加位同DCDC系数系数:T=T=二进制二进制“NNNNSSSS”NNNNSSSS”低四位低四位“SSSS”SSSS”表示非零表示非零ACAC系数幅值范围系数幅值范围分类,高四
28、位分类,高四位“NNNN”NNNN”表示前后两个非零表示前后两个非零ACAC系系数之间连续零的个数。数之间连续零的个数。由原始数据可确定由原始数据可确定T T,根据,根据T T查表可获得该查表可获得该ACAC系数的变长编码。系数的变长编码。五、五、JPEGJPEG基本系统编码实例基本系统编码实例 为帮助理解为帮助理解JPEGJPEG熵编码原理,下面我们结熵编码原理,下面我们结合实例介绍合实例介绍JPEGJPEG熵编码方法的实现熵编码方法的实现 【例例4 43 31 1】设某亮度子块按设某亮度子块按Z Z序排列的系序排列的系数如下:数如下:k 0 1 2 3 4 5 6-63系数:系数:12 4
29、 1 0 0 -1 0 六、六、JPEGJPEG基本系统解码基本系统解码 七、本课重点、难点七、本课重点、难点重点:重点:JPEGJPEG基本系统的实现过程基本系统的实现过程难点:难点:HuffmanHuffman编码在编码在JPEGJPEG标准中的应用标准中的应用八、思考练习八、思考练习下下 课!课!第第 3 课课 在本次在本次课课中,我中,我们们将介将介绍绍JPEG扩扩展展系系统统与与MPEG。一、一、JPEG扩展系统扩展系统JPEG标准是一个很灵活的图像压缩国际标准是一个很灵活的图像压缩国际标准,定义了基本系统、扩展系统、无失真标准,定义了基本系统、扩展系统、无失真编码等各种压缩算法,适
30、应范围很广。编码等各种压缩算法,适应范围很广。扩展系统是基本系统的扩展与增强,它必扩展系统是基本系统的扩展与增强,它必须包括基本系统须包括基本系统。在在JPEG扩展系统中,可采用基于扩展系统中,可采用基于DCT的的累进编码或分层编码两种操作模式。分层编累进编码或分层编码两种操作模式。分层编码的步骤如下:码的步骤如下:1把原始图像的空间分辨率按把原始图像的空间分辨率按2的倍数降低;的倍数降低;2对已降低了分辨率的对已降低了分辨率的“小小”图像可采用基于图像可采用基于DCT的顺的顺序方式、累进方式或无失真编码中的任何一种方式进行编码;序方式、累进方式或无失真编码中的任何一种方式进行编码;3对压缩数
31、据解码,重建低分辨率图像,使用插值滤波对压缩数据解码,重建低分辨率图像,使用插值滤波器对其内插,恢复原图像的水平与垂直分辨率;器对其内插,恢复原图像的水平与垂直分辨率;4把相同分辨率的插值图像作为原始图像的预测值,对把相同分辨率的插值图像作为原始图像的预测值,对二者的差值采用基于二者的差值采用基于DCT的顺序方式、累进方式或无失真编的顺序方式、累进方式或无失真编码中的任何一种方式进行编码;码中的任何一种方式进行编码;5重复重复3、4直至达到完整的图像分辩率编码。直至达到完整的图像分辩率编码。二预测编码原理二预测编码原理预测编码(预测编码(predictive coding)是统计冗余数据压缩理
32、)是统计冗余数据压缩理论的三大重要分支之一,广泛应用于图像编码、数字通信论的三大重要分支之一,广泛应用于图像编码、数字通信等领域。等领域。预测编码方法包括线性预测和非线性预测两大类。线性预测编码方法包括线性预测和非线性预测两大类。线性预测编码方法,也称差值脉冲编码调制法,简称预测编码方法,也称差值脉冲编码调制法,简称DPCM,是应用最广泛的预测编码方法之一。是应用最广泛的预测编码方法之一。DPCM编码方法原理见图编码方法原理见图4-6。三预测编码预测器的设计三预测编码预测器的设计 DPCM系统包括预测器、量化器两个主要部系统包括预测器、量化器两个主要部分。预测器是实现压缩的关键。分。预测器是实
33、现压缩的关键。我们以我们以N点预测器为例讨论预测器的设计。点预测器为例讨论预测器的设计。JPEG三点预测器如下:三点预测器如下:JPEG三点预测器用三点预测器用A、B、C三点预测三点预测Y,其,其预测系数为预测系数为:a1=1 a2=0.5 a3=-0.5 即:即:En=Y-(A+(B-C)/2)显然,对第一行、第一列,无法采用三点预显然,对第一行、第一列,无法采用三点预测器,因此,对第一列采用测器,因此,对第一列采用Y-B预测,对第一行预测,对第一行采用采用Y-A预测。预测。四、无失真编码压缩系统四、无失真编码压缩系统JPEG建议的独立的信息保持型压缩系统建议的独立的信息保持型压缩系统框图如
34、下:框图如下:五、五、MPEG概述概述 MPEG(Moving Picture Experts Group)是)是1988年成年成立的一个专家组,中文翻译立的一个专家组,中文翻译“动态图像专家组动态图像专家组”。MPEG专家组专家组1991年提出草案,年提出草案,1992年正式通过,通常年正式通过,通常称之为称之为MPEG标准(运动图像及其伴音的压缩编码标准),标准(运动图像及其伴音的压缩编码标准),标准编号为标准编号为ISO/IEC 11172。此后,更名为。此后,更名为MPEG-1标准,它标准,它便是广为人知的便是广为人知的VCD节目的压缩算法。节目的压缩算法。此后,为适应更高的应用要求,
35、此后,为适应更高的应用要求,MPEG专家组又相继推专家组又相继推出了出了MPEG-2、MPEG-4、MPEG-7、MPEG-21。六、六、MPEG-1标准标准1概述概述MPEG标准包括四部分:标准包括四部分:ISO/IEC11172-1(MPEG系统系统)、ISO/IEC11172-2(MPEG视频视频)、ISO/IEC11172-3(MPEG音频音频)、ISO/IEC11172-4(测试和验证测试和验证)。2运动补偿编码技术运动补偿编码技术运动补偿编码技术是基于运动补偿编码技术是基于1616子块的算法,每个子块可作子块的算法,每个子块可作为一个二维的运动矢量处理。运动补偿编码技术把当前为一个
36、二维的运动矢量处理。运动补偿编码技术把当前1616子块看作先前某一时刻图像子块的位移,并用这个子块来预测子块看作先前某一时刻图像子块的位移,并用这个子块来预测当前子块。可获得很高的压缩比,是减少帧序列冗余有效方法。当前子块。可获得很高的压缩比,是减少帧序列冗余有效方法。3编码图像的类型编码图像的类型 定义了三种类型图像:帧内图(定义了三种类型图像:帧内图(Intra Pictures,I)、预测图()、预测图(Predicted Pictures,P)和插补图,即双向预测图()和插补图,即双向预测图(Bidirectional Predicted,B)。)。帧内图(帧内图(Intrapictu
37、res,I)采用)采用JPEG压缩压缩技术,直接对原始图像数据压缩,可提供随机存技术,直接对原始图像数据压缩,可提供随机存取的存取位置,但压缩比不大;取的存取位置,但压缩比不大;预测图(预测图(Predicted Pictures,P)、双向预)、双向预测图(测图(Bidirectional Predicted,B)采用运动)采用运动补偿编码技术,可获得很高的压缩比补偿编码技术,可获得很高的压缩比。预测图(预测图(P帧)采用运动补偿编码技术,帧)采用运动补偿编码技术,用过去的(最靠近的)用过去的(最靠近的)I帧或帧或P帧进行预帧进行预测,因此,也称为前向预测帧,其示意测,因此,也称为前向预测帧
38、,其示意图如图图如图4-18。P帧是预测的基础帧,可用帧是预测的基础帧,可用来预测来预测B-帧或下一个帧或下一个P帧。帧。双向预测图(双向预测图(B-帧)采用运动补偿编码技帧)采用运动补偿编码技术,利用前、后帧图像作为预测参考,其示术,利用前、后帧图像作为预测参考,其示意图如图意图如图4-18。B-帧不作为预测参考帧,因帧不作为预测参考帧,因此,此,B-帧不仅图像压缩比高,而且误差不会帧不仅图像压缩比高,而且误差不会传播。传播。4视频流的组成视频流的组成 MPEG并未规定三种类型图像的数量、排并未规定三种类型图像的数量、排列顺序,但根据三种类型图像特性为保证图像列顺序,但根据三种类型图像特性为
39、保证图像恢复质量,对大多数景物,在参考图像之间插恢复质量,对大多数景物,在参考图像之间插入两帧入两帧B-帧图像较为合适,最好每帧图像较为合适,最好每16帧图像至帧图像至少有一个帧内图(少有一个帧内图(I帧)。帧)。一个典型一个典型的的MPEG-1的的视频流组成如图视频流组成如图4-20。5MPEG音频编码音频编码 七、七、MPEG-4标准标准 MPEG-4标准与标准与MPEG-1、MPEG-2标准最标准最根本的区别在于根本的区别在于MPEG-4是基于内容的压缩编是基于内容的压缩编码方法,它突破了传统的以矩形码方法,它突破了传统的以矩形/方形块处理方形块处理图像的方法。它将图像按内容分割成块,如
40、图像的方法。它将图像按内容分割成块,如图像的场景、画面上的物体(物体图像的场景、画面上的物体(物体1、物体、物体2、)被分割成不同的子块,将感兴趣的物体从)被分割成不同的子块,将感兴趣的物体从场景中截取出来,进行编码处理。由于基于场景中截取出来,进行编码处理。由于基于内容或物体截取的子块内信息相关性强,因内容或物体截取的子块内信息相关性强,因而可以产生更高的压缩比。而可以产生更高的压缩比。5MPEG音频编码音频编码 七、七、MPEG-2标准标准 MPEG-2草案由草案由MPEG专家组专家组1992年提出,年提出,1993年正式通过。与年正式通过。与MPEG-1类似,类似,MPEG-2标准(标准
41、(ISO/IEC13813)也包括)也包括MPEG系统、系统、MPEG视频、视频、MPEG音频等部分内容,它是音频等部分内容,它是DVD所采用的核心算法。所采用的核心算法。八、八、MPEG-4标准标准 MPEG-4标准与标准与MPEG-1、MPEG-2标准最标准最根本的区别在于根本的区别在于MPEG-4是基于内容的压缩编是基于内容的压缩编码方法,它突破了传统的以矩形码方法,它突破了传统的以矩形/方形块处理方形块处理图像的方法。它将图像按内容分割成块,如图像的方法。它将图像按内容分割成块,如图像的场景、画面上的物体(物体图像的场景、画面上的物体(物体1、物体、物体2、)被分割成不同的子块,将感兴
42、趣的物体从)被分割成不同的子块,将感兴趣的物体从场景中截取出来,进行编码处理。由于基于场景中截取出来,进行编码处理。由于基于内容或物体截取的子块内信息相关性强,因内容或物体截取的子块内信息相关性强,因而可以产生更高的压缩比。而可以产生更高的压缩比。九、九、MPEG-7标准标准 MPEG-7标准于标准于1998年年10月提出,月提出,2001年最终完成并公布,正式名称为年最终完成并公布,正式名称为“多媒体内容多媒体内容描述接口描述接口”,扩展了现有内容识别专用解决方,扩展了现有内容识别专用解决方案的有限的能力,规定了一个用于描述各种案的有限的能力,规定了一个用于描述各种不同类型多媒体信息的描述符
43、的标准集合。不同类型多媒体信息的描述符的标准集合。十、十、MPEG-21标准标准 开展开展MPEG-21研究工作的目的是:研究工作的目的是:(1)是否需要和如何将不同的协议、标准、)是否需要和如何将不同的协议、标准、技术等有机地融合在一起;技术等有机地融合在一起;(2)讨论是否需要制定新的标准;)讨论是否需要制定新的标准;(3)如果具备了前面两个条件,如何将这些)如果具备了前面两个条件,如何将这些不同的标准集成在一起。不同的标准集成在一起。下下 课!课!第第 4 课课 在本次在本次课课中,我中,我们们将介将介绍绍多媒体多媒体计计算机存算机存储储技技术术。一、一、CD-ROM概述概述1CD-RO
44、M的起源的起源 20世纪世纪70年代初期年代初期“镭射镭射”1978年开始,年开始,Philips公司和公司和Sony公司公司“CD”。探索存储设备应用到计算机中,两个重要问题需要解决:探索存储设备应用到计算机中,两个重要问题需要解决:计算机如何寻找数据;误码率及错误校正技术;计算机如何寻找数据;误码率及错误校正技术;只读光盘只读光盘CD-ROM(Compact Disc-Read Only Memory)黄)黄皮书标准皮书标准解决了硬件生产厂家的制造标准问题解决了硬件生产厂家的制造标准问题。1985年制定了一个文件交换标准(年制定了一个文件交换标准(ISO 9660标准)标准)2 光盘结构光
45、盘结构 激光唱盘、激光唱盘、CD-ROM、数字激光视盘等等统称为光盘。一片、数字激光视盘等等统称为光盘。一片光盘是由三层材料组成的圆盘,盘片厚度为光盘是由三层材料组成的圆盘,盘片厚度为1.2mm,盘片外沿,盘片外沿直径直径12cm,中间有一个直径为,中间有一个直径为1.5cm的圆孔,平均盘重的圆孔,平均盘重18g。光盘的底层为聚碳酸酯(光盘的底层为聚碳酸酯(Polycarbonate)或丙烯树压制出的)或丙烯树压制出的一种极坚硬的塑料透明衬底,中间层是用铝(或其它合金)制一种极坚硬的塑料透明衬底,中间层是用铝(或其它合金)制成的一种很薄的金属反射层,顶层是涂漆的保护层成的一种很薄的金属反射层,
46、顶层是涂漆的保护层。3CD-ROM的含义的含义 只读只读“紧凑式紧凑式”光盘光盘二、二、CD-ROM中数据的表示中数据的表示 1计算机中数据:计算机中数据:二进制字节数据二进制字节数据2光盘数据特点光盘数据特点 用凹坑和非凹坑之间机械性的跳变边沿代表用凹坑和非凹坑之间机械性的跳变边沿代表“1”,而凹,而凹坑和非凹坑的平坦部分代表坑和非凹坑的平坦部分代表“0”,参考实例如图,参考实例如图4-5-2所所示示 理理论论分析和分析和实验证实验证明,把明,把“0”的游程最小的游程最小长长度限制在度限制在2个,个,而最而最长长限制在限制在10个,光个,光盘盘上的信息就能可靠上的信息就能可靠读读出。出。这这
47、便是便是“0”游程游程规则规则 3计算机中数据到光盘数据的转换计算机中数据到光盘数据的转换 (1)通道编码)通道编码多媒体信息内容,是以多媒体信息内容,是以“1”和和“0”的二进制数据存放在磁的二进制数据存放在磁盘中的,在存储到光盘之前,需要将磁盘中的二进制多媒盘中的,在存储到光盘之前,需要将磁盘中的二进制多媒体数据信息进行变换处理,这种处理过程称为通道编码。体数据信息进行变换处理,这种处理过程称为通道编码。实现计算机中数据到光盘数据的转换采用了实现计算机中数据到光盘数据的转换采用了8到到14位的调位的调制编码方案,简称为制编码方案,简称为EFM(Eight to Fourteen Modul
48、ation)编码方案。)编码方案。具体说,在具体说,在214=16384种通道码中,通过计种通道码中,通过计算机的计算,有算机的计算,有267种码能满足两个种码能满足两个“1”之之间至少间至少2个个“0”、最多、最多10个个“0”的要求。舍的要求。舍去高位为去高位为1的的11种编码,可得到与种编码,可得到与8位数据相位数据相对应的对应的28=256种通道码。种通道码。(2)通道合并位)通道合并位 此外当连续两个通道码合并时,可能会出现此外当连续两个通道码合并时,可能会出现合并后不能满足合并后不能满足“0”的游程长度至少为的游程长度至少为2的的要求,因此,在每两个通道码之间又增加了要求,因此,在
49、每两个通道码之间又增加了3位通道合并位,这样一来,原来的位通道合并位,这样一来,原来的8位数据实位数据实际上编码后变成了际上编码后变成了17位的信息了。位的信息了。三、三、CD-ROM物理格式物理格式1概述概述 光盘上的数据按从外向内的螺旋线的光道排列,光道上可进光盘上的数据按从外向内的螺旋线的光道排列,光道上可进一步划分为扇区一步划分为扇区。2CD数据格式数据格式 CD光盘按照时间组织数据,每一秒包括光盘按照时间组织数据,每一秒包括75扇区,每一个扇扇区,每一个扇区包括区包括98帧帧,每一帧每一帧24字节。字节。3CD-ROM扇区格式扇区格式 光盘扇区的物理长度是固定的光盘扇区的物理长度是固
50、定的,每个扇区由每个扇区由2352个字节组成。个字节组成。每个扇区开头含一个每个扇区开头含一个12字节的同步段和一个字节的同步段和一个4字节的起始段字节的起始段(或称扇区头)。(或称扇区头)。常用格式有两种:常用格式有两种:Mode 1 和和Mode 2。(1)Mode 1 扇区格式扇区格式 Mode 1 扇区格式用于存放要求误码率很低扇区格式用于存放要求误码率很低的数据或者说对错误极为敏感的数据如计算的数据或者说对错误极为敏感的数据如计算机程序、企业或金融数据等机程序、企业或金融数据等 除同步信息和扇区头外,在用户数据区之后除同步信息和扇区头外,在用户数据区之后用用4个字节存放个字节存放ED