第四章多媒体数据压缩编码技术优秀PPT.ppt-淘文阁

资源描述

《第四章多媒体数据压缩编码技术优秀PPT.ppt》由会员分享，可在线阅读，更多相关《第四章多媒体数据压缩编码技术优秀PPT.ppt（44页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章多媒体数据压缩编码技术第一页，本课件共有44页多媒体数据压缩编码的重要性多媒体数据压缩编码的重要性l信息时代的重要特征是信息的数字化，数字化了的信息带来了“信息爆炸”。多媒体计算机系统技术是面向三维图形、立体声和彩色全屏幕运动画面的处理技术。数字计算机面临的是数值、文字、语言、音乐、图形、动画、静图像和电视视频图像等多种媒体承载了由模拟量转化成数字量信息的吞吐、存储和传输的问题。数字化了的视频和音频信号的数量之大是非常惊人的。第二页，本课件共有44页多媒体数据压缩编码的可能性多媒体数据压缩编码的可能性l空间冗余l时间冗余l结构冗余l知识冗余l视觉冗余l图像区域的相似性冗余l纹理的统计冗

2、余第三页，本课件共有44页多媒体数据压缩编码的分类多媒体数据压缩编码的分类多媒体数据压缩方法根据不同的分类标准而不同l第一种，根据质量有无损失可分为：无损压缩和有损压缩。l第二种，按照其作用域在空间域或频率域上分为：空间方法、变换方法和混合方法。l第三种，根据是否自适应分为自适应性编码和非适应性编码，一般来说，每一个编码方法都有其相应的自适应算法。l第四种，按其原理分类也可分为：预测编码、变换编码、量化与矢量量化编码、信息熵编码、分频带编码、结构编码和基于知识的编码。第四页，本课件共有44页常用压缩编码算法的基本原理常用压缩编码算法的基本原理及实现技术及实现技术l预测编码：编码器记录与传输

3、的不是样本的真实值，而是它与预测值的差。这一方法称为差值脉冲编码调制（differential pulse code modulation，简称DPCM）方法 l变换编码（K-L变换、DCT变换）：其主要思想是利用图像块内像素值之间的相关性，把图像变换到一组新的基上，使得能量集中到少数几个变换系数上，通过存储这些系数而达到压缩的目的 l统计编码（Huffman编码、算术编码）：最常用的统计编码是Huffman编码第五页，本课件共有44页标量量化比较实验结果(a)32灰度级均匀量化 (b)20灰度级经典非均匀量化 (c)18灰度级自适应量化(d)8灰度级均匀量化 (e)8灰度级经典非均匀量化

4、(f)8灰度级自适应量化第六页，本课件共有44页索引色转换压缩n (a)原图 (b)PHOTOSHOP的索引色 (c)本文的索引色n真彩图转换成16色的索引色图的比较实验结果第七页，本课件共有44页 (s)原图4 (t)16色 (u)12色 (v)8色 (w)6色 (x)4色不同颜色数下的索引色转换压缩比较实验结果不同颜色数下的索引色转换压缩比较实验结果第八页，本课件共有44页 (a)原图 (b)压缩效果图图 a 一次小波变换编码的实验结果 (a)原图 (b)压缩效果图图 b 二次小波变换编码的实验结果第九页，本课件共有44页 (a)原图 (b)压缩效果图图 c 三次小波变换编码的实验结果图

5、d 四次小波变换编码的实验结果 (a)原图 (b)压缩效果图第十页，本课件共有44页预测编码l预测编码的基本原理l自适应预测编码l帧间预测编码第十一页，本课件共有44页变换编码变换编码不是直接对空域图像信号进行编码，而是首先将空域图像信号映射变换到另一个正交矢量空间（变换域或频域），产生一批变换系数，然后对这些变换系数进行编码处理。变换编码是一种间接编码方法，其中关键问题是在时域或空域描述时，数据之间相关性大，数据冗余度大，经过变换在变换域中描述，数据相关性大大减少，数据冗余量减少，参数独立，数据量少，这样再进行量化，编码就能得到较大的压缩比。目前常用的正交变换有：傅立叶(Fouries)变

6、换、沃尔什(Walsh)变换、哈尔(Haar)变换、斜(Slant)变换、余弦变换、正弦变换、K-L(Karhunen-Loeve)变换等。第十二页，本课件共有44页变换编码的基本原理利用映射变换来实现对数据的建模表示，也就是说，将数据“变换”到另外一个更为紧凑的空间表示。经过多维坐标系中适当的旋转和变换，就能够把分散在各个坐标轴上的原始数据，在新的、适当的坐标系中集中到少数坐标轴上，因此可以用较少位数来表示一组样本信号，实现高效率的压缩编码。第十三页，本课件共有44页l预测编码消除相关性的能力有限，变换编码是一种更高效的压缩编码。l变换编码的思想：将初始数据从时间域或者空间域变换到另一个更

7、适合于压缩的抽象域，通常为频域。第十四页，本课件共有44页统计编码根据香农信息论的原理，最佳的数据压缩方法的理论极限是信息熵。如果要求在编码过程中不丢失信息量，即要求保存信息熵，这种信息保持的编码又叫熵保存编码，或叫熵编码。熵编码是无失真压缩。当然在考虑人眼失真不易察觉的生理特性时，有些图像编码不严格要求熵保存，信息允许通过部分损失来换取高的数据压缩比。这种编码属于有失真数据压缩。第十五页，本课件共有44页Huffman编码基本原理基本原理 Huffman编码的理论依据是变字长编码理论。按信源符号出现的概率大小进行排序，出现概率大的分配短码，出现概率小的则分配长码。第十六页，本课件共有44页

8、Huffman编码Huffman编码的编码步骤编码的编码步骤概率统计（如对一幅图像，或m幅同种类型图像作灰度信号统计），得到n个不同概率的信息符号。将n个信源信息符号的n个概率，按概率大小排序。将n个概率中，最后两个小概率相加，这时概率个数减为n-1个。将n-1个概率，按大小重新排序。重复，将新排序后的最后两个小概率再相加，相加和与其余概率再排序。如此反复重复n-2次，得到只剩两个概率序列。以二进制码元(0.1)赋值，构成霍夫曼码字。编码结束。第十七页，本课件共有44页静态图像压缩编码的国际标准静态图像压缩编码的国际标准（JPEG）原理、实现技术）原理、实现技术lJPEG（Joint Pho

9、tographic Experts Group）是一个通用的静态图像压缩标准l JPEG压缩分4个步骤实现：l 颜色模式转换及采样；l DCT变换；l 量化；l 编码。第十八页，本课件共有44页动态图像压缩编码的国际标准动态图像压缩编码的国际标准（MPEG）的基本原理）的基本原理lMPEG（Motion picture Experts Group）是运动图像专家小组的英文缩写 lMPEG标准主要有MPEG-l、MPEG-2、MPEG-4和正在制定的MPEG-7等第十九页，本课件共有44页多媒体数据压缩编码的国际标准1.静态图像压缩编码的国际标准（静态图像压缩编码的国际标准（JPEG）JPE

10、G（Joint Photographic Experts Group联合图象专家组）是（联合图象专家组）是（ITU的前身）国际电的前身）国际电话与电报咨询委员会话与电报咨询委员会CCITT与与ISO于于1986年年联合成立的一个小组，负责制定静态图像的联合成立的一个小组，负责制定静态图像的编码标准。编码标准。1992年年9月月JPEG推出了推出了ISO/IEC 10918标准标准(CCITT T.81)连续色调静态图像的数字连续色调静态图像的数字压缩与编码，简称为压缩与编码，简称为JPEG标准，适用于灰标准，适用于灰度图与真彩图的静态图像的压缩。度图与真彩图的静态图像的压缩。第二十页，本课件共

11、有44页多媒体数据压缩编码的国际标准2000年年12月月JPEG在在JBIG（Joint Bi-level Image experts Group联合二值图像专家组）联合二值图像专家组）的帮助下又推出了比的帮助下又推出了比JPEG标准的压缩率更标准的压缩率更高、性能更优越的高、性能更优越的JPEG 2000标准标准ISO/IEC 15444(ITU T.8002002年年8月月)JPEG 2000图像编码系统，适用于二值图、灰度图、图像编码系统，适用于二值图、灰度图、伪彩图和真彩图的静态图像压缩。伪彩图和真彩图的静态图像压缩。第二十一页，本课件共有44页多媒体数据压缩编码的国际标准JPEG

12、主要采用了以主要采用了以DCT（离散余弦变换）（离散余弦变换）为基础的有损压缩算法。而为基础的有损压缩算法。而JPEG 2000则采则采用的是性能更优秀的小波变换。用的是性能更优秀的小波变换。由于视频的帧内编码就是静态图像的编码，由于视频的帧内编码就是静态图像的编码，所以所以JPEG和和JPEG 2000的算法也用于的算法也用于MPEG的视频编码标准中。的视频编码标准中。第二十二页，本课件共有44页多媒体数据压缩编码的国际标准JPEG专家组开发了两种基本的压缩算法：专家组开发了两种基本的压缩算法：l采用以采用以DCT为基础的有损压缩算法为基础的有损压缩算法l采用以预测技术为基础的无损压缩算法

13、采用以预测技术为基础的无损压缩算法在在JPEG标准中定义了四种编码模式：标准中定义了四种编码模式：l顺序编码顺序编码l累进编码累进编码l无失真编码无失真编码l分层编码分层编码第二十三页，本课件共有44页JPEG图像的压缩比与质量图像的压缩比与质量lJPEG在使用在使用DCT进行有损压缩时，压缩比可进行有损压缩时，压缩比可调整在压缩调整在压缩1030倍后，图像效果仍然不错，倍后，图像效果仍然不错，因此得到了广泛的应用。因此得到了广泛的应用。多媒体数据压缩编码的国际标准第二十四页，本课件共有44页多媒体数据压缩编码的国际标准2.JPEG压缩的算法概要压缩的算法概要JPEG压缩是有损压缩，它利用了

14、人的视觉系统的特压缩是有损压缩，它利用了人的视觉系统的特性，使用量化和无损压缩编码相结合来去掉视角的冗性，使用量化和无损压缩编码相结合来去掉视角的冗余信息和数据本身的冗余信息。余信息和数据本身的冗余信息。JPEG属于结合变换属于结合变换编码编码(DCT)与熵编码与熵编码(RLE/Huffman)的混合编码。的混合编码。JPEG算法与彩色空间无关，因此算法与彩色空间无关，因此“RGB到到YUV变换变换”和和“YUV到到RGB变换变换”不包含在不包含在JPEG算法中。算法中。JPEG算法处算法处理的彩色图像是单独的彩色分量图像，因此它可以压缩来理的彩色图像是单独的彩色分量图像，因此它可以压缩来自不

15、同彩色空间的数据，如自不同彩色空间的数据，如RGB,YCbCr和和CMYK。第二十五页，本课件共有44页多媒体数据压缩编码的国际标准第二十六页，本课件共有44页JPEG压缩编码大致分成三个步骤：压缩编码大致分成三个步骤：(1)使用正向使用正向DCT(FDCT=forward DCT)把把空间域表示的图变换成频率域表示的图。空间域表示的图变换成频率域表示的图。(2)使用加权函数对使用加权函数对DCT系数进行量化，这个系数进行量化，这个加权函数对于人的视觉系统是最佳的。加权函数对于人的视觉系统是最佳的。(3)使用使用Huffman可变字长编码器对量化系可变字长编码器对量化系数进行编码数进行编码

16、多媒体数据压缩编码的国际标准第二十七页，本课件共有44页多媒体数据压缩编码的国际标准第二十八页，本课件共有44页多媒体数据压缩编码的国际标准JPEG压缩编码算法的主要计算步骤压缩编码算法的主要计算步骤(1)8*8分块分块(2)正向离散余弦变换正向离散余弦变换(FDCT)(3)量化量化(quantization)(4)Z字形编码字形编码(zigzag scan)(5)使用差分脉冲编码调制使用差分脉冲编码调制DPCM对直流系数对直流系数 DC(direct current)进行编码进行编码(6)使用行程长度编码使用行程长度编码RLE对交流系数对交流系数AC (alternating curr

17、ent)进行编码进行编码(7)熵编码熵编码(Huffman/算术算术)第二十九页，本课件共有44页多媒体数据压缩编码的国际标准1.FDCT 对每个单独的彩色图像分量，把整个分对每个单独的彩色图像分量，把整个分量图像分成若干量图像分成若干88的图像块，并作为两维的图像块，并作为两维离散余弦变换的输入。通过离散余弦变换的输入。通过DCT变换，把能变换，把能量集中在少数几个系数上。量集中在少数几个系数上。第三十页，本课件共有44页2.量化量化l量化指对经过量化指对经过FDCT变换后的频率系数进行变换后的频率系数进行量化量化l量化的目的是减小非量化的目的是减小非“0”系数的幅度以及系数的幅度以及增加

18、增加“0”值系数的数目值系数的数目l量化是图像质量下降的最主要原因量化是图像质量下降的最主要原因l对于有损压缩算法，对于有损压缩算法，JPEG算法使用线性算法使用线性(均均匀匀)量化器进行量化量化器进行量化l量化步距是按照系数所在的位置和每种颜色量化步距是按照系数所在的位置和每种颜色分量的色调值来确定分量的色调值来确定多媒体数据压缩编码的国际标准第三十一页，本课件共有44页3.Z字形编排字形编排量化后的系数要重新编排，目的是为了增量化后的系数要重新编排，目的是为了增加连续的加连续的“0”系数的个数，就是系数的个数，就是“0”的游程的游程长度，方法是按照长度，方法是按照Z字形的式样编排。字形

19、的式样编排。多媒体数据压缩编码的国际标准第三十二页，本课件共有44页4.直流系数的编码直流系数的编码l88图像块经过图像块经过DCT变换之后得到的变换之后得到的DC直流直流系数有个特点，一是系数的数值比较大，二系数有个特点，一是系数的数值比较大，二是相邻是相邻88图像块的图像块的DC系数值变化不大系数值变化不大l根据这些特点，根据这些特点，JPEG算法使用了差分脉冲算法使用了差分脉冲编码调制编码调制(DPCM)技术，对相邻图像块之间的技术，对相邻图像块之间的DC系数的差值系数的差值(Delta)进行编码：进行编码：多媒体数据压缩编码的国际标准第三十三页，本课件共有44页5.交流系数的编码交流系

20、数的编码l量化量化AC系数的特点是系数的特点是163矢量中包含有许矢量中包含有许多多“0”系数，并且许多系数，并且许多“0”是连续的，因是连续的，因此使用非常简单和直观的游程长度编码此使用非常简单和直观的游程长度编码(RLE)对它们进行编码对它们进行编码lJPEG使用了使用了1个字节的高个字节的高4位来表示连续位来表示连续“0”的个数，而使用它的低的个数，而使用它的低4位来表示编码位来表示编码下一个非下一个非“0”系数所需要的位数，跟在它系数所需要的位数，跟在它后面的是非后面的是非0量化量化AC系数的数值系数的数值多媒体数据压缩编码的国际标准第三十四页，本课件共有44页6.熵编码熵编码lJP

21、EG对对DPCM编码后的直流编码后的直流DC系数和系数和RLE编码后的交流编码后的交流AC系数使用熵编码作进一步系数使用熵编码作进一步的压缩的压缩l在在JPEG有损压缩算法中，使用有损压缩算法中，使用Huffman编编码器来减少熵。使用码器来减少熵。使用Huffman编码器的理由编码器的理由是可以使用很简单的查表是可以使用很简单的查表(lookup table)方法方法进行编码进行编码l压缩数据符号时，压缩数据符号时，Huffman编码器对出现频编码器对出现频度比较高的符号分配比较短的代码，而对出度比较高的符号分配比较短的代码，而对出现频度较低的符号分配比较长的代码。这种现频度较低的符号分配比

22、较长的代码。这种可变长度的可变长度的Huffman码表可以事先进行定义码表可以事先进行定义多媒体数据压缩编码的国际标准第三十五页，本课件共有44页7.组成位数据流组成位数据流lJPEG编码的最后一个步骤是把各种标记代编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据，码和编码后的图像数据组成一帧一帧的数据，这样做的目的是为了便于传输、存储和译码这样做的目的是为了便于传输、存储和译码器进行译码器进行译码l这样组织的数据通常称为这样组织的数据通常称为JPEG位数据流位数据流(JPEGbitstream)多媒体数据压缩编码的国际标准第三十六页，本课件共有44页MPEG编码的国际

23、标准编码的国际标准视频编码的国际标准，包括计算机与网络领域的视频编码的国际标准，包括计算机与网络领域的MPEG系系列与电子与通信领域的列与电子与通信领域的H系列系列MPEG系列标准系列标准:1988年由年由ISO 和和IEC 联合成立了联合成立了MPEG(MovingPicture Expert Group运动图像专家运动图像专家组组)，负责开发视频数据和声音数据的编码、解码和，负责开发视频数据和声音数据的编码、解码和它们的同步等标准。这个专家组开发的标准称为它们的同步等标准。这个专家组开发的标准称为MPEG标准。到目前为止，已经公布的标准。到目前为止，已经公布的MPEG标准标准有有MPEG-

24、1/2/4/7/21/B，其中的，其中的MPEG-1、MPEG-2和和MPEG-4标准已经得到广泛应用。标准已经得到广泛应用。H.26x系列标准系列标准:ITU-T及其前身及其前身CCIR制定了一系列音制定了一系列音视频压缩编码和通信技术标准。其中的视频压缩编码和通信技术标准。其中的ITU-T H.26x是是与与MPEG类似的视频编码系列标准类似的视频编码系列标准.多媒体数据压缩编码的国际标准第三十七页，本课件共有44页视频编码标准视频编码标准多媒体数据压缩编码的国际标准第三十八页，本课件共有44页多媒体数据压缩编码的国际标准第三十九页，本课件共有44页MPEG-1标准lMPEG-1处理的

25、是标准图像交换格式(Standard Interchange format，SIF)或者称为源输入格式(Source Input Format，SIF)的电视，即NTSC制为352像素x 240行/帧x 30帧/秒，PAL制为352像素x 288行/帧x25帧/秒，压缩的输出速率定义在1.5 Mbit/s以下。这个标准主要是针对当时具有这种数据传输率的CD-ROM和网络而开发的，用于在CD-ROM上存储数字影视和在网络上传输数字影视。lMPEG-1用于数据速率高达约1.5Mbit/s的数字存储媒体的视频和伴音编码(ISO/IEC 11172:1993 Information technolog

26、y-Coding ofmoving pictures and associated audio for digital storage mediaat up to about 1.5 Mbit/s)，1992年11月成为标准功能：低分辨率数字视频编码标准编码：DCT+视觉加权量化+熵编码+运动补偿+帧间预测格式CIF：25或30帧/秒、288行360列或240行352列、8位量化音频：IIII层，声道双-单声道、立体声、联合立体声应用：VCD、MP3 多媒体数据压缩编码的国际标准第四十页，本课件共有44页MPEG-2标准lMPEG-2 运动图像和伴音信息的通用编码(

27、ISO/IEC13818:1996 Information technology Generic codingof moving pictures and associated audio information)，1994年11月成为标准功能：高分辨率数字视频编码标准编码：似MPEG-1格式：低35228829.79、主720480 或57629.79或25、高-144014401080 或115230或25、高19201080或115230或25音频：AAC兼容MPEG-1，另支持5.1/7.1声道（AC-3/DTS）应用：DVD、HDTV 多媒体数据压缩编码的国际标准第四十一页，本课件共

28、有44页MPEG-4标准lMPEG-4 视听对象编码（ISO/IEC DIS 14496-1:1999 Information technology-Coding of audio-visual objects），1999年1月成为标准功能：分辨率可变的视听对象编码标准编码：视音频对象、分块/分级/分层、基于内容和对象的编码格式：支持各种不同的分辨率音频：支持多种码率264kb/s应用：可视电话、电视会议、网络流媒体、移动视频通信、IPTV 多媒体数据压缩编码的国际标准第四十二页，本课件共有44页MPEG-7标准lMPEG-7 多媒体内容描述接口（ISO/IEC 15

29、938-1:2002 Information technology-Multimedia content description interface），1996年启动，2001年9月成为标准目的是制定一套描述符标准，用来描述各种类型的多媒体信息及它们之间的关系，以便更快更有效地检索信息。这些媒体材料可包括静态图像、图形、3D模型、声音、话音、电视以及在多媒体演示中它们之间的组合关系。在某些情况下，数据类型还可包括面部特性和个人特性的表达。功能：多媒体内容描述标准应用：基于内容的多媒体信息检索多媒体数据压缩编码的国际标准第四十三页，本课件共有44页MPEG-21标准lMPEG-21 多媒

30、体框架（ISO/IEC TR 21000-1:2001 Information technology-Multimedia framework(MPEG-21)），2001年12月成为标准l数字图书馆(Digital library)，例如图像目录、音乐词典等；多媒体目录服务(multimedia directory services)，例如黄页(yellow pages)；广播媒体的选择，例如无线电频道，TV频道等；多媒体编辑，例如个人电子新闻服务，多媒体创作等等。潜在应用的应用领域包括：教育、娱乐、新闻、旅游、医疗、购物等等。功能：多媒体框架标准应用：不同多媒体系统的集成和应用多媒体数据压缩编码的国际标准第四十四页，本课件共有44页

展开阅读全文

第四章 多媒体数据压缩编码技术优秀PPT.ppt

第四章多媒体数据压缩编码技术优秀PPT.ppt