第2章 多媒体数据压缩编码技术精选文档.ppt

上传人:石*** 文档编号:87541731 上传时间:2023-04-16 格式:PPT 页数:53 大小:2.53MB
返回 下载 相关 举报
第2章 多媒体数据压缩编码技术精选文档.ppt_第1页
第1页 / 共53页
第2章 多媒体数据压缩编码技术精选文档.ppt_第2页
第2页 / 共53页
点击查看更多>>
资源描述

《第2章 多媒体数据压缩编码技术精选文档.ppt》由会员分享,可在线阅读,更多相关《第2章 多媒体数据压缩编码技术精选文档.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第2章多媒体数据压缩编码技术本讲稿第一页,共五十三页2.1多媒体数据 数据压缩是通过减少计算机中所存储数据或者通信传播中数据的冗余度,达到增大数据密度,最终使数据的存储空间减少的技术。压缩编码的重要性和分类压缩编码的重要性和分类本讲稿第二页,共五十三页2.1.1数据压缩编码的必要性 多媒体数据,其惊人的数据量为媒体的存储、传输及处理带来了巨大的压力。为解决这一问题,单纯用扩大存储容量、增加传输线路带宽的办法是不现实的。因此,在多媒体的应用系统中,一定要对声音、图像等多媒体信号进行压缩。本讲稿第三页,共五十三页2.1.2 数据压缩的可能性 多媒体数据表示中存在着大量的冗余,以图像数据压缩为例,图

2、像信息冗余通常有以下几种情况:(1)空 间 冗 余。在 很 多 图 像 数 据 中,像 素 间 在行、列方向上都有很大的相关性,相邻像素的值比较接近,或者完全相同,这种数据冗余叫做空间冗余。(2)时 间 冗 余。在 视 频 图 像 序 列 中,相 邻 两 帧图像数据有许多共同的地方,这种共同性称为时间冗余,可采用运动补偿算法来去掉冗余信息.本讲稿第四页,共五十三页2.1.2 数据压缩的可能性 (3)视觉冗余。视觉冗余度是相对于人眼的视觉特性而言的,人类视觉系统对图像的敏感性是非均匀和非线性的,并不是图像中的所有变化人眼都能观察到。(4)信息熵冗余。信息熵是指一组数据所携带的信息量,信息熵冗余指

3、数据所携带的信息量少于数据本身而反映出来的数据冗余。(5)结构冗余。在有些图像的纹理区,图像的像素值存在着明显的分布模式。(6)知识冗余。有许多图像的理解与某些先验知识有相当大的相关性。这类规律性的结构可由先验知识和背景知识得到,称此类冗余为知识冗余。本讲稿第五页,共五十三页2.1.3 数据压缩方法的分类图图2-1 2-1 常用压缩编码方法的分类常用压缩编码方法的分类本讲稿第六页,共五十三页2.2 多媒体数据压缩编码基础 数据压缩是通过消除输入数据序列(原始数据序列)中的冗余性,将它变换成较短的输出数据序列(压缩数据序列)的技术。如果将压缩数据序列与原始数据序列长度之比定义为压缩比,尽量减小数

4、据压缩的压缩比则是进行数据压缩的根本目的。本讲稿第七页,共五十三页2.2.1 量化 量化操作实质上是将连续的模拟信号采样得到的瞬时幅度值映射成离散的数字信号,即用一组规定的电平,把瞬时抽样值用最接近的电平值来表示。本讲稿第八页,共五十三页2.2.1 量化 1.量化位数量化位数 量化位数是每个采样点能够表示的数据范围,常用的有8位、12位和16位。量化过程是,先将整个幅值划分为有限个小幅度(量化阶距)的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值,如图2-2所示,其中虚线箭头表示采样值量化后的电平值。本讲稿第九页,共五十三页2.2.1 量化图图2-2 模拟信号的采样和量化模拟信号的采

5、样和量化本讲稿第十页,共五十三页2.2.1 量化2.均匀量化均匀量化 采用相等的量化间隔对采样得到的信号做量化就是均匀量化,也称为线性量化。量化后的样本值Y和实际值X的差E=Y-X称为量化误差或量化噪声。本讲稿第十一页,共五十三页2.2.1 量化3.非均匀量化非均匀量化 非均匀量化的基本思想是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这样就可以在满足精度要求的情况下用较少的位数来表示。声音数据还原时,采用相同的规则。本讲稿第十二页,共五十三页2.2.2莫尔斯码 莫尔斯码即电报码,它采用“”和“-”来表示26个英文字母。采用常出现的字母用短码表示(如E用

6、“”表示,T用“-”表示),不常出现的字母用长码表示(如Q用“-”表示,X用“-”表示)的变长编码方式以减少码率。本讲稿第十三页,共五十三页2.2.3哈夫曼编码 该算法基于一种称为编码树的技术,其步骤如下:(1)将待编码的N个信源符号按照出现的概率由大到小排列,给排在最后的两个符号各分配一位二进制码元,对其中概率大的符号分配0,概率小的符号分配1(反之亦可)。(2)把概率最小的两个符号概率相加,求出的和作为一个新符号的概率,将新的概率值与剩下的N-2个概率值一起重新进行排序,再重复步骤(1)的编码过程。(3)重复步骤(2)直到只剩一个概率值为止,其值为1。(4)分配码字,对于各种信源符号,基于

7、步骤(1)分配的数字,从编码树的根部开始回溯读出,并将它作为该符号对应分配的码字。本讲稿第十四页,共五十三页2.2.3哈夫曼编码 例设有离散无记忆信源,符号a1、a2、a3、a4、a5、a6的出现概率分别为0.12、0.08、0.4、0.1、0.25、0.05,其哈夫曼编码过程如下:本讲稿第十五页,共五十三页2.2.3哈夫曼编码平均码长为:平均码长为:信源熵为:信源熵为:编码效率为:编码效率为:本讲稿第十六页,共五十三页2.2.3哈夫曼编码 采用哈夫曼编码时有两个问题值得注意:采用哈夫曼编码时有两个问题值得注意:(1)哈夫曼编码没有错误保护功能。在译码时,如果某些位出现错误,会引起一连串的错误

8、,造成错误传播(ErrorPropagation)。计算机对这种错误也无能为力,说不出错在哪里,更谈不上去纠正它。(2)哈夫曼编码是可变长度码,因此很难随意查找或调用压缩文件中的内容,然后再译 码,这就需要在存储代码之前加以考虑。尽管如此,哈夫曼编码还是得到了广泛的 应用。本讲稿第十七页,共五十三页2.2.4行程长度编码 行程长度编码(Run-LengthEncoding,RLE)也称游程编码,是一种非常简单的数据压缩编码形式。它基于简单的编码数据原则,即重复的数据值序列(或称为流)用一个重复次数和单个数据值来代替。这里,重复的次数称为“游程”。控制符重复次数被重复字符图图2-3 32-3 3

9、字节码字格式字节码字格式本讲稿第十八页,共五十三页2.2.5预测编码1.差值脉冲编码调制(差值脉冲编码调制(DPCM)设二维图像上空间坐标为(i,j)的像素的实际样本值为f(i,j),f(i,j)是根据已传输的相邻像素的样本值对该像素估算得到的预测值。实际值和预测值之间的差值即预测误差,用下式来表示:e(i,j)=f(i,j)-f(i,j)由于图像像素之间有极强的相关性,所以这个预测误差是很小的。编码时,是对预测误差e(i,j)进行量化、编码、发送,由此而得名为差值脉冲编码调制法(DPCM)。本讲稿第十九页,共五十三页2.2.5预测编码图图2-4 DPCM编、解码原理图编、解码原理图本讲稿第二

10、十页,共五十三页2.2.5预测编码2.自适应差值脉冲编码调制(自适应差值脉冲编码调制(ADPCM)其基本思想是:利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值;使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。其简化的编码框图如图2-5所示。本讲稿第二十一页,共五十三页2.2.5预测编码图图2-5 ADPCM简化的编码框图简化的编码框图本讲稿第二十二页,共五十三页2.2.5预测编码3.帧间预测编码帧间预测编码 采用预测编码方法消除序列图像在时间上的相关性,传送前后两帧的对应像素之间的差值,这

11、称为帧间预测。图图2-6 具有运动补偿的帧间预测具有运动补偿的帧间预测本讲稿第二十三页,共五十三页2.2.6矢量量化 在矢量量化编码中,是把输入数据几个一组地分成许多组,成组地量化编码,即将这些数看成一个k维矢量,然后以矢量为单位逐个矢量进行量化。矢量量化一般是限失真编码。输入矢量X是一个待编码的k维矢量,该矢量原则上既可以是原始图像,也可以是图像的预测误差或变换矩阵系数的分块(或称分组)。码本C是一个具有N个k维矢量的集合,C=Yi,i=1,2,N,本讲稿第二十四页,共五十三页2.2.6矢量量化 矢量编码的过程就是在码本C中搜索一个与输入矢量最接近的码字Yi的过程。在码本中寻找到与输入矢量完

12、全一致的码字的概率很小,但只要二者之间误差最小时,便可用该码字Yi代表输入矢量。传输时并不传送码字Yi本身,只传送其下标“i”。当码本长度为N,为传送下标所需要的比特数为log2N。传送一个像素所需要的平均比特数为log2N。本讲稿第二十五页,共五十三页2.2.6矢量量化图图2-7 矢量量化编码解码框图矢量量化编码解码框图本讲稿第二十六页,共五十三页2.2.7变换编码 变换编码也是去除冗余的一种最基本的编码方法。不同的是变换编码首先要把压缩的数据变换到某个变换域中(如频域),然后再进行编码。变化域中表现为能量集中在某个区域,可以利用这一特点在不同区域间有效地分配量化比特数,或者去掉那些能量很小

13、的区域,从而达到数据压缩的目的。例如声音信号,从时域变换到频域以后,可以清楚的看到能量集中在哪些频率范围内,从而根据频率范围分布有效地分配不同的量化位数。本讲稿第二十七页,共五十三页2.3静态图像压缩标准JPEG JPEG(JointPhotographicExpertsGroup)是联合图像专家小组的英文缩写,这个专家组是由国际电报电话咨询委员会(CCITI)和国际标准化协会(ISO)于1986年联合组成负责制定静态的数字图像数据压缩编码方法,这个专家组开发的算法称为JPEG算法,并 于1991年 正 式 成 为 国 际 标 准,编 号 为ISO/IEC10918,现常称为JPEG标准。JP

14、EG是一个使用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。本讲稿第二十八页,共五十三页2.3.1JPEG压缩算法简介JPEG的目的是为了给出一个连续色调图像的压缩方法使之满足以下要求:(1)压缩比可控:能覆盖一个较宽的图像质量等级范围,能达到“很好”到“极好”的评估,与原始图像相比,人的视觉难以区分。(2)不受限制:适用于所有的连续色调图像,不应对图像的尺寸、彩色空间和像素纵横比等特性进行限制,也不应对图像的场景内容(如复杂性、彩色范围或统计特性)有任何限制。(3)适中的计算复杂性:压缩算法既可用软件实现,也可用硬件实现,并具有较好的性能。(4)具有顺序编码、累进编码、无

15、失真编码和层次编码4种操作模式。本讲稿第二十九页,共五十三页2.3.2JPEG压缩基本处理算法1.分块采样分块采样 JPEG压缩首先要对连续彩色图像的每一帧中的亮度信号(Y)和色差(CR、CB)信号进行单独采样。采样时,首先将图像分割成许多1616个采样点构成的宏区块,将宏区块再分成4部分,每一部分为88个采样点组成的像块,像块是基于DCT压缩编码处理的最小单位,DCT变换就是以像块为单位的。本讲稿第三十页,共五十三页2.3.2JPEG压缩基本处理算法本讲稿第三十一页,共五十三页2.3.2JPEG压缩基本处理算法2.DCT变换变换 DCT是英文DiscreteCosineTransform的缩

16、写,意思是离散余弦变换。它是一种傅立叶变换,任何连续的实对称函数采用傅立叶变换后,只含余弦项。在空间域中的样值矩阵,经DCT变换后,成了频率域中88DCT系数矩阵。频域中的右下角对应高频部分,而在左上角对应低频部分,其中左上角(0,0)位置的系数反映图像子块的平均样本值,对应直流分量,称为DC系数。其其他他63个个对对应应交交流流分分量量的的系系数,称为数,称为AC系数。系数。本讲稿第三十二页,共五十三页2.3.2JPEG压缩基本处理算法DCT变换公式为:变换公式为:正变换:正变换:逆变换:逆变换:其中:其中:DC系数:系数:本讲稿第三十三页,共五十三页2.3.2JPEG压缩基本处理算法3.D

17、CT系数量化系数量化 经过DCT变换后,DCT系数间的相关性已经显现出来,即左上角的系数值大,而右下角的系数值小,为数据压缩创造了必要条件。但这种相关性还不是十分明显,要最终实现数据压缩,还需要进一步降低非零系数的幅值,增加零值系数的数量,从而进一步提高F矩阵的相关性。为此还要对变换后的DCT系数进行量化,来减少表示每个DCT系数所使用的位数,另外可以增加零值系数,提高压缩比。本讲稿第三十四页,共五十三页2.3.2JPEG压缩基本处理算法表表2-1 亮度量化表亮度量化表 表表2-2 色度量化表色度量化表 本讲稿第三十五页,共五十三页2.3.2JPEG压缩基本处理算法 对DCT系数的量化是基于限

18、失真编码理论进行的,量化是造成图像质量下降的最主要的原因。其作用是在一定的主观保真度图像质量的前提下,丢掉那些对视觉效果影响不大的信息,失真度在人的视觉所能接受的容限之内。本讲稿第三十六页,共五十三页2.3.2JPEG压缩基本处理算法4.DC系数差值编码和系数差值编码和AC系数的行程编码系数的行程编码 量化后的64个DCT系数仍然是二维系数矩阵,坐标(0,0)处的系数是直流分量,相邻两个88像块之间的DC系数有强相关性,JPEG中对DC系数采用DPCM编码,即对相邻块之间的DC系数差值DIFF=DCi-DCi-1进行编码。其余63个交流系数采用行程编码,使用Z字形扫描方式可以增加连续零系数的个

19、数,也就是增加零值的游程长度。图2-9为Z字形扫描轨迹图。从左上方AC01开始,沿对角线方向,直到AC77扫描结束。63个AC系数行程编码的码字,可用2个字节来表示,如图2-10所示。本讲稿第三十七页,共五十三页2.3.2JPEG压缩基本处理算法图图2-9 Z字形扫描字形扫描本讲稿第三十八页,共五十三页2.3.2JPEG压缩基本处理算法图图2-10 AC系数行程编码的码字系数行程编码的码字 本讲稿第三十九页,共五十三页2.3.2JPEG压缩基本处理算法 5.熵编码熵编码 为了进一步压缩数据,对DPCM编码后的直流系数DC和RLE编码后的交流系数AC采用熵编码。在JPEG有损压缩算法中,使用哈夫

20、曼编码器的理由是可以使用很简单的查表方法进行编码。压缩数据符号时,哈夫曼编码器对出现频率比较高的符号分配比较短的代码,而对出现频率低的符号分配比较长的代码。这种可变长度的哈夫曼编码表可以事先进行定义。为了实现正确解码,发送端和接收端必须采用相同的哈夫曼编码表。本讲稿第四十页,共五十三页2.4运动图像压缩标准MPEG MPEG(MovingPictureExpertGroup,活动图像 专 家 组)是 在1988年 由 ISO(InternationalOrganizationforStandardization,国际标准化组织)和IEC(InternationalElectrotechnica

21、lCommission,国际电工委员会)联合成立的专家组,其任务是负责制订适用于数字存储媒介、电视广播和通信等应用场合的视频和音频数据的压缩编码标准。这个专家组开发的标准称为MPEG标准。本讲稿第四十一页,共五十三页2.4.1运动图图像压缩编码的基本方法 MPEG运动图像压缩编码算法基于运动补偿和DCT算法。其基本思想和方法可以归纳为两点:在空间方向上,图像数据压缩采用JPEG压缩算法来去掉冗余信息。在时间方向上,图像数据压缩采用运动补偿算法来去掉冗余信息。本讲稿第四十二页,共五十三页2.4.1运动图图像压缩编码的基本方法 为了保证图像质量基本不降低而又能够获得高的压缩比,在MPEG中将图像分

22、为3种类型:帧内图像I(IntraPicture)、预测图像P(PredictedPicture)和双向预测图像B(BidirectionalPicture)。本讲稿第四十三页,共五十三页2.4.1运动图图像压缩编码的基本方法 帧内图像I不参考任何过去的或者是将来的其他图像帧,压缩编码采用类似JPEG压缩算法。I帧图像的压缩比相对较低。I帧图像提供了随机存取的插入点,另外I帧图像可作为B帧和P帧图像的预测参考帧。I帧图像是周期性出现在视频序列中的,出现频率可由编码器选择。本讲稿第四十四页,共五十三页2.4.1运动图图像压缩编码的基本方法 预测图像P利用相邻帧的一般统计信息进行预测。也就是说,它

23、考虑运动特性,提供帧间编码。P帧预测当前帧与前面最近的I帧或P帧的差别,在预测中使用了运动补偿算法,所以P帧图像的压缩比相对较高。本讲稿第四十五页,共五十三页2.4.1运动图图像压缩编码的基本方法 图像B是双向预测内插帧,它既用已传输的在视频序列中处于该帧前的I帧或P帧作预测参考帧,进行前向运动补偿预测;又用后面的P帧作预测参考帧,进行后向运动补偿预测。但B帧不能用来作为对其他帧进行运动补偿预测的参考帧。本讲稿第四十六页,共五十三页2.4.1运动图图像压缩编码的基本方法一个典型的MPEG图像排列如图2-11所示。图图2-11 典型的典型的MPEG图像帧排列图像帧排列本讲稿第四十七页,共五十三页

24、2.4.2MPEG系列标准1.MPEG-1标准标准MPEG-1的标准名称为“信息技术用于数据速率高达大约1.5Mbit/s的数字存储媒体的电视图像和伴音编码”,由如下五个部分组成:(1)MPEG-1系统(2)MPEG-1视频(3)MPEG-1声音(4)MPEG-1一致性测试(5)MPEG-1软件模拟本讲稿第四十八页,共五十三页2.4.2MPEG系列标准2.MPEG-2数字电视标准数字电视标准 MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,标准的正式规范在ISO/IEC13818中,标准名称为“信息技术电视图像和伴音信息的通用编码”。MPEG-2不是M

25、PEG-1的简单升级,MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善,克服并解决了MPEG-1不能满足日益增长的多媒体技术、数字电视技术对分辨率和传输率等方面的技术要求缺陷。本讲稿第四十九页,共五十三页2.4.2MPEG系列标准 与MPEG-1、MPEG-2相比,MPEG-4具有如下独特的优点:(1)基于内容的交互性(2)高效的压缩性(3)通用的访问性MPEG-4的主要应用领域有:因特网多媒体应用、广播电视、交互式视频游戏、实时可视通信、交互式存储媒体应用、演播室技术及电视后期制作、远程视频监控、通过ATM网络等进行的远程数据库业务等。本讲稿第五十页,共五十三页2.4.2MPEG

26、系列标准4.MPEG-7多媒体内容描述接口标准多媒体内容描述接口标准 MPEG-7的工作于1996年启动,名称叫做多媒 体 内 容 描 述 接 口(MultimediaContentDescriptionInterface),目的是制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便实现快速有效地检索信息。这些媒体材料可包括静态图像、图形、3D模型、声音、话音、电视以及在多媒体演示中它们之间的组合关系。在某些情况下,数据类型还可包括面部特性和个人特性的表达。本讲稿第五十一页,共五十三页2.4.2MPEG系列标准5.MPEG-21多媒体框架标准多媒体框架标准 制定MPEG-21标准的目的是建立一个规范且开放的多媒体传输平台,让所有的多媒体播放装置都能透过此平台接收多媒体资料,使用者可以利用各种装置、透过各种网络环境去获得多媒体内容,而无须知道多媒体资料的压缩方式及使用的网络环境。同样地,多媒体内容提供者或服务业者也不会受限于使用者的装置及网络环境,针对多种不同压缩方法来提供多媒体内容。本讲稿第五十二页,共五十三页谢谢本讲稿第五十三页,共五十三页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁