《多媒体技术基础与应用(第3版).ppt》由会员分享,可在线阅读,更多相关《多媒体技术基础与应用(第3版).ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多媒体技术基础与应用第九章 数据压缩编码技术与JPEG标准9.1 9.1 数据压缩编码技术概述数据压缩编码技术概述 9.2 9.2 预测编码预测编码9.3 9.3 变换编码变换编码9.4 9.4 统计编码统计编码 9.5 9.5 其他编码其他编码9.6 9.6 静态图像压缩标准静态图像压缩标准JPEG JPEG 多媒体技术基础与应用9.1 数据压缩编码技术概述 9.1.1 9.1.1 信息为什么能压缩信息为什么能压缩从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息确定的信息,去除确定的信息(可推知的可推知的)
2、,也就是用一种更接,也就是用一种更接近信息本质的描述来代替原有冗余的描述。近信息本质的描述来代替原有冗余的描述。图9-1 连续的几帧画面存在着相似性 多媒体技术基础与应用9.1.2 9.1.2 有损压缩与无损压缩有损压缩与无损压缩多媒体数据压缩可分为有损压缩和无损压缩两类。多媒体数据压缩可分为有损压缩和无损压缩两类。无损压缩算法是为保留原始多媒体对象(包括图像、语音和视无损压缩算法是为保留原始多媒体对象(包括图像、语音和视频)而设计的。在无损压缩中,数据在压缩或解压缩过程中不频)而设计的。在无损压缩中,数据在压缩或解压缩过程中不会改变或损失,解压缩产生的数据是对原始对象的完整复制。会改变或损失
3、,解压缩产生的数据是对原始对象的完整复制。当图像的冗余度很少(即同类像素重复性很小)时,用无损压当图像的冗余度很少(即同类像素重复性很小)时,用无损压缩技术不能得到可接受的结果,这时就要采用有损压缩。有损缩技术不能得到可接受的结果,这时就要采用有损压缩。有损压缩会造成一些信息的损失,关键问题是看这种损失对图像质压缩会造成一些信息的损失,关键问题是看这种损失对图像质量带来的影响。只要这种损失被限制在允许的范围内,有损压量带来的影响。只要这种损失被限制在允许的范围内,有损压缩就是可接受的。缩就是可接受的。有损压缩技术主要的应用领域是在影像节目、可视电话会议和有损压缩技术主要的应用领域是在影像节目、
4、可视电话会议和多媒体网络这样的由音频、彩色图像和视频组成的多媒体应用多媒体网络这样的由音频、彩色图像和视频组成的多媒体应用中,并且得到了广泛的应用中,并且得到了广泛的应用 多媒体技术基础与应用9.1.3 9.1.3 对称压缩和不对称压缩对称压缩和不对称压缩 压缩技术的基本方式有两种:即对称压缩和不对称压缩。压缩技术的基本方式有两种:即对称压缩和不对称压缩。在对称压缩中,压缩的算法和解压缩的算法是一样的。它是一在对称压缩中,压缩的算法和解压缩的算法是一样的。它是一种可逆操作。对称压缩的优点在于双方都以同一种速度进行操种可逆操作。对称压缩的优点在于双方都以同一种速度进行操作。作。另一种压缩技术是不
5、对称压缩,是指压缩和解压缩的运算速率另一种压缩技术是不对称压缩,是指压缩和解压缩的运算速率是互不相同的。是互不相同的。多媒体技术基础与应用9.1.4 9.1.4 信息编码技术的发展信息编码技术的发展 1.1.经典编码技术经典编码技术2.“2.“第二代第二代”编码方法编码方法 9.1.5 9.1.5 图像编码技术的标准化图像编码技术的标准化 如果没有一个共同的标准做基础,不同系统间不能兼容,除非如果没有一个共同的标准做基础,不同系统间不能兼容,除非每一编码方法的各个细节完全相同,否则各系统间的联接十分每一编码方法的各个细节完全相同,否则各系统间的联接十分困难。困难。多媒体技术基础与应用图9-2
6、数据压缩编码方法的分类多媒体技术基础与应用9.2 预测编码9.2.1 9.2.1 预测编码的基本概念预测编码的基本概念预测编码是数据压缩理论的一个重要分支,它是根据离散信号预测编码是数据压缩理论的一个重要分支,它是根据离散信号之间存在着一定的相关性,利用前面的一个或多个信号对下一之间存在着一定的相关性,利用前面的一个或多个信号对下一信号进行预测,然后对实际值和预测值的差值进行编码。就图信号进行预测,然后对实际值和预测值的差值进行编码。就图像压缩而言,预测编码可分为帧内预测和帧间预测两种类型。像压缩而言,预测编码可分为帧内预测和帧间预测两种类型。9.2.2 9.2.2 差分脉冲编码差分脉冲编码-
7、DPCM-DPCMDPCMDPCM(Differential Pulse Code ModulationDifferential Pulse Code Modulation,差分脉冲编码,差分脉冲编码调制)与调制)与PCMPCM不同,它编码的不是采样样本值,而是样本值不同,它编码的不是采样样本值,而是样本值及其预测值的差分,即量化的是已知的样本值与预测值之间的及其预测值的差分,即量化的是已知的样本值与预测值之间的差值。差值。多媒体技术基础与应用图9-3 DPCM工作原理方框图多媒体技术基础与应用9.2.3 9.2.3 自适应差分脉冲编码自适应差分脉冲编码-ADPCM-ADPCMADPCMADP
8、CM是自适应量化和自适应预测方法的总称。是自适应量化和自适应预测方法的总称。图9-4 ADPCM编码框图 多媒体技术基础与应用9.3 变换编码9.3.1 9.3.1 变换编码的基本方法变换编码的基本方法变换编码先对信号进行某种函数变换,从信号的一种表示空间变换编码先对信号进行某种函数变换,从信号的一种表示空间变换到信号的另一种表示空间,然后在变换后的域上,对变换变换到信号的另一种表示空间,然后在变换后的域上,对变换后的信号进行编码后的信号进行编码 。图9-5 变换编码的工作过程 多媒体技术基础与应用9.3.2 9.3.2 离散余弦变换离散余弦变换离散余弦变换离散余弦变换DCT(DCT(Disc
9、rete Cosine TransformationDiscrete Cosine Transformation)具有快速具有快速算法,且易于实现等优点,它的快速算法已可由专用芯片来实算法,且易于实现等优点,它的快速算法已可由专用芯片来实现,因而被广泛采用。现,因而被广泛采用。图9-6 JPEG将源图像划分为若干个子块,每个子块包含88个像素 多媒体技术基础与应用图9-7 一个88个像素的子块的DCT变换 多媒体技术基础与应用公式9-1的物理意义是:这个变换的基本运算是将信号从一种表达形式(空间域,即图像的像素值)变成另一种等同的表达形式(频率域,即频率系数),并且这种变换过程是可逆的。如果离
10、散余弦变换是不可逆运算(即从DCT系数中恢复原始像素信息),那么这种变换是毫无意义的。事实上,有一个逆离散余弦变换(IDCT)公式能够将频率域的数据重新转换为像素值,如公式(9-2)。多媒体技术基础与应用9.3.3 9.3.3 小波变换小波变换小波变换是时间小波变换是时间(空间空间)频率的局部化分析,它通过伸缩平移运频率的局部化分析,它通过伸缩平移运算对信号算对信号(函数函数)逐步进行多尺度细化,最终达到高频处时间细逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节,解决了傅
11、立叶变换的困难问题,成可聚焦到信号的任意细节,解决了傅立叶变换的困难问题,成为继傅立叶变换以来在科学方法上的重大突破。为继傅立叶变换以来在科学方法上的重大突破。图9-8 小波压缩效果示例(压缩比:50:1)多媒体技术基础与应用9.4 统计编码9.4.1 9.4.1 统计编码的基本概念统计编码的基本概念统计编码又称熵编码,就是利用信源的统计,减少信源所具有统计编码又称熵编码,就是利用信源的统计,减少信源所具有的冗余度而缩短了码长的编码称为熵编码。的冗余度而缩短了码长的编码称为熵编码。统计编码又可分为定长码和变长码。统计编码又可分为定长码和变长码。常用的统计编码有霍夫曼(常用的统计编码有霍夫曼(H
12、uffmanHuffman)编码、算术编码和行程)编码、算术编码和行程编码三种。编码三种。多媒体技术基础与应用9.4.2 9.4.2 霍夫曼霍夫曼(Huffman)(Huffman)编码编码霍夫曼压缩算法的编码思想如下:霍夫曼压缩算法的编码思想如下:1.1.信源符号按概率递减顺序排列;信源符号按概率递减顺序排列;2.2.把两个最小的概率加起来,作为新符号的概率;把两个最小的概率加起来,作为新符号的概率;3.3.重复步骤重复步骤与与,直到概率和等于,直到概率和等于1 1为止;为止;4.4.完成上述步骤后,再沿路径返回进行编码。完成上述步骤后,再沿路径返回进行编码。图9-9 霍夫曼编码过程 多媒体
13、技术基础与应用9.4.4 9.4.4 行程编码行程编码不需要存储每一个像素的颜色值,而仅仅存储一个像素的颜色不需要存储每一个像素的颜色值,而仅仅存储一个像素的颜色值,以及具有相同颜色的像素数目即可,或者存储一个像素的值,以及具有相同颜色的像素数目即可,或者存储一个像素的颜色值,以及具有相同颜色值的行数。这种压缩编码称为行程颜色值,以及具有相同颜色值的行数。这种压缩编码称为行程长度编码,用长度编码,用RLE(Run Length Encoding)RLE(Run Length Encoding)表示,具有相同颜表示,具有相同颜色并且是连续的像素数目称为行程长度。色并且是连续的像素数目称为行程长度
14、。图9-10 由1610个像素组成的小图像多媒体技术基础与应用9.5 其他编码9.5.1 LZW9.5.1 LZW编码编码9.5.2 9.5.2 分形编码分形编码 图9-12 Koch雪花曲线生成过程 图9-13 用迭代函数产生的分形图形 多媒体技术基础与应用9.6 静态图像压缩标准JPEG9.6.1 JPEG9.6.1 JPEG概述概述JPEGJPEG算法是一种适用于连续色调、多级灰度、静止图像的数算法是一种适用于连续色调、多级灰度、静止图像的数字图像压缩编码方法。字图像压缩编码方法。JPEGJPEG是国际上彩色、灰度、静止图像是国际上彩色、灰度、静止图像的第一个国际标准,也是一个适用范围广
15、泛的通用标准。它不的第一个国际标准,也是一个适用范围广泛的通用标准。它不仅适用于静止图像的压缩,电视图像序列的帧内图像的压缩编仅适用于静止图像的压缩,电视图像序列的帧内图像的压缩编码,也常采用码,也常采用JPEGJPEG压缩方法。压缩方法。JPEGJPEG压缩分四个步骤实现:压缩分四个步骤实现:颜色模式转换及采样;DCT变换;量化;编码多媒体技术基础与应用图9-15 JPEG的编码与解码步骤 多媒体技术基础与应用9.6.2 9.6.2 颜色模式转换及采样颜色模式转换及采样RGBRGB色彩模型是我们最常用的表示颜色的方式。色彩模型是我们最常用的表示颜色的方式。JPEGJPEG采用的采用的是是YC
16、bCrYCbCr色彩系统。这里色彩系统。这里Y Y代表亮度,代表亮度,CbCb和和CrCr则代表色度、饱则代表色度、饱和度。和度。9.6.3 DCT9.6.3 DCT变换变换DCTDCT变换前后的空间域矩阵(变换前后的空间域矩阵(P P矩阵)和频率域矩阵(矩阵)和频率域矩阵(T T矩阵)矩阵)中数值的物理意义及其联系中数值的物理意义及其联系 图9-16 DCT变换是将源图像(图a)的空间域(图b)变换为频率域(图c)多媒体技术基础与应用9.6.3 9.6.3 量化量化1.1.量化过程量化过程 图9-17 经量化后,源图像(左)与IDCT运算后得到的图像(右)会产生一定的失真,失真程度视量化等级
17、而定多媒体技术基础与应用量化的计算公式:量化的计算公式:量化值量化值(i,j)(i,j)T(i,j)T(i,j)量化矩阵量化矩阵(i,j)(i,j)在解码过程中,逆量化公式为:在解码过程中,逆量化公式为:T(i,j)T(i,j)量化值量化值(i,j)(i,j)量化矩阵量化矩阵(i,j)(i,j)多媒体技术基础与应用2.JPEG2.JPEG推荐的量化表推荐的量化表 多媒体技术基础与应用9.6.5 9.6.5 编码编码1.1.直流系数(直流系数(DCDC)的编码)的编码 相邻的子块相邻的子块DCDC系数的差值可用公式系数的差值可用公式 表示为:表示为:2.2.交流系数(交流系数(ACAC)编码与)
18、编码与Z Z形扫描形扫描 图9-18 Z字型扫描过程多媒体技术基础与应用 3.3.熵编码熵编码源图像质量 文件容量38384 bytes 高质量压缩(High quality),文件容量11331 bytes 多媒体技术基础与应用中等质量(Medium quality),文件容量6968 bytes 低质量(Low quality),文件容量为3687 bytes的图像质量 图9-19 JPEG不同压缩率的图像质量对比(图片来源 NASA)多媒体技术基础与应用9.6.6 9.6.6 新一代静态图像压缩标准新一代静态图像压缩标准-JPEG2000-JPEG2000图9-20 对图像感兴趣区域进行压缩