《多媒体图像压缩技术精选PPT.ppt》由会员分享,可在线阅读,更多相关《多媒体图像压缩技术精选PPT.ppt(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多媒体图像压缩技术第1页,此课件共21页哦一、多媒体数据压缩技术 仙农仙农(C(CE EShannon)Shannon)在创立信息论时,提出把数据看作是信息和冗余度的组合。早在创立信息论时,提出把数据看作是信息和冗余度的组合。早期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。而数据之所以能期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。而数据之所以能够被压缩是因为其中存在各种各样的冗余;其中有时间冗余性、空间冗余性、信息熵够被压缩是因为其中存在各种各样的冗余;其中有时间冗余性、空间冗余性、信息熵冗余、先验知识冗余、其它冗余等。时间冗余是语音和序列图像中常见的冗余,运动冗
2、余、先验知识冗余、其它冗余等。时间冗余是语音和序列图像中常见的冗余,运动图像中前后两帧间就存在很强的相关性,利用帧间运动补兴就可以将图像数据的速率图像中前后两帧间就存在很强的相关性,利用帧间运动补兴就可以将图像数据的速率大大压缩。语音也是这样。尤其是浊音段,在相当长的时间内大大压缩。语音也是这样。尤其是浊音段,在相当长的时间内(几到几十毫秒几到几十毫秒)语音信语音信号都表现出很强的周期性,可以利用线性预测的方法得到较高的压缩比。空间冗余是号都表现出很强的周期性,可以利用线性预测的方法得到较高的压缩比。空间冗余是用来表示图像数据中存在的某种空间上的规则性,如大面积的均匀背景中就有很大的用来表示图
3、像数据中存在的某种空间上的规则性,如大面积的均匀背景中就有很大的空间冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下最优空间冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下最优编码而造成的冗余性,这种冗余性可以通过熵编码来进行压缩,经常使用的如编码而造成的冗余性,这种冗余性可以通过熵编码来进行压缩,经常使用的如Huff-Huff-manman编码。先验知识冗余是指数据的理解与先验知识有相当大的关系,如当收信方知编码。先验知识冗余是指数据的理解与先验知识有相当大的关系,如当收信方知道一个单词的前几个字母为道一个单词的前几个字母为administratoadmi
4、nistrato时,立刻就可以猜到最后一个字母为时,立刻就可以猜到最后一个字母为r r,那么,那么在这种情况下,最后一个字母就不带任何信息量了,这就是一种先验知识冗余。其它在这种情况下,最后一个字母就不带任何信息量了,这就是一种先验知识冗余。其它冗余是指那些主观无法感受到的信息等带来的冗余。冗余是指那些主观无法感受到的信息等带来的冗余。第2页,此课件共21页哦通常数据压缩技术可分为无损压缩通常数据压缩技术可分为无损压缩(又叫冗余压缩又叫冗余压缩)和有损压缩和有损压缩(又叫熵压缩又叫熵压缩)两大类。无损压缩就是把数据中的冗余去掉或减两大类。无损压缩就是把数据中的冗余去掉或减少,但这些冗余量是可以
5、重新插入到数据中的,因而不会产生少,但这些冗余量是可以重新插入到数据中的,因而不会产生失真。该方法一般用于文本数据的压缩,它可以保证完全地恢失真。该方法一般用于文本数据的压缩,它可以保证完全地恢复原始数据;其缺点是压缩比小复原始数据;其缺点是压缩比小(其压缩比一般为其压缩比一般为2 2:1 1至至5 5:1)1)。有损压缩是对熵进行压缩,因而存在一定程度的失真;它主要有损压缩是对熵进行压缩,因而存在一定程度的失真;它主要用于对声音、图像、动态视频等数据进行压缩,压缩比较高用于对声音、图像、动态视频等数据进行压缩,压缩比较高(其压缩比一般高达其压缩比一般高达2020:1 1以上。最新被称为以上。
6、最新被称为“E EigenigenIDID”的的压缩技术可将基因数据压缩压缩技术可将基因数据压缩1 15 5亿倍亿倍)。对于多媒体图像采用的。对于多媒体图像采用的有损压缩的标准有静态图像压缩标准有损压缩的标准有静态图像压缩标准(JPEG(JPEG标准,即标准,即 JointPhotographicExpertGroupJointPhotographicExpertGroup 标准标准)和动态图像压缩标准和动态图像压缩标准(MPEG(MPEG标准,即标准,即 MovingPictureExpertGroupMovingPictureExpertGroup 标准标准)。第3页,此课件共21页哦PE
7、GPEG利用了人眼的心理和生理特征及其局限性来对彩色的、利用了人眼的心理和生理特征及其局限性来对彩色的、单色的和多灰度连续色调的、静态图像的、数字图像的压单色的和多灰度连续色调的、静态图像的、数字图像的压缩,因此它非常适合不太复杂的以及一般来源于真实景物缩,因此它非常适合不太复杂的以及一般来源于真实景物的图像。它定义了两种基本的压缩算法:一种是基于有失的图像。它定义了两种基本的压缩算法:一种是基于有失真的压缩算法,另一种是基于空间线性预测技术真的压缩算法,另一种是基于空间线性预测技术(DPCM)(DPCM)无无失真的压缩算法。为了满足各种需要,它制定了四种工作失真的压缩算法。为了满足各种需要,
8、它制定了四种工作模式:无失真压缩、基于模式:无失真压缩、基于DCTDCT的顺序工作方式、累进工作的顺序工作方式、累进工作方式和分层工作方式。方式和分层工作方式。第4页,此课件共21页哦 MPEGMPEG用于活动影像的压缩。用于活动影像的压缩。MPEGMPEG标准具体包三部分内容:标准具体包三部分内容:(1)MPEG(1)MPEG视频、视频、(2)MPEG(2)MPEG音音频、频、(3)MP(3)MP系统系统(视频和音频的同步视频和音频的同步)。MPEGMPEG视频是标准的核心分,它采用了帧内和帧视频是标准的核心分,它采用了帧内和帧间相结合的压缩方法,以离散余变换间相结合的压缩方法,以离散余变换
9、(DCT)(DCT)和运动补偿两项技术为基础,在图像质量和运动补偿两项技术为基础,在图像质量基不变的情况下,基不变的情况下,MPEGMPEG可把图像压缩至可把图像压缩至1 1100100或更或更MPEGMPEG音频压缩算法则是根据人音频压缩算法则是根据人耳屏蔽滤波功能。利用音响心理学的基本原理,即耳屏蔽滤波功能。利用音响心理学的基本原理,即“某些频率的音响在重放其频率某些频率的音响在重放其频率的音频时听不到的音频时听不到”这样一个特性,将那些人耳完全不到或基本上听到的多余音频信这样一个特性,将那些人耳完全不到或基本上听到的多余音频信号压缩掉,最后使音频号的压缩比达到号压缩掉,最后使音频号的压缩
10、比达到8 8:1 1或更高,音质逼真,与或更高,音质逼真,与CDCD唱片可媲美。唱片可媲美。按照按照MPEGMPEG标准,标准,MPEGMPEG数据流包含系统层和压层数据。系统层含有定时信号,图像和数据流包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、多分配等信息。压缩层包含经压缩后的实际的图像和声数据,该数据流声音的同步、多分配等信息。压缩层包含经压缩后的实际的图像和声数据,该数据流将视频、音频信号复合及同步后,其数据输率为将视频、音频信号复合及同步后,其数据输率为1 15MB5MBs s。其中压缩图像数据传输。其中压缩图像数据传输率为率为1 12M2M压缩声音传输率为压缩声音传
11、输率为0 02MB2MBs s。第5页,此课件共21页哦MPEGMPEG标准的发展经历了标准的发展经历了MPEGMPEGI,MPEGI,MPEG一一2 2、MPEGMPEG一一4 4、MPEG-7MPEG-7、MPEGMPEG一一2121等不同层次。在等不同层次。在MPEGMPEG的不同标准中,的不同标准中,每每个标准都是建立在前面的标准之上的,并与前面的标准个标准都是建立在前面的标准之上的,并与前面的标准向后的兼容。目前在图像压缩中,应用得较多的是向后的兼容。目前在图像压缩中,应用得较多的是MPEGMPEG一一4 4标准,标准,MPEG-MPEG-是在是在MPEG-2MPEG-2基础上作了很
12、大的扩充,主要目基础上作了很大的扩充,主要目标是多媒体应用。在标是多媒体应用。在MPEGMPEG一一2 2标准中,我们的观念是单幅图标准中,我们的观念是单幅图像,而且包含了一幅图像的全部元素。在像,而且包含了一幅图像的全部元素。在MPEGMPEG一一4 4标准下,标准下,我们的观念变为多图像元素,其中的每我们的观念变为多图像元素,其中的每个多图像元素都是个多图像元素都是独立编码处理的。该标准包含了为接收器所用的指令,告诉独立编码处理的。该标准包含了为接收器所用的指令,告诉接收器如何构成最终的图像。接收器如何构成最终的图像。第6页,此课件共21页哦 每个解码缓冲器只接收属于它自己的灵敏据流,并转
13、送给解码器。复合存储器完成图像元素的存每个解码缓冲器只接收属于它自己的灵敏据流,并转送给解码器。复合存储器完成图像元素的存储,并将它们送到显示器的恰当位置。音频的情况也是这样,但显然不同点是要求同时提供所有储,并将它们送到显示器的恰当位置。音频的情况也是这样,但显然不同点是要求同时提供所有的元素。数据上的时间标记保证这些元素在时间上能正确同步。的元素。数据上的时间标记保证这些元素在时间上能正确同步。MPEGMPEG一一4 4标准对自然元素标准对自然元素(实物实物图像图像)和合成元素进行区分和规定,计算机生成的动画是合成元素的一个例子。比如,一幅完整和合成元素进行区分和规定,计算机生成的动画是合
14、成元素的一个例子。比如,一幅完整的图像可以包含一幅实际的背景图,并在前面有一幅动画或者有另外一幅自然图像。这样的每一的图像可以包含一幅实际的背景图,并在前面有一幅动画或者有另外一幅自然图像。这样的每一幅图像都可以作最佳压缩,并互相独立地传送到接收器,接收器知道如何把这些元素组合在一起。幅图像都可以作最佳压缩,并互相独立地传送到接收器,接收器知道如何把这些元素组合在一起。在在MPEGMPEG一一2 2标准中,图像被看作一个整体来压缩;而在标准中,图像被看作一个整体来压缩;而在MPEGMPEG一一4 4标准下,对图像中的每一个元素标准下,对图像中的每一个元素进行优化压缩。静止的背景不必压缩到以后的
15、进行优化压缩。静止的背景不必压缩到以后的I I帧之中去,否则会使带宽的使用变得很紧张。而如帧之中去,否则会使带宽的使用变得很紧张。而如果这个背景图像静止果这个背景图像静止1010秒钟,就只要传送一次秒钟,就只要传送一次(假设我们不必担心有人在该时间内切人此频道假设我们不必担心有人在该时间内切人此频道),需要不断传送的仅是前台的比较小的图像元素。对有些节目类型,这样做会节省大量的带宽。需要不断传送的仅是前台的比较小的图像元素。对有些节目类型,这样做会节省大量的带宽。MPEGMPEG一一4 4标准对音频的处理也是相同的。例如,有一位独唱演员,伴随有电子合成器,在标准对音频的处理也是相同的。例如,有
16、一位独唱演员,伴随有电子合成器,在MPEGMPEG一一2 2标准下,我们必须先把独唱和合成器作混合,然后再对合成的音频信号进行压缩与传送。在标准下,我们必须先把独唱和合成器作混合,然后再对合成的音频信号进行压缩与传送。在MPEGMPEG一一4 4标准下,我们可以对独唱作单独压缩,然后再传送乐器数字接口的声轨信号,就可以使标准下,我们可以对独唱作单独压缩,然后再传送乐器数字接口的声轨信号,就可以使接收器重建伴音。接收器重建伴音。第7页,此课件共21页哦当然,接收器必须能支持MIDI放音。与传送合成的信号相比,分别传送独唱信号和MIDI数据要节省大量的带宽。其它的节目类型同样可以作类似的规定。MP
17、EG一7标准又叫多媒体内容描述接口标准。图像可以用色彩、纹理、形状、运动等参数来描述,MPEG一7标准是依靠众多的参数对图像与声音实现分类,并对它们的数据库实现查询。第8页,此课件共21页哦二、多媒体数据压缩技术的实现方法 目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码的压缩方法、离目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码的压缩方法、离散余弦变换散余弦变换(DCT)(DCT)和小波分解技术压缩算法的研究更具有代表性。小波技术突破了传和小波分解技术压缩算法的研究更具有代表性。小波技术突破了传统压缩方法的局限性,引入了局部和全局相关去冗余的新思想,具有较大的潜力,
18、因统压缩方法的局限性,引入了局部和全局相关去冗余的新思想,具有较大的潜力,因此近几年来吸引了众多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个此近几年来吸引了众多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个叫做叫做“小片小片”的区域;在每个小片中,图像经滤波后被分解成若干个低频与高频分量。的区域;在每个小片中,图像经滤波后被分解成若干个低频与高频分量。低频分量可以用不同的分辨率进行量化,即图像的低频部分需要许多的二进制位,以低频分量可以用不同的分辨率进行量化,即图像的低频部分需要许多的二进制位,以改善图像重构时的信噪比。低频元素采用精细量化,高频分量可以量化得比较粗糙,改善图
19、像重构时的信噪比。低频元素采用精细量化,高频分量可以量化得比较粗糙,因为你不太容易看到变化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法因为你不太容易看到变化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被提出,这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用大量的被提出,这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用大量的计算机资源,但可以获得很好的结果。借助于从计算机资源,但可以获得很好的结果。借助于从DNADNA序列研究中发展出来的模式识别序列研究中发展出来的模式识别技术,能减少通过技术,能减少通过WANWAN链路的流量,最多时的压缩比率能达到链路的
20、流量,最多时的压缩比率能达到9090,从而为网络传送,从而为网络传送图像和声音提供更大的压缩比,减轻风络负荷,更好地实现网络信息传播。图像和声音提供更大的压缩比,减轻风络负荷,更好地实现网络信息传播。第9页,此课件共21页哦三、压缩原理 由于图像数据之间存在着一定的冗余,所以使得数据的压缩成由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人为可能。信息论的创始人ShannonShannon提出把数据看作是信息和冗提出把数据看作是信息和冗余度(余度(redundancyredundancy)的组合。所谓冗余度,是由于一副图像的)的组合。所谓冗余度,是由于一副图像的各像素
21、之间存在着很大的相关性,可利用一些编码的方法删去各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余压缩数据的目的。为了去掉数据中的它们,从而达到减少冗余压缩数据的目的。为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。图像的冗余包括以下几种:型。图像的冗余包括以下几种:(1)(1)空间冗余:像素点之间的空间冗余:像素点之间的相关性。相关性。(2)(2)时间冗余:活动图像的两个连续帧之间的冗余。时间冗余:活动图像的两个连续帧之间的冗余。(3)(3)信息熵冗余:单位信息量大于其熵。信息熵冗余:单
22、位信息量大于其熵。(4)(4)结构冗余:图像结构冗余:图像的区域上存在非常强的纹理结构。的区域上存在非常强的纹理结构。(5)(5)知识冗余:有固定的结知识冗余:有固定的结构,如人的头像。构,如人的头像。(6)(6)视觉冗余:某些图像的失真是人眼不易视觉冗余:某些图像的失真是人眼不易觉察的。觉察的。第10页,此课件共21页哦对数字图像进行压缩通常利用两个基本原理(1)(1)数字图像的相关性。在图像的同一行相邻像素之间、数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除
23、或减少图像信息中的冗去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。余度,即实现了对数字图像的压缩。(2)(2)人的视觉心理特人的视觉心理特征。人的视觉对于边缘急剧变化不敏感征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。从而达到对数字图像压缩的目的。第11页,此课件共21页哦编码压缩方法有许多种,从不同的角度出发有不
24、同的分类方法,比如从信息论角度出发可分 为两大类:(1)(1)冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。具体讲就是解冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。具体讲就是解码图像和压缩码图像和压缩 编码前的图像严格相同,没有失真,从数学上讲是一种可逆运编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。算。(2)(2)信息量压缩方法,也称有损压缩,失真度编码或熵压缩编码。也就信息量压缩方法,也称有损压缩,失真度编码或熵压缩编码。也就是讲解码图像和原始图像是有差别的,允许有一定的失真。应用在多媒体中是讲解码图像和原始图像是有差别的,允许有一定的失真。应用在多媒体中的图像压
25、缩编码方法,从压缩编码算法原理上可以分类为:的图像压缩编码方法,从压缩编码算法原理上可以分类为:(1)(1)无损压缩编无损压缩编码种类码种类 哈夫曼编码哈夫曼编码 算术编码算术编码 行程编码行程编码 Lempel zevLempel zev编码编码(2)(2)有损压缩编有损压缩编码种类码种类 预测编码:预测编码:DPCMDPCM,运动补偿,运动补偿 频率域方法:正文变换编码频率域方法:正文变换编码(如如DCT)DCT),子带,子带编码编码 空间域方法:统计分块编码空间域方法:统计分块编码 模型方法:分形编码,模型基编码模型方法:分形编码,模型基编码 基于重要基于重要性:滤波,子采样,比特分配,
26、矢量量化性:滤波,子采样,比特分配,矢量量化(3)(3)混合编码混合编码 JBIGJBIG,H261H261,JPEGJPEG,MPEGMPEG等技术标准衡量一个压缩编码方法优劣的重要指标等技术标准衡量一个压缩编码方法优劣的重要指标(1)(1)压缩比要高,有压缩比要高,有几倍、几十倍,也有几百乃至几千倍;几倍、几十倍,也有几百乃至几千倍;(2)(2)压缩与解压缩要快,算法要简单,压缩与解压缩要快,算法要简单,硬件实现容易;硬件实现容易;(3)(3)解压缩的图像质量要好。解压缩的图像质量要好。第12页,此课件共21页哦四、JPEG图像压缩算法 1 1.JPEG.JPEG压缩过程压缩过程 JPEG
27、 JPEG压缩分四个步骤实现:压缩分四个步骤实现:1.1.颜色模式转换及采样;颜色模式转换及采样;2.DCT 2.DCT变变换;换;3.3.量化;量化;4.4.编码。编码。2 21 1颜色模式转换及采样颜色模式转换及采样 RGB RGB色彩系统是色彩系统是我们最常用的表示颜色的方式。我们最常用的表示颜色的方式。JPEGJPEG采用的是采用的是YCbCrYCbCr色彩色彩系统。想要用系统。想要用JPEGJPEG基本压缩法处理全彩色图像,得先把基本压缩法处理全彩色图像,得先把RGBRGB颜色模式图像数据,转换为颜色模式图像数据,转换为YCbCrYCbCr颜色模式的数据。颜色模式的数据。Y Y代表亮
28、度,代表亮度,CbCb和和CrCr则代表色度、饱和度。通过下列计算则代表色度、饱和度。通过下列计算公式可完成数据转换。公式可完成数据转换。第13页,此课件共21页哦Y=0.2990R+0.5870G+0.1140B Cb=-Y=0.2990R+0.5870G+0.1140B Cb=-0.1687R-0.3313G+0.5000B+128 0.1687R-0.3313G+0.5000B+128 Cr=0.5000R-0.4187G-0.0813BCr=0.5000R-0.4187G-0.0813B128 128 人类人类的眼晴对低频的数据比对高频的数据具有更高的敏感度,的眼晴对低频的数据比对高频
29、的数据具有更高的敏感度,事实上,人类的眼睛对亮度的改变也比对色彩的改变要敏事实上,人类的眼睛对亮度的改变也比对色彩的改变要敏感得多,也就是说感得多,也就是说Y Y成份的数据是比较重要的。既然成份的数据是比较重要的。既然CbCb成成份和份和CrCr成份的数据比较相对不重要,就可以只取部分数据成份的数据比较相对不重要,就可以只取部分数据来处理。以增加压缩的比例。来处理。以增加压缩的比例。JPEGJPEG通常有两种采样方式:通常有两种采样方式:YUV411YUV411和和YUV422YUV422,它们所代表的意义是,它们所代表的意义是Y Y、CbCb和和CrCr三个三个成份的资料取样比例。成份的资料
30、取样比例。第14页,此课件共21页哦 2 22.DCT2.DCT变换变换 DCT DCT变换的全称是离散余弦变换变换的全称是离散余弦变换(Discrete Cosine(Discrete Cosine Transform)Transform),是指将一组光强数据转换成频率数据,以便得知强度变化的情,是指将一组光强数据转换成频率数据,以便得知强度变化的情形。若对高频的数据做些修饰,再转回原来形式的数据时,显然与原始数据形。若对高频的数据做些修饰,再转回原来形式的数据时,显然与原始数据有些差异,但是人类的眼睛却是不容易辨认出来。有些差异,但是人类的眼睛却是不容易辨认出来。压缩时,将原始图像数压缩时
31、,将原始图像数据分成据分成8*88*8数据单元矩阵,例如亮度值的第一个矩阵内容如下:数据单元矩阵,例如亮度值的第一个矩阵内容如下:JPEG JPEG将整将整个亮度矩阵与色度个亮度矩阵与色度CbCb矩阵,饱和度矩阵,饱和度CrCr矩阵,视为一个基本单元称作矩阵,视为一个基本单元称作MCUMCU。每。每个个MCUMCU所包含的矩阵数量不得超过所包含的矩阵数量不得超过1010个。例如,行和列采样的比例皆为个。例如,行和列采样的比例皆为4:2:24:2:2,则每个,则每个MCUMCU将包含四个亮度矩阵,一个色度矩阵及一个饱和度矩阵。将包含四个亮度矩阵,一个色度矩阵及一个饱和度矩阵。当当图像数据分成一个
32、图像数据分成一个8*88*8矩阵后,还必须将每个数值减去矩阵后,还必须将每个数值减去128128,然后一一代入,然后一一代入DCTDCT变换公式中,即可达到变换公式中,即可达到DCTDCT变换的目的。图像数据值必须减去变换的目的。图像数据值必须减去128128,是因,是因为为DCTDCT转换公式所接受的数字范围是在转换公式所接受的数字范围是在-128-128到到+127+127之间。之间。第15页,此课件共21页哦 DCT DCT变换公式:变换公式:x,y x,y代表图像数据矩阵内某个数值的坐标代表图像数据矩阵内某个数值的坐标位置位置f(x,y)f(x,y)代表图像数据矩阵内的数个数值代表图像
33、数据矩阵内的数个数值u,vu,v代表代表DCTDCT变变换后矩阵内某个数值的坐标位置换后矩阵内某个数值的坐标位置F(u,v)F(u,v)代表代表DCTDCT变换后矩变换后矩阵内的某个数值阵内的某个数值 u=0 u=0 且且 v=0 c(u)c(v)=1/1.414 u0 v=0 c(u)c(v)=1/1.414 u0 或或 v0 c(u)c(v)=1 v0 c(u)c(v)=1 经过DCT变换后的矩阵数据自然数为频率系数,这些系数以F(0,0)的值最大,称为DC,其余的63个频率系数则多半是一些接近于0的正负浮点数,一概称之为AC。第16页,此课件共21页哦 3 33 3、量化、量化 图像数据
34、转换为频率系数后,还得接受一图像数据转换为频率系数后,还得接受一项量化程序,才能进入编码阶段。量化阶段需要两个项量化程序,才能进入编码阶段。量化阶段需要两个8*88*8矩阵数据,一个是专门处理亮度的频率系数,另一个则是矩阵数据,一个是专门处理亮度的频率系数,另一个则是针对色度的频率系数,将频率系数除以量化矩阵的值,取针对色度的频率系数,将频率系数除以量化矩阵的值,取得与商数最近的整数,即完成量化。得与商数最近的整数,即完成量化。当频率系数经过当频率系数经过量化后,将频率系数由浮点数转变为整数,这才便于执行量化后,将频率系数由浮点数转变为整数,这才便于执行最后的编码。不过,经过量化阶段后,所有数
35、据只保留整最后的编码。不过,经过量化阶段后,所有数据只保留整数近似值,也就再度损失了一些数据内容,数近似值,也就再度损失了一些数据内容,JPEGJPEG提供的提供的量化表如下:量化表如下:第17页,此课件共21页哦 2 24 4、编码、编码 Huffman Huffman编码无专利权问题,成为编码无专利权问题,成为JPEGJPEG最常用的编码方式,最常用的编码方式,HuffmanHuffman编码通常是以完整的编码通常是以完整的MCUMCU来进行的。来进行的。编码时,每个矩阵数据编码时,每个矩阵数据的的DCDC值与值与6363个个ACAC值,将分别使用不同的值,将分别使用不同的HuffmanH
36、uffman编码表,而亮度与色度编码表,而亮度与色度也需要不同的也需要不同的HuffmanHuffman编码表,所以一共需要四个编码表,才能顺利地完编码表,所以一共需要四个编码表,才能顺利地完成成JPEGJPEG编码工作。编码工作。DC DC编码编码 DC DC是彩采用差值脉冲编码调制的差值编码是彩采用差值脉冲编码调制的差值编码法,也就是在同一个图像分量中取得每个法,也就是在同一个图像分量中取得每个DCDC值与前一个值与前一个DCDC值的差值来编值的差值来编码。码。DCDC采用差值脉冲编码的主要原因是由于在连续色调的图像中,其差采用差值脉冲编码的主要原因是由于在连续色调的图像中,其差值多半比原
37、值小,对差值进行编码所需的位数,会比对原值进行编码所值多半比原值小,对差值进行编码所需的位数,会比对原值进行编码所需的位数少许多。例如差值为需的位数少许多。例如差值为5 5,它的二进制表示值为,它的二进制表示值为101101,如果差值为,如果差值为-5 5,则先改为正整数,则先改为正整数5 5,再将其二进制转换成,再将其二进制转换成1 1的补码即可。所谓的补码即可。所谓1 1的补码,的补码,就是将每个就是将每个BitBit若值为若值为0 0,便改成,便改成1 1;BitBit为为1 1,则变成,则变成0 0。差值。差值5 5应保留的位应保留的位数为数为3 3,下表即列出差值所应保留的,下表即列
38、出差值所应保留的BitBit数与差值内容的对照。数与差值内容的对照。第18页,此课件共21页哦在差值前端另外加入一些差值的霍夫曼码值,例如亮度差值为5(101)的位数为3,则霍夫曼码值应该是100,两者连接在一起即为100101。下列两份表格分别是亮度和色度DC差值的编码表。根据这两份表格内容,即可为DC差值加上霍夫曼码值,完成DC的编码工作。第19页,此课件共21页哦ACAC编码编码 AC AC编码方式与编码方式与DCDC略有不同,在略有不同,在ACAC编码之前,首先得编码之前,首先得将将6363个个ACAC值按值按Zig-zagZig-zag排序,即按照下图箭头所指示的顺序串排序,即按照下
39、图箭头所指示的顺序串联起来。联起来。63 63个个ACAC值排列好的,将值排列好的,将ACAC系数转换成中间符号,系数转换成中间符号,中间符号表示为中间符号表示为RRRR/SSSSRRRR/SSSS,RRRRRRRR是指第非零的是指第非零的ACAC之前,其之前,其值为值为0 0的的ACAC个数,个数,SSSSSSSS是指是指ACAC值所需的位数,值所需的位数,ACAC系数的范围与系数的范围与SSSSSSSS的对应关系与的对应关系与DCDC差值差值BitsBits数与差值内容对照表相似。数与差值内容对照表相似。如如果连续为果连续为0 0的的ACAC个数大于个数大于1515,则用,则用15/015
40、/0来表示连续的来表示连续的1616个个0 0,15/015/0称为称为ZRLZRL(Zero Rum LengthZero Rum Length),而(),而(0/00/0)称为)称为EOBEOB(Enel of BlockEnel of Block)用来表示其后所剩余的)用来表示其后所剩余的ACAC系数皆等于系数皆等于0 0,以中间符号值作为索引值,从相应的以中间符号值作为索引值,从相应的ACAC编码表中找出适当的霍编码表中找出适当的霍夫曼码值,再与夫曼码值,再与ACAC值相连即可。值相连即可。第20页,此课件共21页哦例如某一组亮度的中间符为例如某一组亮度的中间符为5/35/3,ACAC
41、值为值为4 4,首先以,首先以5/35/3为为索引值,从亮度索引值,从亮度ACAC的的HuffmanHuffman编码表中找到编码表中找到11111111100111101111111110011110霍夫曼码值,于是加上原来霍夫曼码值,于是加上原来100100(4 4)即是用来取即是用来取55,44的的HuffmanHuffman编码编码11111111100111101001111111110011110100,55,44表示表示ACAC值为值为4 4的前面有的前面有5 5个零。个零。由于亮度由于亮度ACAC,色度,色度ACAC霍夫曼编码表比较长,在霍夫曼编码表比较长,在此省略去,有兴趣者可参阅相关书籍。此省略去,有兴趣者可参阅相关书籍。实现上述四个实现上述四个步骤,即完成一幅图像的步骤,即完成一幅图像的JPEGJPEG压缩。压缩。第21页,此课件共21页哦