《图像的编码与压缩.ppt》由会员分享,可在线阅读,更多相关《图像的编码与压缩.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、图像的编码与压缩 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望 图像数据的特点之一是信息量大。以像幅为23cm23cm的航摄影像为例,若按采样间隔25um、每象素8bit扫描,其数据量为84.5MB;一颗卫星每半小时发回次全波段(五个波段)数据,每个波段图像大小为22922190字节约4.90MB,每天的数据量高达1.2GB。如此海量数据需要巨大的存储空间。在多媒体中,海量图像数据的存储和处理是难点之一。根据计算,一张600M字节的光盘,能存放20秒左右的640
2、480像素的图像画面信息,如不进行编码压缩处理,多媒体信息保存有多么困难是可想而知的。在现代通信中,图像传输已成为重要内容。除要求设备可靠、图像保真度高以外,实时性将是重要技术指标之一。很显然,在信道带宽、通信链路容量一定的前提下,采用编码压缩技术,减少传输数据量,是提高通信速度的重要手段。没有图像编码压缩技术的发展,大容量图像信息的存储与传输是难以实现的,多媒体、高速信息公路等新技术在实际中的应用会碰到很大困难。2.为什么能压缩?为什么能压缩?因为一般图像中,存在很大的冗余度。因此图像信息的压缩是可能的。但到底能压缩多少,除了和图像本身存在的冗余度多少有关外,很大程度取决于对图像质量的要求。
3、例如广播电视要考虑艺术欣赏,对图像质量要求就很高,用目前的编码技术,即使压缩比达到31都是很困难的。而对可视电话,因画面活动部分少,对图像质量要求也低,可采用高效编码技术,使压缩比高达15001以上。目前高效图像压缩编码技术已能用硬件实现实时处理,在广播电视、工业电视、电视会议、可视电话、传真和互连网、遥感等多方面得到应用。二、图像编码的分类二、图像编码的分类 图像编码压缩的方法目前有很多,其分类方法根据出发点不同而有差异。根据解压重建后的图像和原始图像之间是否具有误差(对原图像的保真程度),图像编码压缩分为无误差(亦称无失真、无损、信息保持)编码和有误差(有失真或有损)编码两大类。无损压缩(
4、冗余度压缩、可逆压缩):是一种在解码时可以精确地恢复原图像,没有任何损失的编码方法,但是压缩比不大,通常只能获得15倍的压缩比。用于要求重建后图像严格地和原始图像保持相同的场合,例如复制、保存十分珍贵的历史、文物图像等;有损压缩(不可逆压缩):只能对原始图像进行近似的重建,而不能精确的复原,适合大数工用于存储数字化了的模拟数据。压缩比大,但有信息损失。行程编码(行程编码(RLE)在一个逐行存储的图像中,具有相同灰度值的一些象素组成的序列称为一个行程。在编码时,对于每个行程只存储一个灰度值的码,再紧跟着存储这个行程的长度。这种按照行程进行的编码被称为行程编码(Run Length Encodin
5、g)。行程编码对于仅包含很少几个灰度级的图像,特别是二值图像,比较有效。2.1 无损编码无损编码LZW编码编码LZW编码是由Lemple和Ziv提出并经Welch扩充而形成的无损压缩专利技术。在对文件进行编码时,需要生成特定字符序列的表以及对应的代码。每当表中没有的字符串出现时,就把它与其代码一道存储起来。这以后当该串再次出现时,只存储其代码。实际上,字符串表是在压缩过程中动态生成的,而且由于解压缩算法可以从压缩文件中重构字符串表,因而字符串表也不必存储。Huffman编码编码Huffman编码是50年代提出的一种基于统计的无损编码方法,它利用变长的码来使冗余量达到最小。通过一个二叉树来编码,
6、使常出现的字符用较短的码代表,不常出现的字符用较长的码代表。静态Huffman编码使用一棵依据字符出现的概率事先生成好的编码树进行编码。而动态Huffman编码需要在编码的过程中建立编码树。由于Huffman编码所得到的平均码字长度可以接近信源的熵,因此在变长编码中是最佳的编码方法,故也称为熵编码。熵编码。2.2 有损编码有损编码 量化量化 将图像用较少的灰度级别来表示是最简单的减小数据量的方法,这种方法就是标量量化方法。更一般的情况是,针对连续量的采样过程,量化是用有限个状态来表示连续值。预测编码预测编码 预测编码根据数据在时间和空间上的相关性,根据统计模型利用已有样本对新样本进行预测,将样
7、本的实际值与其预测值相减得到误差值,再对误差值进行编码。由于通常误差值比样本值小得多,因而可以达到数据压缩的效果。模拟量到数字量的转换过程是脉冲编码调制过程PCM,也称PCM编码。对于图像而言,直接以PCM编码,存储量很大。预测编码可以利用相邻象素之间的相关性,用前面已出现的象素值估计当前象素值,对实际值与估计值的差值进行编码。常用的一种线性预测编码方法是差分脉冲编码调制DPCM。DCT编码编码 DCT变换是图像压缩标准中常用的变换方法,如JPEG标准中将图像按照8x8分块利用DCT变换编码实现压缩。Lena.bmp(原图原图)Lenna.jpg(压缩率压缩率9.2)Lenna.jpg(压缩率
8、压缩率18.4)Lenna.jpg(压缩率压缩率51.6)其它变换编码其它变换编码 变换方法是实现图像数据压缩的主要手段,其基本原理是首先通过变换将图像数据投影到另一特征空间,降低数据的相关性,使有效数据集中分布;再采用量化方法离散化,最后通过Huffman等无损压缩编码进一步压缩数据的存储量。DCT是一种常用的变换域压缩方法,是JPEG,MPEGI-II等图像及视频信号压缩标准的算法基础。在实际采用DCT编码时,需要分块处理,各块单独变换编码,整体图像编码后再解压会出现块状人工效应,特别是当压缩比较大时非常明显,使图像失真。因此,为了获得更高的图像压缩比,人们提出了一些其它方法,如基于小波变
9、换的图像压缩算法和基于分形的图像压缩算法等。基于小波变换的图像压缩算法首先使用某种小波基函数将图像做小波变换,再根据四个通道的不同情况,分别量化编码,比如对低频频段(LL)采用较多的量化级别,而对中间频段(LH,RH)采用较少量化级别,对高频频段(HH)采用很少几个量化级别,这样根据重构时对复原信号的重要程度分别对待的方式可以有效地提高压缩比而又不产生明显的失真。由于小波变换不使用DCT变换方法中的固定大小的块分别编码的处理方法,而是通过整体的多级(通常用3-5个级别)变换方法实现,没有块状效应。小波变换可以获得10-50倍的压缩比而没有明显的失真。小波变换在静态图像压缩中的作用已经得到公认,
10、为JPEG2000标准所采纳。三、保真度准则 在图像压缩编码中,解码图像与原始图像可能会差异,因此,需要评价压缩后图像的质量。描述解码图像相对原始图像偏离程度的测度一般称为保真度(逼真度)准则。常用的准则可分为两大类:客观保真度准则和主观保真度准则。客观保真度准则客观保真度准则最常用的客观保真度准则是原图像和解码图像之间的均方根误差和均方根信噪比两种。令f(x,y)代表原图像,代表对f(x,y)先压缩又解压缩后得到的f(x,y)的近似,对任意x和y,f(x,y)和 之间的误差定义为:若f(x,y)和 均为MN,则它们之间均方根误差 为:如果将 看作原始图f(x,y)和噪声信号e(x,y)的和,
11、那么解压图像的均方信噪比 为:如果对上式求平方根,就得到均方根信噪比 。主观保真度准则主观保真度准则 尽管客观保真度准则提供了一种简单、方便的评估信息损失的方法,但很多解压图最终是供人观看的。事实上,具有相同客观保真度的不同图像,在人的视觉中可能产生不同的在视觉效果。这是因为客观保真度是一种统计平均意义下的度量准则,对于图像中的细节无法反映出来。而人的视觉系统具有独特的特性,能够觉察出来。这种情况下,用主观的方法来测量图像的质量更为合适。1种常用的方法是对1组(不少于20人)观察者显示图像,并将他们对该图像的评分取平均,用来评价一幅图像的主观质量。评价也可对照某种绝对尺度进行。下表给出一种对电
12、视图像质量进行绝对评价的尺度,根据图像的绝对质量进行判断打分。评分评 价说 明1优秀图像质量非常好,如同人能想象出的最好质量。2良好图像质量高,观看舒服,有干扰但不影响观看。3可用图像质量可接受,有干扰但不太影响观看。4刚可看图像质量差,干扰有些妨碍观看,观察者希望改进。5差图像质量很差,妨碍观看的干扰始终存在,几乎无法观看。6不能用图像质量极差,不能使用。也可通过将 和f(x,y)比较并按照某种相对的尺度进行评价。如果观察者将 和f(x,y)逐个进行对照,则可以得到相对的质量分。例如可用 来代表主观评价很差,较差,稍差,相同,稍好,较好,很好。四、霍夫曼编码 Huffman编码是1952年由
13、Huffman提出的一种编码方法。这种编码方法根据源数据符号发生的概率进行编码。在源数据中出现概率越大的符号,相应的码越短;出现概率越小的符号,其码长越长,从而达到用尽可能少的码符号表示源数据。它在变长编码方法中是最佳的。下面通过实例来说明这种编码方法。具体编码方法是:把输入元素按其出现概率的大小顺序排列起来,然后把两个具有最小概率的元素之概率加起来;把该概率之和同其余概率大小顺序排队,然后再把两个最小概率加起来,再重新排队;重复,直到最后得到和为1的根节点。具体编码方法是:把输入元素按其出现概率的大小顺序排列起来,然后把两个具有最小概率的元素之概率加起来;把该概率之和同其余概率大小顺序排队,
14、然后再把两个最小概率加起来,再重新排队;重复,直到最后得到和为1的根节点。五、预测编码预测就是根据过去时刻的样本序列,运用一种模型,预测当前的样本值。预测编码通常不直接对信号编码,而是对预测误差编码。当预测比较准确,误差较小时,即可达到编码压缩的目的。这种编码称之为差分脉冲编码调制(DPCM),上图是原理框图。在该系统中,xN为tN时刻的亮度取样值。预测器根据tN时刻之前的样本x1,x2,xN-1对xN作预测,得到预测值xN。xN与xN之间的误差为 量化器对eN进行量化得到eN。编码器对eN 进行编码发送。接收端解码时的预测过程与发送端相同,所用预测器亦相同。接收端恢复的输出信号 是xN的近似
15、值,两者的误差是 当xN足够小时,输入信号xN 和DPCM系统的输出信号 几乎一致。六、图像压缩的标准六、图像压缩的标准 图像压缩的国际标准主要是由国际标准化组织(International Standardization Organization,简称ISO)和国际电信联盟(International Telecommunication Union,简称ITU)制定的。国际电信联盟的前身是国际电话电报咨询委员会(Consultative Committee of the International Telephone and Telegraph,简称CCITT)。由这两个组织制定的国际标准可
16、分成三个部分:静止灰度(或彩色)图像压缩标准、运动图像压缩标准和二值图像压缩标准。静止图像压缩标准静止图像压缩标准 由上述两个组织的灰度图像联合专家组JPEG(Joint Picture Expert Group),建立了静态灰度(或彩色)图像压缩的公开算法,并于1991年开始使用。它定义三种编码系统:(1)DCT有损编码系统;(2)扩展编码系统;(3)无失真编码系统。在视觉效果不受到严重损失的前提下,对灰度图像压缩算法可以达到15到20的压缩比。如果在图像质量上稍微牺牲一点的话,可以达到40:1或更高的压缩比。如果处理的是彩色图像,JPEG算法首先将RGB分量转化成亮度分量和色差分量,同时丢
17、失一半的色彩信息(空间分辨率减半)。然后,用离散余弦变换来进行变换编码,舍弃高频的系数,并对余下的系数进行量化,以进一步减小数据量。最后,使用行程长度编码和Huffman编码来完成压缩任务。JPEG解压缩过程就是JPEG压缩过程的逆过程,这使得算法具有对称性。运动图像压缩标准运动图像压缩标准 运动图像专家组MPEG(Moving Pictrue Expert Group)的任务是制定用于数字存储媒介中活动图像及伴音的编码标准MPEG与JPEG算法在概念上类似,只不过它还利用了相继图像之间的冗余信息。由于可达到100:1的压缩比,所以MPEG算法非常实用,如用于在每秒一兆位的信道中传送带声音的彩色电视图像,以及在磁盘驱动器中存储较长一段时间的数字电视图像片段等。二值图像压缩标准二值图像压缩标准 二值图像联合专家组JBIG(Joint Bilevel Imaging Group)的任务是研究制定用于二值图像的编码标准。该标准主要为二值传真图像应用而设计的。上述专家组最初制定的一些标准已得到广泛应用,到目前还在制定一些新的标准。设某一幅图象共有设某一幅图象共有8个灰度级,各灰度级出现概率分别为:个灰度级,各灰度级出现概率分别为:试对此图象进行试对此图象进行Huffman编码。编码。