《第六章 图像编码.ppt》由会员分享,可在线阅读,更多相关《第六章 图像编码.ppt(118页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章 图像编码6.1 概述 6.2 基本理论 6.3 霍夫曼编码6.4 无损预测编码6.5 有损预测编码6.6 变换编码6.7 图像压缩标准6.1 概述一、图像压缩编码必要性 容量很大,存储、处理和传输困难。二、图像压缩编码的可能性 1.相邻象素(帧对应象素)间相关性大(冗余大);2.利用人的视觉特性:人眼分辨率有限等;(如电视中隔行扫描);3.从信息论角度,消除(减少)图像信息中的冗余(无用和重复)数据。6.1 概述三、图像压缩编码 1.数据压缩:对给定量信息,设法减少表达这些信息的数据量。2.方法:压缩掉冗余数据(统计角度:将原图转化为尽可能不相关数据集)。3.图像编码:对图像信息进行压
2、缩编码,在存储、处理和传输前进行。4.图像解码:对压缩图像进行解压以重建原图或其近似图像称为图像解码。6.1 概述四、图像压缩方法分类 不同目的、不同应用等有不同分类方法,常按压缩前及解压后的保真程度分类:1 1信息保持(存)型信息保持(存)型 减少或去除冗余数据,同时保持信息不变,即压缩、解压中无信息损失。也称无失真/无损/可逆型。多用于图像存档,目前压缩率 CR210。6.1 概述2.2.信息损失型信息损失型 以牺牲部分信息为代价,来获取高压缩率。也称有损压缩。解压后得到原图像之近似。3.3.特征抽取法特征抽取法 在图像分析、分类与识别中,仅对于实际需要的(提取)特征信息进行编码,可大大压
3、缩数据量。实际属于信息损失型。6.1 概述根据压缩编码基于的理论可分为:第一代压缩编码八十年代以前,主要是根据传统的信源编码方法。n第二代压缩编码 八十年代以后,突破信源编码理论,结合分形、模型基、神经网络、小波变换等数学工具,充分利用视觉系统生理心理特性和图像信源的各种特性。6.1 概述像素编码像素编码变换编码变换编码预测编码预测编码位平面编码位平面编码增量调制增量调制熵编码熵编码算术编码算术编码DCTDCT变换变换DPCMDPCM调制调制第第一一代代压压缩缩编编码码其他编码其他编码行程编码行程编码6.1 概述子带编码子带编码模型编码模型编码分层编码分层编码分型分型编码编码第第二二代代压压缩
4、缩编编码码6.2 基本理论 一、数据冗余一、数据冗余 (一)概念(一)概念 1.数据是信息的载体;2.数据冗余:代表无用信息或重复表示了其他数据已表示的信息的数据。3.数学表示 (1)压缩率(比):CR=n1/n26.2 基本理论(2)相对数据冗余:RD=1 1/CR例:CR=20;RD=19/20(二二)图像压缩中的图像压缩中的 3 3 种冗余种冗余 编码冗余 像素冗余 视觉心理冗余6.2 基本理论n编码冗余:如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余。例:如果用8位表示该图像的像素,我们就说该图像存在着编码冗余,因为该图像的像素只有两个灰度,用一位即可
5、表示6.2 基本理论n像素冗余:由于任何给定的像素值,原理上都可以通过它的邻居预测到,单个像素携带的信息相对是小的。对于一个图像,很多单个像素对视觉的贡献是冗余的。这是建立在对邻居值预测的基础上。例:原图像数据:234 223 231 238 235 压缩后数据:234 1 2 7 -36.2 基本理论n视觉心理冗余:一些信息在一般视觉处理中比其它信息相对重要程度要小,这种信息就被称为视觉心理冗余。6.2 基本理论 去掉视觉冗余的过程称为量化,它是信息损失型。第二代编码方法就是基于心理视觉冗余。电视广播中的隔行扫描就是常见的例子。(三)结论(三)结论 1.因为存在数据冗余,改变信息描述方法,可
6、压缩掉这些冗余;2.因为视觉冗余,忽略一些视觉不太明显的微小差异,可进行所谓的“有损压缩”。6.2 基本理论二、二、图像保真度 保真度标准评价压缩算法的标准n客观保真度标准n主观保真度标准6.2 基本理论n客观保真度标准 如果信息丢失的级别,可以表示为原始或输入图像与压缩后又解压缩输出的图像的函数,这个函数就被称为客观保真度标准。一般表示为:e(x,y)=f(x,y)-f(x,y)f(x,y)是输入图像,f(x,y)是压缩后解压缩的图像,e(x,y)是误差函数6.2 基本理论两个图像之间的总误差:M-1 N-1 f(x,y)-f(x,y)x=0 y=0均方根误差(rms)M-1 N-1 erm
7、s=1/MN f(x,y)-f(x,y)21/2 x=0 y=06.2 基本理论输出图的均方信噪比SNRms为 如果令fmax=max f(x,y),x=0,1,M 1,y=0,1,N 1,即图像中的灰度最大值,则可得到另一个常用的准则峰值信噪比PSNR:6.2 基本理论n主观保真度标准n通过视觉比较两个图像,给出一个定性的评价,如很粗、粗、稍粗、相同、稍好、较好、很好,这种评价被称为主观保真度标准。6.2 基本理论三、图像编解码过程图像编解码过程6.2 基本理论四、无失真信源编码定理 信源中符号的编码长度的平均码长下限是信源的熵,这一结论对于图像信源同样实用。6.3 霍夫曼编码n霍夫曼编码(
8、1)基本思想n通过减少编码冗余来达到压缩的目的。n基本思想是统计一下符号的出现概率,建立一个概率统计表,将最常出现(概率大的)的符号用最短的编码,最少出现的符号用最长的编码。6.3 霍夫曼编码霍夫曼编码(2)算法实现n首先求出图像中灰度分布的灰度直方图;n根据该直方图,对其按照分布概率从小到大的顺序进行排列;n每一次从中选择出两个概率为最小的节点相加,形成一个新的节点,构造一个称为“Huffman树”的二叉树;n对这个二叉树进行编码,就获得了Huffman编码码字。6.3 霍夫曼编码n例如:aaaa bbb cc d eeeee fffffffn分布为:a:4/22 b:3/22 c:2/22
9、 d:1/22 e:5/22 f:7/22n排序为:d,c,b,a,e,f 1/22 2/22 3/22 4/22 5/22 7/22f10f=11 e=01 a=00 b=101 c=1001 d=1000101010106.3 霍夫曼编码6.3 霍夫曼编码n霍夫曼编码n静态编码n在压缩之前就建立好一个概率统计表和编码树。算法速度快,但压缩效果不是最好n动态编码n对每一个图像,临时建立概率统计表和编码树。算法速度慢,但压缩效果最好 6.4无损预测编码n无损预测编码(1)编码思想na.去除像素冗余。nb.认为相邻像素的信息有冗余。当前像素值可以用以前的像素值来获得。nc.用当前像素值fn,通过
10、预测器得到一个预测值 fn,对当前值和预测值求差,对差编码,作为压缩数据流中的下一个元素。由于差比原数据要小,因而编码要小,可用变长编码。大多数情况下,fn的预测是通过m个以前像素的线性组合来生成的。6.4无损预测编码即:m fn=roundifn-i i=1在一维线性(行预测)预测编码中,预测器为:m fn(x,y)=roundif(x,y-i)i=1round为取最近整数,i为预测系数(可为1/m),y是行变量。d.前m个像素不能用此法编码,可用哈夫曼编码 6.4无损预测编码 6.4无损预测编码举例:m fn=roundifn-i i=1F=154,159,151,149,139,121,
11、112,109,129m=2 =1/2预测值 f2=1/2 *(154+159)156 e2=151-156=-5 f3=1/2 *(159+151)=155 e3=149 155=-6 f4=1/2 *(151+149)=150 e4=139 150=-11 f5=1/2 *(149+139)=144 e5=121 144=-23 f6=1/2 *(139+121)=130 e6=112 130=-18 f7=1/2 *(121+112)116 e6=109 116=-7 f8=1/2 *(112+109)110 e6=129 110=19 6.4无损预测编码n无损预测编码(2)编码n第一步
12、:压缩头处理n第二步:对每一个符号:f(x,y),由前面的值,通过预测器,求出预测值f(x,y)n第三步:求出预测误差 e(x,y)=f(x,y)-f(x,y)n第四步:对误差e(x,y)编码,作为压缩值。n重复二、三、四步 6.4无损预测编码n无损预测编码编码+-符号符号编码编码预测器预测器最接近最接近的整数的整数压缩图像压缩图像输入图像输入图像enfn fn 6.4无损预测编码n无损预测编码(3)解码n第一步:对头解压缩n第二步:对每一个预测误差的编码解码,得到预 测误差 e(x,y)。n第三步:由前面的值,得到预测值f(x,y)。n第四步:误差e(x,y),与预测值f(x,y)相加,得到
13、解码f(x,y)。n重复二、三、四步 6.4无损预测编码n无损预测编码解码+符号符号解码解码预测器预测器解压缩图像解压缩图像压缩图像压缩图像enfn fn 6.5 有损预测编码n有损压缩引言n有损压缩是通过牺牲图像的准确率来达到加大压缩率的目的,如果我们容忍解压缩后的结果中有一定的误差,那么压缩率可以显著提高。n有损压缩方法在图像压缩比大于30:1时仍然能够重构图像,而如果压缩比为10:1到20:1,则重构的图像与原图几乎没有差别n无损压缩的压缩比很少有能超过3:1的。这两种压缩方法的根本差别在于有没有量化模块 6.5 有损预测编码n源数据编码与解码的模型(复习)n源数据编码的模型n源数据解码
14、的模型符号符号解码器解码器反向反向映射器映射器映射器映射器量化器量化器符号符号编码器编码器 6.5有损预测编码n量化器基本思想:n减少数据量的最简单的办法是将图像量化成较少的灰度级,通过减少图像的灰度级来实现n这种量化是不可逆的,因而解码时图像有损失sts1s2s3t1t2t3 如果输入是256个灰度级,对灰度级量化后输出,只剩下4个层次,数据量被大大减少。6.5 有损预测编码n有损预测的基本思想 对无损预测压缩的误差进行量化,通过消除视觉心理冗余,达到对图像进一步压缩的目的。n算法的演变a)无损预测压缩的基础是:n 原图像值fn与预测值fn之间的误差en。有公式:en=fn fnn 解码与编
15、码使用相同的预测器。6.5 有损预测编码n编码en=fn fn+-符号符号编码编码预测器预测器最接近最接近的整数的整数压缩图像压缩图像输入图像输入图像enfn fn m fn(x,y)=roundif(x,y-i)i=1/m i=1 6.5 有损预测编码n解码 fn=en+fn+符号符号解码解码预测器预测器解压缩图像解压缩图像压缩图像压缩图像enfn fn 6.5 有损预测编码n算法的演变b)有损预测的演变:将en量化:n=Q(en);用fn=n +fn近似fn编码:n=Q(fn-fn)解码:fn=n +fn 6.5 有损预测编码n有损预测编码 n=Q(fn-fn)+-符号符号编码编码预测器预
16、测器压缩图像压缩图像输入图像输入图像enfn fn量化器量化器n 6.5 有损预测编码n有损预测解码 fn=n +fn+符号符号解码解码预测器预测器解压缩图像解压缩图像压缩图像压缩图像 fn fnn 6.5 有损预测编码n有损预测编码n上述方案的压缩编码中,预测器的输入是fn,而解压缩中的预测器的输入是fn,要使用相同的预测器,编码方案要进行修改。6.5 有损预测编码n修改后的有损预测编码n=Q(fn-fn)+-符号符号编码编码预测器预测器压缩图像压缩图像输入图像输入图像enfn fn量化器量化器n+fn fn=n +fn 6.5 有损预测编码nDM(Delta modulation)有损预测
17、编码n量化器和预测器的定义:n量化器+en 0 是一个正常数-其它 en用1位编码 n预测器fn=fn-1 一般是一个小于1的预测系数 en=5.5 有损预测编码nDM(Delta modulation)有损预测编码n量化器+6.5-6.5ee 6.5 有损预测编码nDM(Delta modulation)有损预测编码n举例:=1,=6.5 输入 编码 解码误差n f f e e f f f f-f0 14 -14.0 -14.0 0.01 15 14.0 1.0 6.5 20.5 14.0 20.5 -5.52 14 20.5-6.5-6.5 14.0 20.5 14.0 0.03 15 1
18、4.0 1.0 6.5 20.5 14.0 20.5 -5.5.14 29 20.5 8.5 6.5 27.0 20.5 27.0 2.015 37 27.0 10.0 6.5 33.5 27.0 33.5 3.516 47 33.5 13.5 6.5 40.0 33.5 40.0 7.017 62 40.0 22.0 6.5 46.5 40.0 46.5 15.5 6.5 有损预测编码nDM(Delta modulation)有损预测编码n举例:=1,=6.5 计算:n=0,f0=f0=14,n=1,f1=(1)(14)=14,e1=15 14=1,e1=+6.5(因为e1 0),f1=6.
19、5+14=20.5,(重构结果)f1-f1=(15 20.5)=5.5(重构误差)6.5 有损预测编码nDM(Delta modulation)有损预测编码n算法分析 粒状噪音粒状噪音溢出过载溢出过载 6.5 有损预测编码nDM(Delta modulation)有损预测编码n算法分析n在n=14到19变化快的区域,太小以至不能表示输入的最大的变化,发生一个被称为溢出过载的失真。n在n=0到7相对平滑的区域,太大以至不能表示输入的最小变化,出现了粒状噪音。n在大多数图像中,这两种现象导致对象边缘的钝化和平滑区域表面粒状的失真。6.5 有损预测编码nDM(Delta modulation)有损预
20、测编码n算法分析n在所有有损预测压缩中都会出现误差。误差的严重程度取决于使用的量化方法和预测方法之间的相互作用。n尽管存在这种相互作用,定义预测函数时仍然假定没有量化误差,而定义量化函数时仅是尽可能地降低它自身的误差,即量化函数和预测函数是分别定义的。6.6 变换编码n变换编码的基本思想(1)用一个可逆的、线性的变换(如傅立叶变换),把图像映射到变换系数集合(2)然后对该系数集合进行量化和编码(3)对于大多数自然图像,重要系数的数量是比较少的,因而可以用量化(或完全抛弃),且仅以较小的图像失真为代价。6.6 变换编码n变换编码的基本思想举例 原始图像相应的DCT系数52 55 61 66 70
21、 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 7079 65 60 70 77 68 58 7585 71 64 59 55 61 65 8387 79 69 68 65 76 78 94-415-29-6225 55-20-1 3 7 -21-629 11-7 -6 6-46 8 77 -25 -30 10 7-5-50 13 35 -15 -9 6 0 3 11 -8 -13 -2 -1 1 -4 1-10 1 3 -3
22、-1 0 2-1-4 -1 2 -1 2-3 1-2-1 -1 -1 -2 -1-1 0-1 6.6 变换编码n变换编码的基本思想n编码、解码流程符号符号解码器解码器逆向变换逆向变换正向变换正向变换量化器量化器符号符号编码器编码器构造构造nxn的子图的子图合成合成nxn的子图的子图输入图像输入图像NxN压缩图像压缩图像压缩的图像压缩的图像解压图像解压图像 6.6 变换编码n变换编码的基本思想n构造nxn的子图NxNnxnnxnnxnnxnnxnnxn6.6 变换编码n变换编码的基本理论n变换编码的基本原理n将傅立叶逆变换表达式进行改写:F(u,v)改为:T(u,v)expj2(ux+vy)/n
23、改为:h(x,y,u,v)n-1 n-1 有:f(x,y)=T(u,v)h(x,y,u,v)u=0 v=0变换压缩的基本思想,就是要用等式的右部近似原图像6.6 变换编码n变换编码的基本理论n变换编码的基本原理进一步改写 n-1 n-1 F=T(u,v)Huv u=0 v=0其中:1)F是一个包含了f(x,y)的象素的nxn的矩阵;2)Huv的值只依赖坐标变量x,y,u,v与T(u,v)和f(x,y)的值无关。被称为基图像。可以在变换前一次 生成。对每一个 nxn的子图变换都可以使用。6.6 变换编码n变换编码的基本理论n基图像H h(0,0,u,v)h(0,1,u,v)h(0,n-1,u,v
24、)h(1,0,u,v)h(1,1,u,v)h(1,n-1,u,v)Huv=h(n-1,0,u,v)h(n-1,1,u,v)h(n-1,n-1,u,v)6.6 变换编码n变换编码的基本理论n变换系数截取模板函数通过定义变换系数截取模板函数,消去冗余 0 如果T(u,v)满足一个特定的截断标准m(u,v)=1 否则 n-1 n-1对于:F=T(u,v)Huv u=0 v=01 1 1 1 0 0 0 01 1 1 1 0 0 0 01 1 1 0 0 0 0 01 1 0 0 0 0 0 01 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0
25、 0 0 06.6 变换编码n变换编码的基本理论n变换系数截取模板函数 对于u,v=0,1,n-1,F的一个近似,可以从截断表达式获得:n-1 n-1 F=T(u,v)m(u,v)Huv u=0 v=0 其中m(u,v)被构造,用来消去对等式的总合贡献最小的基本图像。6.6 变换编码n实现变换压缩算法的主要问题n变换的选择n子图尺寸的选择n压缩的位分配(编码)正向变换正向变换量化器量化器符号符号编码器编码器构造构造nxn的子图的子图输入图像输入图像NxN压缩图像压缩图像6.6 变换编码n变换压缩方法主要研究的问题n变换的选择(1)可以选择的变换1)Karhunen-Loeve变换(KLT)2)
26、离散傅立叶变换(DFT)F(u,v)=1/N f(x,y)exp-j2(ux+vy)/Nu,v=0,1,2,.N-1,并且f(x,y)=F(u,v)expj2 (ux+vy)/N x,y=0,1,2,.N-16.6 变换编码n变换的选择3)离散余弦变换(DCT)C(u,v)=(u)(v)f(x,y)cos(2x+1)u/2N cos(2y+1)v/2N f(x,y)=(u)(v)C(u,v)cos(2x+1)u/2N cos(2y+1)v/2N4)Walsh-Hadamard变换(WHT)5)小波变换6.6 变换编码n变换的选择(2)对变换的评价按信息封装能力排序:KLT,DCT,DFT,WH
27、T,HaarT 但KLT的基图像是数据依赖的,每次都要重新计算Huv。因而很少使用。DFT的块效应严重。常用的是DCT,已被国际标准采纳,作成芯片。其优点有:1)基本没有块效应 2)信息封装能力强,把最多的信息封装在最少的系数中6.6 变换编码n变换压缩方法主要研究的问题n子图尺寸的选择子图尺寸的选择有两个原则:1)如果n是子图的维数,n应该是2的整数次方。为便于降低计算复杂度。2)n一般选为8x8或16x16。由实践得到:3)随着n的增加,块效应相应减少。6.6 变换编码n变换压缩方法主要研究的问题n压缩位的分配定义:截取、量化、系数编码统称为位分配解决m(u,v)的设计、编码问题截取和量化
28、一般有两种方法:(1)子带编码(2)阈值编码(适应性编码)6.6 变换编码n压缩位的分配(1)子带编码n基本思想:所有子图像使用相同的编码模板因为,大部分的信息应该包含在最大方差的变换系数中。每一个DCT变换系数被认为是一个随机变量,该变量的分布可以在所有变换子图像的集合上进行计算。找出取最大方差的m个系数的位置,并同时确定系数的坐标u和v,对所有子图像,这m个系数的T(u,v)值是保留的,其他的T值被抛弃。其中m是一个可选常数。6.6 变换编码1)方差本身可以直接由(N/n)2个变换子图像数组的集合计算得到。2)或者基于一个假想的图像模型得到。3)根据最大方差的分布情况得到系数截取模板4)方
29、差最大的地方置1,其它地方置01 1 1 1 1 0 0 01 1 1 1 0 0 0 01 1 1 0 0 0 0 01 1 0 0 0 0 0 01 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0消去87.5%的系数的模板为6.6 变换编码n算法实现:1)计算模板:方差最大的地方置1,其它地方置02)量化系数:例如最优Lloyd-Max量化器3)结果编码:有两种分配二进制位的编码方法:1系数被赋予相同数量的二进制位2系数之间固定地分配一定的二进制位6.6 变换编码n压缩位的分配系数之间固定地分配一定的二进制位的用位模板8
30、 7 6 4 3 2 1 07 6 5 4 3 2 1 06 5 4 3 3 1 1 04 4 3 3 2 1 0 03 3 3 2 1 1 0 02 2 1 1 1 0 0 01 1 1 0 0 0 0 00 0 0 0 0 0 0 06.6 变换编码n压缩位的分配(2)阈值编码(适应性编码)n基本思想:没有一个消取系数的固定模板。不同的子图保留不同的系数。通过一个阈值T,来决定一个系数的去留。If a(系数)T(阈值)m(u,v)=1Else m(u,v)=0n由于其简单性,阈值编码是实际应用中更常使用的编码方法。6.6 变换编码n压缩位的分配(2)阈值编码(适应性编码)n理论根据:1)取
31、值最大的变换系数,在重构子图的质量中起的作用也最重要。2)最大系数的分布随子图的不同而不同。1 1 0 1 0 0 0 01 1 1 1 0 0 0 01 1 0 0 0 0 0 01 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 06.6 变换编码n压缩位的分配(2)阈值编码(适应性编码)n算法实现思想:a.阈值的选取,常有三种取法。1)所有子图使用同一个全局阈值。压缩率的大小随图像的不同而不同。由超过全局阈值的系数的个数所决定6.6 变换编码n压缩位的分配(2)阈值编码(适应性编码)n算法实现
32、思想:a.阈值的选取,常有三种取法。2)对每个子图使用不同的阈值。每个子图保留的系数的个数事先确定,即总保留N个最大的。称为N-最大化编码。对于每个子图同样多的系数被丢弃。因此,每个子图的压缩率是相同的,并且是预先知道的。6.6 变换编码(2)阈值编码(适应性编码)n算法实现思想:a.阈值的选取,常有三种取法。3)阈值作为子图系数位置的函数。所有子图使用同一个全局阈值模板,但阈值的取值,与系数的位置相关,阈值模板给出了,不同位置上系数的相应阈值。6.6 变换编码(2)阈值编码(适应性编码)n算法实现思想:b.对系数的编码 a)将系数按45度对角顺序展开成序列,得 到有一个有长串为零的序列。例:
33、-19-20 5 21 6 0 0 0 0 0 0 0 0 0 b)用RLE编码对上述序列编码。6.6 变换编码n压缩位的分配n(2)阈值编码(适应性编码)n对系数编码的展开顺序0 1 5 6 14 15 27 282 4 7 13 16 26 29 423 8 12 17 25 30 41 43 9 11 18 24 31 40 44 5310 19 23 32 39 45 52 5420 22 33 38 46 51 55 6021 34 37 47 50 56 59 6135 36 48 49 57 58 62 63 6.7图像压缩标准n图像标准的制定:是在ISO(国际标准化组织)和CC
34、ITT(国际电报电话咨询委员会)联合组织下进行制定的n标准的类型(三类):n二值图像压缩标准:(1)面向传真而设计n连续调图像压缩标准:静止帧黑白、彩色压缩:(2)面向静止的单幅图像连续帧黑白、彩色压缩:(3)面向连续的视频影像 6.7图像压缩标准n连续调图像压缩标准n静止帧黑白、彩色压缩(JPEG)n连续帧单色、彩色压缩(MPEG)6.7图像压缩标准nJPEG标准简述有三种压缩系统:(1)基线编码系统:面向大多数有损压缩的应用,采用DCT变换压缩。(2)扩展编码系统:面向递进式应用,从低分辨 率到高分辨率逐步递进传递的应用(3)独立编码系统:面向无损压缩的应用,采用无损 预测压缩,符号编码采
35、用哈夫曼或算术编码一个产品或系统必须包括对基线系统的支持。6.7图像压缩标准nJPEG压缩流程符号符号解码器解码器DCT逆向变换逆向变换DCT正向变换正向变换量化器量化器符号符号编码器编码器构造构造8x8的子图的子图合成合成8x8的子图的子图输入图像输入图像NxN压缩图像压缩图像压缩的图像压缩的图像解压图像解压图像颜色颜色空间空间转换转换零偏置零偏置转换转换颜色颜色空间空间转换转换零偏置零偏置转换转换 6.7图像压缩标准n构造子图像子图像尺寸:8 x 8n颜色空间转换 人眼对亮度更敏感,提取亮度特征,将RGB转换为YCbCr模型,编码时对亮度采用特殊编码:Y =0.299R+0.5870G+0
36、.1140BCb=0.1787R 0.3313G+0.5000B+128Cr=0.5000R 0.4187G 0.0813B+128颜色解码:R=Y+1.40200(Cr 128)G=Y 0.34414(Cb 128)0.71414(Cr 128)B=Y+1.77200(Cb 128)6.7图像压缩标准n零偏置转换n对于灰度级是2n的像素,通过减去2n-1,替换像素本身n对于n=8,即将0255的值域,通过减去128,转换为值域在-128127之间的值n目的:使像素的绝对值出现3位10进制的概率大大减少 6.7图像压缩标准 用8x8的JEPG基线标准,压缩并重构下列子图525561667061
37、64736359669010985697262596811314410466736358711221541067069676168104126886870796560707768587585716459556165838779696865767894 6.7图像压缩标准0偏置转换后-76-73-67-62-58-67-64-55-65-69-62-38-19-43-59-56-66-69-60-1516-24-62-55-65-70-57-626-22-58-59-61-67-60-24-2-40-60-58-49-63-68-58-51-65-70-53-43-57-64-69-73-67-
38、63-45-41-49-59-60-63-52-50-34 6.7图像压缩标准n频域变换n频域变换产生64个系数,第一个系数称为直流系数(DC系数),其余的63个系数称为交流系数(AC系数)。6.7图像压缩标准正向DCT变换(N=8)后变成-415-29-62 25 55-20-1 3 7-21-62 9 11-7-6 6-46 8 77-25-30 10 7-5-50 13 35-15-9 6 0 3 11-8-13-2-1 1-4 1-10 1 3-3-1 0 2-1-4-1 2-1 2-3 1-2-1-1-1-2-1-1 0-1 6.7图像压缩标准n系数量化n采用阈值作为子图系数位置函数
39、的量化方式 所有子图使用同一个全局阈值模板,但阈值的取值,与系数的位置相关,阈值模板给出了,不同位置上系数的相应阈值。n对于亮度和颜色使用不同的量化阈值模板,并取整 6.7图像压缩标准n系数量化1)正向量化:Squv=round(Suv/Quv)其中:Suv是DCT系数,Quv量化模板系数2)逆向量化:Ruv=Squv Quv例:Sq(0,0)=round-415/16 =round-25.9=-26 Ruv(0,0)=-26*16=-416 6.7图像压缩标准 亮度的量化模板系数16 111016244051611212141926586055141316244057695614172229
40、51878062182237566810910377243555648110411392496478871031211201017292959811210010399 6.7图像压缩标准 颜色的量化模板系数17 182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999 6.7图像压缩标准量化变换后的数组,比例化并消去系数-26-3-6 2 2000 1-2-4 0 0000-3 1 5-1-1000-
41、4 1 2-1 0000 1 0 0 0 0000 0 0 0 0 0000 0 0 0 0 0000 0 0 0 0 0000 6.7图像压缩标准n符号编码n将量化后的系数,按之字形重新排序成矢量,全零结尾用特殊符号EOB-26-3 1-3-2-6 2-4 1-4 1 1 5 0 2 0 0-1 2 0 0 0 0 0-1-1 EOBnDC和AC用不同的方式分别编码nDC的编码方式(预测+统计):编码由两部分组成:区间号编码(SSSS)+系数预测误差本身编码(VVVV)6.7图像压缩标准n连续帧单色、彩色压缩n连续帧图像的定义n连续帧图像压缩的基本思想n帧间运动补偿预测编码技术nH.261标
42、准nMPEG1/2/4/7标准 6.7图像压缩标准n连续帧图像的定义n由多幅尺寸相同的静止图像组成的图像序列,被称为连续帧图像。n与静止帧图像相比,连续帧图像多了一个时间轴,成为三维信号,因此连续帧图像也被称为三维图像。6.7图像压缩标准n连续帧图像压缩的基本思想n基于如下基本假设:n在各连续帧之间存在简单的相关性平移运动。n一个特定画面上的像素量值:1)可以根据同帧附近像素来加以预测,被称为:帧内编码技术2)可以根据附近帧中的像素来加以预测,被称为:帧间编码技术 6.7图像压缩标准n连续帧图像压缩的基本思想n通过减少帧间图像数据冗余,来达到减少数据量、压缩连续帧图像体积的目的。n将连续帧图像
43、序列,分为参考帧和预测帧,参考帧用静止图像压缩方法进行压缩,预测帧对帧差图像进行压缩。由于帧差图像的数据量大大小于参考帧的数据量,从而可以达到很高的压缩比。6.7图像压缩标准n帧间运动补偿预测编码技术n帧间预测编码+-熵编码熵编码帧间帧间预测器预测器运动补偿运动补偿压缩图像块压缩图像块输入图像块输入图像块enfn fn运动补偿预测帧间误差图像运动补偿预测帧间误差图像运动补偿预测图像运动补偿预测图像 6.7图像压缩标准n帧间运动补偿预测编码技术n帧间预测编码n向前预测n双向预测前一帧前一帧当前帧当前帧前一帧前一帧当前帧当前帧下一帧下一帧 6.7图像压缩标准n帧间运动补偿预测编码技术n帧间预测编码
44、nI 帧n不进行预测、进行帧内编码的编码帧(参考帧)nP帧n通过向前预测得到的误差编码帧nB帧n通过双向预测得到的误差编码帧n因图像序列存放在存储器中,可以使用下一帧 6.7图像压缩标准n帧间运动补偿预测编码技术n编码中的运动补偿n运动补偿概念是以对帧间运动的估算为基础的,若物体均在空间上有一位移,那么用有限的运动参数来对帧间的运动加以描述,如对于像素的平移运动,可用运动矢量来描述。n一个来自前一编码帧的运动补偿预测像素,就能给出一个当前像素的最佳预测。预测误差和运动矢量一同参与编码。6.7图像压缩标准n帧间运动补偿预测编码技术n编码中的运动补偿n由于一些运动矢量之间的空间相关性通常较高,因此
45、,一个像素的运动矢量,可以代表一个相邻像素块的运动。n实现中,画面一般划分成一些不连接的像素块(在MPEGl和MPEG2标准中一个像素块为1616像素),对于每一个这样的像素块,只估算一个运动矢量。6.7图像压缩标准n帧间运动补偿预测编码技术n编码中的运动补偿n举例:常用的基于块的运动估算和补偿块匹配法K帧K+l 帧块查找窗口 6.7图像压缩标准nH.261263标准nH.261263标准是由CCITT制定的nccitt 国际电话与电报咨询委员会,它现在被称为 itu-t(国际标准化组织电讯标准化分部),是世界上主要的制定和推广电讯设备和系统标准的国际组织.它位于瑞士的geneva.6.7图像
46、压缩标准nH.261标准n应用范围:ISDN的视频会议n主要编码技术:nDCT变换n向前运动补偿预测nZig-zag排序n霍夫曼编码 6.7图像压缩标准nH.263标准n应用范围:可视电话n主要编码技术:nDCT变换n双向运动补偿预测nZig-zag排序n霍夫曼编码 6.7图像压缩标准nMPEG1/2/4/7标准nMPEG1/2/4/7标准由ISO/IEC制定的nISO是国际标准化组织nIEC是国际电工委员会,是非政府性国际组织,是世界上成立最早的专门国际标准化机构。正式成立于1906 年。6.7图像压缩标准nMPEG1标准n应用范围:视频CD_ROM存储、视频消费n主要编码技术:nDCT变换
47、n前向、双向运动补偿预测nZig-zag排序n霍夫曼编码、算术编码n每15帧至少要有一个I帧 6.7图像压缩标准nMPEG2标准n应用范围:数字电视、高质量视频、有线电视、视频编辑、视频存储n主要编码技术:nDCT变换n前向、双向运动补偿预测nZig-zag排序n霍夫曼编码、算术编码n每15帧至少要有一个I帧 6.7图像压缩标准nMPEG4标准n应用范围:互联网、交互视频、移动通信n主要编码技术:nDCT变换、小波变换n前向、双向运动补偿预测nZig-zag排序n脸部动画、背影编码n霍夫曼编码、算术编码n每15帧至少要有一个I帧 6.7图像压缩标准n二值图像压缩标准n基本思想n一维压缩n二维压
48、缩nCCITT Group3nCCITT Group4 6.7图像压缩标准n基本思想:n采用行程编码与静态的哈夫曼编码相结合n由于是二值图像,不用为灰度值编码。n只给行程长度编码,且黑和白的长度分别使用不同的编码。n按行压缩nCCITT Group3采用一维编码与二维编码结合nCCITT Group4采用二维编码 6.7图像压缩标准n一维压缩 基本思想:1)每一行行首、尾编码n行首:用一个白行程码开始。如果行首是黑像素,则 用零长度的白00110101开始。n行尾:用行尾编码字(EOL)000000000001结束。2)图像首、尾编码n图像首行:用一个EOL开始。n图像结尾:用连续6个EOL结
49、束。3)图像内部编码n内部编码:长度小于63的用哈夫曼编码,大于63的用组合编码:大于63的长度+小于63的余长度 6.7图像压缩标准长度小于63的哈夫曼编码行程长度 白编码黑编码000110101000011011110001110102011111310001041011011511000011610011001000000101101062001100110000011001106300110100000001011011 6.7图像压缩标准长度大于63的组合编码 行程长度 白编码黑编码641101100000011111281001000001100100019201011100001
50、100100125601101110000010110113200011011000000011001138400110111000000110100160001001101000000010110111664011000000000110010017280100110110000001100101 6.7图像压缩标准nCCITTGroup3基本思想:nGroup3标准应用了一种非适应的,一维和二维混合的行程编码技术n在该编码中,每一个K行组的最后K-1行(K=2或4),有选择地用二维编码方式。6.7图像压缩标准nCCITTGroup4基本思想:nGroup4标准是Group3标准简化或改进版