《第五章图像编码PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第五章图像编码PPT讲稿.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章图像编码第1页,共42页,编辑于2022年,星期三2022/10/1925.4 预测编码预测编码1)基本思想图像相邻像素间存在很强的相关性,通过观察其相邻像素取值,可以预测一个像素的大概情况。预测值和实际值存在误差,称为预测误差。预测误差的方差必然比原图像像素的方差小,因此对预测误差进行编码必然压缩其平均码长。第2页,共42页,编辑于2022年,星期三2022/10/1935.4 预测编码预测编码2)预测误差的熵编码对比一幅图像和其差分图像的标准差和熵。LennaLenna差分图象差分图象第3页,共42页,编辑于2022年,星期三2022/10/194 预测编码的基本原理预测编码的基本原
2、理 v由于量化和传送的仅是误差信号,根据一般扫描图像信号在空间及时间邻域内个象素的相关性,预测误差分布更加集中,即熵值比原来图象小,可用较少的单位象素比特率进行编码,使得图象数据得以压缩。第4页,共42页,编辑于2022年,星期三2022/10/195 DPCM工作原理工作原理第5页,共42页,编辑于2022年,星期三2022/10/1963)DPCM预测编码预测器的阶数对当前像素进行预测的像素集合中的像素个数,称为预测器的阶数。理论上预测器的阶数越大越好,当阶数大于3时其性能的改变非常有限。预测器的系数如一个3阶预测器中,各像素的权重称为预测器的系数。其既可以固定不变,也可以变化。第6页,共
3、42页,编辑于2022年,星期三2022/10/197其它预测方法有:1.前值预测,用同一行中邻近前面一象素预测,即2.一维预测,用同一行中前面若干象素预测;3.二维预测,用几行内象素预测;4.三维预测,利用相邻两帧图像信号的相关性预测。第7页,共42页,编辑于2022年,星期三2022/10/1985.5 变换编码(1)熵保持。正交变换具有熵保持性质,即正交变换不丢失信息,从而通过传输变换系数来传送信息。(2)能量保持性质。(3)能量重新分配与集中。在质量允许的情况下,可舍弃一些能量较小的系数。(4)去相关特性。正交变换可以使高度相关的空间图像值变为相关性很弱的变换系数。第8页,共42页,编
4、辑于2022年,星期三2022/10/199举例设x1和x2是相邻的两个像素点,灰度级为8第9页,共42页,编辑于2022年,星期三变换方法压缩编码变换方法压缩编码频域方法的基础:频域方法的基础:通过可逆的线性变换将图像映射为一组变换系数,达通过可逆的线性变换将图像映射为一组变换系数,达到能量集中的目的,从而舍弃能量很小的系数,达到到能量集中的目的,从而舍弃能量很小的系数,达到压缩的目的。压缩的目的。频域方法的优点:压缩比高,视觉效果好频域方法的优点:压缩比高,视觉效果好第10页,共42页,编辑于2022年,星期三2022/10/1911频域方法的处理流程:频域方法的处理流程:构造子图构造子图
5、像像正变换正变换重新量化重新量化符号编码符号编码合并子图像合并子图像符号解码符号解码反变换反变换输入图像输入图像压缩图像压缩图像压缩图像压缩图像解压图像解压图像第11页,共42页,编辑于2022年,星期三2022/10/1912子图像尺寸的选择变换方法的选择比特分配方法变换编码中的主要问题:第12页,共42页,编辑于2022年,星期三1.子图像尺寸的选择原则子图像尺寸的选择影响到编码误差和计算的复杂度,实际中应考虑1.相邻子图像之间的相关性(冗余)降低到可接受的水平2.子图像的长和宽均为 2 的整数次幂一般情况下,压缩量和计算复杂度随子图像尺寸增加而增加,常用的尺寸为 88 和 1616。分块
6、的好处:计算速度快;误差扩散小第13页,共42页,编辑于2022年,星期三2.2.变换方法的选择变换方法的选择 压缩并不是在变换步骤取得的,而是在量化变换的系数时取得压缩并不是在变换步骤取得的,而是在量化变换的系数时取得的。因此变换的能量集中特性影响了压缩效果。的。因此变换的能量集中特性影响了压缩效果。单就信息集中能力而言,单就信息集中能力而言,K-LK-L变换最强,但计算复杂,与输变换最强,但计算复杂,与输入图像相关。入图像相关。DCTDCT在信息集中与计算复杂度方面具有较好的综合性能,得到广在信息集中与计算复杂度方面具有较好的综合性能,得到广泛应用。泛应用。第14页,共42页,编辑于202
7、2年,星期三2022/10/1915 对变换系数的重新量化,要通过保留较大系数,舍弃对变换系数的重新量化,要通过保留较大系数,舍弃较小的系数而达到压缩目的,因此其截断误差与两个因素较小的系数而达到压缩目的,因此其截断误差与两个因素有关:有关:舍弃的变换系数的数量和相对重舍弃的变换系数的数量和相对重要性要性3.3.比特分配方法比特分配方法 (变换系数截断、量化与符号编码方法变换系数截断、量化与符号编码方法的选择的选择)所保留系数的表示精度所保留系数的表示精度为确定那些系数需要保留,可以选择采用下面的准则:为确定那些系数需要保留,可以选择采用下面的准则:准则准则1 1:分区编码方法:分区编码方法准
8、则准则2 2:阈值编码方法:阈值编码方法第15页,共42页,编辑于2022年,星期三2022/10/19162 2)阈值采样)阈值采样阈值采样不是选择固定的采样区域,而是根据变换系数得方差的大小来决定阈值采样不是选择固定的采样区域,而是根据变换系数得方差的大小来决定是否选择该变换系数,也就是说,若某个系数的方差(或幅值)超过给是否选择该变换系数,也就是说,若某个系数的方差(或幅值)超过给定的阈值,则对该系数进行量化与编码否则,略去该变换系数。定的阈值,则对该系数进行量化与编码否则,略去该变换系数。n n 1 1)区域采样)区域采样第16页,共42页,编辑于2022年,星期三JPEGJPEG压缩
9、编码方法介绍压缩编码方法介绍 JPEG JPEG是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算法法(DCT(DCT和和DPCM)DPCM),并考虑了人眼的视觉特性,在量化和无损压缩编码方面综,并考虑了人眼的视觉特性,在量化和无损压缩编码方面综合权衡,达到较大的压缩比合权衡,达到较大的压缩比(25:1(25:1以上以上)。JPEGJPEG既适用于既适用于灰度图像灰度图像也适用于也适用于彩色图彩色图像像。JPEG JPEG 有几种模式,其中最常用的是基于有几种模式,其中最常用的是基于DCTDCT变换的顺序式模式,又称变换的顺序式模式
10、,又称为基本系统。为基本系统。JPEG JPEG 的压缩的压缩编码大致分成编码大致分成三个步骤三个步骤:1.1.使用正向离散余弦变换使用正向离散余弦变换(f forward orward d discrete iscrete c cosine osine t transformransform,FDCTFDCT)把空间域表示的图变换成频率域表示的图。把空间域表示的图变换成频率域表示的图。2.2.使用加权函数对使用加权函数对DCTDCT系数进行量化,这个加权函数对于人的视觉系统是最系数进行量化,这个加权函数对于人的视觉系统是最佳的。佳的。3.3.使用霍夫曼可变字长编码器对量化系数进行编码。使用霍
11、夫曼可变字长编码器对量化系数进行编码。第17页,共42页,编辑于2022年,星期三JPEGJPEG基本系统的算法框图:基本系统的算法框图:第18页,共42页,编辑于2022年,星期三具体讲:具体讲:JPEGJPEG压缩编码算法的主要计算步骤如下:压缩编码算法的主要计算步骤如下:1.1.正向离散余弦变换正向离散余弦变换(FDCT)(FDCT)。2.2.量化量化(quantization)(quantization)。3.3.Z Z 字形编码字形编码(zig-zag scan)(zig-zag scan)。4.4.使用差分脉冲编码调制使用差分脉冲编码调制(d differential iffere
12、ntial p pulse ulse c code ode mmodulationodulation,DPCM)DPCM)对直流对直流系数系数(DC)(DC)进行编码。进行编码。5.5.使用行程长度编码使用行程长度编码(r run-un-l length ength e encodingncoding,RLE)RLE)对交流系数对交流系数(AC)(AC)进行编码。进行编码。6.6.熵编码熵编码(entropy coding)(entropy coding)。第19页,共42页,编辑于2022年,星期三2022/10/1920一、正向离散余弦变换一、正向离散余弦变换(FDCT)(FDCT)的算法
13、与特性:的算法与特性:(1)(1)对每个单独的彩色图像分对每个单独的彩色图像分量,把整个分量图像分成量,把整个分量图像分成8888的图像块,并作为两维的图像块,并作为两维离散余弦变换离散余弦变换DCTDCT的输入。的输入。通过通过DCTDCT变换,把能量集变换,把能量集中在少数几个系数上。中在少数几个系数上。f(i,j)f(i,j)F(u,vF(u,v)DCTDCTDCTDCT第20页,共42页,编辑于2022年,星期三(2)DCT(2)DCT变换公式:变换公式:C(u),C(v)C(u),C(v)=1/=1/,当当u,vu,v=0=0;C(u),C(v)C(u),C(v)=1,=1,其他。其
14、他。f(i,j)f(i,j)经经DCTDCT变换之后,变换之后,F(0,0)F(0,0)是直流系数,其他为交流系数。是直流系数,其他为交流系数。第21页,共42页,编辑于2022年,星期三2022/10/1922(3)(3)在计算中,可将两维的在计算中,可将两维的DCTDCT变换变成变换变成一维的一维的DCTDCT变换:变换:第22页,共42页,编辑于2022年,星期三(4)DCT(4)DCT变换后,变换后,F(0,0)F(0,0)是直流系数,其它为交流系数是直流系数,其它为交流系数F(u,vF(u,v)F(0,0)F(0,0)考虑到整幅图像中各个子图像的平均亮度接近,考虑到整幅图像中各个子图
15、像的平均亮度接近,因此将各子图像的直流系数取出单独组合编码。而将因此将各子图像的直流系数取出单独组合编码。而将交流系数按交流系数按 Z Z 字形顺序排列,组成符号流。字形顺序排列,组成符号流。DCDC第23页,共42页,编辑于2022年,星期三二、量化问题:二、量化问题:量化是对量化是对DCTDCT变换后的频率系数重新进行量化,以减少非零系数的数目。量化变换后的频率系数重新进行量化,以减少非零系数的数目。量化是图像降质的主要原因。是图像降质的主要原因。对于有损压缩算法,对于有损压缩算法,JPEGJPEG算法使用均匀量化器进行量化,量化步距是按照系数所算法使用均匀量化器进行量化,量化步距是按照系
16、数所在的位置和每种颜色分量的色调值来确定。由于人眼对低频分量的图像比对高频分量的在的位置和每种颜色分量的色调值来确定。由于人眼对低频分量的图像比对高频分量的图像更敏感,因此变换图像中左上角的量化步距要比右下角的量化步距小。图像更敏感,因此变换图像中左上角的量化步距要比右下角的量化步距小。第24页,共42页,编辑于2022年,星期三2022/10/1925 考虑人眼对亮度信号比对色差信号更敏感,以及亮考虑人眼对亮度信号比对色差信号更敏感,以及亮度和色差的能量集中情况不同,分别使用了两种量化表:度和色差的能量集中情况不同,分别使用了两种量化表:亮度量化表亮度量化表 色差量化表色差量化表161110
17、1624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399 两种量化两种量化表都考虑了表都考虑了人眼的视觉人眼的视觉特性。特性。17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999亮度量化
18、表亮度量化表色差量化表色差量化表第25页,共42页,编辑于2022年,星期三三、三、Z Z 字形编排:字形编排:量化后的系数要分成两组,各子块的直流系数重新组合,而子块内的交流系数量化后的系数要分成两组,各子块的直流系数重新组合,而子块内的交流系数重新编排,以增加连续的重新编排,以增加连续的“0 0”系数的个数,即系数的个数,即“0 0”系数的游程长度,方法是按照系数的游程长度,方法是按照 Z Z 字形的式样编排。将字形的式样编排。将 88 88 的矩阵变成的矩阵变成 1 1 64 64 的矢量,频率较低的系数放在矢的矢量,频率较低的系数放在矢量的顶部。量的顶部。636258574948363
19、5615956504737342160555146383322205452453932231910534440312418119434130251712834229261613742282715146510编排顺序编排顺序第26页,共42页,编辑于2022年,星期三例如:例如:150-100000-2-1000000-1-1000000000000000000000000000000000000000000000012第27页,共42页,编辑于2022年,星期三四、直流系数的编码方法:四、直流系数的编码方法:88 88 图像块经过图像块经过 DCT DCT 变换之后得到的直流系数有两个特点:变
20、换之后得到的直流系数有两个特点:根据这些特点,根据这些特点,JPEGJPEG算法使用了差分脉冲调制编码算法使用了差分脉冲调制编码(DPCM)(DPCM)技术,对相邻图像块之间技术,对相邻图像块之间量化量化DCDC系数的差值系数的差值(DeltaDelta)进行编码,进行编码,DeltaDeltaDC(0,0)DC(0,0)k k-DC(0,0)-DC(0,0)k-1k-1qq系数的数值比较大系数的数值比较大qq相邻相邻 88 88 图像块的图像块的 D CD C系数值变化不大系数值变化不大第28页,共42页,编辑于2022年,星期三2022/10/1929 重新量化的重新量化的ACAC系数的特
21、点是系数的特点是 163 163 矢量中包含有许多矢量中包含有许多“0 0”系数,并且许多系数,并且许多“0 0”是连续的,因此使用非常简单和直观的游程长度编码是连续的,因此使用非常简单和直观的游程长度编码(RLE)(RLE)对它们进行编码。对它们进行编码。五、交流系数的编码方法五、交流系数的编码方法六、熵编码:六、熵编码:JPEG JPEG 使用使用熵编码熵编码对对DPCMDPCM编码后的直流编码后的直流 DC DC 系数和系数和 RLE RLE 编码后的交流编码后的交流 AC AC 系数系数作进一步的压缩。作进一步的压缩。第29页,共42页,编辑于2022年,星期三JPEGJPEG图例:图
22、例:原图原图压缩压缩9.29.2倍倍第30页,共42页,编辑于2022年,星期三JPEGJPEG图例:图例:压缩压缩18.418.4倍倍原图原图第31页,共42页,编辑于2022年,星期三JPEGJPEG图例:图例:压缩压缩27.627.6倍倍原图原图第32页,共42页,编辑于2022年,星期三JPEGJPEG图例:图例:压缩压缩55.255.2倍倍原图原图第33页,共42页,编辑于2022年,星期三2022/10/19345.6 混合编码混合编码实现的可能性及有效性:回顾一下讲过的几个内容的特点1.行程编码:擅长于重复数字的压缩。2.Huffman编码:擅长于像素个数的不同编码。3.DCT变
23、换:擅长将高频部分分离出来。第34页,共42页,编辑于2022年,星期三2022/10/19355.6 混合编码例:aaaa bbb cc d eeeee fffffff (共22*8=176 bits)4 3 2 1 5 7 行程编码:4a3b2c1d5e7f (共6*(8+3)=66Bits)176 66第35页,共42页,编辑于2022年,星期三2022/10/19365.6 混合编码 aaaa bbb cc d eeeee fffffff (共22*8=176 bits)4 3 2 1 5 7 Huffman编码:f=01 e=11 a=10 b=001 c=0001 d=0000 1
24、010101010001001001000100010000111111111101010101010101 (共 7*2+5*2+4*2+3*3+2*4+1*4=53 bits)176 66 53第36页,共42页,编辑于2022年,星期三2022/10/19375.6 混合编码 aaaa bbb cc d eeeee fffffff (共22*8=176 bits)4 3 2 1 5 7 Hufman与行程编码混合:41030012000110000511701(共:3+2+3+3+3+4+3+4+3+2+3+2=35 bits)176 66 53 35第37页,共42页,编辑于2022年
25、,星期三2022/10/1938例:例:有图像有图像 f(x,y)f(x,y),如右图所示,灰阶为,如右图所示,灰阶为 3 bit3 bit,即,即0 07 7,比较几种不同编,比较几种不同编码的效果码的效果5.6 5.6 通过映射变换达到压缩编码通过映射变换达到压缩编码0011111122333333444444445555555566667777777777777777777777777777 直接将图像传输:直接将图像传输:图像的熵:图像的熵:H H2.47 bit2.47 bit总码长为总码长为364364192 bit192 bit平均码长为平均码长为 R R3 bit3 bit编码
26、效率:编码效率:h h 82.3%82.3%第38页,共42页,编辑于2022年,星期三2022/10/19392 2 采用采用 HuffmanHuffman 编码编码编码灰度概率重排1重排2重排3重排4重排5重排6728/6428282828283658/64881216202848/64888121636/64688816/6466864/644622/64302/641 100100101001000000000000100010110011001110011100111101111总码长为总码长为 160 bit160 bit平均码长:平均码长:R R160/64160/642.5 b
27、it2.5 bit编码效率:编码效率:h h 98.8%98.8%第39页,共42页,编辑于2022年,星期三2022/10/19403 3 先用差分映射进行变换,再用先用差分映射进行变换,再用 HuffmanHuffman 编码编码差分映射差分映射:差分映射可以按行或按列进行,按行差分映射可以按行或按列进行,按行映射公式为:映射公式为:y y0 0=x=x0 0y y1 1=x=x0 0-x-x1 1y y2 2=x=x1 1-x-x2 2 y yi i=x=xi i1 1-x-xi i00-10000020-10000040000000500000006000-10007000000070
28、00000070000000映射得到的差分图像如右上图所示映射得到的差分图像如右上图所示输入数据对应概率054/6473/6413/6461/6451/6441/6421/64差分图像的灰度概率如右表所示差分图像的灰度概率如右表所示第40页,共42页,编辑于2022年,星期三2022/10/1941编码灰度概率重排1重排2重排3重排4重排5054/64545454545473/6433461013/64333461/6422351/641241/64121/64对差分图像采用对差分图像采用 HuffmanHuffman 编码的结果如下:编码的结果如下:0 0100100101101111011
29、10111111111100110011011101总码长为总码长为 88 bit88 bit平均码长:平均码长:R R88/6488/641.375 bit1.375 bit可见,经过差分映射后再进行编码,可以有效压缩编码数据。可见,经过差分映射后再进行编码,可以有效压缩编码数据。第41页,共42页,编辑于2022年,星期三习题设有一幅设有一幅88图像,其灰度级分布见图所示图像,其灰度级分布见图所示。(1)对该图像进行)对该图像进行Huffman编码,并计算编码效率和压缩比;编码,并计算编码效率和压缩比;(2)对该图像的差分图像进行)对该图像的差分图像进行Huffman编码,并计算编码效率和压编码,并计算编码效率和压缩比;缩比;第42页,共42页,编辑于2022年,星期三