《图像信息处理技术讲稿.ppt》由会员分享,可在线阅读,更多相关《图像信息处理技术讲稿.ppt(438页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第4 4章章 图像信息处理技术图像信息处理技术 关于图像信息处理技关于图像信息处理技术术第一页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 4.1 图像信号概述图像信号概述 图像是一种可视化的信息,图像信号是图像信息的理论描述方法,图像信号按其内容变化与时间的关系来分,主要包括静态图像和动态图像两种。静态图像其信息密度随空间分布,且相对时间为常量;动态图像也称时变图像,其空间密度特性是随时间而变化的。人们经常用静态图像的一个时间序列来表示一个动态图像。第二页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 图像分类还可以按其他方式进行:如按其亮
2、度等级的不同可分为二值图像和灰度图像;按其色调的不同可分为黑白图像和彩色图像;按其所占空间的维数不同可分为平面的二维图像和立体的三维图像等等。图像信号的记录、存储和传输可以采用模拟方式或数字方式。传统的方式为模拟方式,例如,目前我们在电视上所见到的图像就是以一种模拟电信号的形式来记录,并依靠模拟调幅的手段在空间传播的。将模拟图像信号经A/D变换后就得到数字图像信号,数字图像信号便于进行各种处理,例如最常见的压缩编码处理就是在此基础上完成的。本书介绍的图像信息处理技术就是针对数字图像信号的。第三页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 1 彩色图像信号的分量表示
3、对于黑白图像信号,每个像素点用灰度级来表示,若用数字表示一个像素点的灰度,有8比特就够了,因为人眼对灰度的最大分辨力为26。对于彩色视频信号(例如常见的彩色电视信号)均基于三基色原理,每个像素点由红(R)、绿(G)、蓝(B)三基色混合而成。若三个基色均用8比特来表示,则每个像素点就需要24比特,由于构成一幅彩色图像需要大量的像素点,因此,图像信号采样、量化后的数据量就相当大,不便于传输和存储。第四页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 为了解决此问题,人们找到了相应的解决方法:利用人的视觉特性降低彩色图像的数据量,这种方法往往把RGB空间表示的彩色图像变换到其
4、他彩色空间,每一种彩色空间都产生一种亮度分量和两种色度分量信号。常用的彩色空间表示法有YUV、YIQ和YCbCr等。第五页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 (1)YUV彩色空间。通常我们用彩色摄像机来获取图像信息,摄像机把彩色图像信号经过分色棱镜分成R0、G0、B0三个分量信号,分别经过放大和r校正得到RGB,再经过矩阵变换电路得到亮度信号Y和色差信号U、V,其中亮度信号表示了单位面积上反射光线的强度,而色差信号(所谓色差信号,就是指基色信号中的三个分量信号R、G、B与亮度信号之差)决定了彩色图像信号的色调。最后发送端将Y、U、V三个信号进行编码,用同一信
5、道发送出去,这就是在PAL彩色电视制式中使用的YUV彩色空间。YUV与RGB彩色空间变换的对应关系如式(4.1-1)所示。第六页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 YUV彩色空间的一个优点是,它的亮度信号Y和色差信号U、V是相互独立的,即Y信号分量构成的黑白灰度图与用U、V两个色彩分量信号构成的两幅单色图是相互独立的。因为YUV是独立的,所以可以对这些单色图分别进行编码。此外,利用YUV之间的独立性解决了彩色电视机与黑白电视机的兼容问题。BGRVUY100.0515.0615.0436.0289.0147.0114.0587.0299.0(4.1-1)第七页
6、,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 YUV表示法的另一个优点是,可以利用人眼的视觉特性来降低数字彩色图像的数据量。人眼对彩色图像细节的分辨能力比对黑白图像细节的分辨能力低得多,因此就可以降低彩色分量的分辨率而不会明显影响图像质量,即可以把几个相同像素不同的色彩值当做相同的色彩值来处理(即大面积着色原理),从而减少了所需的数据量。在PAL彩色电视制式中,亮度信号的带宽为4.43 MHz,用以保证足够的清晰度,而把色差信号的带宽压缩为1.3 MHz,达到了减少带宽的目的。第八页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 在数字图像处理
7、的实际操作中,就是对亮度信号Y和色差信号U、V分别采用不同的采样频率。目前常用的Y、U、V采样频率的比例有4 2 2和4 1 1,当然,根据要求的不同,还可以采用其他比例。例如要存储R G B8 8 8的彩色图像,即R、G、B分量都用8比特表示,图像的大小为640480像素,那么所需要的存储容量为64048038/8921 600字节;如果用Y U V4 1 1来表示同一幅彩色图像,对于亮度信号Y,每个像素仍用8比特表示,而对于色差信号U、V,每4个像素用8比特表示,则存储量变为640480(8+4)/8460 800字节。尽管数据量减少了一半,但人眼察觉不出有明显变化。第九页,讲稿共四百三十
8、八页哦第第4 4章章 图像信息处理技术图像信息处理技术 (2)YIQ彩色空间。在NTSC彩色电视制式中选用YIQ彩色空间,其中Y表示亮度,I、Q是两个彩色分量。I、Q与U、V是不相同的。人眼的彩色视觉特性表明,人眼对红、黄之间颜色变化的分辨能力最强;而对蓝、紫之间颜色变化的分辨能力最弱。在YIQ彩色空间中,色彩信号I表示人眼最敏感的色轴,Q表示人眼最不敏感的色轴。在NTSC制式中,传送人眼分辨能力较强的I信号时,用较宽的频带(1.31.5 MHz);而传送人眼分辨能力较弱的Q信号时,用较窄的频带(0.5 MHz)。YIQ与RGB彩色空间变换的对应关系如式(4.1-2)所示。第十页,讲稿共四百三
9、十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 BGRQIY311.0523.0212.0321.0275.0596.0114.0587.0299.0(4.1-2)第十一页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 (3)YCbCr彩色空间。YCbCr彩色空间是由ITU-R(国际电联无线标准部,原国际无线电咨询委员会CCIR)制定的彩色空间。按照CCIR601-2标准,将非线性的RGB信号编码成YCbCr,编码过程开始是先采用符合SMPTE-CRGB(它定义了三种荧光粉,即一种参考白光,应用于演播室监视器及电视接收机标准的RGB)的基色作为r校正信号。第十
10、二页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 非线性RGB信号很容易与一个常量矩阵相乘而得到亮度信号Y和两个色差信号Cb、Cr。YCbCr通常在图像压缩时作为彩色空间,而在通信中是一种非正式标准。YCbCr与RGB彩色空间变换的对应关系如式(4.1-3)所示,可以看到:数字域中的彩色空间变换与模拟域中的彩色空间变换是不同的。128128081.0419.0500.0500.0331.0169.0114.0587.0299.0RCCYrb(4.1-3)第十三页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 2 彩色图像信号的分量编码 通过图像
11、信号的表示方法的讨论可以看到:对于彩色图像信号数字压缩编码,可以采用两种不同的编解码方案。一种是复合编码,它直接对复合图像信号进行采样、编码和传输;另一种是分量编码,它首先把复合图像中的亮度和色度信号分离出来,然后分别进行取样、编码和传输。目前分量编码已经成为图像信号压缩的主流,在20世纪90年代以来颁布的一系列图像压缩国际标准中均采用分量编码方案。以YUV彩色空间为例,分量编码系统的基本框图如图4.1-1所示,其中对亮度信号Y使用较高的采样频率,对色差信号U、V则使用较低的采样频率。第十四页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 图4.1-1 彩色图像信号分量
12、编码系统的基本框图 复合视频信号RBG编 码数据流亮色分离YVUA/D变换A/D变换A/D变换映射变换量化编码第十五页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 4.2 图像信号数字化图像信号数字化 图像信号数字化与音频数字化一样主要包括两方面的内容:取样和量化。图像在空间上的离散化称为取样,即使空间上连续变化的图像离散化,也就是用空间上部分点的灰度值来表示图像,这些点称为样点(或像素,像元,样本)。一幅图像应取多少样点呢?其约束条件是:由这些样点采用某种方法能够正确重建原图像。第十六页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 取样的方
13、法有两类:一类是直接对表示图像的二维函数值进行取样,即读取各离散点上的信号值,所得结果就是一个样点值阵列,所以也称为点阵取样;另一类是先将图像函数进行正交变换,用其变换系数作为取样值,故称为正交系数取样。对样点灰度级值的离散化过程称为量化,也就是对每个样点值数字化,使其和有限个可能电平数中的一个对应,即使图像的灰度级值离散化。量化也可分为两种:一种是将样点灰度级值等间隔分档取整,称为均匀量化;另一种是将样点灰度级值不等间隔分档取整,称为非均匀量化。第十七页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 4.2.1 取样点数和量化级数的选取 假定一幅图像取MN个样点,对样
14、点值进行Q级分档取整。那么对M,N和Q如何取值呢?首先,M,N,Q一般总是取2的整数次幂,如Q=2b,b为正整数,通常称为对图像进行b比特量化,M、N可以相等,也可以不相等。若取相等,则图像距阵为方阵,分析运算方便一些。其次,关于M、N和b(或Q)数值大小的确定。对b来讲,取值越大,重建图像失真越小。若要完全不失真地重建原图像,则b必须取无穷大,否则一定存在失真,即所谓的量化误差。第十八页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 一般供人眼观察的图像,由于人眼对灰度分辨能力有限,用58比特量化即可。对MN的取值主要依据取样的约束条件。也就是在MN大到满足取样定理的
15、情况下,重建图像就不会产生失真,否则就会因取样点数不够而产生所谓混淆失真。为了减少表示图像的比特数,应取MN点数刚好满足取样定理。这种状态的取样即为奈奎斯特取样。MN常用的尺寸有512512,256256,6464,3232等。第十九页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 再次,在实际应用中,如果允许表示图像的总比特数MNb给定,对MN和b的分配往往是根据图像的内容和应用要求以及系统本身的技术指标来选定的。例如,若图像中有大面积灰度变化缓慢的平滑区域如人图像的特写照片等,则MN取样点可以少些,而量化比特数b多些,这样可使重建图像灰度层次多些。若b太少,在图像平
16、滑区往往会出现“假轮廓”。第二十页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 反之,对于复杂景物图像,如群众场面的照片等,量化比特数b可以少些,而取样点数MN要多些,这样就不会丢失图像的细节。究竟MN和b如何组合才能获得满意的结果很难讲出一个统一的方案,但是有一点是可以肯定的:不同的取样点数和量化比特数组合可以获得相同的主观质量评价。第二十一页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 *4.2.2 点阵取样 在分析取样和重建图像时,往往认为取样系统的输入图像是一个确定的图像场,即为确知函数,如一幅照片或胶片。但是在某些情况下,如电视图像
17、由于噪声影响和取样方式变化,把这种取样看成是二维随机过程的取样更为有益,当然实际取样还有一些问题要注意。第二十二页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 1.确定图像场的点阵取样原理 对理想取样而言,其取样函数为空间抽样函数 S(x,y),离散形式可表示为),(),(yjyxixyxSji(4.2-1)函数的取样阵列如图4.2-1所示。第二十三页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 图4.2-1 函数的取样阵列 xy第二十四页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 令fI(x,y)代表一理想的无限
18、大连续图像场,其点阵取样方法就是用空间抽样函数S(x,y)和连续图像函数fI(x,y)相乘。设fS(x,y)表示取样后的图像,理想取样数学模型如图4.2-2所示。图4.2-2 理想取样数学模型 乘法 器fI(x,y)S(x,y)fS(x,y)重 建)(y,xf第二十五页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 由此可以得到),()(),(),(),(),(),(yjyxixyjxifyjyxixyxfyxSyxfyxfIjijiIIS(4.2-2)第二十六页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 式中,连续函数fI(x,y)移入求和
19、式内变为离散形式fI(ix,jy),表明只是在取样点(ix,jy)上计值。根据二维傅立叶变换卷积定理,可以得到频域关系式为yxujuiuyxuuuFuFSjiI22),(4),(),(),(41),(22(4.2-3)式中 第二十七页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 假定理想图像的频谱是有限的,截止频率为uc和vc,根据函数的筛选性质对式(4.2-3)进一步运算可以得式(4.2-4)和如图4.2-3所示的取样图像频谱示意图。),(1),(juiuFyxuFIjiS(4.2-4)第二十八页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术
20、 图4.2-3 取样图像频谱示意图 ucuuv(a)(b)xu2yv2Fs(u,v)F(u,v)v第二十九页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 由式(4.2-4)和图4.2-3可以看出,取样图像频谱是原图像频谱在频域中的无穷多个重复。重复频谱之间间隔u和v取决于取样间隔x和y的大小,只要选取合适的x、y,就能保证u、v等于或大于原图像截止频率2uc、2vc,那么各个重复频谱之间就不会重叠。在这种情况下,选用合适的二维重建滤波器,就可以取出一个完整的原图像频谱(即除所有i,j0的频谱成分),再由二维傅立叶反变换获得和原图像一样的重建图像 。),(yxf第三十页
21、,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 取样正确与否的原则是能否由取样图像不失真地重建原图像,而正确取样的关键是取样间隔x、y的选择,因此保证正确取样的条件是yxuuucc2222因为(4.2-5)第三十一页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 所以 ccccyuxyux2222则(4.2-6)第三十二页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 满足式(4.2-5)和式(4.2-6)中“等于”条件的取样称为奈奎斯特取样。满足两式中大于条件的取样称为过取样,而不满足上述两条件的取样称为欠取样。在欠取样
22、情况下,会产生混淆失真。混淆失真是取样中应注意的一个重要问题。防止出现混淆失真的办法,从理论上讲,若已知原图像频谱的最高频率成分,则使用过取样或奈奎斯特取样,而不要使用欠取样;第三十三页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 但若不知道原图像频谱的最高频率成分,则应先采用已知截止频率的低通滤波器预先过滤图像,限制其高频率成分,再针对低通滤波器截止频率进行过取样或奈奎斯特取样。在实际取样系统中,取样脉冲宽带效应相当于一个低通滤波器,另外光学系统的透镜散焦,孔阑衍射也都可以等效为低通滤波器的作用,尽管会引起图像模糊降质,但对防止混淆失真却是有好处的。第三十四页,讲稿
23、共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 2.随机图像场取样 实际图像往往有噪声,这种附加有噪声的确定图像场可以认为是随机图像场,因此这里简单介绍一下随机图像场的取样。),(),(),(2211yxfyxfERIIyxfI式中,x=x1-x2;y=y1-y2。第三十五页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 用狄拉克取样函数S(x,y)对这个随机过程进行取样所获得的取样场为),(),(),(),(),(yjyxixyxfyxSyxfyxfjiIIS(4.2-8)因而取样场的自相关函数为),;,(),(),(),(),(),;,(21212
24、21122112121yyxxSyxfyxfEyxfyxfEyyxxRSISSfS (4.2-9)第三十六页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 根据狄拉克函数性质:两个狄拉克函数相乘还是一个狄拉克函数,即 S(x1,y1)S(x2,y2)=S(x1-x2,y1-y2)=S(x,y)(4.2-10)将式(4.2-7)和式(4.2-10)代入式(4.2-9)即可得),(),(),(yxyxIyxfSRfRS第三十七页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 对上式两边取二维傅立叶变换,根据傅氏变换定理得),(),(41),(2uuF
25、uFISff(4.2-11)),(4),(2jxiuFyxuFISfjif(4.2-12)第三十八页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 图4.2-4 有噪声图像的取样(一维示意图)u信 号 谱噪 声 谱u取 样 信 号 谱u取 样 噪 声 谱u第三十九页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 4.2.3 图像信号量化 经过取样的图像只是在空间上被离散为像素(样本)的阵列,而每一个样本灰度值还是一个有无穷多个取值的连续变化量,必须将其转化为有限个离散值,赋予不同码字才能真正成为数字图像,再由计算机或其他数字设备进行处理运算,这样
26、的转化过程称为量化。将样本连续灰度等间隔分层量化方式称为均匀量化,不等间隔分层量化方式称为非均匀量化。量化既然以有限个离散值来近似表示无限多个连续量,就一定会产生误差,这就是所谓的量化误差。第四十页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 由此产生的失真叫量化失真或量化噪声,对均匀量化来讲,量化分层越多,量化误差越小,但编码时占用比特数就越多。在一定比特数下,为了减少量化误差,往往要用非均匀量化,如按图像灰度值出现的概率大小不同进行非均匀量化,即对灰度值经常出现的区域进行细量化,反之进行粗量化。在实际图像系统中,由于存在着成像系统引入的噪声及图像本身的噪声,因此量
27、化等级取得太多(量化间隔太小)是没有必要的,因为如果噪声幅度值大于量化间隔,量化器输出的量化值就会产生错误,得到不正确的量化。第四十一页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 在应用屏幕显示其输出图像时,灰度邻近区域边界会出现“忙动”现象。假设噪声是高斯分布,均值为0,方差为2,在有噪声情况下,最佳量化层选取有两种方法,一是令正确量化的概率大于某一个值,二是使量化误差的方差等于噪声方差。针对输出图像是专供人观察评价的应用,研究出了一些按人的视觉特性进行非均匀量化方式,如图像灰度变化缓慢部分细量化,而图像灰度变化快的细节部分粗量化,这是由于视觉掩盖效应被发现而产生
28、的。再如按人的视觉灵敏度特征进行对数形式量化分层等。第四十二页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 4.3 数字图像压缩方法的分类数字图像压缩方法的分类 图像压缩的基本目标就是减小数据量,但最好不要引起图像质量的明显下降,在大多数实际应用中,为了取得较低的比特率,轻微的质量下降是允许的。至于图像压缩到什么程度而没有明显的失真,则取决于图像数据的冗余度。较高的冗余度形成较大的压缩,而典型的图像信号都具有很高的冗余度,正是这些冗余度的存在允许我们对图像进行压缩。第四十三页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 例如,我们在第2章介绍
29、的空间冗余和时间冗余是图像信号最常见的冗余,所有的这些冗余度都可以被除去而不会引起显著的信息损失,但压缩编码无法减少冗余度。不同的出发点有不同的分类,按照信息论的角度,数字图像压缩方法一般可分为:(1)可逆编码(Reversible Coding 或Information Preserving Coding),也称为无损压缩。这种方法的解码图像与原始图像严格相同,压缩是完全可恢复的或无偏差的,无损压缩不能提供较高的压缩比。第四十四页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 (2)不可逆编码(Non-Reversible Coding),也称为有损压缩。用这种方法恢
30、复的图像较原始图像存在一定的误差,但视觉效果一般是可接受的,它可提供较高的压缩比。第四十五页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 按照压缩方法的原理,数字图像压缩方法可分为:(1)预测编码(Predictive Coding)。预测编码是一种针对统计冗余进行压缩的方法,它主要是减少数据在空间和时间上的相关性,达到对数据的压缩,是一种有失真的压缩方法。预测编码中典型的压缩方法有DPCM和ADPCM等,它们比较适合于图像数据的压缩。第四十六页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 (2)变换编码(Transform Coding)。
31、变换编码也是一种针对统计冗余进行压缩的方法。这种方法将图像光强矩阵(时域信号)变换到系数空间(频域)上进行处理。常用的正交变换有DFT(离散傅氏变换)、DCT(离散余弦变换)、DST(离散正弦变换)、哈达码变换和Karhunen-Loeve变换。第四十七页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 (3)量化和矢量量化编码(Vector Quantization)。量化和矢量量化编码本质上也还是一种针对统计冗余进行压缩的方法。当我们对模拟量进行数字化时,必然要经历一个量化的过程。在这里量化器的设计是一个很关键的步骤,量化器设计的好坏对于量化误差的大小有直接的影响。矢
32、量量化是相对于标量量化而提出的,如果我们一次量化多个点,则称为矢量量化。第四十八页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 (4)信息熵编码(Entropy Coding)。根据信息熵原理,用短的码字表示出现概率大的信息,用长的码字表示出现概率小的信息。常见的方法有哈夫曼编码、游程编码以及算术编码。(5)子带编码(Sub-band Coding)。子带编码将图像数据变换到频域后,按频率分带,然后用不同的量化器进行量化,从而达到最优的组合。或者是分步渐近编码,在初始时对某一频带的信号进行解码,然后逐渐扩展到所有频带,随着解码数据的增加,解码图像也逐渐地清晰起来。此方
33、法对于远程图像模糊查询与检索的应用比较有效。第四十九页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 (6)结构编码(Structure Coding),也称为第二代编码(Second Generation Coding)。编码时首先求出图像中的边界、轮廓、纹理等结构特征参数,然后保存这些参数信息。解码时根据结构和参数信息进行合成,从而恢复出原图像。(7)基于知识的编码(Knowledge-Based Coding)。对于人脸等可用规则描述图像,利用人们对其的知识形成一个规则库,据此将人脸的变化等特征用一些参数进行描述,从而用参数加上模型就可以实现人脸的图像编码与解码。
34、图像压缩算法的总体框图如图4.3-1所示。第五十页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 图4.3-1 图像压缩算法的总体框图 无 失 真 压 缩(熵 编 码)有 失 真压 缩哈 夫 曼 编 码、香 农 编 码、LZW 编 码、游 程 编 码、算 术 编 码 预 测 编 码:点 线 性 预 测、帧 内 预 测、帧 间 预 测 变 换 编 码:KL、DFT、DCT、DST、HADAMARD、小 波 量 化 编 码:标 量 量 化、矢 量 量 化 子 带 编 码:子 带 编 码、块 切 割 法 模 型 编 码:结 构 模 型、知 识 基 模 型 混 合 编 码:H.
35、261、JPEG、MPEG、H.263等 等图像压缩算法第五十一页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 下面几节主要介绍几种常见的压缩编码方法:信息熵编码方法(如哈夫曼编码、游程编码和算术编码)、预测编码和变换编码,并介绍新一代编码方法(如知识基编码和分形编码)等以及相关知识。由于矢量量化编码和子带编码方法在上一章中结合音频编码已经介绍,它们在应用于图像时原理基本相同,这里不再赘述。第五十二页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 4.4 典型的熵编码方法典型的熵编码方法 4.4.1 基本概念 1 图像熵和平均码字长度 1)图像
36、熵(Entropy)设数字图像像素灰度级集合为(W1,W2,Wk,,WM),其对应的概率分别为P1,P2,Pk,PM。按信息论中信源信息熵定义,数字图像的熵H为第五十三页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 由此可见,一幅图像的熵就是这幅图像的平均信息量度,也是表示图像中各个灰度级比特数的统计平均值。式(4.4-1)所表示的熵值是在假定图像信源无记忆(即图像的各个灰度级不相关)的前提下获得的,这样的熵值常称为无记忆信源熵值,记为H0()。对于有记忆信源,假如某一像素灰度级与前一像素灰度级相关,那么公式(4.4-1)中的概率要换成条件概率P(Wi/Wi-1)和联
37、合概率P(Wi,Wi-1),则图像信息熵公式变为)(1bitIbPPHkkMk(4.4-1)第五十四页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 式中,P(Wi,Wi-1)=P(Wi)P(Wi/Wi-1),则称H(Wi/Wi-1)为条件熵。因为只与前面一个符号相关,故称为一阶熵H1()。如果与前面两个符号相关,求得的熵值就称为二阶熵H2()。依此类推可以得到三阶和四阶等高阶熵,并且可以证明 H0()H1()H2()H3())/()/()/(11111iiiiMkMkiiWWIbWWPWWH(4.4-2)第五十五页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术
38、图像信息处理技术 香农信息论已证明:信源熵是进行无失真编码的理论极限。低于此极限的无失真编码方法是不存在的,这是熵编码的理论基础。而且可以证明,如果考虑像素间的相关性,使用高阶熵一定可以获得更高的压缩比。第五十六页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 2)平均码字长度 设k为数字图像第k个码字Ck的长度(二进制代数的位数),其相应出现的概率为Pk,则该数字图像所赋予的码字平均长度R为)(1bitPRkkMk(4.4-3)第五十七页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 3)编码效率在一般情况下,编码效率往往用下列简单公式表示%R
39、H(4.4-4)式中,H为信源熵,R为平均码字长度。第五十八页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 根据信息论中信源编码理论,可以证明在RH条件下总可以设计出某种无失真编码方法。若编码结果使R远大于H,表明这种编码方法效率很低,占用比特数太多。例如对图像样本量化值直接采用PCM编码,其结果平均码字长度R就远比图像熵H大。若编码结果使R等于或很接近于H,这种状态的编码方法称为最佳编码。它既不丢失信息而引起图像失真,又占用最少的比特数,例如下面要介绍的哈夫曼编码即属于最佳编码方法。第五十九页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 若
40、要求编码结果RH,则必然丢失信息而引起图像失真。这就是在允许失真条件下的一些失真编码方法。熵编码的目的就是要使编码后的图像平均比特数R尽可能接近图像熵H。一般是根据图像灰度级数出现的概率大小赋予不同长度的码字,概率大的灰度级用短码字,反之,用长码字。可以证明,这样的编码结果所获得的平均码字长度最短。这就是下面要介绍的变长最佳编码定理。第六十页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 2.变长最佳编码定理 【定理】在变长编码中,对出现概率大的信息符号赋予短码字,而对于出现概率小的信息符号赋予长码字。如果码字长度严格按照所对应符号出现概率大小逆序排列,则编码结果平均码
41、字长度一定小于任何其他排列方式。这个定理就是下面要介绍的哈夫曼编码方法的理论基础。设图像灰度级为W1,W2,Wi,WN;各灰度级出现的概率分别为P1,P2,Pi,PN;第六十一页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 编码所赋予的码字长度分别为t1,t2,ti,tN;则编码后图像平均码字长度R应为iiNitPR1第六十二页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 再令严格按照定理规则进行编码,其结果平均码字长度为R1;R2为将其中任两个灰度级不按定理规则编码(即概率大的灰度级赋予长码字。反之,用短码字),而其他所有灰度级仍按定理规则
42、编码所得的图像平均码字长度,那么R2应等于R1加上“不按定理规则编码所增加的平均码字长度”R。只要证明R大于0,即可以证明上述定理。第六十三页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 3.可变长最佳编码的平均码字长度 设可变长编码所用码元进制为D,被编码的信息符号总数为N,第i个符号出现的概率为Pi,与其对应的码字长度为ti,则可以证明这种编码结果平均码字长度R落在下列区间内1IbDHRIbDH第六十四页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 式中,由此可以引导出对某一信息符号存在下式iiNiIbPPH11IbDIbPtIbDIbP
43、iii(4.4-5)对二进制码进一步简化为 -lbPiti-lbPi+1 (4.4-6)第六十五页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 4.惟一可译编码 有些情况下,为了减少表示图像的平均码字长度,往往对码字之间不加同步码。但是,这样就要求所编码字序列能被惟一地译出来。满足这个条件的编码称为惟一可译编码,也常称为单义可译码。单义可译码往往是采用非续长代码。第六十六页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 1)续长代码和非续长代码 若代码中任何一个码字都不是另一个码字的续长,也就是不能在某一码字后面添加一些码元而构成另一个码字,称
44、其为非续长代码。反之,称其为续长代码。如二进制代码0,10,11即为非续长代码,而0,01,11则为续长代码。因为码字01可由码字“0”后加上一个码元“1”构成。第六十七页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 2)单义代码 在介绍单义代码前,先简单介绍一下克劳夫特(Kraft)不等式:若信源符号有m种取值,其码字长度分别为li(i=1,2,,m);又设最长的码字长度为L,码元种类(即多少进制码)为D,长度为li的码字占用了 个长度为L的码字,也就是必须有 LlLmiDDi1对于二进制,则有 ilLD121ilmi。第六十八页,讲稿共四百三十八页哦第第4 4章章
45、 图像信息处理技术图像信息处理技术 任意有限长的码字序列,只能被惟一地分割成一个个码字,则这样的码字序列称为单义代码。单义代码的充要条件是满足克劳夫特(Kraft)不等式11itniD(4.4-7)式中,D为代码中码元种类,对于二进制D2;n为代码中码字个数;ti为代码中第i个码字的长度(即码元个数)。第六十九页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 如代码C00,10,001,101,因为是二进制码,则D2,共有4个码字C100、C210、C3001、C4101,其相应的长度为t1=2、t2=2、t3=3、t4=3,代入式(4.4-7)可得1862121212
46、1233221itti第七十页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 4.4.2 哈夫曼(Huffman)编码方法 哈夫曼编码是根据可变长度最佳编码定理,应用哈夫曼算法而产生的一种编码方法。在具有相同输入概率集合的前提下,它的平均码字长度比其他任何一种惟一可译码都小,因此,也常称其为紧凑码。下面以一个具体的例子来说明其编码方法,如图4.4-1所示。第七十一页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 图4.4-1 哈夫曼(Huffman)编码的示例 输入图像灰度级W1W2W3W4W5W6W7W8灰度级出现概率0.40(1)0.18(0
47、01)0.10(0000)0.07(0100)0.06(0101)0.05(00010)0.04(00011)(1)0.10(011)第一步0.40(1)0.18(001)0.10(011)0.10(0000)0.09(0001)0.07(0100)0.06(0101)第二步0.40(1)0.18(001)0.13(010)0.10(011)0.10(0000)0.09(0001)第三步0.40(1)0.19(000)0.18(001)0.13(010)0.10(011)第四步0.40(1)0.23(01)0.19(000)0.18(001)第五步0.40(1)0.37(00)0.23(01)
48、第六步0.60(0)0.40(1)(2)(3)配分字码第七十二页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 1.编码步骤 (1)先将输入灰度级按出现的概率由大到小顺序排列(对概率相同的灰度级可以任意颠倒排列位置)。(2)将最小两个概率相加,形成一个新的概率集合。再按第(1)步方法重排(此时概率集合中概率个数已减少一个)。如此重复进行,直到只有两个概率为止。第七十三页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 (3)分配码字。码字分配从最后一步开始反向进行,对最后两个概率一个赋予“1”码,一个赋予“0”码。如概率0.60赋予“0”码,0.4
49、0赋予“1”码(也可以将0.60赋予“1”码,0.40赋予“0”码)。如此反向进行到开始的概率排列。在此过程中,若概率不变,则仍用原码字。如图4.4-1中第六步中概率0.40到第五步中仍用“1”码。若概率分裂为两个,其码字前几位码元仍用原来的。码字的最后一位码元一个赋予“0”码元,另一个赋予“1”码元。如图中第六步中概率0.60到第五步中分裂为0.37和0.23,则所得码字分别为“00”和“01”。第七十四页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 2.前例哈夫曼编码的编码效率计算 根据式(4.4-1)求出前例信源熵为55.2)04.004.005.005.006
50、.006.007.007.01.01.0218.018.04.04.0(81IbIbIbIbIbIbIbIbPPHiii根据式(4.4-3)求出平均码字长度为第七十五页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 61.2504.0505.0406.0407.0410.0310.0318.014.081iiiPR根据式(4.4-4)求出编码效率为%8.9761.255.2RH可见哈夫曼编码效率很高。第七十六页,讲稿共四百三十八页哦第第4 4章章 图像信息处理技术图像信息处理技术 *4.4.3 游程编码 在图像中,尤其是一些不太复杂的图像和计算机生成的图像中,往往存在着