《第3章图像编码PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第3章图像编码PPT讲稿.ppt(75页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第3 3章图像编码章图像编码第1页,共75页,编辑于2022年,星期一3.1 3.1 图像编码基础图像编码基础 3.1.1 图像压缩编码的必要性图像压缩编码的必要性3.1.2 图像压缩编码的可能性图像压缩编码的可能性3.1.3 图像压缩编码的分类图像压缩编码的分类3.1.4 图像压缩编码的评价图像压缩编码的评价第2页,共75页,编辑于2022年,星期一3.1.1 图像压缩编码的必要性图像压缩编码的必要性 图图像像编编码码与与压压缩缩从从本本质质上上来来说说就就是是对对要要处处理理的的图图像像源源数数据据按按一一定定的的规规则则进进行行变变换换和和组组合合,从从而而达达到到以以尽尽可可能能少少
2、的的代代码码(符符号号)来来表表示示尽尽可可能能多多的数据信息。的数据信息。压压缩缩通通过过编编码码来来实实现现,或或者者说说编编码码带带来来压压缩缩的的效果,所以一般把此项处理称为压缩编码。效果,所以一般把此项处理称为压缩编码。第3页,共75页,编辑于2022年,星期一3.1.2 图像压缩编码的可能性图像压缩编码的可能性一般来说,图像数据中存在以下几种冗余。一般来说,图像数据中存在以下几种冗余。(1 1)空间冗余(像素间冗余、几何冗余)。)空间冗余(像素间冗余、几何冗余)。(2 2)时间冗余。)时间冗余。(3 3)信息熵冗余。)信息熵冗余。(4 4)结构冗余。)结构冗余。(5 5)知识冗余。
3、)知识冗余。(6 6)心理视觉冗余。)心理视觉冗余。第4页,共75页,编辑于2022年,星期一3.1.3 图像压缩编码的分类图像压缩编码的分类 图像编码压缩的方法目前有很多,其分类方图像编码压缩的方法目前有很多,其分类方法根据出发点不同而有差异。法根据出发点不同而有差异。(1 1)根据解压重建后的图像和原始图像之)根据解压重建后的图像和原始图像之间是否有误差,图像编码压缩分为无损(亦称无间是否有误差,图像编码压缩分为无损(亦称无失真、无误差、信息保持型)编码和有损(有失失真、无误差、信息保持型)编码和有损(有失真、有误差、信息非保持型)编码两大类。真、有误差、信息非保持型)编码两大类。第5页,
4、共75页,编辑于2022年,星期一 (2 2)根据编码原理,图像压缩编码分为熵)根据编码原理,图像压缩编码分为熵编码、预测编码、变换编码和混合编码等。编码、预测编码、变换编码和混合编码等。(3 3)根据图像的光谱特征,图像压缩编码分)根据图像的光谱特征,图像压缩编码分为单色图像编码、彩色图像编码和多光谱图像编码。为单色图像编码、彩色图像编码和多光谱图像编码。(4 4)根据图像的灰度,图像压缩编码分为多)根据图像的灰度,图像压缩编码分为多灰度编码和二值图像编码。灰度编码和二值图像编码。第6页,共75页,编辑于2022年,星期一3.1.4 图像压缩编码的评价图像压缩编码的评价 对对于于图图像像编编
5、码码的的质质量量评评价价主主要要体体现现在在基基于于压压缩缩编编码码参参数数的的评评价价、基基于于保保真真度度(逼逼真真度度)标标准准的的评评价价、算算法法的的适适用用范范围围、算算法法的的复复杂杂度度4 4个方面。个方面。第7页,共75页,编辑于2022年,星期一1基于压缩编码参数的评价基于压缩编码参数的评价(1)信息量、图像的熵与平均码字长度)信息量、图像的熵与平均码字长度第8页,共75页,编辑于2022年,星期一第9页,共75页,编辑于2022年,星期一第10页,共75页,编辑于2022年,星期一(2)编码效率)编码效率第11页,共75页,编辑于2022年,星期一(3)压缩比)压缩比第1
6、2页,共75页,编辑于2022年,星期一(4)冗余度)冗余度第13页,共75页,编辑于2022年,星期一 常常用用的的准准则则可可分分为为两两大大类类:客客观观保保真真准准则则和和主主观保真准则。观保真准则。2基于保真度(逼真度)准则的评价基于保真度(逼真度)准则的评价第14页,共75页,编辑于2022年,星期一(1)客观保真度准则)客观保真度准则第15页,共75页,编辑于2022年,星期一第16页,共75页,编辑于2022年,星期一第17页,共75页,编辑于2022年,星期一第18页,共75页,编辑于2022年,星期一(2)主观保真度准则)主观保真度准则表表表表3-13-1总总总总体体体体优
7、优优优度度度度标标标标准准准准序 号评 估 结 果优良中合格劣第19页,共75页,编辑于2022年,星期一表表表表3-23-2分分分分组优组优组优组优度度度度标标标标准准准准序 号评 估 结 果组内最好比本组中等好比本组中等稍好本组中等比本组中等稍差比本组中等差组内最差第20页,共75页,编辑于2022年,星期一 特定的图像编码算法具有相应的适用范围,特定的图像编码算法具有相应的适用范围,并不对所有的图像都有效。并不对所有的图像都有效。一般来说,大多数基于图像信息统计特性的一般来说,大多数基于图像信息统计特性的压缩算法具有较广的适用范围,而一些特定的编压缩算法具有较广的适用范围,而一些特定的编
8、码算法的适用范围较窄。码算法的适用范围较窄。3算法的适用范围算法的适用范围第21页,共75页,编辑于2022年,星期一 算法的复杂度是指完成图像压缩和解压缩所需算法的复杂度是指完成图像压缩和解压缩所需的运算量和硬件实现该算法的难易程度。的运算量和硬件实现该算法的难易程度。优秀的压缩算法要求有较高的压缩比,压缩和优秀的压缩算法要求有较高的压缩比,压缩和解压缩快,算法简单,易于硬件实现,还要求解压解压缩快,算法简单,易于硬件实现,还要求解压缩后的图像质量较好。缩后的图像质量较好。4算法的复杂度算法的复杂度第22页,共75页,编辑于2022年,星期一3.2 3.2 信息论基础与熵编码信息论基础与熵编
9、码 3.2.1 赫夫曼编码赫夫曼编码3.2.2 香农编码香农编码3.2.3 算术编码算术编码3.2.4 行程编码行程编码 第23页,共75页,编辑于2022年,星期一3.2.1 赫夫曼编码赫夫曼编码 赫夫曼(赫夫曼(HuffmanHuffman)编码是)编码是19521952年提出的,年提出的,是一种比较经典的信息无损熵编码,该编码依是一种比较经典的信息无损熵编码,该编码依据变长最佳编码定理,应用据变长最佳编码定理,应用HuffmanHuffman算法而产生。算法而产生。HuffmanHuffman编码是一种基于统计的无损编码。编码是一种基于统计的无损编码。设信源的信源空间为设信源的信源空间为
10、第24页,共75页,编辑于2022年,星期一第25页,共75页,编辑于2022年,星期一第26页,共75页,编辑于2022年,星期一 从从HuffmanHuffman算法可以看出,算法可以看出,HuffmanHuffman编码具有编码具有如下特点。如下特点。(1 1)HuffmanHuffman编码构造程序是明确的,但编编码构造程序是明确的,但编出的码不是唯一的。出的码不是唯一的。(2 2)HuffmanHuffman编码结果码字不等长。编码结果码字不等长。(3 3)HuffmanHuffman编码的信源概率是编码的信源概率是2 2的负幂时,的负幂时,效率达效率达100%100%;但是对等概率
11、分布的信源却产生定;但是对等概率分布的信源却产生定长码,效率最低。长码,效率最低。(4 4)HuffmanHuffman编码只能用近似的整数而不是编码只能用近似的整数而不是理想的小数来表示单个符号,这也是理想的小数来表示单个符号,这也是HuffmanHuffman编编码无法达到最理想的压缩效果的原因。码无法达到最理想的压缩效果的原因。第27页,共75页,编辑于2022年,星期一3.2.2 香农编码香农编码第28页,共75页,编辑于2022年,星期一3.2.3 算术编码算术编码 算术编码不是将单个信源符号映射成一个码算术编码不是将单个信源符号映射成一个码字,而是把整个信源表示为实数线上的字,而是
12、把整个信源表示为实数线上的0 0到到1 1之间之间的一个区间,其长度等于该序列的概率。的一个区间,其长度等于该序列的概率。再在该区间内选择一个代表性的小数,转再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。化为二进制作为实际的编码输出。第29页,共75页,编辑于2022年,星期一 算术编码具有以下特点。算术编码具有以下特点。(1 1)由于实际的计算机的精度不可能无限长,)由于实际的计算机的精度不可能无限长,因此运算中会出现溢出问题。因此运算中会出现溢出问题。(2 2)算术编码器对整个消息只产生一个码字,)算术编码器对整个消息只产生一个码字,这个码字是在之间的一个实数,因此译码
13、器必须这个码字是在之间的一个实数,因此译码器必须在接收到这个实数后才能译码。在接收到这个实数后才能译码。第30页,共75页,编辑于2022年,星期一3.2.4 行程编码行程编码行行程程编编码码(Run Run Length Length EncodingEncoding,RLERLE)是是一一种种利利用用空空间间冗冗余余度度压压缩缩图图像像的的方方法法,对对某某些些相相同同灰灰度度级级成成片片连连续续出出现现的的图图像像,行行程程编编码码也也是是一一种种高高效效的的编编码码方方法法,特特别别是是对对二二值值图图像像,效效果尤为显著。果尤为显著。第31页,共75页,编辑于2022年,星期一图图图
14、图3-6 3-6 一行一行一行一行图图图图像的行程像的行程像的行程像的行程编码图编码图编码图编码图第32页,共75页,编辑于2022年,星期一第33页,共75页,编辑于2022年,星期一第34页,共75页,编辑于2022年,星期一3.3 3.3 预测编码预测编码 3.3.1 DPCM原理原理3.3.2 最佳线性预测编码最佳线性预测编码3.3.3 自适应预测编码自适应预测编码 第35页,共75页,编辑于2022年,星期一3.3.1 DPCM原理原理1 1差值图像的统计特性差值图像的统计特性 由由图图像像的的统统计计特特性性可可知知,相相邻邻像像素素之之间间有有较较强强的的相相关关性性,即即相相邻
15、邻像像素素的的灰灰度度值值相相同同或或相相近近,因因此此,某某像像素素的的值值可可根根据据以以前前已已知知的的几几个个像像素素值值来估计、猜测。来估计、猜测。第36页,共75页,编辑于2022年,星期一第37页,共75页,编辑于2022年,星期一 预测编码的基本思想是通过仅提取每个像素中预测编码的基本思想是通过仅提取每个像素中的新信息并对它们编码来消除像素间的冗余,这里的新信息并对它们编码来消除像素间的冗余,这里一个像素的新信息定义为该像素的当前或现实值与一个像素的新信息定义为该像素的当前或现实值与预测值的差,即如果已知图像一个像素离散幅度的预测值的差,即如果已知图像一个像素离散幅度的真实值,
16、利用其相邻像素的相关性,预测它的可能真实值,利用其相邻像素的相关性,预测它的可能数值,再求两者差;或者说利用这种具有预测性质数值,再求两者差;或者说利用这种具有预测性质的差值,再量化、编码传输,其效果更佳,这一方的差值,再量化、编码传输,其效果更佳,这一方法就称为法就称为DPCMDPCM法。法。2预测编码的基本原理预测编码的基本原理第38页,共75页,编辑于2022年,星期一图图图图3-10 DPCM3-10 DPCM系系系系统统统统原理框原理框原理框原理框图图图图第39页,共75页,编辑于2022年,星期一第40页,共75页,编辑于2022年,星期一第41页,共75页,编辑于2022年,星期
17、一第42页,共75页,编辑于2022年,星期一3预测编码的类型预测编码的类型第43页,共75页,编辑于2022年,星期一第44页,共75页,编辑于2022年,星期一第45页,共75页,编辑于2022年,星期一第46页,共75页,编辑于2022年,星期一图图图图3-11 3-11 二二二二维预测维预测维预测维预测示意示意示意示意图图图图第47页,共75页,编辑于2022年,星期一3.3.2 最佳线性预测编码最佳线性预测编码第48页,共75页,编辑于2022年,星期一第49页,共75页,编辑于2022年,星期一第50页,共75页,编辑于2022年,星期一第51页,共75页,编辑于2022年,星期一
18、第52页,共75页,编辑于2022年,星期一3.3.3 自适应预测编码自适应预测编码 线性预测编码忽略了像素的个性,它存在以线性预测编码忽略了像素的个性,它存在以下缺点,从而影响图像质量。下缺点,从而影响图像质量。对灰度有突变的地方,会有较大的预测对灰度有突变的地方,会有较大的预测误差,致使重建图像的边缘模糊,分辨率降低。误差,致使重建图像的边缘模糊,分辨率降低。对灰度变化缓慢区域,其差值信号应为对灰度变化缓慢区域,其差值信号应为零,但因其预测值偏大而使重构图像有颗粒噪声。零,但因其预测值偏大而使重构图像有颗粒噪声。第53页,共75页,编辑于2022年,星期一第54页,共75页,编辑于2022
19、年,星期一第55页,共75页,编辑于2022年,星期一3.4 3.4 变换编码变换编码 3.4.1 变换选择变换选择3.4.2 子图像尺寸选择子图像尺寸选择3.4.3 比特分配比特分配3.4.4 DCT编码的编码的MATLAB示例示例 第56页,共75页,编辑于2022年,星期一 图图3-133-13是一个典型的变换编码系统。是一个典型的变换编码系统。编码器执行编码器执行4 4个步骤:子图像分割、变换、量个步骤:子图像分割、变换、量化和编码。化和编码。图图图图3-13 3-13 变换编码变换编码变换编码变换编码系系系系统统统统第57页,共75页,编辑于2022年,星期一 从图从图3-133-1
20、3可见,变换编码并不是一次对整可见,变换编码并不是一次对整幅图像进行变换和编码,而是将图像分成(常幅图像进行变换和编码,而是将图像分成(常用的为用的为8 8或或1616)个子图像后分别处理。)个子图像后分别处理。这是因为:这是因为:(1 1)小块图像的变换计算容易。)小块图像的变换计算容易。(2 2)距离较远的像素之间的相关性比距离)距离较远的像素之间的相关性比距离近的像素之间的相关性小。近的像素之间的相关性小。第58页,共75页,编辑于2022年,星期一3.4.1 变换选择变换选择第59页,共75页,编辑于2022年,星期一第60页,共75页,编辑于2022年,星期一第61页,共75页,编辑
21、于2022年,星期一第62页,共75页,编辑于2022年,星期一 傅立叶变换仅次于最佳变换。傅立叶变换仅次于最佳变换。而且可以证明它渐进地等价于而且可以证明它渐进地等价于KLKL变换。变换。当当趋趋向向无无穷穷大大时时,傅傅立立叶叶变变换换系系数数趋趋于于非非相相关。关。也也就就是是说说,如如果果图图像像尺尺寸寸大大于于像像素素之之间间的的相相关关距距离离,则则傅傅立立叶叶变变换换的的压压缩缩性性能能与与KLKL变变换换将将没没有有多大差别。多大差别。1基于基于FFT的图像压缩技术的图像压缩技术第63页,共75页,编辑于2022年,星期一(1)blkproc函数。函数。第64页,共75页,编辑
22、于2022年,星期一第65页,共75页,编辑于2022年,星期一 它能够将图像块排列成向量,其语法格式它能够将图像块排列成向量,其语法格式为:为:b=im2col(a,m n,block_type)b=im2col(a,m n,block_type)其功能是将图像其功能是将图像a a的每一个的每一个mnmn块转换成一块转换成一列,重新组合成矩阵列,重新组合成矩阵b b。block_typeblock_type指定排列的方式,当指定排列的方式,当block_typeblock_type为为distinctdistinct时,图像块不重叠;当时,图像块不重叠;当block_typeblock_ty
23、pe为为slidingsliding时,图像块滑动。时,图像块滑动。(2)im2col函数。函数。第66页,共75页,编辑于2022年,星期一 它用于将向量重新排列成图像块,其语法格式它用于将向量重新排列成图像块,其语法格式为:为:b=col2im(a,m n,mm nn,block_type)b=col2im(a,m n,mm nn,block_type)其功能是将图像其功能是将图像a a的每一列重新排列成的每一列重新排列成mnmn的图像块。的图像块。block_typeblock_type指定排列的方式,当指定排列的方式,当block_typeblock_type为为distinctdis
24、tinct时,图像块不重叠;当时,图像块不重叠;当block_typeblock_type为为slidingsliding时,图像块滑动,并用这些图像块组时,图像块滑动,并用这些图像块组合成合成mmnnmmnn图像。图像。(3)col2im函数。函数。第67页,共75页,编辑于2022年,星期一 它用于计算图像它用于计算图像x x的二维快速傅立叶变换,输的二维快速傅立叶变换,输出矩阵的大小与其输入的图像出矩阵的大小与其输入的图像x x相同。相同。(5)ifft2(x)函数。函数。它用于计算图像它用于计算图像x x的二维快速傅立叶逆变换。的二维快速傅立叶逆变换。(4)fft2(x)函数。函数。第
25、68页,共75页,编辑于2022年,星期一 图像的图像的DCTDCT(离散余弦变换)。(离散余弦变换)。DCTDCT具具有有把把高高度度相相关关数数据据能能量量集集中中的的能能力力,这这一一点点和和傅傅立立叶叶变变换换相相似似,但但DCTDCT得得到到的的变变换换系系数数是是实实数,因此广泛应用于图像压缩。数,因此广泛应用于图像压缩。2基于基于DCT的图像压缩技术的图像压缩技术第69页,共75页,编辑于2022年,星期一3基于哈达玛变换的图像压缩技术基于哈达玛变换的图像压缩技术第70页,共75页,编辑于2022年,星期一3.4.2 子图像尺寸选择子图像尺寸选择 实践证明,子图像尺寸取实践证明,
26、子图像尺寸取4 4像素像素44像素、像素、8 8像素像素88像素、像素、1616像素像素1616像素适合图像的压缩,像素适合图像的压缩,这是因为:这是因为:(1 1)如果子图像尺寸取得太小,虽然计算)如果子图像尺寸取得太小,虽然计算速度快,实现简单,但压缩能力有限。速度快,实现简单,但压缩能力有限。(2 2)如果子图像尺寸取得太大,虽然去相关)如果子图像尺寸取得太大,虽然去相关效果好(因为效果好(因为DFTDFT、DCTDCT等正弦类变换均渐近最佳性,等正弦类变换均渐近最佳性,但也渐趋饱和),但由于图像本身的相关性很小,但也渐趋饱和),但由于图像本身的相关性很小,反而使其压缩效果不明显,而且增
27、加了计算的复杂反而使其压缩效果不明显,而且增加了计算的复杂性。性。第71页,共75页,编辑于2022年,星期一3.4.3 比特分配比特分配 在大多数变换编码中,选择要保留的系数在大多数变换编码中,选择要保留的系数时有以下时有以下2 2种方法。种方法。(1 1)根据最大方差进行选择,称为区域编码。)根据最大方差进行选择,称为区域编码。(2 2)根据最大值的量级选择,称为阈值)根据最大值的量级选择,称为阈值编码。编码。对变换后的子图像进行截取、量化和编码,对变换后的子图像进行截取、量化和编码,这整个过程称为比特分配。这整个过程称为比特分配。第72页,共75页,编辑于2022年,星期一1区区a域编码
28、域编码图图图图3-17 3-17 典型的区域模板典型的区域模板典型的区域模板典型的区域模板第73页,共75页,编辑于2022年,星期一2阈值编码阈值编码图图图图3-18 3-18 典型的典型的典型的典型的阈值阈值阈值阈值模板模板模板模板第74页,共75页,编辑于2022年,星期一 一般来说,对变换子图像取阈值(即产生式一般来说,对变换子图像取阈值(即产生式(3-243-24)表示的模板函数)有)表示的模板函数)有3 3种方法。种方法。(1 1)对所有子图像用一个全局阈值。)对所有子图像用一个全局阈值。(2 2)对各子图像分别用不同的阈值。)对各子图像分别用不同的阈值。(3 3)根据子图像中各系数的位置选取阈值。)根据子图像中各系数的位置选取阈值。第75页,共75页,编辑于2022年,星期一