教学课件第5章图像编码（第5 - 1讲）（研究生学位课）ppt（全）.ppt-淘文阁

资源描述

《教学课件第5章图像编码（第5 - 1讲）（研究生学位课）ppt（全）.ppt》由会员分享，可在线阅读，更多相关《教学课件第5章图像编码（第5 - 1讲）（研究生学位课）ppt（全）.ppt（83页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、教学课件第5章图像编码（第5-1讲）（研究生学位课）数字图像处理学数字图像处理学第第5章章图像编码图像编码（第一讲）（第一讲）阮秋琦教授阮秋琦教授模拟图像信号在传输过程中极易受到各种噪声的干扰，而且模拟图像信号一旦受到污染则很难完全得到恢复。另外，在模拟领域中，要进行人与机器（计算机或智能机），机器与机器之间的信息交换以及对图像进行诸如压缩、增强、恢复、特征提取和识别等一系列处理都是比较困难的。所以无论从完成图像通信与数据通信网的结合方面来看，还是从对图像信号进行各种处理的角度来看，图像信号数字化都是首当其冲的重要问题。图像数字化的关键是编码。本章将对图像编码进行较为详细的讨论。5.1 5

2、.1 图像编码分类图像编码分类图像编码属于信源编码范畴。其特点是利用图像信号的统计特性及人眼睛的生理和心理特性对图像进行高效编码。在信息论中将数字通信过程概括为图5-1的形式。信源信源信源编码信源编码信道编码信道编码调制调制传输信道传输信道噪声噪声解调解调信道解码信道解码信源解码信源解码信宿信宿图5-1 数字通信系统模型图5-1所示的模型是一个数字通信系统模型。在这样一个模型中有二次编、译码，信源编码、信源译码信道编码、信道译码。信源编码的主要任务是解决有效性问题，也就是对信源实现压缩处理，使处理后的信号更适宜数字通信系统。解决有效性问题就是在编码过程中尽量提高编码效率，也就是力求用最少的

3、数码传递最大的信息量。信道编码的任务是解决可靠性问题。也就是尽量使处理过的信号在传输过程中不出错或少出错，既使出了错也要有能力尽量纠正错误。因此，在信道编码中往往引进用作误差控制的数码，以实现自动检错和纠错。图像编码主要是要研究压缩数码率，即高效编码问题。编码是信息处理科学中的经典研究课题，就图像编码而言，已有近70余年的历史。近年来，M.Kunt提出第一代、第二代编码的概念。M.Kunt把1948年至1988年这四十年中研究的以去除冗余为基础的编码方法称为第一代编码，如：PCM、DPCM、M、亚取样编码法，变换域的DFT、DCT、Walsh-Hadamard变换编码等方法以及以此为基础的混合

4、编码法均属于经典的第一代编码法。第二代编码方法多是八十年代以后提出的新的编码方法，如金字塔编码法、Fractal编码、基于神经元网络的编码方法、小波变换编码法、模型基编码法等。现代编码法的特点是：充分考虑人的视觉特性；恰当地考虑对图像信号的分解与表述；采用图像的合成与识别方案压缩数据率。这种分法尽管并没得到图像编码界全体同仁的广泛认可，但笔者认为对了解图像编码发展进程是有益的。图像编码这一经典的研究课题，经五十多年的研究已有多种成熟的方法得到应用，特别是所谓的第一代编码更是如此。随着多媒体技术的发展已有若干编码标准由ITU-T制定出来，如JPEG、H.261、H.263、H.264、H.26

5、5、MPEG1、MPEG2、MPEG4、MPEG7、JBIG(二值图像压缩)(Joint Bo-level Image Coding Expert Group)等。信源编码的目的是提高编码效率。是否能提高编码效率？回答是肯定的。从信息论的角度看，各种信源都存在大量的冗余成分。如果去掉这些冗余成分，就能提高编码效率。所以，所谓第一代编码就是围绕着去除冗余度这一中心思想实现数据压缩的。冗余度在那里？冗余度主要存在于两个主要方面：1）、存在于信源的相关性之中；2）、存在于图像信源各个元素出现概率的不均等之中。因此，无论是记忆性信源还是无记忆性信源都由压缩的可能。去掉了冗余成分的信源固然精练了，但是，

6、也变得脆弱了。抗干扰性能也变差了。因此，在传书过程中，还要加入一些冗余成分以增加抗干扰能力。这就是信道编码的任务了。图像编码的分类图像编码大致可分位三类：1）、匹配编码；2）、变换编码；3）、识别编码：（1）、匹配编码这种编码方法是使代码长度与图像信源的概率分布相匹配。如：出现概率大的编短码，概率小的编长码，总的码率就会下降。这种编码的长短不一，使得传输、译码、存储均不方便，另一个缺点是编码的先决条件是要知道图像信源的概率分布。解决办法：1）、寻找一个大体上能代表图像信源的数学模型，如正态分布，指数分布等；2）、实际统计图像信源的概率分布，这种方法更切合实际，但是，往往找不到合适的数学模型，

7、给分析带来不便。（2）、变换编码首先把图像信源从一个空间变换到另外一个空间，然后对变换系数进行编码。变换方式大体上可分为两类;预测变换函数变换（3)、识别编码这种方法的关键是识别。基本原理是用另外一套符号代替原来的信源中的消息，如：电报、速记等均可认为是识别编码的例子。主要方法：a)关联识别，需要一定数量的样本。信息与样本比较，判别相似程度。b)、逻辑识别没有样本，是用逻辑表达式判别被识别对象。这种编码方法与实际应用还有距离。从压缩的角度也可以分为;1)熵压缩法：不可逆的编码法，压缩中有信息损失，但在视觉角度看失去的信息是无关紧要的信息。2）无失真编码：是可逆的编码方法。没有信息损失。

8、另外，如果从目前已有的实用方案的角度来分类，可以分为三大类，即预测编码，变换编码及统计编码。而这些方法既适用于静止图像编码，也适用于电视信号编码。就具体编码方法而言可简略地概括在书中表5-1中。最后需要着重提及的是，上述各种具体方案并不是孤立的、单一的使用，往往是各种方法重迭、交叉使用，以达到更高的编码效率，在ITU-T的建议标准中这一点尤为突出。更为详细的编码标准见表5-1和5-2.5.2 图像编码中的保真度准则图像编码中的保真度准则图像信号在编码和传输过程中会产生误差，尤其是在熵压缩编码中，产生的误差应在允许的范围之内。在这种情况下，保真度准则可以用来衡量编码方法或系统质量的优劣。通常，这

9、种衡量的尺度可分为客观保真度准则和主观保真度准则。5.2.1 客观保真度准则客观保真度准则通常使用的客观保真度准则有输入图像和输出图像的均方根误差；输入图像和输出图像的均方根信噪比两种。输入图像和输出图像的均方根误差是这样定义的。设输入图像是由 NXN 个像素组成，令其为 f(x,y)，其中 x,y=0,1,2,3.N-1 。这样一幅图像经过压缩编码处理后，送至受信端，再经译码处理，重建原来图像。这里令重建图像为 g(x,y)。它同样包含 NN 个像素，并且 x,y=0,1,2N-1 在 0,1,2,3.N-1 范围内(x,y)处的任意值，输入像素和对应的输出图像之间的误差可用下式表示而包含

10、NxN象素的图像之均方误差为 (5-2)(5-1)由式(5-2)可得到均方根误差为 (5-3)如果把输入、输出图像间的误差看作是噪声，那么，重建图像g（x，y）可由下式表示 (5-4)在这种情况下，另一个客观保真度准则重建图像的均方信噪比如下式表示(5-5)均方根信噪比为 (5-6)5.2.2 主观保真度准则主观保真度准则图像处理的结果，绝大多数场合是给人观看，由研究人员来解释的，因此，图像质量的好坏与否，既与图像本身的客观质量有关，也与人的视觉系统的特性有关。有时候客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量，所以又规定了主观保真度准则。这种方法是把图像显示给观察者，然后把评价

11、结果加以平均，以此来评价一幅图像的主观质量。一种方法是规定一种绝对尺度，例如：（）优秀的：具有极高质量的图像；（）好的：是可供观赏的高质量的图像，干扰并不令人讨厌；（）可通过的：图像质量可以接受，干扰不讨厌；（）边缘的：图像质量较低，希望能加以改善，干扰有些讨厌；（）劣等的：图像质量很差，尚能观看，干扰显著地令人讨厌；（）不能用：图像质量非常之差，无法观看。另外常用的还有两种准则，即妨害准则和品质准则。妨害准则如下五级：（）没有妨害感觉；（）有妨害，但不讨厌；（）能感到妨害，但没有干扰；（）妨害严重，并有明显干扰；（）不能接收信息。品质准则如下七级：（）非常好；（）好；（）稍好；（）普通；（

12、）稍坏；（）恶劣；（）非常恶劣。除此之外，还可以采用成对比较法，也就是同时出示两幅图像，让观察者表示更喜欢哪一幅图像，借此排出图像质量的等级。也有采用随机抽取法来评定图像质量的。这种方法是把数量相等的原始图像和经编译码后的图像混杂在一起，然后让观察者挑出他认为质量差的图像。质量较差的图像可定义为处理过的图像，然后统计错挑的概率，显然错挑概率越大说明图像经处理后的劣化越小。总之，主观保真度评价方法的准则可不同，但其基本原理都一样，当然，对观察者的视觉条件应有一定的要求。5.35.3 PCM PCM 编码编码脉冲编码调制（Pulse coding ModulationPCM）是将模拟图像信号变为数

13、字信号的基本手段。图像信号的PCM 编码与语音信号PCM 编码相比并没有原则上的区别。但是，图像信号，特别是电视信号占的频带宽，要求响应速度快，因此，电路设计与实现上有较大的难度。图像信号PCM 编、译码原理方框图如图5-3所示。图像信号PCM 编码由前置低通滤波器、取样保持电路、量化器、编码器组成。图像图像低通滤波低通滤波取样保持取样保持编码编码传输信道传输信道解码解码低通滤波低通滤波量化量化图5-3 PCM编、译码原理方框图限制频带限制频带减少折叠误差减少折叠误差时间离散化时间离散化幅度离散化幅度离散化多值变多比特多值变多比特多比特变多值多比特变多值内插及平滑内插及平滑前置低通滤波器的

14、作用：1）、为满足取样定理的带限要求，以减少折迭误差；2）、对杂散噪声也有一定的抑制作用。取样保持电路：将完成把时间上连续的模拟信号进行时间离散化的任务。取样周期由奈奎斯特（Nyquist）定理限定。量化器：把模拟信号的幅值离散化，经取样与量化处理后就可产生多值数字信号。编码：把多值的数字信号变成二进制的数字的多比特信号，以便传输或进行后续处理。译码器的原理比较简单，它包括一个译码电路和一个低通滤波器。译码器：把数字信号恢复为模拟信号，这个模拟信号就是在接收端的解码图像信号。滤波器：内插和平滑作用。5.35.3.2 .2 PCM PCM 编码的量化噪声编码的量化噪声量化是对时间离散的模拟信

15、号进行幅度离散化的过程，这个过程是去零取整的过程。量化后的样值与原信号相比大部分是近似关系。这样，把连续的数值限制在固定的台阶式的变化之下必然会带来畸变。这种畸变在接收端是无法克服的，只能使其尽量减小。图5-4 量化噪声与过载噪声的形成由量化带来的噪声可分为量化噪声和过载噪声。以正弦波输入为例，输入幅度较大和输入幅度较小时的量化噪声如图5-4所示。(a)是输入信号超过编码范围时的量化噪声和过载噪声的形成；(b)是信号未超过编码范围，只有量化噪声的情况。在PCM 编码中，量化噪声主要取决于码的位数，码位数越多（即量化阶数多）量化噪声的功率越小。一个量化阶的电压可由下式表示：(5-7)式中：V

16、为输入信号电压；n为样值用二进制数表示的比特数。(5-8)对于过载噪声，当量化特性输入过载点为V时，由下式表示 (5-9)(5-10)由信噪比的概念，则：（5-11）由式(5-11)可见，每增加一位码可得到6dB的信噪比得益。值得注意的是量化噪声不同于其他噪声，它的显著特点是仅在有信号输入时才出现，所以它是数字化中特有的噪声。一般情况下，直接测量比较困难。5.5.3 3.3.3 编码器、译码器编码器、译码器线性PCM 编码一般采用等长码，也就是说每一个码字都有相同的比特数。其中用得最为普遍的是自然二进码，也有用格雷码的。以M=8为例的自然二进码和格雷码列入表(5-3)。表5.3 M=8的自然

17、二进码和格雷码 (a)(b)图 5-5 编码位数对画面质量的影响 (c)(d)(e)(f)图 5-5编码位数对画面质量的影响5 53 34 4 非线性非线性PCM PCM 编码编码在线性PCM编码中，量化阶是均匀的。这样，在小信号输入的情况下信噪比较低，在大信号输入的情况下信噪比较高。为了改善小信号在量化过程中的信噪比，采用一种瞬时压缩扩张技术。这种技术实际上是降低大信号时的信噪比提高小信号时的信噪比，其结果是在不增加数码率的情况下，使信号在整个动态范围内有较均衡的信噪比。瞬时压扩技术基本有两种方案。一种是如图5-8所示的方案。在这种方案中，首先将取样后的PAM信号进行非线性压缩，然后对压缩

18、后的PAM信号进行线性编码。在接收端，首先进行线性译码，然后再送入瞬时扩张器进行非线性扩张，恢复原来的PAM信号。量化量化压缩压缩取样取样编码编码扩张扩张译码译码输出输出图5-8 一种非线性压扩方案该方案一般采用二极管电压、电流的非线性特性来实现。通常采用图5-9所示的修正的对数特性。在图5-9中，对于压缩器来说，X表示输入，Y表示输出。对于扩张器来说，Y表示输入，表示输出。参变量是表示压缩或扩张程度的量。显然，当=0时就是线性编码了。图 5-9 理论压扩曲线另外一种方案是数字化非线性压扩技术，这种方案是把编码与压缩，译码与扩张都分别在编码和译码中一次完成。数字式非线性编码的压扩特性有特性

19、、A特性等等。根据CCITT1970年的建议，通常采用13折线(A=87.6)的压扩特性。量化量化采样采样低通低通编码及压缩编码及压缩低通低通译码及扩张译码及扩张输出输出图 5-10 数字化非线性压扩技术框图 13折线压扩特性如图5-11所示。各折线的斜率列于表5-4中。由图中可见，各段折线的斜率是不一样的；4至8段的小信号区的信噪比都得到了改善。图中的表示压缩器的输入，表示压缩器的输出，V 为过载点电压。图5-11 13折线压扩特性(信号为正时的八段)表表 5 5-4 各种线段斜率表各种线段斜率表折线段 1 2 3 4 5 6 7 8 斜率图5-11只画出了信号在正半周时的情况，负半周时也一样。由于正半周的7、8两段和负半周的7、8两段斜率都一样，所以在整个特性中这四段连成一条直线。因此，总共有13条直线段，简称13折线。(5-14)(5-15)式中 A 是一常数，不同的 A 值可决定一条不同的曲线。在原点处的斜率由下式表示(5-16)当原点处的斜率为16时，则可求得A=87.6。图5-11所示的折线就是A=87.6的13折线压缩特性。

展开阅读全文

教学课件第5章 图像编码（第5 - 1讲）（研究生学位课）ppt（全）.ppt

教学课件第5章图像编码（第5 - 1讲）（研究生学位课）ppt（全）.ppt