《HVS特性及其在图像视频处理中的应用.doc》由会员分享,可在线阅读,更多相关《HVS特性及其在图像视频处理中的应用.doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-作者xxxx-日期xxxxHVS特性及其在图像视频处理中的应用【精品文档】HVS特性及其在数字图像视频处理中的应用摘 要 图像视频处理是近年来的研究热点。由于人眼是信息的最终接受者,因而建立在人类视觉模型(HVS)基础之下的感知处理作为主客观鞋系的桥梁,能有效地在人类恰可察觉的允许失真内提高处理性能。本文就HVS的特性以及几类基于人眼视觉特性的数字图像视频处理技术,主要包括数字水印、图像压缩编码、图像质量评价和图像增强做了相关介绍。关键词 视觉特性 人类视觉系统(HVS) 数字水印 图像压缩编码 图像质量评价 图像增强1引 言人类对人眼视觉特性进行了大量的实验和研究。虽然目前在机理上还未完全
2、弄清楚这些特性,但已有大量的已经实用化的应用,最典型的就是黑白及彩色电视的实用化。这些成功的应用表明了对人眼视觉特性的有效了解和使用。由于人眼视觉特性的内容非常丰富,本文仅对一些与数字图像视频处理密切相关的特性进行介绍。主要内容安排如下:2、介绍人眼视觉特性的基本概念;3、介绍HVS模型;4、介绍基于HVS特性的几类图像视频处理技术;5、对本文内容进行小结。2人眼视觉特性概述2.1人眼的生理结构在讨论人眼视觉特性之前先简单回顾人眼的生理结构。人眼主要由巩膜、角膜、虹膜、瞳孔、晶状体、结膜、玻璃体、脉络膜、视神经、黄斑和视网膜等部分组成。其中,透明的角膜覆盖在眼睛的前面,而不透明的巩膜则包裹着眼
3、球的剩余部分。人眼在观看景物时,光线首先透过角膜,穿过瞳孔后到达晶状体。光线穿过晶状体后将反转的图像投射在视网膜上。视网膜的主要作用是收集光信号,一般情况下对彩色视觉不起作用。锥状细胞在亮视和中等亮度条件下起作用,而且对于空间信息比较敏感。在人眼的视网膜中有大约有一亿两千万个杆状细胞和七百万个锥状细胞,通过压缩,一幅图像变成了空间、时间、轮廓、颜色和运动等信息。人眼通过大量的传感器冗在暗视条件下保证感知信号的准确性。事实上,人眼的色彩感觉是通过计算三种锥状细胞响应的差别来实现的。这些差别信号通过一个非彩色通道和两个反色通道(红-绿通道,蓝-黄通道)来传递而这种方式有助于消除图像信号的冗余24。
4、目前常用的一种色度空间是YCbCr,其中Y表示亮度通道,Cb和Cr表示色差通道。2.2人眼视觉特性简介(1)人眼的分辨率人眼分辨景物细节的能力称为人眼的分辨率。它包括空间分辨率、亮度分辨率、时间分辨率和彩色分辨率等。人眼对很细小的“条纹”很难看清楚,就是空间分辨率问题。对于空间分辨率高的部分,要用放大镜才能使人眼看清楚。人眼对运动很快的目标看不清楚,则属于时间分辨率问题。如果时间频率高,则空间分辨率和亮度分辨率都会下降。空间分辨率、亮度分辨率和时间分辨率是相互联系的,只有三个方面都合适,人眼才能看得清楚。例如,亮度差别小的,如果时间频率很低,则人眼会看清楚,如果时间频率高,则无法看清;亮度差别
5、很大的,即使有轻微晃动,仍能看清楚。当时间频率较高时,人眼对空间对比度的敏感性降低,即对快速运动的物体的细节分辨率降低。当空间频率较高时,人眼对闪烁的敏感度降低。人眼对彩色空间细节的分辨率低于对黑白画面的分辨率。实验还表明,人眼对不同颜色构成的彩色细节的分辨率也不同。(2)人眼的适应性人眼可以通过自身的适应性调节来感觉出宽达108倍的亮度范围,这种对亮度适应性主要体现在以下三个方面:1)暗适应:从明亮处走入暗处,视觉要经过几分钟才能适应,约45分钟才能稳定。人眼适应暗环境的功能称为暗适应。2)亮适应:环境由暗变亮时,锥状细胞在几秒钟内就恢复了作用,很快分辨出物体的明暗和颜色。这一适应过程约在3
6、分钟内达到稳定。3)局部适应:视网膜上某点或某个局部小区域受强光刺激时,这部分的视敏度就比其他部分的要低。(3)对比效应对比效应是由于人眼的多种适应性而引起的,具体包括以下四种类型:1)亮度的同时对比效应:人眼对某个区域感觉到的亮度不是简单地取决于该区域的强度,在相同亮度的刺激下,背景亮度不同时,人眼所感觉到的明暗程度也不同。2)彩色饱和度对比效应:相同、色度与亮度相同的红色区域分别被亮度相同的灰色和红色背景包围,相比之下会感觉红色背景包围的红色区域饱和度较低。3)彩色色调对比效应:面积相同、色度与亮度相同的桔红色区域分别被黄色和红色背景包围,相比之下会感到黄色背景包围的桔红色偏红,而红色背景
7、包围的桔红色偏黄。4)面积对比效应:色度、亮度相同而面积不同的两个彩色区域,面积大的一块会给人以亮度和饱和度都强一些的感觉。(4)马赫带效应人眼对于图像上不同空间频率的成分具有不同的灵敏度。实验表明,人眼对于中频的响应较高,对高、低频率的响应较低。由于这一特性,在观察灰阶条带时,就会显示出马赫带效应。马赫带效应具有增强目标轮廓的作用,是人眼判读图像中的特定目标时的有利因素。典型的HVS模型典型的HVS模型框架如图3-1所示,它用一个顺序处理过程来模拟人类视觉系统的一系列生理心理反应。彩色处理多通道分解对比灵敏度函数局部对比适应性掩蔽效应图3-1 典型的HVS模型(1)彩色处理将图像转换到一个适
8、当的感知彩色空间。经过这步转换后,图像用一个亮度分量通道和两个色差分量通道来进行描述。(2)多通道分解HVS由相邻的多个并列视觉通道构成。这些通道具有线性或正交相位、位移不变性、一致的频率响应和多尺度性,对水平和竖直方向的刺激最敏感,而向对角方向敏感性逐渐减弱,在45(或135)方向处最不敏感。这一结构特征恰好与多分辨滤波器组或小波分解相匹配。 (3)对比度敏感函数(CSF)CSF 体现了人眼对对比度的感知随空间频率发生变化的特性,一般认为CSF是带通滤波函数,最大响应区在210c/d(cycle/degree)。当观察距离增大时,低频段的失真将移向最大响应区,因此,CSF有时也采用低通滤波形
9、式。(4)局部对比适应性HVS对刺激信号的响应取决于该信号相对于背景亮度(或刺激信号平均亮度)的局部变化,即刺激信号的对比度。对于不同的物理亮度水平,此阈值的响应曲线呈现分段和非线性的特点,这就是人眼的亮度适应性。(5)掩盖效应掩盖效应,又称视觉掩蔽效应,是指当另一信号出现在一个刺激信号的背景中时,刺激信号的可视度降低,即可见度阈值增加。也就是说,刺激信号在超阈值对比度背景下,会被掩盖掉。纹理(噪声)区的掩盖效应更强。在图像质量评价中,当压缩恢复图像中引入超阈值失真时,还要注意“互掩盖效应”现象。其他HVS模型根据是否将图像分解为多个通道,HVS的计算模型分为单通道模型和多通道模型。单通道模型
10、比较简单,计算量也比较低。由预处理环节、局部对比度的计算和掩蔽效应的模拟三部分组成。多通道HVS模型能够更好地模拟HVS的多分辨率特征,它是将预处理后的图像进行了多层分解,然后再在每个层上计算局部对比度、亮度适应和CSF。最后,多个通道上的信号通常需要结合在一起(Pooling)以给出比较简单的表达方式。4基于HVS特性的数字图像视频处理技术概述在很多不同的图像视频处理应用中,可以利用人眼视觉特性来从视觉质量的角度提高处理的性能。我们从数字水印、图像视频压缩编码、图像视频质量评价和图像增强四个方面的技术来对HVS特性在图像视频处理中的应用进行介绍。数字水印是永久镶嵌在宿主数据中的具有可鉴别性的
11、数字信号或模式,其应用非常广泛。通过向图像中嵌入数字水印,可以保证数字图像的版权。通过向数字视频图像中添加不可见的鲁棒性数字水印,可以跟踪和监督数字视频的传播。在视频传输中,可以通过嵌入一些重要的信息增加其可靠性。此外,数字视频的广泛应用也为秘密通讯提供了良好的媒介,从而在军事领域也具有广泛的应用前景。HVS理论在图像数字水印中有着非常重要的应用。利用视觉特性设计数字水印算法可以从以下几个方面入手:(1)从水印嵌入的角度,可以根据视觉特性对嵌入水印的强度进行调节,以保证嵌入的水印具有良好的感知特性,相关的研究以不可见水印居多;(2)从水印信息预处理的角度,对于二值图像水印,可以采用图像置乱技术
12、增强水印的鲁棒性,并提高提取出水印的显示效果,目前对置乱算法的研究主要侧重于安全性,而对鲁棒性考虑不足;(3)从版权证明方式的角度,水印检测技术研究较多,而有意义图像的提取技术则研究较少;(4)从提取出水印的后处理角度,可以对提取出的水印图像做进一步处理,以提高水印的视觉效果。视频压缩编码技术早期人们的通信是以声音和文字为主,这主要是受到传输带宽和容量的限制。然而,随着制造技术和数字化技术的发展,这些限制被不断地突破,多媒体通信己经逐渐成为新一代通信技术研究的热点。其中图像和视频作为最直观的一种媒体,是多媒体通信中最重要的一个组成部分。然而,由于图像的数据量极大,不利于存储和传输,因此,压缩编
13、码技术是图像通信中至关重要的步骤。早1940年末,人们就开始了这一方面的研究,提出了基于波形的图像编码技术,由于认识的局限和计算能力的限制,帧内图像的压缩比只能达到10-20倍。进入上世纪80年代中后期,相关学科的发展以及新兴学科的出现,为图像压缩和编码技术的发展注入了新的活力。特别是等人提出了利用人眼视觉特性的第二代图像编码技术,以区别于过去以信息论为理论基础、旨在消除图像数据中线性相关性的第一代图像编码技术。第二代图像视频编码技术更强调充分利用人眼的视觉系统的生理、心理和信源本身的特性以获得更高的压缩比和主观质量。根据处理对象的不同,可以将已有的基于HVS的视频编码方法大体分为两类:(1)
14、一些方法在量化前调整图像变换系数的大小,给予受HVS重视的系数更大的权重,以此来提高图像质量,但这种方法需要在解码端作相应的反调整来恢复图像,增加了解码器的负担。另外有人提出用预滤波来处理待编码图像,去除视觉和心理冗余。(2)根据HVS特性优化设计量化过程,对受HVS重视的系数采用小的量化步长。由于量化是影响图像序列的质量和码率的主要因素,所以,基于感知的码率控制方法近年来也得到普遍的重视和深入研究。人眼视觉特性计算模型的最直接应用就是度量图像或视频的客观质量。实际上,大部分的人眼视觉模型就是为这个目的而设计的。同时,对图像质量度量的准确性又常常作为一个重要标准来衡量HVS模型的性能。传统的针
15、对模拟信号的图像、视频质量评估方法是测量诸如信号幅度、信噪比之类的物理参数。随着数字视频压缩技术的引入,传统的质量评估方法已经无法适应新的应用要求,因而需要针对数字系统的特点,设计新型的质量评估方法。通常人们将评估质量的方法分为两大类:主观质量评价和客观质量评价。由于主观评价是以受测者直接观看测试序列基础的,所以在客观评价中引入视觉系统(HVS)的特性是非常必要的。目前新的测量方法主要分为两类:基于视觉感知的测量方法和基于视觉兴趣的测量方法。在这些方法中,较多地考虑了人眼视觉的生理特性,而对人眼视觉的心理特性却研究得相对较少。图像增强的目的是改善图像质量,即以人为对象,以改善人眼视觉效果为目的
16、。因此,与人眼视觉特性结合的图像增强算法已经成为图像增强算法研究中的热点。考虑到HVS是图像增强的终端,研究者们从人眼视觉特性出发来考虑图像增强算法。上世纪80年代末,多尺度技术,尤其是小波分析技术被应用到图像处理中。由于小波的时频局部化特性以及与多尺度表示的结合,使得它非常适合表示人眼对图像的感知特性,也非常适合表示人们对图像各个尺度(分辨率)下细节的分析和增强。Lu首次考虑了人眼的局部适应能力,利用小波分析来增强图像细节,Browen对尺度间的映射函数做了自适应的调整,不过主要是从抑制噪声方面考虑。总之,考虑人眼的视觉特性已成为图像处理研究中的热点,并已取得明显的效果,正在逐步实用化。随着
17、神经解剖学和实验心理学对视觉系统研究的深入,人眼视觉特性和视觉模型将得到更为广泛的研究和应用。5结束语本文首先介绍了人眼视觉特性的基本概念,重点介绍了与图像处理密切相关的几种视觉特性,随后介绍了一种典型的人眼视觉模型和几种常用的人眼视觉模型,最后介绍了几类基于人眼视觉特性的图像处理技术,主要包括数字水印、图像压缩编码、图像质量评价和图像增强等。HVS理论在数字图像处理中有着非常重要的应用,从视觉质量的角度提高处理的性能,具有广泛的应用前景。参 考 文 献1 and ,Absorption spectra of human cone pigments,Nature, , p.433,1992.2
18、 and G.H.Jacobs,Electroretinogram measurements of cone spectral sensitivity in dichromatic monkeys,Journal of the Optical Society of America A:Optics and Image Science,vol.1,no.12,pp.1175-1180,1984.3王楠楠 ,李桂苓, 符合人眼视觉特性的视频质量评价模型J.中国图象图形学报 , 2001, 16(6): 523 - 527.4余松煜,周源华,张瑞,“数字图像处理”,上海交通大学出版社,2007.2.
19、5黎洪松,“数字视频处理”,北京邮电大学出版社,2006.8.6, The visible differences predictor: An algorithm for the assessment ofimage fidelity, in Digital Images and Human Vision. , , Massachusetts:MIT-206.7钮心忻主编,信息隐藏与数字水印,北京邮电大学出版社,20048吴乐南,数据压缩,北京:电子工业出版社M,20009徐孟侠,图像编码的进展J,通信学报,1993,14(2):40-4710, Wavelet-based color image compression: exploiting the contrast sensitivity functionJ, IEEETrans. on Image Processing, Apr.2003,12(1):58-7011杨婉 ,吴乐华,范晔等 ,数字图像客观质量评价方法研究J. 通信技术 , 2008, 41(7): 244 - 246.12 ,Recent advances in retinex theoryJ,Vision Research,1986,26【精品文档】