《2022年多媒体图像压缩技术 .pdf》由会员分享,可在线阅读,更多相关《2022年多媒体图像压缩技术 .pdf(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多媒体图像压缩技术2010 级电子信息科学与技术刘小辉2010271022 摘要:随着计算机多媒体技术的不断发展,人们期望更高性能的图像压缩技术的出现。图像压缩是用最少的数据量来表示尽可能多的原图像的信息。多媒体数据压缩技术是现代网络发展的关键性技术之一。由于图像和声音信号中存在各种各样的冗余,为数据压缩提供了可能。数据压缩技术有无损压缩缩和有损压缩两大类,这些压缩技术又各有不同的标准。Abstract:With the ever-growing multimedia technology,people are looking for ward to new image compression
2、 technologies with better performances.Image compression with the least amount of data is represented as much information of original image.Multimedia data compression technology is the modern network development of the key technology of.Because of the image and sound signal in the presence of vario
3、us kinds of redundancy,compression of data is possible.Data compression technology of lossless and lossy compression two categories,these compression techniques and different standards.关键字(Keyword):多媒体数据压缩技术(Multimedia data compression technology)无损压缩和有损压缩(Lossless and lossy compression)图像和声音信号(The
4、image and sound signal)最少的数据量(The least amount of data)随着计算机多媒体技术和通信技术的日益发展,以及网络的迅速普及,图像数据信息以名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 5 页 -其直观、形象的表现效果,在信息交流中的使用越来越广泛。每天都有大量的图像信息通过数字方式进行存储、处理和传输。由于技术上对图像数据的要求,图像的分辨率在不断增加。由此导致图像数据量急剧增加。这就给图像的传输和存储带来了极大的困难。因此,图像数据压缩势在必行,通过压缩手段将信息的数据量降下来,以压缩的形式存储和传输,既节约了存储空间,又提高了
5、通信干线的传输效率【1】。在信息环境中,大量的信息是以数字化的方式表示、存储和传输的,而这些数字化信息中图像信息又占了绝大部分。但是数字化后,图像占的空间是巨大的,如一幅分辨率为512512、颜色深度为8 位的黑白图像将占256kB的存储空间;同样,一副彩色图像则占3256768kB,一副 233023308bit 地气象卫星红外云图占4.74MB。这样,一颗卫星每天的数据量为 1.1GB,而当前的 80G 硬盘仅可以存储约70 天的卫星云图资料。这样的存储需求是不可思议的,也是让人不能忍受的。为了对图像数据进行有效的处理、存储和传输,必须对图像数据进行压缩存储。数字图像信息压缩编码也就成为多
6、媒体信息处理中的关键技术之一。1 常用图像数据压缩编码方法数据编码,就是用某种方式对信息的符号进行表示。数据压缩中所指的数据编码是通过选用有效的表示方法,减少表示信息的数据量,从而达到数据压缩的目的。按照压缩还原效果是否存在失真,数据压缩分为无损压缩和有损压缩。对于某些数据(如计算机应用软件程序)里面的每个数据都不容许有任何变更,因此是无损压缩。而对于一副彩色照片,它的某些对人眼不敏感的地方被压缩掉,从而可以提高压缩比,此为有损压缩。前者又称为可逆压缩或无失真压缩,后者称为不可逆压缩和有失真压缩。通常图像数据压缩编码方法用的是无损压缩,无损压缩就是把数据中的冗余去掉或减少,但这些冗余量是可以重
7、新插入到数据中的,因而不会产生失真。该方法一般用于文本数据的压缩,它可以保证完全地恢复原始数据;其缺点是压缩比小(其压缩比一般为2:1 至 5:1)。有损压缩是对熵进行压缩,因而存在一定程度的失真;它主要用于对声音、图像、动态视频等数据进行压缩,压缩比较高(其压缩比一般高达20:1 以上。对于多媒体图像采用的有损压缩的标准有静态图像压缩标准(JPEG标准)和动态图像压缩标(MPEG 标准)。JPEG 利用了人眼的心理和生理特征及其局限性来对彩色的、单色的和多灰度连续色调的、静态图像的、数字图像的压缩,因此它非常适合不太复杂的以及一般来源于真实景物的图像。它定义了两种基本的压缩算法:一种是基于有
8、失真的压缩算法,另一种是基于空间线性预测技术(DPCM)无失真的压缩算法。MPEG 用于活动影像的压缩。MPEG 标准具体包三部分内容:(1)MPEG 视频、(2)MPEG 音频、(3)MP系统(视频和音频的同步)。MPEG 视频是标准的核心分,它采用了帧内和帧间相结合的压缩方法,以离散余变换(DCT)和运动补偿两项技术为基础,在图像质量基不变的情况下,MPEG 可把图像压缩至1100 或更 MPEG 音频压缩算法则是根据人耳屏蔽滤波功能。利用音响心理学的基本原理,即“某些频率的音响在重放其频率的音频时听不到”这样一个特性,将那些人耳完全不到或基本上听到的多余音频信号压缩掉,最后使音频号的压缩
9、比达到8:1或更高,音质逼真,与CD 唱片可媲美。按照MPEG 标准,MPEG 数据流包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、多分配等信息【1】。2 多媒体数据压缩技术的实现方法【3】目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码的压缩方法、离散名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 5 页 -余弦变换(DCT)和小波分解技术压缩算法的研究更具有代表性。小波技术突破了传统压缩方法的局限性,引入了局部和全局相关去冗余的新思想,具有较大的潜力,因此近几年来吸引了众多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个叫做“小片”的区域;在每
10、个小片中,图像经滤波后被分解成若干个低频与高频分量。低频分量可以用不同的分辨率进行量化,即图像的低频部分需要许多的二进制位,以改善图像重构时的信噪比。低频元素采用精细量化,高频分量可以量化得比较粗糙,因为你不太容易看到变化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被提出,这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用大量的计算机资源,但可以获得很好的结果。借助于从DNA 序列研究中发展出来的模式识别技术,能减少通过WAN 链路的流量,最多时的压缩比率能达到90,从而为网络传送图像和声音提供更大的压缩比,减轻风络负荷,更好地实现网络信息传播。3 压缩原理【2】由于图像数据
11、之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人Shannon提出把数据看作是信息和冗余度(redundancy)的组合。所谓冗余度,是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余压缩数据的目的。为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。图像的冗余包括以下几种:(1)空间冗余:像素点之间的相关性。(2)时间冗余:活动图像的两个连续帧之间的冗余。(3)信息熵冗余:单位信息量大于其熵。(4)结构冗余:图像的区域上存在非常强的纹理结构。(5)知识冗余:有固定的结构,如人的头像。(6)视觉冗余:某些图像的失真
12、是人眼不易觉察的。对数字图像进行压缩通常利用两个基本原理:(1)数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。(2)人的视觉心理特征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。编码压缩方法有许多种,从不同的角度出发有不同的分类方法,比如从信息论角度出发可分 为两大类:(1)冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。具体
13、讲就是解码图像和压缩编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。(2)信息量压缩方法,也称有损压缩,失真度编码或熵压缩编码。也就是讲解码图像和原始图像是有差别的,允许有一定的失真。衡量一个压缩编码方法优劣的重要指标(1)压缩比要高,有几倍、几十倍,也有几百乃至几千倍;(2)压缩与解压缩要快,算法要简单,硬件实现容易;(3)解压缩的图像质量要好。名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 5 页 -4 JPEG图像压缩算法【4】JPEG 压缩分四个步骤实现:(1).颜色模式转换及采样;(2).DCT变换;(3).量化;(4).编码。41 颜色模式转换及采样RGB
14、色彩系统是我们最常用的表示颜色的方式。JPEG 采用的是 YCbCr色彩系统。想要用JPEG 基本压缩法处理全彩色图像,得先把 RGB 颜色模式图像数据,转换为 YCbCr 颜色模式的数据。Y代表亮度,Cb 和Cr则代表色度、饱和度。人类的眼晴对低频的数据比对高频的数据具有更高的敏感度,事实上,人类的眼睛对亮度的改变也比对色彩的改变要敏感得多,也就是说Y成份的数据是比较重要的。既然Cb 成份和Cr成份的数据比较相对不重要,就可以只取部分数据来处理。以增加压缩的比例。JPEG通常有两种采样方式:YUV411和 YUV422,它们所代表的意义是Y、Cb和Cr三个成份的资料取样比例。42DCT 变换
15、DCT 变换的全称是离散余弦变换(Discrete Cosine Transform),是指将一组光强数据转换成频率数据,以便得知强度变化的情形。若对高频的数据做些修饰,再转回原来形式的数据时,显然与原始数据有些差异,但是人类的眼睛却是不容易辨认出来。JPEG 将整个亮度矩阵与色度Cb矩阵,饱和度 Cr矩阵,视为一个基本单元称作MCU。每个MCU 所包含的矩阵数量不得超过10 个。例如,行和列采样的比例皆为4:2:2,则每个 MCU 将包含四个亮度矩阵,一个色度矩阵及一个饱和度矩阵。43、量化图像数据转换为频率系数后,还得接受一项量化程序,才能进入编码阶段。量化阶段需要两个 8*8 矩阵数据,
16、一个是专门处理亮度的频率系数,另一个则是针对色度的频率系数,将频率系数除以量化矩阵的值,取得与商数最近的整数,即完成量化。当频率系数经过量化后,将频率系数由浮点数转变为整数,这才便于执行最后的编码。44 编码Huffman编码无专利权问题,成为 JPEG 最常用的编码方式,Huffman编码通常是以完整的MCU 来进行的。编码时,每个矩阵数据的DC 值与 63 个AC 值,将分别使用不同的Huffman编码表,而亮度与色度也需要不同的Huffman编码表,所以一共需要四个编码表,才能顺利地完成JPEG 编码工作。实现上述四个步骤,即完成一幅图像的JPEG 压缩。5 结语对多媒体数据进行数据压缩
17、是实现现时有效地处理、传输和储存多媒体数据的首要问题和根本方法。视屏图像压缩的出发点是利用各种算法将数据冗余压缩到最小,以保留尽可能少的有用信息,为了使压缩后的数据能够互换,必须规定通用的标准格式。国际上静止图像压缩标准时JPEG,而活动图像压缩标准是MPEG-1,MPEG-2和 MPEG-4。到目前为止,虽然图名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 5 页 -像压缩技术已很成熟,并得到了广泛应用,但是人们人在继续研究,以追求更高的压缩效率和更好的图像质量。参考文献:1 李煌晖,朱山风,段上为等译多媒体数字压缩原理与标准第一版北京;电子工业出版社2 李 安 强,张 青.多 媒 体 资 源 库 图 像 自 动 压 缩 处 理 技 术 分 析 J,微 计 算 机 信息.2009,5(3):309-3103 蔡安妮,孙景鳘.多媒体通信技术基础电子工业出版杜.2000 4 龚华,刘雪松,张奎刚.JPEG标准格式的编码方法J.微处理机.名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 5 页 -