第3章多媒体信息编码PPT讲稿.ppt

上传人:石*** 文档编号:44666446 上传时间:2022-09-22 格式:PPT 页数:128 大小:5.29MB
返回 下载 相关 举报
第3章多媒体信息编码PPT讲稿.ppt_第1页
第1页 / 共128页
第3章多媒体信息编码PPT讲稿.ppt_第2页
第2页 / 共128页
点击查看更多>>
资源描述

《第3章多媒体信息编码PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第3章多媒体信息编码PPT讲稿.ppt(128页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第3章多媒体信息编码1 1第1页,共128页,编辑于2022年,星期一第3章 多媒体信息编码 3.1 引言引言 3.23.2无损数据压缩无损数据压缩无损数据压缩无损数据压缩3.3 有损压缩编码有损压缩编码2 2第2页,共128页,编辑于2022年,星期一一、什么是数据压缩数据压缩就是在一定的精度损失条件下,以最少的数码表示信源所发出的信号.数据压缩处理一般由两个过程组成:一是编码过程,即对原始数据进行编码压缩,以便存储和传输;二是解码过程,即对压缩的数据进行解压,恢复成可用的数据。信源编码信道编码信道信道译码信源译码信源信宿3.1 引言引言3 3第3页,共128页,编辑于2022年,星期一压缩

2、/解压的过程EncoderDecoderInputMessageOutputMessageCompressedMessageaaaaaaaaaaaaaaaaaaaa20aaaaaaaaaaaaaaaaaaaaaCODEC4 4第4页,共128页,编辑于2022年,星期一二、多媒体数据压缩编码的必要性 压缩编码的必要性和重要性压缩编码的必要性和重要性1.1.多媒体系统技术多媒体系统技术多媒体系统技术多媒体系统技术:面向三维图形、立体声、彩色全屏幕运动画面的面向三维图形、立体声、彩色全屏幕运动画面的面向三维图形、立体声、彩色全屏幕运动画面的面向三维图形、立体声、彩色全屏幕运动画面的处理技术;处理技

3、术;处理技术;处理技术;多种媒体承载的由模拟量转化成数字量信息的获取、表示、多种媒体承载的由模拟量转化成数字量信息的获取、表示、多种媒体承载的由模拟量转化成数字量信息的获取、表示、多种媒体承载的由模拟量转化成数字量信息的获取、表示、存储、传输、表现。存储、传输、表现。存储、传输、表现。存储、传输、表现。2.2.未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量 1 1页页页页B5B5文件数据量约为文件数据量约为文件数据量约为文件数据量约为6.61MB/P6.61MB/P180255mm180255mm2 212122 2像素像素像素像素/mm/mm2 28bit1

4、B/8bit=6.61MB/P8bit1B/8bit=6.61MB/P650MB650MB的的的的CDROMCDROM存放存放存放存放98Pages98Pages5 5第5页,共128页,编辑于2022年,星期一二、多媒体数据压缩编码的必要性 CD-ACD-A激光唱盘每秒采样位为激光唱盘每秒采样位为激光唱盘每秒采样位为激光唱盘每秒采样位为1.41Mbps1.41Mbps44kHz16bit/Hz44kHz16bit/Hz 样本样本样本样本2(2(声道声道声道声道)1.41Mbps1.41Mbps650MB650MB的的的的CDROMCDROM存放存放存放存放1 1小时音乐小时音乐小时音乐小时音

5、乐 数字音频磁带数字音频磁带数字音频磁带数字音频磁带(DAT)(DAT)每秒采样位为每秒采样位为每秒采样位为每秒采样位为768kbps768kbps48kHz16bit/Hz48kHz16bit/Hz 样本样本样本样本=768kbps=768kbps650MB650MB的的的的CDROMCDROM存放存放存放存放2 2小时节目小时节目小时节目小时节目 数字电视图像数字电视图像数字电视图像数字电视图像 SIF(Source input format)SIF(Source input format)格式、格式、格式、格式、NFSCNFSC制、彩色、制、彩色、制、彩色、制、彩色、4:4:44:4:4

6、采样采样采样采样每帧每帧每帧每帧:3522403B=253KB:3522403B=253KB每秒每秒每秒每秒:253KB30=7.603MBps:253KB30=7.603MBps每片每片每片每片CDROM:650MB253kB=2569CDROM:650MB253kB=2569帧帧帧帧/片片片片 (650MB7.603MB)60=1.42(650MB7.603MB)60=1.42分分分分/片片片片6 6第6页,共128页,编辑于2022年,星期一二、多媒体数据压缩编码的必要性2.2.未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量 数字电视图像数字电视图像数字

7、电视图像数字电视图像 ICCR(International Consultative Committee for ICCR(International Consultative Committee for Radio)Radio)格式、格式、格式、格式、PALPAL制、制、制、制、4:4:44:4:4采样采样采样采样每帧每帧每帧每帧:7205763B=1.24MB:7205763B=1.24MB每秒每秒每秒每秒:1.24MB25=31.1MBps:1.24MB25=31.1MBps每片每片每片每片CDROM:650MB1.24MB=524CDROM:650MB1.24MB=524帧帧帧帧/片片

8、片片 650MB31.1MB=20.9650MB31.1MB=20.9秒秒秒秒/片片片片 陆地卫星陆地卫星陆地卫星陆地卫星(LandSat-3)(LandSat-3)分辨率分辨率分辨率分辨率2340324023403240、4 4波段、波段、波段、波段、7 7位采样精度位采样精度位采样精度位采样精度每幅每幅每幅每幅:2340324074=212Mb:2340324074=212Mb每天每天每天每天:212Mb30=6.36Gbit:212Mb30=6.36Gbit每年每年每年每年:6.36Gbit365=2321.4Gbit=290GB:6.36Gbit365=2321.4Gbit=290GB

9、7 7第7页,共128页,编辑于2022年,星期一三、多媒体数据压缩的可能性 多媒体数据压缩的可能性(1 1)图像数据表示中大量冗余)图像数据表示中大量冗余(2 2)图像数据压缩技术)图像数据压缩技术:利用图像数据冗余性减少数据量方法利用图像数据冗余性减少数据量方法1.1.空间冗余空间冗余空间冗余空间冗余 静态图像存在的主要冗余静态图像存在的主要冗余静态图像存在的主要冗余静态图像存在的主要冗余;采样点颜色之间的空间连贯性采样点颜色之间的空间连贯性采样点颜色之间的空间连贯性采样点颜色之间的空间连贯性:区域中各点光强、色彩、饱和度同区域中各点光强、色彩、饱和度同区域中各点光强、色彩、饱和度同区域中

10、各点光强、色彩、饱和度同;离散像素采样表示颜色没有利用这种空间连贯性离散像素采样表示颜色没有利用这种空间连贯性离散像素采样表示颜色没有利用这种空间连贯性离散像素采样表示颜色没有利用这种空间连贯性;改变颜色的像素存储方式改变颜色的像素存储方式改变颜色的像素存储方式改变颜色的像素存储方式,利用空间连贯性利用空间连贯性利用空间连贯性利用空间连贯性,减少数据量减少数据量减少数据量减少数据量.8 8第8页,共128页,编辑于2022年,星期一图图BitmapBitmap颜色相同的块颜色相同的块帧内压缩帧内压缩帧内压缩帧内压缩例如,在静态图像中有一块表面颜色均匀的区域,在此区例如,在静态图像中有一块表面颜

11、色均匀的区域,在此区域中所有点的光强和色彩以及饱和度都是相同的,因此数域中所有点的光强和色彩以及饱和度都是相同的,因此数据有很大的据有很大的空间冗余空间冗余。9 9第9页,共128页,编辑于2022年,星期一2.时间冗余时间冗余时间冗余时间冗余序列图像序列图像序列图像序列图像(电视、运动图像电视、运动图像电视、运动图像电视、运动图像)表示常包含的冗余表示常包含的冗余;相邻帧记录了相邻时刻的同一场景画面相邻帧记录了相邻时刻的同一场景画面,移动物位移动物位移动物位移动物位置稍不同置稍不同置稍不同置稍不同.运动图像一般为位于一时间轴区间的一组连运动图像一般为位于一时间轴区间的一组连续画面,其中的相邻

12、帧往往包含相同的背景和移动续画面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地所以后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,所以称为一场景画面,所以称为时间冗余。时间冗余。同理,语音数据中也存在着时间冗余。同理,语音数据中也存在着时间冗余。1010第10页,共128页,编辑于2022年,星期一时间冗余时间冗余1111第11页,共128页,编辑于2022年,星期一3.视觉冗余视

13、觉冗余人类的视觉系统由于受生理特性的限制,对于图像场的注意人类的视觉系统由于受生理特性的限制,对于图像场的注意人类的视觉系统由于受生理特性的限制,对于图像场的注意人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均匀的,人对细微的颜色差异感觉不明显。是非均匀的,人对细微的颜色差异感觉不明显。是非均匀的,人对细微的颜色差异感觉不明显。是非均匀的,人对细微的颜色差异感觉不明显。例如,人类视觉的一般分辨能力为例如,人类视觉的一般分辨能力为例如,人类视觉的一般分辨能力为例如,人类视觉的一般分辨能力为2626灰度等级,而一般的图像的量化灰度等级,而一般的图像的量化灰度等级,而一般的图像的量化灰度等

14、级,而一般的图像的量化采用的是采用的是采用的是采用的是2828灰度等级,即存在视觉冗余。灰度等级,即存在视觉冗余。灰度等级,即存在视觉冗余。灰度等级,即存在视觉冗余。人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允许范围的人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允许范围的人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允许范围的人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允许范围的变化,人也感觉不出来。变化,人也感觉不出来。变化,人也感觉不出来。变化,人也感觉不出来。(1).(1).人类视觉系统对图像场的敏感性是非均匀的和非线性的人类视觉系统对图像场的敏感性是非均

15、匀的和非线性的人类视觉系统对图像场的敏感性是非均匀的和非线性的人类视觉系统对图像场的敏感性是非均匀的和非线性的;(2).(2).记录图像时假定视觉系统是均匀和线性的记录图像时假定视觉系统是均匀和线性的记录图像时假定视觉系统是均匀和线性的记录图像时假定视觉系统是均匀和线性的,对不同敏感区同样对待对不同敏感区同样对待对不同敏感区同样对待对不同敏感区同样对待,产生了视产生了视产生了视产生了视觉冗余觉冗余觉冗余觉冗余.应对不同敏感部分分开编码应对不同敏感部分分开编码应对不同敏感部分分开编码应对不同敏感部分分开编码;1212第12页,共128页,编辑于2022年,星期一(3).(3).视觉的非均匀性视觉

16、的非均匀性视觉的非均匀性视觉的非均匀性.视觉系统对图像的亮度和色彩度的敏感性相差很大,视觉系统对图像的亮度和色彩度的敏感性相差很大,视觉系统对图像的亮度和色彩度的敏感性相差很大,视觉系统对图像的亮度和色彩度的敏感性相差很大,RGBRGBNTSCNTSC的的的的YIQYIQ后后后后发现发现发现发现,视觉系统的亮度视觉系统的亮度视觉系统的亮度视觉系统的亮度y y的敏感度远高于色度的敏感度远高于色度的敏感度远高于色度的敏感度远高于色度(I,Q)(I,Q)的敏感度的敏感度的敏感度的敏感度可对可对可对可对IQIQ允许允许允许允许误差大于误差大于误差大于误差大于y y的允许误差的允许误差的允许误差的允许误

17、差;亮度增加时亮度增加时亮度增加时亮度增加时,视觉系统对量化误差的敏感度降低视觉系统对量化误差的敏感度降低视觉系统对量化误差的敏感度降低视觉系统对量化误差的敏感度降低,人眼辨别能力与物体周围的背人眼辨别能力与物体周围的背人眼辨别能力与物体周围的背人眼辨别能力与物体周围的背景亮度成反比景亮度成反比景亮度成反比景亮度成反比.在高亮度区在高亮度区在高亮度区在高亮度区,灰度值的量化可粗糙一些灰度值的量化可粗糙一些灰度值的量化可粗糙一些灰度值的量化可粗糙一些;人眼的视觉系统能把图像的边缘和非边缘区域分开处理人眼的视觉系统能把图像的边缘和非边缘区域分开处理人眼的视觉系统能把图像的边缘和非边缘区域分开处理人

18、眼的视觉系统能把图像的边缘和非边缘区域分开处理边缘区和非边缘区和非边缘区和非边缘区和非边缘区分别编码的依据边缘区分别编码的依据边缘区分别编码的依据边缘区分别编码的依据;人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通道后再进行处理道后再进行处理道后再进行处理道后再进行处理编码时把图像分解成符合这一规律编码时把图像分解成符合这一规律编码时把图像分解成符合这一规律编码时把图像分解成符合这一规律(视觉内在特性视

19、觉内在特性视觉内在特性视觉内在特性)的频的频的频的频率通道率通道率通道率通道,可获大的压缩比可获大的压缩比可获大的压缩比可获大的压缩比;小波编码的特性小波编码的特性小波编码的特性小波编码的特性.1313第13页,共128页,编辑于2022年,星期一4.4.结构冗余结构冗余结构冗余结构冗余图像纹理区的像素值存在着分布模式图像纹理区的像素值存在着分布模式图像纹理区的像素值存在着分布模式图像纹理区的像素值存在着分布模式:如方格状地板图案如方格状地板图案如方格状地板图案如方格状地板图案;已知分布模式已知分布模式已知分布模式已知分布模式,可通过某一过程生成图像可通过某一过程生成图像可通过某一过程生成图像

20、可通过某一过程生成图像.5.5.知识冗余知识冗余 有些图像的理解与某些知识有相当大的相关性有些图像的理解与某些知识有相当大的相关性有些图像的理解与某些知识有相当大的相关性有些图像的理解与某些知识有相当大的相关性,如人脸的图像有固定结构如人脸的图像有固定结构如人脸的图像有固定结构如人脸的图像有固定结构;规律性结构可由先验知识和背景知识获得规律性结构可由先验知识和背景知识获得规律性结构可由先验知识和背景知识获得规律性结构可由先验知识和背景知识获得知识冗余知识冗余知识冗余知识冗余;由已有知识由已有知识由已有知识由已有知识,对图像中物体构造其基本模型对图像中物体构造其基本模型对图像中物体构造其基本模型

21、对图像中物体构造其基本模型,创建对应各种特征的图像库创建对应各种特征的图像库创建对应各种特征的图像库创建对应各种特征的图像库:存储存储存储存储时只需保存图像的一些特征参数时只需保存图像的一些特征参数时只需保存图像的一些特征参数时只需保存图像的一些特征参数;知识冗余是模型编码主要利用的特征知识冗余是模型编码主要利用的特征知识冗余是模型编码主要利用的特征知识冗余是模型编码主要利用的特征.6.6.图像区域的相同性冗余图像区域的相同性冗余图像中多个区域所对应的像素值相同或者相近图像中多个区域所对应的像素值相同或者相近图像中多个区域所对应的像素值相同或者相近图像中多个区域所对应的像素值相同或者相近,产生

22、重复产生重复产生重复产生重复性存储性存储性存储性存储;向量量化向量量化向量量化向量量化(Vector quantization)(Vector quantization)是针对这种冗余的压缩是针对这种冗余的压缩是针对这种冗余的压缩是针对这种冗余的压缩编码方法编码方法编码方法编码方法.1414第14页,共128页,编辑于2022年,星期一时间域压缩迅速传输媒体信源频率域压缩并行开通更多业务空间域压缩降低存储费用能量域压缩降低发射功率四、数据压缩的好处多媒体数据压缩的必要性 数据存储 传输带宽1515第15页,共128页,编辑于2022年,星期一五、压缩编码算法的性能评价指标数据压缩编码算法的评估

23、指标包括:1.压缩比2.保真度保真度3.算法复杂性4.时延时延一个好的算法还要考虑:多媒体系统的软、硬件适应能力。应用环境技术标准技术标准1616第16页,共128页,编辑于2022年,星期一压缩编码算法的性能评价指标压缩比:压缩比压缩前数据量压缩比压缩前数据量/压缩后数据量压缩后数据量理论上讲,在保证压缩后图像质量的前提下,压缩比理论上讲,在保证压缩后图像质量的前提下,压缩比越高越好。越高越好。保真性:保真是一个对压缩质量进行评价的参数,分为主观保真度和客观保真度。客观保真度用重建信号质量与原信号之间的均方误差来客观保真度用重建信号质量与原信号之间的均方误差来衡量:衡量:x xi i和和和和

24、xi i 分别对应原信号和重建信号,分别对应原信号和重建信号,N2为总信息数量。为总信息数量。为总信息数量。为总信息数量。1717第17页,共128页,编辑于2022年,星期一压缩编码算法的性能评价指标保真性:客观保真性:将均方误差作为由数据压缩而产生的噪声客观保真性:将均方误差作为由数据压缩而产生的噪声能量,定义压缩信噪比为能量,定义压缩信噪比为主观保真性:在规定的观测条件(图像尺寸、对比主观保真性:在规定的观测条件(图像尺寸、对比度、亮度、观测距离等)下,对一组标准图像压缩度、亮度、观测距离等)下,对一组标准图像压缩前后的质量进行对比的主观评定标准。具体做法是前后的质量进行对比的主观评定标

25、准。具体做法是对重建信号的特性进行按等级评分,然后根据下式对重建信号的特性进行按等级评分,然后根据下式计算平均分计算平均分MOSMOS:其中,其中,k为级别数,为级别数,为级别数,为级别数,ni为该类别的人数,为该类别的人数,ci为分数。为分数。为分数。为分数。1818第18页,共128页,编辑于2022年,星期一六、压缩分类(1)1、按照压缩方法是否产生失真分类(1)无失真压缩 无失真压缩要求解压以后的数据和原始数据完全一致。解压后得到的数据是原数据的复制,是一种可逆压缩。无失真压缩法去掉或减少数据中的冗余,恢复时再重新插到数据中,因此是可逆过程根据目前的技术水平,无损压缩算法一般可以把普通

26、文件的数据压缩到原来的1/21/4。一些常用的无损压缩算法有赫夫曼(Huffman)算法和LZW(Lenpel-Ziv&Welch)压缩算法1919第19页,共128页,编辑于2022年,星期一(2)有失真压缩 解解压压以以后后的的数数据据和和原原始始数数据据不不完完全全一一致致,是是不可逆压缩方式。有失真压缩还原后,不影响信息的表达。不可逆压缩方式。有失真压缩还原后,不影响信息的表达。例如,图像、视频、音频数据的压缩就可以采用有损压缩方例如,图像、视频、音频数据的压缩就可以采用有损压缩方法,因为其中包含的数据往往多于我们的视觉系统和听觉系法,因为其中包含的数据往往多于我们的视觉系统和听觉系统

27、所能接收的信息,丢掉一些数据而不至于对声音或者图像统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。图像、视频、所表达的意思产生误解,但可大大提高压缩比。图像、视频、音频数据的压缩比可高达音频数据的压缩比可高达100:1,但人的主观感受仍不会对,但人的主观感受仍不会对原始信息产生误解。原始信息产生误解。2020第20页,共128页,编辑于2022年,星期一多媒体信息编码技术主要侧重于有损压缩编码的研究。经过多年的研究与开发,已经出台了一系列有关的国际标准。其中,最著名的是国际标准组织(ISO)制定的JPEG和MPEG。JPEG是静止图像的压缩标准,其

28、压缩比可达401。MPEG(MPEG-1、MPEG-2及MPEG-4)是动态图像的压缩标准,采用MPEG-2标准对NTSC质量视频进行压缩后,网络带宽需求可降低到3.36 Mb/s。其它的标准还有国际电信联合会(ITU)制定的用于可视电话、会议电视的H.261和H.263;用于音频的G.711、G.721、G.728等。2121第21页,共128页,编辑于2022年,星期一六、压缩分类(2)根据码词长度是否相等分类定长码(fixed-length code)采用相同的位数(采用相同的位数(bitbit)对对数据数据进进行行编码编码大多数存大多数存储储数字信息的数字信息的编码编码系系统统都采用定

29、都采用定长码长码变长码(variable-length code)采用不相同的位数(采用不相同的位数(bitbit)对对数据数据进进行行编码编码,以,以节节省省存存储储空空间间示例:示例:赫夫曼赫夫曼编码编码2222第22页,共128页,编辑于2022年,星期一六、压缩分类(3)按照压缩方法的原理分类按照压缩方法的原理分类预测编码:预测编码:基本思想是利用已被编码的点的数据值,预测邻近基本思想是利用已被编码的点的数据值,预测邻近的一个像素点的数据值的一个像素点的数据值变换编码变换编码:基本思想是将图像的光强矩阵变换到系数空间上,然后基本思想是将图像的光强矩阵变换到系数空间上,然后对系数进行编码

30、压缩对系数进行编码压缩统计编码:统计编码:根据信息出现概率的分布特性而进行的压缩编码根据信息出现概率的分布特性而进行的压缩编码*无失真编码无失真编码*分析合成编码:分析合成编码:基元和特征参数基元和特征参数混合编码:混合编码:混合压缩是利用了各种单一压缩的长处,以求在压缩混合压缩是利用了各种单一压缩的长处,以求在压缩比、压缩效率及保真度之间取得最佳折衷比、压缩效率及保真度之间取得最佳折衷2323第23页,共128页,编辑于2022年,星期一多媒体数据压缩编码方法PCM固 定自适应自适应预测编码固 定DPCMMADPCM运动补偿变换编码傅立叶(DFT)离散余弦(DIT)离散正弦(DST)沃尔什-

31、哈达马哈 尔斜变换卡胡南-苏夫(KL)小波变换子带编码统计编码(熵编码)(无损)哈夫曼算术编码费 诺香 农游程(RLC)LZW静图像编码方块逐渐浮现逐层内插位平面抖动电视图像编码帧内预测帧间编码运动估计运动补偿条件补充内 插帧间预测基于重要性矢量量化滤 波子 采 样模型编码分形编码混合编码H.261JPEGMPEG图3-1 多媒体数据压缩编码方法2424第24页,共128页,编辑于2022年,星期一3.2无损数据压缩无损数据压缩数据压缩的理论基础为数据压缩的理论基础为Shannon信息论。它一方面给出了数据压缩的理论极限,另一方面又指明了数据压缩的技术途径。香农香农-范诺范诺霍夫曼编码霍夫曼编

32、码算术编码算术编码RLERLE编码编码词典编码词典编码统计编码统计编码2525第25页,共128页,编辑于2022年,星期一3.2.1信息熵及基本概念 1信息量与信息熵 信息量信息量 式中,P(xj)是信源X发出xj的概率。I(xj)的含义是,信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。2626第26页,共128页,编辑于2022年,星期一l信源信源X的的“熵熵”:信源X发出的xj(j=1,2,n)共n个随机事件的自信息统计平均,即 等概率事件的熵最大:当P(x1)1时,P(x2)P(x3)P(xj)0,此时熵为由上可得熵的范围为:2727第27页,共128页,编辑于2022

33、年,星期一平均码长与熵如果信源X输出为一个随机变量序列aj j,对aj j的编码长度为Lj j,则X的平均码长为:对信源编码的最小平均码长为该信源的熵,为:Pj j 表示符号表示符号 aj j 在X X中出现的概率2828第28页,共128页,编辑于2022年,星期一在编码中用熵值来衡量是否为最佳编码。若以在编码中用熵值来衡量是否为最佳编码。若以LcLc表示编码器输出码字的平均码长,则当LcH(X)有冗余,不是最佳。LcLcH(X)不可能。LcH(X)H(X)最佳编码(Lc稍大于H(X))。)。熵值为平均码长熵值为平均码长LcLc的下限。的下限。平均码长Lc的计算公式为:(j=1,2,n)其中

34、:P(xj)是信源X发出xj的概率,L(xj)为xj的编码长。2929第29页,共128页,编辑于2022年,星期一Entropy Example【例1】【例2】一幅用256级灰度表示的图像,如果每一个象素点灰度的概率均为Pi=1/256,编码每一个象素点就需要8位。3030第30页,共128页,编辑于2022年,星期一【例3】有一幅40个象素组成的灰度图像,灰度共有个象素组成的灰度图像,灰度共有5 5级,4040个象素中出现灰度个象素中出现灰度A A、B B、C C、D、E的象素数如的象素数如表所示。如果用表所示。如果用3个位表示5个等级的灰度值,也就是每个象素用3位表示,编码这幅图像总共需

35、要120120位。H H(S)=(15/40)log)=(15/40)log2(40/15)+(7/40)log2 2(40/7)+(5/40)log2 2(40/5)=2.196(40/5)=2.196,每个符号用2.1962.196位表示,位表示,40个象素需用87.8487.84位。位。符符 号号b bA AB BC CD DE E出现次数出现次数15157 77 76 65 53131第31页,共128页,编辑于2022年,星期一2冗余度、编码效率与压缩比冗余度、编码效率与压缩比 设原图像的平均码长为L L,熵为H(X)H(X),压缩后图像的平均码长为Lc,则定义冗余度为,则定义冗余度

36、为:编码效率:编码效率:压缩比:在数字图像通信系统中,冗余度、编码效率与压缩比是衡量信源特性以及编解码设备性能的重要指标。3232第32页,共128页,编辑于2022年,星期一统计编码的基本思想:其宗旨在于找到一种编码使得平均码长到达熵极限,其宗旨在于找到一种编码使得平均码长到达熵极限,基本思想就是基本思想就是对于无记忆的信源,根据码字出现的概率分布特性寻找概率与码字长度间的最优化匹配。对对出现概率较大的符号取较短的码长,而对出现概率较小的出现概率较大的符号取较短的码长,而对出现概率较小的符号取较大的码长符号取较大的码长,据此对信息进行压缩。3.2.2统计编码(信息熵编码)信息熵编码也称为统计

37、编码,是利用信息源出现的概率来进行编码,常见的信息熵编码包括哈夫曼编码、香农-范诺编码、行程编码和算术统计编码等。3333第33页,共128页,编辑于2022年,星期一统计编码统计编码是一种无损编码,常用于图像、文档等要求无损失的压缩中。实现原理:有些媒体(如图像,文档)数据中各样点值的出现概率在编码前可以统计出,结合其出现概率进行的编码可以充分降低数据量,同时又保证了媒体的质量。由于在编码过程中仅仅将这些媒体数据看成是一串数据,没有深入到其物理意义中去研究,所以压缩比率并不高。3434第34页,共128页,编辑于2022年,星期一1、仙农-范诺(Shannon-Fano)编码最早阐述和实现这

38、种编码的是Shannon(1948年)和Fano(1949年),采用从上到下的方法进行编码。按照符号出现的频度或概率排序使用递归方法分成两个部分,每一部分具有近似相同的次数,0分在上,1分在下3535第35页,共128页,编辑于2022年,星期一例子1例如,A,B,C,D和E符号符号出现的次数出现的次数(P(Pi i)loglog2 2(1/P(1/Pi i)分配的代码分配的代码需要的位数需要的位数A A15(0.375)15(0.375)1.41501.415000003030B B7(0.175)7(0.175)2.51452.514501011414C C7(0.175)7(0.175)

39、2.51452.514510101414D D6(0.150)6(0.150)2.73692.73691101101818E E5(0.125)5(0.125)3.00003.00001111111515ABCDE00111103636第36页,共128页,编辑于2022年,星期一例子2SymbolCountCodeA1500B701D5110C610E5111Firstdivision2nddivision3rddivision4thdivision3737第37页,共128页,编辑于2022年,星期一符号符号频率频率信息量信息量总信息量总信息量A151.3820.68B72.4817.35

40、C62.7016.20D62.7016.20E52.9614.82编码编码码长码长BitBit数数002300121410212110318111315Total85.25bitsTotal89bits3838第38页,共128页,编辑于2022年,星期一2.霍夫曼编码基本思想:对于出现概率较大的符号取较短的码长,而对概率较小的符号则取较长的码长。霍夫曼编码(Huffman Encoding)又称变长度编码,或最优编码,即遵照霍夫曼编码原则的结果一定是平均码长最短。霍夫曼编码的特点:只适用于有限个离散信源;且实现起来相当复杂。3939第39页,共128页,编辑于2022年,星期一具体的编码步骤

41、如下:(1 1)将信源符号出现的概率按由大到小的顺序排序。)将信源符号出现的概率按由大到小的顺序排序。)将信源符号出现的概率按由大到小的顺序排序。)将信源符号出现的概率按由大到小的顺序排序。(2 2)将两处最小的概率进行组合相加,形成一个新的概率。)将两处最小的概率进行组合相加,形成一个新的概率。)将两处最小的概率进行组合相加,形成一个新的概率。)将两处最小的概率进行组合相加,形成一个新的概率。(3 3)将新出现的概率与未编码的字符一起重新排序。)将新出现的概率与未编码的字符一起重新排序。)将新出现的概率与未编码的字符一起重新排序。)将新出现的概率与未编码的字符一起重新排序。(4 4)重复步骤

42、()重复步骤()重复步骤()重复步骤(2 2)、()、()、()、(3 3),直到出现的概率和为),直到出现的概率和为),直到出现的概率和为),直到出现的概率和为1 1。(5 5)分配代码。代码分配从最后一步开始反向进行,对最后两)分配代码。代码分配从最后一步开始反向进行,对最后两)分配代码。代码分配从最后一步开始反向进行,对最后两)分配代码。代码分配从最后一步开始反向进行,对最后两个概率一个赋予个概率一个赋予个概率一个赋予个概率一个赋予0 0代码,一个赋予代码,一个赋予代码,一个赋予代码,一个赋予1 1代码。如此反向进行到开始的代码。如此反向进行到开始的代码。如此反向进行到开始的代码。如此反

43、向进行到开始的概率排列。在此过程中,若概率不变则采用原代码。概率排列。在此过程中,若概率不变则采用原代码。概率排列。在此过程中,若概率不变则采用原代码。概率排列。在此过程中,若概率不变则采用原代码。4040第40页,共128页,编辑于2022年,星期一例4 4:设输入图像的灰度级a1,a2,a3,a4,a5,a6出现的出现的概率分别是概率分别是0.4、0.2、0.12、0.150.15、0.10.1、0.03。试进行哈夫曼编码,并计算编码效率、压缩比、冗余度。编码步骤:编码步骤:(1 1)初始化,根据符号概率的大小按由大到小顺序)初始化,根据符号概率的大小按由大到小顺序对符号进行排序,如图对符

44、号进行排序,如图4-24-2所示。所示。(2 2)把概率小的两个符号组成一个节点,如图)把概率小的两个符号组成一个节点,如图4-24-2中的中的a5a5、a6a6组成节点组成节点P1P1。(3 3)重复步骤)重复步骤2 2,得到节点,得到节点P2P2、P3P3、P4P4、P5P5,形成一棵,形成一棵“树树”,其中,其中P5P5为根节点。为根节点。(4 4)从根节点)从根节点P5P5开始到相应于每个符号的开始到相应于每个符号的“树叶树叶”,从上到下标上从上到下标上1 1(上枝)或者(上枝)或者0 0(下枝),至于哪个为(下枝),至于哪个为1 1哪个哪个为为0 0则无关紧要,最后的结果仅仅是分配的

45、代码不同,而则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。代码的平均长度是相同的。最终编码结果为:最终编码结果为:a1=1,a2=000,a1=1,a2=000,a3=011,a3=011,a4=001,a5=0100,a4=001,a5=0100,a6=0101a6=0101 4141第41页,共128页,编辑于2022年,星期一由公式(由公式(4-6)可求得图像信源熵是:H(X)=H(X)=-(0.40.4 loglog2 20.4+0.20.4+0.2loglog2 20.2+0.12 log2 20.12+0.12+0.15 log2 20.15+0.1 log

46、log20.1+0.030.1+0.03loglog2 20.030.03)=2.25 bit 根据哈夫曼编码过程图给出的结果,可求出它的平均码字长度:Lc=0.41+0.23+0.153+0.123+0.14+0.034=2.33编码效率为:压缩之前8个符号需要3个比特量化,经过压缩之后的平均码字长度为2.33,其压缩比为:冗余度为:r=1-=3.4%4242第42页,共128页,编辑于2022年,星期一Huffman Coding的问题错错错错误误误误传传传传播播播播(errorpropagation):霍夫曼码没有错误保护功能。在译码时,如果码串中没有错误,就能一个接一个地正确译出代码。

47、但如果码串中发生错误,不但这个码本身译错,更糟糕的是一错一大串。霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑(必必须须在在存存储储代代码码前前先先进进行行译译码码)。尽管如此,霍夫曼码还是得到广泛应用。由由于于一一个个节节点点的的上上下下两两个个分分支支即即可可以以赋赋值值“0 0”,也也可可以以赋赋值值“1”,因因此此同同一一信信源源对对应应的的霍霍夫夫曼曼编编码码并并不不唯唯一一,但但平平均均码长是相同的。码长是相同的。4343第43页,共128页,编辑于2022年,星期一霍夫曼编码霍夫曼编码为唯一可译码,即码的任意一串有限长的

48、码符号序列只能被唯一译成所对应的信源符号。霍夫曼对不同的信源,其编码效率是不同的。当信源概率霍夫曼对不同的信源,其编码效率是不同的。当信源概率分布很不均匀时,霍夫曼码会具有显著效果。分布很不均匀时,霍夫曼码会具有显著效果。如果信源的实际概率模型与构码时所假设的概率模型有差异,实际的平均码字将大于预期值,编码效率将下降。这种情况下,唯一的解决办法就是更换码表,使之与实际概率模型匹配。4444第44页,共128页,编辑于2022年,星期一Huffman与Shannon-Fano特点霍夫曼编码与仙农-范诺编码这两种方法都自含同步码,即在编码之后的码串中都不需要另外添加标记符号,即在译码时分割符号的特

49、殊代码。霍夫曼编码方法的编码效率比仙农-范诺编码效率高一些。Theorem:The Huffman algorithm generates an optimal prefix code.4545第45页,共128页,编辑于2022年,星期一Huffman Coding ExampleCharacterX6 X3 X4 X5 X1 X7 X2Probability0.25 0.2 0.15 0.15 0.1 0.1 0.050.450.250.150.31.00.55CharX6 X3 X4 X5 X1 X7 X2Code10 11 001 011 010 0000 00011110001010

50、01错误错误正确正确4646第46页,共128页,编辑于2022年,星期一3.算术编码 在算术编码中,消息用在算术编码中,消息用在算术编码中,消息用在算术编码中,消息用0 0 0 0到到到到1 1 1 1之间的实数进行编码。之间的实数进行编码。之间的实数进行编码。之间的实数进行编码。图像数据压缩标准如图像数据压缩标准如图像数据压缩标准如图像数据压缩标准如JPEGJPEGJPEGJPEG中扮演重要角色中扮演重要角色中扮演重要角色中扮演重要角色 不必预先定义概率模型,自适应模式具有独特的点;不必预先定义概率模型,自适应模式具有独特的点;不必预先定义概率模型,自适应模式具有独特的点;不必预先定义概率

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁