《多媒体技术基础及应用教学课件.ppt》由会员分享,可在线阅读,更多相关《多媒体技术基础及应用教学课件.ppt(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多媒体技术基础及应用教学课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第第4 4章章 多媒体数据压缩编码技术多媒体数据压缩编码技术4.1 4.1 多媒体多媒体数据压缩编码的重要性和分类数据压缩编码的重要性和分类4.2 4.2 量化量化 4.3 4.3 统计编码统计编码4.4 4.4 预测编码预测编码4.5 4.5 变换编码变换编码4.6 4.6 多媒体数据压缩编码的国际标准多媒体数据压缩编码的国际标准2第第4 4章章 多媒体数据压缩编码技术多媒体数据压缩编码
2、技术本章重点掌握本章重点掌握静态图像压缩编码的国际标准静态图像压缩编码的国际标准(JPEG)(JPEG)3第第4 4章章 多媒体数据压缩编码技术多媒体数据压缩编码技术本章讲课思路本章讲课思路:静态图像压缩编码的国际标准静态图像压缩编码的国际标准(JPEG)(JPEG)变换编码变换编码统计编码统计编码预测编码预测编码数据压缩的基本概念数据压缩的基本概念4第一部分第一部分数据压缩的基本概念数据压缩的基本概念5数据压缩的基本概念数据压缩的基本概念1.1.什么叫数据压缩?什么叫数据压缩?2.2.多媒体数据压缩的必要性多媒体数据压缩的必要性3.3.多媒体数据压缩的可能性多媒体数据压缩的可能性4.4.数据
3、压缩技术实现的可能性数据压缩技术实现的可能性5.5.数据压缩标准及应用数据压缩标准及应用61.1.什么叫数据压缩?什么叫数据压缩?定义(定义(1 1):数据压缩就是以数据压缩就是以最少最少的数码表示的数码表示信源信源所发的信号,减少容纳给定消息集合所发的信号,减少容纳给定消息集合或数据采样集合的或数据采样集合的信号空间信号空间。4.1 4.1 多媒体数据压缩编码多媒体数据压缩编码的重要性和分类的重要性和分类7“信信源源”可可以以是是数数据据、静静止止图图象象、语语音音、电视或其他需要存储和传输的信号;电视或其他需要存储和传输的信号;“信信号号空空间间”是是指指信信号号集集合合所所占占的的空空域
4、域、时域和频域空间。时域和频域空间。“最最少少”是是指指在在保保证证信信源源的的一一定定质质量量或或者者说是有效的前提下的最少。说是有效的前提下的最少。1.1.什么叫数据压缩?什么叫数据压缩?8空域、时域和频域空间是指:空域、时域和频域空间是指:1.1.物物理理空空间间:如如存存储储器器、磁磁盘盘、磁磁带带、光光盘盘等数据存储介质。等数据存储介质。2.2.时时间间区区间间:如如传传输输给给定定信信源源所所需需的的时时间间。3.3.电电磁磁频频谱谱区区域域:如如传传输输给给定定信信源源所所需需的的带带宽。宽。1.1.什么叫数据压缩?什么叫数据压缩?92.2.多媒体数据压缩的必要性多媒体数据压缩的
5、必要性 多媒体信息包括文本、声音、动画、多媒体信息包括文本、声音、动画、图形、图像以及视频等多种媒体信息。经图形、图像以及视频等多种媒体信息。经过数字化处理后其数据量是非常大的,如过数字化处理后其数据量是非常大的,如果不进行数据压缩处理,计算机系统就无果不进行数据压缩处理,计算机系统就无法对它进行存储和交换。法对它进行存储和交换。10多媒体数据数字化后的海量性多媒体数据数字化后的海量性5 51 12 2个个个个像像像像素素素素512512个像素个像素个像素个像素一幅一幅512512512512的彩色图像,的彩色图像,每像素用每像素用8bit8bit表示,表示,则其大小为:则其大小为:51251
6、2 512512 8 8 3=629145bit3=629145bit 6.3M bit 6.3M bit =768kB =768kB(1)彩色图象数据)彩色图象数据11多媒体数据数字化后的海量性多媒体数据数字化后的海量性上述彩色图像按上述彩色图像按NTSCNTSC制,每秒钟传送制,每秒钟传送3030帧,其帧,其每秒的数据量为:每秒的数据量为:6.3Mbit 6.3Mbit 30 30帧帧/s=188M bit/s=23.5MB/s/s=188M bit/s=23.5MB/s一个一个650MB650MB的硬盘可以存储的图象为:的硬盘可以存储的图象为:650MB/23.5MB/s=27.5s65
7、0MB/23.5MB/s=27.5s(秒)(秒)12多媒体数据数字化后的海量性多媒体数据数字化后的海量性双通道立体声激光唱盘(双通道立体声激光唱盘(CD-ACD-A),采样频),采样频率为率为44.1kHz44.1kHz,采样精度为,采样精度为1616位位/样本,其样本,其1 1秒钟的音频数据量为:秒钟的音频数据量为:44.144.1 103103 1616 2=1.41Mb/s2=1.41Mb/s一个一个650MB650MB的硬盘可以存储的硬盘可以存储约约1 1小时的音乐。小时的音乐。(2)音频数据)音频数据13多媒体数据中存在不存在多媒体数据中存在不存在“数据冗余数据冗余”吗吗?(1 1)
8、信息量与数据量的关系)信息量与数据量的关系 I=D I=D du du其中:其中:I I 信息量信息量 D D数据量数据量 du du冗余量冗余量 3.3.多媒体数据压缩的可能性多媒体数据压缩的可能性14多媒体数据中存在不存在多媒体数据中存在不存在“数据冗余数据冗余”吗?吗?(2 2)语音数据)语音数据中文广播员一分钟读中文广播员一分钟读180180个汉字个汉字,一个汉字存一个汉字存储两个字节储两个字节,共需共需360360个字节。采样频率为个字节。采样频率为8kHz8kHz。采样采样1 1分钟分钟,其数据量为:其数据量为:8K/s8K/s60s=480 K B/60s=480 K B/分分一
9、分钟的数据冗余为一分钟的数据冗余为480KB/360B=1000480KB/360B=1000(倍)的冗余(倍)的冗余 15多媒体数据中存在不存在多媒体数据中存在不存在“数据冗余数据冗余”吗吗?(3 3)图像数据的数据冗余)图像数据的数据冗余 空间冗余空间冗余 时间冗余时间冗余16空间冗余空间冗余 空间冗余也称为空域相关,一幅图空间冗余也称为空域相关,一幅图像是由若干个像素组成的,在相邻像是由若干个像素组成的,在相邻像素之间相关性很大,有很大的信像素之间相关性很大,有很大的信息冗余,这就是空间冗余。息冗余,这就是空间冗余。17 空间冗余空间冗余 例例:图像中的图像中的“A”是一个规则物是一个规
10、则物体。光的亮度、饱和度及颜色都一样,体。光的亮度、饱和度及颜色都一样,因此,数据因此,数据A有很大的冗余。有很大的冗余。A18时间冗余时间冗余 时间冗余也称为时域相关。在运动时间冗余也称为时域相关。在运动图像中,相邻帧之间也存在着很大图像中,相邻帧之间也存在着很大的相关性。的相关性。19时间冗余时间冗余 例例:序列图像序列图像F2F2F1F1AA20结构结构冗余冗余纹理的统计纹理的统计冗余冗余图像区域的相同性图像区域的相同性冗余冗余知识知识冗余冗余视觉视觉冗余冗余信息熵信息熵冗余冗余(4 4)其它类型的数据冗余)其它类型的数据冗余21结构冗余结构冗余 有些图像有非常强的纹理结构。图像有些图像
11、有非常强的纹理结构。图像的像素值存在着明显的分布模式。例的像素值存在着明显的分布模式。例如,方格状的地板图案、草席图结构如,方格状的地板图案、草席图结构等。我们称此为结构冗余。等。我们称此为结构冗余。22纹理的统计冗余纹理的统计冗余 有些图像纹理尽管不严格服从某一分有些图像纹理尽管不严格服从某一分布规律,但是它在统计的意义上服从布规律,但是它在统计的意义上服从该规律。利用这种性质也可以减少表该规律。利用这种性质也可以减少表示图像的数据量,所以我们称之为纹示图像的数据量,所以我们称之为纹理的统计冗余。理的统计冗余。23图像区域的相同性冗余图像区域的相同性冗余 是指在图像中的两个或多个区域所对是指
12、在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区生的数据重复性存储,这就是图像区域的相似性冗余。域的相似性冗余。24知识冗余知识冗余q图像的理解与某些基础知识有关。图像的理解与某些基础知识有关。q例例:人脸的图像有同样的结构:嘴的人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻上方有鼻子,鼻子上方有眼睛,鼻子在中线上子在中线上 25 视觉冗余视觉冗余 人类的视觉系统对图像场的敏感区是非均人类的视觉系统对图像场的敏感区是非均匀和非线性的。然而,在记录原始的图像匀和非线性的。然而,在记录原始的图像数据时,通常假定
13、视觉系统是线性的和均数据时,通常假定视觉系统是线性的和均匀的,对视觉敏感和不敏感的部分同等对匀的,对视觉敏感和不敏感的部分同等对待,从而产生了比理想编码(即把视觉敏待,从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开来编码)更多的感和不敏感的部分区分开来编码)更多的数据,这就是视觉冗余。数据,这就是视觉冗余。例例:人类视觉分辨率为人类视觉分辨率为2 2 ,但常用,但常用2 2 就就是数据冗余。是数据冗余。6 68 826信息熵冗余信息熵冗余信息量:信息量:指从指从N个相等的可能事件个相等的可能事件中选出一个事件所需要的信息度量中选出一个事件所需要的信息度量和含量。和含量。信息熵:指一团数
14、据所带的信息量,信息熵:指一团数据所带的信息量,平均信息量就是信息熵(平均信息量就是信息熵(entropy)。)。27 从数据压缩技术的发展从数据压缩技术的发展历程来看,目前有五个因历程来看,目前有五个因素成就了计算机多媒体数素成就了计算机多媒体数据压缩的可能性。据压缩的可能性。4.4.数据压缩技术实现的可能性数据压缩技术实现的可能性28 第一,经典的数据压缩技术,建立第一,经典的数据压缩技术,建立在信息论的基础上,成功的研究了数据在信息论的基础上,成功的研究了数据压缩的理论极限和数据压缩的基本途径。压缩的理论极限和数据压缩的基本途径。系统的理论研究成就了今天的压缩技术。系统的理论研究成就了今
15、天的压缩技术。4.4.数据压缩技术实现的可能性数据压缩技术实现的可能性29 第二,信号处理能力迅速提高,第二,信号处理能力迅速提高,VLSIVLSI在数字信号处理器上的应用和在数字信号处理器上的应用和高速微处理器在计算机中的应用,高速微处理器在计算机中的应用,大大提高了计算机能力,使原来很大大提高了计算机能力,使原来很复杂的压缩算法能够得到迅速的处复杂的压缩算法能够得到迅速的处理。理。4.4.数据压缩技术实现的可能性数据压缩技术实现的可能性30 第三,基于主观感觉的失真衡量第三,基于主观感觉的失真衡量体系解决了多媒体应用产品的性能评体系解决了多媒体应用产品的性能评价问题。多媒体的应用大多在声音
16、、价问题。多媒体的应用大多在声音、音乐和视频方面,接受者最终是人的音乐和视频方面,接受者最终是人的耳朵和眼睛,这样是有损压缩得到广耳朵和眼睛,这样是有损压缩得到广泛的应用,提高了压缩比。泛的应用,提高了压缩比。4.4.数据压缩技术实现的可能性数据压缩技术实现的可能性31 第四,压缩编码标准的建立,第四,压缩编码标准的建立,奠定了技术产业化的基础,减少奠定了技术产业化的基础,减少了制造商和服务商的风险,他们了制造商和服务商的风险,他们在产品中融入了压缩方法。在产品中融入了压缩方法。4.4.数据压缩技术实现的可能性数据压缩技术实现的可能性32 第五,网络、计算机和通第五,网络、计算机和通信技术的不
17、断融合和进步提信技术的不断融合和进步提供了新的需要并提供高了数供了新的需要并提供高了数据压缩实现的接受程度,使据压缩实现的接受程度,使数据压缩技术得到迅速的提数据压缩技术得到迅速的提高。高。4.4.数据压缩技术实现的可能性数据压缩技术实现的可能性334.4.数据压缩方法的分类数据压缩方法的分类根据质量有无损失可分为有损失编码和根据质量有无损失可分为有损失编码和无损失编码。无损失编码。按照其作用域在空间域或频率域上分为:按照其作用域在空间域或频率域上分为:空间方法、变换方法和混合方法。空间方法、变换方法和混合方法。根据是否自适应分为自适应性编码和非根据是否自适应分为自适应性编码和非自适应性编码。
18、自适应性编码。34按编码算法原理的分类按编码算法原理的分类 (1)(1)预测编码预测编码 (2)(2)变换编码变换编码 (3)(3)量化与向量量化编码量化与向量量化编码 (4)(4)信息熵编码信息熵编码 (5)(5)子带编码子带编码 (6)(6)结构编码结构编码 (7)(7)基于知识的编码基于知识的编码35编码方法可以分成下述三类编码方法可以分成下述三类:1.1.考考虑虑信信源源的的统统计计特特性性:预预测测编编码码方方法法、变变换换编编码码方方法法、矢矢量量量量化化编编码码方方法法、子子带带小小波波编码方法、神经网络编码方法等;编码方法、神经网络编码方法等;2.2.考考虑虑人人眼眼视视觉觉特
19、特性性:基基于于方方向向滤滤波波的的图图像像编编码码方方法法,基基于于图图像像轮轮廓廓纹纹理理的的编编码码方方法;法;3.3.考虑图像传递景物特性:分形编码,基于考虑图像传递景物特性:分形编码,基于内容的编码方法。内容的编码方法。365.5.数据压缩标准及应用数据压缩标准及应用多媒体技术的关键技术之一是关于多媒体多媒体技术的关键技术之一是关于多媒体数据压缩(编码)和解压(解码)算法。数据压缩(编码)和解压(解码)算法。为了解决不同厂家产品的兼容性问题,国为了解决不同厂家产品的兼容性问题,国际标准化协会际标准化协会ISOISO,国际电子学委员会,国际电子学委员会IEC,IEC,国际电信协会国际电
20、信协会ITUITU等国际组织于等国际组织于9090年代领导年代领导制定了三个重要的多媒体国际标准:制定了三个重要的多媒体国际标准:JPEGJPEG标准;标准;H.261H.261标准;标准;MPEGMPEG标准。标准。375.5.数据压缩标准及应用数据压缩标准及应用JPEGJPEG标准全称为标准全称为“多灰度多灰度静态图像的数字压缩编码静态图像的数字压缩编码”,是用于静态图像压缩,是用于静态图像压缩的国际标准。的国际标准。385.5.数据压缩标准及应用数据压缩标准及应用目前已有目前已有MPEG-1MPEG-1、MPEG-2MPEG-2、MPEG-4MPEG-4等等3 3个国际标准,正在完成的有
21、个国际标准,正在完成的有2 2个:个:MPEG-7MPEG-7和和MPEG-21MPEG-21。MPEGMPEG压缩标准用于压缩标准用于数字卫星广播、高清晰电视、数字录数字卫星广播、高清晰电视、数字录象机以及网络环境下的电视点播象机以及网络环境下的电视点播(VODVOD)、)、DVDDVD等各方面。等各方面。395.5.数据压缩标准及应用数据压缩标准及应用MPEG-7MPEG-7标准(标准(ISO/IEC 15938ISO/IEC 15938)名称叫)名称叫“多媒体内容描述接口多媒体内容描述接口”,是一个关,是一个关于表示音于表示音/视信息的信息的标准。视信息的信息的标准。MPEG-21MPE
22、G-21标准(标准(ISO/IEC 18034ISO/IEC 18034),正),正式名称叫式名称叫“多媒体框架多媒体框架”。MPEG-21MPEG-21的的目标是用于通过网络实现数字内容的目标是用于通过网络实现数字内容的电子交易。电子交易。405.5.数据压缩标准及应用数据压缩标准及应用H.261H.261标准主要用于视频电话和视频会标准主要用于视频电话和视频会议。目前还有议。目前还有H.263H.263标准和标准和H.264H.264标准。标准。411.1.量化原理量化原理(1 1)数据压缩编码中的量化处理,是)数据压缩编码中的量化处理,是指以指以PCMPCM码作为输入,经正交变换、差码作
23、为输入,经正交变换、差分、或预测处理后,熵编码之前,对正分、或预测处理后,熵编码之前,对正交变换系数、差值或预测误差的量化处交变换系数、差值或预测误差的量化处理。理。4.2 4.2 量化量化42(2 2)量化输入值的动态范围很大,需要以)量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,希望量能取有限个整数,称作量化级,希望量化后的数值(样本)用较少的比特数便化后的数值(样本)用较少的比特数便可表示。可表示。(3 3)量化处理是一个多对一的处理过程,)量化处理是一个多对一的处理过程,是个不可逆过程。是个不可逆过程。(
24、4 4)量化处理中有信息丢失,或者说,会)量化处理中有信息丢失,或者说,会引起量化误差(量化噪声)。引起量化误差(量化噪声)。432.2.量化器的设计量化器的设计 (1 1)给定量化分层级数,满足量化误差最)给定量化分层级数,满足量化误差最小。小。(2 2)限定量化误差,确定分层级数,满足)限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。以尽量小的平均比特数,表示量化输出。443.3.量化方法分类量化方法分类 量化方法量化方法标量量化标量量化矢量量化矢量量化均匀量化均匀量化非均匀量化非均匀量化自适应量化自适应量化454.4.标量量化标量量化 标量量化是对单个样本或单个参数标
25、量量化是对单个样本或单个参数的幅值进行量化。的幅值进行量化。“标量标量”是指被是指被量化的变量维数,即一维变量。量化的变量维数,即一维变量。46均匀量化特性曲线均匀量化特性曲线均匀量化特性曲线均匀量化特性曲线 均匀量化均匀量化 47均匀量化特性曲线均匀量化特性曲线均匀量化特性曲线均匀量化特性曲线 步长点步长点量化器步长。量化器步长。过载点;过载点;输出阶。输出阶。量化输出值若是量化输出值若是n n位,则称为位,则称为n n位量位量化器。化器。均匀量化均匀量化 48均匀量化特性曲线均匀量化特性曲线均匀量化特性曲线均匀量化特性曲线 步长点步长点量化器步长。量化器步长。过载点;过载点;输出阶。输出阶
26、。量化输出值若是量化输出值若是n n位,则称为位,则称为n n位量位量化器。化器。均匀量化均匀量化 49均匀量化特性曲线均匀量化特性曲线均匀量化特性曲线均匀量化特性曲线 步长点步长点量化器步长。量化器步长。过载点;过载点;输出阶。输出阶。量化输出值若是量化输出值若是n n位,则称为位,则称为n n位量位量化器。化器。均匀量化均匀量化 50输出阶层数为输出阶层数为L L的量化器,的量化器,输出值的位数输出值的位数 (位)。(位)。输出量化位数为输出量化位数为n n的量化器,的量化器,输出阶数输出阶数 (位)。(位)。均匀量化均匀量化 51非均匀量化特性曲线非均匀量化特性曲线非均匀量化特性曲线非均
27、匀量化特性曲线 非均匀量化非均匀量化 横轴的量横轴的量化间隔是化间隔是不唯一的不唯一的 525.5.矢量量化矢量量化 矢量量化编码是近年来图像、语矢量量化编码是近年来图像、语音信号编码技术中颇为流行的一种新音信号编码技术中颇为流行的一种新型量化编码方法。矢量量化编码方法型量化编码方法。矢量量化编码方法一般是有失真编码方法。矢量量化的一般是有失真编码方法。矢量量化的名字是相对于标量量化而提出的。名字是相对于标量量化而提出的。535.5.矢量量化矢量量化 对于对于PCMPCM数据,一个数一个数数据,一个数一个数地进行量化叫标量量化。若对这地进行量化叫标量量化。若对这些数据分组,每组些数据分组,每组K K个数构成一个个数构成一个K K维矢量,然后以矢量为单元,逐维矢量,然后以矢量为单元,逐个矢量进行量化,称矢量量化。个矢量进行量化,称矢量量化。54数据压缩的基本概念数据压缩的基本概念1.1.什么叫数据压缩?什么叫数据压缩?2.2.多媒体数据压缩的必要性多媒体数据压缩的必要性3.3.多媒体数据压缩的可能性多媒体数据压缩的可能性4.4.数据压缩技术实现的可能性数据压缩技术实现的可能性5.5.数据压缩标准及应用数据压缩标准及应用55