《数字电视5学习.pptx》由会员分享,可在线阅读,更多相关《数字电视5学习.pptx(100页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、5.1 视频压缩编码标准的发展历程视频压缩编码标准的发展历程5.2 H.261标准标准5.3 JPEG标准标准5.4 MPEG-1标准标准5.5 MPEG-2标准标准5.6 H.263标准标准5.7 MPEG-4标准标准5.8 H.264标准标准第5章 视频压缩编码标准第1页/共100页5.1 视频压缩编码标准的发展历程视频压缩编码标准的发展历程 图像压缩编码标准可分为两大系列:图像压缩编码标准可分为两大系列:MPEG-X 和和 H.26X。MPEG-X 是由国是由国际标准化组织际标准化组织(ISO)和国际电工委员会和国际电工委员会(IEC)提出的标准。提出的标准。H.26X 是由是由国际电信
2、联盟国际电信联盟(ITU)标准委员会提出的,它们标准委员会提出的,它们在数据格式和输出码率之间有如表在数据格式和输出码率之间有如表 所示的对应关系。所示的对应关系。表按时间顺序给出了各种视频压缩编码标准。表按时间顺序给出了各种视频压缩编码标准。第2页/共100页1.ISO/IEC颁布的标准颁布的标准 国际标准化组织国际标准化组织(ISO)是目前世界上最大、最具权威性的国是目前世界上最大、最具权威性的国际标准化专门机构。国际电工委员会际标准化专门机构。国际电工委员会(IEC)是世界上最早的国际是世界上最早的国际性电工标准化机构。性电工标准化机构。MPEG-1是由是由 ISO 和和 IEC 共同委
3、员会中的共同委员会中的 MPEG 组织于组织于1992年制年制定的。它最初用于定的。它最初用于数字信息存储体数字信息存储体上活动图像及其伴音的编码,其上活动图像及其伴音的编码,其数码率为数码率为1.5 Mb/s,图像采用,图像采用CIF格式格式(352288 像素或像素或 352240像像素素),每秒,每秒 30帧,两路立体声伴音的质量接近帧,两路立体声伴音的质量接近CD音质,该标准广泛音质,该标准广泛应用于应用于VCD。MPEG-2是由是由ISO的活动图像专家组和的活动图像专家组和 ITU 的第的第15研究组于研究组于1994年年共同制定的,在共同制定的,在ITU的标准中,被称为的标准中,被
4、称为H.262。MPEG-2作为计算机作为计算机可处理的数据格式,主要应用于数字存储媒体、视频广播和通信领可处理的数据格式,主要应用于数字存储媒体、视频广播和通信领域,它的数码率为域,它的数码率为240 Mb/s。第3页/共100页 随着用户对音频和视频等宽带业务的需求和宽带网络的迅速发随着用户对音频和视频等宽带业务的需求和宽带网络的迅速发展,展,MPEG-2的视频流逐渐被用户接受,的视频流逐渐被用户接受,VOD(Video On Demand,视频点播视频点播)视频流典型速率将达到视频流典型速率将达到 36 Mb/s。HDTV 的出现,是视频业务发展的另一个高级阶段。的出现,是视频业务发展的
5、另一个高级阶段。MPEG 组组织于织于1999年年1月正式公布了月正式公布了MPEG-4(1)版本版本,1999年年12月又公布了月又公布了MPEG-4(2)版本。版本。MPEG组织的初衷是制定一个针对视频会议、视组织的初衷是制定一个针对视频会议、视频电话的超低比特率频电话的超低比特率(64 kb/s以下以下)编码的标准,并打算采用第二代编码的标准,并打算采用第二代压缩编码算法,以支持甚低数码率压缩编码算法,以支持甚低数码率 的应用。的应用。H.264/AVC 标准是当前国际上最新的图像编码标准。它被标准是当前国际上最新的图像编码标准。它被 ITU命名为命名为 H.264,ISO/IEC 则把
6、此标准叫做国际标准则把此标准叫做国际标准 (MPEG-4(10)高级图像编码高级图像编码(AVC)。制定此标准的主要目的就在于。制定此标准的主要目的就在于增强图像的压增强图像的压缩效率缩效率和改善和改善图像数据在网络中的传输图像数据在网络中的传输。H.264标准在当前图像标准中压缩效率是最高的,它比标准在当前图像标准中压缩效率是最高的,它比H.263标标准提高将近一倍。准提高将近一倍。第4页/共100页2.ITU颁布的标准颁布的标准国际电信联盟国际电信联盟(ITU)是联合国的一个专门机构,是国际电信是联合国的一个专门机构,是国际电信界最权威的标准修订组织。界最权威的标准修订组织。H.261是国
7、际电报电话咨询委员会是国际电报电话咨询委员会(CCITT)制定的第一个制定的第一个视视频编码标准频编码标准,它的数码率是,它的数码率是 P64 kb/s,主要应用于,主要应用于ISDN、ATM 等宽带信道上实时的传输声音和图像信息,不适合在等宽带信道上实时的传输声音和图像信息,不适合在 PSTN 和移和移动通信网等带宽有限的网络上应用。动通信网等带宽有限的网络上应用。H.262 也相当于也相当于MPEG-2,它是由,它是由 ITU与与 ISO/IEC 联合开发联合开发的,目前这个标准已经成功地应用在的,目前这个标准已经成功地应用在 DVD、数字广播、数字电视数字广播、数字电视等诸多领域。等诸多
8、领域。为了满足低速率视频通信的应用需要,为了满足低速率视频通信的应用需要,ITU又推出了适于在速又推出了适于在速率低于率低于 64 kb/s 的信道上传输的的信道上传输的 H.263 视频编码标准。视频编码标准。第5页/共100页 H.263 算法所用的基本结构来自算法所用的基本结构来自H.261,并在,并在H.261的基础上做的基础上做了许多重要改进。了许多重要改进。1998年,年,ITU推出的推出的 H.263+是是 H.263 的第二版,的第二版,进一步提高了压缩编码性能。进一步提高了压缩编码性能。2000年制定年制定 H.263+(H.263 第三版。第三版。3.超高清晰度成像超高清晰
9、度成像(HRI)建议建议 HRI 典型空间分辨率的级别的建议如表所示。典型空间分辨率的级别的建议如表所示。第6页/共100页第7页/共100页第8页/共100页第9页/共100页图 视频压缩编码标准的发展历程第10页/共100页4.我国制定的我国制定的AVS标准标准 我国是我国是 ISO/IEC组织的正式成员国,国家信标委下属的多媒组织的正式成员国,国家信标委下属的多媒体分委员会与体分委员会与 ISO/IEC JTC1/SC29直接对口。从直接对口。从2000年年5月开始,月开始,我国科研单位开始跟踪并参与我国科研单位开始跟踪并参与JVT标准的制定工作,目前已有多标准的制定工作,目前已有多项技
10、术提案递交到项技术提案递交到 JVT标准,有些技术已经被标准,有些技术已经被JVT标准所接收。标准所接收。基于我国专家多年参与基于我国专家多年参与MPEG国际标准制定的经验,国际标准制定的经验,2002年年6月成立的月成立的“数字音数字音/视频编、解码技术标准工作组视频编、解码技术标准工作组”联合国内从联合国内从事事数字音数字音/视频编、解码技术视频编、解码技术研发的科研机构和企业,提出了我国研发的科研机构和企业,提出了我国自主的自主的数字音数字音/视频编、解码技术标准视频编、解码技术标准AVS(Audio Video coding Standard)。第11页/共100页 5.2 H.261
11、标准标准 1984年国际电报电话咨询委员会的第年国际电报电话咨询委员会的第15研究组建立了一个专家研究组建立了一个专家组专门研究组专门研究电视电话的编码问题电视电话的编码问题,所用的电话网络为,所用的电话网络为综合业务数据综合业务数据网络网络ISDN,当时的目标是推荐一个图像编码标准,其传输速率为当时的目标是推荐一个图像编码标准,其传输速率为:m384 kb/s,m=1,2,3,4,5。这里这里 384 kb/s 在在 ISDN中称为中称为 H0 通道。通道。另有另有基本通道基本通道 B 的速率的速率为为 64 kb/s,6B384 kb/s。5H0=30B=1920 kb/s 为窄带为窄带
12、ISBN 的的最高速率最高速率。因为以因为以 384 kb/s速率作为起始点偏高,广泛性受限制,另外跨度速率作为起始点偏高,广泛性受限制,另外跨度也太大,灵活性受影响,所以改为也太大,灵活性受影响,所以改为 P64 kb/s,P=1,2,30。最后又把最后又把 P 扩展到扩展到 32,因为,因为3264 kb/s=2084kb/s,其中,其中2084=211,基本上等于基本上等于 2 Mb/s,第12页/共100页 实际上已超过了窄带实际上已超过了窄带 ISDN的最高速率的最高速率1920 kb/s,最高速率也,最高速率也称通道容量。经过称通道容量。经过5年以上的精心研究和努力,终于在年以上的
13、精心研究和努力,终于在1990年年12月月完成和批准了完成和批准了CCITT推荐书推荐书 H.261,即,即“采用采用P64 kb/s的声像业的声像业务的图像编解码务的图像编解码”,H.261简称简称 P64。由于由于H.261标准是用于标准是用于电视电话和电视会议电视电话和电视会议,因此推荐的图像,因此推荐的图像编码算法必须是实时处理的,并且要求最小的延迟时间编码算法必须是实时处理的,并且要求最小的延迟时间(因为图像因为图像必须和语音密切配合,否则必须延迟语音时间必须和语音密切配合,否则必须延迟语音时间)。当。当 P 取取 1 或或 2时,时,速率只能达到速率只能达到128 kb/s,由于速
14、率较低,只能传清晰度不太高的图,由于速率较低,只能传清晰度不太高的图像,因此适合于面对面的电视电话。像,因此适合于面对面的电视电话。H.261标准主要应用在综合业务数字网标准主要应用在综合业务数字网 ISDN 上上传输电视电话传输电视电话会议等低码率会议等低码率的多媒体领域。的多媒体领域。1990年年12月国际电报电话咨询委员月国际电报电话咨询委员会会(CCITT)通过了通过了H.261建议书,即建议书,即“采用采用 p64kbit/s 的声像业务的声像业务的图像编解码的图像编解码”,其中,其中 p=1,2,,32。第13页/共100页一一.图像格式图像格式图像图像纵横比纵横比和每帧图像的纵、
15、横像素数是图像的基本格式,和每帧图像的纵、横像素数是图像的基本格式,并且由此可以推算像素的纵横比。为了使现行各种电视制式,即并且由此可以推算像素的纵横比。为了使现行各种电视制式,即PAL、NTSC、SECAM 制的图像比较容易地转换为电视电话的图制的图像比较容易地转换为电视电话的图像格式,从而便于相互交换,并且速率又较低,像格式,从而便于相互交换,并且速率又较低,H.261采用通用采用通用中中间格式间格式CIF。CIF 规定图像亮度分量规定图像亮度分量 Y 的横向像素为的横向像素为 352 个个,纵向,纵向像素为像素为 288个个。图像。图像色度分量色度分量 Cb、Cr 的纵、横像素数均为亮度
16、分量的一半。的纵、横像素数均为亮度分量的一半。另外,图像尺寸的纵横比为另外,图像尺寸的纵横比为 3 4,与常规模拟电视屏幕尺寸比例一,与常规模拟电视屏幕尺寸比例一致。由此可以推算致。由此可以推算像素的纵横比像素的纵横比为为:像素纵横比像素纵横比=纵纵:横横=第14页/共100页 像素纵横比为像素纵横比为11 12,接近于方形。亮度分量,接近于方形。亮度分量Y 的像素数为色度的像素数为色度分量分量 Cb或或 Cr像素数的像素数的 4倍倍,而,而Y分量像素的面积等于色度分量分量像素的面积等于色度分量 Cb或或Cr像素的面积,可见,色度分量的清晰度比亮度分量的清晰度低,像素的面积,可见,色度分量的清
17、晰度比亮度分量的清晰度低,这对整个图像清晰度基本无影响,因为人眼对色度的分辨率本来就这对整个图像清晰度基本无影响,因为人眼对色度的分辨率本来就低,所以可以利用这种心理视觉冗余度来减少色度像素数。低,所以可以利用这种心理视觉冗余度来减少色度像素数。亮度分量的亮度分量的纵向像素为纵向像素为 288个个,实际上相当于,实际上相当于 288 行扫描线,行扫描线,这是考虑到当前两种电视制式为这是考虑到当前两种电视制式为 625行行25 帧和帧和 525行行30帧,都帧,都是隔行扫描和每帧为是隔行扫描和每帧为2场,所以两种制式的场扫描行数为场,所以两种制式的场扫描行数为6252 和和5252,而,而 28
18、8 扫描行就是由这两种场扫描行数转换来的,即取这扫描行就是由这两种场扫描行数转换来的,即取这两种场扫描行数的平均值:两种场扫描行数的平均值:这样比较容易实现 CIF 与这两种电视制式之间的相互转换。第15页/共100页 由于编码时采用由于编码时采用 88 像素块作为基本单元像素块作为基本单元,因此图像的纵、,因此图像的纵、横像素数均应是横像素数均应是 8 的整数倍,的整数倍,即即 352844,288836,1768 22,1448=18,所以亮度分量和色度分量的所以亮度分量和色度分量的 88块数分别应为块数分别应为4436,2218,即,即亮度分量的块数为各色度分量块数的亮度分量的块数为各色
19、度分量块数的 4倍,故倍,故四个亮度分量块和四个亮度分量块和两个色度分量块共六块两个色度分量块共六块反映的是同一个像区,可以组成一组,称反映的是同一个像区,可以组成一组,称之为之为宏块宏块,用,用 MB表示,这样有利于一起编码。表示,这样有利于一起编码。对于对于625行行25 帧制式,行周期为帧制式,行周期为64 s,其中显示区时间约,其中显示区时间约为为54 s,所以显示区像素数为,所以显示区像素数为:显示区像素数显示区像素数 =显示区时间显示区时间抽样周期抽样周期从显示区中同步地取出从显示区中同步地取出 352 个像素即可。个像素即可。第16页/共100页 对于对于 525行行30 帧制式
20、,行周期为帧制式,行周期为63.555 s,其中显示区时间,其中显示区时间约为约为53s,从显示区中同步地取出,从显示区中同步地取出352个像素即可。个像素即可。当电视电话在当电视电话在 ISDN 网中传输时,若网中传输时,若 P取取 1或或 2,则,则最高速率为最高速率为128 kb/s,CIF 规定的像素仍然太多,因此取规定的像素仍然太多,因此取CIF 规定的纵、横像规定的纵、横像素数的一半,称为素数的一半,称为 QCIF (其中其中Q为为Quarter,即即1/4)。QCIF格式亮度信号的格式亮度信号的横向像素数为横向像素数为176,纵向像素数为,纵向像素数为144。色。色度信号度信号
21、Cb、Cr 的横向像素数为的横向像素数为88,纵向像素数为,纵向像素数为72。Y:176*144*144 Cb、Cr :88*72 QCIF 规格为最低要求,所有电视电话都应该达到此规格,而规格为最低要求,所有电视电话都应该达到此规格,而CIF规格则为任选。规格则为任选。由于现行电话网可以传输的速率在由于现行电话网可以传输的速率在 20 kb/s以下,以下,远比远比 64 kb/s 低,因此要采取降低帧频等措施。低,因此要采取降低帧频等措施。第17页/共100页 另按另按CCIR-601规定量化后色度信号峰峰值为规定量化后色度信号峰峰值为 224等级电平,等级电平,最低电平为最低电平为16,最
22、高电平为,最高电平为240,亮度信号,亮度信号Y量化后的电平有量化后的电平有220级电平,亮度信号最高电平为级电平,亮度信号最高电平为 235,最低电平,最低电平(黑电平黑电平)为为16,其,其亮度信号和色差信号的码电平分配见第亮度信号和色差信号的码电平分配见第 1 章。章。在在 ISDN 中传输电视电话和电视会议时帧频应取中传输电视电话和电视会议时帧频应取 30 Hz。综。综上所述,上所述,H.261标准的图像格式如表标准的图像格式如表 所示。所示。第18页/共100页二二.信源编码器方框图信源编码器方框图图所示为图所示为H.261标准信源编码器方框图。图中图像输入实际上标准信源编码器方框图
23、。图中图像输入实际上是以是以宏块宏块 MB为单位输入的,为单位输入的,MB 中包含亮度信号中包含亮度信号Y 的的 4个个 88像像素方块,色度信号素方块,色度信号 Cb、Cr 的各一个的各一个 88 像素方块像素方块,共,共 6个个 88 像像素方块。下面分段讨论信源编码器方框图。素方块。下面分段讨论信源编码器方框图。图与第图与第4章的图章的图 实质上完全一样,只不过这里更细化了。实质上完全一样,只不过这里更细化了。电视电话的帧频为电视电话的帧频为 30 帧帧/秒。相邻帧由于其内容渐变而有很强秒。相邻帧由于其内容渐变而有很强的相关性,所以允许每两帧传送图像之间可以的相关性,所以允许每两帧传送图
24、像之间可以有有 3 帧不传帧不传。每次场。每次场景更换后,第景更换后,第 1 帧一定要传,所以要对第帧一定要传,所以要对第 1 帧进行帧内编码,所传帧进行帧内编码,所传的这帧称为的这帧称为帧内帧帧内帧,用,用 I(即即 Intraframe 的缩写的缩写)表示。表示。第19页/共100页 图中的第图中的第 5 帧为帧为预测帧预测帧,用,用P 表示,它是由第表示,它是由第 1 帧和第帧和第5 帧本身经过预测编码而得的。帧本身经过预测编码而得的。P 帧本身也可以作为下一个帧本身也可以作为下一个P帧帧预测编码的基础。预测编码的基础。图中的图中的 B 帧称为双向内插帧帧称为双向内插帧,它是由邻近的,它
25、是由邻近的 I、P 帧或帧或P、P 帧计算所得的。由此可知,帧计算所得的。由此可知,I 帧和帧和 P 帧是产生全部帧是产生全部 B 帧的基帧的基础。通常每础。通常每12 帧或帧或 15 帧图像中传帧图像中传 1 帧帧 I 帧,每帧,每 3 帧或帧或 4帧图帧图像中传像中传1帧帧 P 帧。换场景后第帧。换场景后第1帧为帧为I 帧。帧。图 帧内、帧间编码模式计算第20页/共100页图 H.261标准信源编码器方框第21页/共100页第22页/共100页三三.H.261标准信源解码器方框图标准信源解码器方框图图 H.261标准信源解码器方框图第23页/共100页帧内、帧间模式帧内、帧间模式在帧内模式
26、时,编码器送来的宏块在帧内模式时,编码器送来的宏块 MB 量化量化 DCT 系数被送系数被送入去量化器入去量化器 Q1,同时该块,同时该块 MB 的的量化步长量化步长 q 也被送入去量化器也被送入去量化器Q1,于是按照基本公式,于是按照基本公式 F(u,v)=2q Q(u,v)可得可得 DCT系数系数F(u,v),经反,经反 DCT 变换变换 T1 后所得的像素值后所得的像素值 f(x,y)(带撇号表示带撇号表示与原值略有差别与原值略有差别)被送入加法器。被送入加法器。四四.图像复用和解复用图像复用和解复用 1.图像数据的层次图像数据的层次 为了有秩序地传输每帧图像数据,可把为了有秩序地传输每
27、帧图像数据,可把一帧图像数据一帧图像数据分成分成 4个层次个层次,即,即数据块层数据块层、宏块层、块组层宏块层、块组层和和帧层帧层。(1)数据块数据块层用层用B表示。一个数据块包含表示。一个数据块包含 88个像素,亮度和色度个像素,亮度和色度信号均以此数据块作为基本编码单元。信号均以此数据块作为基本编码单元。第24页/共100页 (2)宏块层用宏块层用 MB 表示。一个宏块包含表示。一个宏块包含4个亮度数据个亮度数据块和块和 2个色度个色度数据块数据块(Cb、Cr各各1个个),因此,因此 MB内共有内共有6个数据块,个数据块,其先后顺序其先后顺序如图如图 所示。在宏块中所示。在宏块中Y、Cb、
28、Cr 描述同一像区。描述同一像区。(3)块组块组层用层用GOB表示。一个块组包含表示。一个块组包含 33个宏块个宏块,纵向有,纵向有3行,行,每行有每行有11个,其先后次序如图所示。个,其先后次序如图所示。图 亮度、色度数据第25页/共100页(4)按照按照CIF格式,每帧图像包含的各层次情况如下:格式,每帧图像包含的各层次情况如下:1帧帧CIF图像图像=12GOB =1233 MB =3966 B2376 B=1584B(Y)+396B(Cb)+396B(Cr)=152 064像素像素一帧图像中一帧图像中12块组块组GOB的排列顺序如图的排列顺序如图 所示。若为所示。若为QCIF格式,格式,
29、则像素只有则像素只有CIF格式像素的格式像素的1/4,所以每帧,所以每帧QCIF图像只有图像只有3块组,其块组,其安排顺序如图所示。安排顺序如图所示。图像数据按上述层次安排和传输,有利于图像数据交换和设备图像数据按上述层次安排和传输,有利于图像数据交换和设备兼容。兼容。图 块组GOB中宏块MB安排顺序第26页/共100页图 块组GOB安排顺序第27页/共100页2.图像复用图像复用图像复用把上述层次的数据按一定方式连接起来,构成一帧图像复用把上述层次的数据按一定方式连接起来,构成一帧数据流。一帧数据的安排方式如图所示,图中共有数据流。一帧数据的安排方式如图所示,图中共有4行,以下分行行,以下分
30、行叙述。叙述。图 5.2.9 图像复用构成一帧数据流12块块33宏块宏块6块块第28页/共100页(1)第一行表示包含第一行表示包含一帧数据一帧数据。以帧头数据开始,其后有。以帧头数据开始,其后有12块块组组数据。数据。帧头帧头包含的内容有包含的内容有帧开始码、帧计数码、帧类型信息码帧开始码、帧计数码、帧类型信息码(如帧格式如帧格式CIF或或QCIF等等)、备用插入信息码。、备用插入信息码。(2)第二行为块组第二行为块组GOB数据数据,以块组头开始,其后有,以块组头开始,其后有33宏块宏块数据。数据。块组块组(GOB)头头包含块组包含块组开始码、块组编号码开始码、块组编号码、块组、块组量化步长
31、量化步长(用于整块组,直到有宏块变更量化步长用于整块组,直到有宏块变更量化步长)、备用插入信息码。、备用插入信息码。(3)第三行为第三行为宏块数据宏块数据,以宏块头开始,其后有,以宏块头开始,其后有 6 块数据块块数据块。宏。宏块块(MB)头包含宏块地址码头包含宏块地址码 MBA(H.261提供提供 MBA编码表编码表)、类、类型信息型信息(包括帧内、帧间、运动补偿、滤波器是否使用,包括帧内、帧间、运动补偿、滤波器是否使用,H.261提提供宏块信息编码表供宏块信息编码表)、宏块量化步长、宏块量化步长(一直用到再次变更一直用到再次变更)、运动、运动矢量数据矢量数据 MVD(H.261提供提供 M
32、VD编码表编码表)、编码块图样、编码块图样CBP (用用于说明各块数据中的数据数于说明各块数据中的数据数)。第29页/共100页(4)第四行表明第四行表明数据块数据块 B 中的数据安排,即中的数据安排,即变换系数变换系数TCOEFF的的安排,每块有安排,每块有 88个数据,呈方块形,左上角为直流系数,其个数据,呈方块形,左上角为直流系数,其它均为交流系数,左下角为最高频率交流系数,对应图像信号它均为交流系数,左下角为最高频率交流系数,对应图像信号的最高频率。的最高频率。将这串数据分组,凡是零和零后面的一个数据组成一组。将这串数据分组,凡是零和零后面的一个数据组成一组。前面的一串零称为前面的一串
33、零称为游程游程,用,用 RUN表示,后面的数据称为表示,后面的数据称为量值量值,用用LEVEL表示。对常见的组,表示。对常见的组,H.261 提供了提供了TCOEFF编码表。编码表。对少见的游程,量值用对少见的游程,量值用(RUN,LEVEL)表示,表示,H.261也提供了也提供了TCOEFF编码表。帧间编码的第一个系数是直流差,按上述交编码表。帧间编码的第一个系数是直流差,按上述交流系数方式编码。流系数方式编码。第30页/共100页 5.3 JPEG标准标准 JPEG(Joint Photographic Experts Group)是是联联合合照照片片(静静止止)图像专家组图像专家组的英文
34、缩写。的英文缩写。JPEG用用于于连连续续变变化化的的静静止止图图像像,所所谓谓连连续续变变化化,是是指指灰灰度度等等级级和和颜颜色色两两方方面面的的连连续续变变化化。JPEG包包含含两两种种基基本本压压缩缩方方法法,各有不同的操作模式。各有不同的操作模式。JPEG标准包括标准包括两种基本压缩方法两种基本压缩方法:(1)有有损损压压缩缩方方法法:它它是是以以DCT变变换换为为基基础础的的压压缩缩方方法法,其其压压缩缩比较高,是比较高,是JPEG标准的基础。标准的基础。(2)无无损损压压缩缩方方法法,又又称称预预测测压压缩缩方方法法,是是以以二二维维DPCM为为基基础础的的压压缩缩方方式式,解解
35、码码后后能能完完全全精精确确地地恢恢复复原原图图像像采采样样值值,其其压压缩缩比比低于有损压缩方法。低于有损压缩方法。第31页/共100页 JPEG 编码压缩算法编码压缩算法与与 H.261的帧内模式相同。的帧内模式相同。JPEG系统可系统可选用逐渐浮现重建选用逐渐浮现重建 方式,即重建图像可以整幅由粗到细显示。方式,即重建图像可以整幅由粗到细显示。JPEG 标准标准数据压缩数据压缩是在是在本帧本帧内进行的,与前、后帧无关。内进行的,与前、后帧无关。它也可以用于活动图像中,只不过压缩方法只限于帧内进行,它也可以用于活动图像中,只不过压缩方法只限于帧内进行,不不作运动补偿和帧间差运算作运动补偿和
36、帧间差运算。这种用于。这种用于活动图像的压缩技术活动图像的压缩技术称做称做 M-JPEG,可用于电视台节目编辑中。,可用于电视台节目编辑中。一一.基于基于DCT 的编码器和解码器的编码器和解码器 图图 为基于为基于DCT的编、解码器方框简图。图中输入端为源图像的编、解码器方框简图。图中输入端为源图像数据,分成数据,分成 88 像素块像素块(Blocks)数据后才能输入正向数据后才能输入正向 DCT(即即FDCT)。量化器所需的专用数据表由下方输入。熵编码器所需的。量化器所需的专用数据表由下方输入。熵编码器所需的专用数据表也由下方输入。输出的压缩图像数据可以寄存,也可专用数据表也由下方输入。输出
37、的压缩图像数据可以寄存,也可以直接送到解码器中。以直接送到解码器中。第32页/共100页图 基于DCT的编码器方框简图第33页/共100页 输入解码器的数据中,除了压缩图像数据外,还包含重建输入解码器的数据中,除了压缩图像数据外,还包含重建图像所必需的专用数据表等数据。经过熵解码器、去量化器和图像所必需的专用数据表等数据。经过熵解码器、去量化器和反向反向 DCT(即即IDCT)后,得到重建的图像数据。后,得到重建的图像数据。图 基于DCT的 解码器方框简图第34页/共100页二二.离散余弦变换和离散余弦变换和DCT系数量化系数量化JPEG标准是将二维空间的图像数据标准是将二维空间的图像数据用离
38、散余弦变换用离散余弦变换(DCT)公式变换到公式变换到二维频域成为二维频率系数二维频域成为二维频率系数。变换后的。变换后的系数经量化矩阵系数经量化矩阵量化量化,量化过程请参考,量化过程请参考 节直流节直流(DC)系数量化过程。系数量化过程。对对 DCT变换后的直流系数变换后的直流系数(DC)的处理可参考图的处理可参考图 所示的处理所示的处理方式。方式。三三.熵编码器熵编码器熵编码也称熵编码也称无损编码或无误差编码无损编码或无误差编码,即对,即对DC和和AC系数进行编系数进行编码和解码后,码和解码后,DC和和AC系数恢复原值。熵编码分为两个步骤:其一系数恢复原值。熵编码分为两个步骤:其一为为中间
39、熵编码中间熵编码;其二是其二是可变长度熵编码可变长度熵编码。第35页/共100页四四.数据交换格式数据交换格式静像数据经编码后,得到压缩数据流,即方框静像数据经编码后,得到压缩数据流,即方框 8 输出的可变输出的可变长度熵编码数据流。为了便于交换和储存,需要有统一的交换格式,长度熵编码数据流。为了便于交换和储存,需要有统一的交换格式,同时也便于解码器解码。同时也便于解码器解码。图图 所示为数据交换格式,图中包含一帧图像的压缩数据。以下所示为数据交换格式,图中包含一帧图像的压缩数据。以下按图按图 中的中的4行分行叙述。行分行叙述。(1)第一行为第一行为压缩图像数据压缩图像数据。图中。图中 SOI
40、 表示图像开始。中间方框表表示图像开始。中间方框表示一帧图像数据。最后的示一帧图像数据。最后的 EOI 表示图像结束。表示图像结束。SOI 和和 EOI均称为均称为标记符号,各占标记符号,各占 2 字节字节(Byte)。(2)第二行说明第二行说明帧内包含的数据内容帧内包含的数据内容。首先是表杂项,其中表即。首先是表杂项,其中表即为数据表,如量化表、霍夫曼为数据表,如量化表、霍夫曼 DC 和和 AC 表等,杂项即为其它必要表等,杂项即为其它必要的信息。第二行的帧头的信息。第二行的帧头表示帧头信息表示帧头信息,包含所选方法,包含所选方法(如基线如基线 DCT方法等方法等)、抽样精度、量化位数、源图
41、像行数、每行抽样数、抽样精度、量化位数、源图像行数、每行抽样数、第36页/共100页各分量图像尺寸比例、各分量图像排队次序和分别选用何种量化各分量图像尺寸比例、各分量图像排队次序和分别选用何种量化表等。扫描表等。扫描1表示扫描数据表示扫描数据1,由图中第三行阐述。在此帧内最少,由图中第三行阐述。在此帧内最少包含包含 2 数组内容,即帧头和扫描数组内容,即帧头和扫描1。(3)第三行的第三行的扫描头扫描头(Scan Header)包含扫描起始信息、分量图像包含扫描起始信息、分量图像号码、该分量图像的号码、该分量图像的 参数、熵编码表选择等内容。参数、熵编码表选择等内容。ECS0(Entropy C
42、oded Segment)表示第表示第 0段熵编码,由第四行说明。段熵编码,由第四行说明。RST0(Restart Marker)为重新开始的标记,可以在熵编码段之间插为重新开始的标记,可以在熵编码段之间插入,但最多插入入,但最多插入 8个,按个,按0 7 标号。标号。(4)第四行用于说明第四行用于说明初始和结束的熵编码段初始和结束的熵编码段。各编码段内包含若干。各编码段内包含若干个最小编码单元个最小编码单元MCU,各,各MCU内有一组按次序排列的分量图像内有一组按次序排列的分量图像数据,即压缩后的数据,或称熵编码数据。关于数据交换格式的数据,即压缩后的数据,或称熵编码数据。关于数据交换格式的
43、详细资料,请参阅详细资料,请参阅JPEG标准文件。标准文件。第37页/共100页图 数据交换格式第38页/共100页 5.4 MPEG-1 标准标准 MPEG是是活动图像专家组活动图像专家组(Moving Picture Expert Group)的的英文缩写,它是国际标准化组织英文缩写,它是国际标准化组织(ISO)和国际电工委员会和国际电工委员会(IEC)联联合技术委员会。合技术委员会。MPEG的任务是开发运动图像及其声音的数字编码的任务是开发运动图像及其声音的数字编码标准标准,成立于成立于 1988年。年。最初的任务有三个:实现最初的任务有三个:实现 1.5 Mb/s、10 Mb/s、40
44、Mb/s 的压缩的压缩编码标准,即编码标准,即 MPEG-1、MPEG-2、MPEG-3。但因为。但因为 MPEG-2的的功能已使功能已使 MPEG-3为多余,所以为多余,所以 MPEG-3 于于 1993年年 7月撤消。月撤消。MPEG-4 项目是项目是 1991年年 5月建议,并于月建议,并于 1993年年 7月确认,其目月确认,其目标是标是甚低数码率的音频甚低数码率的音频/视频压缩编码视频压缩编码(数码率低于数码率低于 28.8 kb/s,但实,但实际范围比这要宽得多际范围比这要宽得多)。下面介绍。下面介绍 MPEG-1标准。标准。第39页/共100页 随着数字音频和数字视频技术的广泛应
45、用,随着数字音频和数字视频技术的广泛应用,ISO的活动图像专家的活动图像专家组组(MPEG)在在1991年年11月提出了月提出了 ISO/IEC 11172 标准的建议草案,标准的建议草案,通称通称 MPEG-1标准。该标准于标准。该标准于1992年年11月被通过,月被通过,1993年年 8月公布。月公布。MPEG-1标准适用于数码率在标准适用于数码率在 1.5 Mb/s 左右左右的应用环境,也就是为的应用环境,也就是为CD-ROM、光盘的视频存储和放像所制定的。、光盘的视频存储和放像所制定的。一一.MPEG-1标准的内容标准的内容ISO/IEC 11172 包括三大部分:包括三大部分:(1)
46、ISO/IEC 11172-1:第一部分,系统。第一部分,系统。(2)ISO/IEC 11172-2:第二部分,视频。第二部分,视频。(3)ISO/IEC 11172-3:第三部分,音频。第三部分,音频。MPEG-1标准可以标准可以处理各种类型的活动图像处理各种类型的活动图像,其基本算法对于压,其基本算法对于压缩缩水平方向水平方向 352个像素个像素、竖直方向竖直方向 288个像素个像素的空间分辨力,每秒的空间分辨力,每秒 24/25/30 幅画面的运动图像有很好的效果。如果待处理信号是隔行扫描幅画面的运动图像有很好的效果。如果待处理信号是隔行扫描的图像,则编码前必须将其转换成逐行扫描的格式。
47、的图像,则编码前必须将其转换成逐行扫描的格式。第40页/共100页 MPEG-1标准提供了一些录像机的功能,如正放、标准提供了一些录像机的功能,如正放、图像冻结、图像冻结、快进、快倒和慢放,此外,还提供了随机存储的功能,当然,解码快进、快倒和慢放,此外,还提供了随机存储的功能,当然,解码器这些功能的实现在一定程度上同图像数据的存储介质性质有关。器这些功能的实现在一定程度上同图像数据的存储介质性质有关。总的编、解码过程如图总的编、解码过程如图 所示。所示。图 编码和解码过程第41页/共100页 MPEG-1 标准采用了一系列技术以获得高压缩比:标准采用了一系列技术以获得高压缩比:第一,对色差信号
48、进行亚采样,减少数据量第一,对色差信号进行亚采样,减少数据量;第二,采用第二,采用运动补偿技术运动补偿技术减少帧间冗余度减少帧间冗余度;第三,作二维第三,作二维 DCT变换变换去除空间相关性去除空间相关性;第四,对第四,对 DCT系数进行量化,舍去不重要的信息,将量化后的系数进行量化,舍去不重要的信息,将量化后的 DCT 系数按照频率重新排序系数按照频率重新排序;第五,将第五,将 DCT 系数进行变字长熵保持编码系数进行变字长熵保持编码;第六,对每数据块的直流分量第六,对每数据块的直流分量(DC)进行进行预测差分编码预测差分编码。第42页/共100页 在在 MPEG-1 标准中,考虑到压缩比和
49、随机存取这对矛盾,一标准中,考虑到压缩比和随机存取这对矛盾,一共定义了四种图像类型:共定义了四种图像类型:(1)I 帧图像帧图像,或称,或称 Intra帧图像,采用帧图像,采用帧内编码帧内编码,不参照其它图像,不参照其它图像;(2)P 帧图像帧图像,或称,或称 Predicted 帧图像,它们参照前一幅帧图像,它们参照前一幅 I 帧或帧或 P 帧帧 图像作运动补偿编码图像作运动补偿编码;(3)B 帧图像帧图像,或称,或称双向预测帧图像双向预测帧图像,它们参照前一幅和后一幅,它们参照前一幅和后一幅 I帧帧 或或 P 帧图像作双向运动补偿编码帧图像作双向运动补偿编码;(4)D 类图像,或称直流类图
50、像,或称直流(DC)图像,这类图像中只含直流分量,图像,这类图像中只含直流分量,是为快放功能而设计的。是为快放功能而设计的。第43页/共100页 5.5 MPEG-2 标准标准 MPEG-2 广泛广泛应用于数字电视应用于数字电视(包括包括 HDTV)及数字声音广及数字声音广播、播、数字图像数字图像与声音信号的传输等领域,因而与声音信号的传输等领域,因而 MPEG-2是十分重是十分重要的,也是非常成功的世界统一标准。要的,也是非常成功的世界统一标准。MPEG-2 标准共有标准共有 3 部分:部分:第第1部分是系统部分是系统(Systems)部分部分(ISO/IEC IS 13818-1);第第2