《第8章数字电视基础.doc》由会员分享,可在线阅读,更多相关《第8章数字电视基础.doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第8章 数字电视基础 学习指导 本章将介绍数字电视的基础知识,主要内容包括数字电视信号的产生及编码方式、数字高清晰度电视的信号格式、数字电视信号的数码率等。 本章重点为: 8.2 数字电视信号的产生 8.3 数字高清晰度电视 8.4 数字电视信号的数码率 本章难点为: 8.2 数字电视信号的产生 本章选学内容为: 8.5 数字电视信号的压缩 8.6 数字电视信号的误码控制8.1 概述 数字电视技术的发展 数字电视技术是近20年来发展最快的技术之一。总体来看,数字电视技术的发展经历了三个主要阶段。 第一阶段:在20世纪80年代以前,当时以研究开发单独的局部设备为主,投入使用的有数字时基校正器(D
2、TBC)、数字帧同步机、数字特技机等; 第二阶段:是在80年代到90年代,这一阶段的特点是开发成功了数字整机电视设备,如数字录像机、数字信号处理摄像机等; 第三阶段:是在90年代以后,在这一阶段,数字电视技术已开始从单个设备向整个系统发展,一些研究机构提出了全数字化的数字电视广播标准,如DVB、ATSC等,而且数字电视技术与高清晰度电视技术结合在一起,一些发达国家已经开始进行数字电视或数字高清晰度电视系统的试播。 数字电视的优点 所谓数字电视,就是将模拟电视信号经取样、量化和编码后转换成用二进制数表示的数字信号,然后进行各种处理,如编码、调制、传输、存储等。采用数字技术不仅可以使各种电视设备获
3、得比原有模拟设备更高的性能,而且还可以实现模拟技术不能实现的新功能。数字电视技术的优势主要表现在以下几个方面: 在复制或传输等处理过程中,噪声不会累积。数字电视信号只有“0”、“1”两个电平,各种处理过程中产生的噪声只要不超过某个额定电平,通过数字再生技术就可以将其清除掉。即使无法清除,也可以通过纠错编码技术进行误码校正。因此,数字电视信号在复制或传输等处理过程中,信噪比基本保持不变。 数字信号稳定可靠,易于实现存储、计算机处理、网络传输等功能,而且数字电视信号很容易实现加/解密处理。 可充分利用信道容量。数字电视信号可采用时分多路复用方式,在行、场消隐期间实现数据广播。 压缩后的数字信号经调
4、制后可进行开路广播,在设计的服务区内(地面广播),观众能以较高的概论实现“无差错接收”,使收到的电视图像和声音质量接近演播室质量。 可合理利用各种类型的频谱资源。以地面广播为例,数字电视可以启用模拟电视的“禁用频道”(taboo channel),而且可采用“单频网络”(single frequency)技术,例如一套电视节目仅占用同一个数字电视频道就可覆盖全国。 SDTV和HDTV 数字电视包括标准清晰度电视(SDTV)和高清晰度电视(HDTV)。 SDTV:是指对传统的模拟电视(如NTSC、PAL等)信号进行数字化后得到的信号。标准清晰度数字电视系统具有和模拟电视系统相同或相似的扫描格式和
5、参数; HDTV:是新一代的电视系统,其性能和指标都远远超过了标准清晰度电视,扫描格式及参数也完全不同于传统的模拟电视系统。 国际上通常将黑白电视称为第一代电视,将彩色电视称为第二代电视,而将高清晰度电视(HDTV)称为第三代电视。8.2 数字电视信号的产生及编码 1 数字电视信号的产生 从摄像机的光电转换器件得到的电视信号都是模拟信号,将模拟电视信号变成数字电视信号要经过模/数(A/D)转换过程。模/数转换包含三个过程,即取样、量化及编码。其中,取样的目的是将时间上连续的模拟信号变成时间上离散的信号,量化是将幅度上连续的取样值变成幅度上离散的取样值,而编码的作用是将离散化的取样值编成二进制数
6、码。 根据电视信号的特点,其数字化的方式有两种,即复合编码方式和分量编码方式。 复合编码方式:将彩色电视信号作为一个整体进行取样、量化和编码,得到一个数字复合电视信号; 分量编码方式:对亮度信号和两个色差信号分别进行取样、量化和编码,得到三个数字分量电视信号。 另外,对电视信号进行取样时,为了便于行、场、帧间的信号处理,其取样结构一般都采用固定正交结构。 取样结构:指取样点在画面上相对于空间和时间的分布规律; 固定正交取样结构:每一行的样点正好处于前一场和前一行样点的正下方,而且与前一帧的样点重合,如 图8-1 固定正交取样结构 所示。 由于电视画面是以帧、场、行为周期重复的,因此只要将取样频
7、率选择为行频的整数倍,就可保证每一行的取样点数为整数,进而实现固定正交取样结构 量化 量化过程是把取样后的信号幅值归并到有限个幅度等级上,并用一个相应的数据来表示。归并过程使得量化后的信号幅度与取样信号实际幅度之间有偏差,这称为量化误差。量化误差的存在会使重现图像上产生杂波干扰,称为量化杂波或量化噪声。 为了使量化后的电视信号具有足够的信噪比,应尽量减小量化误差,即尽量增加量化级数。在电视信号的模数转换过程中,如果要保证实际图像的量化信噪比大于50dB,则量化级数至少应为256级,即量化比特数为8比特。在有些应用场合,量化比特数可达10比特或更高,这时可得到量化信噪比更高的信号。不过,并不是量
8、化级数越多越好,量化级数增加后,量化比特数也相应增加,导致数码率的增加,这会给后续的信号处理和传输带来很多困难。 编码 编码过程是将量化后的取样值用一组二进制码表示。例如,设量化级数为256级(0255级),即8比特量化,若用自然二进制码方式进行编码,则对应这256个量化值,就可用这一组二进制码表示。 经过取样、量化和编码之后,原模拟电视信号就变成了由一系列“0”、“1”组成的数据流。 3 分量编码方式 取样: 取样结构:固定正交结构。 取样频率:分量编码方式是将亮度信号和色差信号分别进行取样、量化和编码,因此不需考虑色副载波的影响。在选择取样频率时,要考虑以下几个方面: a.为了便于国际间的
9、节目交换,取样频率应能同时兼容625行/50场和525行/60场两种扫描系统。根据取样定理,当亮度信号的上限频率为fm6MHz时,取样频率fs2.2fm13.2MHz。 b.又为了实现固定正交取样结构,fs应为行频fH的整数倍。对于625行/50场系统,行频为15.625kHz;对525行/60场,行频为15.kHz。为了满足兼容要求,取样频率fs应为两种行频的公倍数。 综合考虑上述因素后,分量编码中亮度信号的取样频率选取为13.5MHz。因此,对于625行/50场系统,亮度信号每行取样点数为: 根据亮度信号和两个色差信号取样频率及取样结构之间的关系,分量编码方式可分为4:2:2、4:4:4、
10、4:1:1和4:2:0四种,如 图8-2 几种分量编码方式的取样格式 所示。 4:2:2编码方式:亮度信号的取样频率为13.5MHz,两个色差信号的取样频率均为6.75MHz。显然,这种方式下色差信号的水平分解力是亮度信号的一半。4:2:2编码方式广泛应用于演播室节目制作和传输中。 4:4:4编码方式:亮度信号和两个色差信号(或R、G、B信号)的取样频率均为13.5MHz,且取样结构完全相同。这种方式下,三个信号具有相同的水平和垂直分解力。这种方式一般用在对R、G、B信号进行数字化的场合。 4:1:1编码方式:亮度信号和两个色差信号的取样频率分别为13.5MHz、3.375MHz、3.375M
11、Hz,因此两个色差信号在垂直方向上的分解力与亮度信号相同,但在水平方向上的分解力是亮度信号的1/4。 4:2:0编码方式:亮度信号与色差信号的取样频率与4:2:2方式相同,但两个色差信号每两行取一行,因此在水平和垂直方向上的分解力均为亮度信号的一半。 量化及编码 分量编码方式中,三个分量信号的量化级数均为256(或1024)级,即量化比特数为8比特(或10比特)。有关量化及编码的详细内容请看相关资料:资料8.1 分量信号的量化及编码。 SDTV的基本参数 表8-1 几种分量编码方式的基本参数(625行/50场)列出了上述几种分量编码方式的取样频率及相关参数。其中,每帧有效行数指一帧中正程期间的
12、行数,625行/50场系统规定为576行;每行有效像素数是指数字有效行期间的取样点数。数字有效行相当于模拟电视信号的行正程,但时基上略有不同,如 图8-3 数字有效行 所示。图中OH为每行开始的第一个取样点的位置,即每个数字有效行开始的基准参考点,也是模拟电视信号行同步开始的位置。数字有效行由133852之间的720个样值组成。 资料8.1 分量信号的量化及编码 分量编码方式中,为了将三个分量归一化到相同的动态范围,需要对红色差信号R-Y和蓝色差信号B-Y进行压缩,压缩系数分别为0.5/0.701和0.5/0.886。压缩后的色差信号为: 下图给出了8比特量化时,彩条信号三个分量的量化等级和二
13、进制码。为防止量化过载,不采取从0到255级的全范围量化,而是在上下两端都留出了过载保护带。例如,亮度信号的黑电平和白电平分别对应第16和第235级,即信号的动态范围限制在16235量化级之间,而015级和236255级则为过载保护带。色差信号两端各留出了15个量化级,用于防止量化过载。8.3 数字高清晰度电视 1 高清晰度电视的发展历史及现状 传统的彩色电视广播建立在黑白电视广播基础之上,为了能与黑白电视制式相兼容,它采取了很多技术。尽管这些措施解决了兼容性问题,但同时也带来了很多弊端,如图像亮度和色度分解力较低、存在亮度信号和色度信号之间的相互串扰等等。随着电视的普及和人们鉴赏能力的不断提
14、高,传统彩色电视所提供的图像质量已无法满足人们的要求。人们希望电视图像的质量能够接近35mm胶片的影像质量。出于这一目的,人们开始了新一代电视的研究,这就是高清晰度电视HDTV(High Definition Television)。 高清晰度电视的发展历史可分为两个阶段,即模拟高清晰度电视和数字高清晰度电视。日本从1970年开始研究开发模拟HDTV技术,于80年代提出MUSE制高清晰度电视系统并试播成功。MUSE制的特点是采用了多重亚取样技术,将30MHz的基带信号带宽压缩到了8.1MHz,从而能在一个12GHz的卫星频道中传输。西欧从70年代末也开始了HDTV的研究,后提出了HD-MAC制
15、的高清晰度电视系统方案。HD-MAC制中采用的关键技术是“亚取样”和“行穿插”。经压缩后可将信号带宽降低为原来的四分之一。从本质上讲,MUSE制HD-MAC制都属于模拟电视系统,只不过采用了一些数字处理。而且,它们都无法与现有地面电视广播频道相兼容,只能采用卫星通道传送。后来,随着数字技术的发展,数字高清晰度电视的优势已经越来越明显,日本和欧洲也先后转而研究开发数字高清晰度电视系统。 数字高清晰度电视系统的研究始于美国。美国于1987年开始研究与现有地面电视广播频道兼容的高级电视(ATV:Advanced Television)系统。此系统共有包含高清晰度电视在内的18种数字电视格式,后来被推
16、荐为美国的ATV广播标准,称之为ATSC数字电视标准。美国的数字高清晰度电视的特点是可在NTSC频道中播出。另外,由于采用了数字化传输,因此接收端能得到与演播室相差无几的高质量图像,而且可用很小的功率播出。欧洲在放弃HD-MAC制之后,也开始了数字电视系统的研究开发,目前已形成较为完善的标准,称为DVB(Digital Video Broadcasting)标准。另外,日本也提出了一种全数字广播方案,称为综合业务数字广播ISDB(Integrated Services Digital Broadcasting),用于数字音、视频及数据广播。 目前,世界上许多国家都将HDTV列入数字电视的范畴,
17、有些国家已经制定了符合本国国情的数字高清晰度电视标准。美国制定了数字电视广播的进程表,决定到2006年全面停止模拟电视广播,代之以包括高清晰度电视在内的数字电视广播。目前,美国已有很多电视台播出全数字的标准清晰度电视(SDTV)和高清晰度电视(HDTV)。欧洲对待HDTV的态度是暂不推广HDTV,重点放在SDTV上。日本定于2003年在主要城市开展地面数字高清晰度电视广播。 我国有关部门对高清晰度电视技术非常重视,一直在密切跟踪国际最新技术的进展情况。近年来,我国自行研制成功了多种制式的编解码器、调制解调器、信道编解码器及HDTV接收机等,并于1999年10月1日对建国50周年大典进行了HDT
18、V转播。目前,我国有关部门已组织专家制定完成了HDTV的演播室节目制作及交换标准,其它标准也在制定当中。 2 数字高清晰度电视系统的技术参数 高清晰度电视的定义及主要特点: 国际无线电咨询委员会CCIR(现已归入ITU)将HDTV描述为:高清晰度电视系统的设计要求是使观看者在图像高度的大约3倍距离处观看图像细节时,能达到或接近具有正常视觉锐度的观看者观看原始景物的感觉。也就是说,HDTV系统在垂直和水平方向上的分解力都应比SDTV系统提高一倍。另外,HDTV在图像色彩、声音等方面也都有明显的改善。 总结起来,HDTV系统应具有以下特点: 扫描行数:为了使垂直分解力增加一倍,HDTV系统的每帧图
19、像行数不应少于1000行。ITU-R BT.709建议书中曾给出两种扫描行数,即1125行/帧和1250行/帧。 每行取样点数:为了使水平分解力也增加一倍,HDTV系统的每行取样点数应不少于1800。ITU-R BT.709建议书中给出的每行取样点数为2200和2304,其中每行有效样点数为1920。 画面宽高比:根据双眼的视场清晰范围,HDTV画面宽高比应象宽银幕电影那样在(1.661.85):1的范围内,目前已公认选定了16:9。 方形像素:如果像素在水平和垂直方向上的大小是相同的,则称为方形像素。如果每个像素都是方形像素,则画面水平方向和垂直方向上所能容纳的像素数量之比就应该与画面的宽高
20、比相同。目前计算机行业绝大多数显示标准都符合方形像素原则。为了便于实现与计算机系统的互操作性,以及便于进行图形图像的各种变换,HDTV最好采用方形像素。ITU-R BT.709建议书中专门规定了方形像素的帧格式,即每帧有效行数为1080,每行有效样点数为1920,这样一来,在16:9的画面宽高比情况下,像素即为方形像素。 伴音:HDTV应有高质量的立体声伴音,因此至少须有4路数字化的伴音通道。 兼容:HDTV的信号格式应能比较方便地实现和现有SDTV信号格式之间的相互转换。 我国HDTV基本参数 我国国家广电总局从1999年开始组织专家研究制定我国的数字高清晰度电视行业标准。目前已经制定完成了
21、与演播室节目制作及交换有关的视频及音频参数标准。表8-2 我国数字高清晰度电视标准中的主要参数 列出了其中主要的视频参数值。8.4 数字电视信号的数码率 1 数码率的定义 数码率:系统在单位时间内传送的数据量。在实时传输情况下,数码率等于取样频率与量化比特数的乘积。在数字电视中,数码率的单位通常为Mbps,即兆比特/秒。 2 SDTV系统的数码率 复合编码方式: 当采用8比特量化时,数码率为: 17.72(MHz)8(bit)141.76 Mbps 采用10比特量化时,数码率为: 17.72(MHz)10(bit)177.2 Mbps 4:2:2分量编码方式: 当采用10比特量化时: 亮度信号
22、的数码率为: 13.5(MHz)10(bit)135 Mbps 两个色差信号的数码率为: 26.75(MHz)10(bit)135 Mbps 所以总的数码率为: 亮度信号数码率色差信号数码率270 Mbps 同样可计算出8比特量化时的数码率。 3 HDTV系统的数码率 4:2:2分量编码方式: 当采用10比特量化时: 亮度信号的数码率为: 74.25(MHz)10(bit)742.5 Mbps 两个色差信号的数码率为: 237.125(MHz)10(bit)742.5 Mbps 所以总的数码率为: 亮度信号数码率色差信号数码率1485 Mbps 同样可计算出8比特量化时的数码率。 注:有关数字
23、电视系统的分解力请看相关资料:资料8.2 数字电视系统的分解力。8.5 数字电视信号的压缩 1 数字电视信号压缩的必要性 电视信号数字化后有很多优点,但同时也有一个缺点,即数码率很高。例如4:2:2编码、8比特量化的SDTV信号数码率为216 Mbps。若按每2bit构成一个周期,则传输这样一路数字电视信号需要有108MHz的通道带宽。而对于10比特量化的HDTV信号来说,其数码率达到1485 Mbps,所需的传输通道带宽高达742.5MHz。因此,若不采取措施,这样的信号无法在一般的通道中传输,更无法在现有电视的6MHz带宽中传输。 另外,电视信号数字化之后,数据量非常大。在4:2:2编码、
24、8比特量化情况下,一帧SDTV图像的数据量约为8.6Mb,要记录10分钟的电视节目就需要130Gb的存储器容量;而一帧HDTV图像的数据量为59.4Mb,记录10分钟的节目需要891Gb的存储器容量。可见,若不压缩数据量,就无法在普通的存储设备上实现数字电视信号的存储。 综上所述,要实现数字电视信号的有效存储和传输,就需要采取措施降低其数据量和数码率,也就是说要设法对数字电视信号进行压缩,通常将这一过程称为信源编码。 2 数字电视信号压缩的可能性 电视信号压缩的目的是减小数据量,降低信号传输的数码率。压缩过程实际上就是去除图像中那些与信息无关或对图像质量影响不大的部分,即冗余部分。根据电视信号
25、的特点及人眼的视觉特性,电视信号中存在很多这样的冗余部分,这就为图像压缩提供了可能性。电视信号的冗余性表现在以下几个方面。 时间和空间相关冗余 从统计上看,原始图像数据在空间和时间上都有很大的冗余度,即存在大量无需传送的多余信息。对于大多数电视图像来说,相邻像素之间、相邻行之间图像内容变化很小,即具有很大的相关性(或称相似性),这种相关性称为电视信号的空间相关性或帧内相关性。另一方面,电视信号是利用人眼的视觉特性,借助于快速传送相关画面的方式来再现活动画面的,因此在相邻场或帧的对应像素间也存在很强的相关性,称之为时间相关性或帧间相关性。时间和空间相关性造成了电视信号的冗余,减少这些冗余就可以实
26、现图像压缩。例如,如果相邻两个像素完全相同,则只需传送第一个像素信息,接收端可利用第一个像素信息来恢复第二个像素。再例如,如果相邻两帧中有相同的静止背景,则第二帧画面就无需传送这一背景信息,在接收端完全可利用第一帧的相关信息来恢复第二帧的背景画面。 视觉冗余 人眼的视觉效果是图像质量的最直接也是最终的检验标准,对于人眼难以识别的数据或对视觉效果影响甚微的数据,都可认为是多余的数据,可以省去。这些多余部分就是视觉冗余。例如,通过对人眼视觉特性的研究,发现人眼对静止或缓慢运动图像的灰度等级及图像细节的分辨力很高,而对快速运动图像的灰度等级及图像细节的分辨力却较低。另外,人眼在观察大面积像块时,对灰
27、度等级分辨力很高,而对轮廓细节的分辨力则较低;反之,在观察图像的轮廓边沿等细节部分时,细节分辨力高而灰度等级分辨力又会降低。这些说明人眼接收综合信息的速率有限。利用这些特性,在传送静止图像或缓慢运动图像时,可减小帧率(即每秒钟传送的帧数),同时在景物边沿轮廓等细节区域选择较高的取样频率和较低的量化比特数,而在大面积像块区域选择较低的取样频率和较高的量化比特数;当传送快速运动画面时,则要提高帧率,同时降低取样频率和量化比特数。这就是利用人眼的视觉冗余实现码率压缩的基本方法。 熵冗余 根据信息论,信源熵是指单位符号(如每个量化电平)所包含的信息量,平均码长是指信源编码后单位码字所包含的数据量,符号
28、和码字是一一对应的。当信源中各符号出现的概论相等时,信源熵达最大值,与平均码长相等,即信息量与数据量相同。但一般情况下,信源中各符号的概率不相等,因此,信源熵都小于平均码长,其差值就造成了熵冗余。通过信源编码,可除去熵冗余,使平均码长接近熵值,这样也可以达到压缩码率的目的。 数字电视信号经压缩后可大大降低数码率,所要求的传输带宽也随之降低。压缩后的一路数字电视信号可在通常的模拟电视频道内传输,而且还可在一个频道内传输多套(46套)数字电视节目。因此,信源压缩编码为数字电视信号的传输提供了可能性。 3 数字电视的压缩编码方式 如上所述,电视信号存在多方面的冗余性,因此压缩时采用的编码方式也有多种
29、多样,这些方式可从不同角度进行分类。 按无损和有损压缩编码进行分类 无损压缩编码:也称可逆压缩编码或信息保持编码。采用这种编码方式可使接收端解码后的信息量与发送端原信息量完全相同,因此再现的图像也与原图像严格一致,也即压缩后的图像完全可以恢复或无损伤。 有损压缩编码:又称不可逆压缩编码或信息非保持编码。这种方法在编码过程中会损失一部分信息,因此接收端解码后再现的图像质量会比原图像质量有所降低,即压缩后图像有损伤,不能完全恢复。但如果视觉上能够接受甚至觉察不出质量的降低,则这种压缩就是可行的。这种压缩主要以消去视觉冗余信息为前提,可根据图像质量标准来选定数据压缩的程度。 按帧内和帧间压缩编码进行
30、分类 帧内压缩编码:又称空间冗余压缩编码。这种编码方式是在一帧(或一场)内进行的,它利用了电视图像信号的空间相关性来消除一帧(或一场)内图像的冗余信息。在画面细节较少的情况下,这种方式可实现较大的数码率压缩。 帧间压缩编码:又称时间冗余压缩编码。此方式在相邻帧之间进行,它利用了电视图像信号的时间相关性来消除相邻帧之间的冗余信息。这种方式对于静止图像或缓慢运动图像有很强的压缩能力,但对于快速运动图像,由于其时间相关性降低,因此压缩能力也相应减弱。 按压缩编码原理进行分类 预测编码:预测编码的目的是消除图像信息的空间相关性(帧内预测)和时间相关性(帧间预测)。编码时可从不同区域选取参与预测的像素。
31、如果只选取前一个像素来预测当前像素,称为前值预测;若选取同一行内前几个像素来预测当前像素,称为一维预测;若选取同一行及上一行内若干个像素来预测当前像素,称为二维预测。上述几种预测方式都属于帧内预测。如果除了选取同一行及上一行内相邻像素外,还选取上一帧相关位置上的像素来预测当前像素,则称为三维预测,也即帧间预测。 变换编码:变换编码是利用图像在空间分布上的规律性来消除图像冗余的另一种编码方式,它将原来在空间域内描述的图像信号利用数学运算变换成在另一变换域内描述的信号。在空间上相关性很强的图像信号在变换域上表现为在某些特定区域内能量很集中,即变换系数矩阵具有某种规律性。利用这一规律性即可实现数据压
32、缩的目的。 熵编码:熵编码是一种无损压缩编码方式。前文中提到,若信源熵小于平均码长,则存在熵冗余。熵编码的目的就是去除熵冗余,使平均码长接近熵值,从而实现压缩码率。熵编码的基本思想是对出现概论大的符号(携带较少的信息量)用短的码字编码,对出现概论小的符号(携带较多的信息量)用长的码字编码,这样可使对不同符号编码的平均码长接近于信源熵。上述这些编码方式的压缩效果及实现难易程度各不相同,实际中通常将几种压缩编码方式结合起来,以达到尽量好的压缩效果。 注:有关视频压缩标准的内容请看相关资料:资料8.3 视频压缩标准。 资料8.3 视频压缩标准 JPEG JPEG是联合图片专家组(Joint Phot
33、ographic Experts Group)的简称。该专家组从1996年开始研究用于静止图像的有损压缩方案,此方案于1992年被正式批准为国际标准,成为现在的JPEG静止图像压缩标准。JPEG的基本算法是:首先将一幅静止图像分成若干个88的象素块,对每一个象素块进行DCT变换和系数量化,并利用Z形扫描形成一维量化系数序列;然后对每一象素块的直流系数进行差值脉冲编码(DPCM),即对本象素块直流系数与前一象素块直流系数的差值进行无损编码,而对交流系数进行有损的游程编码(RLC),并在最后加上块结束码(EOB);最后对直流差值码和交流游程码再进行可变字长的霍夫曼(Huffman)编码。 虽然JP
34、EG是针对静止图像进行的压缩方案,但实际上也可以用于动态的视频图像,即在采集时对视频信号的每一帧画面进行JPEG压缩存储,而在重放时将一系列JPEG图像连续放出,这就是早期非线性编辑系统中使用过的Motion JPEG方式。 H.261 H.261是ITU(原CCITT)于1988到1990年制定,并于1990年12月正式批准的数字视频压缩标准,主要应用于通过ISDN电话线的视频会议和视频电话,其比特率为p64Kb/sec,这里p的取值范围是130。 H.261的输入信号格式为通用中间格式(CIF,Common Intermediate Format),即亮、色信号的水平和垂直象素数均为ITU
35、-R 601标准图像的一半。采用逐行扫描方式,最高图像帧率可达30帧/秒,非压缩原始数据率为37.3Mbps。在更低比特率的应用场合中可采用更小的四分之一CIF格式(QCIF,Quarter CIF),这时非压缩原始数据率变为9.3 Mbps。 H.261有两种压缩编码模式,即帧内编码和帧间编码。帧内编码模式类似于JPEG静止图像压缩方法,即以逐块DCT编码为基础。帧间编码模式主要是为了去除电视信号的帧间相关性。在帧间模式下,首先进行带有或不带有运动补偿(MC)的时间预测,然后对帧间预测误差进行DCT编码。每种模式都提供了多个选项,如改变量化器比例参数、使用带有MC的滤波器等。 MPEG 1
36、MPEG是ISO下属的活动图像专家组(Moving Picture Expert Group)的简称,成立于1988年,负责制定视频及其伴音的编码标准。该组织于1990年9月完成了视频算法的定义,于1991年11月提出了编码的建议草案,主要用于数字存储媒介的活动图像及其伴音,比特率为1.5Mbps。这一草案于1992年下半年被正式批准为国际标准,编号为ISO/IEC 11172。这就是著名的MPEG 1视频压缩国际标准。 MPEG 1的输入信号格式为SIF格式的视频及其伴音,采用逐行扫描方式,速率为1.5Mbps,主要应用于交互式多媒体系统中。MPEG 1在1.2Mbps速率下压缩/解压缩SI
37、F格式的视频质量可以和用VHS录象机记录的模拟视频的质量相媲美。在我国较为普及的VCD采用的就是MPEG 1压缩标准。 MPEG 1算法与H.261算法类似,另外它还有自己的一些特点。在MPEG 1中,每一帧彩色图像被分成若干个由1616象素组成的宏块(MB),而若干个宏块可构成一个宏块组(GOB)。MPEG 1有三种压缩编码模式,即帧内压缩编码、前向预测编码和双向预测编码。其中,采用帧内压缩编码的帧称为I帧(又称帧内编码帧,Intra Coded Frames)。一般只对一些关键帧进行帧内压缩编码,编码方式与JPEG方式相似。采用前向预测编码的帧称为P帧(又称前向预测帧,Predicted
38、Frames),它是前一个I帧或P帧的预测帧,也采用DCT编码。另外,与采用双向预测编码相对应的帧称为B帧(又称双向预测帧,Bi-Directional Frames)。B帧插在I、P或P、P之间,是从相邻最近的I帧或P帧作双向预测进行编码。 MPEG 2 MPEG 2是1994年公布的另一视频压缩标准(编号为ISO/IEC 13818),主要用于数字电视。实际上,MPEG 2是MPEG 1的兼容扩展,可广泛用于各种速率(2-20Mbps)和各种分辨率的情况,而且可接受隔行扫描的输入信号。 MPEG 2的一个主要特点是有多种描述格式,它包含很多类(Profile)和级(Level)。其中,“级
39、”指的是输入信号的格式。MPEG 2有四种输入信号格式,即有四级。最低级与MPEG 1的输入信号格式相同,为SIF格式;最高级为HDTV信号格式。主级(即典型的输入信号格式)为ITU-R 601规定的数字电视信号格式。 “类”指的是不同的处理方法。MPEG 2共有五类,每一类都包括压缩和使用方法的一个集合。不同的类意味着使用不同集合的码率压缩工具,类越高则编码越精细。 MPEG 2的基本算法也是基于运动补偿的预测和带有DCT的帧间内插编码。与MPEG 1的主要区别是:MPEG 2支持场预测和帧预测,允许4:2:2和4:4:4色度再取样等。 MPEG 4 MPEG 4是MPEG专家组于1994年
40、开始制定,并于1998年11月得到批准的一个新的视频压缩标准(编号为ISO/IEC 14496)。其主要目的是提高多媒体业务的交互性。与MPEG 1和MPEG 2所不同的是,MPEG 4标准是对图像中的某个内容进行编码,其具体的编码对象就是图像中的音频和视频对象,称为AV对象。因此,MPEG 4标准就是围绕着AV对象的编码、存储、传输和组合而制定的。 MPEG 4标准支持多种输入视频格式。亮度空间分辨率可以是88到20482048之间的任一格式;色度空间可以是单色、Y/Cr/Cb加上一个Alpha通道,或是R、G、B;取样格式可为4:0:0,4:2:0,4:2:2和4:4:4;还可支持逐行和隔
41、行扫描。 MPEG 4的视频编码主要由两个部分组成,即形状编码和传统的纹理、运动信息编码。其中纹理编码、运动预测和运动补偿部分在原理上与以前的MPEG标准基本一致,而形状编码则是第一次引入到视频压缩标准中。能够表示AV对象形状的信息有两类,即二值形状信息和灰度信息。另外,MPEG 4还提出了分级编码的概念,它对系统在时间、空间及质量方面提供了一定的伸缩性,使解码系统可按具体的信道带宽、系统处理能力、显示能力及用户需求进行多分辨率的解码。8.6 数字电视信号的误码控制 1 误码控制的必要性 数字电视信号经信源压缩编码后大大节省了传输带宽,提高了频带利用率,使传输成为可能。但是,对于一个实际的数字
42、系统来说,不仅要实现传输,而且要实现可靠的传输。 虽然数字信号比模拟信号有更高的抗干扰能力,但由于信道特性不理想以及内外杂波的影响等原因,使接收到的数字信号不可避免地会发生错误,即误码,从而造成信息失真。另外,经过高倍压缩之后的数字电视信号对传输干扰变得非常敏感。在模拟电视中,传输干扰一般仅造成雪花干扰,但在数字电视中则可能造成图像的大块失真,严重时甚至完全解码不出正确的数据,表现为图像和声音的重现彻底崩溃。定性来说,压缩倍数越高,数字电视对传输干扰的抵抗能力越弱,即同样的传输干扰在解码恢复图像或声音时造成的损伤就越严重,因此对传输可靠性的要求也就越高。 综上所述,要实现数字电视信号的可靠传输
43、,就需要采取一定措施对误码进行控制,以保证接收端在较差的接收条件下也能准确恢复数据。误码控制通常包括误码检测和误码校正两个方面,可通过特定的纠错编解码技术实现。通常将实现误码控制的编(解)码过程称为信道编(解)码。 2 误码控制的基本原理 误码控制是通过特定的纠错编码技术实现的。纠错编码是数字通信所特有的一种处理方式,它利用数字信号可以进行数值计算这一特点,将若干个数字信号组成一个码组,按照某种运算法则进行数值运算,然后将运算结果(也是数字信号)附加在码组后面一起传送给接收机。由于每个信号码组与它们的运算结果之间保持着一定的关系,所以如果传输过程中发生了错误,这种运算关系就会遭到破坏。接收端按
44、照规定的运算法则对接收到的每个信号码组及其运算结果进行检查,如符合运算关系,则认为信号中没有误码。如不符合运算关系,则说明发生了误码。 根据编码方式的不同,纠错编码一般可分为前向纠错和后向纠错两类方法。前向纠错是使信源代码本身包含检错纠错能力,当接收端检测出误码后,可在一定范围内进行纠错。这种编码一般称为FEC(前向误码控制编码),在数字电视中普遍采用。后向纠错是当接收端发现有误码时,立即通过反馈信道请求发送端重发。这种方式称为反馈重发,在点对点的交互通信中可以采用,而在点对面且实时性很强的单向广播中显然不适用。 另外,还有一种掩错方式。由于电视信号具有空间和时间相关性,故当误码范围过大而接收
45、端无法纠正时,可以利用前面已接收、存储的相关数据来代替,这与反馈重发类似。 3 误码控制方式 误码控制的编码方案有很多种,可从不同角度进行分类。 按照基本功能可分为检错码、纠错码和纠删码。检错码只能检错不能纠错;纠错码既能检错又能纠错;而纠删码不仅具备纠错码的能力,而且当误码数量超过纠错能力时,可将无法纠错的该部分信息删除,或者再配合以掩错措施。 按照误码产生的原因不同,又可将纠错码分为用于随机误码的纠错编码和用于突发误码的纠错编码。前者主要针对产生偶发性误码的信道,如高斯信道等;后者主要针对产生短暂误码的场合,如瞬时脉冲干扰或瞬间信号丢失等情况。 按照信息码组与附加数据之间的运算关系可分为线性码和非线性码。如果两者之间具有线性关系,即满足一组线性方程,就称为线性码;否则,就称为非线性码。目前使用较多的编码方式都是线性码。 按照信息数据与附加数据之间约束关系的不同,可分为分组码和卷积码。在分组码中,每组的监督码元仅与本组内的信息码元之间有确定的检验关系,而与其它组的信息码元无关;而卷积码则不同,其监督码元数据值不仅与本组的信息码元有关,而且还与其前面的若干组信息码元之间有约束关系。 图8-4 误码控制编码方式的分类 列出了几种常见的误码控制编码方式。