基于宏块内部特征的H264快速预测模式决策算法.pdf-淘文阁

资源描述

《基于宏块内部特征的H264快速预测模式决策算法.pdf》由会员分享，可在线阅读，更多相关《基于宏块内部特征的H264快速预测模式决策算法.pdf（6页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、http:/-1-基于宏块内部特征的基于宏块内部特征的 H.264 快速预测模式决策算法快速预测模式决策算法傅彦，罗引，宋井宽电子科技大学人工智能与数据挖掘实验室，四川成都(610054）E-mail: 摘摘要要:为了提高视频质量同时降低码率，H.264/AVC 采用了 7 种块划分类型，使得在提高编码性能的同时带来了高计算复杂度。本文研究了宏块的内部特征，提出了一种基于宏块内部信息复杂度的快速帧间模式选择算法。试验数据表明，在保证重建图像信噪比的情况下，该算法降低了帧间预测的复杂度，可平均节省 17%到 24%的编码时间，满足了实时视频通信的要求。关键词关键词:H.264；模式选择；

2、运动估计；宏块复杂度中图法分类号中图法分类号:TP 文献标识码文献标识码:A 0 引言引言 H.264/AVC 是由国际电联 ITU-T 的视频编码专家组(VCEG)和国际标准化组织(ISO/IEC)的活动图像专家组(MPEG)联合制定的新一代视频编码新标准1。H.264/AVC 在压缩效率、图像质量、网络适应性等方面具有优越性2，适用于交互、非交互应用环境。与以往的大多数视频编码标准相比（如 MPEG-1/2/4 和 H.261/H.263），新标准的编码效率和对网络的适配性有了极大的提高3。其编码算法可广泛应用于数字电视、无线视频通信和 IP 视频会议等。但是,由于 H.264/AVC

3、编码算法效率高,导致算法复杂、运算量大,给实时视频通信带来困难,以至于不能广泛地被应用。导致编码复杂度大幅度增加的原因有模式选择，熵编码，变换和量化，运动估计等经实验证明，模式选择和运动搜索要耗用整个 H.264 编码器编码时间的 60%(1 个参考帧)到 80%(5 个参考帧)，而且如果采用率失真优化(RDO)算法或更大搜索范围，耗时会更多4。因此,如果能根据某些特征，快速判断出最优模式或者预测出可能的模式范围，就可以避免不必要的计算代价，减少模式选择时间，降低编码的复杂度。在 H.264/AVC 预测帧编码算法的基础上,本文首先利用宏块内部的特征提出了一种首先计算宏块内部信息复杂程度的算法

4、;然后通过得到的宏块信息复杂度来进行模式的快速选择算法。实验结果表明,使用本文提出的模式快速选择算法,在编码图像质量降低很少的情况下,大大提高了帧间预测的速度,满足实时视频通信的要求。1 H.264/AVC 帧间模式决策分析帧间模式决策分析 H.264/AVC 对 P 帧进行编码时，每个亮度宏块可以划分为 4 种尺寸的块(1616、168、816、88)进行运动补偿计算5，对应的预测模式分别记为 MODE1616、MODE168、MODE816、MODE88。如果选择了 MODE88，每个 88 的块还可以进一步划分为子块(84、48、44)，对应的预测模式分别记为 MODE 84、MODE

5、48、MODE44，采用这 7 种类型块的目的是更精确的描述图像的细节。图 1 描述了一个宏块划分模式示例.从编码速度，细节精确程度和最后产生的数据量考虑，H.264/AVC 需要对不同类型的宏块选择相应的块模式.对一帧图像中相对平坦的区域通常选取 MODE1616、MODE168、MODE816的模式进行运动搜索6，而对于发生运动较强烈的区域则采取 MODE88、MODE84、MODE48甚至 MODE44模式。http:/-2-图 1 宏块划分模式示例 H264 的参考模型 Joint Model(JM)使用了基于率失真优化的框架来选择使用何种预测模式。在 JM 中，所有的分块模式都会先执

6、行运动预测。然后利用拉格朗日乘数法选择率失真性能最好的模式。模式判断依据7如下公式：J(s,c,MODE|QP,mode)=SSD(s,c,MODE|QP)+modeR(s,c,MODE|QP)(1)式中 s 表示原始视频信号，c 表示压缩后重建的视频信号，QP 是量化时采用的数值，mode是拉格朗日乘子，MODE 代表在一个宏块中不同的分块模式。SSD 是压缩前后图像残差的平方和。R(s,c,MODE|QP)表示使用不同分块模式时所占用的编码位数。所有不同的分块模式都会通过(1)计算它们的率失真代价，其中代价最小的模式就会被采用。由于对不同的模式都要执行运动预测8，所以这个过程是十分耗费计算

7、时间的。下面提出了一种基于宏块内部信息复杂度的帧间模式选择算法，在不损失率失真性能，保证视频质量的情况下，大大地减少了模式选择的速度。2 基于宏块内部信息复杂性的快速模式选择算法基于宏块内部信息复杂性的快速模式选择算法 21 宏块内部信息复杂度宏块内部信息复杂度在视频序列的编码中，一般对大的平坦的区域，采用的是比较大的帧间分块，如 16169。因为这些区域在多数的情况下都属于同一个物体或者是背景区域。与此相反，对于包含细节比较丰富的区域，该区域同时包含物体边界的几率是很高的，对于包含物体边界的区域，其宏块的内部信息会较为复杂。采用较小的分块模式能更好地预测该域。因此视频图像的宏块内部信息能很

8、好地作为选择帧间分块模式的线索。图2是44子块在一个宏块中的排列情况:取一帧图像中任一个 1616 的宏块，其中有 16 个 44 子块.对左上角第一个 44 子块有如下定义:Diff44(1)=333333,1,21,2,3,000000|iiiii ii iiiiiiiPPPPPP=+(2)图 2 44 子块的排列情况 http:/-3-Diff44即 44 子块内部信息复杂度。Pi,j是块内点的坐标，P0,0即左上角顶点。其他 44子块可以此类推。由(2)可以得到 1616 宏块内部信息复杂度：Diff1616=154 40()iDiffi=(3)同样，8x8 子块内部信息复杂度也可得到

9、:4 44 44 44 44 44 44 44 4(2)(2 1)(24)(25)8 8()(24)(25)(28)(29)DiffjDiffjDiffjDiffjDiffjDiffjDiffjDiffjDiffj+=+(0,1)(2,3)(4)宏块内部信息复杂度即可作为选择 7 种分块模式的依据.当 Diff1616小于阈值 TH1616时，说明该宏块相对平坦，即选择 MODE1616，否则计算 Diff88，当 Diff88小于阈值 TH88则再计算 Diff816，Diff168，若都小于相应阈值 TH816，TH168 则取 Diff 小的分块模式。若 Diff88大于阈值 TH88，

10、则考虑 Diff48，Diff84若小于相应阈值 TH48，TH84 则取 Diff小的分块模式，否则选择 MODE44。这里给出 Diff816，Diff168，Diff48，Diff84的定义:16 8 8 88 8()|(2)(2 1)|DiffjDiffjDiffj=+(j=0,1)(5)8 168 88 8()|()(2)|DiffjDiffjDiffj=+(j=0,1)(6)8 44 44 4()|(2)(2 1)|DiffjDiffjDiffj=+(j=0,.7)(7)4 44 44 84 44 4(0)(4)|()(4)|()|(4)(8)|jjDiffjDiffjDiffjD

11、iffjDiffj=+=+,1,2,3,5,6,7 (8)Diff168，Diff84(j)表示对应块模式的水平方向内部信息的复杂度。Diff816，Diff84(j)则表示对应块模式的垂直方向内部信息的复杂度.当选择 MODE168，MODE84说明水平方向该子块的差异较小，而选择 MODE1616，MODE1616说明垂直方向该子块的差异较小。22 宏块内部信息复杂度模式选择算法流程宏块内部信息复杂度模式选择算法流程如上所述，当宏块存在较大的平坦区域，则选择大宏块模式是比较合适的，而当宏块内部较复杂时，则需要将宏块划分成更小的子块，本算法可以很好的判断处宏块的复杂程度，并且给出最合适的分

12、块方式。算法集体步骤如下:1)计算 16 个 Diff44的值，由(3),(4)得到 Diff1616，Diff88的值.2)如果 Diff1616小于阈值 TH1616，则最佳分块模式即为 MODE1616，转到 7)，否则到3)。3)如果所有 Diff88小于阈值 TH88，则到 4)，否则到 5)。4)计算 Diff168，Diff816的值，如果16 8Diff8 16Diff选择 MODE168模式，否则选择 MODE816，转到 7)。5)如果存在 Diff44都大于阈值 TH44，则选择 MODE44，转到 7)否则到 6)。http:/-4-6)计算 Diff84,Diff48

13、的值,选择8 8Diff，8 4Diff，4 8Diff三者值最小的MODE。到 7)。7)本宏块最佳分块模式选择结束，进入下一宏块模式选择算法。图 3 是该算法的流程图。本算法中，阈值的选取是在量化参数 QP 基础上得到的。即:THij=KQP (9)其中:K 为常数 QP0，51 所以 QP 的取值对得到最优分块模式至关重要。当 QP 增大时阈值 TH 随之增大，模式选择算法速度加快，但是准确性降低，反之算法的速度降低，准确度提高。图 3 算法流程图 3 实验结果及分析实验结果及分析本文将快速模式选择算法应用于 H.264/AVC JM 13.0 中，在不同的量化参数 QP 下，分别测试

14、了不同种类的 QCIF 格式的视频序列，其中 Akiyo.qcif200 帧、News.qcif 200 帧、Foreman.cif150 帧、Bridge_close.cif250 帧。对 4 个序列进行试验，得出改进模式选择和运动搜索算法与 JM 13.0 原算法的性能比较。http:/-5-表 1 编码性能对比数据(P:PSNR，T:TIME(sec)参数 QP=24 QP=28 QP=32 未改进算法改进算法未改进算法改进算法未改进算法改进算法序列 P T P T P T P T P T P T Akiyo 41.68 453.3 41.69 392.3 38.82 460

15、.0 38.81 392.9 36.03 492.7 35.99 405.4 News 40.02 528.6 39.90 438.7 37.18 551.2 37.22 467.8 34.23 576.7 34.18 482.1 Foreman 39.05 2700.8 38.82 2078.6 37.03 2594.3 36.88 1965.4 34.96 2492.1 34.83 2031.6 Bridge 37.83 2844.3 37.85 2137.7 35.80 3337.6 35.78 2599.0 34.17 3241.0 34.15 2575.4 如表 1 为对两个 QCI

16、F，两个 CIF 序列在 QP=24，28，32 时的试验结果，表中正数 P 表示信噪比，T 表示编码耗时。前期的试验分析得到 TH1616=80QP，TH88=34QP，TH44=10QP 时可以得到较高的准确性。可以看出改进的算法比原算法在编码时间上平均减少了17%-24%。而序列的信噪比只有可忽略的降低。可以看出改进的算法在性能上有一定程度提高，同时保持了视频序列的质量。4 结束语结束语块划分模式选择是 H.264/AVC 提高压缩效率和保证图像质量的重要途径，然而采用率失真优化虽然能得到最佳的块划分模式,但该方法计算复杂度非常大。本文提出了 H.264 中利用宏块内部信息的复杂程度的

17、快速帧间模式选择算法，通过量化块内部的信息复杂程度，与阈值进行比较选择最佳的分块模式的方式降低了编码的计算复杂度。从表 2 中的对比数据可以看出文中提出的算法在编码速度方面有较大提高，而且编码速度的提高只以 PSNR 的微小损失作为代价。参考文献参考文献 1Joint Video Team(JVT)of ISO/IEC MPEG and ITU-T VCEG.Draft ITU-T Recommend and Final Draft International Standard of Joint Video Specification(ITU-T Rec.H.264 and ISO/IEC

18、14496-10 AVC),document JVT-G050S,May 2003.2毕厚杰.新一代视频压缩编码标准-H.264/AVC M.北京:人民邮电出版社,2005 3Ahmad A,Khan N,Masud S,et al.Selection of Variable Block Sizes in H.264 AcousticsC/Proc.of IEEE International Conference on Acoustics,Speech and Signal Processing.2004.4王嵩,刘济林,薛全,等.H.264/AVC 中基于全零块检测的运动估计快速算法J.电路

19、与系统学报,2005,10(1):10-14.5Jeon B,Lee J.Fast mode decision for H.264EB/OL.(2003-12-03)2006-08-20.http:/ftp3.itu.Ch/avarch/jvt-site|2003_12_Waikoloa 6成运,戴葵,王志英.H.264/AVC 帧间多种块模式的编码性能分析与研究J.计算机工程与应用,2005,41(5):33-36.7Wu D,Pan F,Lim K P,et a1.Fast inter mode decision in H.264/AVC video coding J.IEEE Trans

20、actions on Circuit and System for Video Technology,2005,15(6):953-958.8N.Ozbek and A.M.Tekalp,Fast H.264/AVC video encoding with multiple frame references,IEEE International Conference on Image Processing,vol.1,pp.597-600,Sept.2005.9JM Reference SoftwareEB/OL.2006-06.http:/bs.hhi.de/suehring/tml/.ht

21、tp:/-6-FAST H.264 Inter-Prediction Mode Decision with Macro-block Information Fu Yan,Luo Yin,Song Jin-kuan College of Computer Science and Engineering,University of Electronic Science and Technology of China,Chengdu (610054)Abstract In the upcoming video coding standard H.264/AVC,motion estimation(M

22、E)is allowed to use seven kinds of block sizes to improve the rate-distortion performance.This new feature has achieved significant coding gain compared to coding a macro-block(MB)using fixed block size.However,ME is computational intensive with complexity increasing linearly to the number of allowe

23、d block sizes.In this paper,A fast inter-prediction mode decision with block complexity information is proposed.The analysis results show that the speed improvement of our proposed algorithm over the primitive algorithm is about 17%to 24%times but with little quality degradation.Keywords:H.264;mode decision;motion estimation;block complexity 作者简介：作者简介：傅彦（1962-），女，四川成都，教授，博士生导师，主要研究方向：数据挖掘、神经网络。

展开阅读全文