视频监控中数字视频编码技术浅析.pdf-淘文阁

资源描述

《视频监控中数字视频编码技术浅析.pdf》由会员分享，可在线阅读，更多相关《视频监控中数字视频编码技术浅析.pdf（4页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、视频监控中数字视频编码技术浅析视频监控中数字视频编码技术浅析视音频编解码软件技术属于在市场前景好、产业关联度大、关系国民经济发展和国家安全的战略性技术，是数字视音频产业的核心技术。视音频编解码软件的应用场合相当广泛，包括可视电话（固定或移动）、实时视频会议系统、视频监控系统、internet 网视频传输以及多媒体信息存储等。由于安防行业中对监控的视音频信息长期大量存储的迫切需求，视音频编解码技术的最新发展在该行业中得到了快速产业转化，并形成了一定的规模。近年来，迅速发展的安防市场极大促进了视音频编码板卡和数字硬盘录像机(DVR)的技术更新速度。而视音频编码板卡和DVR 的关键技术就是数字视音频

2、编解码技术。国际上视音频编解码标准主要有两大系列：ITU（最初是 CCITT）针对多媒体通信制定的 H.26x 系列视频编码标准和G.7 系列音频编码标准；ISO/IEC 制定的 MPEG 系列标准。中国也成立了自己的中国数字视音频编解码标准化技术工作组（AVS），正在制定自有知识产权的 AVS 标准。在视频监控领域由模拟向数字化的转化过程中，MPEG-1技术起到了无可替代的作用，但近年来，由于 MPEG-4 压缩技术在实时视频监控方面，无论是压缩率，传输的速率，清晰度都比 MPEG-1 具有更大的优势，现在 MPEG-4 在视频监控上占有统治地位。同时，H.264 在低码率高画质方面有很大的

3、优势，相信 H.264 也是未来的发展趋势。本文首先重点讲述 MPEG-4，然后对 H.264 中引进的最新视频编码技术及我国数字音视频编解码技术标准工作组制定的 AVS 标准进行简单的对比介绍。希望通过本文能使大家对视频编码技术有进一步的理解。MPEG-4 视频编码技术 MPEG-4 视频编码标准支持 MPEG-1、MPEC-2 中的大多数功能，它包含了 H.263 的核心设计，并增加了优先特性和各种各样创造性的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码，同时也支持基于内容的图像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)

4、的编码等第二代编码技术是MPEG-4 标准的主要特征。MPEG-4 视频编码系统框图（如图）MPEG-4 视频编码中主要包含以下关键技术：离散余弦编码（DCT）DCT 主要完成图像数据由空域转向频域，各系数相互独立，这意味着各系数可分开处理，同时，图像的高频系数大部分接近于零。人的视觉系统对低频比对高频敏感的多，因此可以用更大的量化步长来量化高频系数，使大部分高频系数为零，从得到较高的压缩比，而人眼很难察觉。量化量化是针对 DCT 变换系数进行的，量化过程就是以某个量化步长去除DCT 系数。量化步长的大小称为量化精度，量化步长越小，量化精度就越细，包含的信息越多，但所需的传输频带越高。不同的

5、DCT 变换系数对人类视觉感应的重要性是不同的，因此编码器根据视觉感应准则，对一个88 的 DCT 变换块中的 64 个 DCT 变换系数采用不同的量化精度，以保证尽可能多地包含特定的DCT 空间频率信息，又使量化精度不超过需要。Intra 块 DC 系数和 AC 系数的帧内预测由于Intra 编码方式的各块之间的 DC 和 AC 有较强的连续性，所以我们量化后可以进一步进行预测。DC和 AC 的预测方向有两个：水平方向和垂直方向。其预测方向主要取决于相邻块 DC 系数的相关性，AC 的预测只对块的第一行或第一列进行预测。是对第一行进行预测还是对第一列进行预测主要取决于预测方向，其预测方向和

6、DC 预测方向一致。之型扫描与游程编码由于经量化后，大多数非零 DCT 系数集中于88 二维矩阵的左上角，即低频分量区，之型扫描后，这些非零 DCT 系数就集中于一维排列数组的前部，后面跟着长串的量化为零的DCT 系数，这些就为游程编码创造了条件。所谓游程编码就是对扫描后64 个系数进行编码：用非0 系数的大小(Level)、其前面连续0 的个数(Run)及终止标志(Last：0便是其后还有不为 0 的系数；1表示该系数为最后不为0 的数，余下的系数全为0)加起来构成一个三维矢量(Last，Run，Level)。然后就可以对这些矢量进行 Huffman 编码。变字长编码（VLC）游程编码形成

7、的三维矢量是一种有效表示方式，实际传输前，还须对其进行比特流编码，产生用于传输的数字比特流。其中用得最多的就是Huffman 编码，Huffman 编码中，根据所有编码信号的概率生成一个码表，码表中对大概率信号分配较少的比特表示，对小概率信号分配较多的比特表示，使得整个码流的平均长度趋于最短。运动估计运动估计用于帧间编码，即 P 帧和B 帧编码。通过在参考帧图像中搜索到与当前块最接近的块。从而使传输的误差块可以用更少的比特表示，从而达到压缩目的。运动估计的准确程度对帧间编码的压缩效果非常重要。运动估计以宏块或块为单位进行，计算被压缩图像与参考图像的对应位置上的宏块或块间的位置偏移。这种位置偏

8、移是叫运动矢量（MV），一个运动矢量代表水平和垂直两个方向上的位移。现在MPEG-4 所用的运动估计算法主要有：MVFAST（Motion Vector Field Adaptive Search Technique），改进的 PMVFAST（Predictive MVFAST）和 EPZS(Enhanced Predictive Zonal Search)算法。运动补偿运动补偿实际上是一种预测编码的思想，因此，运动补偿又可称为运动预测。运动预测的过程为：根据前面在运动估计中得到的匹配MV，在当前宏块/块和参考帧中的匹配宏块/块之间进行预测（即：计算差值），编码器只需对预测误差和使用的MV进

9、行码流编码。帧内图像I 帧不参照任何过去的或者将来的其他图像帧，压缩编码采用类似JPEG压缩算法。每幅图像分成 88 的图像块，对每个图像块进行离散余弦变换 DCT。DCT 变换后对每个系数进行量化，然后对量化后的系数进行DC、AC 预测，对预测后的差值按照 Zig-zag 进行扫描，然后再进行游程编码，最后用霍夫曼(Huffman)编码或者用算术编码得到最后的码流。其中DC 预测后的 DC 差值可直接查表得到对应的码字。预测图像P 帧的编码是以图像宏块为基本编码单元，一个宏块定义为1616 像素的图像块。预测图像P 使用两种类型的参数来表示：一种参数是当前要编码的图像宏块与参考图像的宏块之间

10、的差值，另一种参数是宏块的运动矢量。通过运动估计求得最佳运动矢量，然后通过运动补偿得到的宏块与编码宏块相应像素值之差的到差值模块。然后仿照I 帧编码算法对差值进行编码，计算出的运动矢量也要进行Huffman 编码。双向预测图像B 帧的编码方法与预测图像P 的算法类似。不过，它除了可以参考过去的图像之外，它还参考将来的图像，参考过去帧和将来帧的均值帧。除了这三个参考帧之外，它还有一种参考模式，即直接模式。直接模式就是以将来的P 帧的运动矢量的一半作为自己的运动矢量，以此矢量进行运动补偿，这样的方法连MV都不用编码传输，加上其量化步长一般比I 帧和P帧大，所以可以达到高的压缩率。H.264 视频编

11、码技术 H.264 也称为MPEG-4 的第十部分，它和H.261、H.263 一样，也是采用DCT 变换编码加DPCM 的差分编码，即混合编码结构。同时，H.264 在混合编码的框架下引入了新的编码方式，提高了编码效率，更贴近实际应用。相对于先期的视频压缩标准，H.264 引入了很多先进的技术，包括 44 整数变换、空域内的帧内预测、1/4 象素精度的运动估计、多参考帧与多种大小块的帧间预测技术等。新技术带来了较高的压缩比，同时大大提高了算法的复杂度。高精度、多模式运动估计H.264 支持1/4 或1/8 像素精度的运动矢量。在 1/4 像素精度时可使用 6抽头滤波器来减少高频噪声，对于1/

12、8 像素精度的运动矢量，可使用更为复杂的8 抽头的滤波器。在进行运动估计时，编码器还可选择增强内插滤波器来提高预测的效果。支持 7 种不同模式的块尺寸的运动估计，允许编码器使用多于一帧的先前帧用于运动估计，这就是所谓的多帧参考技术。44 块的整数变换H.264 与先前的标准相似，对残差采用基于块的变换编码，但变换是整数操作而不是实数运算，其过程和DCT 基本相似。这种方法的优点在于：在编码器中和解码器中允许精度相同的变换和反变换，便于使用简单的定点运算方式。统一的VLCH.264 中熵编码有两种方法，一种是对所有的待编码的符号采用统一的VLC（UVLC：Universal VLC），另一种是采

13、用内容自适应的二进制算术编码（CABAC：Context-Adaptive Binary Arithmetic Coding）。CABAC 是可选项，其编码性能比UVLC 稍好，但计算复杂度也高。帧内预测在先前的H.26x 系列和MPEG-x 系列标准中，都是采用的帧间预测的方式。在 H.264 中，当编码 Intra 图像时可用帧内预测。对于每个44 块（除了边缘块特别处置以外），每个像素都可用 17个最接近的先前已编码的像素的不同加权和（有的权值可为0）来预测，即此像素所在块的左上角的 17个像素。显然，这种帧内预测不是在时间上，而是在空间域上进行的预测编码算法，可以除去相邻块之间的空间冗

14、余度，取得更为有效的压缩。中国数字音视频编解码技术标准工作组AVS 是由我国自主制定的音/视频编码技术标准，主要面向高清晰度电视、高密度光存储媒体等应用。AVS 标准以当前国际上最先进的MPEG-4 AVC/H.264 框架为基础，强调自主知识产权，同时充分考虑了实现的复杂度。相对于H.264，AVS 的主要特点有：88 的整数变换与64 级量化；亮度和色度帧内预测都是以88 块为单位，亮度块采用 5 种预测模式，色度块采用 4 种预测模式；采用1616、168、816 和 88 4 种块模式进行运动补偿；在 1/4 象素运动估计方面，采用不同的四抽头滤波器进行半象素插值和1/4 象素插值；P

15、帧可以利用最多 2 帧的前向参考帧，而B 帧采用前后各一个参考帧。结束语我国目前在视音频产业领域已经具备较强的产业基础，但由于不掌握核心技术标准，相关企业长期受制于国外持有标准化专利与技术的企业和组织。视音频编解码软件技术属于在市场前景好、产业关联度大、关系国民经济发展和国家安全的战略性技术，是数字视音频产业的核心技术，发展编解码软件技术，既可以占领编解码软件市场，也是发展数字多媒体产业的基础。视频监控是安全防范行业中的一个核心组成部分，由于安防行业对系统间互联互通需求较低的特殊性及其对视频信息大量存储的迫切需求，随着视频编解码技术的发展，安防行业迅速完成了由模拟向数字视频的转变，并形成了一定的规模，这一转变过程走在了广播电视、通信等信息处理行业的前面。同时我们也应当看到，安防行业的发展趋势是逐步走向远程化、网络化、移动化，这其中必然涉及到通信网的构建技术、传输技术等多个不同层面。随着安防系统的复杂化，安防领域的核心技术问题将转变为信源编码、信道编码、传输质量保证（QoS）等通信领域一直关注的问题。安防行业的发展必将促进通信行业的发展，并最终将在某种层面演变成为通信网上的一个行业应用。来源：中国安防产品网

展开阅读全文