《第1章数字媒体非线性编辑技术概述课件.ppt》由会员分享,可在线阅读,更多相关《第1章数字媒体非线性编辑技术概述课件.ppt(104页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数字媒体新线性编辑技术数字媒体新线性编辑技术part 1 理论部分理论部分 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述本章学习目标本章学习目标 1了解数字媒体的基础知识2了解非线性编辑与合成的基本概念3熟悉非线性编辑系统的功能与作用 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 数字媒体非线性编辑技术是一门新的综合性技术。涵盖内容:电视技术、数字媒体技术和计算机技术的主要领域。关键技术:电影与电视编辑技术、数字视频与音频处理技术、数字图形与图像处理技术、数据压缩、存储技术、多媒体网络技术以及计算机硬件技术等等。应用:电视台、电影厂和音像出版社,
2、多媒体资源制作、网络流媒体制作等计算机传媒领域。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像 数字媒体中的图形与图像主要是指静态的数字媒体形式,它不仅包含着诸如形、色、明、暗等外在的信息显示属性,而且从产生、处理、传输、显示的过程看,还包含着诸如颜色模型、分辨率、像素深度、文件大小、真/伪彩色等计算机技术的内在属性。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像1
3、.图形与图像的区别与联系 区别:图像所表现的显示内容是自然界的真实景物,或利用计算机技术逼真地绘制出的带有光照、阴影等特性的自然界景物。图形实际上是对图像的抽象,组成图形的画面元素主要是点、线、面或简单立体图形等,与自然界景物的真实感相差很大。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像 联系:有时为了更好地利用计算机数字化的特性,图形也可以用图像来表示,图像也可以抽象提取特征转化为图形来表示(这种抽象过程,会使原型图像丢失一些显示信息)。如下图所示。第第1 1章章 数字媒体非
4、线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像2.图形与图像的像素 定义:像素是数字图形与图像中能被单独处理的最小基本单元。从像素的视觉属性看,它是一个最小可视单位。从像素的量值属性看,它的数据结构应同时包含有显示地址、色彩、亮度等数据,这些数据就称为像素值。如果把每个像素值按照图像中该像素所对应的位置排列,就可以构成一个像素矩阵,矩阵中的每一个元素对应图像中的一个点。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字
5、图形与图像数字图形与图像3图形与图像的颜色模型 定义:要将现实世界中的对象在计算机中表示出来,必须依靠不同的定量颜色的方法来实现,这种定量颜色的方法就是颜色模型。分类:(1)RGB模型 RGB模型也称为加色法混色模型。它是以RGB(红、绿、蓝)三基色光互相叠加来实现混色的方法,因而适合于显示器等发光体的显示。当三种基本颜色等量相加时,就会得到不同深浅的灰色。然而物体的颜色是丰富多彩的,任何一种颜色和这三种基色之间的关系可用下面的配色方程来描述:F(物体颜色)=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1
6、1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像(2)CMY模型 CMY模型(Cyan,Magenta,Yellow)是采用青、品红、黄色3种基本颜色按一定比例合成颜色的方法。CMY模型又称为减色法混色模型,因为色彩的显示不是直接来自于光线的色彩,而是光线被物体吸收掉一部分之后反射回来的剩余光线所产生的。光线都被吸收时成为黑色,当光线都被反射时成为白色。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像(3)YUV与YIQ模型 YUV适用于PAL和
7、SECAM彩色电视制式,而YIQ适用于NTSC(National Television System Committee,国家电视系统委员会)彩色电视制式。其中Y是亮度信号,U和V则是两个色差信号,分别传送红基色分量和蓝基色分量与亮度分量的差值信号,在NTSC彩色电视制式中使用YIQ模型,其特性与YUV模型相近。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像(4)HSI颜色模型 HSIHue-Saturation-Intensity(Lightness),HSI或HSL颜色模型用
8、H、S、I三个参数描述颜色特性,其中H定义颜色的波长,称为色调;S表示颜色的深浅程度,称为饱和度;I表示强度或亮度。这些正是颜色的三要素。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像4图形与图像的基本属性(1)分辨率 分辨率是一个统称,分为显示分辨率、图像分辨率等。显示分辨率是指某一种显示方式下,显示屏上能够显示出的像素数目,以水平和垂直的像素数表示。图像分辨率是指组成数字图形与图像的像素数目,以水平和垂直的像素数表示。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编
9、辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像(2)颜色深度 颜色深度是指图像中每个像素的颜色(或亮度)信息所占的二进制数位数,记作位/像素(bits per pixel,bpp)。常见颜色深度种类有:4位:这是VGA标准支持的颜色深度,共16种颜色。8位:这是数字媒体应用中的最低颜色深度,共256种颜色。16位:在16位中,用其中的15位表示RGB三种颜色,每种颜色5位,用剩余的一位表示图像的其他属性。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1
10、数字图形与图像数字图形与图像 24位:用三个8位分别表示RGB,称为三个颜色通道,可生成的颜色数为16 777 216种,约16 M种颜色,这已成为真彩色。32位:同24位颜色深度一样,也是用三个8位通道分别表示RGB三种颜色,剩余的8位用来表示图像的其他属性。(3)Alpha通道 使用32位颜色深度时,用一个8位来表示图像的透明度信息,这个8位通道称为Alpha通道。Alpha通道分为两种类型:Straight和Premultiplied通道。Straight Alpha通道将像素的透明度信息保存在独立的Alpha通道中,它也被称为不带遮罩的Alpha通道。Premultiplied Alp
11、ha通道不但保存Alpha通道中的透明度信息,而且同时保存RGB通道中的相同信息,因而它也被称为带有背景色遮罩的Alpha通道。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像5图形与图像的基本类型 定义:位图是由许许多多的像素组合而成的平面点阵图。其中每个像素的颜色、亮度和属性是用一组二进制像素值来表示的。矢量图是用一
12、系列数学公式来描述或处理一幅图的,描述的对象包括一幅图中所包含的各图元的位置、颜色、大小、形状、轮廓和其他一些特性,也可以用更为复杂的形式表示图像中的曲面、光照、阴影、材质等效果。矢量图和位图的区别:1、矢量图以数学的矢量方式来记录图像内容,它的内容以线条和色块为主;位图以像素点来表示图形,它强调图形是由哪些点构成以及这些点所具有的颜色。2、矢量图文件所占空间小,灵活度高,适合于做网络动画;位图文件较大,灵活性差,适合做网页的背景图片。3、矢量图进行缩放、旋转操作时不会失真,可以用来制作3D图像;位图缩放时会改变它的显示质量。4、矢量图远远没有位图那样逼真,无法像照片那样精确的描绘自然景象,也
13、不易于在软件间交换文件。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像6图形与图像的处理(1)图形处理 数字图形处理包括二维平面及三维空间的图形处理两种。现在图形处理的具体内容主要包括:几何变换,如平移、旋转、缩放、透视和投影等;曲线和曲面拟合;建模或造型;隐线、隐面消除;阴暗处理;纹理产生;配色,等等。(2)图像处理 数字图像处理是指将客观世界中实际存在的物体映射成数字化图像,然后在计算机上用数学的方法对数字化图像进行处理。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线
14、性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.1 1.1.1 数字图形与图像数字图形与图像(3)图形处理与图像处理的区别 图形处理着重研究怎样将数据和几何模型变成可视的图形,这种图形可能是自然界中根本不存在的,即人工创造的画面。图像处理侧重于将客观世界中原来存在的物体映像处理成新的数字化图像,关心的问题是如何压缩数据、如何识别、提取特征、三维重建等内容。实际上,图形与图像在处理与存储时均按各自的特定格式和方法进行,而在屏幕上显示时,二者都是以一定的分辨率和颜色深度在屏幕上以点阵的形式显示出来。1动态图形与图像的视觉原理 人眼具有“视觉暂留”的时间特性,人眼对光像的主观亮度感觉
15、与光像对人眼作用的时间并不同步,主观感觉亮度是逐渐下降的,如图1-2所示。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频图像亮度视觉 t亮度 t t 图1-2 动态图像之间在视觉亮度上的时间重叠特性曲线 新的理论:似动现象定义:人们把客观上静止的物体看成是运动的,或者把客观上不连续的位移看定义:人们把客观上静止的物体看成是运动的,或者把客观上不连续的位移看成是连续运动的现象。成是连续运动的现象。20世纪初,德国心理学家M.韦特海默用实验方法研究了似动现象。他相继呈现一条垂直(a)
16、和一条水平(b)的发亮线段(见图似动现象实验示意),改变两条线段呈现的时距,并测量对它们的知觉经验。结果发现,当两条线段的距离短于30毫秒时,人们看到a、b同时出现;当时距长于200毫秒时,人们看到a、b先后出现;当时距约为60毫秒时,人们看到线段从a向b运动。韦特海默解释说,当视网膜受到两条线段的刺激后,会引起皮层相应区域的兴奋。在适当的时空条件下,这两个兴奋回路之间发生融合,形成短路,因而得到运动的印象。似动主要依赖于刺激物的强度、时间间隔和空间距离。这些物理参数的相互关系可以用科尔特定律来表示:当刺激间的时距不变时,产生最佳运动的刺激强度和空间距离成正比;当空间距离恒定时,刺激物的强度与
17、时距成反比;当强度不变时,时距与空间距离成正比。有人认为,对似动具有重大意义的不是刺激的时距,而是刺激的持续时间。如a、b两个刺激,a呈现100毫秒或更长一些,那么在a、b之间根本没有时距时,也能知觉到最好的运动。近20年来,心理学家们对似动与真正运动的关系、似动的机制、似动中图形因素与运动因素的相互关系、似动的深度效应等等,开展了大量的研究工作。这些研究对揭示人们怎样从周围环境中拾取运动的信息提供了宝贵的资料。因而,动态图形与图像是由多幅连续的、内容相关而又彼此独立的画面序列构成的一种离散型时基媒体形式。非线性编辑系统也正是利用了动态图形与图像序列的这种离散时基特性对序列进行剪切、抽取、插入
18、等操作,但仍然保持新序列的图像之间在视觉亮度上的时间重叠特性,从而完成新的序列编排。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频 1动态图形与图像的视觉原理2视频与动画 动态图形与图像序列根据每一幅画面的产生形式,又分为两种不同的类别。当每一幅画面是人工绘制或计算机生成的画面时,称为动画;当每一幅画面是由各种设备实时获取的自然界景物图时,称为动态影像视频,简称视频。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.
19、1.2 1.1.2 数字视频与音频数字视频与音频3视频信号的描述 当今世界上的三种彩色电视信号制式:PAL制式 YUV颜色模型 NTSC制式 SECAM制式 YIQ颜色模型 我国的电视信号制式是:PAL制 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频3视频信号的描述数字视频是在模拟视频的基础上发展起来的。(1)视频扫描特性 实际上,每秒24幅图像的刷新率虽不会出现停顿现象,但 仍会使人眼感到画面的闪烁,要消除明显的闪烁感就要使画面 刷新率提高一倍,即每秒48次以上(如图1-3所
20、示)。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频图像亮度视觉 t亮度 t t 图1-3 画面刷新率每秒48次以上的视觉亮度上的时间重叠特性曲线 3视频信号的描述 (1)视频扫描特性 视频信号是采用了一种扫描技术来进行传输与呈现的。扫描技术又有隔行扫描和逐行扫描。电视技术中是把一帧图像的每一个像素按从左到右,从上到下的顺序逐点扫描传送的。在PAL制中1 帧图像分625个扫描行,为消除视觉闪烁感,又将原来一帧625扫描行的图像按奇数、偶数扫描行分离为“奇”、“偶”两幅(又称为场)
21、画面,这样,每场画面采用隔行交织扫描方式,共312.5行。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频 信号发送时先发送奇数场,然后再发送偶数场,在接收端先接收到奇数场光栅,将整幅图象大致呈现所示,然后再接收偶数场,并将偶数场图象镶嵌在奇数场图像中,从而得到了精细的整幅图象,如图1-4所示。图a 图b 图c 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频 (a)奇
22、数场图像 (b)偶数场图像 (c)奇、偶数场镶嵌 图1-4 隔行扫描图像再现示意图 除了上述隔行扫描的方式之外,还有逐行扫描的方式,它是计算机屏幕画面显示的基础,具有更好的动态显示效果。作为计算机显示基础的逐行扫描方式已被吸纳到数字高清晰度电视标准中来,电视第一次在大动态画面和高清晰静止画面两方面的显示都达到了较好的平衡。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频 (2)视频扫描格式 目前扫描格式主要有两大类:525/59.94和625/50,即:每帧的行数/每秒的场数。NT
23、SC制的场频准确数值是59.94005994Hz,行频是15734.26573Hz;PAL制的场频是50Hz,行频是1562Hz。在数字技术中经常用水平、垂直像素数和帧频来表示扫描格式。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频 目前数字视频可以分为三种不同的标准:ATSC(Advanced Television Systems Committee,广播行业组织,美国高级电视系统委员会)标准 该标准中14种采用逐行扫描方式。高清晰度电视(HDTV)为19201080F,帧频F
24、为60(59.94)Hz/隔行扫描,帧频30(29.97)Hz/逐行扫描,帧频24(23.92)Hz/逐行扫描;还有(HDTV)1280720F,帧频F为60(59.94)Hz/逐行扫描,帧频30(29.97)Hz/逐行扫描,帧频24Hz/逐行扫描。常规清晰度电视(SDTV)为704 480 F和64O 480 F,帧频F可以是 23.976、24、29.97、30、59.94和60Hz。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频 DVB(The Digital Video
25、Broadcasting Project,数字视频广播节目)标准(是以欧洲为典型的数字视频标准)25Hz帧频的SDTV IRD可以接收扫描格式为72057625、54457625、35257625的图像;3OHz帧频的SDTV IRD可以支持30000/1001Hz的帧频,可以接收扫描格式为72048030、54448030、48068030、35248030和352240O30的图像。对25Hz的HDTV IRD,可以接收扫描格式为1152192OF和10801920F的图像。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1
26、.2 1.1.2 数字视频与音频数字视频与音频 ISDB(Integrated Services Digital Broadcasting,综合业务数字广播)标准 它是由欧洲的DVB-T衍生出来的集中在日本的数字视频标准,可以说是经修改的欧洲方案。与DVB-T相比,ISDB-T增加了部分接收和分层传输功能,是一种标准化的复用方案,可以灵活地集成和发送多节目的电视和其它数据业务。它可以接收的扫描格式与DVB系统相近。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频 (3)像素与帧的宽
27、高比 像素比是指图像中的一个像素的宽度和高度之比,帧宽高比则是指图像一帧的宽度和高度之比。在非线性编辑工作中建立新项目时,根据最终作品的要求都需要设置项目视频画面的帧宽高比,当导入的视频素材使用了与项目设置不同的帧宽高比时,就必须确定如何协调这两个不同的参数值。像素的宽高比为1时是方形像素,其它类型是矩形像素,这主要取决于不同标准的视频图像的水平与垂直像素数目的比值与其帧宽高比是否相同。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频 (4)场及其顺序 视频素材从扫描的形式上看,可
28、以分为交错式和非交错式。在交错视频中,每一帧由两个场(Field)构成,称为奇场(Odd Field)和偶场(Even Field),在Premiere pro中称为上场(Upper Field)和下场(Lower Field),这些场依顺序显示在NTSC或PAL制式的监视器上。在非交错视频中,扫描线是按着从上到下的顺序全部显示的,而计算机图形图像软件是以非交错式显示视频的。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频 (5)SMPTE时间码 SMPTE将以小时:分钟:秒:帧的
29、形式确定每一帧的地址。有几种不同的SMPTE时间码标准,用于不同的帧率。PAL制采纳的是25fps的标准,而NTSC制采纳了29.97fps的标准。但NTSC时间码仍采用30fps的帧速率,这就造成了实际播放和测量的时间长度有0.1的差异。为了定位,制定出一个被称为Drop Frame(掉帧)的格式。多数视频编辑系统既装有掉帧,也装有不掉帧时间码格式。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频4视频信号的数字化 数字化过程包括视频信号的采样、量化与编码3个步骤,一般习惯称其为
30、数字化三步曲。以适当的时间间隔读取模拟信号波形幅值的过程叫“采样”,将采样时刻的信号幅值归整定量的过程叫“量化”,将量化后的一连串整数用一个二进制数码序列来表示叫做“编码”。图1-5是数字化过程的示意图。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频视频信号的数字化标准ITU-601标准,又称为4:2:2标准。即:在每4个连续的采样点上,取4个亮度y的样本值,而色差u、v分别取其第一点和第三点的样本值,共8个样本。除了4:2:2标准外,数字视频的采样格式还有:4:1:1标准,4:
31、4:4标准,4:2:0标准。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频幅 10 9.7 输入波形值 9 8 8.8 7 7.1 6 6 5.8 5 5 4.9 4 3 2 2.3 1 1.4 0 t (a)采 样量 7 7 输入波形化 6 6级 5 5数 4 4 4 4 4 3 2 2 1 1 0 t (b)量 化(3 bit)脉 1 001 100 111 110 100 100 101 100 010冲 0 t (c)编 码 图1-5 采样、量化、编码示意图 第第1 1章
32、章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础1.1.2 1.1.2 数字视频与音频数字视频与音频采样编码量化 5 5数字音频技术数字音频技术 能够被人的听觉感知并且被人们接受的声音信号是一种模拟信号,因为它在时间上和幅值上都是连续(不间断)变化的信号。同模拟视频处理一样,想要将模拟音频在计算机内进行编辑处理,也要通过数字化转换把模拟信号转换为数字音频信号。数字化转换过程,同样由采样、量化和编码构成。由于人耳能听到的声音最高频率为20kHZ,也就是音频的最大带宽为20kHZ,因而根据采样定理要想不失真地重构音频信号,则采样频率必须高于被采样信
33、号所含最高频率的两倍,即采样率只要高于40kHZ就可,这与视频采样速率比较起来低得多。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1.1.2 1.1.2 数字视频与音频数字视频与音频 数字化后的视频与音频信号由于其所具有的庞大的信息量,还难于直接用在非线性编辑的实时处理工作中,因此数字化后的视频与音频信号还必须要经过编码压缩。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压缩编码 1视频信号的压缩编码 定义:在保持信号质量
34、的前提下,设法降低码率及数据量,才能使数字视频标准得到应用。而这种降低码率的过程,被称为压缩编码,或信源编码。原理:信源之所以可以压缩是因为视频图像信息内存在着大量的规律性,或称相关性。由于图像是以块和轮廓组成的,在同一帧内(帧内)或相邻帧之间(帧间)存在着大量相同的内容,在传输的前一个样值中也包含了后一个样值或后一帧中相关位置或相关频率的样值内容,这就是冗余内容。要去除信息中的相关性,去除冗余码,使样值独立,从而提高熵值,降低信息码流。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压缩编
35、码 分类:从视频图像压缩后的质量角度看,压缩方法基本可分成无损压缩和有损压缩两类。无损压缩当数据被压缩之后再进行解压,得到的重现图像与原始图像基本相同。其压缩率通常很小,并不实用。有损压缩有较高的压缩比,虽然解压后得到的重现图像相对于原始图像质量降低了,但引起的微小误差,不足以使人眼察觉。因此,有损压缩是视频处理中更有实用价值的方式。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压缩编码 1视频信号的压缩编码 常用的压缩标准是国际标准化组织推荐的JPEG和MPEG。JPEG是一种针对静止的
36、连续色调的图像压缩方法,它属于帖内压缩(只在本帧范围内去除冗余量)。它可按大约20:1的比率压缩图像,而不会导致太大图像质量和彩色数据的误差,它的压缩和解压是对称的,这样压缩和解压可以使用相同的硬件或软件,而且压缩和解压时间大致相同。非线编系统中经常使用的压缩格式是在JPEG基础上制定的 Motion-JPEG标准,它实现了对视频图像的实时压缩和解压缩。使用Motion-JPEG方式捕获的视频在编辑过程中可以随机编辑任意帧,而与其他帧不相关。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压
37、缩编码 1视频信号的压缩编码 MPEG即运动图像国际压缩标准,是一种不对称的压缩算法,压缩的计算量比解压缩大得多,所以压缩常用硬件来执行而解压缩则用软件、硬件均可执行。由于MPEG压缩形成的数字视频不具有帧的定位功能,因此无法对帧进行编辑处理。在视频制作过程中,往往是非线性编辑系统先采用通用的格式进行编辑,最后再转换成MPEG文件。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压缩编码 1视频信号的压缩编码 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.
38、1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压缩编码 2数字音频的压缩编码 音频数据压缩的方案可以有三方面的考虑,一是降低采样频率,二是降低量化位数,三是去除音频编码中的冗余信息。根据数字信号采样定理的要求,根据音频信号的带宽等因素,人们一般将音频采样频率确定为44.1kHz,不可能再降低了,其目的是确保声音的高质量还原。数字音频的压缩可以从量化方面入手,可以减少每位样本所需要的量化位数,然而这种量化位数的降低应是建立在确保音频质量的基础之上的,过于低的量化位数会导致信息的损失,降低音频质量。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1
39、 1.1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压缩编码 更多的考虑是去除音频编码中的冗余信息。数字音频的压缩可以考虑两个心理声学模型,即绝对听阈和掩蔽效应,以此来确定哪些成分在音频信号内可能是冗余的。图1-6反映了人的绝对听阈的情况。140(db)120 120 方 100SPL 80 80方 60 40 40方 20 0 0方 绝对听阈曲线 -20 20 40 100 200 400 1k 2k 4k 10k 20k f(Hz)图1-6 等响度曲线 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1
40、.1.3 1.1.3 数字压缩编码数字压缩编码 掩蔽阈值/db 80 强音处掩蔽效应 60 原绝对听阈曲线 40 20 0 0 1 2 4 6 8 10 12 14 16 频率/kHz 图1-7 1kHz 声音的掩蔽效应图1-7反映了声音的掩蔽效应。原理:人耳对频域中绝对听阈曲线以下部分的声音无法察觉,因而大量的在绝对听阈曲线以下的音频信号对人耳来说是毫无意义的,因此不必记录或传输。被强音掩蔽了的弱音也无法被人耳察觉,因此同样不必记录或传输。另外可以将音频信号中那些对人耳较不敏感的频率段用较粗的量化步长量化,以便舍去一些次要信息,而对于人耳听觉较敏感的频段则设立较小的量化步长,使用较多的码位来
41、传送,以确保必要的声音信息。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压缩编码 音频压缩格式:WAV、MIDI、MP3等。WAV是Microsoft公司采用的波形声音文件存储格式,主要由外部音源录制后,经声卡转找成数字化信息,以扩展名WAV存储,播放时还原成模拟信号,由扬声器输出,WAV文件直接记录了真实声音的二进制采样数据,通常文件较大,多用于存储简短的声音片断MIDI存放的不是声音采样信息,而是将乐器弹奏的每个音符记录为一连串数字,然后由声卡上的合成器根据这些数字代表的含义进行合成
42、后由扬声器放声音,相对于WAV文件,MIDI文件显得更加紧凑,其文件尺寸通常比声音文件小得多,在多媒体应用中,一般WAV文件存放的是解说词,MIDI存放的是背景音乐MP3是MPEG音频文件的一种有损压缩,压缩比为10:1-12:1,MP3因为其压缩比较高,音质接近CD,制作简单,便于交换等优点,非常适合在网上传播,是目前使用最多的音频格式文件.mp3 wav midi 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压缩编码 数字压缩编码技术是实现非线性编辑的基石。当前的非线性编辑系统中核心
43、的部分就是视频与音频的压缩与解压缩硬件和软件子系统,它在进行非线性编辑的过程中,自始至终担当着对视频与音频信号的压缩与解压缩工作,以达到令人满意的实时处理的视频画面和听觉效果。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.1 1.1 数字媒体基础数字媒体基础 1.1.3 1.1.3 数字压缩编码数字压缩编码 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.2 1.2 非线性编辑基础非线性编辑基础 非线性编辑严格意义上说应该称为数字媒体非线性编辑,是数字媒体技术进入广播电视领域的表征。数字媒体技术给传统影视制作带来的变化是巨大的,这不仅表现在
44、技术手段的数字化上,而且也表现在新的理论和概念上,非线性编辑概念的出现,就是这一变化的体现 1物理剪辑方式 1956年,安培公司发明了磁带录像机,可以利用电视观看编辑的节目了。但节目编辑形式仍沿用了电影的剪辑方式。这种编辑方式对磁带有损伤,节目磁带不能复用,编辑时也无法实时查看画面。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.2 1.2 非线性编辑基础非线性编辑基础1.2.1 1.2.1 影视编辑发展历程影视编辑发展历程 2电子编辑方式 1961年,录像技术和录像机功能不断完善,电视编辑进入了电子编辑时代,可以利用标准的对编系统,实现从素材到节目的转录。电子编辑避
45、免了对磁带的损伤,在编辑过程中也可以查看编辑结果,及时修改。电子编辑的编辑精度不高,无法逐帧重放,带速不均匀造成的接点处出现跳帧现象。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.2 1.2 非线性编辑基础非线性编辑基础1.2.1 1.2.1 影视编辑发展历程影视编辑发展历程 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.2 1.2 非线性编辑基础非线性编辑基础1.2.1 1.2.1 影视编辑发展历程影视编辑发展历程 3时码编辑方式 1967年,美国电子工程研制出了EECO时码系统,1969年,使用SMPTE/EBU时码对磁带位置进行标记
46、的方法实现了标准化,利用基于时码设备的编辑技术和手段不断涌现,编辑精度和编辑效率有了大幅度的提高。但是电视编辑仍无法实现实时编辑点定位功能,磁带复制造成的信号损失也没有彻底解决。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.2 1.2 非线性编辑基础非线性编辑基础1.2.1 1.2.1 影视编辑发展历程影视编辑发展历程 4非线性编辑方式 1970年,美国造出了第一台非线性编辑系统,这种早期的模拟非线性编辑系统将图像信号以调频方式记录在磁盘上,可以随机确定编辑点。80年代出现了纯数字非线性编辑系统,但当时压缩硬件还不成熟,磁盘存储容量也很小,因而视频信号并不是以压缩方
47、式记录的,系统也仅限于制作简单的广告和片头。90年代以后,随着数字媒体技术和存储技术的发展、实时压缩芯片的出现、压缩标准的建立以及相关软件技术的发展,使得非线性编辑系统进入了快速发展时期。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.2 1.2 非线性编辑基础非线性编辑基础1.2.2 1.2.2 非线性编辑概念非线性编辑概念 1线性编辑与非线性编辑 在影视编辑领域,“线性”与“非线性”的概念主要是从视音频信息存储的方式出发来区别的,一般来说,将存储信息的顺序与接受信息的顺序相关或一致的方式称为“线性”,将存储信息与接受信息的顺序不相关或不一致的方式称为“非线性”。人
48、们用“线性“这个词描述磁带存储视音频信号的方式,这是因为磁带存储信息的顺序与接收信息的顺序相关,所以人们也就将基于磁带存储的编辑方式称为线性编辑方式。人们用“非线性“这个词描述数字硬盘、光盘等介质存储数字化视音频信息的方式,这是因为数字化存储信息的位置是按照盘操作系统规则(Software routine,一个软件程序)进行分配的,存储信息与接受信息的顺序可以完全不相关。这样,基于数字硬盘或光盘存储的编辑方式也就被称为非线性编辑方式。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.2 1.2 非线性编辑基础非线性编辑基础1.2.2 1.2.2 非线性编辑概念非线性编辑
49、概念 1线性编辑与非线性编辑 非线编的优势:素材以文件的形式储存在硬盘内,复制调用都很方便,且没有损失。在时间线上可以任意组织素材 特技效果丰富且应用灵活方便 软件界面直观,操作简单,素材查找快速准确 以计算机硬件为平台,维护检修比较容易,软件的维护、维修和升级也比较简单 局限:受计算机硬件影响和制约大 存储介质有可能出现故障 上载素材及输出视频时间长 许多特技由于计算机限制不能实现,且渲染需要时间、修改之后需要重新生成。第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.2 1.2 非线性编辑基础非线性编辑基础1.2.2 1.2.2 非线性编辑概念非线性编辑概念 1线性
50、编辑与非线性编辑 第第1 1章章 数字媒体非线性编辑技术概述数字媒体非线性编辑技术概述 1.2 1.2 非线性编辑基础非线性编辑基础1.2.2 1.2.2 非线性编辑概念非线性编辑概念 2.脱机编辑与联机编辑 “脱机(Off-l1ne)编辑”,即采用较低的分辨率和较大压缩比(如100:1)将所用原始素材捕获到计算机中,按照脚本计划进行编辑操作,完成编辑后输出EDL(Edit Decision List)表。该表又称为编辑决策表,它记录了视音频编辑的完整信息。“联机(On-line)编辑”,即先将EDL表文件输入到编辑控制器内,然后控制广播级录象机以较小压缩比(如2:1)按照EDL表自动进行广播