《多媒体技术与应用1ppt课件.PPT》由会员分享,可在线阅读,更多相关《多媒体技术与应用1ppt课件.PPT(100页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多媒体技术与应用1ppt课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望 理解多媒体、多媒体技术的概念 明确多媒体中的主要元素及其特点 了解多媒体的关键特性以及这些特 性之间的关系 了解多媒体的关键技术、主要应用 领域和发展方向 了解多媒体数据中的冗余以及几种 主要压缩算法学习目标1.1 多媒体的基本概念1.2 多媒体技术的应用与发展1.3 多媒体的关键技术1.4 多媒体信息的计算机表示1.5 多媒体数据压缩技术1.6 多媒体与因特网目录1.1 多媒体的基本概
2、念1.1.1 多媒体的定义1.1.2 多媒体技术及其特性1.1.3 多媒体中的媒体元素及其特征1.1.1 多媒体的定义“多媒体”一词译自英文“Multimedia”即“Multiple”和”Media”的合成其核心词是媒体何谓多媒体呢?媒质:存储信息的实体,如磁盘、光盘、磁带、半导体存储器等。媒介:传递信息的载体,如数字、文字、声音、图形和图像等。媒体(medium)在计算机领域有两种含义:即媒质和媒介。通常概念的“媒体”,可分为以下五种类型:感觉媒体表示媒体显示媒体存储媒体传输媒体感觉媒体:能直接作用于人们的感觉器官,从而能使人产生直接感觉的媒体。如语音、音乐、各种图像、动画、文本等。表示媒
3、体:为了传送感觉媒体而人为研究出来的媒体。借助于此种媒体,便能更有效的存储或传送感觉媒体。如语言编码、电报码等。显示媒体:用于通信中使电信号和感觉媒体之间产生转换用的媒体。如输入、输出设施,键盘鼠标器、显示器、打印机等。存储媒体:用于存放某种媒体的媒体如纸张、磁带、磁盘、光盘等。传输媒体:用于传输某些媒体的媒体,如电话线、电缆光纤等。多媒体计算机技术的定义:计算机综合处理多种媒体信息,文本图形、图像、音频和视频,使多种信息建立逻辑连接,集成为一个系统并具有交互性。1.1.2 计算机技术及其特性多媒体计算机技术的三个主要特性信息载体的多样性交互性集成性信息载体的多样性是相对于计算机而言的,即指信
4、息媒体的多样性。多媒体就是要把计算机处理的信息多样化或多维化,从而改变计算机信息处理的单一模式,使人们能交互的处理多种信息。信息载体的多样性交互性多媒体的交互性是指用户可以与计算机的多种信息媒体进行交互操作从而为用户提供了更加有效地控制和使用信息的手段。集成性集成性是指以计算机为中心综合处理多种信息媒体,它包括信息媒体的集成和处理这些媒体的设备的集成。信息媒体的集成包括信息的多通道统一获取、多媒体信息的统一组织和存储、多媒体信息表现合成等方面。多媒体设备的集成包括硬件和软件两个方面。多媒体媒体元素是指多媒体应用中可显示给用户的媒体组成。1.1.3 多媒体中的媒体元素及特征音频动画视频文本图形图
5、像文本文本分为非格式化文本文件和格式化文本文件。非格式化文本文件:只有文本信息没有其他任何有关格式信息的文件,又称为纯文本文件。如“.TXT”文件。格式化文本文件:带有各种文本排版信息等格式信息的文本文件。如“.DOC”文件。图形图形(Graphic)一般指用计算机绘制的画面,如直线、圆、圆弧、矩形、任意曲线和图表等。图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图。用于产生和编辑矢量图形的程序通常称为“draw ”程序。微机上常用的矢量图形文件有:“.3DS”(用于 3D 造型)、“.DXF”(用于
6、CAD)、“.WMF”(用于桌面出版)等等。由于图形只保存算法和特征点,因此占用的存储空间很小。但显示时需经过重新计算,因而显示速度相对慢些。图像 图像(Image)是指由输入设备捕捉的实际场景画面,或以数字化形式存储的任意画面。静止的图像是一个矩阵,阵列中的各项数字用来描述构成图像的各个点(称为像素点 pixel)的强度与颜色等信息。这种图像也称为位图(bit-mapped picture)。用于生成和编辑位图图像的软件通常称为“paint”程序。图像文件在计算机中的存储格式有多种,如 BMP、PCX、TIF、TGA、GIF、JPG 等,一般数据量都较大。图像处理时要考虑三个因素:分辨率图像
7、深度与显示深度图像文件大小分辨率屏幕分辨率:显示器屏幕上的最大显示 区域,即水平与垂直方向 的像素个数。图像分辨率:数字化图像的大小,即该 图像的水平与垂直方向的 像素个数。像素分辨率:像素的宽和高之比一般为 1:1。图像深度和显示深度图像深度(也称图像灰度、颜色深度)表示数字位图图像中每个像素上用于表示颜色的二进制数字位数。显示深度:表示显示器上每个点用于显示颜色的 2 进制数字位数。若显示器的显示深度小于数字图像的深度,就会使数字图像颜色的显示失真。颜色深度颜色总数图像名称12单色图像416索引16 色图像8256索引256 色图像1665536HIColor 图像2416672216Tr
8、ue Color 图像颜色深度与显示的颜色数目图像文件大小用字节表示图像文件大小时,一幅未经压缩的数字图像的数据量大小计算如下:图像数据量大小=像素总数图像深度8例如:一幅 640480 的 256 色图像为64048088=307200 字节Comparison:宽度:271高度:300颜色:2大小:9.9 KB宽度:271高度:300颜色:4大小:19.8 KBComparison:宽度:271高度:300颜色:256大小:79.4 KB宽度:271高度:300颜色:真彩色大小:238.2 KB音频数字音频(Audio)可分为波形声音语音和音乐。波形声音实际上已经包含了所有的声音形式,它可
9、以将任何声音都进行采样量化,相应的文件格式是WAV 文件或VOC文件。语音也是一种波形,所以和波形声音的文件格式相同。音乐是符号化了的声音,乐谱可转变为符号媒体形式。对应的文件格式是MID 或CMF 文件。计算机音频技术主要包括声音的采集、数字化、压缩/解压缩以及声音的播放。数字化主要包括采样和量化这两个方面。采样频率(sampling rate)是将模拟声音波形转换为数字时,每秒钟所抽取声波幅度样本的次数,单位是Hz(赫兹)。量化数据位数(也称量化级)是每个采样点能够表示的数据范围,经常采用的有8 位、12 位和16 位。例如,8 位量化级表示每个采样点可以表示256 个不同量化值,而16
10、位量化级则可以表示65536 个不同的量化值记录声音时,如果每次生成一个声道数据,称为单声道;每次生成两个声波数据,称为立体声(双声道)。数字音频的存储量:可用以下公式估算声音数字化后每秒所需的存储量(未经压缩的)存储量=采样频率量化位数8例如,数字激光唱盘(CD-DA)的标准采样频率为44.1 kHz,量化位数为16 位,立体声。一分钟 CD-DA 音乐所需的存储量为 44.1 K162608=10584 KB若使用双声道,存储量再增加一倍Sampling Resolution8 bitSamplingFrequency11 KHz+127+64+320-32-64-12801001010C
11、omparison:Sampling Resolution16 bitSamplingFrequency22 KHz+32767+512+1280-128-512-327680010101100011000Comparison:动画是活动的画面,实质是一幅幅静态图像的连续播放。动画的连续播放既指时间上的连续,也指图像内容上的连续。计算机设计动画有两种:一种是帧动画,一种是造型动画。动画帧动画是由一幅幅位图组成的连续的画面,就如电影胶片或视频画面一样要分别设计每屏幕显示的画面。造型动画是对每一个运动的物体分别进行设计,赋予每个动元一些特征,然后用这些动元构成完整的帧画面。动元的表演和行为是由制作
12、表组成的脚本来控制。存储动画的文件格式有FLC、MMM等视频视频是由一幅幅单独的画面序列(帧frame)组成,这些画面以一定的速率(fps)连续地投射在屏幕上,使观察者具有图像连续运动的感觉。视频文件的存储格式有AVI、MPGMOV等。视频标准主要有NTSC制和PAL制两种。NTSC 标准为30fps,每帧525行。PAL 标准为25fps,每帧625行。视频的技术参数有:帧速数据量图像质量1.2 多媒体技术的应用与发展1.2.1 多媒体技术的应用1.2.2 多媒体技术的发展方向1.2.1 多媒体技术的应用就目前而言,多媒体技术已在商业教育培训、电视会议、声像演示等方面得到了充分应用。在教育与
13、培训方面的应用在通信方面的应用在其他方面的应用在教育与培训方面的应用多媒体技术使教材不仅有文字、静态图像,还具有动态图像和语音等。使教育的表现形式多样化,可以进行交互式远程教学。利用多媒体计算机的文本、图形、视频、音频和其交互式的特点,可以编制出计算机辅助教学 CAI(Computer Assisted Instruction)软件,即课件。在通信方面的应用多媒体技术在通信方面的应用主要有:可视电话视频会议信息点播(Information Demand)计算机协同工作 CSCW(Computer Supported Cooperative Work)信息点播有桌上多媒体通信系统和交互电视ITV
14、。计算机协同工作CSCW是指在计算机支持的环境中,一个群体协同工作以完成一项共同的任务。计算机的交互性,通信的分布性和多媒体的现实性相结合,将构成继电报电话、传真之后的第四代通信手段。在其他方面的应用多媒体技术给出版业带来了巨大的影响,其中近年来出现的电子图书和电子报刊就是应用多媒体技术的产物。利用多媒体技术可为各类咨询提供服务,如旅游、邮电、交通、商业、金融、宾馆等。多媒体技术还将改变未来的家庭生活,多媒体技术在家庭中的应用将使人们在家中上班成为现实。1.2.2 多媒体技术的发展方向目前,多媒体主要从以下几个方向发展:多媒体通信网络环境的研究和建立将使多媒体从单机单点向分布、协同多媒体环境发
15、展,在世界范围内建立一个可全球自由交互的通信网。对该网络及其设备的研究和网上分布应用与信息服务研究将是热点。1利用图像理解、语音识别、全文检索等技术,研究多媒体基于内容的处理、开发能进行基于内容的处理系统是多媒体信息管理的重要方向。多媒体标准仍是研究的重点:各类标准的研究将有利于产品规范化,应用更方便。它是实现多媒体信息交换和大规模产业化的关键所在。23多媒体技术与相邻技术相结合,提供了完善的人机交互环境。多媒体仿真智能多媒体等新技术层出不穷,扩大了原有技术领域的内涵,并创造新的概念。多媒体技术与外围技术构造的虚拟现实研究仍在继续进展。多媒体虚拟现实与可视化技术需要相互补充,并与语音、图像识别
16、、智能接口等技术相结合,建立高层次虚拟现实系统。45将来多媒体技术将向着以下六个方向发展;1).高分辨化,提高显示质量;2).高速度化,缩短处理时间;3).简单化,便于操作;4).高维化,三维、四维或更高维;5).智能化,提高信息识别能力;6).标准化,便于信息交换和资源共享。.3 多媒体的关键技术1.3.1 视频音频数据压缩/解压缩技术1.3.2 多媒体专用芯片技术1.3.3 大容量信息存储技术1.3.4 多媒体输入与输出技术1.3.5 多媒体软件技术1.3.6 多媒体通信技术1.3.7 虚拟现实技术1.3.1 视频音频数据压缩/解压缩技术研制MPC需要解决的关键问题之一是要使计算机能适时地
17、综合处理声、文图信息。选用合适的数据压缩技术,有可能将字符数据量压缩到原来的1/2左右,语音数据量压缩到原来的1/2-1/10,图像数据量压缩到原来的1/2-1/60。如今已有压缩编码/解压缩编码的国际标准JPEG 和MPEG。1.3.2 多媒体专用芯片技术专用芯片是多媒体计算机硬件体系结构的关键。为了实现音频、视频信号的快速压缩、解压缩和播放处理,需要大量的快速计算,只有采用专用芯片,才能取得满意的效果。多媒体计算机专用芯片可归纳为两种类型:一种是固定功能的芯片;另一种是可编程的数字信号处理器(DSP)芯片。1.3.3 大容量信息存储技术利用数据压缩技术,在一张CD-ROM光盘上能够存取70
18、多分钟全运动的视频图像或者十几个小时的语言信息或数千幅静止图像。在CD-ROM 基础上,还开发了 CD-I和CD-V、可录式光盘CD-R、高画质、高音质的光盘DVD以及PHOTO CD 等。1.3.4 多媒体输入与输出技术 多媒体输入/输出技术包括媒体变换技术、媒体识别技术、媒体理解技术和综合技术。媒体变换技术是指改变媒体的表现形式。如当前广泛使用的视频卡、音频卡(声卡)都属媒体变换设备。媒体识别技术是对信息进行一对一的映像过程。例如,语音识别技术和触摸屏技术等。媒体理解技术是对信息进行更进一步的分析处理和理解信息内容。如自然语言理解、图像理解、模式识别等技术。媒体综合技术是把低维信息表示映像
19、成高维的模式空间的过程。例如语音合成器就可以把语音的内部表示综合为声音输出。1.3.5 多媒体软件技术多媒体软件技术主要包括以下六个方面的内容:多媒体操作系统多媒体素材采集与制作技术多媒体编辑与创作工具多媒体数据库技术超文本/超媒体技术多媒体应用开发技术多媒体操作系统多媒体操作系统是多媒体软件的核心。它负责多媒体环境下多任务的调度、保证音频、视频同步控制以及信息处理的实时性,提供多媒体信息的各种基本操作和管理;具有对设备的相对独立性与可扩展性。Windows、OS/2 和Macintosh 操作系统都提供了对多媒体的支持。多媒体素材采集与制作技术素材的采集与制作主要包括采集并编辑多种媒体数据。
20、如声音信号的录制编辑和播放;图像扫描及预处理;全动态视频采集及编辑;动画生成编辑;音/视频信号的混合和同步等。多媒体编辑与创作工具多媒体编辑创作软件又称多媒体创作工具,是多媒体专业人员在多媒体操作系统之上开发的,供特定应用领域的专业人员组织编排多媒体数据,并把它们连接成完整的多媒体应用系统的工具。高档的创作工具用于影视系统的动画制作及特技效果,中档的用于培训、教育和娱乐节目制作,低档的用于商业简介、家庭学习材料的编辑。多媒体数据库技术多媒体信息是结构型的,致使传统的关系数据库已不适用于多媒体的信息管理,需要从下面四个方面研究数据库1).多媒体数据模型2).媒体数据压缩和解压缩的模式3).多媒体
21、数据管理及存取方法4).用户界面超文本/超媒体技术超文本是一种新颖的文本信息管理技术,它提供的方法是建立各种媒体信息之间的网状链接结构,这种结构由节点组成。对超文本进行管理使用的系统称为超文本系统。也即浏览器,或称为导航图。若超文本中的节点的数据不仅可以是文本,还可以是图像、动画、音频、视频,则称为超媒体。多媒体应用开发技术多媒体应用的开发会使一些采用不同问题解决方法的人集中到一起,包括计算机开发人员、音乐创作人员,图像艺术家等,他们的工作方法以及思考问题的方法都将是完全不同的。对于项目管理者来说,研究和推出一个多媒体应用开发方法学将是极为重要的。1.3.6 多媒体通信技术多媒体通信技术包含语
22、音压缩、图像压缩及多媒体的混合传输技术。宽带综合业务数字网(B-ISDN)是解决多媒体数据的传输问题的一个比较完整的方法,其中ATM(异步传送模式)是近年来在研究和开发上的一个重要成果。1.3.7 虚拟现实技术虚拟现实的定义可归纳为:利用计算机技术生成的一个逼真的视觉、听觉触觉及嗅觉等的感觉世界,用户可以用人的自然技能对这个生成的虚拟实体进行交互考察。虚拟现实技术是在众多相关技术上发展起来的一个高度集成的技术,是计算机软硬件技术、传感技术、机器人技术、人工智能及心理学等飞速发展的结晶。1.4 多媒体信息的计算机表示1.4.1 声音文件的基本格式1.4.2 图像及图像文件格式1.4.3 视频和动
23、画的文件格式1.4.1 声音文件的基本格式1.WAV 文件3.VOC 文件2.MIDI 4.MOD 文件WAV 文件Windows 所用的标准数字音频称为波形文件,文件的扩展名是“.WAV”,它记录了对实际声音进行采样的数据。它可以重现各种声音,但产生的文件很大。采用的软件压缩方法主要有ACM和PCM 等。人的讲话声使用8位量化级11.025 KHz采样率就能较好的还原。CD音质需要16位量化级、44.1 KHz的采样率。MIDIMIDI文件的扩展名为“.MID”,它与波形文件不同,记录的不是声音本身,而是将每个音符记录为一个数字,因此比较节省空间,可以满足长时间音乐的需要。MIDI 的主要限
24、制是缺乏重现真实自然的能力。采用波表法进行音乐合成的声音卡可以使MIDI 音乐的质量大大提高。VOC 文件:VOC 文件也是一种数字声音文件,主要用于DOS 程序。与波形文件相似,可以方便地互相转换。MOD 文件:MOD 文件是移植过来的MODULE 音乐。它主要由一些业余音乐爱好者通过网络和BBS 支持。1.4.2 图像及图像文件格式图像是由一些排成行和列的点组成的,通常称为位图或点阵图。图像文件在计算机中的存储格式有多种,如”.BMP”、”.PCX”、”.TIF”、”.TGA”“.GIF”、”.JPG”等。1BMP格式BMP 是标准的WINDOWS 和OS/2 的图形和图像的基本位图格式,
25、有压缩(RLE)和非压缩之分。BMP 支持黑白图像、16色和256色的伪彩色图像以及RGB 真彩色图像。2PCX格式是使用游程长编码(RLE)方法进行压缩的图像文件格式文件。支持黑白图像、16色和256色的伪彩色图像、灰度图像以及RGB 真彩色图像,3GIF格式GIF 是压缩图像存储格式,它使用LZW 压缩方法,压缩比较高,文件长度较小。支持黑白图像、16色和256色的彩色图像。4TIF格式TIF 格式是工业标准格式,支持所有图像类型。文件分成压缩和非压缩两大类。5JPG和PIC格式 JPG 和PIC 都使用JPEG 方法进行图像数据压缩。这两种格式的最大特点是文件非常小。它是一种有损压缩的静
26、态图像文件存储格式。支持灰度图像、RGB 真彩色图像和CMYK 真彩色图像。6PCD格式PCD格式是Photo-CD 的专用存储格式,文件中含有从专业摄影照片到普通显示用的多种分辨率的图像,所以数据量都非常大。Comparison:Einstein.bmp颜色:真彩色大小:239.1 KB压缩比:1.0Einstein.gif颜色:256大小:61.4 KB压缩比:1.3Comparison:Einstein.jpg颜色:真彩色大小:11.1 KB压缩比:21.4Einstein.tif颜色:真彩色大小:238.4 KB压缩比:1.01.4.3 视频和动画的文件格式动画文件的格式主要有两种:F
27、LIC 格式和MMM 格式。视频文件的使用一般与标准有关,主要有AVI、MOV、MPG、DAT、DIR 等。1.FLIC动画 早期版本的FLIC文件只支持320200256 色模式,文件的扩展名为“.FIY”。较新版本支持的分辨率和颜色数都有所提高,文件的扩展名也改为“.FLC”。它使用了无损压缩方法,画面效果十分清晰,但本身不能存储同步声音。2.MMM动画MMM格式是微软多媒体动画的文件格式。3.AVI文件AVI文件将视频和音频信号混合交错地存储在一起。其文件扩展名为“.AVI”,采用了Intel公司的Indeo视频有损压缩技术,较好地解决了音频信息与视频信息同步的问题。4.MOV文件MOV
28、 是Macintosh 计算机用的影视文件格式。也采用了Intel公司的Indeo视频有损压缩技术,以及视频与音频信息混排技术。5.MPG文件是PC机上全屏幕活动视频的标准文件格式,它是使用MPEG 方法进行压缩的全运动视频图像。6.DAT文件DAT 是Video CD 或Karaoke CD数据文件的扩展名,也是基于MPEG 压缩方法的一种文件格式。7.DIR格式DIR是Marco Media公司使用的Director 多媒体著作工具产生的电影文件格式。1.5 多媒体数据压缩技术1.5.1 多媒体数据的冗余类型1.5.2 数据压缩方法1.5.3 视频编码的国际标准1.5.1 多媒体数据的冗余
29、类型图像数据表示中存在着大量的冗余,图像数据压缩技术就是利用图像数据的冗余性来减少图像数据量的方法。常见图像数据冗余类型如下:1.空间冗余2.时间冗余3.视觉冗余空间冗余一幅图像表面上各采样点的颜色之间往往存在着空间连贯性,基于离散像素采样来表示物体表面颜色的像素存储方式可利用空间连贯性,达到减少数据量的目的。例如,在静态图像中有一块表面颜色均匀的区域,在此区域中所有点的光强和色彩以及饱和度都是相同的,因此数据有很大的空间冗余。时间冗余运动图像一般为位于一时间轴区间的一组连续画面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许
30、多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,所以称为时间冗余。同理,语音数据中也存在着时间冗余。视觉冗余人类的视觉系统对图像场的敏感度是非均匀的。但是,在记录原始的图像数据时,通常假定视觉系统近似线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从而产生比理想编码(即把视觉敏感和不敏感的部分区分开来的编码)更多的数据,这就是视觉冗余。1.5.2 数据压缩方法压缩处理一般是由两个过程组成:一是编码过程,即将原始数据经过编码进行压缩,以便存储与传输;二是解码过程,此过程对编码数据进行解码,还原为可以使用的数据。数据压缩可分为两种类型:一种叫做无损压缩,另一种叫做有损压缩。无损
31、压缩混合压缩有损压缩无损压缩无损压缩常用在原始数据的存档,如文本数据、程序以及珍贵的图片和图像等。其原理是统计压缩数据中的冗余(重复的数据)部分。常用的有:RLE(run length encoding)行程编码Huffman 编码算术编码LZW(lempel-ziv-welch)编码(1)、行程编码(RLE)RLE 编码是将数据流中连续出现的字符用单一记号表示。例如,字符串AAABCDDDDDDDDBBBBB可以压缩为3ABC8D5B。RLE编码简单直观,编码/解码速度快,因此许多图形和视频文件,如.BMP.TIFF及AVI等格式文件的压缩均采用此方法.(2)、Huffman编码它是一种对统
32、计独立信源能达到最小平均码长的编码方法。其原理是,先统计数据中各字符出现的概率后,再按字符出现频率高低的顺序分别赋以由短到长的代码,从而保证了文件的整体的大部分字符是由较短的编码构成的。(3)、算术编码其方法是将被编码的信源消息表示成实数轴0-1之间的一个间隔,消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位数就越多。该方法实现较为复杂,常与其它有损压缩结合使用,并在图像数据压缩标准(如JPEG)中扮演重要角色。(4)、LZW编码LZW(Lempel-Ziv-Welch)压缩使用字典库查找方案。它读入待压缩的数据并与一个字典库(库开始是空的)中的字符串对比,如有匹配的字符串,则输出
33、该字符串数据在字典库中的位置索引,否则将该字符串插入字典中。许多商品压缩软件如ARJ、PKZIR、ZOO、LHA等都采用了设方法。另外,.GIF 和.TIF 格式的图形文件也是按这一文件存储的。有损压缩图像或声音的频带宽、信息丰富,人类视觉和听觉器官对频带中某些频率成分不大敏感,有损压缩以牺牲这部分信息为代价,换取了较高的压缩比。常用的有损压缩方法有:PCM(脉冲编码调制)、预测编码、变换编码、插值与外推等。新一代的数据压缩方法有:矢量量化和子带编码、基于模型的压缩、分形压缩及小波变换等。混合压缩混合压缩是利用了各种单一压缩的长处,以求在压缩比、压缩效率及保真度之间取得最佳折衷。该方法在许多情
34、况下被应用,如JPEG 和MPEG 标准就采用了混合编码的压缩方法。1.5.3 视频编码的国际标准1、静止图像压缩标准2、运动图像压缩标准3视频通信编码标准静止图像压缩标准国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合成立的“联合照片专家组“JPEG(joint photographic experts group)于1991年提出的“多灰度静止图像的数字压缩编码“(简称JPEG标准)。这是一个适应于彩色和单色多灰度或连续色调静止数字图像的压缩标准。JPEG标准支持很高的图像分辨率和量化精度。它包含两部分:第一部分是无损压缩,基于差分脉冲编码调制(DPCM)的预测编码。第二
35、部分是有损压缩,基于离散余弦变换(DCT)和Huffman编码,通常压缩20-40倍。运动图像压缩标准视频图像压缩的一个重要标准是MPEG(Moving Picture Experts Group)于1990年形成的一个标准草案(简称MPEG标准)。它兼顾了JPEG标准和CCITT专家组的H.261标准。MPEG标准分成MPEG视频、MPEG音频和MPEG系统三大部分。MPEG算法除了对单幅图像进行编码外(帧内编码),还利用图像序列的相关特性去除帧间图像冗余,大大提高了视频图像的压缩比。压缩比可达到60-100倍。视频通信编码标准多媒体通信中的电视图像编码标准都采用H.261和H.263。H.
36、261主要用来支持电视会议和可视电话。电视图像数据压缩后的数据速率为P64kb/s,其中P是一个可变参数,取值范围是1-30。H.263是在H.261的基础上开发的电视图像编码标准,用于低位速率通信的电视图像编码。1.6 多媒体与因特网因特网(Internet)是一个通过网络设备把世界各国的计算机相互连接在一起的计算机网络。在这个网络上,使用普通的语言就可以进行相互通信、协作研究、从事商业活动,共享信息资源。因特网是二十世纪全球发展最迅速影响最深远和冲击最大的信息存取和处理工具。万维网WWW(Word Wide Web)是一个在因特网上运行的全球性分布式信息系统。由于它支持文本、图像、声音、影
37、视等数据类型,而且使用超文本、超链接技术把全球范围里的信息链接在一起,所以也称为超媒体环球信息系统。万维网技术是因特网上环球信息系统设计技术上的一个重大突破,是目前最热门的多媒体技术。本章小结本章对多媒体和多媒体技术的定义及特点、多媒体计算机要解决的关键技术以及多媒体技术的应用和发展、媒体信息的计算机表示等问题作了较详细的讨论。多媒体计算机技术是综合处理声、文、图、音频、视频等信息的技术,多媒体计算机具有信息载体的多样性、集成性和交互性的特点。多媒体的关键技术包括多媒体计算机系统要解决的关键技术(如媒体数据的压缩编码和解码技术、专用芯片技术、多媒体数据的输入/输出技术)和多媒体应用设计中的关键技术两个方面。多媒体的应用丰富多彩,不仅涉及到计算机的各应用领域,也涉及到教育培训、电子出版、通信、文化娱乐等领域或行业。多媒体计算机技术将朝着高分辨率化、高速度化、简单化、标准化和智能化方向发展。