多媒体技术应用总结PPT课件.ppt

上传人:石*** 文档编号:87220297 上传时间:2023-04-16 格式:PPT 页数:129 大小:3.05MB
返回 下载 相关 举报
多媒体技术应用总结PPT课件.ppt_第1页
第1页 / 共129页
多媒体技术应用总结PPT课件.ppt_第2页
第2页 / 共129页
点击查看更多>>
资源描述

《多媒体技术应用总结PPT课件.ppt》由会员分享,可在线阅读,更多相关《多媒体技术应用总结PPT课件.ppt(129页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于多媒体技术应用总结第一张,PPT共一百二十九页,创作于2022年6月媒体媒体(media)媒体:媒体:指交流、传播信息的工具。是承载信息指交流、传播信息的工具。是承载信息的载体。的载体。“载体载体”是指承载知识或信息的物是指承载知识或信息的物质形体。质形体。媒体的种类:媒体的种类:感觉媒体、表示媒体、表现媒体、存储媒体及感觉媒体、表示媒体、表现媒体、存储媒体及传输媒体。传输媒体。第二张,PPT共一百二十九页,创作于2022年6月感觉媒体感觉媒体 能直接作用于人的感官能直接作用于人的感官,让人产生感让人产生感觉的媒体。觉的媒体。例如:通过视觉例如:通过视觉看到看到的文的文字、图形;通过听觉字

2、、图形;通过听觉听到听到的音乐、的音乐、语音等。语音等。第三张,PPT共一百二十九页,创作于2022年6月表示媒体表示媒体 为传播和表达某种感觉媒体所指定为传播和表达某种感觉媒体所指定的各类信息的编码与格式。的各类信息的编码与格式。例如,例如,语言编码,电报码,图像编码,语言编码,电报码,图像编码,.第四张,PPT共一百二十九页,创作于2022年6月表现媒体表现媒体 用于输入和输出感觉媒体的载体。用于输入和输出感觉媒体的载体。n 输出媒体输出媒体显示器,扬声器,打印机显示器,扬声器,打印机,.n 输入媒体输入媒体键盘,键盘,鼠标,扫描仪鼠标,扫描仪,.第五张,PPT共一百二十九页,创作于202

3、2年6月存储媒体存储媒体 用于存放表示媒体用于存放表示媒体的载体的载体。例如:内。例如:内存、软磁盘、硬盘、存、软磁盘、硬盘、光盘、纸张、光盘、纸张、.第六张,PPT共一百二十九页,创作于2022年6月传输媒体传输媒体 用于把表示媒体从一处传用于把表示媒体从一处传输到另一处的物理实体输到另一处的物理实体。例如:各种导线、电缆、电例如:各种导线、电缆、电话线、光纤、话线、光纤、.第七张,PPT共一百二十九页,创作于2022年6月各种媒体形式的关系各种媒体形式的关系表现媒体表现媒体(输入设备)(输入设备)存储媒体存储媒体表现媒体表现媒体(输出设备)(输出设备)感觉感觉媒体媒体感觉感觉媒体媒体表示表

4、示媒体媒体表示表示媒体媒体第八张,PPT共一百二十九页,创作于2022年6月1.1.2、多媒体数据的特点、多媒体数据的特点_数据量大数据量大_数据类型多数据类型多_数据类型之间的差别大数据类型之间的差别大_多媒体数据的输入输出复杂多媒体数据的输入输出复杂第九张,PPT共一百二十九页,创作于2022年6月多媒体数据的多通道异步输入过程 第十张,PPT共一百二十九页,创作于2022年6月 多媒体技术定义多媒体技术定义 多媒体技术是指计算机多媒体技术是指计算机综合处理综合处理文本、文本、图形、图像、动画、音频及视频等多种图形、图像、动画、音频及视频等多种信息,使它们建立一种逻辑连接,并集信息,使它们

5、建立一种逻辑连接,并集成为一个具有交互性的系统的技术。成为一个具有交互性的系统的技术。1.1.3 多媒体技术及特性多媒体技术及特性第十一张,PPT共一百二十九页,创作于2022年6月多媒体技术的特性n多样性:多样性:指信息媒体的多样性指信息媒体的多样性n集成性:集成性:指以计算机为中心综合处理多种信息媒体,指以计算机为中心综合处理多种信息媒体,它包括信息媒体的集成和处理这些媒体设备的集成它包括信息媒体的集成和处理这些媒体设备的集成n交互性:交互性:指用户可以与计算机的多种信息媒体进行指用户可以与计算机的多种信息媒体进行交互操作,从而为用户提供更加有效地控制和使用交互操作,从而为用户提供更加有效

6、地控制和使用信息的手段信息的手段n实时性:实时性:音频信息与视频信息均与时间有关音频信息与视频信息均与时间有关第十二张,PPT共一百二十九页,创作于2022年6月1.2、多媒体个人计算机系统的组成结构、多媒体个人计算机系统的组成结构 多媒体计算机多媒体计算机 可以处理数值、文字、图像、动画、音可以处理数值、文字、图像、动画、音频、视频等信息的计算机被称为多媒体频、视频等信息的计算机被称为多媒体计算机。它具有速度快、存储容量大、计算机。它具有速度快、存储容量大、能实时处理的特点。能实时处理的特点。第十三张,PPT共一百二十九页,创作于2022年6月多媒体计算机的分类多媒体计算机的分类J基于基于I

7、BM PC系列的多媒体个系列的多媒体个人计算机(人计算机(MPC)J基于基于Apple Macintosh系列的系列的计算机计算机第十四张,PPT共一百二十九页,创作于2022年6月多媒体多媒体PC机(机(MPC)MPC=multimedia personal computer 具有特定多媒体功能的具有特定多媒体功能的PC机。机。1990年年“多多媒体微机市场协会媒体微机市场协会”指定了指定了MPC标准。该标准。该标准规定了将一个以标准规定了将一个以Intel处理器芯片为基处理器芯片为基础的计算机转变成为多媒体计算机的最低础的计算机转变成为多媒体计算机的最低软硬件规范。软硬件规范。第十五张,P

8、PT共一百二十九页,创作于2022年6月多媒体计算机系统结构多媒体计算机系统结构多媒体应用系统多媒体应用系统多媒体创作系统多媒体创作系统多媒体核心系统多媒体核心系统多媒体多媒体I/OI/O接口接口多媒体实时压缩与解压缩多媒体实时压缩与解压缩计算机硬件系统计算机硬件系统构成多媒体系统的根基,是组成多媒体计算机的所有物理设备。主要用于与时问有关的音频、视频等多媒体信息的压缩和解压缩。完成各多媒体硬件设备的驱动控制,提供相应的软件接口,以便高层软件系统的调用。主要是计算机的操作系统。创作多媒体应用系统的工作环境。包括根据各种需求开发的多媒体应用系统。第十六张,PPT共一百二十九页,创作于2022年6

9、月多媒体系统的三要素4用于视频和音频信息处理的多媒体硬件用于视频和音频信息处理的多媒体硬件4多媒体操作系统多媒体操作系统4支持多媒体的软件开发和编辑工具支持多媒体的软件开发和编辑工具第十七张,PPT共一百二十九页,创作于2022年6月1.4、多媒体的关键技术、多媒体的关键技术数字音频和视频技术:数字音频和视频技术:主要解决音频和视频信息的数字化和压缩、解压缩主要解决音频和视频信息的数字化和压缩、解压缩等问题,以便对音频、视频信息做到实时或准实时处理。等问题,以便对音频、视频信息做到实时或准实时处理。多媒体软件平台技术:多媒体软件平台技术:主要涉及多媒体操作系统、多媒体著作工具等。主要涉及多媒体

10、操作系统、多媒体著作工具等。多媒体通信技术:多媒体通信技术:是指利用通信网络综合地完成多媒体信息的传输和是指利用通信网络综合地完成多媒体信息的传输和交换的技术。这种技术打破了计算机、通信、广播和出版的界限,使交换的技术。这种技术打破了计算机、通信、广播和出版的界限,使它们融为一体,向人类提供了诸如多媒体电子邮件、视频会议等全新它们融为一体,向人类提供了诸如多媒体电子邮件、视频会议等全新的信息服务。的信息服务。多媒体数据库技术多媒体数据库技术第十八张,PPT共一百二十九页,创作于2022年6月1.5、多媒体技术的发展、多媒体技术的发展p84年:年:Apple公司引入位图概念公司引入位图概念p85

11、年:推出了世界上第一台多媒体系统年:推出了世界上第一台多媒体系统p86年:推出了交互式紧凑光盘系统年:推出了交互式紧凑光盘系统CD-Ip87年:推出交互式数字视频系统年:推出交互式数字视频系统DVIp90年:指定年:指定MPC_I级标准级标准p91年:推出年:推出CD-ROM/XA标准标准p92年:公布年:公布MPEG-I数字电视标准数字电视标准p93年:推出了年:推出了MPC_II级标准级标准p01年:推出年:推出MPEG-7标准,它提出了一种适用于现实生活标准,它提出了一种适用于现实生活中的各种多媒体内容的标准化描述方案,中的各种多媒体内容的标准化描述方案,第十九张,PPT共一百二十九页,

12、创作于2022年6月第2章文本信息处理技术第二十张,PPT共一百二十九页,创作于2022年6月2.1 文本信息的获取与表现文本信息的获取与表现 文本信息是计算机最初、最简单的表文本信息是计算机最初、最简单的表现形式。所谓文本就是现形式。所谓文本就是由字符组成的由字符组成的字符序列字符序列。第二十一张,PPT共一百二十九页,创作于2022年6月2.1.1 文本信息的特点文本信息的特点 1 1、表示简单:表示简单:表示简单:表示简单:文本是字母、数字及其他各种符号的集合,通常人们将这个集合称为字符集。在目前文本是字母、数字及其他各种符号的集合,通常人们将这个集合称为字符集。在目前文本是字母、数字及

13、其他各种符号的集合,通常人们将这个集合称为字符集。在目前文本是字母、数字及其他各种符号的集合,通常人们将这个集合称为字符集。在目前的计算机系统中,广泛使用的是的计算机系统中,广泛使用的是的计算机系统中,广泛使用的是的计算机系统中,广泛使用的是ASCIIASCII编码字符集。编码字符集。编码字符集。编码字符集。2 2、处理方便:处理方便:处理方便:处理方便:每个字符占用固定的二进制位数每个字符占用固定的二进制位数每个字符占用固定的二进制位数每个字符占用固定的二进制位数(8(8位或位或位或位或1616位位位位),计算机可以直接对字节进行操作。,计算机可以直接对字节进行操作。,计算机可以直接对字节进

14、行操作。,计算机可以直接对字节进行操作。3 3、表达问题准确:表达问题准确:表达问题准确:表达问题准确:很多事物只有用文字才能够表达清楚、准确。很多事物只有用文字才能够表达清楚、准确。很多事物只有用文字才能够表达清楚、准确。很多事物只有用文字才能够表达清楚、准确。4 4、存取速度快:存取速度快:存取速度快:存取速度快:往往一页文字表达的内容要比一幅图像的内容多。由于一页纸的数据量比一幅图像的往往一页文字表达的内容要比一幅图像的内容多。由于一页纸的数据量比一幅图像的往往一页文字表达的内容要比一幅图像的内容多。由于一页纸的数据量比一幅图像的往往一页文字表达的内容要比一幅图像的内容多。由于一页纸的数

15、据量比一幅图像的数据量小,所以,存取数据所花费的时间也会少很多。数据量小,所以,存取数据所花费的时间也会少很多。数据量小,所以,存取数据所花费的时间也会少很多。数据量小,所以,存取数据所花费的时间也会少很多。第二十二张,PPT共一百二十九页,创作于2022年6月2.1.2 文本信息的获取方式文本信息的获取方式 1、键盘输入方式、键盘输入方式 2、手写输入方式、手写输入方式 3、语音输入方式、语音输入方式 4、利用扫描仪输入方式、利用扫描仪输入方式第二十三张,PPT共一百二十九页,创作于2022年6月2.2 文本信息的编辑处理 在在多多媒媒体体应应用用系系统统的的制制作作中中,也也需需要要对对文

16、文本本内内容容进进行行修修改改,因因此此在在多多媒媒体体集集成成工工具具中中都都提提供供了了文文本本编编辑辑功功能能,比比如如,文文本本剪剪切切、复复制制、粘粘贴贴、插插入入、删删除除等等等等。实实际际上上对对文文本本的的编编辑辑处处理理还还包包括括对对其进行格式化。其进行格式化。第二十四张,PPT共一百二十九页,创作于2022年6月(1)字形:文 文 文文(2)字号:文 文 文(3)字体:点阵字体、TrueType字体2.2.1 Windows中的字体第二十五张,PPT共一百二十九页,创作于2022年6月2.2.2 格式化文本格式化文本 格式化文本包括:设置字体、字形、字号、颜色、格式化文本

17、包括:设置字体、字形、字号、颜色、字间距、行间距、段落格式等。具体实现方法有两字间距、行间距、段落格式等。具体实现方法有两种:种:1、利用、利用OLE功能链接相应的服务应用程序;功能链接相应的服务应用程序;2、在专门的文本编辑软件中格式化后,利用屏幕拷、在专门的文本编辑软件中格式化后,利用屏幕拷贝功能将其转换成图像,然后再导入多媒体应用系统贝功能将其转换成图像,然后再导入多媒体应用系统的画面中。的画面中。第二十六张,PPT共一百二十九页,创作于2022年6月利用利用 OLE 技术嵌入技术嵌入 Microsoft Word 或书写器对象或书写器对象 OLEOLE(OObjectbject L L

18、ink and ink and E Embedding)是一种对象链接)是一种对象链接)是一种对象链接)是一种对象链接与嵌入技术。它可以将与嵌入技术。它可以将与嵌入技术。它可以将与嵌入技术。它可以将Windows环境下不同应用程环境下不同应用程序创建的数据作为对象链接或嵌入到其他的应用程序创建的数据作为对象链接或嵌入到其他的应用程序中。其中提供数据对象的应用程序被称为序中。其中提供数据对象的应用程序被称为服务应服务应用程序用程序,链接或嵌入数据对象的应用程序被称为,链接或嵌入数据对象的应用程序被称为客客客客户应用程序户应用程序户应用程序户应用程序。若在一个文档中含有多个数据对象,就将。若在一个

19、文档中含有多个数据对象,就将。若在一个文档中含有多个数据对象,就将。若在一个文档中含有多个数据对象,就将其称为其称为其称为其称为复合文档复合文档。第二十七张,PPT共一百二十九页,创作于2022年6月利用利用 OLE 技术嵌入技术嵌入 Microsoft Word 或书写器对象或书写器对象J在客户应用程序中直接嵌入服务应在客户应用程序中直接嵌入服务应用程序用程序J直接嵌入直接嵌入Word文档文档J将文本图形化,并以图像文本的形将文本图形化,并以图像文本的形式插入到多媒体应用系统中式插入到多媒体应用系统中第二十八张,PPT共一百二十九页,创作于2022年6月第 3 章音频信息处理技术第二十九张,

20、PPT共一百二十九页,创作于2022年6月3.1 音频信息的处理 人人们们在在接接收收外外界界信信息息以以及及与与他他人人进进行行交交流流的的过过程程中中,大大约约有有20%是是通通过过听听觉觉实实现现的的,所所以以音音频频(声声音音)是是多多媒媒体计算机技术中一种不可缺少的媒体。体计算机技术中一种不可缺少的媒体。第三十张,PPT共一百二十九页,创作于2022年6月3.1.1 多媒体中的音频信息多媒体中的音频信息 声声音音是是由由物物体体振振动动引引发发的的一一种种物物理理现现象象。这这种种振振动动会会不不断断地地向向四四周周传传播播,当被人耳接收时,我们就听到了声音。当被人耳接收时,我们就听

21、到了声音。第三十一张,PPT共一百二十九页,创作于2022年6月声音媒体分为三类声音媒体分为三类 q波波形形声声音音:实实际际上上已已经经包包含含了了所所有有声声音音形形式式,这这是是因因为为计计算算机机可可以以将将任任何何声声音音信信号号通通过过采采样样、量量化化数数字字化化,在在必必要要的的时候,还可以准确地将其恢复。时候,还可以准确地将其恢复。q语语音音:人人的的说说话话声声不不仅仅是是一一种种波波形形,而而且且还还通通过过语语气气、语语速速、语语调调携携带带着着比比文文本更加丰富的信息。本更加丰富的信息。q音音乐乐:音音乐乐是是一一种种符符号号化化了了的的声声音音,这这种种符符号号就就

22、是是乐乐谱谱,乐乐谱谱则则是是转转变变为为符符号号媒体形式的声音。媒体形式的声音。第三十二张,PPT共一百二十九页,创作于2022年6月声音媒体具有三个要素声音媒体具有三个要素 q音调音调:与声音的频率有关,频率越快,:与声音的频率有关,频率越快,音调就越高。音调就越高。第三十三张,PPT共一百二十九页,创作于2022年6月q音音强强:又又称称为为响响度度,它它取取决决于于声声音音的的振振幅幅。振幅越大,声音就越响亮。振幅越大,声音就越响亮。q音音色色:音音色色是是由由于于波波形形和和泛泛音音的的不不同同所所带带来来的一个声音属性。的一个声音属性。纯纯音音一一般般的的声声音音由由几几种种振振动

23、动频频率率的的波波组组成成,若该声音只有一种振动频率就叫做纯音;若该声音只有一种振动频率就叫做纯音;复复音音由由许许多多纯纯音音组组成成,复复音音的的频频率率用用组组成成这这个复音的基音频率表示,一般的乐音都是复音;个复音的基音频率表示,一般的乐音都是复音;基音基音是复音中频率最低部分的声音;是复音中频率最低部分的声音;泛泛音音在在一一个个复复音音中中,除除去去基基音音外外,所所有有其其余余的纯音都是泛音。的纯音都是泛音。第三十四张,PPT共一百二十九页,创作于2022年6月q主主观观打打分分是是一一种种比比较较快快捷捷、简简单单的的衡衡量量声音质量的方法。声音质量的方法。q不不同同的的应应用

24、用对对象象,声声音音质质量量的的衡衡量量标标准准也不尽相同。也不尽相同。声音质量的衡量声音质量的衡量第三十五张,PPT共一百二十九页,创作于2022年6月3.1.2 数字化声音信号 声音是由物体的振动产生的,这种振动引起声音是由物体的振动产生的,这种振动引起了周围空气压力的震荡,我们称这种震荡的了周围空气压力的震荡,我们称这种震荡的函数表现形式为函数表现形式为波形波形。第三十六张,PPT共一百二十九页,创作于2022年6月 平时我们听到的大多数声音都是利用模平时我们听到的大多数声音都是利用模拟元件对模拟信号处理产生的效果。拟元件对模拟信号处理产生的效果。特点:连续性特点:连续性 缺点:精度差、

25、易于老化、易受周围环境影缺点:精度差、易于老化、易受周围环境影 若使用计算机处理声音信息,首先要解若使用计算机处理声音信息,首先要解决的问题就是声音信号的数字化决的问题就是声音信号的数字化.第三十七张,PPT共一百二十九页,创作于2022年6月 采样量化的结果将用所得到的数值序列采样量化的结果将用所得到的数值序列表示原始的模拟声音信号,这就是将模表示原始的模拟声音信号,这就是将模拟声音信号数字化的基本过程。拟声音信号数字化的基本过程。采样量化声音的模拟信号声音的数字信号第三十八张,PPT共一百二十九页,创作于2022年6月影响数字化声音质量的因素影响数字化声音质量的因素v采样频率采样频率:每秒

26、钟采取声音信号振幅数:每秒钟采取声音信号振幅数值的次数,单位是值的次数,单位是Hz。采样频率越高,。采样频率越高,数字化后的声音越接近原始声音,但需数字化后的声音越接近原始声音,但需要的存储空间也越多。要的存储空间也越多。v量化位数量化位数:表示采样数值所使用的二进:表示采样数值所使用的二进制位数。二进制位数越多,表示的数值制位数。二进制位数越多,表示的数值范围越大,量化后振幅的精度越高。范围越大,量化后振幅的精度越高。v声道数声道数:有单声道和双声道两种。:有单声道和双声道两种。第三十九张,PPT共一百二十九页,创作于2022年6月44.1kHz(高保真)(高保真)16位位 2(立体声)(立

27、体声)8=176.4 KB/秒秒=0.176 MB/秒秒数字化声音文件的大小数字化声音文件的大小数据量(字节数据量(字节/秒)秒)=采样频率采样频率 量化位数量化位数 声道数声道数8一张一张CD光盘光盘650 MB/0.176 MB=3693秒秒,约为,约为1小时小时第四十张,PPT共一百二十九页,创作于2022年6月3.1.4 数字化音频信息的编辑与特效处理 对于数字化后的波形声音文件,可以使对于数字化后的波形声音文件,可以使用声音处理实用软件工具对其进行剪切、用声音处理实用软件工具对其进行剪切、连接、混合、音调升降处理,并可以为连接、混合、音调升降处理,并可以为其增加回音、频率过滤、边缘效

28、果等特其增加回音、频率过滤、边缘效果等特殊效果。殊效果。第四十一张,PPT共一百二十九页,创作于2022年6月3.2 MIDI与音乐合成3.2.1 什么是什么是MIDI?MIDI(Musical Instrument Digital Interface)是乐器数字接口的英文缩写,它是指数字乐是乐器数字接口的英文缩写,它是指数字乐器与计算机连接的接口,即在数字乐器与计器与计算机连接的接口,即在数字乐器与计算机相连接时所使用的可以直接插入在计算算机相连接时所使用的可以直接插入在计算机串口上的一个小部件,通过它可以使数字机串口上的一个小部件,通过它可以使数字乐器与计算机相互乐器与计算机相互“沟通沟通

29、”信息。信息。MIDI的特点的特点是其文件内部记录的是演奏数字音是其文件内部记录的是演奏数字音乐的全部动作过程乐的全部动作过程,所以其数据量相当小。所以其数据量相当小。第四十二张,PPT共一百二十九页,创作于2022年6月在在80年代,为了使各个厂商生产的设备年代,为了使各个厂商生产的设备可以被不同的计算机接收与处理,由几可以被不同的计算机接收与处理,由几家电子乐器厂商共同制定一个家电子乐器厂商共同制定一个MIDI接口接口标准,这就是我们常说的标准,这就是我们常说的“GM(Gernera1 MIDI)标准标准”。这个标准主要由两部分组成:一是规定这个标准主要由两部分组成:一是规定了与设备相连的

30、硬件标准;二是规定了了与设备相连的硬件标准;二是规定了MID1数据的格式,主要包括硬件上传输数据的格式,主要包括硬件上传输信息的编码方式。信息的编码方式。第四十三张,PPT共一百二十九页,创作于2022年6月3.2.2 音乐合成 常见的音乐合成有两种方法:常见的音乐合成有两种方法:(1)调频合成法()调频合成法(FM合成法)合成法)这这种种合合成成技技术术是是早早期期的的电电子子合合成成乐乐器器所所采采用用的的发发音音方方式式,它它主主要通过叠加不同频率的正要通过叠加不同频率的正(余余)弦波,模拟真实的声音波形。弦波,模拟真实的声音波形。(2)波表合成法()波表合成法(Wave Table)这

31、这种种合合成成技技术术是是将将各各种种真真实实的的乐乐器器声声音音录录制制下下来来,并并保保存存在在一一个个波波形形表表格格中中。播播放放时时根根据据MIDI文文件件记记录录的的乐乐谱谱信信息息向向波波形形表表格格发发出出指指令令,然然后后从从中中找找出出对对应应的的声声音音信信息息,经经过过合合成成后后回回放放出出来来。由由于于它它采采用用的的是是真真实实乐乐器器的的采采样样,所所以以效效果果自然要好于自然要好于FM。第四十四张,PPT共一百二十九页,创作于2022年6月3.3.1 语音识别的发展简史 1952年年KHDavis用电阻、电容、电子管等分立元件,实现带通滤用电阻、电容、电子管等

32、分立元件,实现带通滤波器组进行语音频谱分析和匹配,对波器组进行语音频谱分析和匹配,对10个阿拉伯数字的识别率达到个阿拉伯数字的识别率达到了了98。1960年年RDenes等人共同研究成功第一个计算机语音识别系统,开创了计等人共同研究成功第一个计算机语音识别系统,开创了计算机语音识别的新阶段算机语音识别的新阶段 1958年,中国科学院声学研究所用电子管设备识别年,中国科学院声学研究所用电子管设备识别10个元音。个元音。1972年起开始用计算机识别语音。至今为止,汉语语音识别的研究年起开始用计算机识别语音。至今为止,汉语语音识别的研究工作基本跟上了国际语音识别的基本步伐,结合汉语的特点有些地工作基

33、本跟上了国际语音识别的基本步伐,结合汉语的特点有些地方还有所独创。方还有所独创。第四十五张,PPT共一百二十九页,创作于2022年6月3.3.2 语音识别第四十六张,PPT共一百二十九页,创作于2022年6月3.3.4语音识别的应用 理解特定人的口语理解特定人的口语 辨辨认认说说话话人人:从从一一些些人人中中辨辨认认出出某某个个人人来来,可以用于刑事侦查。可以用于刑事侦查。确确认认说说话话人人:确确认认说说话话人人是是指指依依据据说说话话人人说说出出的的某某个个特特定定语语句句,确确认认说说话话者者是是其其本本人人,可可以以用用在在银银行行系系统统中中,验验证证确确是是顾顾客客本本人人后后才给

34、予服务。才给予服务。第四十七张,PPT共一百二十九页,创作于2022年6月3.4 声音文件的基本格式 1WAV文文件件:这这是是Windows环环境境使使用用的的标标准准波波形形声声音音文文件格式,扩展名为件格式,扩展名为.wav。2VOC文文件件:这这是是为为特特定定音音频频卡卡设设计计的的文文件件格格式式,它它主主要要应用于应用于DOS环境。环境。3.MIDI文文件件:这这是是记记录录MIDI音音乐乐的的文文件件格格式式,后后缀缀为为.mid。与与波波形形文文件件相相比比较较,它它记记录录的的不不是是实实际际声声音音信信号号采采样样的的数数值值,而是演奏乐曲的动作过程及属性,因此,它的数据

35、量很小。而是演奏乐曲的动作过程及属性,因此,它的数据量很小。第四十八张,PPT共一百二十九页,创作于2022年6月 4mp3文件文件:这种文件格式是受:这种文件格式是受MPEG技术启发产生的。由技术启发产生的。由于它将于它将wav中的音频信息进行了很好地压缩,所以数据量中的音频信息进行了很好地压缩,所以数据量很小,且保持音质不失真。很小,且保持音质不失真。5wma文件文件:这是微软公司新发布的一种音频压缩文件格式,:这是微软公司新发布的一种音频压缩文件格式,这种文件格式与这种文件格式与MP3相比具有采样频率范围更宽,有版权保护,相比具有采样频率范围更宽,有版权保护,数据量更小且不失真等优势。数

36、据量更小且不失真等优势。6ra文件文件:随着流媒体技术的发展,人们可以实现在网上边下:随着流媒体技术的发展,人们可以实现在网上边下载边收听歌曲,边下载边欣赏视频节目的愿望。这是为了解决网载边收听歌曲,边下载边欣赏视频节目的愿望。这是为了解决网络传输带宽资源而设计的。络传输带宽资源而设计的。第四十九张,PPT共一百二十九页,创作于2022年6月3.5 音频卡 音频卡又称为声卡,是计算机处理声音信音频卡又称为声卡,是计算机处理声音信息的专用功能卡。息的专用功能卡。音频卡通过一些外部音频卡通过一些外部接口实现声音信号的接口实现声音信号的采集和播放。采集和播放。第五十张,PPT共一百二十九页,创作于2

37、022年6月3.5 音频卡 音频卡的基本功能音频卡的基本功能 (1)录制、编辑和回放数字声音文件;)录制、编辑和回放数字声音文件;(2)在在录录制制和和回回放放声声音音文文件件时时进进行行压压缩缩和和解解压压缩,以节省存储空间;缩,以节省存储空间;(3)采采用用语语音音合合成成技技术术,使使计计算算机机能能够够朗朗读读书书面文字;面文字;(4)有乐器数字接口)有乐器数字接口(MIDI)。(5)初步的语音识别。)初步的语音识别。第五十一张,PPT共一百二十九页,创作于2022年6月第 4 章图形图像信息处理技术第五十二张,PPT共一百二十九页,创作于2022年6月4.1 色彩的基本概念 人们对颜

38、色感觉的形成有四个要素;即人们对颜色感觉的形成有四个要素;即光源、物体、眼睛和大脑。这四个要素光源、物体、眼睛和大脑。这四个要素不仅使人产生颜色的感觉,而且也是人不仅使人产生颜色的感觉,而且也是人能正确判断色彩的条件。能正确判断色彩的条件。第五十三张,PPT共一百二十九页,创作于2022年6月发射光及反射光发射光及反射光反射光反射光发射光发射光发光物体发光物体呈现的颜色是由物体本身发出不同波长的呈现的颜色是由物体本身发出不同波长的呈现的颜色是由物体本身发出不同波长的呈现的颜色是由物体本身发出不同波长的光所造成;光所造成;光所造成;光所造成;不发光物体不发光物体不发光物体不发光物体呈现的颜色是光

39、照射物体时呈现的颜色是光照射物体时被物体反射出的光所具有的。被物体反射出的光所具有的。第五十四张,PPT共一百二十九页,创作于2022年6月三基色原理 红、绿、蓝三色光可以混合成自然界的全部色彩,而这三红、绿、蓝三色光可以混合成自然界的全部色彩,而这三色光本身相互独立,所以人们常常将红、绿、蓝称为色光色光本身相互独立,所以人们常常将红、绿、蓝称为色光三原色。从生理学上讲:人们眼睛的视网膜上存在着三种三原色。从生理学上讲:人们眼睛的视网膜上存在着三种不同类型的锥体细胞,它们分别对红、绿、蓝有很高的灵不同类型的锥体细胞,它们分别对红、绿、蓝有很高的灵敏度(对不同波长有不同的灵敏度),物体反射光进入

40、人敏度(对不同波长有不同的灵敏度),物体反射光进入人眼睛以后,在三种锥体细胞的作用下,产生不同颜色的光眼睛以后,在三种锥体细胞的作用下,产生不同颜色的光感。这就是三刺激理论,又称三色学说理论。感。这就是三刺激理论,又称三色学说理论。第五十五张,PPT共一百二十九页,创作于2022年6月度量色彩的三要素 色调色调:由可见光谱中各分量成分的波长:由可见光谱中各分量成分的波长来确定,是彩色光的基本特性。来确定,是彩色光的基本特性。饱和度饱和度:是指颜色的纯度,即掺入白光的:是指颜色的纯度,即掺入白光的深浅感觉。深浅感觉。亮度亮度:指彩色光对人眼引起的光刺激程度,:指彩色光对人眼引起的光刺激程度,显然

41、它与光的能量有关。显然它与光的能量有关。第五十六张,PPT共一百二十九页,创作于2022年6月加色法颜色加色法颜色和和减色法颜色减色法颜色i加色法颜色是把不同的颜色加色法颜色是把不同的颜色相加相加得到的得到的颜色。该系统中,没有任何颜色呈黑色,颜色。该系统中,没有任何颜色呈黑色,全部颜色出现时呈白色。加色法系统属全部颜色出现时呈白色。加色法系统属于于发射光发射光,计算机监视器采用这个系统。,计算机监视器采用这个系统。i加色法采用红、绿、蓝(加色法采用红、绿、蓝(RGB)三种颜三种颜色作为基色。色作为基色。第五十七张,PPT共一百二十九页,创作于2022年6月减色法所得到的颜色是减后的颜色。没有

42、任减色法所得到的颜色是减后的颜色。没有任何颜色时呈白色,全部颜色都出现则呈黑色。何颜色时呈白色,全部颜色都出现则呈黑色。减色法利用的是减色法利用的是反射光反射光原理。打印机采用此原理。打印机采用此系统。系统。反射光采用青色(反射光采用青色(Cyan)、粉红)、粉红(Magenta)及黄()及黄(Yellow)三种颜色作为)三种颜色作为基色。由于打印墨的问题,往往需加一些黑基色。由于打印墨的问题,往往需加一些黑墨,所以真正打印机处理的是四色。简称墨,所以真正打印机处理的是四色。简称 CMYK。第五十八张,PPT共一百二十九页,创作于2022年6月色彩模型HSB 模型模型HSB 是艺术家习惯采用的

43、颜色描述方法。是艺术家习惯采用的颜色描述方法。JHue:色调:色调JSaturation:饱和度:饱和度JBrightness:亮度:亮度第五十九张,PPT共一百二十九页,创作于2022年6月RGB模型模型 自然界中绝大多数的色彩都可以用适当比例的三基原色自然界中绝大多数的色彩都可以用适当比例的三基原色混合组成的等效色来模拟。显示器这类发光物体用的就混合组成的等效色来模拟。显示器这类发光物体用的就是是RGB模型。模型。红红+绿绿=黄黄 红红+蓝蓝=品红品红 绿绿+蓝蓝=青青 红红+绿绿+蓝蓝=白白 第六十张,PPT共一百二十九页,创作于2022年6月CMY模型模型 用彩色墨水或颜料进行混合,得

44、到的颜色被称为减法色。用彩色墨水或颜料进行混合,得到的颜色被称为减法色。从理论上说,任何一种颜色都可以用三种基本颜料按一定从理论上说,任何一种颜色都可以用三种基本颜料按一定比例混合而成。这三种颜色是比例混合而成。这三种颜色是 红、绿、蓝色的补色,红、绿、蓝色的补色,即青即青(Cyan)、品红、品红(Magenta)和黄色和黄色(Yellow),通常写,通常写 成成CMY。第六十一张,PPT共一百二十九页,创作于2022年6月YUV模型模型 这是一种电视系统使用的色彩表示形式。这是一种电视系统使用的色彩表示形式。其中其中Y表示亮度,表示亮度,U、V表示色差。所谓表示色差。所谓色差是指三原色信号分

45、量与亮度信号之色差是指三原色信号分量与亮度信号之差。其特点:差。其特点:q可以使黑白电视和彩色电视兼容可以使黑白电视和彩色电视兼容q可以利用人眼对彩色的敏感度低于对亮度的可以利用人眼对彩色的敏感度低于对亮度的敏感度的视觉特性,将敏感度的视觉特性,将UV信息用较少的二进信息用较少的二进制位数表示,较窄的频带传送制位数表示,较窄的频带传送 第六十二张,PPT共一百二十九页,创作于2022年6月矢量图形与位图图像的特点矢量图形与位图图像的特点矢量图形与位图图像的特点矢量图形与位图图像的特点矢量图像矢量图像矢量图像矢量图像:用一组指令集合来描述图形的内容,这些指令用:用一组指令集合来描述图形的内容,这

46、些指令用来描述构成该图形的所有直线、圆、矩形等图元。来描述构成该图形的所有直线、圆、矩形等图元。位图图像位图图像位图图像位图图像:图像是通过扫描仪、数字相机、摄像机等输入设备导:图像是通过扫描仪、数字相机、摄像机等输入设备导:图像是通过扫描仪、数字相机、摄像机等输入设备导:图像是通过扫描仪、数字相机、摄像机等输入设备导入到计算机中的。它们将原始图像分成许许多多的点阵,我们入到计算机中的。它们将原始图像分成许许多多的点阵,我们入到计算机中的。它们将原始图像分成许许多多的点阵,我们入到计算机中的。它们将原始图像分成许许多多的点阵,我们将其称为像素。每个像素用若干个二进制位记录色彩、亮度等将其称为像

47、素。每个像素用若干个二进制位记录色彩、亮度等将其称为像素。每个像素用若干个二进制位记录色彩、亮度等将其称为像素。每个像素用若干个二进制位记录色彩、亮度等反映该像素属性的信息,并将每个像素的内容按一定的规则排反映该像素属性的信息,并将每个像素的内容按一定的规则排反映该像素属性的信息,并将每个像素的内容按一定的规则排反映该像素属性的信息,并将每个像素的内容按一定的规则排列起来构成文件的内容,我们将用这种形式表示的图像称为位列起来构成文件的内容,我们将用这种形式表示的图像称为位列起来构成文件的内容,我们将用这种形式表示的图像称为位列起来构成文件的内容,我们将用这种形式表示的图像称为位图图像,简称为图

48、像。图图像,简称为图像。图图像,简称为图像。图图像,简称为图像。4.2 位图图像与矢量图形第六十三张,PPT共一百二十九页,创作于2022年6月矢量图形的优缺点矢量图形的优缺点 优点优点优点优点:适用于绘制简单的图形,占内:适用于绘制简单的图形,占内:适用于绘制简单的图形,占内:适用于绘制简单的图形,占内存小,数据量比位图小,颜色数不影存小,数据量比位图小,颜色数不影存小,数据量比位图小,颜色数不影存小,数据量比位图小,颜色数不影响文件的大小,易对个别图元进行编响文件的大小,易对个别图元进行编响文件的大小,易对个别图元进行编响文件的大小,易对个别图元进行编辑,放大缩小后输出的图形不失真。辑,放

49、大缩小后输出的图形不失真。辑,放大缩小后输出的图形不失真。辑,放大缩小后输出的图形不失真。缺点缺点缺点缺点:对于复杂图形,矢量命令会变:对于复杂图形,矢量命令会变:对于复杂图形,矢量命令会变:对于复杂图形,矢量命令会变得复杂,创建的图形不自然。由于矢量得复杂,创建的图形不自然。由于矢量得复杂,创建的图形不自然。由于矢量得复杂,创建的图形不自然。由于矢量图形依赖于简单的图元,所以很难表现图形依赖于简单的图元,所以很难表现图形依赖于简单的图元,所以很难表现图形依赖于简单的图元,所以很难表现物体的复杂属性。不如位图表现的形象、物体的复杂属性。不如位图表现的形象、物体的复杂属性。不如位图表现的形象、物

50、体的复杂属性。不如位图表现的形象、逼真。逼真。逼真。逼真。第六十四张,PPT共一百二十九页,创作于2022年6月位图的优缺点位图的优缺点 优点优点优点优点:自然、直观,容易:自然、直观,容易:自然、直观,容易:自然、直观,容易描述细节内容,并可进行描述细节内容,并可进行描述细节内容,并可进行描述细节内容,并可进行特殊效果的处理。特殊效果的处理。特殊效果的处理。特殊效果的处理。缺点缺点缺点缺点:数据量大,耗费存:数据量大,耗费存储。进行图像的放大、缩储。进行图像的放大、缩小和旋转等编辑处理较困小和旋转等编辑处理较困难。难。第六十五张,PPT共一百二十九页,创作于2022年6月矢量图形与位图的关系

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁