《第5章数据音频技术优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第5章数据音频技术优秀PPT.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第5章 数据音频技术现在学习的是第1页,共59页第第5章章 数据音频技术数据音频技术 声音是多媒体技术研究中的一个重要内容。声音的种类繁多,如声音是多媒体技术研究中的一个重要内容。声音的种类繁多,如声音是多媒体技术研究中的一个重要内容。声音的种类繁多,如声音是多媒体技术研究中的一个重要内容。声音的种类繁多,如人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然界的雷声、风声、雨声、闪电声等。在用计算机处理这些声音时,界的雷声
2、、风声、雨声、闪电声等。在用计算机处理这些声音时,界的雷声、风声、雨声、闪电声等。在用计算机处理这些声音时,界的雷声、风声、雨声、闪电声等。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们各自的特性。既要考虑它们的共性,又要利用它们各自的特性。既要考虑它们的共性,又要利用它们各自的特性。既要考虑它们的共性,又要利用它们各自的特性。自从自从自从自从19691969年年年年BellBell实验室开始数字语音的研究以来,计算机产生音乐以实验室开始数字语音的研究以来,计算机产生音乐以实验室开始数字语音的研究以来,计算机产生音乐以实验室开始数字语音的研究以来,计算机产生音乐以及语音识别、语音合
3、成技术得到了越来越广泛的研究和应用。多媒体及语音识别、语音合成技术得到了越来越广泛的研究和应用。多媒体及语音识别、语音合成技术得到了越来越广泛的研究和应用。多媒体及语音识别、语音合成技术得到了越来越广泛的研究和应用。多媒体数字音频处理技术在音频数字化、语音处理、合成及识别等各个方面数字音频处理技术在音频数字化、语音处理、合成及识别等各个方面数字音频处理技术在音频数字化、语音处理、合成及识别等各个方面数字音频处理技术在音频数字化、语音处理、合成及识别等各个方面都有着很好的发展。都有着很好的发展。都有着很好的发展。都有着很好的发展。现在学习的是第2页,共59页5.1 声音与声音信号数字化声音与声音
4、信号数字化 作为一种模拟信号,声音在时间和振幅上都是连续的,即它的振作为一种模拟信号,声音在时间和振幅上都是连续的,即它的振作为一种模拟信号,声音在时间和振幅上都是连续的,即它的振作为一种模拟信号,声音在时间和振幅上都是连续的,即它的振幅能以任意精度并在任何一个时刻进行测量。与之不同的是,数幅能以任意精度并在任何一个时刻进行测量。与之不同的是,数幅能以任意精度并在任何一个时刻进行测量。与之不同的是,数幅能以任意精度并在任何一个时刻进行测量。与之不同的是,数字信号只能在确定的时刻才有意义,其数值也只能取有限的量。字信号只能在确定的时刻才有意义,其数值也只能取有限的量。字信号只能在确定的时刻才有意
5、义,其数值也只能取有限的量。字信号只能在确定的时刻才有意义,其数值也只能取有限的量。现在学习的是第3页,共59页5.1.1 声音与听觉器官声音与听觉器官 声音的强弱表现在声波压力的大小上,音调的高低表现在声音声音的强弱表现在声波压力的大小上,音调的高低表现在声音声音的强弱表现在声波压力的大小上,音调的高低表现在声音声音的强弱表现在声波压力的大小上,音调的高低表现在声音的频率上。当声音用电信号表示时,在时间和幅度上都是连续的频率上。当声音用电信号表示时,在时间和幅度上都是连续的频率上。当声音用电信号表示时,在时间和幅度上都是连续的频率上。当声音用电信号表示时,在时间和幅度上都是连续的模拟信号。对
6、声音信号的分析表明,声音信号由许多频率不的模拟信号。对声音信号的分析表明,声音信号由许多频率不的模拟信号。对声音信号的分析表明,声音信号由许多频率不的模拟信号。对声音信号的分析表明,声音信号由许多频率不同的信号组成,这类信号称为复合信号,而单一频率的信号称同的信号组成,这类信号称为复合信号,而单一频率的信号称同的信号组成,这类信号称为复合信号,而单一频率的信号称同的信号组成,这类信号称为复合信号,而单一频率的信号称为分量信号。声音信号的一个重要参数就是带宽,用来描述组为分量信号。声音信号的一个重要参数就是带宽,用来描述组为分量信号。声音信号的一个重要参数就是带宽,用来描述组为分量信号。声音信号
7、的一个重要参数就是带宽,用来描述组成复合信号的频率范围,如高保真声音的频率范围为成复合信号的频率范围,如高保真声音的频率范围为成复合信号的频率范围,如高保真声音的频率范围为成复合信号的频率范围,如高保真声音的频率范围为1020000Hz1020000Hz,带宽约为,带宽约为,带宽约为,带宽约为20kHz20kHz,而视频信号的带宽是,而视频信号的带宽是,而视频信号的带宽是,而视频信号的带宽是6MHz6MHz。现在学习的是第4页,共59页5.1.1 声音与听觉器官声音与听觉器官 声音信号的两个基本参数是频率和幅度。信号的频率是指信号每声音信号的两个基本参数是频率和幅度。信号的频率是指信号每声音信
8、号的两个基本参数是频率和幅度。信号的频率是指信号每声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒钟变化的次数,用秒钟变化的次数,用秒钟变化的次数,用秒钟变化的次数,用HzHz表示。频率小于表示。频率小于表示。频率小于表示。频率小于20Hz20Hz的信号称为亚音信的信号称为亚音信的信号称为亚音信的信号称为亚音信号,或称为次音信号;频率范围为号,或称为次音信号;频率范围为号,或称为次音信号;频率范围为号,或称为次音信号;频率范围为20Hz20kHz20Hz20kHz的信号称为音频的信号称为音频的信号称为音频的信号称为音频(AudioAudio)信号。虽然人的发音器官发出的声音频率大约是
9、)信号。虽然人的发音器官发出的声音频率大约是)信号。虽然人的发音器官发出的声音频率大约是)信号。虽然人的发音器官发出的声音频率大约是803400Hz803400Hz,但人说话的信号频率通常为,但人说话的信号频率通常为,但人说话的信号频率通常为,但人说话的信号频率通常为3003000Hz3003000Hz,在这种频率,在这种频率,在这种频率,在这种频率范围的信号称为话音信号;高于范围的信号称为话音信号;高于范围的信号称为话音信号;高于范围的信号称为话音信号;高于20kHz20kHz的信号称为超音频信号,或称的信号称为超音频信号,或称的信号称为超音频信号,或称的信号称为超音频信号,或称超声波信号。
10、一般来说,人的听觉器官能感知的声音频率大约在超声波信号。一般来说,人的听觉器官能感知的声音频率大约在超声波信号。一般来说,人的听觉器官能感知的声音频率大约在超声波信号。一般来说,人的听觉器官能感知的声音频率大约在2020000Hz2020000Hz之间,在这种频率范围里感知的声音幅度大约在之间,在这种频率范围里感知的声音幅度大约在之间,在这种频率范围里感知的声音幅度大约在之间,在这种频率范围里感知的声音幅度大约在0120db0120db之间。多媒体技术中处理的主要是音频信号,包括音乐、语音和音效之间。多媒体技术中处理的主要是音频信号,包括音乐、语音和音效之间。多媒体技术中处理的主要是音频信号,
11、包括音乐、语音和音效之间。多媒体技术中处理的主要是音频信号,包括音乐、语音和音效(风雨声、鸟叫声、机器声)等。(风雨声、鸟叫声、机器声)等。(风雨声、鸟叫声、机器声)等。(风雨声、鸟叫声、机器声)等。现在学习的是第5页,共59页5.1.2 模拟信号与数字信号模拟信号与数字信号 大多数电信号(模拟信号)过去一直是用模拟元部件(如晶体管、大多数电信号(模拟信号)过去一直是用模拟元部件(如晶体管、大多数电信号(模拟信号)过去一直是用模拟元部件(如晶体管、大多数电信号(模拟信号)过去一直是用模拟元部件(如晶体管、变压器、电阻、电容等)进行处理的。但是,开发一个具有相当精变压器、电阻、电容等)进行处理的
12、。但是,开发一个具有相当精变压器、电阻、电容等)进行处理的。但是,开发一个具有相当精变压器、电阻、电容等)进行处理的。但是,开发一个具有相当精度、且几乎不受环境变化影响的模拟信号处理元部件相当困难,成度、且几乎不受环境变化影响的模拟信号处理元部件相当困难,成度、且几乎不受环境变化影响的模拟信号处理元部件相当困难,成度、且几乎不受环境变化影响的模拟信号处理元部件相当困难,成本也很高。本也很高。本也很高。本也很高。话音信号是典型的连续信号,不仅在时间上,而且在幅度上也是连续话音信号是典型的连续信号,不仅在时间上,而且在幅度上也是连续话音信号是典型的连续信号,不仅在时间上,而且在幅度上也是连续话音信
13、号是典型的连续信号,不仅在时间上,而且在幅度上也是连续的。时间上的。时间上的。时间上的。时间上“连续连续连续连续”是指在一个指定的时间范围内声音信号的幅值有是指在一个指定的时间范围内声音信号的幅值有是指在一个指定的时间范围内声音信号的幅值有是指在一个指定的时间范围内声音信号的幅值有无穷多个,在幅度上无穷多个,在幅度上无穷多个,在幅度上无穷多个,在幅度上“连续连续连续连续”是指幅度的数值有无穷多个。我们把在是指幅度的数值有无穷多个。我们把在是指幅度的数值有无穷多个。我们把在是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。时间和幅度上都是连续的信号称为模拟信号。时间和幅度
14、上都是连续的信号称为模拟信号。时间和幅度上都是连续的信号称为模拟信号。现在学习的是第6页,共59页5.1.2 模拟信号与数字信号模拟信号与数字信号 如果把模拟信号转变成数字信号,用数字来表示模拟量和对数字信号如果把模拟信号转变成数字信号,用数字来表示模拟量和对数字信号如果把模拟信号转变成数字信号,用数字来表示模拟量和对数字信号如果把模拟信号转变成数字信号,用数字来表示模拟量和对数字信号做计算,那么开发模拟运算部件的问题就转变成了开发数字运算部件做计算,那么开发模拟运算部件的问题就转变成了开发数字运算部件做计算,那么开发模拟运算部件的问题就转变成了开发数字运算部件做计算,那么开发模拟运算部件的问
15、题就转变成了开发数字运算部件的问题,这就出现了数字信号处理器(的问题,这就出现了数字信号处理器(的问题,这就出现了数字信号处理器(的问题,这就出现了数字信号处理器(digital signal processordigital signal processor,DSPDSP)。)。)。)。DSPDSP与通用微处理器相比,除了结构不同外,它们的基本差别与通用微处理器相比,除了结构不同外,它们的基本差别与通用微处理器相比,除了结构不同外,它们的基本差别与通用微处理器相比,除了结构不同外,它们的基本差别是,是,是,是,DSPDSP有能力响应和处理采样模拟信号得到的数据流,如做有能力响应和处理采样模拟
16、信号得到的数据流,如做有能力响应和处理采样模拟信号得到的数据流,如做有能力响应和处理采样模拟信号得到的数据流,如做乘法和累加求和运算等。乘法和累加求和运算等。乘法和累加求和运算等。乘法和累加求和运算等。现在学习的是第7页,共59页5.1.2 模拟信号与数字信号模拟信号与数字信号 在数字环境进行信号处理的主要优点是:首先,数字信号计算是一在数字环境进行信号处理的主要优点是:首先,数字信号计算是一在数字环境进行信号处理的主要优点是:首先,数字信号计算是一在数字环境进行信号处理的主要优点是:首先,数字信号计算是一种精确的运算方法,它不受时间和环境变化的影响;其次,表示部种精确的运算方法,它不受时间和
17、环境变化的影响;其次,表示部种精确的运算方法,它不受时间和环境变化的影响;其次,表示部种精确的运算方法,它不受时间和环境变化的影响;其次,表示部件功能的数学运算不是物理上实现的功能部件,而仅仅是用数学运件功能的数学运算不是物理上实现的功能部件,而仅仅是用数学运件功能的数学运算不是物理上实现的功能部件,而仅仅是用数学运件功能的数学运算不是物理上实现的功能部件,而仅仅是用数学运算来模拟,相对容易实现;此外,可以对数字运算部件进行编程,算来模拟,相对容易实现;此外,可以对数字运算部件进行编程,算来模拟,相对容易实现;此外,可以对数字运算部件进行编程,算来模拟,相对容易实现;此外,可以对数字运算部件进
18、行编程,如欲改变算法或改变某些功能,还可对数字部件进行再编程。如欲改变算法或改变某些功能,还可对数字部件进行再编程。如欲改变算法或改变某些功能,还可对数字部件进行再编程。如欲改变算法或改变某些功能,还可对数字部件进行再编程。现在学习的是第8页,共59页5.1.3 声音信号数字化声音信号数字化 计算机要处理或合成声音,就必须把模拟的(连续的)声音波形转换计算机要处理或合成声音,就必须把模拟的(连续的)声音波形转换计算机要处理或合成声音,就必须把模拟的(连续的)声音波形转换计算机要处理或合成声音,就必须把模拟的(连续的)声音波形转换成数字(离散化),这个过程称为声音采样(图成数字(离散化),这个过
19、程称为声音采样(图成数字(离散化),这个过程称为声音采样(图成数字(离散化),这个过程称为声音采样(图5-15-1),它是把连续),它是把连续),它是把连续),它是把连续的声波信号通过一种称为模数(的声波信号通过一种称为模数(的声波信号通过一种称为模数(的声波信号通过一种称为模数(A/DA/D)转换器的部件转换成数字信)转换器的部件转换成数字信)转换器的部件转换成数字信)转换器的部件转换成数字信号,供计算机处理,如果需要的话,这种转换后的数字信号又可以通号,供计算机处理,如果需要的话,这种转换后的数字信号又可以通号,供计算机处理,如果需要的话,这种转换后的数字信号又可以通号,供计算机处理,如果
20、需要的话,这种转换后的数字信号又可以通过数模转换(过数模转换(过数模转换(过数模转换(D/AD/A)器,经过放大输出,变成人耳能够听到的声音。)器,经过放大输出,变成人耳能够听到的声音。)器,经过放大输出,变成人耳能够听到的声音。)器,经过放大输出,变成人耳能够听到的声音。现在学习的是第9页,共59页图图图图5-1 5-1 声音信号数字化的过程声音信号数字化的过程声音信号数字化的过程声音信号数字化的过程现在学习的是第10页,共59页5.1.3 声音信号数字化声音信号数字化 连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样连
21、续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样;连续幅度的离散化通过量化来实现,一次,这种采样称为均匀采样;连续幅度的离散化通过量化来实现,一次,这种采样称为均匀采样;连续幅度的离散化通过量化来实现,一次,这种采样称为均匀采样;连续幅度的离散化通过量化来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间
22、隔的,就称为线性量化,否则就称为非线性量化。图就称为线性量化,否则就称为非线性量化。图就称为线性量化,否则就称为非线性量化。图就称为线性量化,否则就称为非线性量化。图5-25-2表示了声音数字化表示了声音数字化表示了声音数字化表示了声音数字化的概念。的概念。的概念。的概念。现在学习的是第11页,共59页图图图图5-2 5-2 声音的采样和量化声音的采样和量化声音的采样和量化声音的采样和量化现在学习的是第12页,共59页5.1.3 声音信号数字化声音信号数字化 我们把时间和幅度都用离散的数字表示的信号称为数字信号。我们把时间和幅度都用离散的数字表示的信号称为数字信号。我们把时间和幅度都用离散的数
23、字表示的信号称为数字信号。我们把时间和幅度都用离散的数字表示的信号称为数字信号。声音数字化需要回答两个问题:声音数字化需要回答两个问题:声音数字化需要回答两个问题:声音数字化需要回答两个问题:每秒钟采集多少个声音样每秒钟采集多少个声音样每秒钟采集多少个声音样每秒钟采集多少个声音样本,也就是采样频率是多少;本,也就是采样频率是多少;本,也就是采样频率是多少;本,也就是采样频率是多少;每个声音样本的位数(每个声音样本的位数(每个声音样本的位数(每个声音样本的位数(bit per bit per samplesample,bpsbps)应该是多少,也就是量化精度。)应该是多少,也就是量化精度。)应该
24、是多少,也就是量化精度。)应该是多少,也就是量化精度。采样的速度决定了录制声音的准确性,而采样值的精度则决定了录制采样的速度决定了录制声音的准确性,而采样值的精度则决定了录制采样的速度决定了录制声音的准确性,而采样值的精度则决定了录制采样的速度决定了录制声音的准确性,而采样值的精度则决定了录制声音的精确性。实践证明,采样速度越快,采样值越准确,声音特征声音的精确性。实践证明,采样速度越快,采样值越准确,声音特征声音的精确性。实践证明,采样速度越快,采样值越准确,声音特征声音的精确性。实践证明,采样速度越快,采样值越准确,声音特征复原得就会越好。复原得就会越好。复原得就会越好。复原得就会越好。现
25、在学习的是第13页,共59页5.1.3 声音信号数字化声音信号数字化 常用的几种音频信号数字化的采样率标准是:常用的几种音频信号数字化的采样率标准是:常用的几种音频信号数字化的采样率标准是:常用的几种音频信号数字化的采样率标准是:44.2kHz44.2kHz(CDCD音质)音质)音质)音质)、22.05kHz22.05kHz(FMFM音质)、音质)、音质)、音质)、11.025kHz11.025kHz(AMAM音质)等。为了追求音质)等。为了追求音质)等。为了追求音质)等。为了追求音响品质的完美,减少噪声的干扰,达到理想的传播声音的环音响品质的完美,减少噪声的干扰,达到理想的传播声音的环音响品
26、质的完美,减少噪声的干扰,达到理想的传播声音的环音响品质的完美,减少噪声的干扰,达到理想的传播声音的环境,国际上制定了一系列判断音质的标准,图境,国际上制定了一系列判断音质的标准,图境,国际上制定了一系列判断音质的标准,图境,国际上制定了一系列判断音质的标准,图5-35-3给出了几种数给出了几种数给出了几种数给出了几种数字声音质量等级的国际标准所对应的频率范围。字声音质量等级的国际标准所对应的频率范围。字声音质量等级的国际标准所对应的频率范围。字声音质量等级的国际标准所对应的频率范围。现在学习的是第14页,共59页图图图图5-3 5-3 数字声音质量等级对应的频率范围数字声音质量等级对应的频率
27、范围数字声音质量等级对应的频率范围数字声音质量等级对应的频率范围现在学习的是第15页,共59页5.1.3 声音信号数字化声音信号数字化 样本大小是用每个声音样本的位数(样本大小是用每个声音样本的位数(样本大小是用每个声音样本的位数(样本大小是用每个声音样本的位数(bit/sbit/s或或或或b/sb/s)表示的,它反映度)表示的,它反映度)表示的,它反映度)表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用量声音波形幅度的精度。例如,每个声音样本用量声音波形幅度的精度。例如,每个声音样本用量声音波形幅度的精度。例如,每个声音样本用1616位(位(位(位(2 2字节)字节)字节)字节)表
28、示,测得的声音样本值是在表示,测得的声音样本值是在表示,测得的声音样本值是在表示,测得的声音样本值是在065 536065 536的范围里,它的精度就的范围里,它的精度就的范围里,它的精度就的范围里,它的精度就是输入信号的是输入信号的是输入信号的是输入信号的1/655361/65536。样本位数的大小影响到声音的质量,位数越。样本位数的大小影响到声音的质量,位数越。样本位数的大小影响到声音的质量,位数越。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的多,声音的质量越高,而需要的存储空
29、间也越多;位数越少,声音的多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。质量越低,需要的存储空间越少。质量越低,需要的存储空间越少。质量越低,需要的存储空间越少。采样精度的另一种表示方法是信号噪声比。采样精度的另一种表示方法是信号噪声比。采样精度的另一种表示方法是信号噪声比。采样精度的另一种表示方法是信号噪声比。现在学习的是第16页,共59页5.1.3 声音信号数字化声音信号数字化 原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实现各原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实现各原始的音频数据一般需进行编辑加工才能使用。通过编辑
30、可以实现各原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实现各种声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都种声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都种声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都种声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都具有设置音量、渐强渐弱处理及多通道混合等常用功能。音频处理主具有设置音量、渐强渐弱处理及多通道混合等常用功能。音频处理主具有设置音量、渐强渐弱处理及多通道混合等常用功能。音频处理主具有设置音量、渐强渐弱处理及多通道混合等常用功能。音频处理主要集中在音频压缩上,最新的语音压缩算法可将原始声音
31、数据压缩要集中在音频压缩上,最新的语音压缩算法可将原始声音数据压缩要集中在音频压缩上,最新的语音压缩算法可将原始声音数据压缩要集中在音频压缩上,最新的语音压缩算法可将原始声音数据压缩6 6 8 8倍以上。倍以上。倍以上。倍以上。现在学习的是第17页,共59页5.1.4 声音质量与数据率声音质量与数据率 数字化音频的质量取决于采样频率和量化位数这两个重要参数,反数字化音频的质量取决于采样频率和量化位数这两个重要参数,反数字化音频的质量取决于采样频率和量化位数这两个重要参数,反数字化音频的质量取决于采样频率和量化位数这两个重要参数,反映音频数字化质量的另一个因素是通道(或声道)个数。记录声音映音频
32、数字化质量的另一个因素是通道(或声道)个数。记录声音映音频数字化质量的另一个因素是通道(或声道)个数。记录声音映音频数字化质量的另一个因素是通道(或声道)个数。记录声音时,如果每次生成一个声波数据,称为单声道;每次生成二个声波时,如果每次生成一个声波数据,称为单声道;每次生成二个声波时,如果每次生成一个声波数据,称为单声道;每次生成二个声波时,如果每次生成一个声波数据,称为单声道;每次生成二个声波数据,称为立体声(双声道),立体声更能反映人的听觉感受。音数据,称为立体声(双声道),立体声更能反映人的听觉感受。音数据,称为立体声(双声道),立体声更能反映人的听觉感受。音数据,称为立体声(双声道)
33、,立体声更能反映人的听觉感受。音频数字化的采样频率和量化级越高,结果越接近原始声音,除此之频数字化的采样频率和量化级越高,结果越接近原始声音,除此之频数字化的采样频率和量化级越高,结果越接近原始声音,除此之频数字化的采样频率和量化级越高,结果越接近原始声音,除此之外,数字化音频的质量还受其他一些因素(如扬声器的质量等)的外,数字化音频的质量还受其他一些因素(如扬声器的质量等)的外,数字化音频的质量还受其他一些因素(如扬声器的质量等)的外,数字化音频的质量还受其他一些因素(如扬声器的质量等)的影响。影响。影响。影响。根据声音的频带,通常把声音的质量分成根据声音的频带,通常把声音的质量分成根据声音
34、的频带,通常把声音的质量分成根据声音的频带,通常把声音的质量分成5 5个等级,由低到高分别个等级,由低到高分别个等级,由低到高分别个等级,由低到高分别是电话、调幅广播(是电话、调幅广播(是电话、调幅广播(是电话、调幅广播(AMAM)、调频广播()、调频广播()、调频广播()、调频广播(FMFM)、光盘()、光盘()、光盘()、光盘(CDCD)和数字录音带(和数字录音带(和数字录音带(和数字录音带(digital audio tapedigital audio tape,DATDAT)的声音。在这)的声音。在这)的声音。在这)的声音。在这 5 5个等个等个等个等级中,使用的采样频率、样本精度、通
35、道数和数据率见表级中,使用的采样频率、样本精度、通道数和数据率见表级中,使用的采样频率、样本精度、通道数和数据率见表级中,使用的采样频率、样本精度、通道数和数据率见表5-15-1。现在学习的是第18页,共59页表表表表5-1 5-1 声音质量和数据率声音质量和数据率声音质量和数据率声音质量和数据率现在学习的是第19页,共59页5.2 音乐合成和音乐合成和MIDI 多媒体音频数据的一个重要来源是多媒体音频数据的一个重要来源是多媒体音频数据的一个重要来源是多媒体音频数据的一个重要来源是MIDIMIDI(乐器数字接口)。从(乐器数字接口)。从(乐器数字接口)。从(乐器数字接口)。从2020世纪世纪世
36、纪世纪8080年代初期开始,年代初期开始,年代初期开始,年代初期开始,MIDIMIDI逐步为音乐界广泛接受和使用。逐步为音乐界广泛接受和使用。逐步为音乐界广泛接受和使用。逐步为音乐界广泛接受和使用。MIDIMIDI是乐器和计算机使用的标准语言,是一套指令(即命令)的约是乐器和计算机使用的标准语言,是一套指令(即命令)的约是乐器和计算机使用的标准语言,是一套指令(即命令)的约是乐器和计算机使用的标准语言,是一套指令(即命令)的约定,它指示乐器(即定,它指示乐器(即定,它指示乐器(即定,它指示乐器(即MIDIMIDI设备)要做什么,怎么做,如演奏设备)要做什么,怎么做,如演奏设备)要做什么,怎么做
37、,如演奏设备)要做什么,怎么做,如演奏音符、加大音量、生成音响效果等。音符、加大音量、生成音响效果等。音符、加大音量、生成音响效果等。音符、加大音量、生成音响效果等。MIDIMIDI不是声音信号,它传不是声音信号,它传不是声音信号,它传不是声音信号,它传送的是发给送的是发给送的是发给送的是发给MIDIMIDI设备或其他装置让其产生声音或执行某个动作的指设备或其他装置让其产生声音或执行某个动作的指设备或其他装置让其产生声音或执行某个动作的指设备或其他装置让其产生声音或执行某个动作的指令。令。令。令。现在学习的是第20页,共59页5.2 音乐合成和音乐合成和MIDI 作为数字音乐的一个国际标准,作
38、为数字音乐的一个国际标准,作为数字音乐的一个国际标准,作为数字音乐的一个国际标准,MIDIMIDI标准规定了电子乐器与计算标准规定了电子乐器与计算标准规定了电子乐器与计算标准规定了电子乐器与计算机之间传送数据的通信协议等规范。机之间传送数据的通信协议等规范。机之间传送数据的通信协议等规范。机之间传送数据的通信协议等规范。MIDIMIDI标准使不同厂家生产标准使不同厂家生产标准使不同厂家生产标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。随着的电子合成乐器可以互相发送和接收音乐数据。随着的电子合成乐器可以互相发送和接收音乐数据。随着的电子合成乐器可以互相发送和接收音乐数据。随着MID
39、IMIDI标准标准标准标准的施行,计算机成为电子合成乐器间的控制环节,出现了大量可进的施行,计算机成为电子合成乐器间的控制环节,出现了大量可进的施行,计算机成为电子合成乐器间的控制环节,出现了大量可进的施行,计算机成为电子合成乐器间的控制环节,出现了大量可进行记录、存储、编辑和播放乐谱(音符表或音符序列)的计算机软行记录、存储、编辑和播放乐谱(音符表或音符序列)的计算机软行记录、存储、编辑和播放乐谱(音符表或音符序列)的计算机软行记录、存储、编辑和播放乐谱(音符表或音符序列)的计算机软件。件。件。件。MIDIMIDI音频的处理过程如图音频的处理过程如图音频的处理过程如图音频的处理过程如图5-4
40、5-4所示,其主要优点是:所示,其主要优点是:所示,其主要优点是:所示,其主要优点是:1 1)生成的文件比较小。由于)生成的文件比较小。由于)生成的文件比较小。由于)生成的文件比较小。由于MIDIMIDI文件存储的是命令,而不是声音本身,因此它文件存储的是命令,而不是声音本身,因此它文件存储的是命令,而不是声音本身,因此它文件存储的是命令,而不是声音本身,因此它比较节省空间。例如,同样半小时的立体声音乐,比较节省空间。例如,同样半小时的立体声音乐,比较节省空间。例如,同样半小时的立体声音乐,比较节省空间。例如,同样半小时的立体声音乐,MIDIMIDI文件只有文件只有文件只有文件只有200KB2
41、00KB左右,而波形左右,而波形左右,而波形左右,而波形文件(文件(文件(文件(WAVWAV)则要差不多)则要差不多)则要差不多)则要差不多300MB300MB。现在学习的是第21页,共59页图图图图5-4 MIDI5-4 MIDI音频的处理过程音频的处理过程音频的处理过程音频的处理过程现在学习的是第22页,共59页5.2 音乐合成和音乐合成和MIDI 2 2)容易编辑。因为编辑命令比编辑声音波形要容易得多。)容易编辑。因为编辑命令比编辑声音波形要容易得多。)容易编辑。因为编辑命令比编辑声音波形要容易得多。)容易编辑。因为编辑命令比编辑声音波形要容易得多。3 3)可以作为背景音乐。)可以作为背
42、景音乐。)可以作为背景音乐。)可以作为背景音乐。MIDIMIDI音乐可以和其他的媒体,如数字电视、图形、动音乐可以和其他的媒体,如数字电视、图形、动音乐可以和其他的媒体,如数字电视、图形、动音乐可以和其他的媒体,如数字电视、图形、动画、话音等一起播放,这样可以加强演示效果。画、话音等一起播放,这样可以加强演示效果。画、话音等一起播放,这样可以加强演示效果。画、话音等一起播放,这样可以加强演示效果。产产产产生生生生MIDIMIDI乐乐乐乐音的方法很多,主要有两种:一种是音的方法很多,主要有两种:一种是音的方法很多,主要有两种:一种是音的方法很多,主要有两种:一种是频频频频率率率率调调调调制制制制
43、(frequency modulationfrequency modulation,FMFM)合成法,另一种是)合成法,另一种是)合成法,另一种是)合成法,另一种是乐乐乐乐音音音音样样样样本合成本合成本合成本合成法,也称法,也称法,也称法,也称为为为为波形表(波形表(波形表(波形表(wave tablewave table)合成法。)合成法。)合成法。)合成法。现在学习的是第23页,共59页5.3 数码音乐数码音乐MP3 MP3MP3的全称是的全称是的全称是的全称是MPEG-1 Layer3MPEG-1 Layer3音频文件。音频文件。音频文件。音频文件。MPEG-1MPEG-1是活动影音压缩
44、是活动影音压缩是活动影音压缩是活动影音压缩标准,其中的声音部分称为标准,其中的声音部分称为标准,其中的声音部分称为标准,其中的声音部分称为MPEG-1MPEG-1音频层,它根据压缩质量和编码音频层,它根据压缩质量和编码音频层,它根据压缩质量和编码音频层,它根据压缩质量和编码复杂度划分为三层,即复杂度划分为三层,即复杂度划分为三层,即复杂度划分为三层,即Layer1Layer1、Layer2Layer2和和和和Layer3Layer3,分别对应,分别对应,分别对应,分别对应MP1MP1、MP2MP2和和和和MP3MP3这这这这3 3种声音文件,并根据不同的用途,使用不同层次种声音文件,并根据不同
45、的用途,使用不同层次种声音文件,并根据不同的用途,使用不同层次种声音文件,并根据不同的用途,使用不同层次的编码。的编码。的编码。的编码。MPEGMPEG音频编码的层次越高,对应的编码器越复杂,音频编码的层次越高,对应的编码器越复杂,音频编码的层次越高,对应的编码器越复杂,音频编码的层次越高,对应的编码器越复杂,压缩率也越高,压缩率也越高,压缩率也越高,压缩率也越高,MP1MP1和和和和MP2MP2的压缩率分别为的压缩率分别为的压缩率分别为的压缩率分别为4:14:1和和和和6:1 8:16:1 8:1,而,而,而,而MP3MP3的压缩率则高达的压缩率则高达的压缩率则高达的压缩率则高达10:1 1
46、2:110:1 12:1。也就是说,。也就是说,。也就是说,。也就是说,分钟分钟分钟分钟CDCD音质的音音质的音音质的音音质的音乐,未经压缩需要乐,未经压缩需要乐,未经压缩需要乐,未经压缩需要10MB10MB的存储空间,而经过的存储空间,而经过的存储空间,而经过的存储空间,而经过MP3MP3压缩编码后只有压缩编码后只有压缩编码后只有压缩编码后只有1MB1MB左右。左右。左右。左右。现在学习的是第24页,共59页5.3 数码音乐数码音乐MP3 不过不过不过不过MP3MP3对音频信号采用的是有损压缩方式,为了降低失真度,对音频信号采用的是有损压缩方式,为了降低失真度,对音频信号采用的是有损压缩方式
47、,为了降低失真度,对音频信号采用的是有损压缩方式,为了降低失真度,MP3MP3采取了采取了采取了采取了“感官编码技术感官编码技术感官编码技术感官编码技术”,即编码时先对音频文件进行频谱分析,然,即编码时先对音频文件进行频谱分析,然,即编码时先对音频文件进行频谱分析,然,即编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,再通过量化的方式将剩下的每一位打散排后用过滤器滤掉噪音电平,再通过量化的方式将剩下的每一位打散排后用过滤器滤掉噪音电平,再通过量化的方式将剩下的每一位打散排后用过滤器滤掉噪音电平,再通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的列,最后形成具有较高压缩比
48、的列,最后形成具有较高压缩比的列,最后形成具有较高压缩比的MP3MP3文件,使压缩后的文件在回放文件,使压缩后的文件在回放文件,使压缩后的文件在回放文件,使压缩后的文件在回放时能达到比较接近原音源的声音效果。虽然它是一种有损压缩方时能达到比较接近原音源的声音效果。虽然它是一种有损压缩方时能达到比较接近原音源的声音效果。虽然它是一种有损压缩方时能达到比较接近原音源的声音效果。虽然它是一种有损压缩方式,但它以极小的声音失真换取了较高的压缩比,使得式,但它以极小的声音失真换取了较高的压缩比,使得式,但它以极小的声音失真换取了较高的压缩比,使得式,但它以极小的声音失真换取了较高的压缩比,使得MP3MP
49、3能够能够能够能够在因特网上广泛传播。在因特网上广泛传播。在因特网上广泛传播。在因特网上广泛传播。现在学习的是第25页,共59页5.3 数码音乐数码音乐MP3 MP3MP3这种压缩比非常高的数字音频文件不仅能在网上传播,而且还能这种压缩比非常高的数字音频文件不仅能在网上传播,而且还能这种压缩比非常高的数字音频文件不仅能在网上传播,而且还能这种压缩比非常高的数字音频文件不仅能在网上传播,而且还能容易地下载到便携式数字音频设备(容易地下载到便携式数字音频设备(容易地下载到便携式数字音频设备(容易地下载到便携式数字音频设备(MP3MP3随身听)中。随身听)中。随身听)中。随身听)中。MP3MP3随身
50、听随身听随身听随身听基于基于基于基于DSPDSP(数字信号处理器),无需计算机支持便可以实现(数字信号处理器),无需计算机支持便可以实现(数字信号处理器),无需计算机支持便可以实现(数字信号处理器),无需计算机支持便可以实现MP3MP3文件的存储、解码和播放。事先可以将创建好的文件的存储、解码和播放。事先可以将创建好的文件的存储、解码和播放。事先可以将创建好的文件的存储、解码和播放。事先可以将创建好的MP3MP3文件从计文件从计文件从计文件从计算机或因特网上下载到算机或因特网上下载到算机或因特网上下载到算机或因特网上下载到MP3MP3随身听内置的存储器中,当从中选择播随身听内置的存储器中,当从