第5章数据音频技术精选文档.ppt-淘文阁

资源描述

《第5章数据音频技术精选文档.ppt》由会员分享，可在线阅读，更多相关《第5章数据音频技术精选文档.ppt（59页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第5章数据音频技术本讲稿第一页，共五十九页第第5章章数据音频技术数据音频技术声音是多媒体技术研究中的一个重要内容。声音的种类繁多，如人的声音是多媒体技术研究中的一个重要内容。声音的种类繁多，如人的声音是多媒体技术研究中的一个重要内容。声音的种类繁多，如人的声音是多媒体技术研究中的一个重要内容。声音的种类繁多，如人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然界的雷声、话音、乐器的声响、动物的叫声、机器产生的声音以及自然界的雷声、话音、乐器的声响、动物的叫声、机器产生的声音以及自然界的雷声、话音、乐器的声响、动物的叫声、机器产生的声音以及自然界的雷声、风声、雨声、闪电声等。在用计算

2、机处理这些声音时，既要考虑它们风声、雨声、闪电声等。在用计算机处理这些声音时，既要考虑它们风声、雨声、闪电声等。在用计算机处理这些声音时，既要考虑它们风声、雨声、闪电声等。在用计算机处理这些声音时，既要考虑它们的共性，又要利用它们各自的特性。的共性，又要利用它们各自的特性。的共性，又要利用它们各自的特性。的共性，又要利用它们各自的特性。自从自从自从自从19691969年年年年BellBell实验室开始数字语音的研究以来，计算机产生音乐实验室开始数字语音的研究以来，计算机产生音乐实验室开始数字语音的研究以来，计算机产生音乐实验室开始数字语音的研究以来，计算机产生音乐以及语音识别、语音合成技术得到

3、了越来越广泛的研究和应用。多以及语音识别、语音合成技术得到了越来越广泛的研究和应用。多以及语音识别、语音合成技术得到了越来越广泛的研究和应用。多以及语音识别、语音合成技术得到了越来越广泛的研究和应用。多媒体数字音频处理技术在音频数字化、语音处理、合成及识别等各媒体数字音频处理技术在音频数字化、语音处理、合成及识别等各媒体数字音频处理技术在音频数字化、语音处理、合成及识别等各媒体数字音频处理技术在音频数字化、语音处理、合成及识别等各个方面都有着很好的发展。个方面都有着很好的发展。个方面都有着很好的发展。个方面都有着很好的发展。本讲稿第二页，共五十九页5.1 声音与声音信号数字化声音与声音信号数字

4、化作为一种模拟信号，声音在时间和振幅上都是连续的，即它的振幅作为一种模拟信号，声音在时间和振幅上都是连续的，即它的振幅作为一种模拟信号，声音在时间和振幅上都是连续的，即它的振幅作为一种模拟信号，声音在时间和振幅上都是连续的，即它的振幅能以任意精度并在任何一个时刻进行测量。与之不同的是，数字信能以任意精度并在任何一个时刻进行测量。与之不同的是，数字信能以任意精度并在任何一个时刻进行测量。与之不同的是，数字信能以任意精度并在任何一个时刻进行测量。与之不同的是，数字信号只能在确定的时刻才有意义，其数值也只能取有限的量。号只能在确定的时刻才有意义，其数值也只能取有限的量。号只能在确定的时刻才有意义，

5、其数值也只能取有限的量。号只能在确定的时刻才有意义，其数值也只能取有限的量。本讲稿第三页，共五十九页5.1.1 声音与听觉器官声音与听觉器官声音的强弱表现在声波压力的大小上，音调的高低表现在声音的频声音的强弱表现在声波压力的大小上，音调的高低表现在声音的频声音的强弱表现在声波压力的大小上，音调的高低表现在声音的频声音的强弱表现在声波压力的大小上，音调的高低表现在声音的频率上。当声音用电信号表示时，在时间和幅度上都是连续的模拟信率上。当声音用电信号表示时，在时间和幅度上都是连续的模拟信率上。当声音用电信号表示时，在时间和幅度上都是连续的模拟信率上。当声音用电信号表示时，在时间和幅度上都是连续的

6、模拟信号。对声音信号的分析表明，声音信号由许多频率不同的信号组成，号。对声音信号的分析表明，声音信号由许多频率不同的信号组成，号。对声音信号的分析表明，声音信号由许多频率不同的信号组成，号。对声音信号的分析表明，声音信号由许多频率不同的信号组成，这类信号称为复合信号，而单一频率的信号称为分量信号。声音信这类信号称为复合信号，而单一频率的信号称为分量信号。声音信这类信号称为复合信号，而单一频率的信号称为分量信号。声音信这类信号称为复合信号，而单一频率的信号称为分量信号。声音信号的一个重要参数就是带宽，用来描述组成复合信号的频率范围，号的一个重要参数就是带宽，用来描述组成复合信号的频率范围，号的一

7、个重要参数就是带宽，用来描述组成复合信号的频率范围，号的一个重要参数就是带宽，用来描述组成复合信号的频率范围，如高保真声音的频率范围为如高保真声音的频率范围为如高保真声音的频率范围为如高保真声音的频率范围为1020000Hz1020000Hz，带宽约为，带宽约为，带宽约为，带宽约为20kHz20kHz，而视，而视，而视，而视频信号的带宽是频信号的带宽是频信号的带宽是频信号的带宽是6MHz6MHz。本讲稿第四页，共五十九页5.1.1 声音与听觉器官声音与听觉器官声音信号的两个基本参数是频率和幅度。信号的频率是指信号每声音信号的两个基本参数是频率和幅度。信号的频率是指信号每声音信号的两个基本参数

8、是频率和幅度。信号的频率是指信号每声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒钟变化的次数，用秒钟变化的次数，用秒钟变化的次数，用秒钟变化的次数，用HzHz表示。频率小于表示。频率小于表示。频率小于表示。频率小于20Hz20Hz的信号称为亚音信号，的信号称为亚音信号，的信号称为亚音信号，的信号称为亚音信号，或称为次音信号；频率范围为或称为次音信号；频率范围为或称为次音信号；频率范围为或称为次音信号；频率范围为20Hz20kHz20Hz20kHz的信号称为音频的信号称为音频的信号称为音频的信号称为音频（AudioAudio）信号。虽然人的发音器官发出的声音频率大约是）信号。虽然人的

9、发音器官发出的声音频率大约是）信号。虽然人的发音器官发出的声音频率大约是）信号。虽然人的发音器官发出的声音频率大约是803400Hz803400Hz，但人说话的信号频率通常为，但人说话的信号频率通常为，但人说话的信号频率通常为，但人说话的信号频率通常为3003000Hz3003000Hz，在这种频率，在这种频率，在这种频率，在这种频率范围的信号称为话音信号；高于范围的信号称为话音信号；高于范围的信号称为话音信号；高于范围的信号称为话音信号；高于20kHz20kHz的信号称为超音频信号，或的信号称为超音频信号，或的信号称为超音频信号，或的信号称为超音频信号，或称超声波信号。一般来说，人的听觉器官

10、能感知的声音频率大称超声波信号。一般来说，人的听觉器官能感知的声音频率大称超声波信号。一般来说，人的听觉器官能感知的声音频率大称超声波信号。一般来说，人的听觉器官能感知的声音频率大约在约在约在约在2020000Hz2020000Hz之间，在这种频率范围里感知的声音幅度大约在之间，在这种频率范围里感知的声音幅度大约在之间，在这种频率范围里感知的声音幅度大约在之间，在这种频率范围里感知的声音幅度大约在0120db0120db之间。多媒体技术中处理的主要是音频信号，包括音乐、语之间。多媒体技术中处理的主要是音频信号，包括音乐、语之间。多媒体技术中处理的主要是音频信号，包括音乐、语之间。多媒体技术中处

11、理的主要是音频信号，包括音乐、语音和音效（风雨声、鸟叫声、机器声）等。音和音效（风雨声、鸟叫声、机器声）等。音和音效（风雨声、鸟叫声、机器声）等。音和音效（风雨声、鸟叫声、机器声）等。本讲稿第五页，共五十九页5.1.2 模拟信号与数字信号模拟信号与数字信号大多数电信号（模拟信号）过去一直是用模拟元部件（如晶体管、大多数电信号（模拟信号）过去一直是用模拟元部件（如晶体管、大多数电信号（模拟信号）过去一直是用模拟元部件（如晶体管、大多数电信号（模拟信号）过去一直是用模拟元部件（如晶体管、变压器、电阻、电容等）进行处理的。但是，开发一个具有相当变压器、电阻、电容等）进行处理的。但是，开发一个具有相

12、当变压器、电阻、电容等）进行处理的。但是，开发一个具有相当变压器、电阻、电容等）进行处理的。但是，开发一个具有相当精度、且几乎不受环境变化影响的模拟信号处理元部件相当困难，精度、且几乎不受环境变化影响的模拟信号处理元部件相当困难，精度、且几乎不受环境变化影响的模拟信号处理元部件相当困难，精度、且几乎不受环境变化影响的模拟信号处理元部件相当困难，成本也很高。成本也很高。成本也很高。成本也很高。话音信号是典型的连续信号，不仅在时间上，而且在幅度上也是连续话音信号是典型的连续信号，不仅在时间上，而且在幅度上也是连续话音信号是典型的连续信号，不仅在时间上，而且在幅度上也是连续话音信号是典型的连续信号，

13、不仅在时间上，而且在幅度上也是连续的。时间上的。时间上的。时间上的。时间上“连续连续连续连续”是指在一个指定的时间范围内声音信号的幅值有是指在一个指定的时间范围内声音信号的幅值有是指在一个指定的时间范围内声音信号的幅值有是指在一个指定的时间范围内声音信号的幅值有无穷多个，在幅度上无穷多个，在幅度上无穷多个，在幅度上无穷多个，在幅度上“连续连续连续连续”是指幅度的数值有无穷多个。我们把在是指幅度的数值有无穷多个。我们把在是指幅度的数值有无穷多个。我们把在是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。时间和幅度上都是连续的信号称为模拟信号。时间和幅度上都是连续的信号称为

14、模拟信号。时间和幅度上都是连续的信号称为模拟信号。本讲稿第六页，共五十九页5.1.2 模拟信号与数字信号模拟信号与数字信号如果把模拟信号转变成数字信号，用数字来表示模拟量和对数字信如果把模拟信号转变成数字信号，用数字来表示模拟量和对数字信如果把模拟信号转变成数字信号，用数字来表示模拟量和对数字信如果把模拟信号转变成数字信号，用数字来表示模拟量和对数字信号做计算，那么开发模拟运算部件的问题就转变成了开发数字运算号做计算，那么开发模拟运算部件的问题就转变成了开发数字运算号做计算，那么开发模拟运算部件的问题就转变成了开发数字运算号做计算，那么开发模拟运算部件的问题就转变成了开发数字运算部件的问题，

15、这就出现了数字信号处理器（部件的问题，这就出现了数字信号处理器（部件的问题，这就出现了数字信号处理器（部件的问题，这就出现了数字信号处理器（digital signal processordigital signal processor，DSPDSP）。）。）。）。DSPDSP与通用微处理器相比，除了结构不同外，它们的基与通用微处理器相比，除了结构不同外，它们的基与通用微处理器相比，除了结构不同外，它们的基与通用微处理器相比，除了结构不同外，它们的基本差别是，本差别是，本差别是，本差别是，DSPDSP有能力响应和处理采样模拟信号得到的数据流，有能力响应和处理采样模拟信号得到的数据流，有能力响应

16、和处理采样模拟信号得到的数据流，有能力响应和处理采样模拟信号得到的数据流，如做乘法和累加求和运算等。如做乘法和累加求和运算等。如做乘法和累加求和运算等。如做乘法和累加求和运算等。本讲稿第七页，共五十九页5.1.2 模拟信号与数字信号模拟信号与数字信号在数字环境进行信号处理的主要优点是：首先，数字信号计算是一在数字环境进行信号处理的主要优点是：首先，数字信号计算是一在数字环境进行信号处理的主要优点是：首先，数字信号计算是一在数字环境进行信号处理的主要优点是：首先，数字信号计算是一种精确的运算方法，它不受时间和环境变化的影响；其次，表示部种精确的运算方法，它不受时间和环境变化的影响；其次，表示部

17、种精确的运算方法，它不受时间和环境变化的影响；其次，表示部种精确的运算方法，它不受时间和环境变化的影响；其次，表示部件功能的数学运算不是物理上实现的功能部件，而仅仅是用数学运件功能的数学运算不是物理上实现的功能部件，而仅仅是用数学运件功能的数学运算不是物理上实现的功能部件，而仅仅是用数学运件功能的数学运算不是物理上实现的功能部件，而仅仅是用数学运算来模拟，相对容易实现；此外，可以对数字运算部件进行编程，算来模拟，相对容易实现；此外，可以对数字运算部件进行编程，算来模拟，相对容易实现；此外，可以对数字运算部件进行编程，算来模拟，相对容易实现；此外，可以对数字运算部件进行编程，如欲改变算法或改变某

18、些功能，还可对数字部件进行再编程。如欲改变算法或改变某些功能，还可对数字部件进行再编程。如欲改变算法或改变某些功能，还可对数字部件进行再编程。如欲改变算法或改变某些功能，还可对数字部件进行再编程。本讲稿第八页，共五十九页5.1.3 声音信号数字化声音信号数字化计算机要处理或合成声音，就必须把模拟的（连续的）声音波形转计算机要处理或合成声音，就必须把模拟的（连续的）声音波形转计算机要处理或合成声音，就必须把模拟的（连续的）声音波形转计算机要处理或合成声音，就必须把模拟的（连续的）声音波形转换成数字（离散化），这个过程称为声音采样（图换成数字（离散化），这个过程称为声音采样（图换成数字（离散化）

19、，这个过程称为声音采样（图换成数字（离散化），这个过程称为声音采样（图5-15-1），它是把连），它是把连），它是把连），它是把连续的声波信号通过一种称为模数（续的声波信号通过一种称为模数（续的声波信号通过一种称为模数（续的声波信号通过一种称为模数（A/DA/D）转换器的部件转换成数）转换器的部件转换成数）转换器的部件转换成数）转换器的部件转换成数字信号，供计算机处理，如果需要的话，这种转换后的数字信字信号，供计算机处理，如果需要的话，这种转换后的数字信字信号，供计算机处理，如果需要的话，这种转换后的数字信字信号，供计算机处理，如果需要的话，这种转换后的数字信号又可以通过数模转换（号又可以通过

20、数模转换（号又可以通过数模转换（号又可以通过数模转换（D/AD/A）器，经过放大输出，变成人耳能够）器，经过放大输出，变成人耳能够）器，经过放大输出，变成人耳能够）器，经过放大输出，变成人耳能够听到的声音。听到的声音。听到的声音。听到的声音。本讲稿第九页，共五十九页图图图图5-1 5-1 声音信号数字化的过程声音信号数字化的过程声音信号数字化的过程声音信号数字化的过程本讲稿第十页，共五十九页5.1.3 声音信号数字化声音信号数字化连续时间的离散化通过采样来实现，就是每隔相等的一小段时连续时间的离散化通过采样来实现，就是每隔相等的一小段时连续时间的离散化通过采样来实现，就是每隔相等的一小段时连

21、续时间的离散化通过采样来实现，就是每隔相等的一小段时间采样一次，这种采样称为均匀采样；连续幅度的离散化通过间采样一次，这种采样称为均匀采样；连续幅度的离散化通过间采样一次，这种采样称为均匀采样；连续幅度的离散化通过间采样一次，这种采样称为均匀采样；连续幅度的离散化通过量化来实现，就是把信号的强度划分成一小段一小段，如果幅量化来实现，就是把信号的强度划分成一小段一小段，如果幅量化来实现，就是把信号的强度划分成一小段一小段，如果幅量化来实现，就是把信号的强度划分成一小段一小段，如果幅度的划分是等间隔的，就称为线性量化，否则就称为非线性量度的划分是等间隔的，就称为线性量化，否则就称为非线性量度的划分

22、是等间隔的，就称为线性量化，否则就称为非线性量度的划分是等间隔的，就称为线性量化，否则就称为非线性量化。图化。图化。图化。图5-25-2表示了声音数字化的概念。表示了声音数字化的概念。表示了声音数字化的概念。表示了声音数字化的概念。本讲稿第十一页，共五十九页图图图图5-2 5-2 声音的采样和量化声音的采样和量化声音的采样和量化声音的采样和量化本讲稿第十二页，共五十九页5.1.3 声音信号数字化声音信号数字化我们把时间和幅度都用离散的数字表示的信号称为数字信号。声音我们把时间和幅度都用离散的数字表示的信号称为数字信号。声音我们把时间和幅度都用离散的数字表示的信号称为数字信号。声音我们把时间和

23、幅度都用离散的数字表示的信号称为数字信号。声音数字化需要回答两个问题：数字化需要回答两个问题：数字化需要回答两个问题：数字化需要回答两个问题：每秒钟采集多少个声音样本，也就是每秒钟采集多少个声音样本，也就是每秒钟采集多少个声音样本，也就是每秒钟采集多少个声音样本，也就是采样频率是多少；采样频率是多少；采样频率是多少；采样频率是多少；每个声音样本的位数（每个声音样本的位数（每个声音样本的位数（每个声音样本的位数（bit per samplebit per sample，bpsbps）应该是多少，也就是量化精度。应该是多少，也就是量化精度。应该是多少，也就是量化精度。应该是多少，也就是量化精度。采

24、样的速度决定了录制声音的准确性，而采样值的精度则决定了采样的速度决定了录制声音的准确性，而采样值的精度则决定了采样的速度决定了录制声音的准确性，而采样值的精度则决定了采样的速度决定了录制声音的准确性，而采样值的精度则决定了录制声音的精确性。实践证明，采样速度越快，采样值越准确，录制声音的精确性。实践证明，采样速度越快，采样值越准确，录制声音的精确性。实践证明，采样速度越快，采样值越准确，录制声音的精确性。实践证明，采样速度越快，采样值越准确，声音特征复原得就会越好。声音特征复原得就会越好。声音特征复原得就会越好。声音特征复原得就会越好。本讲稿第十三页，共五十九页5.1.3 声音信号数字化声音信

25、号数字化常用的几种音频信号数字化的采样率标准是：常用的几种音频信号数字化的采样率标准是：常用的几种音频信号数字化的采样率标准是：常用的几种音频信号数字化的采样率标准是：44.2kHz44.2kHz（CDCD音质）、音质）、音质）、音质）、22.05kHz22.05kHz（FMFM音质）、音质）、音质）、音质）、11.025kHz11.025kHz（AMAM音质）等。为了追求音音质）等。为了追求音音质）等。为了追求音音质）等。为了追求音响品质的完美，减少噪声的干扰，达到理想的传播声音的环境，响品质的完美，减少噪声的干扰，达到理想的传播声音的环境，响品质的完美，减少噪声的干扰，达到理想的传播声音

26、的环境，响品质的完美，减少噪声的干扰，达到理想的传播声音的环境，国际上制定了一系列判断音质的标准，图国际上制定了一系列判断音质的标准，图国际上制定了一系列判断音质的标准，图国际上制定了一系列判断音质的标准，图5-35-3给出了几种数字声给出了几种数字声给出了几种数字声给出了几种数字声音质量等级的国际标准所对应的频率范围。音质量等级的国际标准所对应的频率范围。音质量等级的国际标准所对应的频率范围。音质量等级的国际标准所对应的频率范围。本讲稿第十四页，共五十九页图图图图5-3 5-3 数字声音质量等级对应的频率范围数字声音质量等级对应的频率范围数字声音质量等级对应的频率范围数字声音质量等级对应的频

27、率范围本讲稿第十五页，共五十九页5.1.3 声音信号数字化声音信号数字化样本大小是用每个声音样本的位数（样本大小是用每个声音样本的位数（样本大小是用每个声音样本的位数（样本大小是用每个声音样本的位数（bit/sbit/s或或或或b/sb/s）表示的，它反映度）表示的，它反映度）表示的，它反映度）表示的，它反映度量声音波形幅度的精度。例如，每个声音样本用量声音波形幅度的精度。例如，每个声音样本用量声音波形幅度的精度。例如，每个声音样本用量声音波形幅度的精度。例如，每个声音样本用1616位（位（位（位（2 2字节）表示字节）表示字节）表示字节）表示，测得的声音样本值是在，测得的声音样本值是在，测

28、得的声音样本值是在，测得的声音样本值是在065 536065 536的范围里，它的精度就是输入信号的范围里，它的精度就是输入信号的范围里，它的精度就是输入信号的范围里，它的精度就是输入信号的的的的1/655361/65536。样本位数的大小影响到声音的质量，位数越多，声音的质。样本位数的大小影响到声音的质量，位数越多，声音的质。样本位数的大小影响到声音的质量，位数越多，声音的质。样本位数的大小影响到声音的质量，位数越多，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需量越高，而需要的存储空间也越多；位数越少，声音的

29、质量越低，需量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。要的存储空间越少。要的存储空间越少。要的存储空间越少。采样精度的另一种表示方法是信号噪声比。采样精度的另一种表示方法是信号噪声比。采样精度的另一种表示方法是信号噪声比。采样精度的另一种表示方法是信号噪声比。本讲稿第十六页，共五十九页5.1.3 声音信号数字化声音信号数字化原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实现各种声音混

30、合以及消除或降低声音中的畸变等。一般的音频编现各种声音混合以及消除或降低声音中的畸变等。一般的音频编现各种声音混合以及消除或降低声音中的畸变等。一般的音频编现各种声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都具有设置音量、渐强渐弱处理及多通道混合等常用功能。辑软件都具有设置音量、渐强渐弱处理及多通道混合等常用功能。辑软件都具有设置音量、渐强渐弱处理及多通道混合等常用功能。辑软件都具有设置音量、渐强渐弱处理及多通道混合等常用功能。音频处理主要集中在音频压缩上，最新的语音压缩算法可将原始音频处理主要集中在音频压缩上，最新的语音压缩算法可将原始音频处理主要集中在音频压缩上，最新的语音压缩

31、算法可将原始音频处理主要集中在音频压缩上，最新的语音压缩算法可将原始声音数据压缩声音数据压缩声音数据压缩声音数据压缩6 86 8倍以上。倍以上。倍以上。倍以上。本讲稿第十七页，共五十九页5.1.4 声音质量与数据率声音质量与数据率数字化音频的质量取决于采样频率和量化位数这两个重要参数，数字化音频的质量取决于采样频率和量化位数这两个重要参数，数字化音频的质量取决于采样频率和量化位数这两个重要参数，数字化音频的质量取决于采样频率和量化位数这两个重要参数，反映音频数字化质量的另一个因素是通道（或声道）个数。记反映音频数字化质量的另一个因素是通道（或声道）个数。记反映音频数字化质量的另一个因素是通道

32、（或声道）个数。记反映音频数字化质量的另一个因素是通道（或声道）个数。记录声音时，如果每次生成一个声波数据，称为单声道；每次生录声音时，如果每次生成一个声波数据，称为单声道；每次生录声音时，如果每次生成一个声波数据，称为单声道；每次生录声音时，如果每次生成一个声波数据，称为单声道；每次生成二个声波数据，称为立体声（双声道），立体声更能反映人成二个声波数据，称为立体声（双声道），立体声更能反映人成二个声波数据，称为立体声（双声道），立体声更能反映人成二个声波数据，称为立体声（双声道），立体声更能反映人的听觉感受。音频数字化的采样频率和量化级越高，结果越接的听觉感受。音频数字化的采样频率和量化级越

33、高，结果越接的听觉感受。音频数字化的采样频率和量化级越高，结果越接的听觉感受。音频数字化的采样频率和量化级越高，结果越接近原始声音，除此之外，数字化音频的质量还受其他一些因素近原始声音，除此之外，数字化音频的质量还受其他一些因素近原始声音，除此之外，数字化音频的质量还受其他一些因素近原始声音，除此之外，数字化音频的质量还受其他一些因素（如扬声器的质量等）的影响。（如扬声器的质量等）的影响。（如扬声器的质量等）的影响。（如扬声器的质量等）的影响。根据声音的频带，通常把声音的质量分成根据声音的频带，通常把声音的质量分成根据声音的频带，通常把声音的质量分成根据声音的频带，通常把声音的质量分成5 5个

34、等级，由低到高分个等级，由低到高分个等级，由低到高分个等级，由低到高分别是电话、调幅广播（别是电话、调幅广播（别是电话、调幅广播（别是电话、调幅广播（AMAM）、调频广播（）、调频广播（）、调频广播（）、调频广播（FMFM）、光盘（）、光盘（）、光盘（）、光盘（CDCD）和）和）和）和数字录音带（数字录音带（数字录音带（数字录音带（digital audio tapedigital audio tape，DATDAT）的声音。在这）的声音。在这）的声音。在这）的声音。在这 5 5个等级中，个等级中，个等级中，个等级中，使用的采样频率、样本精度、通道数和数据率见表使用的采样频率、样本精度、通道数

35、和数据率见表使用的采样频率、样本精度、通道数和数据率见表使用的采样频率、样本精度、通道数和数据率见表5-15-1。本讲稿第十八页，共五十九页表表表表5-1 5-1 声音质量和数据率声音质量和数据率声音质量和数据率声音质量和数据率本讲稿第十九页，共五十九页5.2 音乐合成和音乐合成和MIDI 多媒体音频数据的一个重要来源是多媒体音频数据的一个重要来源是多媒体音频数据的一个重要来源是多媒体音频数据的一个重要来源是MIDIMIDI（乐器数字接口）。从（乐器数字接口）。从（乐器数字接口）。从（乐器数字接口）。从2020世世世世纪纪纪纪8080年代初期开始，年代初期开始，年代初期开始，年代初期开始，MI

36、DIMIDI逐步为音乐界广泛接受和使用。逐步为音乐界广泛接受和使用。逐步为音乐界广泛接受和使用。逐步为音乐界广泛接受和使用。MIDIMIDI是是是是乐器和计算机使用的标准语言，是一套指令（即命令）的约定，它指乐器和计算机使用的标准语言，是一套指令（即命令）的约定，它指乐器和计算机使用的标准语言，是一套指令（即命令）的约定，它指乐器和计算机使用的标准语言，是一套指令（即命令）的约定，它指示乐器（即示乐器（即示乐器（即示乐器（即MIDIMIDI设备）要做什么，怎么做，如演奏音符、加大音量、设备）要做什么，怎么做，如演奏音符、加大音量、设备）要做什么，怎么做，如演奏音符、加大音量、设备）要做什么，怎

37、么做，如演奏音符、加大音量、生成音响效果等。生成音响效果等。生成音响效果等。生成音响效果等。MIDIMIDI不是声音信号，它传送的是发给不是声音信号，它传送的是发给不是声音信号，它传送的是发给不是声音信号，它传送的是发给MIDIMIDI设设设设备或其他装置让其产生声音或执行某个动作的指令。备或其他装置让其产生声音或执行某个动作的指令。备或其他装置让其产生声音或执行某个动作的指令。备或其他装置让其产生声音或执行某个动作的指令。本讲稿第二十页，共五十九页5.2 音乐合成和音乐合成和MIDI 作为数字音乐的一个国际标准，作为数字音乐的一个国际标准，作为数字音乐的一个国际标准，作为数字音乐的一个国际标

38、准，MIDIMIDI标准规定了电子乐器与计算标准规定了电子乐器与计算标准规定了电子乐器与计算标准规定了电子乐器与计算机之间传送数据的通信协议等规范。机之间传送数据的通信协议等规范。机之间传送数据的通信协议等规范。机之间传送数据的通信协议等规范。MIDIMIDI标准使不同厂家生产的电子标准使不同厂家生产的电子标准使不同厂家生产的电子标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。随着合成乐器可以互相发送和接收音乐数据。随着合成乐器可以互相发送和接收音乐数据。随着合成乐器可以互相发送和接收音乐数据。随着MIDIMIDI标准的施行，计标准的施行，计标准的施行，计标准的施行，计算机成为电子

39、合成乐器间的控制环节，出现了大量可进行记录、存算机成为电子合成乐器间的控制环节，出现了大量可进行记录、存算机成为电子合成乐器间的控制环节，出现了大量可进行记录、存算机成为电子合成乐器间的控制环节，出现了大量可进行记录、存储、编辑和播放乐谱（音符表或音符序列）的计算机软件。储、编辑和播放乐谱（音符表或音符序列）的计算机软件。储、编辑和播放乐谱（音符表或音符序列）的计算机软件。储、编辑和播放乐谱（音符表或音符序列）的计算机软件。MIDIMIDI音频的处理过程如图音频的处理过程如图音频的处理过程如图音频的处理过程如图5-45-4所示，其主要优点是：所示，其主要优点是：所示，其主要优点是：所示，其主要

40、优点是：1 1）生成的文件比较小。由于）生成的文件比较小。由于）生成的文件比较小。由于）生成的文件比较小。由于MIDIMIDI文件存储的是命令，而不是声音本身，因此它文件存储的是命令，而不是声音本身，因此它文件存储的是命令，而不是声音本身，因此它文件存储的是命令，而不是声音本身，因此它比较节省空间。例如，同样半小时的立体声音乐，比较节省空间。例如，同样半小时的立体声音乐，比较节省空间。例如，同样半小时的立体声音乐，比较节省空间。例如，同样半小时的立体声音乐，MIDIMIDI文件只有文件只有文件只有文件只有200KB200KB左右，而波左右，而波左右，而波左右，而波形文件（形文件（形文件（形文件

41、（WAVWAV）则要差不多）则要差不多）则要差不多）则要差不多300MB300MB。本讲稿第二十一页，共五十九页图图图图5-4 MIDI5-4 MIDI音频的处理过程音频的处理过程音频的处理过程音频的处理过程本讲稿第二十二页，共五十九页5.2 音乐合成和音乐合成和MIDI 2 2）容易编辑。因为编辑命令比编辑声音波形要容易得多。）容易编辑。因为编辑命令比编辑声音波形要容易得多。）容易编辑。因为编辑命令比编辑声音波形要容易得多。）容易编辑。因为编辑命令比编辑声音波形要容易得多。3 3）可以作为背景音乐。）可以作为背景音乐。）可以作为背景音乐。）可以作为背景音乐。MIDIMIDI音乐可以和其他的媒

42、体，如数字电视、图形、音乐可以和其他的媒体，如数字电视、图形、音乐可以和其他的媒体，如数字电视、图形、音乐可以和其他的媒体，如数字电视、图形、动画、话音等一起播放，这样可以加强演示效果。动画、话音等一起播放，这样可以加强演示效果。动画、话音等一起播放，这样可以加强演示效果。动画、话音等一起播放，这样可以加强演示效果。产产产产生生生生MIDIMIDI乐乐乐乐音的方法很多，主要有两种：一种是音的方法很多，主要有两种：一种是音的方法很多，主要有两种：一种是音的方法很多，主要有两种：一种是频频频频率率率率调调调调制制制制（frequency modulationfrequency modulation

43、，FMFM）合成法，另一种是）合成法，另一种是）合成法，另一种是）合成法，另一种是乐乐乐乐音音音音样样样样本合本合本合本合成法，也称成法，也称成法，也称成法，也称为为为为波形表（波形表（波形表（波形表（wave tablewave table）合成法。）合成法。）合成法。）合成法。本讲稿第二十三页，共五十九页5.3 数码音乐数码音乐MP3 MP3MP3的全称是的全称是的全称是的全称是MPEG-1 Layer3MPEG-1 Layer3音频文件。音频文件。音频文件。音频文件。MPEG-1MPEG-1是活动影音压是活动影音压是活动影音压是活动影音压缩标准，其中的声音部分称为缩标准，其中的声音部分称

44、为缩标准，其中的声音部分称为缩标准，其中的声音部分称为MPEG-1MPEG-1音频层，它根据压缩质量和音频层，它根据压缩质量和音频层，它根据压缩质量和音频层，它根据压缩质量和编码复杂度划分为三层，即编码复杂度划分为三层，即编码复杂度划分为三层，即编码复杂度划分为三层，即Layer1Layer1、Layer2Layer2和和和和Layer3Layer3，分别对应，分别对应，分别对应，分别对应MP1MP1、MP2MP2和和和和MP3MP3这这这这3 3种声音文件，并根据不同的用途，使用不同层种声音文件，并根据不同的用途，使用不同层种声音文件，并根据不同的用途，使用不同层种声音文件，并根据不同的用途

45、，使用不同层次的编码。次的编码。次的编码。次的编码。MPEGMPEG音频编码的层次越高，对应的编码器越复杂，音频编码的层次越高，对应的编码器越复杂，音频编码的层次越高，对应的编码器越复杂，音频编码的层次越高，对应的编码器越复杂，压缩率也越高，压缩率也越高，压缩率也越高，压缩率也越高，MP1MP1和和和和MP2MP2的压缩率分别为的压缩率分别为的压缩率分别为的压缩率分别为4:14:1和和和和6:1 8:16:1 8:1，而，而，而，而MP3MP3的压缩率则高达的压缩率则高达的压缩率则高达的压缩率则高达10:1 12:110:1 12:1。也就是说，。也就是说，。也就是说，。也就是说，分钟分钟分钟

46、分钟CDCD音质的音音质的音音质的音音质的音乐，未经压缩需要乐，未经压缩需要乐，未经压缩需要乐，未经压缩需要10MB10MB的存储空间，而经过的存储空间，而经过的存储空间，而经过的存储空间，而经过MP3MP3压缩编码后只有压缩编码后只有压缩编码后只有压缩编码后只有1MB1MB左右。左右。左右。左右。本讲稿第二十四页，共五十九页5.3 数码音乐数码音乐MP3 不过不过不过不过MP3MP3对音频信号采用的是有损压缩方式，为了降低失真度，对音频信号采用的是有损压缩方式，为了降低失真度，对音频信号采用的是有损压缩方式，为了降低失真度，对音频信号采用的是有损压缩方式，为了降低失真度，MP3MP3采取了采

47、取了采取了采取了“感官编码技术感官编码技术感官编码技术感官编码技术”，即编码时先对音频文件进行频谱，即编码时先对音频文件进行频谱，即编码时先对音频文件进行频谱，即编码时先对音频文件进行频谱分析，然后用过滤器滤掉噪音电平，再通过量化的方式将剩下的分析，然后用过滤器滤掉噪音电平，再通过量化的方式将剩下的分析，然后用过滤器滤掉噪音电平，再通过量化的方式将剩下的分析，然后用过滤器滤掉噪音电平，再通过量化的方式将剩下的每一位打散排列，最后形成具有较高压缩比的每一位打散排列，最后形成具有较高压缩比的每一位打散排列，最后形成具有较高压缩比的每一位打散排列，最后形成具有较高压缩比的MP3MP3文件，使压缩文件

48、，使压缩文件，使压缩文件，使压缩后的文件在回放时能达到比较接近原音源的声音效果。虽然它是后的文件在回放时能达到比较接近原音源的声音效果。虽然它是后的文件在回放时能达到比较接近原音源的声音效果。虽然它是后的文件在回放时能达到比较接近原音源的声音效果。虽然它是一种有损压缩方式，但它以极小的声音失真换取了较高的压缩比，一种有损压缩方式，但它以极小的声音失真换取了较高的压缩比，一种有损压缩方式，但它以极小的声音失真换取了较高的压缩比，一种有损压缩方式，但它以极小的声音失真换取了较高的压缩比，使得使得使得使得MP3MP3能够在因特网上广泛传播。能够在因特网上广泛传播。能够在因特网上广泛传播。能够在因特网

49、上广泛传播。本讲稿第二十五页，共五十九页5.3 数码音乐数码音乐MP3 MP3MP3这种压缩比非常高的数字音频文件不仅能在网上传播，这种压缩比非常高的数字音频文件不仅能在网上传播，这种压缩比非常高的数字音频文件不仅能在网上传播，这种压缩比非常高的数字音频文件不仅能在网上传播，而且还能容易地下载到便携式数字音频设备（而且还能容易地下载到便携式数字音频设备（而且还能容易地下载到便携式数字音频设备（而且还能容易地下载到便携式数字音频设备（MP3MP3随身听）中。随身听）中。随身听）中。随身听）中。MP3MP3随身听基于随身听基于随身听基于随身听基于DSPDSP（数字信号处理器），无需计算机支持便可（

50、数字信号处理器），无需计算机支持便可（数字信号处理器），无需计算机支持便可（数字信号处理器），无需计算机支持便可以实现以实现以实现以实现MP3MP3文件的存储、解码和播放。事先可以将创建好的文件的存储、解码和播放。事先可以将创建好的文件的存储、解码和播放。事先可以将创建好的文件的存储、解码和播放。事先可以将创建好的MP3MP3文文文文件从计算机或因特网上下载到件从计算机或因特网上下载到件从计算机或因特网上下载到件从计算机或因特网上下载到MP3MP3随身听内置的存储器中，当随身听内置的存储器中，当随身听内置的存储器中，当随身听内置的存储器中，当从中选择播放一首从中选择播放一首从中选择播放一首从中

展开阅读全文