音响工程与电声技术.ppt

上传人:b** 文档编号:4121530 上传时间:2021-02-11 格式:PPT 页数:93 大小:945.50KB
返回 下载 相关 举报
音响工程与电声技术.ppt_第1页
第1页 / 共93页
音响工程与电声技术.ppt_第2页
第2页 / 共93页
点击查看更多>>
资源描述

《音响工程与电声技术.ppt》由会员分享,可在线阅读,更多相关《音响工程与电声技术.ppt(93页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、音响工程与电声技术Electroacoustical Project and Technology,课程简介,音响工程与电声技术是以电声与计算机技术为基础,对声音信号的特性以及对音频信号进行加工处理的方法、工具进行研究的一门课程。,课程主要内容,声学基础知识的介绍 基本听觉能力的培养 音频处理设备的介绍 数字音频工作站的使用(硬件、软件) 数字音频录制与处理的基本方法(软件),课程基础,数学基础 物理基础(声学、电学) 计算机基础知识 音乐基础知识,教材及参考书目,教育电声系统, 曹揆申主编,高等教育出版社 电声技术基础, 管善群编著,人民邮电出版社 音响技术, 美君等编,复旦大学出版社 数字

2、音频素材的制作与应用,刘毓敏著,国防工业出版社 电声系统与电声教学, 田振清编,内蒙古教育出版社 音响美学, 张凤涛著,北京广播学院出版社 影视录音, 姚国强著,北京广播学院出版社 音乐理论基础, 李重光编,人民音乐出版社,第一章 声音与人耳的听觉特性,学习目标:,学完这一章,你应当能做到: 1. 说出声波的几个相关概念; 2. 解释什么是声压与声压级; 3. 区别声能量、声能量密度、声功率、声强、声强级; 4. 解释什么是分贝; 5. 解释什么是响度、音调、音色; 6. 能大致画出等响度曲线,并对其进行分析与解释; 7. 阐述声音的时域特征、频域特征与动态范围; 8. 解释什么是掩蔽效应、延

3、时效应、双耳效应、听觉疲劳、听力驻留与听力谐音; 9. 区别准峰值与准平均值; 10.解释什么是失真,失真有哪几种类型。,第一节 什么是声音,声音是一种波动现象。当声源(机械振动源)振动时,振动体对周围相邻媒质产生扰动,而被扰动的媒质又会对它周围的相邻媒质产生扰动,这种扰动的不断传递就是声波产生与传播的基本原理。 通过机械振动发出声音的物体称为声源,声源振动所导致的周围媒质的振动传播称为声波,存在声波的空间称为声场,声场中能够传递上述振动的媒质称为声场媒质。(气体媒质、液体媒质、固体媒质),一、声波的物理特性,波长:声源的某一振动状态在一个周期内所传播的距离(m) 频率 :单位时间内声源所完成

4、的全振动的次数(Hz) 周期T:声源完成一次全振动所需要的时间(s) 速度V:声源某一振动状态在单位时间内所传播的距离(m / s),=1 / T VT V / ,振幅s 相位,空间距离d,任何2个振动相位相同而又相邻的媒质质点间的距离就是波长,声波是一种纵波,即传播媒介中质点的振动方向与声波传播的方向是平行的。 质点自身并不随着声波一起向四周扩散,而只是在原地附近进行振动,并由存在于它们之间的弹性进行能量传递。唯一不传递声波的空间是真空。 声波在不同介质中的传播速度是不同的,常温下它在空气中的传播速度约为:340m/s,振幅s 相位,空间距离d,媒质分子的 振动 状态,图:声波的传播方式,补

5、充一句,声音的传播速度取决于传递媒介的密度与温度。 通常媒介的密度越大、温度越高,声音在里面传播的速度就越快。(气温每上升或下降1,声速即加快或减慢约0.6m。因此在音乐厅中的气温能够影响交响乐团演奏音调的高度,而湿度则对声速的影响很小。),二、声压,由于空气媒质具有弹性,当声波(扰动)在其中传播时,媒质中每一个区间段都处于“压缩舒张压缩”的变化状态中。当媒质的某个区域被压缩时,其密度将大于没有声波(静态)传递时的0;反之,当媒质的某个区域处于舒张状态时,其密度将小于没有声波(静态)传递时的0。 因此,我们可以根据气体状态方程得知,当媒质被压缩时,媒质的压强将大于静态时的大气压强P0;当媒质舒

6、张时,媒质的压强将小于P0。 压缩:PP P00 舒张:PP P00,这个压强的增量P就是声压 P (单位为帕斯卡Pa),三、声能量与声能量密度 声功率与声强,声能量:声波传递的过程,也伴随了能量的传递。声波能量 由声源提供,表现为所有的媒介质点在振动过程中 所具有的动能与势能的总和。 声能量密度:声场中单位体积内的声能量。 声功率:单位时间内通过垂直于声波传播方向、面积为S的截 面的平均声能量称为平均声能量流或者平均声功率。 声强: 通过垂直于声波传播方向单位面积上的平均声功率 或平均声能量流称为平均声能量流密度或者声强。,声功率与声强,第二节 人耳的听觉特性,人对声音的主观感觉有响度、音高

7、、音色三种。它们分别与声波的客观物理属性:声压、频率以及频谱成分相对应,但又有一定的区别。因为,人类的听觉不仅是一种复杂的生理过程,同时也是一种复杂的心理运动过程。,高山流水 出 水 莲 二泉映月 雪花飞扬 炎黄第一鼓,一、响度,人耳对声音强弱的主观感觉称为响度。决定响度的因素主要是作用在人耳的声压或者声强的大小,但是两者却并不成正比例,且同样的声压在不同频率时,感觉的响度也不同。,女中音 手风琴,1、声压级与声强级 实验证明,若要使人耳的听感呈均匀的线性变化,那么声音强度必须按照指数变化,即按照指数规律增加或者减少;所以,人耳的听感强弱具有对数的性质。,人耳刚能听到的声音的声压是 2105

8、Pa,而开始难以忍受的声压是 20Pa ,它们相差100万倍!但是人耳的主观听感的增加却只有120倍。因此,大多数音响设备的音量电位器的电阻变化都是按照对数规律来进行调整的。,A、声压级,空间中某一点的声压的有效值与零声级的参考声压值之比的常用对数,定义为声压级Lp(Sound Pressure Level),单位为分贝(dB):,Prms 某点声压的有效值; P0 零声级的参考声压值。 通过实验,国际规定1kHz时人耳刚好能听到的声音的声压为 2105 Pa,作为声压级的 0 dB;又称为闻阈。,B、声强级,用功率的方式来表示声音的强弱就是声强。空间某点的声强值与零声级的参考声强值之比的常用

9、对数,定义为声强级LI,它也用分贝(dB)作为单位:,I 某点的声强值; I0 零声级的参考声强值。 国际规定I01012 W/m2 ,即1kHz时人耳刚好能听到的声音的声强值。,“分贝”,分贝是声学中最常用的一个单位,它表明的是对数据进行了对数加工以后的数量。以“分贝”作为单位的基础是由于人耳的听觉特性呈一种对数性质,而以分贝作为单位的好处则是它可以将相差若干数量级的数据都以一种简单的线性方式表现出来,也就是说它可以压缩数据的数量级或者倍数关系。比如: 闻阈的声压是 2105 Pa,痛阈的声压是 20Pa,它们相差1106 这样对它们进行表示或者说对声压之间的关系进行运算是非常麻烦的,因为声

10、压的变化一般都是10倍、100倍的变化而很少只有个位数的变化,因此对它们进行对数以后的运算就容易的多了,只相差 lg1066 倍。此外,为了计算的方便,我们还采用了相对值的方式定义了“声压级”的概念;并且,为了保证声压级数值不至于太小(小数点后几位),我们还将上面的对数值乘以了系数20,从而使声压级只保持在个位与十位两位数。,2105 Pa0dB 2104 Pa20dB 2103 Pa40dB 2102 Pa60dB 2101 Pa80dB 210 0 Pa100dB 210 1 Pa120dB,2104 Pa20dB 4104 Pa26dB 8104 Pa32dB ,声压与声压级的对应关系,

11、与之类似,声强级每相差3dB则代表声强值加2倍,10dB代表声强值加10倍。,2、可闻声的频率范围 声波的频率范围比较宽,可从几Hz到几十MHz。人耳可听到的频率范围相对要小的多,大约为20Hz20000Hz。 低于20Hz的称为次声,高于20000Hz的称为超声。,声压级不同,“可闻声”的频率范围也不同;人耳对于25kHz的频率最为敏感。,注:实际上,只有极少数人能够听到低频与高频端点的声音;大部分人的可听范围在40Hz到16000Hz之间,约8倍频程。,将人耳所能听到的各频率声音的最低声压(级)连成一条曲线,称作闻阈曲线(在1kHz时为0dB);将人耳对响度过大以至于感到难受(疼痛)的各频

12、率声音的声压(级)也连成一条曲线,称作“痛阈曲线” (在1kHz时为120dB或140dB ),3、等响度曲线,在声压级与频率的坐标系中,声压级作为参变量,将频率不同、人们听起来却有同等响度的声压级分别连接起来组成一簇曲线,就构成了“等响度曲线”。图中的每条曲线代表了某一个响度等级,响度级的单位为“方”(Phon)。,响度级 将某一频率的声音与1kHz的声音相比较,当两者响度一样时,1kHz声音的声压级(以2105 Pa 为 0dB的相对分贝数)就是该声音的响度级。,1kHz声音的声压级就是一条等响曲线的响度级,等响曲线,痛阈 120方,闻阈 0方,响度的特性,低声压级时,同一等响曲线上各频率

13、声音的声压级相差很大(曲线较为陡峭);而高声压级时,同一等响曲线上各频率声音的声压级相差较小。(曲线较为平坦) 对于所有的响度级而言,频率在 3kHz5kHz 左右的响度曲线都处于最低位置,也就是说,人耳对于这一个频段的声音最为敏感。 曲线簇在高频段,高响度级与低响度级的曲线斜率及其间隔基本一致,说明高频段的响度变化与声压级增量基本一致;而在曲线簇的低频段,低响度级曲线斜率很大,等响曲线的间隔却较小,说明低频段声压级的微小变化都会导致响度的较大变化。 响度变化1dB大约是正常人所能辨别的最小的听感等级。而等响曲线上,声音每增加10方(一个响度级),我们主观的响度感觉加倍。,实际意义: (1)

14、在播放音乐的时候,音量的改变能够影响到可听见的声音的频率范围。因此,在小音量播放的时候,高低频声音信号损失较大(尤其是低音),而在大音量播放的时候,声音能够被较为完整的还原出来。在山王的大厅中 (2)在用于测量声音响度的声级计中,插入了符合不同等响级要求的计权网络,网络能够与等响曲线在高低频时的响度损失大致相吻合,使声级计的示数反应出人耳的听感特点。,国际电工技术委员会(IEC)针对声音响度测量设备规定了A、B、C三种计权曲线,用于模拟人耳的听觉特性;其中A计权大致模拟040dB响度级的听感,B计权模拟4070dB响度级的听感,C计权模拟80130dB响度级的听感。,对于录音室、演播室等场合,

15、总是希望背景声(噪声)的响度级尽可能低(通常都要求低于25dB),以减少干扰,因此在实际应用中,使用的最多的是A计权。,二、音调,人耳对声音调子高低的主观感觉称为音调或者音高。决定音调的主要因素是声音的频率;但音调也不是与频率完全对应的。也就是说,音调与频率之间并不是呈线性比例对应的,在闻阈的高频与低频段尤其如此。 频率低的音调给人以低沉、厚实、粗犷、笨拙、稳重等感觉,而频率高的音调则给人以轻快、明亮、活泼、缥缈等感觉。因此,在音乐中,音调是表达音乐的感情与内涵的重要元素。,俄罗斯舞曲 水族馆 乌龟 大象,1、人耳对声音频率的主观感觉 大量实验证明,人耳对于音高变化的感觉大致上也呈对数关系,即

16、:,音高 K lg,式中K为常数,是音高的频率。,上式表明: 当音频信号的频率变化较大时,人耳对于音调(音高)的变化感觉可能并不大,而频率的相对值的变化却能反映听感的音高变化。 注:“相对值”可以理解为频率按照倍数来进行变化。,倍 频 程,正如前面所说的,人耳对于音调的听感具有对数的性质,因此我们引入了倍频程的概念来适应这种由于音调频率的相对改变而带来的主观音调听感变化的现象。 若两个声音信号的频率1、2相差一倍时,即 2/1 = 2,称其为一个倍频程(OCT)。如2= 4kHz,1 = 2kHz,则2与1正好相差一个倍频程,人耳的音调听感也上升一倍。如果要使音调听感再上升一倍,则3 应为8K

17、Hz。,2、音律 所谓音律实际上指的就是乐音体系中各个“音”的音高构成的规律,或者是各个“音”的音高之间的关系。 对音律的研究可以追溯到古希腊时期,在历史上曾经出现过多种律制,比如:十二平均律、五度相生律、纯律等等。目前世界上广泛采用的是十二平均律。 所谓十二平均律是指将一个倍频程(音乐中称为一个八度音Octave),按频率对数划分为十二等分,这十二个相邻音的频率比各为 122。 具有1/12的倍频关系称为半音,2个半音组成一个全音(1/6倍频)。,按照音律规则由高向低排列的一系列“音”我们称为“音列”。譬如在钢琴、风琴等乐器上规则排列的键盘按键就能发出音列的声音。 音列中的每一个音都有两种表

18、示方法:“音名”与“唱名”。,如上图所示,音名有:C、D、E、F、G、A、B;唱名有:1、2、3、4、5、6、7。根据调式的不同,唱名还可以改变。 此外,由于在音乐中使用的音调的数量有许多(钢琴能够发出88个不同的音调),而基本音名却只有7个;为了区分音名相同而音高相差若干个八度的音,我们对整个音列进行了分组,每一个八度我们称为一个音组。 在音列中央的一组,我们称为小字一组,它的标记是用小写字母并在右上方加数字“1”表示。比小字1组高的还有小字2、3、4、5组;比小字1组低的还有小字组、大字组、大字1、2组;一共有2个不完全音组和7个完全音组。,440Hz,261.6Hz,音列中的各个音级的频

19、率不是随便确定的,它们一方面要符合12平均律的各音级之间的频率比;另一方面,我们也要对音列中各个音的频率进行规定,从而使世界上所有的音阶的音调都完全一致。 事实上,我们只需要对音列中的一个音的频率作出规定就可以保证整个音列的音调与其它音列的音调完全一致。 这个音我们称之为“标准音”,即小字1组的a(a1)。目前通用的标准音的频率为440Hz,这个高度也称为“第一国际高度”或者“演奏会高度”。此外还有不常见的第二国际高度435Hz,以及“古典高度”415430Hz之间。,3、响度对音调的影响 人耳对于音高的感觉还会受到响度(声压级)的影响,当响度较大时,耳膜由于受到较大的刺激而产生超常形变,从而

20、影响听觉神经对于音高的感觉。 通常情况下,响度增加时人耳对于音高的听感降低,低频时尤其如此。此外,响度增加还会导致音色的损失。,三、音色,人耳在主观感觉上区别相同响度和相同音高的两类不同声音的主观听觉特性称为音色(或者音质、音品)。 音色形成的原因多而复杂,比如声源的振动方式,发音方法,发音体的质地,共鸣体的结构等等,都与音色直接相关。但音色不同的根本原因在于谐波或泛音的频谱构成与分布(或是谐波与泛音的多少、强弱、次序、组合方式等)。,“基音”(基频)与“泛音”(谐频) 小提琴 钢琴 吉他 ?,我们平时所听到的绝大多数声音都不是由单一的频率所形成的。以琴弦为例:当琴弦振动发声时,不仅整根琴弦在

21、以某个频率振动,而且琴弦的某些部分还会以更高的频率单独振动;因此实际上我们听到的声音是由全弦振动以及部分弦振动所共同产生的“复合音”。 基音与泛音结合在一起形成了复合音。构成复合音的各音称为“分音”;全弦振动所产生的音叫做第一分音,由弦的二分之一振动所产生的音叫做第二分音,基波与2、3次谐波叠加后的合成波,“纯音”,纯音的概念是相对于复合音而言的。 只有一种频率的声音叫做纯音。比如音叉所发出的声音。由于音叉主要是靠共振发音,它的泛音频率极高,第一个泛音就是基音频率的6.27倍;这种泛音的音量(SPL)极弱,而且衰减迅速,很快就会消失,所以我们可以认为音叉所发出的声音是纯音。,如果两个音的基频相

22、同,则我们对它们的主观听感的音高就相同。也就是说,基音确定音调的高低。但如果它们的谐音不同,则会带来音色上的差异。 人耳正是根据这种音色上的差异来分辨不同的人声或者乐器声。,线状谱,除了具有线状频谱的音以外,还有一些声音不存在明显的音高(固定的振荡频率),比如背景噪声、电路中的热噪声、气流声、语言中的轻辅音(汉语中有zh、ch、sh、c、s等,英语中有t、s、p等)、以及打击乐器中的锣、鼓、钹、镲,甚至弦乐器拉奏时的摩擦声等等,都是这样一些非周期性的信号。,非周期性的信号频谱具有连续谱的性质。它虽然没有固定的音高,但却存在频谱的分布状态规律。,四、可闻声的频域特征,无论是线状谱还是连续谱的声信

23、号,都有各自的能量分布规律,即不同频率的“分音”(基音与泛音)具有不同能量强度。,1、共振峰 具有线状谱的声信号,基频分量的幅度(能量强度)总是较大的,谐波分量则随着频率的增加而具有总体上逐渐递减的趋势,但高次谐波并非一定会比低次谐波分量小,因此线状谱的谱线具有起伏的特征。 我们用平滑曲线连接起谐波谱线的顶端,形成包络线;在包络上某个区域的极大值我们就称为“共振峰”formant。 共振频率的最强音(振幅最大值),我们称为“峰巅”,正如我们在前面所说的,音色是由复合音的谐波成分所决定的,而对音色影响较大的就是那些分量突出的谐波成分即“共振峰”(以及“峰巅”)。共振峰的高度、位置、数量决定了每种

24、乐器与人声的音色,而这也是我们对声音信号进行分析、处理的重要依据。,2、谱级分布,我们最常见的电声信号主要有“语声”与“乐器声”两大类。通过对大量的乐器与人声进行统计计算,我们可以分别得到语声与乐器声的大致谱级分布曲线,这两种频谱的分布具有明显的差异。,注:虽然声音信号的种类繁多,但我们所关注的,同时也是电声设备主要处理与传输的基本上就是“语声”与“乐器声”两大类。,以下是对男女声进行大量的测试统计后得出的语声频谱分布图。男女声相比在200Hz以下有显著的差异,而在200Hz以上则相当的接近。在中频段女声略高,而在高频段则男声略高。并且从下图中,我们还可以看出,一般人的讲话声的能量主要分布于1

25、00Hz5kHz之间,尤其是在200Hz700Hz之间。,通信频带: 3003.4kHz,音乐的频谱分布比语声要宽一些,如下图所示的是西洋乐、轻音乐和民乐的频谱平均分布。 西乐在低、中频域内较为平坦,在高频段大约以6dB/oct平滑下降;轻音乐比西乐变化较大,并且存在着若干个峰值(3k附近);民乐(包括日本的邦乐)低频能量较弱,高频段的下降也较为明显。,以上的数据都是经过大量测试统计所的出的结果,适用于大多数情况(但却并不见得适用于某个特例)。 男女语声频谱分布的差别,主要是由男女生理结构的差异(声带)所导致的;而西乐、轻音乐、民乐频谱分布的主要差别,一方面是由于它们之间“曲风”的差异所造成的

26、,另一方面则是由于它们使用的“乐器”不同所导致的。,五、可闻声的时域特征,时域特性就是声信号的瞬时值随着时间变化的情况。 虽然声信号随着时间改变会发生复杂的变化,但是所有的声信号都包括了起振、稳定、衰减三个阶段。,1、起振段 起振段指声源激发发声体或空气柱使之克服静止张力或阻尼而开始振动所需要的时段。,注:同一种声源的高频音起振时间短、低频音起振时间长,2、稳定段 稳定段指起振后具有稳定鸣响的时段。 通常弦乐器具有较长的稳定段,而打击乐器的稳定段很短或根本没有。总的来说,以持续力激发的声源多具有稳定振荡,以断续力或者冲击力激发的声源则多缺少稳定振荡。,3、衰减段 衰减段指振幅开始减小直至停振的

27、时段。 不同声源所发出的声音的衰减时间不同,而高频音的衰减时间也短于低频音。,在前面我们提过,音色不同的根本原因在于谐波的频谱构成与分布状况。实际上,声音的时域特征也是确定音色的一个要素。起振时间、稳定时间、衰减时间与频谱的构成共同决定了各种声源具有不同的音色。 简而言之:声音的频域特征与时域特征共同构成了音色的全部要素。,三个阶段完整的声信号,无稳定段的声信号,稳定段不明显的声信号,六、可闻声的动态范围,声源所发出的声音的最大音量和最小音量之间的音量范围,通常被称作动态范围。,七、人耳听觉的非线性掩蔽效应,实验表明,当两个或两个以上的声音同时存在时,其中的一个声音在听觉上会掩盖另一个(或其它

28、的)声音,这种现象称为“掩蔽效应”。 在很多场合中,我们需要关注的声音都有可能被其它干扰声音所掩蔽。为此,在电声技术中信噪比(S/N)是用于衡量电声设备性能以及音频信号质量的一项重要指标。 我们把“被掩蔽声”的“闻阈”在受到其它声音干扰时应提高的分贝数定义为“掩蔽量”,以dB表示。 掩蔽量不仅与频率有关,而且与声音的性质有关。,对掩蔽效应我们可以得出以下一些结论: (1)掩蔽声和被掩蔽声频率越接近,掩蔽作用越大,在频率相同时掩蔽作用最大。 (2)低频声对高频声的掩蔽作用明显,而高频声对低频声的掩蔽效应很小。 (3)当掩蔽声是由多个声音组成的复音的时候,由于各个掩蔽声对被掩蔽声的掩蔽值不同,会导

29、致最终被掩蔽复音的音色发生变化。 (3)在时间上,掩蔽声越接近被掩蔽声时,掩蔽作用越大,且后掩蔽大于前掩蔽。 (4)单耳听觉的掩蔽效应大于双耳听觉。 (5)提高掩蔽声的声压级可展宽掩蔽的频率范围。,八、人耳听觉的延时效应与双耳效应,1、延时效应 延时效应又称为哈斯效应(Hass Effect),它指的是几个在时间上有先后的相同声音到达人耳时,听觉对它们的分辨力的特性。简单的说就是人耳对“回声”的感觉的规律。 实验表明,从声源直接传入人耳的声音与经反射传到人耳的回声如果时差小于30ms,则人耳一般不能对它们进行区分,仅能感觉到音色和响度的变化。但如果延时超过50ms时(相当于直达声与反射声的声程

30、大于17m),人耳就能判别出它们是来自两个不同方向的独立的声音。这后一个声音就是回声,它会对声源的声音产生干扰,妨碍我们的听闻与理解,因此必须加以控制。,哈斯通过大量主观性评价实验提出了反射声延迟时间与感觉到回声百分率值的关系,如下图所示:,2、双耳效应 由于人耳分布于头部两侧(约20cm),因此当声源偏离听者头部的中轴线时,由于声音到达两耳的距离不同,因此会产生微小的声级差、时间差和相位差,人们就能以此来辨别声音的方向,确定声源的位置,这就是双耳效应。 实验表明,人耳对于水平方向声源位置的分辨能力要比垂直方向强的多,通常可以达到15甚至于5 而在垂直方向有时甚至于要达到60才能分辨出来。 正

31、式由于双耳效应,人们才能在嘈杂的环境中分辨出来自于某个方向的声音,而单耳却不具备这种能力。,双耳效应与哈斯效应都是立体声的生理学基础。 自学材料:P27P32 立体声的听觉机理,九、听觉疲劳,因声音过度刺激而使听力暂时减退的现象称为听觉疲劳。听力减退的表现是闻阙提高、对同一声音响度的听觉降低或双耳定位能力减弱。 由听觉疲劳引起的听力损失经一定时期后能够恢复,故又称为暂时性听力损失。,十、听力驻留,在看电影的时候,我们实际上看到的是每秒25帧的静止的画面,但我们却感觉是看到的运动的画面,片中所有的动作都是连续的,这就是视觉暂留现象。 研究表明,听觉也具有一定的驻留现象。比如我们首先听到一个1ms

32、的脉冲声,然后又听到一个声强相同但长度变为2ms的脉冲声;在我们的主观感觉中,第二个声音并不是发声周期延长了,而是响度增加了。 也就是说,人所听到的一个脉冲声的响度不是和它的强度有关,而是和强度与时间的乘积有关;直到时间相当长(几十毫秒到一百毫秒以上),人才能觉察到声音的响度并没有发生变化而只是时间延长了而已。,十一、听力谐音,由于人耳的非线性和响应的不对称性,在听觉系统中产生了不存在于声刺激中的结合音。 比如:一个基频(基音)200Hz的复合音,谐音(泛音)为400Hz、600Hz、800Hz、1000Hz。我们把这个复合音信号的基频信号(200Hz)滤去,但人耳仍然能感知到200Hz的频率

33、。这种在听觉系统中重新产生的音,称为主观音。,第三节 听觉特性对电声技术的要求,人们对听感质量要求的不断提高是促进电声技术快速发展的动力;听觉特性对电声技术在频率域、时间域、空间域等方面都提出了更高的要求。,一、频率域要求,1、减少频率失真 乐音由基波和谐波共同组成,每一种音源都有其固定的频率成分和频谱范围。 其中基波的频带范围我们称为基频范围,基波与谐波共同组成的频带范围则构成了乐器的频谱(总频带范围)。 在前面我们讲到“音调”是由基频所决定的,而谐波频率决定的是“音色”,因此一种乐器的“音域”(即音调的范围)则是由基频范围所决定的。 同时我们知道,谐波频率总是基频的整数倍,也就是说谐波频率

34、要比基频高很多。因此,一种乐器的频谱(总频带范围)下限是由最低的基频成分所决定,而上限则是由谐波频率的最大值所决定的。,1,2,3,4,5,6,7,8,9,10,1、小提琴 2、中提琴 3、大提琴 4、倍大提琴 5、单簧管 6、长笛 7、圆号 8、长号 9、双簧管 10、大钢琴,部分西洋乐器的频谱范围,1、京胡 2、高音板胡 3、中音板胡 4、扬琴 5、大低胡 6、大胡 7、琵琶,部分民族乐器的频谱范围,如果声音信号经过电声系统的拾取、处理、传输、重现以后损失了某些频率成分,或者对于不同频率声音的大小比例关系进行了改变,我们就称之产生了频率失真,也叫线性失真。 因此,为了真实、完美的录制、传输

35、与重放各种乐音,要求电声系统具有很宽的频响范围。其频带的下限最好接近或低于20Hz,上限最好接近或达到20kHz,不均匀度控制在1dB以下。,2、减少相位失真 相比频率失真而言,相位失真所引起的听觉改变不是太明显,也就是说人耳对各频率分量的相位失真不太敏感。这种现象我们称为“相聋”。 而具有优良幅频特性的电子线路,通常也都具有良好的相频特性。 但是,随着研究的进一步深入,以及人们听感能力的特高,相频特性将直接影响到“声像”的方位。因此,我们也要对相位失真加以重视。,二、时间域要求,1、瞬态和稳态,从声音的时域特征我们可以知道,声源振动存在起振、稳定、衰减三个阶段。起振快无稳定段的声音具有明显的

36、瞬态特性;反之,稳定振荡段长的声音则具有明显的稳态特性。 对于很多的电声设备而言,它们的稳态指标可以做得很高,但是却不适应瞬态的、振荡激烈的声信号。对于这些信号它们会产生明显的失真,而音质也会明显的恶化。 因此,衡量电声设备和系统的优劣应该从稳态和瞬态两方面来检验。,随想曲第5号 驱魔鼓,2、直流分量 不论声波信号有多复杂,或者波形的正负峰值有多大的差异,声波的正负半周平均值总为0。(交变信号) 因此,无论是记录、重放还是加工处理,都不需要传送直流分量。(在很多情况下,直流分量反而是干扰噪声。),三、非线性失真要求,1、设备系统的非线性,波形失真:输出的时间域波形相比于输入波形发生改变。 频率

37、失真:产生多余的谐波分量。 复合信号相互调制产生多余的频率分量。,非线性失真也称为谐波失真。,2、动态范围(阈),人耳对于声音信号强度的接受范围极大(0120dB),而电声设备所能处理、传输的信号强度范围却小得多。 一般而言,电声设备所能处理的电声信号的下限受到噪声电平所制约,而上限则受系统的非线性畸变影响(通常称为过载失真,严重时还会导致元器件的老化、灵敏度下降甚至损坏。)这样就形成了一个动态的范围,也就是最强与最弱信号电平之间的差值。(要与声音的动态范围区分开来),0dB,噪声电平,最高电平,电声信号强度的5种计量值,在声学测量和电声学测量中,为了在计量声音信号的强度时能充分反应出声音信号

38、的波形特点,曾陆续出现过5种计量值来表示声音信号的声压和电压的强弱。其中前三种是基本的计量值,它们分别是: (1)峰值 指信号在一个完全周期(周期信号)或一定长的时间内(非周期信号)的最大瞬时绝对值。以信号电压为例,峰值的定义为:,(2)有效值(均方根值) 它是信号瞬时值平方平均值的平方根值,也即它是用与声音信号相同功率的直流信号强度来代表的数值。以信号电压为例,有效值定义为:,(3)整流平均值(简称平均值) 它是指声音信号瞬时绝对值的平均值,也即将声音信号进行全波整流(取绝对值)后的直流分量数值(取平均值)。定义式(以电压为例)如下:,从上面的定义可以看出,声音信号的峰值、有效值和整流平均值

39、实际上都是用一个直流信号与之相比较而得来的有关数值。这三个计量值广泛地应用于声学测量中。在电声测量中还使用下面两个导出的计量值,它是用声音信号的有关数值与简谐信号的有效值相比较而导出的计量值。,(4)准峰值 它是用与声音信号有相同峰值的稳态简谐信号的有效值表示的数值,定义式(以电压为例)如后: (5)准平均值 它是用与声音信号有相同平均值的稳态简谐信号的有效值表示的数值,定义式(以电压为例)如后:,准峰值,准平均值,根据以上的定义我们可以看出以上5个计量值的大小都与信号的频谱成分和波形形状是有关系的,为了进一步对这些关系进行研究,我们先来研究一下最简单的单频稳态信号即简谐信号的峰值、有效值、平

40、均值、准峰值、以及准平均值之间的关系。,简谐信号:,根据我们前面对准峰值与准平均值的定义可以看出,简谐信号的准峰值、准平均值与有效值是相等的,不过根据准峰值与准平均值的定义,我们应该用下面的关系式来描述它们:,Uq-p声音信号电压的准峰值 Uq-a声音信号电压的准平均值,简谐信号5个计量值之间的固定比例关系,由此可见,简谐信号的5个计量值之间有着固定的比例关系。 但是对于实际的声音信号而言,各个计量值之间的关系就不是那么简单了。它们之间的关系会因声音信号的频谱成分或者波形形状的不同而异。,具有相同有效值的声音信号与简谐信号峰值的不同,平均值相同的声信号与简谐信号的波形示意及动态范围,一般而言,

41、语言信号的动态范围较小,约为2040dB;音乐信号的动态范围可达80dB以上,现代流行音乐动态的上限甚至可以超过100dB。 动态的下限主要是高斯噪声,其准峰值约高于准平均值6dB左右。,失真,只要声音信号丧失或者歪曲了原始声波的特性,我们就认为产生了失真现象。失真的形式主要有以下几种: 1)频率失真 由于电声设备在音频范围内对各频率声音的放大率不一致;或者是出现了对音频范围内某一频率的遗漏,即产生了频率失真。,f,f,原始信号,放大信号,f,失真信号,2)谐波失真 由于电声设备的非线性,引入了原始波形中所没有的谐波或丢失原有的某些谐波所导致的一种失真。 3)互调失真 两个频率不同的声音叠加在

42、一起时所产生的一种失真形式,其表现为两个频率相互调制并产生不需要的拍频与复合声波。 4)空间感失真 表现为声像位置与原始声源位置不一致,从而影响空间感的再现。通常是由于录音时传声器摆放位置不当,声源位置不当或由于多个传声器的拾取音量不平衡所导致。 5)瞬态失真 瞬态失真是由于电声设备的某一部分不能将原始波形上的陡峭波前准确还原而引起的。通常在把能量从一种媒介转移到令一种媒介的器件时才会引起瞬态失真现象。,例如当一个很强的瞬态声音被扬声器播放时,扬声器的纸盆在恢复其原来位置之前有时会有一段“延迟复位”时间,这被称为“振荡(振铃)现象”,它会使接着播放的声波产生轻微的振幅变化,结果就形成了瞬态失真

43、。 6)音量失真 即扬声器音量与原始声音音量不一致。这种现象往往是我们故意造成的。例如在影视作品中,我们常常将角色的耳语放大若干倍,以提高语言的可读懂度。 7)过载失真(也称为振幅失真或调制失真) 电声设备通常都有一定的动态范围,超过这一范围的声音信号就会产生过载失真。它常常表现为尖利刺耳或爆裂的声音。例如声源声压级过高时,会导致电容传声器振模产生的电压使其内部的前置放大器出现信号过载失真。这种失真是传声器本身造成的,即使在调音台上使用衰减器来降低信号电平也无济于事,因为过载失真是不可逆的。,信噪比 S/N,信噪比可以理解为电声信号与设备本底噪声之间的幅度比值,通常也用分贝来表示。它表现为电声

44、设备可用的有效音量范围。 一般民用设备的信噪比约为4045分贝;专业模拟设备可以达到60分贝,而数字设备则可以达到90分贝以上。,阻抗,当一个电声设备或者电子元件对外表现得既有电抗(感抗)又有电阻时,其合成的效果我们统称为“阻抗”。 例如:一个扬声器的音圈上标明的阻抗是15,但我们测得的直流电阻可能只有56 ,其差值就是音圈对交流电所能够产生的感抗值。 当设备之间的阻抗正确匹配时,我们可以获得最大功率的传输效果;而在阻抗匹配不良的时候,输出功率就会受到损失。,噪声,声信号在拾取、传播、记录或处理过程中会产生各种噪声,它通常有以下几种类型: 1)线路噪声 主要是电子元件内部的固有噪声、导线的热噪声和外来电磁干扰噪声。 2)本底噪声 记录媒介本身的噪声。例如磁带上磁粉涂布不均所产生的噪声等等。 3)现场噪声 环境噪声与设备噪声,高保真,所谓高保真是指声信号经过各种设备处理后,能够不失真的被精确还原为原始状态,即将声源声再现出来。 高保真只是相对而言的,它会随着技术的发展而不断变化。例如70年代运用磁带记录的声音我们就认为它具有高保真效果(相对于唱盘而言),而现在我们显然不一样。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁