《语音清晰度的客观评测.ppt》由会员分享,可在线阅读,更多相关《语音清晰度的客观评测.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、LOGO语音清晰度的客观评测语音清晰度的客观评测语音清晰度的客观评测语音清晰度的客观评测中国传媒大学中国传媒大学中国传媒大学中国传媒大学 传播声学研究所传播声学研究所传播声学研究所传播声学研究所章斯宇章斯宇章斯宇章斯宇 主要内容主要内容1 语音清晰度评测的发展概况语音清晰度评测的发展概况语音清晰度评测的发展概况语音清晰度评测的发展概况2 混响作用下混响作用下STIPA与清晰度的关系与清晰度的关系3 噪声环境下噪声环境下STIPA与清晰度的关系与清晰度的关系4 总结与展望总结与展望1.语音清晰度的评测语音清晰度的评测v语音的清晰度或可懂度是音质评价的重要指标语音的清晰度或可懂度是音质评价的重要指
2、标反映反映厅堂或扩声系统的声音传输质量厅堂或扩声系统的声音传输质量v主观评价:主观评价:组织测试队伍实地测试组织测试队伍实地测试(articulation test)优点:直接、真实缺点:耗费人力物力vGB-T 15508-1995 声学声学 语言清晰度测试方法语言清晰度测试方法语音清晰度的客观评价方法语音清晰度的客观评价方法STI%ALconAI主观主观测试测试v尽可能反映真实尽可能反映真实的清晰度水平的清晰度水平清晰度指数清晰度指数 AI (Articulation Index)vFrench&Steinberg(1947),Fletcher(1953),Kryter(1962)1)测量或
3、估计语言频谱和听音人处的噪声有效掩蔽谱计算得到各频带的“有效信噪比”;2)对各频带信噪比进行线性转化至0,1得“贡献值”;3)基于不同频带对清晰度的贡献率加权平均得AI;vANSI Std.S3.5-196919861997v特点特点:特别适用于评价诸如噪声干扰、有限带通噪声干扰、有限带通等频域失真引起的语音清晰度恶化程度,不能反映混响、回声混响、回声或削峰削峰等时域或非线性失真的影响。辅音损失率辅音损失率%ALcon(articulation loss of consonants)v能不能根据测量房间内的某些物理量估计语音清晰度?能不能根据测量房间内的某些物理量估计语音清晰度?vKnudse
4、n(1932),Peutz(1971),Klein(1971)根据大量的实地测量和清晰度主观评价测试的结果,Peutz发现%ALcon与房间的声学特性相关。Peutz 公式(经验推导)公式(经验推导)D听音处距声源的距离。单位m。T60混响时间(1400Hz)。单位s。V房间的体积。单位m3。校准值。针对不同水平的听者。1.5%12.5%。Dc临界距离。单位m。注意:SNR25dB;单个无指向性的点声源(Q=1);Klein对对Peutz公式的补充公式的补充v当房间声学特性难以改善时,采用电声手段提高语音清晰度。当房间声学特性难以改善时,采用电声手段提高语音清晰度。v声源个数声源个数n;声源指
5、向性因子;声源指向性因子Q;虽然提高扬声器的Q值有助于改善语音清晰度,但Q值与清晰度之间是否成简单的线性关系并没有实际的实验数据支持。Jacob(1985)认为语音清晰度与Q并无直接的关联。辅音损失率辅音损失率%ALcon的不足的不足根据实验结果的经验推导,物理基础不够;对于信噪比低于25dB的情况估计不足,不能充分反映噪声和混响联合作用时的影响;没有考虑早期反射声,单次回响的作用,且结果仅给出某个频带的清晰度水平,未考虑参数的频率特性的影响;Jacob(1985)vHougast&Steeneken(197319801985)vIEC Std.60268-16v充分反映声传递系统性能质量的优
6、劣充分反映声传递系统性能质量的优劣输入端:说话人发音语言传输指数语言传输指数STI(speech transmission index)输出端:听者耳朵语言传输系统:语言传输系统:充分考虑传递过程中充分考虑传递过程中噪声、混响、回响、噪声、混响、回响、系统失真等各种干扰系统失真等各种干扰因素的影响因素的影响Black Box调制转移函数调制转移函数MTF(modulation transfer function)v连续的语音可以看成一系列语音碎片(音位)的组合。音位又可以看成是发音器官对某种窄带噪声调制的结果。音位的时域包络中包含了所传递的信息。v传输过程中,噪声、混响、系统失真等会使得包络发
7、生变化,从而导致清晰度恶化,利用MTF描述量化包络波动性能的变化程度。MTF的计算的计算v函数定义为声信号经传输后接收信号强度包络的调制度调制度相对于原信号强度包络调制度的降低,它随调制频率不同而变化。STI的计算的计算v14种调制频率;7种倍频带噪声 作为测试信号v计算98个MTF结果v类似AI计算中的加权平均最终得STI 0,1v根据房间脉冲响应可以直接计算MTFSTI与与语语音清晰度音清晰度Steeneken(1980)v不论是噪声、带通限制、削峰、混响等干扰因素,STI与语音清晰度得分之间始终有着良好的一致性。v客观可测的物理参量STI能良好的反映和预测真实的语音清晰度水平。语言传输指
8、数语言传输指数STI的简化算法的简化算法v限制条件:限制条件:无明显非线性失真;环境噪声无脉冲;混响时间频率特性平滑;宽带语言传输系统;v1)RASTI(Rapid STI or Room acoustic STI)适用于不包括扩声系统的厅堂语音传输质量的评价选取了语言谱中比较有代表性的频带和调制频率500Hz1Hz2Hz4Hz8Hz2KHz0.7Hz1.4Hz2.8Hz5.6Hz11.2Hzv2)STIPA(STI for public address)适用于包括扩声系统的厅堂或电声系统的语音传输质量评价选取了7种倍频带载波,每种载波对应2中调制频率125Hz250Hz500Hz1KHz2K
9、Hz4KHz8KHz1.0Hz1.0Hz0.63Hz2.0Hz1.25Hz0.8Hz2.5Hz5.0Hz5.0Hz3.15Hz1.0Hz6.25Hz4.0Hz12.5Hzv公共广播系统工程技术规范公共广播系统工程技术规范vSTIPA作为评价公共广播语言传输质量的重要指标作为评价公共广播语言传输质量的重要指标分类分类STIPA分类分类STIPA业务广播(一级)0.55紧急广播(一级)0.55业务广播(二级)0.45 紧急广播(二级)0.45业务广播(三级)0.35 紧急广播(三级)0.402.混响作用下混响作用下STIPA与与汉语汉语清晰度的关系清晰度的关系v对于于“声韵声韵调”结构构语言言汉语
10、,情况是怎,情况是怎样的?的?v目的:目的:在实验室条件下对无噪声纯混响作用下STI-PA与普通话单音节清晰度之间的关系进行实验研究。以期对搞清楚在纯混响作用下普通话单音节清晰度与语言传输指数STI-PA的具体关系有所贡献和帮助。对汉语语音清晰度客观评测方法的发展有着积极的意义。实验实验方法方法v实验室录音、模拟测试的方法v参照声学 语言清晰度测试方法GB-T 15508-1995v混响时间:0.5 s6.0 s,步长0.5 s,共12种混响条件;v发音人2名,听音人11名;声场中心声压级65dBA;v中、后音节受混响作用更明显;实验结实验结果果v混响时间与清晰度、STIPA的关系vSTIPA
11、与普通话单音节清晰度的关系v在实验结果的基础上归纳导出了STI-PA与普通话单音节清晰度之间的关系,此关系对制定扩声系统的STI-PA指标具有实用意义。v实验结果也揭示出汉语普通话单音节清晰度受混响的影响与英语清晰度受混响的影响程度有明显的不同。启示我们在实际工程应用中,在涉及到普通话语音清晰度的评测问题时,对直接引用已有的国际标准或基于外语的研究结果要十分慎重。3.噪声条件下噪声条件下STIPA与与汉语汉语清晰度的关系清晰度的关系v在实验室条件下分析了不同频带范围、不同信噪比的噪声环境下语音清晰度、STI-PA与信噪比的关系,并根据单音节清晰度与语言可懂度的关系,估计了在满足一定可懂度条件下
12、的最低信噪比及相应的STI-PA。v实验室录音、模拟测试的方法v参照声学 语言清晰度测试方法GB-T 15508-1995v采用了全频带白噪声和中心频率为250Hz,500Hz,1KHZ,2KHz,4KHz,8KHz的倍频带噪声作为干扰噪声,各频带噪声分别设置45种信噪比。实验结实验结果果v1)信噪比与清晰度、STIPA的关系(以白噪声为例)v2)等清晰度曲线v不同的噪声条件可能有着相同清晰度水平v工作是在实验室条件下进行的,考虑到实际的应用情况,可能还有一些不完善的地方,比如房间冲击响应的结构是否会对STI-PA与清晰度的关系有明显的影响还需要探讨。实际环境中的噪声种类多样,频率范围丰富,由于条件限制无法一一进行测试。每个频带噪声的信噪比取值区间可以更加细致以获得更为全面的结果。另外本次实验只是在65dBA(标准说话声压级)的噪声水平下进行的,其它噪声水平下的语言清晰度和STI-PA、信噪比的关系是否同本次实验结果一致还需要进一步的研究。4.展望展望STI for Chinese?STI%ALconAI主观主观测试测试LOGO