工程硕士学位论文写作范例14034.docx-淘文阁

资源描述

《工程硕士学位论文写作范例14034.docx》由会员分享，可在线阅读，更多相关《工程硕士学位论文写作范例14034.docx（54页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、工程硕士学学位论文文写作范范例Studyy onn thhe PPaveemennt MMateeriaal oof PPervviouus CConccrette(申请清华华大学工工程硕士士专业学学位论文文)培养单单位：计算机科学学与技术术系工程领域：计算机技术术申请请人人：李某指导教师：某某某教授联合指导教教师：某某某高工二九年年三月工程硕士学学位论文文写作说说明李某关于学位论文使用授权的说明本人完全了了解清华华大学有有关保留留、使用用学位论论文的规规定，即即：清华大学拥拥有在著著作权法法规定范范围内学学位论文文的使用用权，其其中包括括：（1）已获学学位的研研究生必必须按学学校

2、规定定提交学学位论文文，学校校可以采采用影印印、缩印印或其他他复制手手段保存存研究生生上交的的学位论论文；（2）为为教学和和科研目目的，学学校可以以将公开开的学位位论文作作为资料料在图书书馆、资资料室等等场所供供校内师师生阅读读，或在在校园网网上供校校内师生生浏览部部分内容容。本人保证遵遵守上述述规定。作者签名：导师签名：日期：日期：摘要摘要情感是人类类智能的的重要方方面。为为建立和和谐的人人机交互互环境，计计算机自自然需要要具有理理解情感感和表达达情感的的能力。本本文在声声学层次次上系统统性地研研究了情情感的区区分特征征和感知知特征，并并提出了了情感语语音的叠叠加模型型。论文的主要要

3、成果如如下：1. 分析析了. ，指指出当前前存在. 问题。研研究了. 特点，提提出了一一种算算法，并并通过. 实现了了。2. 提出出了一种种基于韵韵律强度度的语音音基频预预测算法法，. 。3. 设计计了一个个自学习习的特征征权值训训练算法法，提高高了. 。4 实现了了. 平平台，验验证了. 的有效效性。关键词：关关键词11关关键词22关关键词33关关键词44关关键词55XAbstractAbstrracttWith thee raapidd deevellopmmentt off innforrmattionn teechnnoloogy, compputeer bbecoomess an

4、n inndisspennsabble toool iin oour daiily liffe. Too maake humman-commputter intteraactiion friienddlieer, ressearrcheers of rellevaant ressearrch fieeldss appplyy thhemsselvves on thee deevellopmmentt off neew hhumaan-ccompputeer iinteeracctioon ttechhnollogiies. SSpeeech, ass thhe mmostt naaturral

5、 wayy inn huumann coommuuniccatiion, iss allso in thee ceenteer oof aatteentiion. AAnd thee HCCI (humman-commputter intterffacee) ttechhnollogiies, whhichh baasedd onn sppeecch rrecoogniitioon, speeechh syynthhesiis, andd naaturral lannguaage unddersstanndinng, havve bbeenn reecoggnizzed as thee moo

6、st proomissingg reeseaarchh diirecctioon.In reecennt yyearrs, as thee deevellopmmentt off sttatiistiicall meethoods forr sppeecch ssyntthessis, laargee coorpuus bbaseed TTextt-too-Sppeecch (TTSS) ssysttem hass beeen ablle tto ssyntthessizee hiigh quaalitty sspeeech. BBut commparred witth hhumaan nna

7、tuurall sppeecch, thee syynthhesiizedd sppeecch sstilll hhas somme sshorrtagges, esspecciallly in proosoddy eexprresssionn. In thhis theesiss, sspeeech proosoddy iin CChinnesee Puutonnghuua iis ffirsst sstuddiedd, aand a cconcclussionn iss maade thaat oone proobleem wwithh cuurreent proosoddy mmodee

8、linng mmethhodss iss laack of a gglobbal-levvel proosoddy pplannninng pproccesss. It alsso ppoinnts outt thhat thee prrosoodicc paarammeteers forr gllobaal-lleveel pprossodyy pllannningg, ssuchh ass prrosoodicc sttrenngthh, iis iin nneedd.Inn chhaptter 2, aa neew pprossodiic sstreengtth eestiimattio

9、nn meethood bbaseed oon PParaalleel EEncoodinng aand Tarrgett Appprooximmatiion (PEENTAA) MModeel iis iintrroduucedd. In thiis eestiimattionn meethood, proosoddic strrenggth is takken as a llateent varriabble in phrrasee-leevell prrosoodicc pllannningg prroceess, annd pprossodiic sstreengtth ffuncct

10、ioon, whiich is a mmapppingg fuuncttionn beetweeen acoousttic proosoddic parrameeterrs annd pprossodiic sstreengtth, is reppressentted witth NNeurral Nettworrk. Baasedd onn thhe ccorrrelaatioon bbetwweenn prrosoodicc sttrenngthh annd sspeeech uniit ttargget commpleetioon ddegrree, prrosoodicc sttren

11、ngthh fuuncttionns aare traaineed aautoomatticaallyy wiith a sspeeech corrpuss.In chhaptter 3, aan FF0 ggeneerattionn meethood bbaseed oon pprossodiic sstreengtth iis ppropposeed. Inn thhis neww F00 prrediictiion metthodd, tthe glooball prrosoody plaanniing proobleem iis ttackkledd thhrouugh addding

12、g a glooball prrosoodicc sttrenngthh pllannningg prroceess befforee piitchh prrediictiion forr sppeecch uunitts. Itt haas bbeenn wiidelly aacceepteed tthatt, iin hhumaan sspeeech commmunnicaatioon ttherre iis aa prrosoody pree-pllannningg prroceess forr eaach proosoddic phrrasee beeforre aartiiculla

13、tiion, annd tthenn syyllaablees aare artticuulatted acccorddingg too thheirr prre-pplannnedd prrosoodicc reesullts. IIn tthiss meethood, proosoddic strrenggth is choosenn ass thhe llateent varriabble forr phhrasse lleveel pprossodiic pplannninng, andd thhe pprossodyy pllannningg prroceess is simmula

14、atedd wiith proosoddic strrenggth moddeliing. SSo iin pprossodiic ppreddicttionn, aa prrosoodicc sttrenngthh pllannningg iss fiirstt doone forr eaach proosoddic phrrasee, aand theen ppitcch cconttourr off eaach sylllabble is preedicctedd baasedd onn itts aassiigneed pprossodiic sstreengtth aand itss

15、 prrosoodicc coonteext infformmatiion.One ddiffficuultyy inn sppeecch ssyntthessis forr emmbedddedd pllatfformm iss hoow tto ccusttomiize thee sppeecch ccorppus to meeet tthe diffferrentt reequiiremmentts ffromm diiffeerennt eembeeddeed pplattforrms. OOn tthiss prrobllem, a sellf-llearrninng ffeattu

16、ree weeighhts trrainningg allgorrithhm aand a sspeeech corrpuss cuustoomizzatiionaalgooritthm aree prropoosedd inn chappter 4. Wiith thiis mmethhod, giivenn thhe ssizee off taargeet sspeeech corrpuss, ssampple nummberrs oof ssylllablle cclasssess wiill be dettermmineed aautoomatticaallyy, aand thee

17、syynthhesiis rresuultss off diiffeerennt ssylllablle cclasssess caan bbe mmadee suure to be ballancced.Keywoordss: pprossodiic sstreengtth pprossodiic mmodeel ppitcch ppreddicttionn sppeecch ccorppus cusstommizaatioon HMMM目录目录第1章引言言11.1 论文背背景及意意义11.2 国内外外研究现现状21.2.11 语语音合成成技术的的研究现现状21.3 论文主主要内容容3第

18、2章汉语语韵律分分析52.1 汉语的的特点分分析52.1.11 汉汉语声调调的声学学特性552.2 汉语语语音的韵韵律52.2.11 汉汉语的韵韵律层级级结构772.2.22 汉汉语重音音的韵律律分析772.3 韵律分分析模型型研究现现状82.3.11 SStemm-MLL模型82.3.22 PPENTTA模型型82.4 问题的的提出992.5 基于目目标逼近近(TAA)模型型的韵律律强度(proosoddic Strrenggth)计算1112.5.11 TTargget完完成程度度的估计计112.5.22 PProssodiic sstreengtth函数数的定义义122.5.33 PPr

19、ossodiic sstreengtth的训训练1222.6 实验及及结果分分析1222.7 小结155第5章总结结与展望望17参考文献119致谢21声明21附录AXXXX233个人简历、在在学期间间发表的的学术论论文与研研究成果果25主要符号对照表主要符号对对照表GMM高斯混合模模型（GGausssiaan MMixtturees MModeel）HMM隐含马尔科科夫模型型（Hiiddeen MMarkkov Moddel）LPC线性预测系系数（LLineear Preedicctioon CCoeffficciennts）LPCC线性预测倒倒谱系数数（Liineaar PPreddictt

20、ionn Ceepsttrall Cooeffficiientts）AMCC自适应Meel倒谱谱系数（Adaptive Mel Cepstral Coefficients）MFCCMel频域域倒谱系系数（MMel Freequeencyy Ceepsttrall Cooeffficiientts）UBM统一背景模模型（UUnivverssal Bacckgrrounnd MModeel）UELS无偏对数频频谱估计计（Unnbiaasedd Esstimmatiion of Logg Sppecttrumm）TI文本无关（Text-Independent）TD文本相关（Text-Dependen

21、t）ASI自动说话人人辨识（Automatic Speaker Identification）ASV自动说话人人确认（Automatic Speaker Verification）VQ矢量量化（Vecctorr Quuanttizaatioon）FAR错误接受率率（Faalsee Acccepptannce Ratte）FRR错误拒绝率率（Faalsee Reejecctioon RRatee）GMM高斯混合模模型（GGausssiaan MMixtturees MModeel）HMM隐含马尔科科夫模型型（Hiiddeen MMarkkov Moddel）LPC线性预测系系数（LLineear

22、 Preedicctioon CCoeffficciennts）LPCC线性预测倒倒谱系数数（Liineaar PPreddicttionn Ceepsttrall Cooeffficiientts）AMCC自适应Meel倒谱谱系数（Adaptive Mel Cepstral Coefficients）MFCCMel频域域倒谱系系数（MMel Freequeencyy Ceepsttrall Cooeffficiientts）UBM统一背景模模型（UUnivverssal Bacckgrrounnd MModeel）UELS无偏对数频频谱估计计（Unnbiaasedd Esstimmatiio

23、n of Logg Sppecttrumm）TI文本无关（Text-Independent）TD文本相关（Text-Dependent）ASI自动说话人人辨识（Automatic Speaker Identification）ASV自动说话人人确认（Automatic Speaker Verification）VQ矢量量化（Vecctorr Quuanttizaatioon）FAR错误接受率率（Faalsee Acccepptannce Ratte）FRR错误拒绝率率（Faalsee Reejecctioon RRatee）第1章引言第1章引引言1.1 论论文背景景及意义义文本所研究究的语

24、音音合成（TTTS）是是利用计计算机将将输入的的文本信信息，按按照自然然语言的的发音规规则转换换成语音音输出，即即使计算算机具有有“读”的功能能的一项项技术。一一个语音音合成系系统，要要实现高高质量的的语音合合成，首首先需要要对所要要合成的的文本信信息有很很好的理理解，这这主要涉涉及到自自然语言言理解的的问题；要使合合成的语语音符合合人的说说话的韵韵律形式式，就需需要人的的自然语语音的韵韵律变化化状态及及字音转转换方面面的知识识；最后后要完成成以上所所有信息息到具体体合成语语音的声声学实现现，主要要涉及到到语音信信号处理理等方面面。总之之语音合合成系统统本身涉涉及声学学、语言言学、数数字信号号

25、处理、多多媒体技技术等多多个领域域，是中中文信息息处理领领域的一一项前沿沿技术。脚注实际的语音音合成过过程一般般是将输输入的文文字序列列转换成成音韵序序列，再再由语音音合成器器生成语语音波形形。整个个过程一一般第一一步为文文本分析析处理，即即按照语语义、语语法等规规则对文文本进行行分词和和标注，并并将文字字序列转转换成字字的音节节序列；第二步步为韵律律分析预预测，即即根据语语境、韵韵律规则则和韵律律模型，为为每个音音节或词词组调整整韵律参参数，将将音节序序列转换换成音韵韵序列。第第三步语语音声学学合成，主主要利用用信号处处理技术术，按要要求合成成出符合合上两步步预测结结构的高高质量的的语音流

26、流。因此，语音音合成系系统在结结构上通通常可分分为文本本分析处处理、韵韵律处理理和声学学处理三三大模块块，如图图1.11所示。其其中在文文本分析析处理模模块主要要模拟人人对自然然语言的的理解过过程，对对输入的的文本进进行分析析并给出出后两个个模块所所需的各各种发音音提示，具具体内容容可划分分为正则则化、分分词与词词性标注注、韵律律结构预预测、字字音转换换等几个个部分。其其中正则则化部分分主要负负责将自自然文本本中存在在在非汉汉字字符符转换为为汉字字字符，比比如数字字格式的的日期等等。由于于汉语的的文本中中词与词词之间没没有自然然的分界界，而自自然语音音中的韵韵律的节节奏和文文本中的的词的边边界

27、有很很大的关关系，因因此分词词也是文文本分析析的重要要任务之之一。然然后就是是字音转转换部分分，主要要负责将将输入的的文字序序列转变变为音节节的序列列。韵律律处理模模块的主主要功能能是为合合成语音音规划出出音段特特征，如如音高、时时长和音音强等，使使合成语语音能正正确表达达语意，听听起来更更加自然然。因此此，它是是合成语语音音质质好坏的的关键。韵韵律处理理模块将将根据语语调、重重音和节节奏，对对每个发发音单元元进行韵韵律调整整，调整整后的输输出是包包含“韵律信信息”的音韵韵序列。声声学处理理模块利利用音韵韵序列中中的相应应参数，从从语音数数据库中中选取合合适的语语音基元元拼接成成句，再再经过韵

28、韵律修饰饰，就可可以输出出自然连连续的语语音流。作为人机交交互的核核心技术术之一，语语音合成成技术一一直是语语音研究究的重要要领域，而而且近年年在技术术和应用用方面都都取得了了很大的的发展。随随着电子子计算机机的运算算和存储储能力的的迅猛发发展，语语音合成成技术由由早期的的基于规规则的参参数合成成，到基基于小样样本的拼拼接调整整合成，并并逐渐发发展为基基于大语语料库的的拼接合合成，到到现在流流行的基基于隐马马尔科夫夫模型HHMM的的语音合合成。与与此同时时，合成成语音的的自然度度和音质质都得到到了明显显的改善善，基本本可以实实现人们们的应用用需求，从从而促进进了其在在实际系系统中的的应用。目目

29、前，语语音合成成技术己己经在自自动应答答呼叫中中心(包包括金融融、电信信和政府府等)、电电话信息息查询(包括天天气、交交通和旅旅游等)、汽车车导航以以及电子子邮件阅阅读等方方面得到到广泛的的应用，同同时针对对娱乐和和教育方方面的应应用也正正在开展展。总而而言之，语语音合成成技术正正在影响响着现代代社会的的方方面面面。1.2 国内外外研究现现状1.2.11 语语音合成成技术的的研究现现状1.2.11.1 三级级节标题题语音合成技技术根据据语音生生成的方方法大致致可分为为四种：发音参参数合成成方法，基基于声道道模型参参数合成成方法，拼拼接合成成方法和和基于统统计模型型的参数数合成方方法。其中发音参

30、参数合成成着重于于对人的的发音过过程进行行直接模模拟，由由于人的的发音生生理过程程受各种种因素的的影响使使具体的的物理模模拟过程程与现实实有很大大差异，合合成效果果不理想想。声道道模型参参数合成成方法主主要基于于一个“激励源源滤波波器”(soourcce-ffiltter)的语音音生成模模型，它它把人的的声道看看作成一一个谐振振腔，腔腔体的共共振峰特特性决定定了语音音的频谱谱特性，通通过建立立激励源源模型和和共振峰峰声道模模型来合合成自然然语音。这这种方法法主要有有共振峰峰合成器器、LPPC合成成器等，但但由于模模型本身身相对于于实际的的人的发发声器官官来说过过于简单单，生成成的合成成语音机机

31、器味很很浓，自自然度不不理想。拼接合成方方法与前前两种通通过对发发声过程程进行模模拟的语语音合成成方式不不同，采采用通过过对自然然语言的的分析，选选择合适适的基元元单位，建建立一定定规模的的语料库库；在合合成时，在在语料库库中选择择合适的的基元将将其拼接接起来而而完成完完整的语语音输出出。一般般拼接式式合成系系统结构构如图11.2所所示：文本分析基元选取韵律分析拼接合成语音输出基元库文本输入图1.2拼接式式语音合合成系统统结构图图由于编解码码保存了了语音的的绝大部部分信息息，自然然度很高高。但是是由于人人实际说说话时的的自然语语流并不不仅仅是是各个孤孤立语音音的简单单拼接，所所以整体体效果自自

32、然度不不好。1.3 论文主主要内容容38第2章汉语韵律分析第2章汉语韵韵律分析析2.1 汉语的的特点分分析汉语普通话话是以北北方话为为基础方方言，以以北京语语音为标标准音，以以现代白白话文作作为语法法规范的的语言。汉汉语与其其他的西西方语言言有很大大的不同同，主要要表现在在一字一一音或一一字多音音，而由由不同字字的组合合构成了了无限多多个词汇汇，不同同词汇的的组合又又构成了了表达一一定意义义的句子子，但是是相同发发音的词词汇甚至至句子在在不同的的语境中中表达的的意思却却可能千千差万别别。音素是语音音学的基基本单位位，是指指发出各各不相同同声音的的最小单单位。汉汉语中有有64个个音素，它它们

33、构成成了声母母和韵母母两大类类。汉语语拼音中中有211个声母母和388个韵母母，声母母和韵母母共计559个，声声母和韵韵母再组组成音节节。汉语语无调音音节有4417个个，由于于每个音音节又有有不同的的声调，因因此汉语语的有调调音节为为13332个，无无调音节节和有调调音节加加起来，总总计为117000多个音音节。总总体上汉汉语语音音主要有有以下特特点：2.1.11 汉汉语声调调的声学学特性声调主要表表现人的的声带振振动情况况，它的的声学表表现是语语音的基基音频率率的高低低及其基基音频率率值随时时间的变变化趋势势。因此此，要完完成一个个声调的的发音必必须要持持续一定定的时长长，这样样才能被被人们

34、正正确地感感知，从从声学参参数角度度来说就就是要有有一段连连续的基基频变化化曲线，即即声调曲曲线。对于汉语来来说，音音节声调调的变化化主要通通过音节节的浊音音部分的的基频变变化来表表现，通通常采用用音节韵韵母段中中基频变变化的轨轨迹来确确定音节节的声调调曲线。在在833885中中提出，一一个完整整的汉语语音节声声调曲线线可以分分为3个个部分：弯头段段(头部部)、调调型段(中部)和降尾尾段(尾尾部)。2.2 汉语语语音的韵韵律语音中的韵韵律主要要是指自自然语音音中轻重重、节奏奏，语调调等方面面的变化化。韵律律在自然然语言交交流中起起着非常常重要的的作用，它它不仅是是清楚表表达语义义的关键键，而且

35、且能反映映说话人人的态度度、意向向、情绪绪以及对对听话人人的期望望等信息息。重音音和语调调是自然然语音中中韵律表表现最突突出的两两个方面面。比如如，我们们在表达达一个疑疑问句和和陈述句句之间的的区别，是是通过语语调的改改变和用用我们发发音的基基频变化化来产生生疑问的的。语调调的变化化还可以以传达一一个说话话人的情情感状态态、性别别、健康康情况等等811。而而重音在在谈话中中通常被被用于表表明句子子语义的的重心所所在。例例如，陈陈述句：“小明拿拿走了书书包”这一句句话，当当重心放放在“小明”和“书包”两个不不同的位位置是所所表达的的意思就就有很大大的不同同，虽然然字面上上仍是一一样的，但但是对于

36、于说话人人和听话话人来说说具有不不同的意意思。这这也是自自然语言言相对与与书面语语言一个个优势的的方面，在在书面语语言中，还还没有更更好的方方法来表表达重音音和语调调，这两两个韵律律特征只只在在语语音中才才有明显显的表现现。从感知的角角度来看看，韵律律主要为为听觉特特征，韵韵律包含含了说话话人的意意图信息息和听话话人的感感知信息息，它在在帮助听听话人理理解语言言及意图图时十分分有用。从从生理上上来看，韵韵律的实实现是发发音人在在完成发发音的同同时，与与发音声声调的高高低、用用力的大大小以及及持续时时间的长长短等因因素总体体作用的的结果12。从声声学的角角度上看看，韵律律对应的的声学特特征主要要

37、表现在在语音的的基频、时时长、能能量和频频谱的变变化。从从听觉的的角度上上看，可可以用音音高、时时长、音音强和音音色四个个语音听听觉特征征来描述述。其中中基频是是韵律特特征中最最主要的的声学特特征，说说话过程程中，主主要通过过声音基基频的高高低和变变化模式式反映说说话人的的情绪、语语句内容容的不同同等。此此外，语语音中适适当的停停顿也是是韵律的的一个很很重要的的成分。在汉语语音音中，音音节是最最基本单单元，然然后由音音节组成成词，由由词构成成句子。在在汉语语语音合成成中，音音节也通通常被选选用做语语音合成成的基本本单元，音音节的基基频、时时长、能能量作为为表示韵韵律的声声学参数数。但是是在连续

38、续自然语语音中同同一个汉汉语音节节在不同同的语流流环境中中，由于于发音器器官运动动轨迹的的连续性性和众多多发音习习惯的制制约，其其韵律声声学参数数都会发发生相应应的改变变。而且且韵律本本身也是是通过连连续音节节的韵律律变化表表现出来来的，因因此韵律律特征也也被称为为“超音段段特征”，因此此要对汉汉语语音音中音节节的韵律律进行研研究必须须同基元元所在的的上下文文相结合合才行。也也就是说说自然语语音中一一个韵律律单元的的各个声声学参数数之间都都不是相相互独立立的，而而是相互互配合在在一起共共同完成成发音人人对所要要表达内内容的声声学实现现。在语语音的研研究中也也普遍认认为，人人在讲话话时总是是先将

39、意意识层要要表达的的信息转转化成语语言层和和音系层层的表达达手段，如如选择怎怎样的措措辞及句句式，怎怎样的语语调、轻轻重变化化模式、节节律模式式等，最最后再通通过发音音人的声声学器官官来完成成音系层层和语言言层所规规划的目目标。对于语音合合成系统统来说，韵韵律预测测的水平平对合成成语音的的自然度度关系极极大，甚甚至会影影响合成成语音的的可懂度度，也只只有当合合成语音音中各个个音节的的韵律特特征的参参数更新新与所处处的语流流环境协协调一致致时，才才能获得得高自然然度的语语音输出出。2.2.11 汉汉语的韵韵律层级级结构在连续自然然语流中中由于达达意和节节奏的需需要，说说话时对对于音节节序列的的发

40、音是是按组完完成，即即节奏群群。在节节奏群内内音节与与音节之之间连接接紧密，整整体语调调曲线连连贯，而而且节奏奏群内音音节基频频曲线整整体上呈呈现下降降的趋势势；在节节奏群之之间则会会插入停停顿，在在后一个个节奏群群的开始始通常基基频将重重置889。在在节奏群群内部音音节间相相互连接接的紧密密程度也也是有所所不同的的，通常常共同构构成一个个词的音音节间连连接相对对会更紧紧密一些些，这样样在整个个节奏群群中也可可以通过过音节间间不同的的紧密程程度将整整个语句句韵律表表现为一一个层次次结构。关于语言的的韵律层层级，各各家说法法不同，所所用术语语也不统统一117。在在韵律音音系学里里，一般般认为，韵

41、韵律域从从小到大大可依次次分为：莫拉、音音节、音音步、音音系词、附附着语素素词组、音音系短语语、语调调短语和和韵律语语句。但但通常，人人们将汉汉语韵律律层级简简化为三三个层级级：韵律律词、韵韵律短语语和语调调短语89。广义地说，韵韵律结构构应包括括重音、节节奏和语语调三方方面的结结构，例例如重音音的位置置分布及及其等级级差异；韵律边边界的位位置分布布及其等等级差异异；语调调的基本本架构及及其与声声调和重重音的关关系等。狭狭义地说说，韵律律结构主主要指话话语节奏奏的层次次性组织织，包括括韵律词词的构成成以及各各韵律成成分边界界的界定定等等，通通常叫做做韵律切切分。从从表面上上看，语语言信息息呈线

42、性性排列，在在时间上上依次出出现；但但从话语语生成的的本质上上看，语语言信息息在时间间域并不不是线性性地平均均分配，而而是以非非线性的的、层级级的形式式分布，并并且是非非递归的的500。按按照韵律律的层级级结构，可可以采用用韵律结结构树的的方法，将将任何一一个句子子非递归归地从高高到低、依依序分解解成语调调短语、韵韵律短语语和韵律律词，其其中韵律律短语和和韵律词词是现实实应用系系统常用用的韵律律单位。2.2.22 汉汉语重音音的韵律律分析重音一般是是通过对对连续语语流中某某个字或或词的发发音在一一定的范范围内韵韵律特征征的凸显显表现出出来的，也也就是说说受到重重读的字字或词的的韵律特特征明显显

43、地不同同于相邻邻单元的的韵律特特征229。研研究表明明，汉语语重音的的韵律声声学特征征表现在在音高和和时长的的变化，即即音域扩扩大（增增高声调调域的上上限）和和时长延延长两个个方面，其其次才是是音强的的增加。许许洁萍等等888882经经过实验验也得出出了相似似的结论论。曹剑剑芬559认认为，重重音是韵韵律四要要素综合合增强的的效应，其其中主要要是音节节时长显显著加长长，音高高变化突突出，具具体表现现为音阶阶或音闭闭的抬高高或下沉沉，音域域变化范范围增大大；然后后是音强强的相对对提高，音音色也更更加典型型。从感感知的角角度来看看，如果果一个字字或词组组成为重重音可以以通过音音高、时时长、音音强和

44、停停顿来表表征881。例例如，在在连续语语流中，提提高某个个字或词词组的音音高，可可以起到到警示或或强调作作用；拉拉长音节节时长可可以在心心理上起起到暗示示作用；提高声声音的幅幅度可增增加人们们的注意意力；在在字或词词组前加加入停顿顿，在听听觉上会会凸现重重点。传传统的语语音研究究中曾经经把音强强和重音音等同起起来，这这是片面面的。重重音不仅仅和音强强有关，更更和时长长、音高高有关。时时长越长长、音高高越高、跨跨越的调调域越广广，重音音越明显显。例如如“ji，sshu技技术”重心在在前一个个音节，而而“ji，sshu计计数”重心在在后一个个音节。尽尽管两个个词组的的发音完完全相同同，但是是由于

45、它它们发音音时的重重音位置置不同，其其音高和和时长也也不同，则则词组表表达的意意思完全全不同，因因此重音音的作用用和意义义非常明明显，如如图2.2所示示。.2.3 韵律分分析模型型研究现现状在语音韵律律模型方方面的研研究主要要分为两两个方面面，一个个方面是是音系学学方面的的研究人人员为解解释语音音中的韵韵律现象象而提出出的韵律律分析模模型方面面的研究究4，主要要代表有有Shiih提出出的Sttem-ML模模型和XXuYii的PEENTAA模型，而而另一个个方面为为语音合合成和语语音识别别的研究究人员所所提出的的为在实实际的系系统中应应用的韵韵律预测测模型71722，目目前主要要是基于于数据驱驱

46、动的韵韵律预测测模型，比比如基于于上下文文决策树树的22，基基于概率率的韵律律预测模模型33050等。在在这一部部分我们们主要针针对Sttem-ML和和PENNTA这这两个韵韵律分析析模型进进行简单单介绍。2.3.11 SStemm-MLL模型2.3.22 PPENTTA模型型2.4 问题的的提出要实现高自自然度的的语音合合成，韵韵律预测测是最重重要的工工作之一一。目前前语音合合成系统统中使用用的韵律律预测模模型大多多是基于于数据驱驱动的方方法，比比如基于于决策树树方法，基基于概率率的统计计模型10等等，主主要是基基于上下下文聚类类的方法法对声学学层韵律律参数进进行预测测。上下下文聚类类中采用用的上下下文信息息主要有有韵律层层级结构构信息，音音节自身身属性，及及前后音音节属性性信息等等5，而相相对于自自然语音音中的复复杂多变变的韵律律来说这这些上下下文信息息是远远远不够。由由于有限限上下文文信息的的限制，当当前的韵韵律预测测方法只只能够应应付一般般性的韵韵律变化化，对于于相对复复杂的韵韵律现象象就显得得不足，比比如自然然语音普普遍存在在的轻重重读99192现象。在自然语

展开阅读全文