基于WEB的普通话自动测评系统的研究精品资料.doc

上传人:封****n 文档编号:96698105 上传时间:2024-03-10 格式:DOC 页数:74 大小:1.33MB
返回 下载 相关 举报
基于WEB的普通话自动测评系统的研究精品资料.doc_第1页
第1页 / 共74页
基于WEB的普通话自动测评系统的研究精品资料.doc_第2页
第2页 / 共74页
点击查看更多>>
资源描述

《基于WEB的普通话自动测评系统的研究精品资料.doc》由会员分享,可在线阅读,更多相关《基于WEB的普通话自动测评系统的研究精品资料.doc(74页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、南通大学毕业设计摘 要本文主要是基于WEB的普通话自动测评系统的研究。本系统可以有效地避免人工测试中的弊端,也可以省去大量的人力和资源。通过大量的研究发现:开发此系统可以通过采集大量的普通话语音信号,建立一个语音库,然后分析其信号波形,通过比对与匹配来实现语音识别和自动测评。但是,由于条件有限,本课题没有采取这种方法。本系统采用了微软提供的语音程序开发组件Speech SDK 5.1,即通过调用SDK中相关的语音应用程序接口(SAPI)来实现普通话考试的自动测评。本论文的主要内容有普通话测试的相关题库的建立、普通话语音的采集与分析、对采集的语音与标准答案进行比对算法研究,以及计算机自动阅卷评分

2、的研究。实验测试结果表明:本系统能够实现对单字、双字等项目的测试并评分,取得了预期的效果,可以为今后的进一步研究提供较好的参考。关键词:普通话,自动测评,语音识别,SPEECH SDKI南通大学毕业设计ABSTRACTThis paper studies the Mandarin automatic test system based on Web. The system will effectively avoid the shortage of manual test, also save a huge amount of manpower and resources. Through l

3、ots of study, I know that this system can be developed by collecting a lot of Mandarin speech signal and establishing a speech library, then analyzing the signal waveform, and through matching to realize automatic speech recognition and test. However, due to limited conditions, the subjects did not

4、take this method. The system uses Speech SDK 5.1 , a development component for the Speech procedures provided by the Microsoft Corporation. It means that we can realize the Mandarin automatic test by calling Speech Application Programming Interface(SAPI) associated with SDK. This paper mainly includ

5、es the establishment of Mandarin test papers library, the collection and analysis of the Mandarin speech, the research on the algorithm of matching between the acquired speech and the standard answer ,and on the automatic accounting scores by computer. Experimental results show that the system can r

6、ealized the tests of single words, phrases, and can be able to account scores. The system achieved expected results and can be a good reference for further research.Key words: Mandarin, Automatic Test, Speech Recognition, SPEECH SDK70目 录摘 要IABSTRACTII第一章 前 言11.1 本课题研究的意义和价值11.2 国内外课题研究的现状及发展趋势11.3 本

7、论文的主要研究内容2第二章 语音识别技术及引擎综述42.1 语音识别技术简介42.2SPEECH SDK72.2.1 概述72.2.2 语音识别接口82.2.3SDK编程原理9第三章 普通话自动测评系统的总体设计113.1 环境要求及软硬件平台113.2 系统功能设计113.2.1 系统流程简介113.2.2 系统总体功能设计113.3 数据库设计12第四章 普通话自动测评系统的实现154.1 普通话语音信号的采集154.1.1 信号采集154.1.2 样例分析174.2 评分策略算法的研究174.2.1 普通话测试概述174.2.2 普通话测试评分细则的解读184.2.2 算法思想设计234

8、.3 测评软件的实现254.3.1 相关API函数简介254.3.2 实现原理264.3.3 软件实现264.3.4 测评流程284.4 出题系统的实现294.4.1 ASP技术及工作原理294.4.2 随机出题的设计30第五章 普通话自动测评系统的应用325.1 实验测试325.2 测试结论37第六章 总结与展望38参考文献39致谢40附录41第一章 前 言1.1 本课题研究的意义和价值普通话是以北京语音为标准音、以北方话为基础方言、以典范的现代白话文著作为语法规范的现代汉民族共同语。普通话水平测试(PUTONGHUA SHUIPING CESHI,缩写为PSC),测查应试人的普通话规范程度

9、、熟练程度,认定其普通话水平等级,属于标准参照性考试。普通话水平测试作为国家推广普通话工作规范化、制度化和科学化进程中具有标志性的一项工作,给整个社会的语言健康发展带来了深远的影响。几年的测试实践证明,普通话水平测试能够比较科学准确地衡量和评定应试人的普通话水平,具有可操作性和可信度。但由于普通话测试完全采用口试方式进行,应试对象千差万别,测试员不仅工作强度大,更容易受到主观因素等许多不确定因素的影响。而普通话测试的评分标准尚没有细化到一定程度,再加上测试员的听测能力本身就有差别;所以在普通话水平测试中常常会出现评分差异,无疑对这种国家组织的标准化考试的普测工作的科学性、权威性和规范性造成了负

10、面影响 1。现在,普通话测试完全依靠测试员现场评判,计算得分。测试员必须在有限的时间内迅速评判应试者的语音状况并马上统计出每个受测人的得分;在紧张的测试之后还要花大量的时间进行汇总,可以说测试员的劳动强度是很大的,因此很难保证测试员评分100%的准确性 2。如果能设计出一套PSC软件,能自动记分、统分、评判,建立普通话水平测试的测试体系,可以有效地避免人工测试中的弊端,也可以省去大量的人力和资源。应试者通过计算机在网上测试,测试员在网上评卷。建立完善普通话水平测试系统,按照普通话水平测试大纲中的要求进行分类,由电脑出题并判分(前三项)。所以如果建立一个基于WEB的普通话自动测评系统,具有一定的

11、意义。1.2 国内外课题研究的现状及发展趋势 语音是人类交流和交换信息中最便捷的工具和最重要的媒体,因此,语音识别在半个多世纪以来一直是人们研究的热点,其研究成果己广泛应用于人类社会的各个领域。与图像识别技术相比,语音识别有着许多独特的优势:携带信息量大、处理响应快、无需专门训练、周边设备简单、应用领域广阔、经济效益可观等等。目前国内外对于语音识别技术的研究属于比较前沿的一个学科,特别对于普通话的语音研究国内有一些科研所进行测试性的研究和调查分析。由于Microsoft公司和IBM公司对于普通话的语音识别作了一些研究并开发出相应的产品,中文语音识别的识别率有了大幅度的提高,并提供相应的开发组件

12、包,可以方便开发者基于开发包进行应用软件的开发。我国的汉语语音识别技术经过30多年的研究和探索,已经形成一套既符合汉语特点和我国国情,又能够与国际研究水平同步发展的研究方法和研究体系,成果喜人。同时,我们也看到,要达到令人满意的程度,我国汉语语音识别技术研究还有很长的路要走。在现有成果基础上要取得更大的突破,除了要加大在语言学和语音学层面上的语音识别技术的改进力度以外,还应该借助于心理学、生理学和社会学等相关人文学科的研究成果。现在国内外对汉语语音识别技术研究投入逐渐加大,加上各相关学科及研究领域的协同发展,普通话自动测评的研究日趋成熟,必将在克服重重困难后,取得重大的突破。1.3 本论文的主

13、要研究内容 本课题旨在运用现代化手段进行普通话水平测试,建立普通话水平测试系统,通过计算机进行公正、准确的出卷、阅卷。主要内容有普通话测试的相关题库的建立、普通话语音采集、并对采集的语音与标准答案进行比对算法研究和计算机自动阅卷评分的研究。1需求分析普通话自动测评系统应能满足测试者及施测者的以下需求:采集普通话测试者的语音、自动阅卷和评分、提供测评分数和等级查询、自动出题功能等。 2采集、分析普通话样例录音通过麦克风采集普通话语音信号并保存,然后根据评分标准和实际测试人员的测试得分综合分析这些录音材料。 3编写普通话语音与标准答案的比对算法按照普通话水平测试大纲中的要求并利用上述采集和分析结果

14、编写相应的评分策略算法。 4编写基于WEB的普通话自动测评软件 采用ASP和VB等开发工具,来开发普通话的自动测评软件。 5利用ASP设计基于WEB的自动出题系统 本系统采用ASP及其相关技术自动随机取出一套题供当前测试用。6实验测试 在程序编写完成以后,对本系统进行实验测试。第二章 语音识别技术及引擎综述通过前期对语音识别相关技术的研究,我觉得开发普通话自动测评系统势在必行。前一阶段有幸聆听了社科院李爱军研究员关于“计算机语音信号处理技术及应用”的讲座,对我进行本课题的研究有很大的启发。普通话测试系统的开发可以采取语音识别技术。语音识别的过程是模式识别匹配的过程:首先要根据人的语音特点建立语

15、音模型,对输入的语音信号进行分析并抽取所需的特征,在此基础上建立语音识别所需的模板;而在识别过程中要根据语音识别的整体模型,将输入的语音信号的特征与已经存在的语音模板进行比较,找出一系列最优的与输入的语音相匹配的模板,最后给出计算机的识别结果。 开发此系统可以通过采集大量的普通话语音信号,建立一个语音库,然后分析其信号波形,通过比对与匹配来实现识别和自动测评。但是,由于条件有限,本课题没有采取这种实现方法;本系统也可以通过调用相关的语音程序开发组件来实现,这些组件包括Microsoft Speech SDK、IBM ViaVoice等。所以我采用了微软提供的免费的开发工具Speech SDK

16、5.1,即调用Speech SDK 5.1中相关的语音应用程序接口(SAPI)来实现普通话考试的自动测评。下面来介绍相关的语音识别技术及语音识别引擎的原理。2.1 语音识别技术简介1. 发展历史语音识别技术的研究开始于二十世纪五十年代,Bell实验室的Davis等人首次研制出能识别十个英文数字的实验装置Audry系统。60年代,提出两大重要研究成果:动态规划(Dynamic Planning, DP)和线性预测分析(Linear Predict, LP)。70年代,语音识别领域取得突破性进展。线性预测编码技术(Linear Predict Coding, LPC)被Itakura成功应用于语音

17、识别;Sakoe和Chiba将动态规划的思想应用到语音识别并提出动态时间规整算法等。在同一时期,统计方法开始被用来解决语音识别的关键问题,这为接下来的非特定人大词汇量连续语音识别技术走向成熟奠定了重要的基础。80年代,连续语音识别成为语音识别的研究重点之一。Meyers和Rabiner研究出多级动态规划语音识别算法(Level Building,LB)这一连续语音识别算法。80年代另一个重要的发展是概率统计方法成为语音识别研究方法的主流,其显著特征是HMM模型在语音识别中的成功应用。1988年,美国卡内基梅隆大学(CMU)用VQ/HMM方法实现了997词的非特定人连续语音识别系统SPHINX。

18、 我国在七十年代末就开始了语音技术的研究,但在很长一段时间内,都处于缓慢发展的阶段。直到八十年代后期,国内许多单位纷纷投入到这项研究工作中去,其中有中科院声学所,自动化所,清华大学,四川大学和西北工业大学等科研机构和高等院校,大多数研究者致力于语音识别的基础理论研究工作、模型及算法的研究和改进。但由于起步晚、基础薄弱,计算机水平不发达,导致在整个八十年代,我国在语音识别研究方面并没有形成自己的特色,更没有取得显著的成果和开发出大型性能优良的实验系统。但进入九十年代后,我国语音识别研究的步伐就逐渐紧追国际先进水平了,在“八五”、“九五”国家科技攻关计划、国家自然科学基金、国家863计划的支持下,

19、我国在中文语音技术的基础研究方面也取得了一系列成果。在语音合成技术方面,中国科大讯飞公司已具有国际上最领先的核心技术;中科院声学所也在长期积累的基础上,研究开发出颇具特色的产品:在语音识别技术方面,中科院自动化所具有相当的技术优势:社科院语言所在汉语言学及实验语言科学方面同样具有深厚的积累。但是,这些成果并没有得到很好的应用,没有转化成产业;相反,中文语音技术在技术、人才、市场等方面正面临着来自国际竞争环境中越来越严峻的挑战和压力3。2. 语音识别系统主要包括语音信号的采样和预处理部分、特征参数提取部分、语音识别核心部分以及语音识别后处理部分,图2-1给出了语音识别系统的基本结构4。 图2-1

20、 语音识别系统的基本结构图语音识别的过程是一个模式识别匹配的过程。在这个过程中,首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而在识别过程中要根据语音识别的整体模型,将输入的语音信号的特征与已经存在的语音模板进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入的语音相匹配的模板。然后,根据此模板号的定义,通过查表就可以给出计算机的识别结果。 3. 关键技术1) 语音识别单元的选取作为人类唯一的会意文字,汉语有着与其它语言孑然不同的特色:以字为最小语音单位,而且每一个汉字的发音对应于一个音节,在常用的6000多个汉字中,全

21、部汉字音节只有1281个,如果不考虑声调(四声:阴平、阳平、上声、去声),真正独立的汉语无调单音节字只有412个。由于音节不仅是听觉上能够自然辨别出来的最小语音单位,也是音义结合的基本语言单位。因此,在汉语语音识别中的基元选择,音节无疑是最佳方案,这也是汉语孤立词和小词汇量汉语语音识别系统研究一直沿用的方法。作为大词汇量连续汉语语音识别系统,由于字与字和词与词之间没有明显的停顿,沿用全音节作为语音识别基元的传统方法,其识别率受到很大限制。因此,为了更好地描述汉语连续语音中的细节,提高识别率,作为语音识别的基元需要选择比音节更小的声母、韵母等半音节基元(共61个)和按不同韵头(共6种a,o, e

22、, i, u, )进行分类细化后的声母、韵母基元(共161个)。2) 语音特征参数的提取语音特征参数的提取,是模式识别成败的关键。在汉语语音识别系统中,主要采用以下三种特征提取方法: 基于LPC的倒谱参数(LPCC)分析法,基于Mel系数的Mel频标倒谱系数(MPCC)分析法,基于现代处理技术的小波变换系数分析法。在这些方法中,MFCC方法比LPCC方法的识别效果稍好一些,而且MFCC符合人们的听觉特性,在有信道噪声和频谱失真的情况下具有较好的稳健性,其不足之处是MFCC方法中多次用到FFT,故算法的复杂程度远大于LPCC方法。因此,在安静的环境下,目前比较成熟和最常用的语音特征提取方法还是L

23、PCC方法。在条件不好的环境下,则宜选用MFCC方法。而小波变换法则是一种新兴的理论工具,要获得较高的识别率还有许多问题有待研究,但与经典的方法相比,小波变换法有着计算量小、复杂程度低、识别效果好等许多优点,研究前景十分乐观,是研究发展的一个方向。3) 模式识别模式识别以距离测度为准则,对于传统的语音识别系统是一个按一定测度算法实现被识别特征参数与模式库中的模板进行最优模式匹配的过程。而对基于人工神经网络(ANN)的新型语言识别系统,其模式识别过程则有所不同:首先其模式库是分布式的,即采用一些模拟人类思维过程的算法,在训练过程中通过自学习建立类似于传统语言识别系统中模式库的参数系统,但这些参数

24、以分布方式存在于不同网络层的节点之中;其次是通过模拟人类联想过程逐层将有关参数与被识别特征进行匹配距离计算和比较,最终形成最佳匹配的识别结果。在汉语语音识别系统中常用的识别技术有以下几种:动态时间规整(DTW)技术,隐马尔柯夫模型(HMM)技术, 矢量量化(VQ)技术, 人工神经网络(ANN)技术,混合型模式识别技术等5。以上是语音识别技术的相关介绍,它是本系统实现的理论基础。本系统开发所采用的Speech SDK 5 .1全面支持中文语音应用程序的开发,SDK里提供了语音识别和合成引擎相关组件应用程序层接口。它是采用COM标准开发的,语音识别是由识别引擎( Recognition Engin

25、e)来管理。下面就对Speech SDK做一下介绍。2.2 SPEECH SDK2.2.1 概述微软的Speech SDK 5.1是基于COM的视窗操作系统开发工具包。这个SDK中含有语音应用程序接口(SAPI)、微软连续语音识别引擎(MCSR)以及串联语音合成(文语转换)引擎(TTS)等等。SAPI中还包括对于低层控制和高度适应性的直接语音管理、训练向导、事件、语法、编译、资源、语音识别管理以及文本到语音管理,其结构如图2-2所示。语音引擎通过设备驱动接口(DDI)层和SAPI运行库通信,应用程序(Application)则通过应用程序接口(API)层和SAPI交互。通过使用这些API就能进

26、行语音识别与语音合成方面软件的开发6。图2-2 SAPI 5.1体系结构图2.2.2 语音识别接口通过对Speech SDK提供的开发文档的研究,我对其语音合成与语音识别应用程序的接口有了深入的了解。在SAPI 的应用程序层接口中主要有以下与语音识别相关的COM接口。1. ISpRecognizer这个接口允许应用程序控制SR引擎的外观且每一个ISpRecognizer接口代表一个SR引擎。应用程序能够把一个或更多的识别语境从应用程序能够控制将被用到的识别文法、启动或停止识别、接受事件和识别结果等,连接到各个识别对象。ISpRecognizer接口允许SR引擎的一些附加控制和音频输入。因为SA

27、PI试着把引擎默认设置为敏感的,因此一个标准的应用程序可能并不需要调用这个接口太多的方法。在SAPI中,ISpRecognizer 和 ISpRecoContext有两种实现方法。一种是进程内识别,就是SR引擎和应用程序同时被创建,只有当前应用程序才能连接到当前识别引擎。另外一种实现是“共享识别”,SR引擎在一个单独进程中被创建。系统中只有一个共享的识别引擎在运行,所有使用该共享引擎的应用程序连接到同一个识别程序。因为是通过所有的应用程序文法来完成识别的,因此就允许许多语音应用程序同时工作,并允许用户向任一个程序说话。对于桌面型语音应用程序来说,推荐使用共享识别,因为这种方式允许多个SAPI应

28、用程序同时工作。对于其它类型的应用程序,比如对需要用到多个SR引擎来对波形文件或电话服务程序的识别,就需要用到InProc识别方式。2. ISpRecoContext语音识别上下文接口,能让应用程序创建不同的功能性视图或者语音识别引擎的环境。每一个ISpRecoContext对象可以响应不同的语音识别事件和应用不同的识别文法。应用程序必须至少有一个ISpRecoContext实例接收识别,也可以创建多个ISpRecoContext实例来区分不同的识别程序。通过调用ISpRecognizer:CreateRecoContext. 可以创建一个新的ISpRecoContext对象。 3. ISpR

29、ecoGrammar语法规则接口,使应用程序能管理SR引擎需要识别的字和词语。一个 SpRecognizer 对象可以有多个与它关联的 SpRecoContext 对象;同样地,一个 SpRecoContext 对象可以有多个与它关联的 SpRecoGrammar 对象。对 SpRecoContext 和 SpRecoGrammar 对象使用一对多关系让应用程序以较清晰的应用逻辑区分不同类型的可识别的词语和内容。每个 SpRecoGrammar 对象也能有与上下文无关的文法(CFG),同时可以有装载了的听写文法(例如:如果可能就使用CFG,但是如果CFG无法进行语法分析则回退到听写文法)。2.

30、2.3 SDK编程原理正如ISpVoice是主要的语音合成接口一样,ISpRecoContext是语音识别的主要接口。与ISpVoice一样,它也是一种ISpEventSource接口,提供了为请求的语音识别事件接收通知消息的基本载体。有两种不同的语音识别引擎(ISpRecognizer),即共享语音识别引擎(Shared speech recognition engine)和进程内语音识别引擎(InProc speech recognition engine)。应用程序可以选择其中的一种。一般推荐使用共享语音识别引擎,这种引擎能被多个应用程序共享。创建共享IspRecognizer的IspR

31、ecoContext接口很简单,应用程序只需指定参数为组件的CLSID_SpSharedRecoContext并调用COM的CoCreateInstance函数即可。这时,SAPI将设置音频输入流为SAPI的默认音频输入流。对于单独运行于一个系统中的大型服务器应用程序,其运行效率是很重要的,这时使用进程内语音识别引擎更合适。使用进程内语音识别引擎有3个步骤:首先,应用程序需指定参数为组件的CLSID_ SpInprocRecoInstance并调用COM的CoCreateInstance函数来创建其自己的进程内语音识别IspRecognizer;其次,应用程序需调用ISpRecognizer:

32、SetInput方法来设置音频输入流;最后,应用程序可调用ISpRecognizer:CreateRecoContext来获取IspRecoContext接口。下一步需要为应用程序感兴趣的事件设置通知消息。IspRecognizer也是一种IspEventSource接口,自然是一种IspNotifySource接口,因此,应用程序能够从其IspRecoContext接口中调用IspNotifySource的方法来指定IspRecoContext所需的消息应通知到何处。调用ISpEventSource:SetInterest方法可以设定什么样的事件需要被通知。最重要的事件是SPEI_RECOG

33、NITION,它标识了IspRecognizer已从IspRecoContext中识别了一些语音。Speech SDK文档中SPEVENTENUM的说明提供了其他语音识别事件的详细说明。最后需要说明的是,应用程序必须创建、装载并激活一个IspRecoGrammar接口。该接口从本质上说明了什么语音类型,即听写或命令和控制语法。应用程序首先应调用ISpRecoContext:CreateGrammar方法创建一个IspRecoGrammar接口;然后装载合适的语法,调用ISpRecoGrammar:LoadDictation方法可装载听写语法,调用ISpRecoGrammar:LoadCmdxx

34、x方法可装载命令和控制语法;最后,为了激活语法并启动识别,应用程序应该调用ISpRecoGrammar:SetDictationState方法设置听写状态,或者调用ISpRecoGrammar:SetRuleState方法或 ISpRecoGrammar:SetRuleIdState方法设置命令和控制状态。当应用程序通过请求的通知机制得到通知消息时,SPEVENT结构的lParam成员包含了一个IspRecoResult接口,应用程序能从中确定用IspRecoContext中的哪个IspRecoGrammar接口已识别了什么语音。 无论是共享的还是进程内的IspRecognizer接口都能拥有

35、多个与其关联的IspRecoContext接口,并且每一个接口都能通过自己的事件通知方式得到相应的消息。可以从一个IspRecoContext接口中创建多个IspRecoGrammar接口,不同的接口可用于识别不同的语音类型7。以上就是本系统开发所用到的Speech SDK的原理、接口以及编程方法介绍,利用这个组件,可以开发出语音应用程序,可以实现普通话的自动测评。第三章 普通话自动测评系统的总体设计3.1 环境要求及软硬件平台 1. 本系统的测试要求在比较安静的环境中进行,最好是专用的语音室。 2. 在本实验中,设备为普通台式电脑,基本配置为:Intel P4处理器,512MB内存,SOMI

36、C麦克风,三星显示器等。3. 本系统的软件运行平台为: 1) WINDOWS XP + IIS + ASP 2) ACCESS 2000 3) IE或其他WWW浏览器3.2 系统功能设计3.2.1 系统流程简介 图3-1所示为系统数据流图。用户首先需要登录验证,通过验证后,用户可以从试题库里抽题,然后进行测评;测评结束之后,电脑进行判分并将其成绩存入数据库;之后,用户可以查询到自己的测评成绩。 图3-1 系统数据流图3.2.2 系统总体功能设计 系统分为两个子系统,即用户端和管理端子系统。每个子系统由不同的功能模块组成,如图3-2所示。普通话测评用户端子系统管理端子系统身份验证在线测评成绩查询

37、身份验证试题管理成绩管理图3-2 系统总体功能结构图1. 身份验证:当考生报名成功后,报名系统的数据库中就有其详细信息。这样,我们可以把报名数据库导入本测评系统中。当考生登录本测评系统时,需要通过其输入信息到数据库中去验证。另外,为了防止对本系统的恶意攻击,登录时需要输入一个随机生成的验证码,以保证系统安全。2. 在线测评:打开麦克风,点击开始测评按钮,随机抽题,开始普通话在线测评。3. 成绩查询:测评结束后,计算机会自动统计出成绩和相应等级并存入results数据库中,考生可以查询到自己的成绩和等级。4. 试题管理:试题按照题号、题型以及正确答案的格式存入数据库中,管理员可以对其进行试题的添

38、加、修改、删除等操作。5. 成绩管理:成绩表中的信息包括考生姓名、身份证号、测试成绩以及相应等级等,管理员可以对其进行维护。3.3 数据库设计数据库结构设计是本系统的重要组成部分,应该能与普通话水平测试的报名系统实现很好地衔接。根据系统功能设计的要求以及功能模块的划分,在Access 2000中建立数据库psc以及下列数据表:1. 存储普通话测试考生的信息表(user)考生报名成功后,其详细信息被存储在报名系统的数据表user中,然后可以导入到本测评系统中。当考生登录本测评系统时,需要通过其输入信息到数据库中去验证,只有通过身份验证才能开始测评。考生信息表如表3-1所示。表3-1考生信息表(u

39、ser)字段名称数据类型说明username文本学号password文本身份证号xm文本姓名nj文本年级yxsmc文本院系名称xqm文本校区名yxsh文本院系号bj文本班级bh文本班级号xb文本性别xz文本学制zyh文本专业号zymc文本专业名称jg文本籍贯xqmc文本校区名称2. 存储普通话测试员的信息表(tester)测试员的信息包括其姓名、身份证号以及普通话等级等,如表3-2所示。表3-2普通话测试员的信息表(tester)字段名称数据类型说明sfzh文本身份证号xm文本姓名pscdj文本普通话等级3. 标准答案信息表(answer)标准答案信息包括汉字、声母、韵母和声调等,如表3-3所

40、示。表3-3 标准答案信息表(answer)字段名称数据类型说明word文本识别汉字sm文本声母ym文本韵母sd数字声调4. 题库表(exam)题库表包括题目ID、单音节字、双音节词、朗读文章等信息,如表3-4所示。表3-4题库表(exam)字段名称数据类型说明dyjz文本单音节字syjc文本双音节词ldwz文本朗读文章5. 识别结果表(results)识别结果表包括识别出的汉字以及对应的声母、韵母和声调等,如表3-5所示。表3-5识别结果表(results)字段名称数据类型说明word2文本识别出的字词sm2文本声母ym2文本韵母sd2数字声调6. 成绩表(scores)成绩表中的信息包括考

41、生姓名、身份证号、测试成绩以及相应等级等,如表3-6所示。表3-6成绩表(scores)字段名称数据类型说明xm文本考生姓名sfzh文本身份证号score数字测试成绩grade文本测试等级第四章 普通话自动测评系统的实现系统的功能实现部分主要包括普通话语音信号的采集、评分策略算法的研究和测评软件的实现、出题系统等等。下面具体介绍其实现。4.1 普通话语音信号的采集4.1.1 信号采集1. 在比较安静的房间(宿舍)内,采用麦克风对考生进行普通话的语音信号采集。2. 麦克风设置1) 信号采集和语音识别输入虽然脱离了键盘,但是却离不开麦克风,否则将无法进行语音输入和识别。因此,在使用前应首先选择好麦

42、克风,如有可能,最好选用语音识别专用麦克风。因为这种麦克风具有很强的指向性和抗噪性能,前者保证麦克风只接收一个方向的声音而抑制其它方向的,后者保证在环境噪杂的情况下,有着较高的信噪比。 2) 选择好麦克风后,还要对其进行设置。只有设置合理,才能使计算机接收和处理人的声音信息。3) 正确使用麦克风。大多数用户使用麦克风时,将口正对着麦克风并且紧靠麦克风,以为这样外界干扰小,语音清晰。事实上,利用上述方式输入时会伴有用户明显的呼吸声,从而使信噪比降低。正确的方法应是将嘴角正对麦克风,离开5厘米左右的距离8。3. 采集的实现本程序用Visual BASIC编写,其程序界面分为以下两部分:菜单栏,视图

43、区。图4-1为采集软件运行后的界面。1)菜单区菜单区主要有两个主菜单:“文件”和“帮助”菜单。“文件”菜单下包括两个子菜单,即“开始识别”和“退出”;而点击“帮助”菜单则给出了软件相关信息。2)视图区视图区主要分为三部分:第一部分为识别结果显示(树视图)部分。第二部分为响应事件列表框(即显示系统响应的事件)。第三部分为识别结果显示(文本框)部分。图4-1 采集语音功能界面当用户点击“开始测试”以后,系统开始执行默认的设置:打开麦克风、加载语法和上下文、创建共享识别引擎以及设置为听写状态;然后等待用户的语音录入。当用户点击“停止测试”以后,则本次采集结束。采集结束后,本次识别的结果自动地存入文本

44、文件results.txt中,实现此功能的主要代码如表4-1所示。表4-1 识别语音保存为文本功能源代码/* Save the recognition Result to a *.txt file Dim Phone1 As String Phone1 = Result.PhraseInfo.GetText + : Open Results.txt For Append As #1 /打开文本文件准备写入 Print #1, Phone1, TextBox1.Text /把文本框中内容写入.txt文件 Close #1 /关闭文件/*语音识别结果存入文本文件results.txt中的形式如图4

45、-2所示。首先,第一行保存的是识别出的“汉字”,第二行依次保存默认识别出的结果(“汉字”及其对应的“拼音”)、五个可供选择的识别结果(同样包括其“汉字”和对应的“拼音”)。图4-2 语音保存为.txt的存储格式4.1.2 样例分析你n你ni3 你ni3 的di2 呢ni2 里li3 一yi2样例分析说明如表4-2所示。表4-2 样例分析表识别结果说明你 ni3默认识别结果你 ni3可供选择的结果1的 di2可供选择的结果2呢 ni2可供选择的结果3里 li3可供选择的结果4一 yi2可供选择的结果5分析:如表4-2所示,对于汉字“你”,正确的读音应该是n。而通过本系统识别出来的默认结果是你ni

46、3,即识别到的发音ni(上声)且对应汉字为“你”。当然,系统也给出了另外5个可供选择的识别结果。这说明本系统能较好地对采集到的语音信号进行识别。4.2 评分策略算法的研究4.2.1 普通话测试概述普通话水平测试是我国为加快共同语普及进程、提高全社会普通话水平而设置的一种语言测试制度。普通话水平测试是由政府专门机构主持的一项测试。国家语委普通话培训测试中心及地方(省、市)普通话培训测试中心具体负责实施。普通话水平测试是资格证书测试。有关行业对本行业从业人员提出了相应的普通话水平等级要求,普通话水平等级证书是从业人员普通话水平的凭证,在全国范围内通用。经报名核准后,应试者应在规定的日期,凭本人的准考证和身份证,进入指定的考场,经抽签选定试题准备10分钟后,按指定试卷上的内容进行

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 期刊短文 > 互联网

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁