对外汉语成绩测试的题库建设.pdf

上传人:赵** 文档编号:21130496 上传时间:2022-06-18 格式:PDF 页数:10 大小:400.38KB
返回 下载 相关 举报
对外汉语成绩测试的题库建设.pdf_第1页
第1页 / 共10页
对外汉语成绩测试的题库建设.pdf_第2页
第2页 / 共10页
点击查看更多>>
资源描述

《对外汉语成绩测试的题库建设.pdf》由会员分享,可在线阅读,更多相关《对外汉语成绩测试的题库建设.pdf(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、龙源期刊网 http:/对外汉语成绩测试的题库建设作者:常晓宇 魏鹏程来源:现代语文(语言研究)2011 年第 06 期摘 要:成绩测试是对外汉语教学中不可或缺的重要环节。目前的对外汉语教学界,对成绩测试的重视尚不够,成绩测试的现状也不尽如人意。建立题库是保证成绩测试质量的有效手段。对外汉语成绩测试的题库建设过程应包括:命题的组织、试题的命制、审题、预测、预测分析、入库这几个步骤,每一步骤都有其科学的、具体的操作方法。关键词:对外汉语成绩测试 题库一、成绩测试的重要性(一)成绩测试与HSK在以往的教学中,我们有意无意地偏重于学生HSK(汉语水平考试)的成绩,而或多或少地忽略了成绩测试的重要性。

2、然而成绩测试的性质、作用与目的都与HSK考试截然不同。如下表所示: HSK 成绩测试常模参照测验 标准参照测验被试异质程度高 被试同质程度高尽可能把被试的差距拉开通过率比较高与任何教学单位、教学内容、方法无关使用最多、对汉语教学与汉语学习影响最大、最直接通过上表可以看出,HSK成绩的好坏虽然可以看作留学生汉语水平高低的标志,但其实与汉语教学直接相关,对汉语学习影响最为直接的还是成绩测试。(二)成绩测试在对外汉语教学中的地位龙源期刊网 http:/成绩测试是对外汉语教学的总体设计、教材编写、课堂教学和成绩测试这四大环节中不可或缺的重要环节,也是使用最多、对汉语学习影响最大的测试,与教学息息相关。

3、科学的、符合教学原理的成绩测试对教学具有良好的导向作用。通过测试,教师可以检验教学效果,对学生的学习进行客观、准确、公正的评价,并能及时、有效地总结教学经验,从而调整教学方法、教学手段、教学进度、教学内容、教学态度等等,最终提高教学质量,使教学沿着健康的方向发展;通过测试,学生能从中发现学习重点和自己在学习中存在的问题,系统整理学过的知识技能,从而调整学习策略和学习态度,努力提高学习效率和测试成绩,最终提高他们的水平和能力;通过测试,教学管理部门能够充分利用测试所提供的大量数据,分析本校、本系的实际情况,做到对学生的学习状况了然于胸,从而做出正确的决策。因此,一个对外汉语教学单位的测试情况,包

4、括考试的设计、试题的编写、考试的实施以及对考试结果的解释等,是该单位教学成熟和健全程度的标志之一。(崔颂人,2006)二、成绩测试的现状在我们日常的教学活动中,或者是由于对成绩测试的重视尚不够,或者是因为对试题的编写与选择缺乏必要的系统性的理论指导,导致目前的成绩测试的质量难以保证。承担成绩测试试题编制任务的教师大都缺乏语言测试理论的必要指导。他们会因语料选择的局限和教学任务的繁杂,而随意采用易于编制的题型和易于寻找的材料,其结果无疑会给教与学带来诸多的负面影响(苏剑芳,1999)。其中的问题涉及到试题的效度、信度、难易度、区分度等各个方面,比如:原封不动地、大量地采取教材中的练习作为试题,等

5、于是在测试学生的记忆能力,而不是测试学生的语言能力,这样就降低了试卷的效度;题量太小或太大,难以稳定地测出学生的实际水平,从而造成测试的信度降低;试卷太难或太易,水平高的学生和水平低的学生成绩拉不开,造成区分度太差等等。因此也就无法充分发挥成绩测试应有的作用。目前,首都经贸大学留学生的汉语成绩测试,多多少少也存在着上述的问题。每学期末的成绩测试试题基本上是由各班的任课老师临时编写,缺乏科学性和规范性,而在测试后,也没有必要的统计检测来考察其有效性和合理性。针对这一现状,我们尝试对现有的成绩测试进行一些必要的改进。而试题库建设是成绩测试科学化和规范化的重要途径之一。三、成绩测试的题库建设龙源期刊

6、网 http:/建立题库的过程应包括:命题的组织、试题的命制、审题、预测、预测分析、入库这几个步骤。(戴海琦,2005)(一)命题的组织 1.成立命题指导小组该小组的主要任务为: 1)仔细研究教材及教学大纲,找出知识点、功能项目; 2)设计适合的题型,并举例说明。如初级汉语综合考试的常用题型为:(1)选择合适的词语填空。例如:(犹豫惭愧似乎)那次我没给老大爷让座,现在想起来还觉得_。这些语法我_明白了,但是一用就错。这件事必须马上决定,不能再_了。(2)把括号里的词填入句中合适的位置。例如:A我虽然 B很爱她,C她 D不喜欢我。(却)(3)选择正确的答案填空。例如:这件事发生得太_了,我一下子

7、不敢相信。 A.忽然 B.突然 C.果然 D.不然(4)说说下列句子什么情况下会说。例如:他一点也不把我放在眼里。(5)排列句子顺序。例如:A.可能是因为那里从来没有去过外国人吧 B.一天我跟一个中国朋友去了他的家乡一个小山村龙源期刊网 http:/ C.所以我一到,很多人就都围着我看 D.走在路上,常常听到孩子们叫:“外国人,外国人。”(6)用指定词语完成句子。例如:1.听说他是他们班的第一名,_。(果然) 2._,但还是热心地帮助了他。(尽管)(7)用指定词语回答问题。例如:张东很喜欢看足球、聊足球。你可以怎么说?(看样子)(8)按要求改写句子。例如:这个学校的留学生,我只认识她一个人。(

8、除了以外)(9)改错。例如:1.这件事你对她不该瞒。 2.今天该上口语课,老师不料没来。(10)综合填空。例如:说_健康,人们_会想到吸烟。_两者联系在一起,往往吸烟者觉得不好意思。实际_,现在大多数吸烟者已经明确意识_,吸烟的确危害健康。问题是,他们_多年养成的嗜好无可奈何。(11)阅读;略。(12)作文;略。 3)根据教学大纲和教材内容,编制一套命题指导方案。命题指导方案应全面覆盖该教材的知识点和功能项目等内容,并就每一知识点和功能项目做出题型建议、题量建议以及注意事项等。如:建议题型 建议题量 描述性参数 组卷参数参数“把”字句 题型(2)(6)(7)(8)(9) 52 定位:(二下)L

9、3L4龙源期刊网 http:/能力层次:题目内容:词语等级: 题型:难度:教学敏感度:猜测度:曝光度:至于 题型(1)(2)(6) 32 定位:(三上)L5能力层次:题目内容:语法等级: 题型:难度:教学敏感度:猜测度:曝光度:(杨翼,2006)题库不同于“试题集”,二者的区别就在于题库具有一定的结构,题库中的题目具备一定的参数。一些参数根据专家的评定来确定,一些参数根据预测的统计分析结果来确定(谢小庆、许义强,1999)。题目参数部分可待预测完后填入。 2.建立优质题库的重要指导原则其一,题库中题目的数量,跟题库使用的频率和各试卷允许的项目重复率有关,但一般来说,一个题库的题目数量最少不能少

10、于1000题;龙源期刊网 http:/其二,题库中的试题不仅要在题型分布、内容分布、能力层次分布和难度分布上都均匀(或是符合组卷要求的),而且在这四维联合分布上也要均匀(或是符合组卷要求的),这显然是一项非常细致的工作;其三,所有入库试题性能参数齐全、同一参数所用数字系统的参照系统一,整个题库层次结构清楚,存储和调用都非常方便;其四,题库应该有足够的安全性,保密措施健全。(二)试题的命制为题库命题包括三步工作:第一步是制定个人命题计划;第二步是命题;第三步是复查。 1.制定个人命题计划每个教师在具体命制试题前都应认真制定个人命题计划,不能随意命题、出到哪里算哪里,最终导致题量分布不合要求。个人

11、制定命题计划时,首先,要研读本课程的教材和考试大纲,对课程开设的目的、希望达到的要求、教材的内容范围、逻辑体系、考核目标和考核范围都要非常熟悉;其次,要研读题库指标体系说明和题量分布设计材料;第三要研读个人的命题任务书(戴海琦,2005)。命题核心小组应将考核知识点一一列出,这样,教师只需稍作核实、调整,就可着手落实命题任务。 2.命题命题过程包括“编制试题、制定参考答案和评分规则、填写指标编码”三步。命题时首先要注意不要编写出内容有科学性错误的试题;其次要注意用词用语的准确性,不能模棱两可;第三要有公认的正确答案;第四要在大纲要求的范围和层次出题,不能超越大纲;第五要真正体现出所要求测量的东

12、西,特别是在认知目标层次和难度等级上,不要在该出测综合能力的考核点上出了测记忆或简单应用的试题,不要在该出难题的知识点上出了非常容易的题目。(戴海琦,2005) 3.复查命题完成后应认真复查,复查任务有三项:一是再次评价每道试题内容是否正确、健康,用语是否确切,参考答案正确与否,评分规则是否客观、细致无误;二是确认指标编码的准确性,有无错位、缺位等;三是根据试题的编码,统计所编试题在各个指标上的题量分布,检查其是否偏离了任务书的要求。(戴海琦,2005)龙源期刊网 http:/(三)审题作单题审核时必须对每一道试题做出如下裁决:1.入库;2.修改后入库;3.修改后再审;4.淘汰。如果审题时淘汰

13、量太大,必须要求命题教师及时补命,以免总题量受太大损失(戴海琦,2005)。(四)预测题库中题目的一些参数指标,如难度、区分度、猜测度、答对概率等,需要通过预测来获得原始数据,再通过数据统计分析得到。预测的第一项工作是要做好试题的编制。预测的试卷从内容到形式应与正式测试的试卷相似,差别太大会导致测试数据不准确。如果题目参数还要做等值计算,则编制试卷时还需在试卷中设置好一定量的公共锚题,公共锚题数量大约应占试卷总题量的30%左右,以保证等值计算的顺利进行。公共锚题的内容与形式应是预测试卷的一个浓缩版,以保证它对预测试卷的代表性。预测的第二项工作是选择好被试。预测的被试应该是未来实测被试的有代表性

14、的样本。另外,试测的环境与要求也应该与实际测试的情况相似。试测被试的动机水平和状态也不应与实测被试有太大差距。试测试卷的评分也是一项重要工作,应该由命题教师亲自阅卷,以保证有较高的评分信度。(戴海琦,2005)(五)预测分析预测成绩出来以后,在分析试题参数指标时有两种选择,一种是经典测验理论(CCT),另一种为项目反应理论(IRT)。 1.依据经典测验理论作为一种科学的测验理论,经典测验理论以其发展早、成熟早的优势,在测验编制指导中占据了主要地位,为测验的发展做出了巨大的贡献,至今仍起着重要作用。其优点是:(1)使用的数学模型简单,计算方便,容易推广;(2)以弱假设为基础,弱假设条件容易被大多

15、数测验数据所满足,因此适用性广。但是,经典测验理论的理论体系和计量模型确实存在一些先天不足:(1)项目统计量(难度与区分度)严重依赖于被试样本。经典测验理论的项目难度以通过率表示,因此被试样本能力高时通过率就高,反之则低;龙源期刊网 http:/(2)区分度通常以项目与总分的相关或高分组答对数与总答对数之比来表示,因此对被试异质性要求较高,也就是说被试能力差别大时,区分度高,如果被试同质化程度高,则区分度通常会很低;(3)经典测量理论对被试能力的估计依赖于测验题目的难度。同一被试参加不同难度的测验会得到不同的难度估计值,不同测验结果之间难以进行比较;(4)测验信度建立在平行测验假设的基础之上,

16、但实际上严格平行的测验是不存在的。 2.依据项目反应理论(ItemResponseTheory,IRT)项目反应理论于 20世纪 50年代初正式创立,又称潜在特质理论或项目特征曲线理论。项目反应理论是对被试能力的一种估计,并将被试对单个测验项目的某种反应概率与该项目的一定特征联系起来。这一理论是由潜在特质、项目特征曲线等基本概念组成的。所谓潜在特质是指被试的某种相对比较稳定的、支配其对测验做出反应、并使反应表现出一致性的内在特征。由于特质是不能直接被观察到的,所以人们通常称其为潜在特质。多用“”表示特质或能力水平。它是测验所要测量的目标。项目特征曲线是项目反应理论中最基本的概念,项目反应理论最

17、大的特点就是找到了这条曲线,并且以多种数学表达式(或称数学模型)来描述它和逼近它。一般来说,项目特征曲线的数学模型中都包含两个方面的参数:一是对测验题目的特征进行描述的题目参数;二是被试的特征进行描述的潜在特质或能力参数。根据上述参数,我们就可以对题目质量做出评价,并按照需求高质量地选取测验题目。同时又可以预言被试在某一测验题目上的反应,进而估计出被试在完成题目时所具有的能力或特质。从理论上说,有效地解决了经典测验理论无法建立被试得分与测验题目参数之间函数关系的问题。(杜洪飞,2006)其优点是:(1)建立了被试对项目的反应(观察变量或观测分数)与被试能力(真分数)之间的非线性关系;(2)难度

18、和区分度的估计值与被试能力无关,对被试样本的依赖性小;(3)对被试能力的估计不依赖于特定的测验题目,不同的测验结果可直接比较;(4)测验信息函数的概念代替了信度理论,用测验对能力估计可提供的信息量的多少来表示测量的精度。这就避免了平行测验的假设。其缺点是:(1)项目反应理论建立在更复杂的数学模型之上,依赖更强的假设,计算复杂,不易被人掌握;(2)对经典测量理论的一些研究领域,如效度等问题,项目反应理论没有提出独到的见解。不管依据哪种理论,都需认真统计计算,去芜存菁,保证题库试题有较全面的指标参数。(六)入库试题入库的工作包括题目文字、参考答案、评分标准、编码、编号、对应参数以及附属参考资料,都

19、应保证齐备无缺和准确无误地录入。录入后应认真校对。校对工作最好换人进行,避免心理定势作用。实践证明,请命题教师自己校对,更为可靠(戴海琦,2005)。龙源期刊网 http:/四、题库建成后应注意的问题应该强调的是,要建成一个可经常维护的动态题库,以保证及时剔出陈旧题目,修订和增加新项目。题库建设不是一劳永逸的,需要不时地进行试题修改和更新(戴海琦,2005)。五、基于题库的测验编制建立起题库之后,在题库的基础上编制试卷,形式上已成了按照测验编制计划从题库中调用符合要求的项目组拼合格试卷的过程。这一过程可以由组卷者启动题库管理模块中的检索功能,由组卷者逐项选题,不断与计划比较、调整,最后组成符合

20、要求的试卷。要注意的是,组卷计划常常是多目标要求的,比如有题型比例要求、内容比例要求、难度比例要求和能力层次比例要求等,这些都是组卷时常常需要的、用来维护测验信度或效度的指标。在由人工组卷时,这些目标将由人来统筹兼顾,最终组成合乎要求的试卷。(本文系首都经济贸易大学校级教改立项“留学生成绩测试的规范化与试题库建设”代码02991054210230。)参考文献: 1崔颂人.略谈对外汉语成绩考试的改进J.语言教学与研究,2006,(4). 2戴海琦.考试题库的制作J.考试研究,2005,(1). 3杜洪飞.经典测量理论与项目反应理论的比较研究J.社会心理科学,2006,(6). 4苏剑芳.语言成绩测试内容的确定原则J.广西教育学院学报,1999,(1). 5谢小庆,许义强.HSK(初中等)题库与试卷生成系统J.世界汉语教学,1999,(3). 6杨翼.HSK高等题库参数体系研究J.语言教学与研究,2006,(4).(常晓宇 魏鹏程 北京 首都经济贸易大学对外文化交流学院 100026)龙源期刊网 http:/“本文中所涉及到的图表、公式、注解等请以PDF格式阅读”

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁