语言测验概论.doc-淘文阁

资源描述

《语言测验概论.doc》由会员分享，可在线阅读，更多相关《语言测验概论.doc（16页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、语言测试概论思考与练习1.语言测试的对象是人的语言能力、语言知识或语言技能；语言测试研究的对象包括两个方面:语言方面、测量学方面。2.语言测试研究的基本问题是什么？语言能力问题。3.语言测试研究的基本方法是定性研究与定量研究。4.定量研究与定性研究在语言测试研究中分别发挥什么作用？定性研究是探索性研究的主要方法之一，调研者利用定性研究来定义问题或寻找处理问题的途径。在寻找处理问题的途径时，定性研究常常用于制定假设或是确定研究中应包括的变量。因此，掌握定性研究的基本方法对研究者来说是很必要的。定量研究是要寻求将数据定量表示的方法，并要采用统计分析的形式。一般考虑进行一项新的研究项目时，定量研究之

2、前常常都要以适当的定性研究开路。有时候定性研究也用于解释由定量分析所得的结果。（在研究中应该怎样正确处理二者的关系呢？我们认为，定性研究为定量研究指引方向，定量研究为定性研究提供保障。没有定性研究，定量研究就没有内容；没有定量研究，定性研究就不能落实。）5.中国是世界上最早使用考试的国家。6.以色列著名应用语言学家伯纳德斯波斯基（Bernard Spolsky）认为，语言测验与测验理论的发展可以分为三个时期:前科学时期或传统时期；心理测量结构主义时期或现代时期；心理学社会语言学时期或后现代时期。7.1919年，查尔斯亨德森（Charles Handschin编制了第一个标准化的现代语言测验。8

3、.语言测验真正成为一门独立的学科是哪一时期？标志是什么？20C50S后（心理测量结构主义时期或现代时期）。一般认为1961年罗伯特拉多（Robert Lado）出版的Language Testing:The Construction and Use of Foreign Language Tests【语言测验】标志着语言测验成为一门相对独立的学科。9.二十世纪50年代到60年代语言教学与语言测验的主要理论基础是什么？语言学的结构主义与心理学的行为主义结合。10.分立式测验是谁先提出这一概念？他还提出了哪一种测验形式？托福考试属于哪一种形式的测验形式？卡罗尔。综合式测验。分立式测验。11.语言测

4、验与语言理论首次结合是哪一时期？50年代到60年代（心理测量结构主义时期或现代时期）。12.参加CET的口试须满足什么条件？四级成绩80分以上或六级成绩75分以上。13.请比较TOEFL（托福）与IELTS（雅思）两种考试的区别？【从时间、设计者、用途、特点、测试形式等角度回答】托福诞生于20世纪60年代，由美国教育测验服务中心（ETS）制作与实施，主要用于测试母语非英语的应试者在校园环境中理解与使用英语的能力。而雅思产生于20世纪70年代末，1980年才正式开始使用。由剑桥大学地方考试委员会UCLES设计开发，英国文化委员会负责组织推广。雅思考试分两类，一类是学术类，用于测试应试者是否准备好

5、在英语环境中就读大学本科或研究生课程。另一类是移民类，侧重评估在广泛社会教育环境下的生存技能，适用于去英语国家完成中等教育、获取工作经历或参加非学历培训的应试者。其阅读与写作部分要求比学术类相对低些。无论是哪一类，都意图在测试中反映出应试者在真实世界里使用语言进行交际的能力产生于美国的托福代表着美国测验的特点，即追求公平性，突出表现在对测验信度的关注与偏好使用客观性试题，在测验形式上属于分立式测验。而代表英国测验传统的雅思考试则关注测验的效度，喜好使用主观性试题，在测验形式上属于综合式测验。14.改进版HSK有何特点与创新点？（1）具有与原来中国汉语水平考试同等的考试用途与证书效力。（基本性质

6、与用途:以学习者在学习与生活环境下的语言运用能力为考查重点。）（2）注重语言交际能力，兼顾语言知识。（3）富有特色的测验方式。（4）科学合理的分数体系与等级划分。（5）采用了正态的导出分数，更易于解释。（6）新型口语、写作测验的推出。（7）题目的语料全部选用真实的实用的材料，并且注意一般性原则与避免敏感话题。（8）题型的设计反映教学与习得的规律。15.我国研发的第一个面试型的汉语口语考试是什么？C.TEST（实用汉语水平认定考试）口语考试16.语言测验的基本作用是什么？科学地测量出语言学习者的语言能力或潜力。17.语言测验的目的有哪些？选拔、诊断、评估、预测、研究的目的。18.可以从哪些角度对

7、语言测验的种类分类？用途、测验方式与参照性质。19.按用途划分，语言测验可以分为哪几类？水平（能力）测验、成绩（学业）测验、分班测验、诊断测验与能力倾向测验。20.按用途划分，TOEFL(HSK)属于哪种类型的语言测验？期末测验呢？水平(能力)测验；成绩测验。21.按参照系统划分，语言测验可以分为哪几种类型？常模参照性测验与标准参照性测验。22.常模参照性测验的理论基础是什么？正态分布(其特点是“两头小，中间大”)。23.常模参照测验与标准参照测验有什么区别？基本区别有两个，一是设计与开发过程不同，二是分数的产生与解释不同。常模:要求测验题目有较高的区分度，分数是在全体被试的比较中产生的，也在

8、全体被试中得到解释。(具有选拔目的的测验)标准:要求题目对能力标准或内容范围有较好的代表性，标准参照性测验的分数表明被试行为或能力与标准符合的程度。(某些成绩测验)24.按测验方式划分，语言测验分为哪几种类型？(1)笔试与口试(2)纸笔测验P&P与基于计算机的测验CBT(3)分立式测验与综合式测验25.分立式测验与综合式测验各有什么特点？分立式测验是把语言分成一个一个要素，如语音、语法、词汇等，一次测一个要素，HSK初中等的语法结构与词汇两部分都属于分立式测验。综合式测验要求被试把掌握的语言知识综合起来运用，而不是只表现某一种语言要素，作文、完形试题属于综合式测验。分立式测验容易用客观性试题来

9、测，有些综合式测验只能用主观性试题。26.主观性测验（作文，简答题，口试中的面试等）的优点与缺点。优点:（1）考察的深度比客观性测验深，被试受到的限制比较小，表现自己能力的余地比客观性测验要大得多。（2）命题比较容易，费时较少。（3）基本上没有猜测因素，被试会多少答多少，没有什么东西可猜。缺点:（1）评分不易做到完全一致（评分标准不可能非常详尽，评分员因素。）（2）评分工作量大，费时费力。27.客观性测验（多项选择题，配伍题，是非题等）的优点与缺点。优点:可以事先明确规定评分标准，且这个标准不允许变通；多用机器阅卷评分，差错较少，一致性很高，且阅卷评分所花时间与费用相对较少；题量大，所以测验内

10、容比较广，被试表现自己能力的机会比主观性测验多；容易满足统计学上的一些要求，如大样本、等距的量表等。缺点:客观性语言测验容易测出听读等理解能力，但很难测出写或说等表达能力；客观性试题允许猜测，因此在被试的得分中可能有一部分并不代表他的真实能力。在测验开发方面，对命题员的要求高，命题成功率不是很高。28.按照测验的时间来划分，语言测验可以分为哪几种类型？速度测验（时间控制得紧，但题目相对容易。考查答题速度。）与难度测验（关注知识或能力）。29.按测验的影响力来划分，TOEFL与IELTS属于哪几种类型？高风险测验。30.标准化测验有什么特点？（1）有固定的、标准的内容，其内容不因测验有不同版本而

11、改变；（2）施测与评分按标准程序进行，每次测验的考务与评分程序都一样，不能随意改变；（3）都经过试验，在进行了大量的经验性研究之后才正式使用。（统一命题、统一组织考试、统一阅卷评分。）（标准化测验并不一定就是好的测验。）31.语言测验的质量可以从哪几方面来衡量？信度、效度、题目的难易度与区分度、试卷的标准化。32.信度与效度的关系如何？信度与效度都是测验的质量核心。测验的可靠性（信度）是测验有效（效度）的必要条件，但不是充分条件。也就是说，一个有效的测验信度必定很高，但信度高的测验不一定都有效。33.对语言能力的研究开始于哪一时期？经历了哪几个阶段？心理测量结构主义时期；技能/成分说阶段，一元

12、化阶段，交际能力模型的建立阶段。34.拉多（语言测验成为独立学科的标志著作的作者）关于语言能力的观点。语言测验理论是建立在两点之上的，其一是时下语言学领域对语言的理解，其二是对习惯在语言学习中所起作用的观察。语言测验涉及两个变量:成分（语音，语调，重音，语素，词汇及词汇的有意义的排列）与技能（听说读写）。（“技能/成分”模型。）35.卡罗尔（托福的主要创始人）关于语言能力的观点。【技能/成分】（1）提出了一个包括语言维度（音位或拼写、形态学、句法与词汇）与技能维度（听力能力、口头表达、阅读与写作）的两维的语言能力模型图。（2）卡罗尔（Carroll）明确提出，语言能力包括十个方面的内容:结构的

13、知识；与结构相应旳词汇的知识【2语言知识】；听辨语音；发出语音；技术性的阅读（把书写符号转换为声音）；技术性的书写（把声音转换为书写符号）【4语言应用的形式】；听力理解的速率与准确率；口语的速率与质量；阅读理解的速率与准确率；写作的速率与准确率【4四种应用形式的综合表现】。（他把语言技能定义为语言知识诸方面与掌握语言形式诸通道的结合。）36.技能/成分说对语言测验的影响及其局限性。拉多与卡罗尔的技能/成分说代表了当时语言测验领域对语言能力的看法，这种看法对语言测验的开发与研究都产生了很大的影响。（1）拉多与卡罗尔都倾向于使用客观性考试，认为更切实可行。（2）分立式测验的流行（托福考试）局限性:

14、（1）为测量语言能力而建立的早期模型区分了语言技能（听说读写）与语言知识（语法、词汇、音位/正字法），但没有说明这些技能与知识是怎样相互联系的。（2）技能/成分说更加严重的局限在于它忽视了语言使用的环境，即话语与语境。（3）更直接的挑战来自测量学方面，尤其是来自对分立式测验的怀疑。37.语言能力一元化的代表Oller提出了“单一能力假说”【UCH】，Snolsky则提出了“一般语言能力”。38.Bachman的语言交际能力模型（CLA）分为哪三个部分？语言能力、策略能力、心理生理运动机制。39.Bachman的语言能力树包括哪四个部分？语法能力、篇章能力（2组织能力）；以言行事能力、社会语言学

15、能力（2语用能力）。40.我国对外汉语学界对交际能力的认识与不足。在对外汉语教学界，关于交际能力的理论已经深入人心了，对交际能力的构成，也有学者提出了系统的理论（吕必松，盛炎，范开泰，于延先生等）。这些理论说明中国对外汉语教学界在认识上并不落后于世界语言教学的先进水平。在目前的情况下，我们已经具备了对交际能力进行进一步研究的条件。（起点较高；HSK的广泛使用对上述理论的操作可实现，因素分析技术的引进能在某种程度上提供比较客观的定量分析证据；重复国外所做的同类实验证明或证伪）不足:与交际能力研究的国际水平相比，有不小差距，主要在于我们基本上没有实证研究。我们对交际能力的研究只停留在定性的讨论上，

16、如果没有相应的定量研究跟上，这种讨论只能是泛泛的，深入不到本质。41.个人语法、个别语法与普遍语法的区别与联系。（个人语法最大，普遍语法【普遍语法是人脑在经验以前的初始状态，在经验的作用下，经过一系列状态的变化，最后形成某一种特殊语法的状态，也就是稳定状态】最小，个别语法【是普遍语法在经验作用下在人脑中形成的一种恒定状态，可以理解为使用某一具体语言的语言能力以及关于该语言的知识】介于二者之间。）个人语法中必然包含了个别语法的基本原则，否则说同一语言的人就无法交际，所以个人语法与个别语法必然同质，个人语法之间的差异是非本质的。而个别语法中必然包含普遍语法的基本原则，否则不同语言就不能互译，也就是

17、不能交际，所以，个别语法之间的差异只是参数的差异，这种差异也是非本质的。三种语法同质。人所以会有语言都是普遍语法的原则在起作用。42.评价语言能力的唯一标准是什么？母语者。43.母语者的六个特征。（1）母语者是在他的童年时期学他的第一语言的，所以他是那种语言的母语者。（2）在接收与输出语言时，母语者对自己的语法一【个人语法】具有直觉。（3）母语者对不同于自己语法一的语法二【共同语语法】也具有直觉。（4）母语者具有完备的话语产出能力，这包括短语间的停顿、巨大而完备的词汇量等。在产出与理解上，母语者都显示出完备的交际能力。（5）母语者具备创造性写作的能力。（6）母语者具有解释与传译第一语言的能力。

18、44.判断一个人是不是母语者，除了语言标准，还有什么标准？社会文化标准。45.什么是语言的“僵化”？造成语言的“僵化”的原因有哪些？“僵化”是指学习者停留在一定水平上，不再进步，而不能达到母语者水平。原因:一方面是学习者的内部原因，另一方面则是外部原因。内部原因有两个，一是临界期，一般认为过了学习语言的临界期，人再学习语言就有困难。再一个内部原因是学习者缺乏适应第二语言文化的愿望，这就是一个社会与心理的因素了。外部原因书上无解释。46.我国汉语能力标准的建设现状如何？1987年，中国对外汉语教学学会成立了一个七人小组，着手研究制定“等级标准”。1988年，汉语水平等级标准与等级大纲（试行）（以

19、下简称标准与大纲）出版。标准与大纲的研究制定标志着我国对外汉语教学工作者已经有了明确的“标准”意识，并且迈出了实质性的一步，填补了汉语作为第二语言教学领域的一项空白，对规范我国的对外汉语教学起到了很好的作用，对课程设置、教材编写、成绩测试与水平测试均有很高的参考价值。至今仍有很多教材与考试以这个标准与大纲为依据。现有的标准与大纲虽然有特色与优点（对字、词、语法点的掌握量要求得比较细致），但与CEF（欧洲语言共同参考框架）标准比也有以下一些不足:对能力与水平等级的描写没有CEF那么细致；几乎没有关于学习者在实际语言交际中能够做什么的描写，而是仅仅用掌握的字、词、语法结构的数量来定义能力水平；覆盖

20、的范围比CEF小（大纲里的丁级虽为最高级，但其水平仅相当于CEF的B级【独立使用者】，没有涉及CEF中的C级【自如的使用者】）；一直没有试图在不同语言间建立联系（我们的大纲与其他标准的等级对应关系如何）。47.选择语料要把握几个原则？广泛性；良好的内容倾向；规范性；公平性；信息量丰富；真实性。48.编写多项选择题题干与选项时分别遵循哪些原则？题干:【总的原则:题目要有效地考查出你打算考查的东西，即一定要时刻想着测验的效度。一个好的题干，应当保证所有人都能理解你问的是什么。】（1）题干应尽可能多地包含试题内容。共含的因素、重复性的词语（如相同的叙述或修饰成分）应放在题干中，而不要在选项中重复使用

21、，选项则要尽可能精练。（2）避免采用非常规方式的提问（如否定形式）。（3）题目与题目之间应有相对的独立性，避免相互依赖、相互包含或相互暗示（主要针对阅读或听力理解）。（4）题干避免考查常识性问题。（5）避免出现难以理解并且与测试目的无关的成分（如生僻的词语，复杂的句子）。（6）设计题干时要留足余地，使题目具有一定开放性（只使用特指问句）。选项:（1）保证正确答案的正确性与唯一性。（2）避免题目内暗示。（3）确保干扰项的干扰能力。（4）选项应简练，不应有重复的内容。（5）阅读理解与听力理解试题的备选答案应尽可能回避语料中原有的措辞，特别是正确答案应该换一个说法。（6）所有选项难度应该大体相当。（

22、7）所有选项（特别是词汇试题的答案）应尽可能涉及同一类事物、活动或同一领域（即注意各选项的相关性，还有词性的一致性。）。（8）选项若用解释性语言，应避免牵强附会（针对词汇题选项）。（9）除了测验特殊语法点的题目外，其他测验题目的选项放在题干里时都要合乎语法，也就是说每一个选项在语法上都应该是可替换的。（10）选项尽量不要用“上述三个都不是”、“都没有”等说法，不要用“从不”，“总是”、“所有”等表示范围太广的词语。（11）含有数字或具有某些规律的选项要按数值大小顺序或其规律性排列。（12）选项要与具体的测试目的紧密相关，不受无关因素的影响。（13）正确答案在选项中的位置不应固定，应做到出现频率

23、相等，出现顺序随机。【另外，多项选择题在试卷中一般按从易到难的顺序排列。】49.听力理解测验语料的选择要注意哪些方面？口语化；条理性；控制信息的密集度；难度要适合；控制语速。50.听力理解测验的题型有哪些？听句子选图。情景应答。听对话或讲话回答问题。51.阅读理解测验的考查内容，语料的选择，题目的编写原则。内容:（1）概括材料的中心思想、段落大意（包括某部分大意）（2）理解材料各部分之间的篇章关系（时间空间与逻辑关系），概括文章的结构。（3）了解材料的主要事实与关键信息。（4）跨越词汇障碍，查找所需的细节。（5）根据材料进行推断（生词意思，语境义，言外之意，暗示信息）与预测（下文内容走向）。（

24、6）领会作者的观点、意图与态度。（7）领悟文章的风格与情感基调。语料选择:为了题目的真实性，阅读材料最好从公开发表的报纸、杂志中选。命题员应根据测验的目的选择适当的材料。不要修改原文，但允许适当的删节，要有节制，尽量保持文章原貌。阅读材料的篇幅应根据被试的水平来确定（高水平:一般800字左右；中等水平:500600字左右；低水平:多为300字以下）。编写原则:（阅读理解测验的试题可以分为三类:主旨类、细节类与推断题。）一般来说，一段500字的阅读材料可以出56个题目。尽可能涉及主旨、细节与推断等各方面。第一个题目最好是主旨题，其他问题可以按照文章发展脉络依次提出。题目间不要有暗示，应有独立性。

25、52.词汇测验题目的编写需要注意的问题。首先要解决的问题是测哪些词。（大纲或教材中的？通用的词表或频率词典中的？学生容易出错的？）编选项时要注意:四个选项与画线词要属于同一词类；搭配习惯要一致；难度应该大体相当。53.口语测验的发展经历了哪几个历史阶段？二战之前的口语测验（北美:停留于纸笔测验。北美的第一个真正意义上的口语测验出现在1930年，即美国大学委员会英语能力考试。英国:1913年的英语第一证书考试中就包含有口语测验。）。二战期间的口语测验（战争需要士兵具有用外语进行口头交际的能力。1942年，美国政府制订了军队特殊训练计划【ASTP】，主要包括一系列的语言课程。）。二战后的口语测验（

26、美国制定能力等级量表。ACTFL【美国外语教学委员会】大纲。第一个正式公开出版的口语测验是美国外交学院【FSI】的口语考试OPI。这个评价量表基本参照ACTFL大纲，是一个具有广泛用途的口语考试。）。54.直接式测验与半直接式测验的特点分别是什么？直接式口语测验的特点是考官与应试者面对面交流，考官根据应试者的表现当场评分。（优点:考官可以直接观察到应试者的面部表情与肢体语言，也能够根据应试者的表现对测验进行调整与干预。）半直接式口语测验是在语音实验室里进行的口语测验，考官与应试者互不见面，应试者只根据录音中的要求来回答，所有的言语样本都被录在磁带或计算机上。测验结束后，应试者的录音材料被带回到

27、相关部门，由评分员统一评分。（优点:适合大规模测验；测验输入不受考官影响；测验成本相对较低；事后评分的准确性与稳定性较高。）55.口语测验的评分方法主要有哪些？主观评分【分项等级评分（FSI口语测验的评分方法），总体等级评分（OPI口语测验、雅思口语测验、HSK高等口语测验、ASLPR澳大利亚第二语言能力等级测验等）】与客观评分或半客观评分【0/1评分（适合初学者），分项客观指标评分，机器评分】。56.影响口语测验表现的学习者因素有哪些？（1）个人背景特点，包括年龄、性别、国籍（民族）、社会地位、母语背景、受教育程度、参加测验的经验七个因素。【还包括不同的学习目的、是否有华裔家庭背景等。】（2）个人的知识面。（3）个人情感因素（诸如堕胎、枪支、民族自治等敏感话题，会影响被试的发挥。）。（4）语言能力。第 16 页

展开阅读全文