对外汉语教学的测试.ppt

上传人:石*** 文档编号:46623270 上传时间:2022-09-27 格式:PPT 页数:43 大小:2.71MB
返回 下载 相关 举报
对外汉语教学的测试.ppt_第1页
第1页 / 共43页
对外汉语教学的测试.ppt_第2页
第2页 / 共43页
点击查看更多>>
资源描述

《对外汉语教学的测试.ppt》由会员分享,可在线阅读,更多相关《对外汉语教学的测试.ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、对外汉语教学的测试现在学习的是第1页,共43页教育测量与评价教育测量与评价教育测量也称考试、测试。考试的目的是要作评价,作判断。根据考试的用途、手段和评价标准,可以将考试作如下分类:(一)根据测试用途分类(一)根据测试用途分类 成就测试,能力测试,能力倾向测试成就测试,能力测试,能力倾向测试1.成就测试成就测试也称成绩测试,测试目的在于测量学生在某个学习阶段学到了什么,包括:A)各学科的单科/综合测试。B)教学阶段的安置、形成、诊断和总结性测试。安置性测试安置性测试的典型例子是摸底考试和分班考试。形成性测试形成性测试考察学生进步的情况,对阶段性教学内容掌握的情况。诊断性测试诊断性测试是针对个体

2、或个别教学内容掌握情况的考试,意在对个别学生或特定的教学内容掌握的情况作精确的了解。总结性测试总结性测试的典型例子是学期、学年考试、会考也属这一类型。现在学习的是第2页,共43页2.能力测试测验目的在于测量个体的不因外界环境的影响而轻易改变的、较稳定的、表现在认知能力方面的心理特质,比如观察力、记忆力、理解力、概括力、空间想象力、判断推理能力等等。IQ的测试属于这类考试。现在学习的是第3页,共43页3.能力倾向测试又称学习能力测验,它介于成就测验与能力测验之间,既测知识也测能力,目的在于测量学生的潜在学习能力及学术发展趋向。潜在能力指个体从未来教育或训练中最可能发展并受益的能力,一般分为两种:

3、A)一般学习能力测试。B)特殊能力倾向测试。高考属这类考试。现在学习的是第4页,共43页根据评分者和评分方法分类根据评分者和评分方法分类客观试题由被试者从可供选择项中确定正确(最佳)或错误答案的题目。这类题目包括是非题、多选题、配对题等,这类题目答案唯一,评分不受主观因素影响,在条件许可的情况下,还可以用机器阅卷评分。有时我们也把介于主观性题目与客观性题目之间的限制性题目如简答题、填充题也归类于客观题,全部由客观性题目组成的测验称之为客观性测验。现在学习的是第5页,共43页主观试题由考生以自己的答案来回答所提出的问题。考生在处理问题方式、回答内容的选择、回答内容的组织及答题重点等方面均有相当的

4、自由。这类试题包括论述题、证明题、作文题等,因为这类题目的答案不唯一,评分易受主观性因素的影响,故称之为主观性题目。评分受评阅人主观判断的影响。现在学习的是第6页,共43页根据评价标准分类根据评价标准分类常模参照测试常模参照测试标准参照测试标准参照测试现在学习的是第7页,共43页根据是否运用标准化方法分类根据是否运用标准化方法分类标准化测试标准化测试非标准化测试非标准化测试标准化的含义标准化的含义l题目的标准化(客观试题)l指导语的标准化 l施测过程的标准化 l评分的标准化 l解释的标准化现在学习的是第8页,共43页最重要的是分数解释的标准化原始分=标准分原始分数的误区case 1l有老师对学

5、生说,你上次数学测验的的成绩是78分,这一次测验只得了71分,你为什么退步了?Case 2l家长看到孩子成绩单上的数学测验成绩为82分,语文测验成绩为70分,父母们对此是如何评价的?Case 3l某学校负责人在学期结束时的总结会上对某学科教师说他的教学效果不好,其依据是该学期学生在此学科上的考试平均成绩低于其他学科。现在学习的是第9页,共43页标准分的意义:该生与全体考生比较所处的位置现在学习的是第10页,共43页根据测试材料和形式分类根据测试材料和形式分类语言与文字测试语言与文字测试非语言与文字测试非语言与文字测试 根据人数多寡分类根据人数多寡分类l团体测试团体测试l个人测试个人测试现在学习

6、的是第11页,共43页考察测试质量的几个测量学指标难度、区分度、效度、信度1.难度难度:被试完成题目(item)任务时所遇到的困难程度。难度系数:定量地刻画被试作答题目时困难程度的量值。P 现在学习的是第12页,共43页难度难度指标适用范围指标适用范围计算公式计算公式难度是指测验项目的难易程度,试题的难度可以用试题的通过率来表示。试题卷面的难度值范围是0.60.7难度记为P,在教育测量中,PR/NR:答对该题的人数N:参加测验总人数难度难度现在学习的是第13页,共43页1、难度的两种数学定义:(1)P=1x/w x为某题得分的平均分数,w为该题的满分。这种定义法,难度值小时表明试题容易,值大时

7、表明试题难,最小值为0,最大值为1。(2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。现在学习的是第14页,共43页区分度区分度含义含义意义意义公式公式指标范围指标范围指测验对学业水平不同的考生的区分程度或鉴别力。具有良好区分度的项目,能将不同水平的考生区分开来,即在该项目上水平高的考生得高分,水平低的考生得低分。通常用D表示,取值范围为1.00至-1.00。D越高则质量越好。0.2以下应淘汰0.2-0.3 合格0.3-0.4 良好0.4-1 性能佳 DPHPLPH指高分组通过的百分比,高分组为总分数最高的27%PL指低分组通过的百分比,低分组为总分

8、数最低的27%现在学习的是第15页,共43页区分度计算区分度计算客观性试题客观性试题极端分组法极端分组法公式DPHPL计算步骤:按测验总分从高到低排序;测验总分最高的27的被试作为高分组,最低的27的被试为低分组;分别求出这两组被试通过试题的百分比;将算得有关数据带入上公式。公式XH:高分组总分;XL:低分组总分;H:该题最高分;L:该题最低分;N:考生总人数的25计算步骤:按测验总分由高到低排序;分别确定测验总分的前27和后27作为高低分组;列出试题分析表;将数据带入公式计算。主观性试题主观性试题极端分组法极端分组法现在学习的是第16页,共43页信度信度即测试的稳定性和和可靠程度,信度是反映

9、测量中随机误差大小的指标。包括重测信度、复本信度、同质性信度。重测信度:同一测验对同组被试先后两次施测所得结果的一致性程度;复本信度:两平行测验对同组被试施测所得结果的一致性程度;同质性信度:测验内部所有题目间的一致性程度。教师自编测验的信度指标范围为0.7以上。2i:每道试题方差;2:全卷方差;k:试卷中试题数目含义含义种类种类公式公式指标范围指标范围试题同质性信度现在学习的是第17页,共43页效度效度是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实际测量出其所要测量特性的程度。内容效度:是指测验内容对于其所欲测之行为领域的代表性程度。效标关联效度:是指一个测验对处于特定情境中的

10、个体的行为进行预测的有效性。结构效度:是指测验对于被称作某一理论概念或特质测量的程度。教师自编测验的效度指标范围为0.4以上。含义含义种类种类公式公式指标范围指标范围Di为每一试题的区分度k为试卷中试题的数目试卷结构效度现在学习的是第18页,共43页一、信度一、信度(一)信度的概念(一)信度的概念信度是指测量结果的稳定性或可靠的程度,亦即测量结信度是指测量结果的稳定性或可靠的程度,亦即测量结果是否真实、客观的反映实际水平。可以从以下三个方面果是否真实、客观的反映实际水平。可以从以下三个方面理解测量的信度:理解测量的信度:1、实测值与真值相差的程度、实测值与真值相差的程度也就是误差,误差越小,测

11、量的信度越高。也就是误差,误差越小,测量的信度越高。2、统计量与参数之间的接近程度、统计量与参数之间的接近程度统计量指样本上的数字特征。参数是总体上的数字统计量指样本上的数字特征。参数是总体上的数字特征。特征。现在学习的是第19页,共43页统计量越接近参数,可靠性越高,信度越统计量越接近参数,可靠性越高,信度越高。高。3、两次重复测量或等值测量之间的关联程、两次重复测量或等值测量之间的关联程度度两次测量的相关系数越高,则测量的信度两次测量的相关系数越高,则测量的信度越高,但被测对象的经验、知识增长等因素越高,但被测对象的经验、知识增长等因素也影响信度。也影响信度。(二)提高测量信度的方法(二)

12、提高测量信度的方法1、适当增加测量题目的数量、适当增加测量题目的数量数量多则代表性就大,既可提高信度,又数量多则代表性就大,既可提高信度,又可提高效度。但数量太多又操作困难。可提高效度。但数量太多又操作困难。2、测验的难度要适中、测验的难度要适中现在学习的是第20页,共43页难度适中,则信度大,区分度也大。难度适中,则信度大,区分度也大。3、测验的内容应尽量同质、测验的内容应尽量同质测验内容庞杂,则增加难度,必然降低信度。测验内容庞杂,则增加难度,必然降低信度。4、测验的程序应统一、测验的程序应统一测验的过程直接关系到信度的高低,信度需要规范测验的过程直接关系到信度的高低,信度需要规范公平的测

13、验过程去保证。公平的测验过程去保证。5、测验的时间要充分、测验的时间要充分测验的时间如果不足,不能客观反映学生的实际水测验的时间如果不足,不能客观反映学生的实际水平,也影响信度。平,也影响信度。6、评分要尽量客观、准确、评分要尽量客观、准确评分不准确,必然降低信度。评分不准确,必然降低信度。现在学习的是第21页,共43页二、效度二、效度(一)效度的概念(一)效度的概念效度是指测量结果的准确性和有效性的程度,亦即测量效度是指测量结果的准确性和有效性的程度,亦即测量是否达到了预期的目的。可以从以下三个方面理解效度:是否达到了预期的目的。可以从以下三个方面理解效度:1、效度始终是对一定的测量目的而言

14、的、效度始终是对一定的测量目的而言的一般而言,判断效度的高低,就是判断测验达到目的的一般而言,判断效度的高低,就是判断测验达到目的的程度。程度。2、效度也是对测量的结果而言的、效度也是对测量的结果而言的测量结果真实、正确的反映被测对象的功能和特性时,测量结果真实、正确的反映被测对象的功能和特性时,则为效度较高或有效。则为效度较高或有效。3、效度只是高与低的问题、效度只是高与低的问题现在学习的是第22页,共43页测量的效度不存在有没有,只存在高与低。由于教育测测量的效度不存在有没有,只存在高与低。由于教育测量对象的特殊性(精神的、心理的、可以掩盖的),所以量对象的特殊性(精神的、心理的、可以掩盖

15、的),所以更注重效度问题。更注重效度问题。(二)效度的类型(二)效度的类型1、内容效度、内容效度是指测验目的代表所欲测量的内容和引起预期反映是指测验目的代表所欲测量的内容和引起预期反映所达到的程度,也就是测量内容的代表性程度。所达到的程度,也就是测量内容的代表性程度。2、效标关联效度、效标关联效度又称经验效度或统计效度,是以测验分数和效标之间的又称经验效度或统计效度,是以测验分数和效标之间的相关系数来表示测验效度的高低。相关系数来表示测验效度的高低。效标就是鉴定效度的参照尺度。效标具有可变性,而效标就是鉴定效度的参照尺度。效标具有可变性,而且选择是比较困难的。且选择是比较困难的。3、结构效度、

16、结构效度现在学习的是第23页,共43页是指一个测量能实际测量出理论上的构念或心理特性的是指一个测量能实际测量出理论上的构念或心理特性的程度。即就是从心理学的理论观点对检测结果加以解释和程度。即就是从心理学的理论观点对检测结果加以解释和探讨。探讨。(三)提高效度的方法(三)提高效度的方法1、控制系统误差、控制系统误差2、精心编制量表、精心编制量表3、妥善组织检测、妥善组织检测4、扩充样本的内容和代表性、扩充样本的内容和代表性5、合理处理效度和信度的关系、合理处理效度和信度的关系6、适当增加测验的长度、适当增加测验的长度三、难度三、难度(一)难度的概念(一)难度的概念现在学习的是第24页,共43页

17、难度是指测验试题的难易程度。教育测量中,客观试题难度是指测验试题的难易程度。教育测量中,客观试题的难度一般用正确回答人数与参加测量总人数的比值表示,的难度一般用正确回答人数与参加测量总人数的比值表示,即即pr/n难度是试题对学生知识和能力水平的适合程度的指标。难度是试题对学生知识和能力水平的适合程度的指标。难度既影响区分度,又影响信度和效度。但是难度是一难度既影响区分度,又影响信度和效度。但是难度是一个相对的概念。个相对的概念。(二)难度对测验的影响(二)难度对测验的影响1、影响测验分数的分布形态、影响测验分数的分布形态2、影响测验分数的离散程度、影响测验分数的离散程度3、影响测验的鉴别能力、

18、影响测验的鉴别能力(三)测验的适宜难度(三)测验的适宜难度根据公式根据公式pr/n,则,则0p1,所以,一套题目的整体,所以,一套题目的整体难度应该是难度应该是0.30.7,平均难度是,平均难度是0.450.55,这样才,这样才可以保证分数呈正态分布。可以保证分数呈正态分布。现在学习的是第25页,共43页(四)控制题目难度的基本方法(四)控制题目难度的基本方法影响题目难度的主要因素:影响题目难度的主要因素:1、考查知识点的多少。、考查知识点的多少。2、考查能力的复杂程度或层次的高低。、考查能力的复杂程度或层次的高低。3、考生对题目的熟悉程度。、考生对题目的熟悉程度。4、命题的技巧性。、命题的技

19、巧性。四、区分度四、区分度(一)区分度的概念(一)区分度的概念区分度是指测验对考生实际水平的区分程度。又叫鉴区分度是指测验对考生实际水平的区分程度。又叫鉴别力。别力。区分度又分为正区分(积极区分)、负区分(消极区区分度又分为正区分(积极区分)、负区分(消极区分)和零区分。分)和零区分。(二)区分度与测验信度、难度的关系(二)区分度与测验信度、难度的关系现在学习的是第26页,共43页1、区分度与信度的关系、区分度与信度的关系据研究,要想达到理性的测验信度,提高区分度是一个据研究,要想达到理性的测验信度,提高区分度是一个好方法。好方法。2、区分度与难度的关系、区分度与难度的关系难度适中时,区分度有

20、可能达到最大。难度适中时,区分度有可能达到最大。(三)提高区分度的方法(三)提高区分度的方法1、使题目和整个考试难度适中。、使题目和整个考试难度适中。2、着重考查复杂的学习结果。、着重考查复杂的学习结果。(四)区分度的评价标准(四)区分度的评价标准区分度当然是越高越好,但是越高越难,一般应该控制区分度当然是越高越好,但是越高越难,一般应该控制在在0.20.4之间。之间。0.4非常好;非常好;0.30.39良好;良好;0.20.29尚可。尚可。现在学习的是第27页,共43页3.信度信度指的是测量结果的稳定性和可靠性。也就是说,在不同时间、不同测验条件下所得分数之间能够保持一致。重测信度重测信度

21、同一测验对同组被试先后两次施测所得结果的一致性程度。复本信度复本信度指同一批考生在两个平行(等值)试卷上得分的相关系数。评分者信度评分者信度指评分者评分的稳定性和可靠性,反映了评分能够稳定地反映考生的真实知识和能力水平的程度。现在学习的是第28页,共43页4.效度效度,就是指试卷的有效性,即试卷是否达到了考试的目的。换句话说,也就是测验是否精确地测量了想要测的东西。效度的统计学定义是:与测量目标有关的真实分数方差与总分方差的比率效度的分类效度的分类内容效度内容效度 题目对欲测的内容范围取样的适当程度。构想效度构想效度(理论效度、结构效度、建构效度)效标关联效度效标关联效度(准则效度、实证效度)

22、现在学习的是第29页,共43页提高测验信度、效度的方法提高测验信度、效度的方法测验中题目的数量应适当,不能太少。紧密围绕教学大纲和教学目标命题。考核内容应全面,并能有效代表学生应掌握的知识领域。测验的整体难度适当,不同类型、不同难度的题目应保持恰当比例。少出偏题、怪题,一般应以考察基础知识和基本能力为主。现在学习的是第30页,共43页一、难度一、难度 难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。一般认为,试题的难度指数在0.30.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。现在学习的是第31页,

23、共43页1、难度的两种定义:(1)P=1x/w x为某题得分的平均分数,w为该题的满分。这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。(2)P=x/w 这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。现在学习的是第32页,共43页2、难度的计算:(1)主观性试题的难度 A 基本公式法:P=1x/w B极端分组法 P=1(XH+XL)2W XH:高分组的平均得分(前27%),XL:低分组的平均得分(后27%)。(2)客观性试题的难度 A 基本公式法:P=1R/N R 为答对人数,N 为全体人数。B 极端分组法:P=1(PH+PL)2

24、PH=RH/n 叫高分组通过率,RH:高分组答对人数,n:总人数的前27%。PL=RL/n 叫低分组通过率,RL:低分组答对人数。现在学习的是第33页,共43页二、区分度二、区分度 区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。试题的区分度与试题的难度直接相关,通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。区分度指标的评价:-1.00D+1.00,区分度指数越高,试题的区分度就

25、越强。一般认为,区分度指数高于0.3,试题便可以被接受。现在学习的是第34页,共43页2、区分度的计算方法:基本公式法:D(HL)N(D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和)。极端分组法:(1)主观性试题:D=SHSLn(WH-WL)SH:高分组得分总数,SL:低分组得分总数,WH:该题的最高得分,WL:该题的最低得分,n为高分组(或低分组)的人数,即总人数的27%。(2)客观性试题:D=PHPL,或D=RHRLn(3)一般也可以用D=XHXLX满 计算。XH:高分组某试题的平均分,XL:低分组某试题的平均分,X满:该题

26、的满分。现在学习的是第35页,共43页三、信度三、信度 信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。相反,如果用某套试题对同一应试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了。信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表明该试卷完全不可靠。一般来说,要求信度在0.7以上。现在学习的是第36页,共43页1、评价信度的方法:(1)重测法,(2)复本法副题,(3)折半法,或者说:用再测信度、复本信度和内部一致信度三种方法来进行评估。再测信度是指将同一试卷在相同的条件下对同一组考生先后实

27、施两次,两次测评结果的相关系数。复本信度是指用两份或几份在构想、内容、难度、题型和题量等方面都平行的试卷进行测试,测评结果之间的相关系数。内部一致信度是指试卷内部各题之间的一致性,通常是将试卷一分为二,然后计算一半试卷与另一半试卷之间的相关系数。2、信度系数 xx=ST2SX2 ST2 叫真分数方差,SX2 为获得分数方差。信度系数的最大值为1,表示测验的可靠性高,最小值为0,表示测验的信度低。当xx0.70时,测验可用于团体间的比较。当xx0.85时,测验可用于个体之间的比较。现在学习的是第37页,共43页四、效度四、效度 效度是一个测试能够测试出它所要测试的东西的程度,即测试结果与测试目标

28、的符合程度 任何测试工具,无论其它方面有多好,若效度太低,测试的结果不是它要测试的东西(如用英语试卷测试学生的数学能力),那么,对目前所要测试的东西,这个测试将是无价值的。由于心理现象本身的特点,测评的效度尤为重要。心理属于精神方面的东西,目前人们还无法直接观察它,只能通过一个人的行为模式或者对测试题目的反应,来推论其心理特质。如智力水于主要是借助于个体对一些问题的反应及正误等结果来推断的。效度是一个相对概念,即效度只有高低之分,没有全部有效和全部无效之分。效度从种类上可分为卷面效度、内容效度、构想效度、预测效度和共时效度。现在学习的是第38页,共43页 试卷质量分析的两个类:试题分析和试卷分

29、析试卷质量分析的两个类:试题分析和试卷分析 一、一、试题分析试题分析 对试题(考试)的性质、来源、内容范围、难度等进行概述。1、测验内容的覆盖面如何,2、各知识点所占的比例是否恰当,3、试题内容的选择是否合理,是否有错题,超纲等题目。4、各层次行为目标所占的分数比例是否恰当。如果是自命题,列出试题的双向细目表。如果是非自命题,要对试题分析列出考查知识的细目表,或者是直条图(各部分知识所占比例)。从效度、信度(考试成绩),难度、区分度(试题)四个角度分析。现在学习的是第39页,共43页 二、二、试卷分析试卷分析 分定量分析和定性分析两部分。(一)定量分析:1、逐题统计分析(可用列表法、或统计图法

30、)填空题,统计答对率。如:题号12345总计全对人数半对人数答错人数平均分难度选择题,按选项统计,如:现在学习的是第40页,共43页题号选项12345ABCD平均分难度计算题,按等级统计。如得零分人数,得满分人数,得部分分的人数,计算出难度和平均分。2、统计学生成绩频率分布情况(次数分布图)。点击进入次数分布图 频率分布直方图ppt下载 3、三率一分,即优秀率、及格率、低分段率及平均分。要注明试卷的总分是多少,最高和最低分是多少。现在学习的是第41页,共43页(二)定性分析1、诊断:指出问题,分析原因。问题应分共性和个性,找出共性问题及原因,教与学两方面都要分析。2、制定措施:改进、矫正。现在学习的是第42页,共43页难度谢谢!欢迎提问现在学习的是第43页,共43页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁