教育测量与评价ppt课件(3)(第三章-教育测量与评价的质量特性)..复习课程.ppt

上传人:飞****2 文档编号:77434017 上传时间:2023-03-14 格式:PPT 页数:32 大小:296.50KB
返回 下载 相关 举报
教育测量与评价ppt课件(3)(第三章-教育测量与评价的质量特性)..复习课程.ppt_第1页
第1页 / 共32页
教育测量与评价ppt课件(3)(第三章-教育测量与评价的质量特性)..复习课程.ppt_第2页
第2页 / 共32页
点击查看更多>>
资源描述

《教育测量与评价ppt课件(3)(第三章-教育测量与评价的质量特性)..复习课程.ppt》由会员分享,可在线阅读,更多相关《教育测量与评价ppt课件(3)(第三章-教育测量与评价的质量特性)..复习课程.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。教育测量与评价课件(3)(第三章-教育测量与评价的质量特性).本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。信度的统计定义信度的统计定义 定义定义1:信度是一个被测团体真分数方差与观察分数方差之信度是一个被测团体真分数方差与观察分数方差之比。即:比。即:XX=2T/2X 定义定义2:信度是一个被试团体的真分数与观

2、察分数的相关系信度是一个被试团体的真分数与观察分数的相关系数的平方。即:数的平方。即:XX=2TX 定义定义3:信度是一个被试团体在测验信度是一个被试团体在测验X(A卷)上的观察分卷)上的观察分数与在测验数与在测验X的任意一个的任意一个“平行测验平行测验”X(B卷)上观察分数的卷)上观察分数的相关系数。即:相关系数。即:XX=XX本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。重测信度(稳定性系数)重测信度(稳定性系数)(1)重测信度是指用一个量表(测验或评价表)对同一组重测信

3、度是指用一个量表(测验或评价表)对同一组被施测两次所得结果的一致性程度,其大小等于同一组被试在被施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。两次测验上所得分数的相关系数。(2)重测信度基本假设:)重测信度基本假设:某测验所要测量的潜在特质,短某测验所要测量的潜在特质,短期内不会随着时间推移而改变。期内不会随着时间推移而改变。(3)重测信度适用于异质性测验()重测信度适用于异质性测验(一个测验包括几个不同一个测验包括几个不同的部分,这几个部分分别测量几个不同的心理特质,它们之间的部分,这几个部分分别测量几个不同的心理特质,它们之间可能并不存在相关或相关较低可

4、能并不存在相关或相关较低),也适用于速度测验和运动技),也适用于速度测验和运动技能测验。能测验。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。复本信度(等值性系数或等值稳定性系数)复本信度(等值性系数或等值稳定性系数)(1)复本信度是指两个平行测验(在试题格式、题数、难度、指导语复本信度是指两个平行测验(在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同

5、的测验)测量同一批被试所得结果的一致性程度,其大小等于题又是不相同的测验)测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。同一批被试在两个复本测验上所得分数的相关系数。(2)实施复本测验的方式:)实施复本测验的方式:一是在同一个时间连续施测(此时所得的一是在同一个时间连续施测(此时所得的复本信度叫等值性系数),二是间隔一段时间后施测(此时所得复本信度叫复本信度叫等值性系数),二是间隔一段时间后施测(此时所得复本信度叫等值稳定性系数)。等值稳定性系数)。(3)使用复本信度首先要构造出两份或两份以上的真正的平行测验。)使用复本信度首先要构造出两份或两份以

6、上的真正的平行测验。这是一个很难达到的条件。另外,重测信度的一些不足,在复本信度中仍然这是一个很难达到的条件。另外,重测信度的一些不足,在复本信度中仍然存在,需要加以克服。存在,需要加以克服。(4)复本信度不仅适用于难度测验,也是估计速度测验信度的好方法。)复本信度不仅适用于难度测验,也是估计速度测验信度的好方法。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。(1)同质性信度(内部一致性信度)是指测验内部所有题目间的一同质性信度(内部一致性信度)是指测验内部所有题目间的一致性

7、程度。致性程度。这里题目间的一致性含有两层意思:其一是指所有题目测的这里题目间的一致性含有两层意思:其一是指所有题目测的是同一种心理特质;其二是所有题目得分之间都具有较高的正相关。是同一种心理特质;其二是所有题目得分之间都具有较高的正相关。(2)同质性信度的基本假设:当一个测验具有较高的同特性信度时,)同质性信度的基本假设:当一个测验具有较高的同特性信度时,说明测验主要测的是某一单个心理特质,由于众多的题目测试了同一心说明测验主要测的是某一单个心理特质,由于众多的题目测试了同一心理特质,那么实测结果就是该特质水平的反映。理特质,那么实测结果就是该特质水平的反映。(3)同质性信度不适用于异质测验

8、和速度测验。)同质性信度不适用于异质测验和速度测验。同质性信度的概念同质性信度的概念本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。(1)分半信度分半信度 分半信度指是的将一个测验分成对等的两半后,所有被试在这两半上所得分数的分半信度指是的将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。一致性程度。分半信度的计算方法和等值复本信度的方法类似,只不过分半信度计算的是两个分半信度的计算方法和等值复本信度的方法类似,只不过分半信度计算的是两个“半测验半测验”上得分

9、的相关系数,只是半个测验的信度,还必须用斯皮尔曼上得分的相关系数,只是半个测验的信度,还必须用斯皮尔曼布朗公式布朗公式加以校正加以校正 。(2)库德理查逊信度库德理查逊信度 该方法适合于测验题目全部为二分记分题的测验的内部一致性信度分析。常用的该方法适合于测验题目全部为二分记分题的测验的内部一致性信度分析。常用的库德理查逊公式有:库德理查逊公式有:和和 (3)克龙巴赫系数)克龙巴赫系数 当测验题型较多,并非都是二分记分题时,估计测验信度可采用克龙巴赫系数。当测验题型较多,并非都是二分记分题时,估计测验信度可采用克龙巴赫系数。其计算公式为:其计算公式为:(4)荷伊特信度荷伊特信度 1941年荷伊

10、特提出用方差分量比来估计测验内部一致性的方法,其估计值为:年荷伊特提出用方差分量比来估计测验内部一致性的方法,其估计值为:同质性信度的估计方法同质性信度的估计方法本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。评分者信度评分者信度l 评分者信度的含义评分者信度的含义 评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。l 评分者信度的计算评分者信度的计算 (1)当评分者人数为两人时,评分者信度等于两个评分者

11、给同一批被)当评分者人数为两人时,评分者信度等于两个评分者给同一批被试的答卷所评分数的相关系数。依据数据形式,可采用不同的相关系数计算试的答卷所评分数的相关系数。依据数据形式,可采用不同的相关系数计算方法。方法。(2)当评分者人数多于两人时,评分者信度可用肯德尔和谐系数进行)当评分者人数多于两人时,评分者信度可用肯德尔和谐系数进行估计。估计。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。()百分比一致性指标()百分比一致性指标(PA)百分比一致性指标是指同一测验或两平行测验先

12、后两次施测,其对被试百分比一致性指标是指同一测验或两平行测验先后两次施测,其对被试的分类结果一致的比例。的分类结果一致的比例。其计算公式为:其计算公式为:()()K一致性系数一致性系数 K一致性系数是指实际被评定为一致的百分比与在理论上被评定为一致一致性系数是指实际被评定为一致的百分比与在理论上被评定为一致的最大可能次数百分比的比率。的最大可能次数百分比的比率。其计算公式:其计算公式:(其中其中 )()()K2 指数指数 标准参照测验关注决断的可靠性,而这种决断显然与被试团体的平均水标准参照测验关注决断的可靠性,而这种决断显然与被试团体的平均水平密切相关。在考虑到这个因素的基础上,心理统计学家

13、莱芬斯顿提出了平密切相关。在考虑到这个因素的基础上,心理统计学家莱芬斯顿提出了K2指数作为考察标准参照测验信度的指标。其计算公式为:指数作为考察标准参照测验信度的指标。其计算公式为:或或 或或 标准参照测验的信度分析标准参照测验的信度分析本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。测量标准误测量标准误l 测量标准误的含义测量标准误的含义 测量标准误是指测验中所得测值偏离真分数的程度,记为测量标准误是指测验中所得测值偏离真分数的程度,记为SE。l 测量标准误与测验信度的关系测

14、量标准误与测验信度的关系 l 测量标准误的意义测量标准误的意义 测量标准误是反映测量结果精确性和可靠性的又一指标,同时也是测量标准误是反映测量结果精确性和可靠性的又一指标,同时也是人们正确解释测验分数的科学依据。人们正确解释测验分数的科学依据。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。效度的概念效度的概念l 效度的意义效度的意义 效度是指一个测验或量表实际能测出其所要测量的特性的程度。效度是指一个测验或量表实际能测出其所要测量的特性的程度。对这对这一概念,我们可以从以下几

15、个方面来理解一概念,我们可以从以下几个方面来理解:效度始终是针对一定测量目的而言的;效度始终是针对一定测量目的而言的;效度只有程度上的差异;效度只有程度上的差异;效度是针对测量结果而言的;效度是针对测量结果而言的;评价一个测量是否有效要多角度、多方面地收集证据。评价一个测量是否有效要多角度、多方面地收集证据。l 效度的统计定义效度的统计定义 效度可定义为目标真分数方差与观察分数方差之比:效度可定义为目标真分数方差与观察分数方差之比:XY=2V/2X l 效度与信度的关系效度与信度的关系 ()信度高是效度高的必要而非充分条件()信度高是效度高的必要而非充分条件 ()效度系数不会大于信度系数的平方

16、根()效度系数不会大于信度系数的平方根本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。如何理解如何理解“效度效度”的意义?的意义?思考题思考题本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。效度是指一个测验或量表实际能测出其所效度是指一个测验或量表实际能测出其所要测量的特性的程度。对这一概念,我们可以从以下要测量的特性的程度。对这一概念,我们可以从以下几个方面来

17、理解:几个方面来理解:(1)效度始终是针对一定测量目的而言的;)效度始终是针对一定测量目的而言的;(2)效度只有程度上的差异;)效度只有程度上的差异;(3)效度是针对测量结果而言的;)效度是针对测量结果而言的;(4)评价一个测量是否有效要多角度、多方面地)评价一个测量是否有效要多角度、多方面地收集证据。收集证据。答答:本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。内容效度内容效度l 内容效度的含义及应用范围内容效度的含义及应用范围 内容效度是指测验题目样本对于应测内容与行为领

18、域的代表性程度。内容效度是指测验题目样本对于应测内容与行为领域的代表性程度。如果是教学如果是教学情境下的成就测验,那么其内容效度就是看测验题目样本能体现教学目标与教材要求情境下的成就测验,那么其内容效度就是看测验题目样本能体现教学目标与教材要求的程度。的程度。内容效度主要适用于教育测量(尤其是学业成就测验)的情境中,也适合于某些内容效度主要适用于教育测量(尤其是学业成就测验)的情境中,也适合于某些用于选拔和分类的职业测验,但不适合某些心理测验(如智力测验、人格测验)。用于选拔和分类的职业测验,但不适合某些心理测验(如智力测验、人格测验)。l 内容效度的分析方法内容效度的分析方法 逻辑分析的方法

19、逻辑分析的方法 内容效度的逻辑分析法,即依靠有关专家对测验题目与应测内容范围的吻合程度内容效度的逻辑分析法,即依靠有关专家对测验题目与应测内容范围的吻合程度作出判断。作出判断。内容效度的量化分析方法内容效度的量化分析方法 该方法要求专家在仔细审阅测验目标的基础上,独立地对测验的每个题目作出判该方法要求专家在仔细审阅测验目标的基础上,独立地对测验的每个题目作出判断:断:“该题目实际测到的内容与其欲测量的目标内容之间相关程度如何,并用四点量该题目实际测到的内容与其欲测量的目标内容之间相关程度如何,并用四点量表(表(用完全无关、有点相关、相关较密切、完全相关来表示用完全无关、有点相关、相关较密切、完

20、全相关来表示)来表示这种相关的程度)来表示这种相关的程度大小大小”;当两位专家完成此项工作后,统计弱相关(;当两位专家完成此项工作后,统计弱相关(完全无关、有点相关完全无关、有点相关)、强相关)、强相关(相关较密切、完全相关相关较密切、完全相关)的题目数,则此测验的内容效度系数为:内容效度系数)的题目数,则此测验的内容效度系数为:内容效度系数=D/(A+B+C+D)(D 表示两位专家都判定为强相关的题目数表示两位专家都判定为强相关的题目数)本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并

21、增补指标。结构效度结构效度l 结构效度的含义结构效度的含义 结构效度是指一个测验或量表实际测到所要测量的理论结构(结构是指心理学结构效度是指一个测验或量表实际测到所要测量的理论结构(结构是指心理学或社会学上的一种理论构想或特质)的程度。或社会学上的一种理论构想或特质)的程度。l 结构效度的验证一般步骤结构效度的验证一般步骤 提出有关理论结构的说明,并据此设计测量用的试题;提出有关理论结构的说明,并据此设计测量用的试题;提出可以验证该理论结构是存在的假设说明;提出可以验证该理论结构是存在的假设说明;采用各种方法收集实际的资料,以验证第二步提出的假设的正确性;采用各种方法收集实际的资料,以验证第二

22、步提出的假设的正确性;收集其他类型的辅助证据,淘汰与理论结构相反的试题,或是修正理论,并重收集其他类型的辅助证据,淘汰与理论结构相反的试题,或是修正理论,并重复第二和第三步,直到下述的假设得到验证,即测验的结构效度获得支持为止。复第二和第三步,直到下述的假设得到验证,即测验的结构效度获得支持为止。l 结构效度的验证方法结构效度的验证方法 测验内部寻找证据法测验内部寻找证据法 这种方法是通过研究测验内部结构来验证测验的结构效度。它主要包括内容效这种方法是通过研究测验内部结构来验证测验的结构效度。它主要包括内容效度、作答过程分析、测验的同质性和因素分析等四个方面。度、作答过程分析、测验的同质性和因

23、素分析等四个方面。测验之间寻找证据法测验之间寻找证据法 这一方法的特点是同时考察两个或多个测验间的相互关系,从而来验证测验的这一方法的特点是同时考察两个或多个测验间的相互关系,从而来验证测验的结构效度。它包括相容效度、聚合效度、区分效度和结构效度。它包括相容效度、聚合效度、区分效度和“多种特质多种方法矩阵法多种特质多种方法矩阵法”等具体方法。等具体方法。考察测验的实证效度法考察测验的实证效度法 如果一个测验有实证效度,则可以拿该测验所预测的效标的性质与种类作为该如果一个测验有实证效度,则可以拿该测验所预测的效标的性质与种类作为该测验的结构效度指标,至少可以从效标的性质与种类来推论测量的结构效度

24、。主要测验的结构效度指标,至少可以从效标的性质与种类来推论测量的结构效度。主要方法有差异被试比较法和先后测试分析法。方法有差异被试比较法和先后测试分析法。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。效标关联效度效标关联效度l 效标关联效度的含义、种类及适用范围效标关联效度的含义、种类及适用范围 效标关联效度是指一个测验对于处于特定情境中的个体行为进行预测时的有效性。效标关联效度是指一个测验对于处于特定情境中的个体行为进行预测时的有效性。根据效标资料获得的时间不同及测验使用的

25、目的不同,效标关联效度可以分为:根据效标资料获得的时间不同及测验使用的目的不同,效标关联效度可以分为:同时效度:同时效度:测验分数与效标资料的取得约在同一时间内连续完成,计算这两种资测验分数与效标资料的取得约在同一时间内连续完成,计算这两种资料的相关系数即代表测验的同时效度。这种效度的目的主要用于诊断现状,在于用更简料的相关系数即代表测验的同时效度。这种效度的目的主要用于诊断现状,在于用更简单、更省时、更廉价和更有效的测验分数来取代不易搜集的效标资料。单、更省时、更廉价和更有效的测验分数来取代不易搜集的效标资料。预测效度:预测效度:在测验分数取得一段时间后才获得效标资料,计算这两种资料间的相在

26、测验分数取得一段时间后才获得效标资料,计算这两种资料间的相关系数即代表测验的预测效度。预测效度的作用在于预测某个个体将来的行为。关系数即代表测验的预测效度。预测效度的作用在于预测某个个体将来的行为。l 效标关联效度的估计方法效标关联效度的估计方法 相关法:相关法:该方法就是计算测验分数与效标测量的相关系数,具体方法有:积差相该方法就是计算测验分数与效标测量的相关系数,具体方法有:积差相关、等级相关、点双列相关、二列相关、四分相关、关、等级相关、点双列相关、二列相关、四分相关、相关、列联相关法等等。在使用相关、列联相关法等等。在使用过程中,该选择何种计算方法,应根据测验分数与效标测量数据资料的形

27、式而定。过程中,该选择何种计算方法,应根据测验分数与效标测量数据资料的形式而定。显著差异法:显著差异法:该方法是根据效标测量将被试分为两个极端组,然后检验这两组测该方法是根据效标测量将被试分为两个极端组,然后检验这两组测验分数是否具有统计学上的差异显著性。若这两组被试的测验分数差异,则说明该测验验分数是否具有统计学上的差异显著性。若这两组被试的测验分数差异,则说明该测验有较高的效度。有较高的效度。命中率:命中率:当测验用取舍决策时,常使用命中率这一指标。因为这类测验效度高不当测验用取舍决策时,常使用命中率这一指标。因为这类测验效度高不高,就是看其取舍是否与实际一致。命中率包括总命中率、正命中率

28、和负命中率三种。高,就是看其取舍是否与实际一致。命中率包括总命中率、正命中率和负命中率三种。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。试比较内容效度、结构效度、效标关联试比较内容效度、结构效度、效标关联效度的异同效度的异同?思考题思考题本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。相同点:三者都是作为检验测验有效程度的指标,都可以作为相同点:三者都是作为

29、检验测验有效程度的指标,都可以作为评价一个测验优劣的标准。评价一个测验优劣的标准。不同点:不同点:考察的角度不同。内容效度是指测验题目样本对于应测内容考察的角度不同。内容效度是指测验题目样本对于应测内容与行为领域的代表性程度。结构效度是指一个测验或量表实际测到所要测量与行为领域的代表性程度。结构效度是指一个测验或量表实际测到所要测量的理论结构(结构是指心理学或社会学上的一种理论构想或特质)的程度。的理论结构(结构是指心理学或社会学上的一种理论构想或特质)的程度。效标关联效度是指一个测验对于处于特定情境中的个体行为进行预测时的有效标关联效度是指一个测验对于处于特定情境中的个体行为进行预测时的有效

30、性。效性。应用的范围不同。内容效度主要适用于教育测量(尤其是学业成就测应用的范围不同。内容效度主要适用于教育测量(尤其是学业成就测验)的情境中,也适合于某些用于选拔和分类的职业测验,但对于某些特质验)的情境中,也适合于某些用于选拔和分类的职业测验,但对于某些特质的心理测验(如智力测验、人格测验),内容效度并不适合。结构效度主要的心理测验(如智力测验、人格测验),内容效度并不适合。结构效度主要用于智力测验、人格测验等一些心理测验方面。效标关联效度适用于能够找用于智力测验、人格测验等一些心理测验方面。效标关联效度适用于能够找到有效效标的测验,常用的效标主要有:学业成就、等级评定、临床诊断、到有效效

31、标的测验,常用的效标主要有:学业成就、等级评定、临床诊断、专门的训练成绩、实际的工作表现、对团体的区分能力以及其它现成的有效专门的训练成绩、实际的工作表现、对团体的区分能力以及其它现成的有效测验。测验。确定的方法不同。内容效度确定的主要方法是逻辑分析法、量化分析确定的方法不同。内容效度确定的主要方法是逻辑分析法、量化分析法。结构效度确定的主要方法是测验内部寻找证据法、测验之间寻找证据法法。结构效度确定的主要方法是测验内部寻找证据法、测验之间寻找证据法和考察测验的实证效度法;效标关联效度确定的主要方法有相关法、显著差和考察测验的实证效度法;效标关联效度确定的主要方法有相关法、显著差异法、命中率。

32、异法、命中率。答答:本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。题目或项目的难度,就是指被试完成题目或项目任务时所题目或项目的难度,就是指被试完成题目或项目任务时所遇到的困难程度。定量刻画被试作答一个题目的困难程度的量遇到的困难程度。定量刻画被试作答一个题目的困难程度的量数,就叫做题目的难度系数,也常称为难度值,用符号数,就叫做题目的难度系数,也常称为难度值,用符号P表示。表示。难度的概念难度的概念本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的

33、技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。()以全体被试得分率为难度系数()以全体被试得分率为难度系数 如果一个题目的难度大,则被试得高分的可能性小;反之,如果题目如果一个题目的难度大,则被试得高分的可能性小;反之,如果题目的难度小,则被试得高分的可能性就大。因此,用得分率可以作为难度系的难度小,则被试得高分的可能性就大。因此,用得分率可以作为难度系数的指标。其计算公式为:数的指标。其计算公式为:如果题目是选择题的话,被试有可能猜对而得分,因此,对选择题的如果题目是选择题的话,被试有可能猜对而得分,因此,对选择题的难度系数有人建议需用下面的公式进

34、行校正:难度系数有人建议需用下面的公式进行校正:CP=(P-1)()(-1)()以全体被试失分率为难度系数()以全体被试失分率为难度系数 直接建立在通过率基础上的难度系数,直接建立在通过率基础上的难度系数,P 值越大试题越容易,值越大试题越容易,P 值越值越小试题越难做。这与人们观念可能不一致,因此有人提议用失分率小试题越难做。这与人们观念可能不一致,因此有人提议用失分率q 来表来表示难度,计算公式为:示难度,计算公式为:q=1-P难度系数的计算方法(一)难度系数的计算方法(一)本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热

35、锅炉以及联合循环机组可参照本标准执行,并增补指标。()以两端组被试得分率的均值为难度系数()以两端组被试得分率的均值为难度系数 该方法是分别计算高分组被试和低分组被试的得分率,然后求取二者该方法是分别计算高分组被试和低分组被试的得分率,然后求取二者的平均值作为难度系数,公式为:的平均值作为难度系数,公式为:P=(PH+PL)2 以两端组被试的得分率作为难度系数的具体计算步骤:以两端组被试的得分率作为难度系数的具体计算步骤:按被试的总分,将全体被试从高到低进行排序;按被试的总分,将全体被试从高到低进行排序;从高分往下找,找出高分组;由低分往上找,找出低分组。两组人从高分往下找,找出高分组;由低分

36、往上找,找出低分组。两组人数分别占总人数的;数分别占总人数的;分别计算高分组、低分组的被试在该题目上的平均得分;分别计算高分组、低分组的被试在该题目上的平均得分;代入公式代入公式 ,分别计算分组和低分组被试在同一个题目上的难度,分别计算分组和低分组被试在同一个题目上的难度系数;系数;把把 PH 和和 PL 代入公式代入公式 P=(PH+PL)2,计算这个题目的难度系数。,计算这个题目的难度系数。难度系数的计算方法(二)难度系数的计算方法(二)本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,

37、并增补指标。用上述方法计算出来的难度系数,都属于顺序变量,不具有相等的单用上述方法计算出来的难度系数,都属于顺序变量,不具有相等的单位。因此,通过位。因此,通过 P 值的比较并不能客观指出难度之间差异大小,这对我们值的比较并不能客观指出难度之间差异大小,这对我们作进一步的难度分析带来了困难。作进一步的难度分析带来了困难。为了解决这个问题,人们常假设每个试题所要测量的潜在特质或能力为了解决这个问题,人们常假设每个试题所要测量的潜在特质或能力是呈正态分布的,然后就可以根据正态分布曲线,将试题的难度值是呈正态分布的,然后就可以根据正态分布曲线,将试题的难度值 P 作为作为正态曲线下的(概率)面积,转

38、换成具有相等单位的等距量表,即正态曲线下的(概率)面积,转换成具有相等单位的等距量表,即 Z 分数分数(标准分数)。由于标准分数具有相等单位,属于等距量表。所以,用标(标准分数)。由于标准分数具有相等单位,属于等距量表。所以,用标准分数作为题目难度的指标,为进一步作难度分析带来了一些方便。准分数作为题目难度的指标,为进一步作难度分析带来了一些方便。难度的等距变换难度的等距变换本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。测验由多个题目所组成,显然,所有这些题目的难度取值测验由

39、多个题目所组成,显然,所有这些题目的难度取值都应该力求恰当,而且这些题目分布状态也应合理。究竟怎样都应该力求恰当,而且这些题目分布状态也应合理。究竟怎样的题目难度与难度分布是合适的,这主要取决于测验的目的与的题目难度与难度分布是合适的,这主要取决于测验的目的与性质。性质。测验题目的恰当难度和恰当难度分布测验题目的恰当难度和恰当难度分布本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。常模参照测验、标准参照测验所要求的常模参照测验、标准参照测验所要求的项目恰当难度及难度分布是什么?

40、为什么?项目恰当难度及难度分布是什么?为什么?思考题思考题本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。(1)常模参照测验的项目恰当难度是常模参照测验的项目恰当难度是P值尽量接近值尽量接近0.50,因,因为只有在这种情况下题目的区分性能最好。为只有在这种情况下题目的区分性能最好。常模参照测验所要求的项目恰当难度分布是,围绕这个点,有一个适常模参照测验所要求的项目恰当难度分布是,围绕这个点,有一个适当宽的全距。这样做的原因有以下两个:一是测验时,通常希望开始有几个当宽的全距。这

41、样做的原因有以下两个:一是测验时,通常希望开始有几个难度较低的题目来稳定被试情绪,末尾用几个难度稍大的题目以便只有少数难度较低的题目来稳定被试情绪,末尾用几个难度稍大的题目以便只有少数高水平者才能通过,二是让全部项目都取高水平者才能通过,二是让全部项目都取0.50的难度,通常难以实现。当然,的难度,通常难以实现。当然,在允许有适当宽的全距的前提下,仍然要力争大多数项目难度取值接近在允许有适当宽的全距的前提下,仍然要力争大多数项目难度取值接近0.50。(2)标准参照测验的目的是要考察被试的水平是否达到应有要求,因而)标准参照测验的目的是要考察被试的水平是否达到应有要求,因而测验项目的难度,就不应

42、由被试的实际通过率来决定,而应由项目的考核要测验项目的难度,就不应由被试的实际通过率来决定,而应由项目的考核要求是否体现了应有标准或教学目标来决定。无论项目通过率是高还是低,只求是否体现了应有标准或教学目标来决定。无论项目通过率是高还是低,只要体现了应用的标准或教学目标,项目的难度就是合理的恰当的。要体现了应用的标准或教学目标,项目的难度就是合理的恰当的。答答:本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。题目区分度是指题目区别被试水平能力的量度,记为题目区分度是指题目区别被

43、试水平能力的量度,记为 D。区分度的分析方法,大约可以归纳成两类:一是外在效标法,区分度的分析方法,大约可以归纳成两类:一是外在效标法,即分析即分析被试在测验题目上的得分与外在客观标准上的表现之间的关系。被试在测验题目上的得分与外在客观标准上的表现之间的关系。二是内部二是内部一致性法。一致性法。即分析被试在测题上的得分与在整个测验总分之间的一致性程即分析被试在测题上的得分与在整个测验总分之间的一致性程度。度。区分度的值域范围在区分度的值域范围在-1.00 至至+1.00 之间。通常之间。通常 D 为正值,称作积极为正值,称作积极区分;区分;D 为负值,称作消极区分;为负值,称作消极区分;D 为

44、为 0,称作无区分作用。具有积极区,称作无区分作用。具有积极区分作用的项目,其分作用的项目,其 D 值越大,区分的效果越好。值越大,区分的效果越好。区分度的意义区分度的意义本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。(1)相关法)相关法 区分度的实质是题分与总分的相关,因此,各种计算相关系数的方法区分度的实质是题分与总分的相关,因此,各种计算相关系数的方法都可以用于计算区分度。但具体采用哪一个,应根据题分、总分的数据形式都可以用于计算区分度。但具体采用哪一个,应根据题分、总

45、分的数据形式而定。而定。(2)高低分组法)高低分组法 被试在测验分数序列中两端高分、低分组被认为是两个极端效标组。被试在测验分数序列中两端高分、低分组被认为是两个极端效标组。这两个极端效标组间在特定题目上的反应差别程度可以刻画题目的区分能力。这两个极端效标组间在特定题目上的反应差别程度可以刻画题目的区分能力。因此,类似于前面谈及应用两端分组的办法来估计题目的难度系数一样,可因此,类似于前面谈及应用两端分组的办法来估计题目的难度系数一样,可用高分组在特定题目上的得分率和低分组在相同题目上的得分北之差作为题用高分组在特定题目上的得分率和低分组在相同题目上的得分北之差作为题目区分度的指标(高分、低分

46、组人数比例各占总人数的),被称为鉴目区分度的指标(高分、低分组人数比例各占总人数的),被称为鉴别度指数,记为别度指数,记为 D。计算公式为:。计算公式为:D=PH-PL。为计算方便,还可采用公为计算方便,还可采用公式:式:区分度的计算区分度的计算本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。对多级记分的论文型试题,求积差相关后剔除伪相关因素做校正,其对多级记分的论文型试题,求积差相关后剔除伪相关因素做校正,其校正公式为:校正公式为:对二分记分的选择题若有必要作校正,采用点双列

47、相关系数时其校正公对二分记分的选择题若有必要作校正,采用点双列相关系数时其校正公式为:式为:区分度伪相关的校正区分度伪相关的校正本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。(1)以在后测中正确回答某题目的学生的比例减去在前测中正确回答)以在后测中正确回答某题目的学生的比例减去在前测中正确回答该题目的学生的比例所得之增益数为区分度指标。(柯克斯)该题目的学生的比例所得之增益数为区分度指标。(柯克斯)(2)以指导组中正确回答某题目的学生的比例减去未指导组中正确回)以指导组中正确

48、回答某题目的学生的比例减去未指导组中正确回答题目的学生的比例而得之增益数为区分度指标。(克列恩)答题目的学生的比例而得之增益数为区分度指标。(克列恩)(3)以前测中错误回答而在后测中正确回答某题目的被试的比例为指)以前测中错误回答而在后测中正确回答某题目的被试的比例为指标。(罗登巴赫)标。(罗登巴赫)(4)以在前测中错误回答而在后测中正确回答某题目的被试比例,减)以在前测中错误回答而在后测中正确回答某题目的被试比例,减去在前测和后测中均错误回答某题目的被试比例而得增益数为区分度指标。去在前测和后测中均错误回答某题目的被试比例而得增益数为区分度指标。(考塞考夫和克列恩)(考塞考夫和克列恩)标准参

49、照测验题目区分度的其他研究方法标准参照测验题目区分度的其他研究方法本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。l 教育测量与评价方案可用性的概念教育测量与评价方案可用性的概念 教育测量与评价方案的可用性是指方案质量性能可靠稳定,针对性强,教育测量与评价方案的可用性是指方案质量性能可靠稳定,针对性强,对于所有被测量与评价的对象是客观公平的,同时在操作上具有可行性、对于所有被测量与评价的对象是客观公平的,同时在操作上具有可行性、易用性、经济性等特点。易用性、经济性等特点。l 教

50、育测量与评价方案可用性的评价指标教育测量与评价方案可用性的评价指标 教育测量与评价方案的可用性可以从科学性、公平性、可行性、针对教育测量与评价方案的可用性可以从科学性、公平性、可行性、针对性、区分性和简洁性等六个方面来衡量性、区分性和简洁性等六个方面来衡量。教育测量与评价方案的可用性教育测量与评价方案的可用性本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。假设某学者自编了一套神经类型测验,假设某学者自编了一套神经类型测验,并且在几十万人中进行了试用,试问该测验是否一定并且在几十

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁