《教育测量的一般理论与基本方法.ppt》由会员分享,可在线阅读,更多相关《教育测量的一般理论与基本方法.ppt(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2022-6-281教育测量的一般理论与基本方法教育测量的一般理论与基本方法 袁亚良袁亚良2022-6-282主要内容主要内容n一、基本概念一、基本概念n二、数据整理二、数据整理n三、集中趋势分析三、集中趋势分析n四、分析评价报告四、分析评价报告2022-6-283一、基本概念一、基本概念 1. 教育测量教育测量 教育测量有广义和狭义之分从广义上教育测量有广义和狭义之分从广义上说,教育测量泛指运用测量手段对教育活动说,教育测量泛指运用测量手段对教育活动所进行的量的测定它涉及的范围很广,凡所进行的量的测定它涉及的范围很广,凡是需要并能够测量的与教育有关的活动均在是需要并能够测量的与教育有关的活动
2、均在研究之列,如教育投入、教育过程各要素、研究之列,如教育投入、教育过程各要素、教育的效果等从狭义上讲,教育测量专指教育的效果等从狭义上讲,教育测量专指按一定规则对学生的知识、智能、个性发展、按一定规则对学生的知识、智能、个性发展、思想品德等所进行的量的测定通常所提及思想品德等所进行的量的测定通常所提及的多是狭义上的教育测量的多是狭义上的教育测量2022-6-2842. 教学评价教学评价 教学评价是按照一定标准,运用科学教学评价是按照一定标准,运用科学可行的方法,对教育活动所进行的价值可行的方法,对教育活动所进行的价值判断的过程它包括对教学过程和教学判断的过程它包括对教学过程和教学效果的评价,
3、诸如学校、教师的教学工效果的评价,诸如学校、教师的教学工作,课堂教学,教学方法、模式和内容,作,课堂教学,教学方法、模式和内容,以及学生的学业成就、一般智能发展、以及学生的学业成就、一般智能发展、个性发展、思想品德状况等评价个性发展、思想品德状况等评价2022-6-2853测验及其种类测验及其种类 测验是指对通过一定的仪器和试题测验是指对通过一定的仪器和试题所引起的受测者的行为样本进行测量的所引起的受测者的行为样本进行测量的系统程序教育测量的对象和内容是非系统程序教育测量的对象和内容是非常丰富的,测验作为教育测量的主要工常丰富的,测验作为教育测量的主要工具,种类也很繁多,可按不同标准加以具,种
4、类也很繁多,可按不同标准加以分类分类 2022-6-286按测验的功用分类按测验的功用分类n(1)学绩测验)学绩测验. 测量个人测量个人(或团体或团体)经经过一定形式的学习活动后对知识和技能过一定形式的学习活动后对知识和技能的掌握程度。因为主要是为测量学习成的掌握程度。因为主要是为测量学习成绩而设计,因而称为学业成绩测验,简绩而设计,因而称为学业成绩测验,简称学绩测验,又称作学业成就测验。平称学绩测验,又称作学业成就测验。平时我们举行的学科测验就属此类。时我们举行的学科测验就属此类。 2022-6-287n(2)能力测验)能力测验n能力测验可分为:能力测验可分为:n1)一般能力测验一般能力测验
5、. 如智力测验、创造能力测验;如智力测验、创造能力测验;n2)特殊能力测验特殊能力测验. 如对美术、音乐、数学等方如对美术、音乐、数学等方面的特殊才能的测验;面的特殊才能的测验;n3)潜在能力测验,又称能力倾向测验。测量潜潜在能力测验,又称能力倾向测验。测量潜在能力是为了测定个人能力发展的潜在特质,在能力是为了测定个人能力发展的潜在特质,即尚未表现出来的潜藏着的能力,在一定条即尚未表现出来的潜藏着的能力,在一定条件下某种能力可能达到的水平。件下某种能力可能达到的水平。 2022-6-288(3)人格测验)人格测验.测量动机、兴趣,测量动机、兴趣,态度,气质,情感、信念、价态度,气质,情感、信念
6、、价值观等除能力以外的个性特征值观等除能力以外的个性特征和倾向。和倾向。 2022-6-289按测验的目的分类按测验的目的分类 n(1)诊断性测验)诊断性测验,也称作配置性测验也称作配置性测验.n是指在教学活动的一定阶段,如学年、是指在教学活动的一定阶段,如学年、学期或教学某一课程章节之初进行的测学期或教学某一课程章节之初进行的测验,其目的在于了解学生的知识基础和验,其目的在于了解学生的知识基础和情感发展状态,对即将学习的内容的准情感发展状态,对即将学习的内容的准备状况,使教师、管理人员心中有数,备状况,使教师、管理人员心中有数,以便合理编班、组织教学、恰当处理教以便合理编班、组织教学、恰当处
7、理教学内容。学内容。 2022-6-2810n(2)形成性测验)形成性测验. 是指在教学活动的是指在教学活动的进程中所实施的、以改进教学为目的的进程中所实施的、以改进教学为目的的测验,这种测验形式灵活,师生可以通测验,这种测验形式灵活,师生可以通过形成性测验了解前段教与学的状况,过形成性测验了解前段教与学的状况,以便采取措施及时矫正。例如在教学中,以便采取措施及时矫正。例如在教学中,当讲过一个单元之后,为了了解学生对当讲过一个单元之后,为了了解学生对该单元的内容掌握情况,可以组织形成该单元的内容掌握情况,可以组织形成性测验,以便及时反馈信息,采取补救性测验,以便及时反馈信息,采取补救措施,改进
8、教学工作,更好地完成教学措施,改进教学工作,更好地完成教学任务。任务。 2022-6-2811n(3)终结性测验)终结性测验. 是指在学期学是指在学期学年或某一门课程终了时举行的测验,年或某一门课程终了时举行的测验,其目的在于鉴定教师的教学和学生其目的在于鉴定教师的教学和学生的学习、甚至一门课程的编制。这的学习、甚至一门课程的编制。这种测验的组织、实施都比较正规。种测验的组织、实施都比较正规。例如毕业考试就是其中的一种。例如毕业考试就是其中的一种。 2022-6-28121 诊断、形成、终结性测验诊断、形成、终结性测验 对照对照表表种类种类目的目的特点特点时间时间诊断性诊断性测验测验预测摸底预
9、测摸底 比较正规比较正规教学开始教学开始形成性形成性测验测验矫正改进矫正改进灵活灵活教学进程中教学进程中终结性终结性测验测验鉴定鉴定正规正规教学结束教学结束2022-6-2813按测验的对象分类按测验的对象分类 n(1)个别测验)个别测验n每次仅以一个被试为对象,其优点是主每次仅以一个被试为对象,其优点是主试对被试者的言语、情绪有较多的控制试对被试者的言语、情绪有较多的控制机会,能进行细致的观察。缺点是费时机会,能进行细致的观察。缺点是费时多,手续复杂,对主试专业素质要求较多,手续复杂,对主试专业素质要求较高。一般多用于个性测量、外语的口试高。一般多用于个性测量、外语的口试等。等。2022-6
10、-2814n(2)团体测验)团体测验n是指在同一时间内由一位主试对多数人是指在同一时间内由一位主试对多数人实施的测验。它的优点是时间经济而且实施的测验。它的优点是时间经济而且不一定找专业素质高的人担任主试。缺不一定找专业素质高的人担任主试。缺点是对被试的行为不能有效的控制和细点是对被试的行为不能有效的控制和细致观察。目前教育测量多数采用团体测致观察。目前教育测量多数采用团体测验。验。 2022-6-2815按解释分数和方法分类按解释分数和方法分类 n(1)常模参照测验)常模参照测验n指参照被测群体的实际水平解释分数的测验指参照被测群体的实际水平解释分数的测验叫做叫做常常模参照测验模参照测验群体
11、的平均分数一般可群体的平均分数一般可以反映群体的水平,称为以反映群体的水平,称为常模常模以常模为参以常模为参照点,将被测个人的成绩与常模比较,并把照点,将被测个人的成绩与常模比较,并把比较结果所反映出来的差异数量化,作为导比较结果所反映出来的差异数量化,作为导出分数参照常模解释分数,便于比较和选出分数参照常模解释分数,便于比较和选拔工作的进行,它属于相对评价的范畴例拔工作的进行,它属于相对评价的范畴例如,在升学考试中,按标准化的要求进行的如,在升学考试中,按标准化的要求进行的分数转换就是参照常模得出的分数转换就是参照常模得出的 2022-6-2816n(2)目标参照测验)目标参照测验n参照被测
12、达到目标的程度来解释分数的参照被测达到目标的程度来解释分数的测验,叫做测验,叫做目标参照测验目标参照测验,也称作,也称作标准标准参照测验参照测验通过与特定的标准进行比较,通过与特定的标准进行比较,了解被测的达标程度,这是一种绝对评了解被测的达标程度,这是一种绝对评价方法例如,毕业考试就是以某一学价方法例如,毕业考试就是以某一学段的教育目标为标准,衡量学生的达标段的教育目标为标准,衡量学生的达标情况而进行的情况而进行的 2022-6-28172 常模参照测验和常模参照测验和目标参照测验对照表目标参照测验对照表种类种类参照系参照系归属归属作用作用理想分布理想分布常模参常模参照测验照测验群体水平群体
13、水平相对评价相对评价 比较比较选拔选拔全距大,全距大,正态分布正态分布目标参目标参照测验照测验教育目标教育目标绝对评价绝对评价 鉴定鉴定负偏态负偏态2022-6-28184测量的要素测量的要素n测量的三要素:测量的三要素:n参照点参照点 n 参照点分绝对零点和相对零点教育测量参照点分绝对零点和相对零点教育测量 n 所应用的参照点都是相对零点所应用的参照点都是相对零点n统一的单位统一的单位n量具(测量工具)量具(测量工具) n 教育测量常用的工具是试卷,而试卷由测教育测量常用的工具是试卷,而试卷由测 n 题构成,故我们必须高度重视命题的研究,题构成,故我们必须高度重视命题的研究,n 提高试题的质
14、量,这样才能保证测验的可提高试题的质量,这样才能保证测验的可n 靠性和有效性靠性和有效性 2022-6-2819n5教育测量中使用的量表教育测量中使用的量表()百分量表()百分量表()百分等级量表()百分等级量表()标准分()量表()标准分()量表()量表()量表2022-6-2820二、二、 数据整理数据整理 n(一一)系统抽样方法系统抽样方法n抽样方法是从总体所包含的全部个体中随机抽样方法是从总体所包含的全部个体中随机地抽出一部分个体作为样本,用以估计总体地抽出一部分个体作为样本,用以估计总体情况的一种方法情况的一种方法n要使样本有代表性,能充分反映总体的情况,要使样本有代表性,能充分反映
15、总体的情况,必须采用随机抽样的方法所谓随机抽样,必须采用随机抽样的方法所谓随机抽样,就是从总体抽取样本时,排除人的主观因素就是从总体抽取样本时,排除人的主观因素的影响,使每个个体被抽取的机会均等常的影响,使每个个体被抽取的机会均等常用的抽样方法有四种用的抽样方法有四种 2022-6-28211简单随机抽样简单随机抽样 n最简单的随机抽样方法是用抽签法其方法最简单的随机抽样方法是用抽签法其方法是先将总体中的所有个体编号,总体中个体是先将总体中的所有个体编号,总体中个体的个数为的个数为N,号码便是从,号码便是从1编到编到N对个体编号对个体编号时也可以利用已有的编号,如班级中的座位时也可以利用已有的
16、编号,如班级中的座位号、考试时的准考证号等再将所有编号制号、考试时的准考证号等再将所有编号制成号签,即写在形状、大小相同的卡片成号签,即写在形状、大小相同的卡片(或纸或纸条、小球等条、小球等)上,将号签放在一个暗箱里,搅上,将号签放在一个暗箱里,搅拌均匀抽签时根据样本的容量抽取,如要拌均匀抽签时根据样本的容量抽取,如要求抽取求抽取K个个体作为样本,则每次抽出个个体作为样本,则每次抽出1个号个号签,连续抽出签,连续抽出K次,已经抽出的号签不再放回次,已经抽出的号签不再放回参加抽取参加抽取2022-6-2822n现在较为先进的抽样方法是利用现在较为先进的抽样方法是利用随机随机数表数表进行抽样随机数
17、表的制作,是进行抽样随机数表的制作,是将将0,1,2,9十个数字,按随机的十个数字,按随机的方式重复地抽出,根据抽出的顺序排列方式重复地抽出,根据抽出的顺序排列所作成的表表中可约定二个或三个数所作成的表表中可约定二个或三个数字,乃至五个数字为一组制作随机数字,乃至五个数字为一组制作随机数表时,要保证表中每组位置上,数字出表时,要保证表中每组位置上,数字出现的概率是相等的,现在统计工作者常现的概率是相等的,现在统计工作者常用计算机来制作随机数表用计算机来制作随机数表 2022-6-2823n简单随机抽样,简便易行,适合于总体简单随机抽样,简便易行,适合于总体的个体数不多的情况若总体的个体很的个体
18、数不多的情况若总体的个体很多,要事先将所有个体码号,然后逐个多,要事先将所有个体码号,然后逐个抽取,过程较繁琐,可采用其他方法抽取,过程较繁琐,可采用其他方法 2022-6-28242系统抽样系统抽样n系统抽样是先将总体均衡地分成若干个部分,然后按事先约定的规则,从每部分抽取出1个个体,得到所需要的样本 2022-6-28253分层抽样分层抽样n分层抽样是已知总体是由有明显差异的几个分层抽样是已知总体是由有明显差异的几个部分组成时,为了使样本更充分地反映总体部分组成时,为了使样本更充分地反映总体情况所采用的抽样方法它是先依据总体的情况所采用的抽样方法它是先依据总体的差异情况将总体分成几部分,然
19、后按各部分差异情况将总体分成几部分,然后按各部分所占的比进行抽样所占的比进行抽样n分层抽样能充分利用已知信息,能使样本有分层抽样能充分利用已知信息,能使样本有较好的代表性,缩小变异程度和抽样误差,较好的代表性,缩小变异程度和抽样误差,在实践中较多采用在实践中较多采用 2022-6-28264群体抽样群体抽样n群体抽样是以集体为对象而不以个体为群体抽样是以集体为对象而不以个体为对象的抽样方法对象的抽样方法n整体抽样的方法易于组织,能节约人力整体抽样的方法易于组织,能节约人力物力,适用于大规模的调查研究但样物力,适用于大规模的调查研究但样本单位在总体中分布的均匀性较差,如本单位在总体中分布的均匀性
20、较差,如果结合分层抽样进行,能减少误差,缩果结合分层抽样进行,能减少误差,缩小变异程度小变异程度 2022-6-2827四种抽样一览表四种抽样一览表类别类别 特点特点 相互联系相互联系 适用范围适用范围 简单随简单随机抽样机抽样 从总体中逐个抽取从总体中逐个抽取 总体中的个体个总体中的个体个数较少数较少 系统系统抽样抽样 将总体均分成几部分,将总体均分成几部分,按事先确定的规则在按事先确定的规则在各部分中抽取各部分中抽取 在起始部分抽在起始部分抽样时采用简单样时采用简单随机抽样随机抽样 总体中的个体个总体中的个体个数较多数较多 分层分层抽样抽样 将总体分成几层,分将总体分成几层,分层按比例进行
21、抽取层按比例进行抽取 各层抽样时采各层抽样时采用简单随机抽用简单随机抽样或系统抽样样或系统抽样 总体由差异明显总体由差异明显的几部分组成的几部分组成 群体群体抽样抽样 以总体中的集体为对以总体中的集体为对象进行抽取象进行抽取 采用简单随机采用简单随机抽样抽样 节省人力物力,节省人力物力,便于组织工作便于组织工作 2022-6-2828(二二)数据分布数据分布 在教育测量中,通过各种测验获得在教育测量中,通过各种测验获得大量分数,这些杂乱无章的分数有三个大量分数,这些杂乱无章的分数有三个问题,一是看不清它们的分布形态,二问题,一是看不清它们的分布形态,二是不了解它们的特征和变化规律,三是是不了解
22、它们的特征和变化规律,三是每个分数表达的意义含混模糊因此,每个分数表达的意义含混模糊因此,需要对零乱分散的分数进行整理和分析,需要对零乱分散的分数进行整理和分析,以便在此基础上作出解释和评价以便在此基础上作出解释和评价 2022-6-28291.顺序排列表顺序排列表 顺序排列是简单的整理分数的方顺序排列是简单的整理分数的方法它是将所有个体的成绩,按高低顺法它是将所有个体的成绩,按高低顺序排列,并且列于表中,称作顺序排列序排列,并且列于表中,称作顺序排列表这种方法简明清晰,一眼便能看到表这种方法简明清晰,一眼便能看到最高分数和最低分数,而且可以大致了最高分数和最低分数,而且可以大致了解个体成绩在
23、总体中的位置解个体成绩在总体中的位置 2022-6-28302.频数分布表频数分布表 频数分布表是一种反映数据分布情频数分布表是一种反映数据分布情况的统计表所谓频数是指一群数据在况的统计表所谓频数是指一群数据在各个数值(或区间)上所出现的数据的各个数值(或区间)上所出现的数据的个数,也称为次数每一个频数除以数个数,也称为次数每一个频数除以数据的总个数称为据的总个数称为频率频率,或称,或称相对次数相对次数 2022-6-28313.频数直方图频数直方图 频数分布表可以制作频数直方频数分布表可以制作频数直方图方法是:以分数为横轴,频数为纵图方法是:以分数为横轴,频数为纵轴,建立直角坐标系,在横轴上
24、标出各轴,建立直角坐标系,在横轴上标出各组分数的组中值,频数值等距标在纵轴组分数的组中值,频数值等距标在纵轴上;然后以组中值为底边中点,组距为上;然后以组中值为底边中点,组距为底边,组频数为高作出各矩形,即得频底边,组频数为高作出各矩形,即得频数直方图数直方图2022-6-2832三、集中趋势分析三、集中趋势分析1算术平均数算术平均数 一组数值的总和除以数据一组数值的总和除以数据的总频数所得的商称为算术平的总频数所得的商称为算术平均数,简称平均数均数,简称平均数nxxxxn212022-6-28332方差方差 一组数据中,各数离均差的平方和一组数据中,各数离均差的平方和的算术平均数称为这组数据
25、的的算术平均数称为这组数据的方差方差又又叫均方差或变异数用符号叫均方差或变异数用符号S2或或2表表示示 S2= =2)(1xxni2022-6-28343.标准标准差差 方差的算术平方根称为方差的算术平方根称为标准差标准差 标准差是反映全体考生分数之间的标准差是反映全体考生分数之间的离散程度和差异情况它与平均分一起离散程度和差异情况它与平均分一起使用,决定了某次考试分数分布情使用,决定了某次考试分数分布情况况S S值越大,表示部分考生离平均分值越大,表示部分考生离平均分的的“差距越大差距越大”,也就是分数分布较广;,也就是分数分布较广;S S值越小,则分数分布较窄或说值越小,则分数分布较窄或说
26、“集中集中在平均分附近在平均分附近” S=nxxnii2)(2022-6-28354由分组标准差求总体标准差由分组标准差求总体标准差的方法的方法 n在教育测量中,常常需要根据各部分数在教育测量中,常常需要根据各部分数据的平均数、标准差求全部数据的标准据的平均数、标准差求全部数据的标准差,主要步骤如下:差,主要步骤如下:n(1)求全体学生的总平均分)求全体学生的总平均分n(2)求组内偏差平方和)求组内偏差平方和n各分组方差各分组方差si2与相应的组内数据个数与相应的组内数据个数Ni之积的和叫做组内偏差平方和,用之积的和叫做组内偏差平方和,用q1表表示。即示。即 q1=Nisi2 . 2022-6
27、-2836(3)求组间偏差平方和)求组间偏差平方和n各分组平均数与全体总平均数的差叫做各分组平均数与全体总平均数的差叫做组间偏差。用组间偏差。用di表示,组间偏差平方表示,组间偏差平方di 2 与相应组数据个数与相应组数据个数Ni之积的和叫组间偏之积的和叫组间偏差平方和,用差平方和,用q2表示。即表示。即 nq2=Nidi 2.(4)求总标准差)求总标准差n总标准差公式:总标准差公式: nqqs212022-6-28375.差异系数差异系数 标准差较准确地反映了一组分数的离散程度,标准差较准确地反映了一组分数的离散程度,它与原数据的单位相同,是一种绝对差异量它与原数据的单位相同,是一种绝对差异
28、量数在进行不同组间离散程度比较时,适用数在进行不同组间离散程度比较时,适用于单位相同、平均数相近的情况如果各组于单位相同、平均数相近的情况如果各组数据单位不同,或虽然单位同但平均数相差数据单位不同,或虽然单位同但平均数相差甚远时,不能直接用标准差比较,这时应使甚远时,不能直接用标准差比较,这时应使用差异系数用差异系数 差异系数是一组数据的标准差与平均数的百差异系数是一组数据的标准差与平均数的百分比,用分比,用CV表示表示 %100 xsCV2022-6-2838n例例5 某市中考成绩语文的标准差某市中考成绩语文的标准差S1=15,平均分平均分85分(满分分(满分120分),政治的标分),政治的
29、标准准差差S2=10,平均分,平均分50分(满分分(满分70分),分),试比较两科的差异情况试比较两科的差异情况2022-6-2839解解:语文学科的差异系数为语文学科的差异系数为 CV=1585=17.6% 政治学科的差异系数为政治学科的差异系数为 CV=1050=20% 因此,政治学科分数的离散程度大因此,政治学科分数的离散程度大2022-6-28406.标准分数标准分数n标准分数是以平均分为参照点,标准差标准分数是以平均分为参照点,标准差为度量单位的分数它具有重要理论价为度量单位的分数它具有重要理论价值和应用价值值和应用价值n不改变分布形态的标准分数不改变分布形态的标准分数,定义式为定义
30、式为 sxxzi2022-6-2841n 例例6某生高考数学成绩某生高考数学成绩105分,所分,所在省的数学平均分在省的数学平均分68.40分,标准差为分,标准差为28.90分,求他的标准分数分,求他的标准分数n n解:解: Z = 1.266.n这种标准分数又称这种标准分数又称z分数。分数。 2022-6-2842n为了与通常记分的习惯协调一致,对为了与通常记分的习惯协调一致,对z分分数可以再施行线性变换,以消除它的负数可以再施行线性变换,以消除它的负值和小数,例如线性变换值和小数,例如线性变换 y=Az+B。 n当当A=10,B=50时,便得到了时,便得到了T分数分数T=10z+50 。2
31、022-6-2843n市区市区7年级基础教育质量监测的标准分数年级基础教育质量监测的标准分数T分分就采用了线性变换就采用了线性变换 y=Az+B,其中,其中A=100,B=500。2022-6-2844n正态化的标准分数正态化的标准分数n当两种测验的原始分数分布形态不相同当两种测验的原始分数分布形态不相同时,应采用非线性变换的方法,对偏态时,应采用非线性变换的方法,对偏态分布进行正态化处理。正态化方法如下:分布进行正态化处理。正态化方法如下:n首先把原始分数化为百分等级,然后把首先把原始分数化为百分等级,然后把百分等级看作正态分布曲线下的累积面百分等级看作正态分布曲线下的累积面积,查正态分布表
32、找出相应的积,查正态分布表找出相应的z值,便得值,便得到了中位数为零点的正态化标准分数。到了中位数为零点的正态化标准分数。2022-6-28457. 难度难度 难度是指试卷(题)的难易 程难度是指试卷(题)的难易 程度一般用试卷(题)的得分率或答对度一般用试卷(题)的得分率或答对率(率(P)表示,所以难度事实上是容易)表示,所以难度事实上是容易度度P值在值在01之间,数值越大,说明试之间,数值越大,说明试卷(题)越容易卷(题)越容易2022-6-2846n难度公式难度公式 n难度与分数分布难度与分数分布n一般情况下,测验的平均难度接近一般情况下,测验的平均难度接近0.50时,时,分数趋于正态分
33、布,否则分数分布将出现偏分数趋于正态分布,否则分数分布将出现偏态就整个测验而言,当平均难度为态就整个测验而言,当平均难度为0.5且且题目组间的相关为零的情况下,分数呈正态题目组间的相关为零的情况下,分数呈正态分布,而难度值越小,则题目越难,低分段分布,而难度值越小,则题目越难,低分段人数必然较多难度值越大,题目越容易,人数必然较多难度值越大,题目越容易,分数将大部分集中在高分区这样,在分数分数将大部分集中在高分区这样,在分数的分布上,就会呈现出两种不同的偏向,前的分布上,就会呈现出两种不同的偏向,前者为正偏态,后者为负偏态者为正偏态,后者为负偏态 xxP 2022-6-2847有关考试难度水平
34、估计一览表有关考试难度水平估计一览表最最易易容易容易 适中题适中题 较难较难难难很难很难难度难度 0.950.850.700.500.30 0.10章节章节考试考试20% 40%30%10%高考高考30%30%20% 20%竞赛竞赛20%30% 30% 20%2022-6-28482022-6-28492022-6-28502022-6-28518. 区分度区分度n是试题对不同考生的知识、能力水平的是试题对不同考生的知识、能力水平的鉴别程度如果一个题目的测试结果使鉴别程度如果一个题目的测试结果使水平高的考生答对(得高分),而水平水平高的考生答对(得高分),而水平低的考生答错(得低分),它的区分
35、能低的考生答错(得低分),它的区分能力就很强题目的区分度反映了试题这力就很强题目的区分度反映了试题这种区分能力的高低一般认为,区分度种区分能力的高低一般认为,区分度的数值达到了的数值达到了0.3,便可以接受;达到了,便可以接受;达到了0.3以上为好的题目;在以上为好的题目;在0.4以上为优秀以上为优秀题目;低于题目;低于0.3的题目,区分能力差的题目,区分能力差 2022-6-285219941995年高考数学试题区分度统计表年高考数学试题区分度统计表年份年份 0.3以下以下0.30.4 0.4以上以上 1994文科文科 14.7%20.7%64.4% 1994理科理科 5.3%20.7%74
36、%1995文科文科13.3%8.7%78%1995理科理科16.7%37.3%46%2022-6-2853(1)得分率求差得分率求差法法 将受测群体按题目得分的高低排列,将受测群体按题目得分的高低排列,取高分人数的取高分人数的27%为一组,他们的得分为一组,他们的得分率记作率记作PH;低分人数的;低分人数的27%为另一组,为另一组,他们的得分率记他们的得分率记作作PL,则该题的区分度,则该题的区分度为为D=PHPL2022-6-2854(2)得分求差法得分求差法(适用于解答题适用于解答题)n将受测群体按题目得分的高低排列,取高将受测群体按题目得分的高低排列,取高分人数的分人数的27%为一组,低
37、分人数的为一组,低分人数的27%为为另一组,用另一组,用D表示区分度,用表示区分度,用H表示高分表示高分组得分总和,用组得分总和,用L表示低分组得分总和,表示低分组得分总和, 用用n表示高分组(低分组)人数表示高分组(低分组)人数,XH表示表示该题的最高得分该题的最高得分,XL表示该题的最低得表示该题的最低得分,则分,则)(LHXXnLHD2022-6-2855n(3)当题目为多值评分时,可以用)当题目为多值评分时,可以用受测者在某题上的得分与其测验总受测者在某题上的得分与其测验总分之间的积差相关计算区分度。分之间的积差相关计算区分度。2022-6-2856积差相关积差相关 2222,)(1)
38、(11ynyxnxyxnxyryx2022-6-28579. 信度信度(1)信度的概念)信度的概念 信度是衡量测验分数一致性或可靠性的信度是衡量测验分数一致性或可靠性的一个指标,即用一个或一组测验对同一被试一个指标,即用一个或一组测验对同一被试群体施测多次,所得结果的一致性的程度,群体施测多次,所得结果的一致性的程度,以及测验分数所反映被试真实水平(即真分以及测验分数所反映被试真实水平(即真分数)的可靠性程度数)的可靠性程度 一般情况下,在规模较大的测验中,信一般情况下,在规模较大的测验中,信度系数应不低于度系数应不低于0.90,以达到,以达到0.95为好;学校为好;学校平时测验的信度系数也应
39、不低于平时测验的信度系数也应不低于0.60。 2022-6-2858(2)常模参照测验的信度)常模参照测验的信度n稳定性信度稳定性信度 对一组受测者先后两次施测同一测验所对一组受测者先后两次施测同一测验所得分数的一致性称作得分数的一致性称作稳定性信度。稳定性信度。 稳定性信度适用于速度测验,测题数量稳定性信度适用于速度测验,测题数量较多,且有一定的时间限制,受测者很难记较多,且有一定的时间限制,受测者很难记住前一次测验的内容,受记忆影响较小。住前一次测验的内容,受记忆影响较小。 计算稳定系数的方法是求两次测验分数计算稳定系数的方法是求两次测验分数的积差相关系数。的积差相关系数。 2022-6-
40、2859等值性信度等值性信度 两个复份测验之间分数的一致性称作两个复份测验之间分数的一致性称作等等值性信度值性信度,通常被表示为两个复份测验分数,通常被表示为两个复份测验分数的相关系数。所谓复份测验是指在测验性质、的相关系数。所谓复份测验是指在测验性质、内容、题型、题量、难度等方面均为一致的内容、题型、题量、难度等方面均为一致的A、B两个测验,这两个测验中的一个几乎是另一两个测验,这两个测验中的一个几乎是另一个的复本,所以等值性信度又称为个的复本,所以等值性信度又称为复本信度复本信度。 计算等值系数的方法是,先用计算等值系数的方法是,先用A卷施测,卷施测,然后在较短的时间间隔内施测然后在较短的
41、时间间隔内施测B卷,再求它们卷,再求它们得分的积差相关系数。得分的积差相关系数。2022-6-2860 例例 18名学生化学模拟测验和高中会考成名学生化学模拟测验和高中会考成绩如下表(其中绩如下表(其中x表示模拟成绩,表示模拟成绩,y表示会考成表示会考成绩),求测验的等值性信度。绩),求测验的等值性信度。序序123456789x869486948387858885y889495958494969792序序101112131415161718x967578839084878986y9381808493938792932022-6-2861用这两类测验成绩的积差相关用这两类测验成绩的积差相关系数表
42、示系数表示2222)(1)(11ynyxnxyxnxyrtt71. 01816311482571815561349721816311556141322222022-6-2862 内在一致性信度内在一致性信度 在一个测验中,各个测题上所得成在一个测验中,各个测题上所得成绩的一致性称作绩的一致性称作内在一致性信度内在一致性信度。 测验内部的一致性是确定测验中的测验内部的一致性是确定测验中的所有题目是否测量了同一个心理属性。所有题目是否测量了同一个心理属性。 这里只介绍用分半相关和这里只介绍用分半相关和系数公系数公式来计算内在一致性系数。式来计算内在一致性系数。2022-6-2863分半相关分半相关
43、n将全卷中全部试题按题号或分数适当分将全卷中全部试题按题号或分数适当分半,得到两个平行的半,得到两个平行的“子试卷子试卷”,计算,计算这两个子试卷考生得分的相关系数,这这两个子试卷考生得分的相关系数,这样求得的是半个试卷的信度,然后再用样求得的是半个试卷的信度,然后再用斯皮尔曼斯皮尔曼布郎(布郎(SpearmanBrown)公式校正,得到考试的分半信度系公式校正,得到考试的分半信度系数一般认为分半信度系数在数一般认为分半信度系数在0.90以上以上比较合适这个方法比较适合多数为选比较合适这个方法比较适合多数为选择题的试卷择题的试卷 2022-6-2864斯皮尔曼斯皮尔曼布布郎郎(Spearman
44、 Brown)校正)校正公式公式n其中,其中, rtt 分半信度系数分半信度系数, rab表示表示A、B两份试卷得分的积差相关系数两份试卷得分的积差相关系数n一般认为分半信度系数在一般认为分半信度系数在0.90以上比较以上比较合适合适ababttrrr122022-6-2865内部一致性信内部一致性信度度n通常采用的是克伦巴赫(通常采用的是克伦巴赫(Cronbach)的)的系数公式,它适用于非选择题(多系数公式,它适用于非选择题(多重记分)较多的试卷重记分)较多的试卷系数为试卷系数为试卷信度的最低限,一般认为其值在信度的最低限,一般认为其值在0.80以以上,考试的信度比较好上,考试的信度比较好
45、2022-6-2866克伦巴赫(克伦巴赫(Cronbach) 系数公式系数公式n它适用于非选择题(多重记分)较多的试它适用于非选择题(多重记分)较多的试卷卷系数为试卷信度的最低限,一般认为系数为试卷信度的最低限,一般认为其值在其值在0.80以上,考试的信度比较好以上,考试的信度比较好n克伦巴赫(克伦巴赫(Cronbach)公式:)公式: 其中其中,Si 2是每个测试题目得分的方差是每个测试题目得分的方差,St2是整份测验总分的方差是整份测验总分的方差 )1 (1212tniittSSnnr2022-6-286719941996年高考数学(理科)试年高考数学(理科)试卷统计数据对比表卷统计数据对
46、比表项目项目1994年年1995年年1996年年平均分平均分83.1288.3682.79标准差标准差25.5024.0025.30难度难度0.5500.5900.550分半信度分半信度0.83390.85060.8500信度信度0.75800.88670.88842022-6-2868n(3)标准参照测验的信度)标准参照测验的信度n标准参照测验强调注重于考查学生对教标准参照测验强调注重于考查学生对教学内容熟练掌握的程度,在教与学各个学内容熟练掌握的程度,在教与学各个环节处理得较好或较差的情况下,受测环节处理得较好或较差的情况下,受测团体的水平将比较一致,测验分数的分团体的水平将比较一致,测验
47、分数的分布范围比较小。这样,即使测验具有一布范围比较小。这样,即使测验具有一定的稳定性或可靠性,它的信度系数仍定的稳定性或可靠性,它的信度系数仍然较低。然较低。 2022-6-28692022-6-2870n根据标准参照测验的特点,可用较为简根据标准参照测验的特点,可用较为简便的方法估计信度。便的方法估计信度。n阶段比较法阶段比较法n比率系数估计法比率系数估计法2022-6-2871阶段比较法阶段比较法 n对数学学科内部某一分支的标准参照测验,对数学学科内部某一分支的标准参照测验,可用阶段比较法来判断测验的信度。例如,可用阶段比较法来判断测验的信度。例如,施测施测“不等式不等式”的内容。先对学
48、生进行的内容。先对学生进行“不不等式的性质等式的性质”的标准对照测验,鉴别出学生的标准对照测验,鉴别出学生通过与未通过的类别。学生经过下一阶段的通过与未通过的类别。学生经过下一阶段的学习,再进行学习,再进行“不等式证明不等式证明”的标准对照测的标准对照测验。如果前阶段通过的学生中后阶段未通过验。如果前阶段通过的学生中后阶段未通过的比率较高,经过考察,发现这些学生不会的比率较高,经过考察,发现这些学生不会证明的原因,是由于没有真正熟练掌握不等证明的原因,是由于没有真正熟练掌握不等式的性质,那么说明前阶段的测验可靠性较式的性质,那么说明前阶段的测验可靠性较低。低。2022-6-2872n阶段比较法
49、还适用于同一知识内容在不阶段比较法还适用于同一知识内容在不同时期(或不同水平上)的标准对照测同时期(或不同水平上)的标准对照测验。例如,先对学生施测较低水平的标验。例如,先对学生施测较低水平的标准参照测验,找出通过的学生,经过一准参照测验,找出通过的学生,经过一段时间学习,再用较高水平的标准参照段时间学习,再用较高水平的标准参照测验施测。如果第一次测验通过的学生测验施测。如果第一次测验通过的学生已具备学习下阶段内容的条件,他们在已具备学习下阶段内容的条件,他们在阶段学习中又确实取得成功,也就是说,阶段学习中又确实取得成功,也就是说,在第一次测验通过的学生中第二次测验在第一次测验通过的学生中第二
50、次测验达到熟练掌握的学生人数比率较高,那达到熟练掌握的学生人数比率较高,那么说明该测验信度较高。么说明该测验信度较高。2022-6-2873比率系数估计法比率系数估计法 以甲、乙两个复份的标准参照测验以甲、乙两个复份的标准参照测验对同一组学生施测,用两个测验都通过对同一组学生施测,用两个测验都通过和都未通过的人数之和与该组学生总数和都未通过的人数之和与该组学生总数之比作为测验的信度系数。之比作为测验的信度系数。 公式为:公式为: rtt =(a+d)(a+b+c+d)甲测验甲测验通过通过未通过未通过乙测验乙测验通过通过ab未通过未通过cd2022-6-2874n如果两次测验都通过与都未通如果两