第四章-心理测验的信度与效度课件.ppt

上传人:飞****2 文档编号:82430886 上传时间:2023-03-25 格式:PPT 页数:114 大小:1.31MB
返回 下载 相关 举报
第四章-心理测验的信度与效度课件.ppt_第1页
第1页 / 共114页
第四章-心理测验的信度与效度课件.ppt_第2页
第2页 / 共114页
点击查看更多>>
资源描述

《第四章-心理测验的信度与效度课件.ppt》由会员分享,可在线阅读,更多相关《第四章-心理测验的信度与效度课件.ppt(114页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章 心理测验的信度与效度任滨海任滨海提纲v信度信度信度概述信度概述信度的类型信度的类型影响信度的因素影响信度的因素v效度效度效度概述效度概述效度的类型效度的类型影响效度的因素影响效度的因素2SV2SI2SE2SX2ST23第一节 信 度一、信度定义一、信度定义v 1、通俗的定义、通俗的定义信度,即测量的可靠性,多次测量结果保持一致性的程信度,即测量的可靠性,多次测量结果保持一致性的程度。度。4v2、测量学定义:、测量学定义:信度为一组测量分数的真分数方差和总方差(实得分数信度为一组测量分数的真分数方差和总方差(实得分数的方差)的比率。的方差)的比率。l信度乃是一个被信度乃是一个被试试群体的

2、真分数与群体的真分数与实实得分数的相关系数的得分数的相关系数的平方。平方。l信度乃是一个信度乃是一个测验测验X与它的任意一个平行与它的任意一个平行测验测验Y的相关系的相关系数。数。信度只受随机误差影响,系统误差不影响信度信度只受随机误差影响,系统误差不影响信度5二、信度的指标二、信度的指标 信度以信度以信度系数信度系数为指标,常用相关系数表示,表示实得为指标,常用相关系数表示,表示实得分数的变异数中有多少比例是由真分数的变异决定的,分数的变异数中有多少比例是由真分数的变异决定的,v信度系数信度系数以相关系数为指标,以相关系数为指标,r rxxxx=r=rxTxT2 2=S=ST T2 2/S/

3、SX X2 2v信度的平方根就是信度的平方根就是信度指数信度指数,r rxTxT=S=ST T/S/SX X6信度指数(rxT)与信度系数(rXX)实得分数 x2真实分数 T2rxx 信度系数(百分比)rOT2信度指数(实得分数与真实分数的相关)rxx=rxT27v信度定理:信度定理:定理定理 1:如果满足独立性条件:如果满足独立性条件(即误差分数与真分数无关即误差分数与真分数无关)时,真分数方差与观察分数方差之时,真分数方差与观察分数方差之 比比(信度系数信度系数)等于真等于真分数与观察分数之间的相关系数的平方。分数与观察分数之间的相关系数的平方。定理定理 2:如果满足平行测验条件:如果满足

4、平行测验条件 时,真分数方差与观察时,真分数方差与观察分数方差之比分数方差之比(信度系数信度系数)等于两个平行测验的观察分数等于两个平行测验的观察分数之之 间的相关系数间的相关系数。补充补充:信度系数、信度指数、测定系数的讨论:信度系数、信度指数、测定系数的讨论Baidu 测定系数测定系数 信度系数信度系数 搜索搜索。8三、信度的评估方式三、信度的评估方式v(一)重测信度(一)重测信度v(二)复本信度(二)复本信度v(三)内在一致性信度(三)内在一致性信度v(四)评分者信度(四)评分者信度9(一)重测信度(一)重测信度1、定义:用同一个测验对同一组被试在不同时间施测两次所得结、定义:用同一个测

5、验对同一组被试在不同时间施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。又称稳定性信度、再测信度、施测皮尔逊积差相关系数。又称稳定性信度、再测信度、施测再施测再施测信度、跨时间一致性。信度、跨时间一致性。10施测施测施测施测 时间间隔时间间隔时间间隔时间间隔 再施测再施测再施测再施测 相关系数相关系数相关系数相关系数图图1 1 重测信度图式重测信度图式1110名学生幸福感调查的两次施测分数名学生幸福感调查的两次施测分数重测信度的重测信度的计算举例计算举例ABCDEFGHIJ1615131311

6、10109871516141210911867X1X22、注意事项:、注意事项:v所测量的心理特性必须是稳定的。所测量的心理特性必须是稳定的。v遗忘和练习的效果基本上是相互抵消的。遗忘和练习的效果基本上是相互抵消的。v在两次施测的间隔时期内,被试在所要测验的心理特在两次施测的间隔时期内,被试在所要测验的心理特质方面没有获得的更多的学习和训练。质方面没有获得的更多的学习和训练。v易受练习和记忆的影响,两次测试的时间间隔要适当,易受练习和记忆的影响,两次测试的时间间隔要适当,一般是一般是24周较宜,间隔时间最好不超过周较宜,间隔时间最好不超过6个月。个月。13(二)复本信度(二)复本信度1、定义:

7、又称等值性系数,是以两个等值但题目不同的、定义:又称等值性系数,是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。测验上得分的相关系数。2、方法:为排除施测顺序的影响,在实施时,可将被试、方法:为排除施测顺序的影响,在实施时,可将被试先分为两组,一组人先作先分为两组,一组人先作A型测验,再作型测验,再作B型测验;另一型测验;另一组人则反之。组人则反之。14施测型施测型施测型施测型 最短时距最短时距最短时距最短时距 施测型施测型施测型施测型 相关系数相关系数相关系数相关系数图图2 2 复本信度图式复本信度

8、图式1510名学生创造力的复本测验结果名学生创造力的复本测验结果复本信度的复本信度的计算举例计算举例ABCDEFGHIJX1X2201918181716141212102020191616171211139v3、注意事项、注意事项要构造真正的平行测验要构造真正的平行测验 v 复本测验必须在题目的内容、数量、形式、难度、复本测验必须在题目的内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式、测验区分度、指导语、时限以及所用的例题、公式、测验其它方面都相同或相似。其它方面都相同或相似。被试有条件接受两个测验。被试有条件接受两个测验。17(三)内部一致性信度(三)内部一致性信度v1 1

9、、定义:、定义:反映的是题目之间的关系,表示测验能够测量相同内容反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。或特质的程度。v2 2、方法:、方法:(1)(1)分半信度分半信度:v通常是先把一份测验按题目的奇偶顺序或其它方法分通常是先把一份测验按题目的奇偶顺序或其它方法分成两个尽可能平行的半份测验,然后计算两半之间的成两个尽可能平行的半份测验,然后计算两半之间的相关,即得到分半信度系数。相关,即得到分半信度系数。18v两半变异数相等:两半变异数相等:积差相关积差相关斯皮尔曼布朗公式校正斯皮尔曼布朗公式校正 19l变异数不相等:l弗朗那根(Flanagan)公式:l卢伦(Rulo

10、n)公式:20(2)(2)同质性信度同质性信度:v测验内部所有题目间的一致性。测验内部所有题目间的一致性。用每个题目和其它题目平均数用每个题目和其它题目平均数的相关。的相关。当各测题得分有较高的正相关时,即为同质;相反,当各测题得分有较高的正相关时,即为同质;相反,测题间相关很低或为负相关则为异质。测题间相关很低或为负相关则为异质。v0 0、1 1计分项目(库德计分项目(库德(KuderKuder)-)-理查逊理查逊(Richardson)(Richardson)方法)方法)v非非0 0、1 1计分项目(计分项目(系数或克伦巴赫系数或克伦巴赫(CronbachCronbach)公式公式 )21

11、注意事项注意事项v 在一个测量多种特质的问卷中,不同的因子的同在一个测量多种特质的问卷中,不同的因子的同质性信度应该分开计算。质性信度应该分开计算。v克伦巴赫克伦巴赫系数相当于计算了所有项目间的一致性系数相当于计算了所有项目间的一致性程度,避免了分半信度由于分半方式不同所造成的程度,避免了分半信度由于分半方式不同所造成的分半系数不一致的问题。分半系数不一致的问题。22(四)评分者信度(四)评分者信度v1、定义:用于测量不同评分者之间所产生的误差。、定义:用于测量不同评分者之间所产生的误差。是由多个评分者给一组测验结果评分,所得各个分是由多个评分者给一组测验结果评分,所得各个分数之间的一致性。数

12、之间的一致性。l对于客观性试题,评分所引起的误差或忽略不计对于客观性试题,评分所引起的误差或忽略不计l对于主观性题目来说,不同评分人员对相同被试的评分存在差异。对于主观性题目来说,不同评分人员对相同被试的评分存在差异。如心理测量中的投射测验,学业测验中的高考作文,职业选拔中的如心理测量中的投射测验,学业测验中的高考作文,职业选拔中的面试等。面试等。l一般要求在成对的受过训练的评分者之间平均一致性达一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才以上,才认为评分是客观的。认为评分是客观的。23v2、计算、计算当评分者为当评分者为2人时,可以积差相关或等级相关人时,可以积差相关或等

13、级相关当评分者多于当评分者多于2人时,可以使用肯德尔和谐系数人时,可以使用肯德尔和谐系数24如有如有A A、B B、C C三位专家给三位专家给6 6位应聘者的面试评分,结果位应聘者的面试评分,结果如下,试求评分者信度。如下,试求评分者信度。ABC175664529072603816354460604258475636969066ABCRi15451422237345413466618533286111325=14+7+13+18+8+3=63 =142+72+132+182+82+32=811 由题意知由题意知K=3,N=6,将上述值代入公式有将上述值代入公式有:W=0.95如在评定中有相同的

14、等级时,用下式校正。其中如在评定中有相同的等级时,用下式校正。其中n为为相同等级的个数相同等级的个数26四、信度对测验分数的意义四、信度对测验分数的意义v1 1、解释真实分数与实得分数的相关、解释真实分数与实得分数的相关 信度系数可以解释为测验的总变异中,真分数造成的变信度系数可以解释为测验的总变异中,真分数造成的变异占百分之几。如,当异占百分之几。如,当rxxrxx=0.90=0.90时,我们可以说实得分时,我们可以说实得分数中有数中有90%90%的变异是真分数造成的,仅的变异是真分数造成的,仅10%10%来自测验的误来自测验的误差。差。rxxrxx=1.00=1.00,则表示完全没有测量误

15、差,所有的变异,则表示完全没有测量误差,所有的变异均来自真实分数;同样,信度系数也告诉测量的误差比均来自真实分数;同样,信度系数也告诉测量的误差比例是多少。例是多少。27v2 2、确定信度可以接受的水平、确定信度可以接受的水平 一个测验究竟信度多高才合适,才让人满意呢?当然,最理想的情一个测验究竟信度多高才合适,才让人满意呢?当然,最理想的情况是况是rxxrxx=1.00=1.00,但实际上是办不到的。根据多年的研究结果,一般,但实际上是办不到的。根据多年的研究结果,一般的能力测验和成就测验的信度系数都在的能力测验和成就测验的信度系数都在0.900.90以上,有的可以达以上,有的可以达0.95

16、0.95;而人格测验、兴趣、态度、价值观等测验的信度一般在;而人格测验、兴趣、态度、价值观等测验的信度一般在0.800.850.800.85或更高些。一般原则是:当或更高些。一般原则是:当rxxrxx0.700.70时,测验不能用于对个人做出时,测验不能用于对个人做出评价或预测,而且不能作团体比较;当评价或预测,而且不能作团体比较;当0.70rxx0.850.70rxx0.85时,可用于时,可用于团体比较;当团体比较;当rxx0.85rxx0.85时,才能用来鉴别或预测个人成绩或作为。时,才能用来鉴别或预测个人成绩或作为。28v3 3、解释个人分数的意义(区间估计)、解释个人分数的意义(区间估

17、计)从信度可以解释个人分数的意义,这就是测量标准误的从信度可以解释个人分数的意义,这就是测量标准误的应用。它有两个作用应用。它有两个作用v其一是估计真实分数的范围;其一是估计真实分数的范围;v其二是了解实得分数再测时可能的变化情形。其二是了解实得分数再测时可能的变化情形。29v由于误差的存在,一个人通过测量得到的分数很难由于误差的存在,一个人通过测量得到的分数很难等于真分数。理论上,我们可以对一个人施测无数等于真分数。理论上,我们可以对一个人施测无数次,然后求得所得分数的平均数和标准差。在这个次,然后求得所得分数的平均数和标准差。在这个假设的分布里,平均数就是这个人的真分数,标准假设的分布里,

18、平均数就是这个人的真分数,标准差则为误差大小的指标。差则为误差大小的指标。3031v在在实实际际工工作作中中,我我们们用用一一组组被被试试(人人数数足足够够多多)两两次次施施测测的的结结果果来来代代替替对对同同一一个个人人反反复复施施测测,以以估估计计测测量量误误差差的的变变异异数数。此此时时,个个人人在在两两次次测测验验中中的的分分数数差差异异就就是是测测量量误误差差。据据此此可可制制成成误误差差分分数数的的分分布布。这这个个分分布布的的标标准准差差(误差分布的标准差)我我们们称称之之为为测量的标准误,是是表表示示测测量量误误差差的的大大小小的的指指标标,其计算公式为:其计算公式为:v (公

19、式(公式5 54 4)v式式中中SESE表表示示测测量量的的标标准准误误,即即误误差差分分布布的的标标准准差差;S Sx x表示一次测量分数的标准差;表示一次测量分数的标准差;r rxxxx表示信度系数。表示信度系数。32v我们可以用测量的标准误来估计个人测验的真分数我们可以用测量的标准误来估计个人测验的真分数的大小。的大小。v如果选用如果选用9595的可靠性水平(置信水平),即显著的可靠性水平(置信水平),即显著性水平(性水平(a a值)为值)为.05.05,真分数有,真分数有9595的可能落入的可能落入X 1.96SE X 1.96SE,即,即X 1.96 SEX 1.96 SE的范围之内

20、,也可以的范围之内,也可以写成写成X X1.96SE 1.96SE T T X X1.96 SE1.96 SE,SESE则用公式则用公式5 54 4代入。或有代入。或有5 5的可能落入这范围之外。这实际的可能落入这范围之外。这实际上也表明了再测时分数改变的可能范围。上也表明了再测时分数改变的可能范围。33v例例1 1,已知,已知WISC-RWISC-R的标准差为的标准差为1515,信度系数为,信度系数为0.950.95,对一名,对一名1212岁的儿童实施该测验后,岁的儿童实施该测验后,IQIQ为为110110,那么他的真分数在,那么他的真分数在9595的可靠度要求下,的可靠度要求下,变动范围应

21、是多大?变动范围应是多大?34=103.4 116.635v注意几点:注意几点:v(1 1)SESE对对真真分分数数做做的的是是区区间间估估计计,不不可可能能由由此此得得到到一一个个确确切切的的点点。这这就就是是说说,测测验验分分数数不不是是一一个个定定点点,而而是是具具有有一一定定的的分分布布范范围围。因因此此,两次测验分数之间存在差异是很正常的。两次测验分数之间存在差异是很正常的。v(2 2)置置信信水水平平确确定定后后,估估计计的的精精度度主主要要取取决决于于SESE,SESE越越小小,范范围围越越小小,估估计计就就越越精精确确,反反之也然。之也然。v(3 3)真分数不能等同于真正能力或

22、心理特质,)真分数不能等同于真正能力或心理特质,真分数中包括了系统误差。真分数中包括了系统误差。36v4 4、比较不同测验分数的差异、比较不同测验分数的差异测量标准误和测验信度在评价两个不同测验的分数是测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。分数的差别和同一被试在两个测验上的差别。37v我们可以用我们可以用“差异的标准误差异的标准误”来检验差异的显著性。来检验差异的显著性。v差异的标准误的公式为:差异的标准误的公式为:v (公式(公式55)v 为为差差异

23、异的的标标准准误误,S为为相相同同尺尺度度的的标标准准分分数数的的标标准准差差,Z分分数数为为1,T分分数数为为10。、分分别别为为两两个个测测验验的的信信度度系系数。数。v先先将将原原始始分分数数化化成成标标准准分分数数,然然后后将将两两个个标标准准分分数数的的差差异异与与1.96SEd(0.05显显著著性性水水平平)进进行行比比较较,如如果果其其绝绝对对值值大于此值,则差异显著,否则差异不显著。大于此值,则差异显著,否则差异不显著。38例题例题v某被试在韦氏成人智力测验中言语智商为102,操作智商为110。假设言语测验和操作测验的信度分别为0.87和0.88,则该被试的操作智商与言语智商有

24、显著性差异吗?v解答一:标准分数差异的范围(标准分数差异的范围(95%95%):):-1.967.5-1.967.51.967.51.967.5-14.7-14.714.714.7所以被试的操作智商与言语智商无显著性差异所以被试的操作智商与言语智商无显著性差异39解答二40v例,某校五年级进行了两次数学测验,小张第一例,某校五年级进行了两次数学测验,小张第一次考了次考了8585分,此次数学测验年级平均分是分,此次数学测验年级平均分是7777分,分,标准差是标准差是8 8分,此次测验的信度系数是分,此次测验的信度系数是0.840.84;第;第二次考了二次考了9595分,此次数学测验年级平均分是分

25、,此次数学测验年级平均分是8181分,分,标准差是标准差是1010分,此次测验的信度系数是分,此次测验的信度系数是0.910.91;问;问小张这两次数学测验的成绩是否有显著差异?小张这两次数学测验的成绩是否有显著差异?v 41五、影响信度的因素五、影响信度的因素v样本的影响样本的影响样本团体的异质性高,信度就高样本团体的异质性高,信度就高样本团体平均能力水平的影响样本团体平均能力水平的影响v测验长度的影响测验长度的影响可以通过增加测验长度的方式提高信度值。可以通过增加测验长度的方式提高信度值。v新增项目必须与试卷中的原有项目同质。新增项目必须与试卷中的原有项目同质。v新增项目的数量必须适度。新

26、增项目的数量必须适度。42v如由50题组成的儿童心理学测验,其信度系数为0.72,若再增加30个与原测验难度相近且同质性的题目,问长度增加后的测验系数是多少?=0.8043v例:有一个包括例:有一个包括1010个题目的测验,信度为个题目的测验,信度为0.500.50,若把测验增加到,若把测验增加到5050个题目,其信度将增加到个题目,其信度将增加到多少?多少?44v用用同同样样方方法法可可以以算算出出题题目目数数量量继继续续增增加加时时相相关关系数的值见下表系数的值见下表v表表 题目数量对相关系数的影响题目数量对相关系数的影响题题目目数量数量10105050100100200200300300

27、400400500500相相关关系数系数0.500.500.830.830.910.910.950.950.960.968 80.970.976 60.980.980 045v由表可以看出,增加题目数量可以提高信度,由表可以看出,增加题目数量可以提高信度,但并非多多益善。测验过长是得不偿失的:但并非多多益善。测验过长是得不偿失的:(1 1)测验过长,编制测验要浪费较多的时间)测验过长,编制测验要浪费较多的时间和精力,施测时浪费受测者的时间和精力,花和精力,施测时浪费受测者的时间和精力,花费大。(费大。(2 2)测验过长会引起被试的疲劳和反)测验过长会引起被试的疲劳和反感,从而降低可靠性。为了节

28、省时间和精力,感,从而降低可靠性。为了节省时间和精力,有时还需要将过长的测验适当缩短,而不使其有时还需要将过长的测验适当缩短,而不使其对信度有大的损害。对信度有大的损害。46v测验难度的影响测验难度的影响测验太难或太容易,则分数的范围会缩小,从而降低信测验太难或太容易,则分数的范围会缩小,从而降低信度。应该有一个适当的难度水平,以产生最广的分数分度。应该有一个适当的难度水平,以产生最广的分数分布。布。各类选择题的理想平均难度:五择一测题,各类选择题的理想平均难度:五择一测题,0.70;四择一;四择一测题,测题,0.74;三择一测题,;三择一测题,0.77;是非题,;是非题,0.85.47 10

29、0 75 50 25 0 1 2 3分數評量次數難度太小難度太大適當難度平均數(M):85 21 60標準差():3.9 4.2 12.4信度(KR21):0.43 0.46 0.90 分數之分散度和難度與信度之間的關係48v时间间隔的影响时间间隔的影响只对重测信度有影响只对重测信度有影响49v1.1.对对5 5个学生进行某种测验,得分分别为个学生进行某种测验,得分分别为1414、1111、1313、1616、1515。为了考察这个测验的信度,在。为了考察这个测验的信度,在2020天后用原量表再次测验,天后用原量表再次测验,得分分别为得分分别为1313、1212、1414、1515、1616。

30、试计算稳定性系数,并解。试计算稳定性系数,并解释之。释之。小测验502.2.有有1616人人参参加加的的一一项项测测验验,本本拟拟再再测测一一次次以以估估计计信信度度,但但因因学学生生毕毕业业离离校校,无无法法再再测测,现现把把各各人人奇奇数数题题得得分分和和偶偶数数题题得得分分分分列列后后,请估计测验结果的信度。请估计测验结果的信度。得分得分被试被试奇数题奇数题1817181514171713偶数题偶数题1817161613181714得分得分被试被试奇数题奇数题1313161415161316偶数题偶数题131314141416151751v3.43.4位教师评阅位教师评阅5 5份试卷,所

31、评等级如下表,问份试卷,所评等级如下表,问评分是否一致?评分是否一致?阅卷者阅卷者(K=4K=4)作文编号(作文编号(N N5 5)1 12 23 34 45 5张张2 25 54 43 31 1王王1 15 54 43 32 2李李1 14 45 53 32 2赵赵2 25 54 43 31 152v4.4.有有一一种种包包含含7 7个个论论文文式式题题目目的的测测验验,对对6 6个个应应试试者者施施行行,得得分分见见下下表表,试求该测验的信度。试求该测验的信度。题号题号被试被试1 12 23 34 45 56 61 16 611117 78 89 97 72 25 59 96 67 78

32、87 73 37 79 96 69 96 68 84 48 83 38 88 87 79 95 59 911117 77 79 99 96 69 911117 71010101010107 710109 9111112128 8101053第二节 效度ENGLISH 54一、效度的定义一、效度的定义v1、效度的通俗定义、效度的通俗定义效度指的是测量的正确性,即一个测验或量具能够测量效度指的是测量的正确性,即一个测验或量具能够测量出其所要测量的东西的程度。出其所要测量的东西的程度。效度所要回答的问题是:效度所要回答的问题是:v(1 1)一一个个测测验验测测量量了了什什么么特特性性?或或者者说说,

33、测测验验测测到到了了它所要测量的东西吗?它所要测量的东西吗?v(2 2)它对所要测量的特性测得有多准?)它对所要测量的特性测得有多准?55v2、效度的理论定义:一组测量中,与测量目标有关的、效度的理论定义:一组测量中,与测量目标有关的真实方差与总方差的比率。真实方差与总方差的比率。v效度除受随机误差影响外,还受系统误差的影响效度除受随机误差影响外,还受系统误差的影响。56二、效度的性质二、效度的性质v1 1、效度具有相对性、效度具有相对性相对某一目标的有效性相对某一目标的有效性v2 2、效度具有连续性、效度具有连续性只有程度上的不同,而没有只有程度上的不同,而没有“全有全有或或“全无全无”的区

34、别的区别反映有效性程度高低反映有效性程度高低57三、效度评估的三种方法三、效度评估的三种方法v(一)内容效度(一)内容效度v(二)结构效度(二)结构效度v(三)实证效度(三)实证效度58(一)内容效度(一)内容效度1、定义:指测验题目对欲测内容或行为取样的适当程度,、定义:指测验题目对欲测内容或行为取样的适当程度,从而确定测验是否是所欲测量的行为领域的代表性取样从而确定测验是否是所欲测量的行为领域的代表性取样2 2、一个测验要有内容效度必须具备两个条件:、一个测验要有内容效度必须具备两个条件:v(1 1)要有定义得完好的内容范围)要有定义得完好的内容范围 2020以内的加减法以内的加减法 中小

35、学生的心理健康的特点和表现。中小学生的心理健康的特点和表现。v(2 2)测验项目应是已界定的内容范围的代表性样本)测验项目应是已界定的内容范围的代表性样本 如果把所有的内容视为一个总体,那么测验项目可以视为一如果把所有的内容视为一个总体,那么测验项目可以视为一个样本,这个样本要具有代表性,这个样本能够代表总体的个样本,这个样本要具有代表性,这个样本能够代表总体的程度就是内容效度。程度就是内容效度。593、确定内容效度的方法、确定内容效度的方法(1)专家判断法:内容效度又称)专家判断法:内容效度又称“逻辑效度逻辑效度”v明确欲测内容的范围。包括知识范围和能力要求两明确欲测内容的范围。包括知识范围

36、和能力要求两个方面。个方面。v编制双向细目表,要求测验编制者将各个条目所欲编制双向细目表,要求测验编制者将各个条目所欲测的内容和技能要求列出,并将条目与第一步确定的测的内容和技能要求列出,并将条目与第一步确定的要求相结合。要求相结合。v制定评定量表来册来测量测验的效度。制定评定量表来册来测量测验的效度。60雙向細目表雙向細目表v表格左方表格左方表示教學表示教學所欲達成所欲達成的目標,的目標,上方表示上方表示教材內容教材內容範圍,並範圍,並逐一檢視逐一檢視每一試題每一試題以考驗整以考驗整份測驗之份測驗之內容效度內容效度題數題數內內容範圍容範圍行為目行為目標標細胞細胞能量代能量代謝謝光合作光合作用

37、用呼吸作呼吸作用用生物分生物分子子總題數總題數分數分數百分比百分比知識知識02110446.7理解理解201227711.7應用應用121116610.0分析分析112116610.0綜合綜合211217711.7評鑑評鑑01121558.3情意情意10111446.7技能技能10010223.3簡答題簡答題1111151931.7總題數總題數98912846分數分數111014151060百分比百分比18.316.723.325.016.710061v(2)统计分析法)统计分析法v克伦巴赫(克伦巴赫(Cronbach)提出内容效度的统计分析方法。)提出内容效度的统计分析方法。从同一个教学内容

38、总体中抽取两套独立的平行测验,用这两个平行从同一个教学内容总体中抽取两套独立的平行测验,用这两个平行测验来测同一批被试,求其相关。若相关低,则两个测验中至少有测验来测同一批被试,求其相关。若相关低,则两个测验中至少有一个缺乏内容效度;若相关高,则测验可能有较高的内容效度(除一个缺乏内容效度;若相关高,则测验可能有较高的内容效度(除非两个测验取样偏向同一个方面)。非两个测验取样偏向同一个方面)。v再测法再测法 在被试学习某种知识之前作一次测验,在学过该知识之后再作同样的在被试学习某种知识之前作一次测验,在学过该知识之后再作同样的测验。这时,如果后测成绩显著的优于前测成绩,则说明所测内容测验。这时

39、,如果后测成绩显著的优于前测成绩,则说明所测内容正是被试新近所学内容。正是被试新近所学内容。62(3)经验法)经验法v这种效度是通过实践来检验效度,如儿童发展量表是这种效度是通过实践来检验效度,如儿童发展量表是否有效,经过对不同年龄阶段的儿童进行调查,然后否有效,经过对不同年龄阶段的儿童进行调查,然后分析其结果。分析其结果。634、注意:内容效度的特性、注意:内容效度的特性v(1)内容效度与所有效度的性质一样,不是普遍适)内容效度与所有效度的性质一样,不是普遍适用的,而是根据具体情况分析得来。用的,而是根据具体情况分析得来。v(2 2)内内容容效效度度适适合合于于测测验验所所要要测测量量的的内

40、内容容总总体体能能够够明明确确界界定定的的情情况况。因因此此尤尤其其适适合合对对教教育育测测验验的的效效度度的的考考察察。内内容容效效度度对对各各种种用用于于人人员员选选拔拔和和安安置置的的职职业业测测验验也也是是适适用用的的。职职业业测测验验关关心心的的是是被被试试是是否否具具有有从从事事某某项项职职业业的的知知识识、技技能能等等,那那么么要要明明确确某某项项职职业业所所需需的的全全部部知知识识和和技技能能,再再对对这这些些知知识识和和技技能能进进行行取取样样,取取出一个有代表性的样本。出一个有代表性的样本。64v(3 3)内内容容效效度度对对能能力力倾倾向向测测验验和和人人格格测测验验不不

41、是是很很合合适适,因因为为它它们们要要测测量量的的往往往往是是较较抽抽象象的的特特质质,其其范范围围难难以以明明确确界界定定,没没有有明明确确的的内内容容范范围围,就就无无法法考考证证测测验验项项目是否具有代表性。目是否具有代表性。v(4 4)缺缺点点:缺缺乏乏理理想想的的数数量量指指标标,因因而而妨妨碍碍了了信信息息交交流和各测验的相互比较。流和各测验的相互比较。65 5、内容效度与表面效度、内容效度与表面效度v(1)内容效度经常与表面效度()内容效度经常与表面效度(face validity)混淆。)混淆。表面效度是由外行对测验作表面上的检查确定的,它表面效度是由外行对测验作表面上的检查确

42、定的,它不反映测验实际测量的东西,只是指测验表面上看来不反映测验实际测量的东西,只是指测验表面上看来好像是测量所要测的东西;而内容效度是由够资格的好像是测量所要测的东西;而内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价而建立判断者(专家)详尽地、系统地对测验作评价而建立的。的。66(2)测验对表面效度的考虑:)测验对表面效度的考虑:v表面效度不是效度的客观指标,不能保证测验的正确表面效度不是效度的客观指标,不能保证测验的正确性,但能对受测者的动机产生影响,因而也会影响到性,但能对受测者的动机产生影响,因而也会影响到测验的效度。测验的效度。如:如:“我偷过东西。我偷过东西。”v编制

43、测验时应根据编制测验的要求提高或降低表面效编制测验时应根据编制测验的要求提高或降低表面效度,如人格测验,表面效度应该低,使被试看不出来,度,如人格测验,表面效度应该低,使被试看不出来,从而让被试作出真实的反应,能力测验应该提高表面从而让被试作出真实的反应,能力测验应该提高表面效度,以激发被试的答题动机。效度,以激发被试的答题动机。67(二)构想效度(结构效度)(二)构想效度(结构效度)v1、定义:、定义:构想效度(构想效度(construct validityconstruct validity),又称构念效度、结构效度。构想:),又称构念效度、结构效度。构想:心理学理论中所涉及的假设性的概念

44、或特质,如智力、焦虑等,它心理学理论中所涉及的假设性的概念或特质,如智力、焦虑等,它们往往用某种操作定义来定义、可以用测验来测量。们往往用某种操作定义来定义、可以用测验来测量。构构想想效效度度是是指指测测验验分分数数能能够够说说明明某某一一理理论论概概念念或或特特质质的的程程度度。也也就就是是测测验验是是否否实实际际测测量量了了所所欲欲测测量量的的理理论论概概念念或或特特质质。考考察察构构想想效效度度的的宗宗旨旨是是要要回回答答下下面面一一些些问问题题:一一个个测测验验测测量量的的是是什什么么心心理理构构想想?对对这这个个构构想想测测得得有有多多好好?测测验验分分数数中中有有多多少少变变异异数

45、数是是来来自自测测验验所所欲欲测测量的构想。量的构想。68v2、实际操作步骤:、实际操作步骤:(1)先从某一建构的理论开始)先从某一建构的理论开始(2)提出各项心理功能或行为的基本假设)提出各项心理功能或行为的基本假设(3)据以设计和编制测验问卷)据以设计和编制测验问卷(4)以相关分析、因素分析等方法来检测结果是否符合)以相关分析、因素分析等方法来检测结果是否符合理论之见解理论之见解69v3、计算结构效度的方法、计算结构效度的方法(1)测验内方法)测验内方法v测验的内容效度测验的内容效度内容效度可以作为检验结构效度的一个方面。内容效度可以作为检验结构效度的一个方面。v分析被试解答测题时的反应过

46、程分析被试解答测题时的反应过程在在施施行行个个别别测测验验时时,要要求求被被试试边边想想边边说说,从从而而可可以以分分析析被被试试解解题题时时的的心心理理过过程程,以以核核实实测测验验是是否否真真正正测测到到了了所所要要测测量量的的心理构想。心理构想。如如,人人格格测测验验中中有有这这样样一一个个题题目目:“我我喜喜欢欢在在别别人人面面前前说说另另一一个个人人的的缺缺点点。”一一个个被被试试回回答答“否否”,问问他他是是怎怎么么考考虑虑的的,他他说说:“一一个个人人如如果果喜喜欢欢在在别别人人面面前前说说另另一一个个人人的的缺缺点点,那那他就是个小人。他就是个小人。70v考察测验的同质性考察测

47、验的同质性这这种种方方法法是是以以测测验验的的内内在在一一致致性性系系数数(如如K KR20R20,K KR21R21,以以及及 系系数数等等)为为指指标标,判判断断测测验验测测的的是是单单一一特特质质还还是是多多种种特质,从而确定测验构想效度的高低。特质,从而确定测验构想效度的高低。(2 2)测验间方法)测验间方法v相容效度(相容效度(congruent validitycongruent validity)计计算算受受测测者者在在新新测测验验上上的的分分数数与与原原有有的的已已知知效效度度较高的同类测验上的分数之间的相关较高的同类测验上的分数之间的相关。如,斯坦福比奈量表和韦氏量表是公认的

48、效度如,斯坦福比奈量表和韦氏量表是公认的效度较高的智力量表,后人编制的智力测验常计算与这较高的智力量表,后人编制的智力测验常计算与这些量表的测验分数的相关,以提供相容效度的证据。些量表的测验分数的相关,以提供相容效度的证据。71v区分效度(区分效度(discriminantdiscriminant validity validity)一一个个有有效效的的测测验验不不仅仅应应与与其其他他测测同同一一构构想想的的测测验验有有关关,而而且且还还必必须须与与测测量量不不同同构构想想的的测测验验无无关关。用用此种方法确定的效度称区分效度。此种方法确定的效度称区分效度。低低相相关关:可可以以证证明明新新测

49、测验验相相对对独独立立于于某某些些无无关关因因素,但并不保证它一定有效。素,但并不保证它一定有效。高相关:这个测验的效度是可疑的。高相关:这个测验的效度是可疑的。v因素效度(因素效度(factorial validity):):通过对一组测验进行因素分析,找到影响测验分通过对一组测验进行因素分析,找到影响测验分数的共同因素,每个测验在共同因素上的负荷量,数的共同因素,每个测验在共同因素上的负荷量,即每个测验与共同因素的相关,称作测验的因素效即每个测验与共同因素的相关,称作测验的因素效度。度。72(3)效标关联法)效标关联法测验分数与效标行为的一致性有助于证明测验确测验分数与效标行为的一致性有助

50、于证明测验确实测量了某种构想。实测量了某种构想。根据效标选取不同的被试,组成对照组,然后比根据效标选取不同的被试,组成对照组,然后比较两组被试的测验成绩,看测验分数能否将它们较两组被试的测验成绩,看测验分数能否将它们区分开来。区分开来。v如:两组被试,神经症被试和正常人如:两组被试,神经症被试和正常人v测验对效标的预测能力,也可以提供构想效度测验对效标的预测能力,也可以提供构想效度的证据。的证据。73(4)实验操作法)实验操作法通过控制某些实验条件,观察其对测验分数的影响,也通过控制某些实验条件,观察其对测验分数的影响,也可以获得构想效度的证据。可以获得构想效度的证据。v如,举行两场考试,使被

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁