《心理咨询师培训课件优秀PPT.ppt》由会员分享,可在线阅读,更多相关《心理咨询师培训课件优秀PPT.ppt(63页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章 心理测量学学问第一节第一节 概概 述述第一单元第一单元 测量与测量量表测量与测量量表教材(基础学问)教材(基础学问)P353355一、什么是测量一、什么是测量 测量就是依据确定的法则用数字对事物加以确测量就是依据确定的法则用数字对事物加以确定。定。定义中包括三个主要的元素:(定义中包括三个主要的元素:(1)事物)事物(2)数字)数字 (3)法则。)法则。二、测量要素二、测量要素 任何测量都应当具备两个要素:既参照点和单任何测量都应当具备两个要素:既参照点和单位。位。参照点有两种:参照点有两种:a.确定零点确定零点 b.相对零点相对零点 三、测量量表三、测量量表 命名量表命名量表 依次量
2、表依次量表 等距量表等距量表 等比量表等比量表其次单元 心理测验的基本概念 教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P355P355357357一、心理测验的定义一、心理测验的定义一、心理测验的定义一、心理测验的定义 所谓心理测验,就是依据心理学理论,运用确定所谓心理测验,就是依据心理学理论,运用确定所谓心理测验,就是依据心理学理论,运用确定所谓心理测验,就是依据心理学理论,运用确定的操作程序,通过视察人的少数有代表性的行为,的操作程序,通过视察人的少数有代表性的行为,的操作程序,通过视察人的少数有代表性的行为,的操作程序,通过视察人的少数有代表性的行为,对于贯穿在人的
3、全部行为活动中的心理特点做出推对于贯穿在人的全部行为活动中的心理特点做出推对于贯穿在人的全部行为活动中的心理特点做出推对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。论和数量化分析的一种科学手段。论和数量化分析的一种科学手段。论和数量化分析的一种科学手段。二、心理测验的性质二、心理测验的性质二、心理测验的性质二、心理测验的性质 (一)间接性(一)间接性(一)间接性(一)间接性 (二)相对性(二)相对性(二)相对性(二)相对性 (三)客观性(三)客观性(三)客观性(三)客观性第三单元 心理测验的分类(1)教材(基础学问)教材(基础学问)P357359 心理测验与心理测量
4、的区分:心理测验与心理测量的区分:心理测验是一种工具;心理测量是一个心理测验是一种工具;心理测量是一个过程过程 一、按测验功能分类:一、按测验功能分类:a.智力测验智力测验 b.特殊实力测验特殊实力测验 c.人格人格测验测验 二、按测验的材料分类:二、按测验的材料分类:a.文字测验文字测验 b.操作测验操作测验 三、按测验材料的严谨程度分类三、按测验材料的严谨程度分类:a.客观测验客观测验 b.投射测验投射测验投射测验投射测验1概念:投射法是指向被试者供应一些未经组织的刺激 情境,让他在不受限制的情境下,自由地表现出他的反应,分析反应的结果,便可推断出他的人格结构。2投射技术的种类(1)联想法
5、(2)构造法(3)表露法(4)完成法罗夏墨迹测验罗夏墨迹测验联想法联想法 主题统觉测验主题统觉测验构造法构造法 表露法表露法主要有:a.画人测验b.知觉运动测验(4)完成法逆境对话试验第三单元 心理测验的分类(2)四、按测验的方式分类:a.个别测验 b.团体测验 五、按测验的要求分类:最高行为测验成就测验、学绩测验 典型行为测验一般人格等。第四单元 如何看待心理测验教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P359P359360360一、错误的测验观一、错误的测验观一、错误的测验观一、错误的测验观 (一)测验万能论(一)测验万能论(一)测验万能论(一)测验万能论 (二)测
6、验无用论(二)测验无用论(二)测验无用论(二)测验无用论 二、正确的测验观二、正确的测验观二、正确的测验观二、正确的测验观 (一)心理测验是重要的心理学探讨方法之一、是决(一)心理测验是重要的心理学探讨方法之一、是决(一)心理测验是重要的心理学探讨方法之一、是决(一)心理测验是重要的心理学探讨方法之一、是决策的协助工具策的协助工具策的协助工具策的协助工具 (二)心理测验作为探讨方法和测量工具尚不完善。(二)心理测验作为探讨方法和测量工具尚不完善。(二)心理测验作为探讨方法和测量工具尚不完善。(二)心理测验作为探讨方法和测量工具尚不完善。第五单元 心理测验在心理询问中的应用教材(基础学问)教材(
7、基础学问)P360361 在我国目前状况下,心理门诊中运用较多在我国目前状况下,心理门诊中运用较多的大致有这样的大致有这样3类心理测验:类心理测验:一、智力测验一、智力测验 二、人格测验二、人格测验 三、心理评定量表三、心理评定量表第六单元 心理测验的发展史(1)教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P361P361364364一、科学心理测验的产生与发展一、科学心理测验的产生与发展一、科学心理测验的产生与发展一、科学心理测验的产生与发展 三个重要人物:三个重要人物:三个重要人物:三个重要人物:a.a.高尔登(高尔登(高尔登(高尔登(F.GaltonF.Galton)
8、,首先提倡科学心理测验的学者),首先提倡科学心理测验的学者),首先提倡科学心理测验的学者),首先提倡科学心理测验的学者 b.b.卡特尔(卡特尔(卡特尔(卡特尔(J.M.CattellJ.M.Cattell),卡特尔在心理杂志上发),卡特尔在心理杂志上发),卡特尔在心理杂志上发),卡特尔在心理杂志上发表表表表“心理测验与测量心理测验与测量心理测验与测量心理测验与测量”一文,这是心理测验第一次出现一文,这是心理测验第一次出现一文,这是心理测验第一次出现一文,这是心理测验第一次出现于心理学文献中于心理学文献中于心理学文献中于心理学文献中 c.c.比内(比内(比内(比内(A.BinetA.Binet)
9、,编写了世界上第一个正式的心理测),编写了世界上第一个正式的心理测),编写了世界上第一个正式的心理测),编写了世界上第一个正式的心理测验验验验第六单元 心理测验的发展史(2)20世纪心理测验的主要发展:1、操作测验的发展 2、团体智力测验的发展 3、实力倾向测验的发展 4、人格测验的发展 二、现代心理测验在我国的发展(参见本课程教学参考资料:专栏5-1中国古代的心理测验思想)其次节 测验的常模 其次节 测验的常模补充内容:常模参照分数与标准参照分数常模参照分数说明的测验:律师考试就是这样,即使大家考试都考得特殊好,也只要前面的百分之几。依据大家的成果。标准参照分数说明的测验:国家心理询问师的考
10、试,出了两份卷子:基础理论,操作技能,满分一百,及格六十。两科都满60,可以得到分数。门槛已经设好了。大家都能跳过门槛,就都能通过。很多人都没有通过,也就不能过去了。通过与不通过,参照一个事先设定好的标准,来说明分数。叫做标准参照分数说明。第一单元 常模团体(1)教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P365P365367367 一、常模团体的性质一、常模团体的性质一、常模团体的性质一、常模团体的性质 常模团体是由具有某种共同特征的人所组成的一个群体,或常模团体是由具有某种共同特征的人所组成的一个群体,或常模团体是由具有某种共同特征的人所组成的一个群体,或常模团体是由
11、具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。它用一个标准的、规范的分数表示者是该群体的一个样本。它用一个标准的、规范的分数表示者是该群体的一个样本。它用一个标准的、规范的分数表示者是该群体的一个样本。它用一个标准的、规范的分数表示出来,以供应比较的基础。出来,以供应比较的基础。出来,以供应比较的基础。出来,以供应比较的基础。任何一个测验都有很多可能的常模团体任何一个测验都有很多可能的常模团体任何一个测验都有很多可能的常模团体任何一个测验都有很多可能的常模团体 对测验编制者而言,常模的选择包括:确定一般总体、确定对测验编制者而言,常模的选择包括:确定一般总体、确定对测验编制者而
12、言,常模的选择包括:确定一般总体、确定对测验编制者而言,常模的选择包括:确定一般总体、确定目标总体、确定样本。目标总体、确定样本。目标总体、确定样本。目标总体、确定样本。对测验的运用者来说,要考虑的问题是,现有的常模团体哪对测验的运用者来说,要考虑的问题是,现有的常模团体哪对测验的运用者来说,要考虑的问题是,现有的常模团体哪对测验的运用者来说,要考虑的问题是,现有的常模团体哪一个最合适。一个最合适。一个最合适。一个最合适。第一单元 常模团体(2)二、常模团体的条件(一)群体的构成必需明确界定(二)常模团体必需是所测群体的代表性样本(三)样本的大小要适当 总体数目小,只有几十个人,则须要100%
13、的样本。假如总体数目大,相应的样本也大,一般最低不小于30或100个。全国性常模,一般应有20003000人为宜。(四)标准化样组是确定时空的产物第一单元 常模团体(3)三、取样的方法 简洁随机抽样 系统抽样 分组抽样 分层抽样 四、常模分数与说明 常模分数:常模分数就是施测常模样本被试后,将被试者的原始分数按确定规则转换出来的导出分数。常模:常模分数构成的分布,就是通常所说的常模(norm),它是说明心理测验分数的基础。其次单元 常模的类型(1)教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P368P368373373一、发展常模(年龄量表)一、发展常模(年龄量表)一、发展
14、常模(年龄量表)一、发展常模(年龄量表)(一)发展依次量表(一)发展依次量表(一)发展依次量表(一)发展依次量表 最早的一个范例是葛塞尔发展程序表最早的一个范例是葛塞尔发展程序表最早的一个范例是葛塞尔发展程序表最早的一个范例是葛塞尔发展程序表 (二)智力年龄(二)智力年龄(二)智力年龄(二)智力年龄 比内比内比内比内-西蒙量表中首先运用智力年龄的概念。西蒙量表中首先运用智力年龄的概念。西蒙量表中首先运用智力年龄的概念。西蒙量表中首先运用智力年龄的概念。计算方法:假计算方法:假计算方法:假计算方法:假如某儿童如某儿童如某儿童如某儿童6 6岁组的题目全部通过,岁组的题目全部通过,岁组的题目全部通过
15、,岁组的题目全部通过,7 7岁组通过岁组通过岁组通过岁组通过4 4题,题,题,题,8 8岁组通过岁组通过岁组通过岁组通过3 3题,题,题,题,9 9岁组通过岁组通过岁组通过岁组通过2 2题,其智龄为:题,其智龄为:题,其智龄为:题,其智龄为:6 6(岁)(岁)(岁)(岁)+4*2+4*2(月)(月)(月)(月)+3*2+3*2(月)(月)(月)(月)+2*2+2*2(月)(月)(月)(月)=6=6岁岁岁岁+18+18月月月月=7=7岁岁岁岁6 6个月。个月。个月。个月。(三)年级当量(三)年级当量(三)年级当量(三)年级当量 年级当量事实上就是年级量表,测验结果说明属哪一年级的水年级当量事实上
16、就是年级量表,测验结果说明属哪一年级的水年级当量事实上就是年级量表,测验结果说明属哪一年级的水年级当量事实上就是年级量表,测验结果说明属哪一年级的水平,在教化成就测验中最常用平,在教化成就测验中最常用平,在教化成就测验中最常用平,在教化成就测验中最常用其次单元 常模的类型(2)二、百分位常模(一)百分等级 指在常模样本中低于这个分数的人数的百分比。(二)百分点 也称百分位数。计算处于某一百分比例的人对应的测验分数是多少。(三)四分位数和特别位数 四分位数和特别位数只是百分位数的两个变式,其含义相像。其次单元 常模的类型(3)三、标准分数常模 标准分数是将原始分数与平均数的距离以标准差为单位表示
17、出来的量表。因为它的基本单位是标准差,所以叫标准分数。1.线性转换的标准分数 Z=(X-X)/SD Z=A+BZ 2.非线性转换的标准分数 当原始分数不是常态分布时,也可以使之常态化,这一转换过程就是非线性的。其次单元 常模的类型(3)四、智商及其意义 1.比率智商 IQ=MA/CA*100 2.离差智商 IQ=100+15Z=100+15(X-X)/SD 必需指出:从不同的测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。(参见本课程教学参考资料:专栏5-2几种导出分数间的相互关系)留意的问题发展常模换算及说明时须要留意的问题 只适合于所测特质随年龄发展变
18、更的状况,对成年人不适用,只适用于在典型环境下成长的儿童。一年的差异在不同年龄有不同的含义。百分位换算及说明时须要留意的问题 依次量表,缺少相等单位。靠近中心的原始分数差异扩大,而两端的差异缩减。不能比较和说明不同被试间分数差异的数量。标准分数换算及说明时须要留意的问题 计算非线性转换的标准分数时,特质的分数事实上应当是常态分布。标准差不同,其分数的意义不同。第三单元 常模分数的表示方法教材(基础学问)教材(基础学问)P373375一、转换表法一、转换表法 最简洁而且最基本的表示常模的方法就是最简洁而且最基本的表示常模的方法就是转换表,有时也叫常模表。转换表,有时也叫常模表。二、剖面图法二、剖
19、面图法 剖面图就是将测验分数的转换关系用图形剖面图就是将测验分数的转换关系用图形表示出来。表示出来。第三节 测验的信度 第一单元 信度的概念教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P376P376377377一、信度的定义一、信度的定义一、信度的定义一、信度的定义 信度是指同一被试者在不同时间内用同一测验信度是指同一被试者在不同时间内用同一测验信度是指同一被试者在不同时间内用同一测验信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果(或用另一套相等的测验)重复测量,所得结果(或用另一套相等的测验)重复测量,所得结果(或用另一套相等的测验)
20、重复测量,所得结果的一样程度。的一样程度。的一样程度。的一样程度。二、信度的指标二、信度的指标二、信度的指标二、信度的指标 1.1.信度系数与信度指数信度系数与信度指数信度系数与信度指数信度系数与信度指数 大部分状况下,信度是以信度系数为指标,它大部分状况下,信度是以信度系数为指标,它大部分状况下,信度是以信度系数为指标,它大部分状况下,信度是以信度系数为指标,它是一种相关系数。是一种相关系数。是一种相关系数。是一种相关系数。2.2.测量标准误测量标准误测量标准误测量标准误其次单元 信度评估的方法(1)教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P377P377378378
21、一、重测信度一、重测信度一、重测信度一、重测信度 又称稳定性系数。它的计算方法是接受重测法,又称稳定性系数。它的计算方法是接受重测法,又称稳定性系数。它的计算方法是接受重测法,又称稳定性系数。它的计算方法是接受重测法,即运用同一测验,在同样条件下对同一组被试者前即运用同一测验,在同样条件下对同一组被试者前即运用同一测验,在同样条件下对同一组被试者前即运用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。后施测两次测验,求两次得分间的相关系数。后施测两次测验,求两次得分间的相关系数。后施测两次测验,求两次得分间的相关系数。二、复本信度二、复本信度二、复本信度二、复本信
22、度 又称等值性系数。它是以两个等值但题目不同的又称等值性系数。它是以两个等值但题目不同的又称等值性系数。它是以两个等值但题目不同的又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在测验(复本)来测量同一群体,然后求得被试者在测验(复本)来测量同一群体,然后求得被试者在测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。两个测验上得分的相关系数。两个测验上得分的相关系数。两个测验上得分的相关系数。三、内部一样性信度三、内部一样性信度三、内部一样性信度三、内部一样性信度 a.a.分半信度分半信度分半信度分半信度 b.b.同质性信度同质性信度同质
23、性信度同质性信度四、评分者信度四、评分者信度四、评分者信度四、评分者信度其次单元 信度评估的方法(2)一、重测信度 又称稳定性系数。它的计算方法是接受重测法,即运用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。一般是两周到四周较宜,间隔时间最好不超过六个月。二、复本信度 又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。复本信度也要考虑两个复本实施的时间间隔。假如两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺有时间的影响。假如两个复本的施测相隔一段时间,则称稳定与等值系数。
24、其次单元 信度评估的方法(3)三、内部一样性信度 a.分半信度:分半信度指接受分半法估计所得的信度系数。修正公式是斯皮尔曼-布朗公式:b.同质性信度:同质性主要代表测验内部全部题目间的一样性。几个计算同质性信度的公式如下:1库德-理查逊公式 2克伦巴赫系数 四、评分者信度 用于测量不同评分者之间所产生的误差。第三单元 信度与测验分数的说明(1)教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P378P378380380一、说明真实分数与实得分数的相关一、说明真实分数与实得分数的相关一、说明真实分数与实得分数的相关一、说明真实分数与实得分数的相关 信度系数可以说明为总的方差中有多
25、少比例是信度系数可以说明为总的方差中有多少比例是信度系数可以说明为总的方差中有多少比例是信度系数可以说明为总的方差中有多少比例是由真实分数的方差确定的,也就是测验的总变异中由真实分数的方差确定的,也就是测验的总变异中由真实分数的方差确定的,也就是测验的总变异中由真实分数的方差确定的,也就是测验的总变异中真分数造成的变异占百分之几。真分数造成的变异占百分之几。真分数造成的变异占百分之几。真分数造成的变异占百分之几。二、确定信度可以接受的水平二、确定信度可以接受的水平二、确定信度可以接受的水平二、确定信度可以接受的水平 当当当当rxxrxx.70.70时,测验不能用于对个人作出评价时,测验不能用于
26、对个人作出评价时,测验不能用于对个人作出评价时,测验不能用于对个人作出评价或预料,而且不能做团体比较;当或预料,而且不能做团体比较;当或预料,而且不能做团体比较;当或预料,而且不能做团体比较;当.70 rxx.85.70 rxx.85时,时,时,时,可用于团体比较;当可用于团体比较;当可用于团体比较;当可用于团体比较;当rxx .85rxx .85时,才能用来鉴别或时,才能用来鉴别或时,才能用来鉴别或时,才能用来鉴别或预料个人成就或作为。预料个人成就或作为。预料个人成就或作为。预料个人成就或作为。第三单元 信度与测验分数的说明(2)三、说明个人分数的意义 作用:其一是估计真实分数的范围;其二是
27、了解实得分数再测时可能的变更情形。例:在一个智力测验中,某个被试的iQ为100,这是否反映了他的真实水平?假如再测一次,他的分数将变更多少?X1.96SEXTX+1.96SE 已知该智力测验的标准差为15,信度系数为.84,则其IQ的测量标准误和可能范围为:SE=IQ=1001.96610011.7688112 第三单元 信度与测验分数的说明(3)四、比较不同测验分数的差异 例;某被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88。问其操作智商是否显著高于言语智商呢?首先
28、计算出差异分数的标准误:在统计上,常常要求两个分数的差异程度达到0.05的显著水平,才能承认不是误差的影响。因此,将差异标准误(7.5)乘以1.96,结果为14.7,这表明个体在韦氏测验两半得分的差异高于大约15分,才能达到0.05显著水平。上述被试的差异分数110-102=8是不显著的。第三单元 信度与测验分数的说明(4)三、说明个人分数的意义 一般接受95%的或然水平,其置信区间为:X1.96SEXTX+1.96SE 四、比较不同测验分数的差异第四单元 影响信度的因素教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P380P380382382一、样本特征一、样本特征一、样本
29、特征一、样本特征 (一)样本团体异质性的影响(一)样本团体异质性的影响(一)样本团体异质性的影响(一)样本团体异质性的影响 (二)样本团体平均实力水平的影响(二)样本团体平均实力水平的影响(二)样本团体平均实力水平的影响(二)样本团体平均实力水平的影响 二、测验长度二、测验长度二、测验长度二、测验长度 (一)测验越长测题取样或内容取样越有代表性(一)测验越长测题取样或内容取样越有代表性(一)测验越长测题取样或内容取样越有代表性(一)测验越长测题取样或内容取样越有代表性 (二)测验越长被试的揣测因素影响就越小。(二)测验越长被试的揣测因素影响就越小。(二)测验越长被试的揣测因素影响就越小。(二)
30、测验越长被试的揣测因素影响就越小。三、测验难度三、测验难度三、测验难度三、测验难度 洛德(洛德(洛德(洛德(LordLord)提出在学绩测验中,为了保证其牢靠性,)提出在学绩测验中,为了保证其牢靠性,)提出在学绩测验中,为了保证其牢靠性,)提出在学绩测验中,为了保证其牢靠性,各类选择题的志向平均难度为:五择一测题,各类选择题的志向平均难度为:五择一测题,各类选择题的志向平均难度为:五择一测题,各类选择题的志向平均难度为:五择一测题,0.700.70;四择;四择;四择;四择一测题,一测题,一测题,一测题,0.740.74;三择一测题,;三择一测题,;三择一测题,;三择一测题,0.770.77;是
31、非题,;是非题,;是非题,;是非题,0.850.85。四、时间间隔四、时间间隔四、时间间隔四、时间间隔 两次测验相隔时间越短,其信度系数越大(参见本课程两次测验相隔时间越短,其信度系数越大(参见本课程两次测验相隔时间越短,其信度系数越大(参见本课程两次测验相隔时间越短,其信度系数越大(参见本课程教学参考资料:专栏教学参考资料:专栏教学参考资料:专栏教学参考资料:专栏5-35-3信度的特殊问题)信度的特殊问题)信度的特殊问题)信度的特殊问题)留意事项斯皮尔曼-布朗公式为校正分半信度的阅历公式,它的假设是两半测验分数的变异数相等。当假设不成立时,可以接受弗朗那根(Flanagan)公式或卢伦(ku
32、lon)公式之一,干脆求得测验的信度系数。对于一些困难的、异质的心理学变量,接受单一的同质性测验是不行的,因而常常接受若干个相对异质的分测验。第四节 测验的效度第一单元 效度的概念教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P383P383384384一、效度的定义一、效度的定义一、效度的定义一、效度的定义 在心理测验中,效度是指所测量的与所要测量的心理特在心理测验中,效度是指所测量的与所要测量的心理特在心理测验中,效度是指所测量的与所要测量的心理特在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简洁地说是指一个心理测验的精点之间符合的程度,或者简洁地
33、说是指一个心理测验的精点之间符合的程度,或者简洁地说是指一个心理测验的精点之间符合的程度,或者简洁地说是指一个心理测验的精确性。确性。确性。确性。二、效度的性质二、效度的性质二、效度的性质二、效度的性质 1.1.效度具有相对性效度具有相对性效度具有相对性效度具有相对性 任何测验的效度是对确定的目标来说的,或者说测验只任何测验的效度是对确定的目标来说的,或者说测验只任何测验的效度是对确定的目标来说的,或者说测验只任何测验的效度是对确定的目标来说的,或者说测验只有用于与测验目标一样的目的和场合才会有效。有用于与测验目标一样的目的和场合才会有效。有用于与测验目标一样的目的和场合才会有效。有用于与测验
34、目标一样的目的和场合才会有效。2.2.效度具有连续性效度具有连续性效度具有连续性效度具有连续性 测验效度通常用相关系数表示,它只有程度上的不同,测验效度通常用相关系数表示,它只有程度上的不同,测验效度通常用相关系数表示,它只有程度上的不同,测验效度通常用相关系数表示,它只有程度上的不同,而没有而没有而没有而没有“全有全有全有全有”或或或或“全无全无全无全无”的区分。效度是针对测验结果的区分。效度是针对测验结果的区分。效度是针对测验结果的区分。效度是针对测验结果的。(参见本课程教学参考资料:专栏的。(参见本课程教学参考资料:专栏的。(参见本课程教学参考资料:专栏的。(参见本课程教学参考资料:专栏
35、5-45-4信度和效度的信度和效度的信度和效度的信度和效度的关系)关系)关系)关系)其次单元 效度评估的方法(1)教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P384P384390390一、内容效度(一、内容效度(一、内容效度(一、内容效度(content-related validitycontent-related validity)什么是内容效度什么是内容效度什么是内容效度什么是内容效度 内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定内
36、容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。测验是否是所欲测量的行为领域的代表性取样。测验是否是所欲测量的行为领域的代表性取样。测验是否是所欲测量的行为领域的代表性取样。内容效度的评估方法内容效度的评估方法内容效度的评估方法内容效度的评估方法 1 1专家推断法专家推断法专家推断法专家推断法 2 2统计分析法统计分析法统计分析法统计分析法 3 3阅历推想法阅历推想法阅历推想法阅历推想法 内容效度的特性内容效度的特性内容效度的特性内容效度的特性 内容效度常常与表面效度(内容效度常常与表面效度(内容效度常常与表面效度(内容效度常常与表面效度(f
37、ace validityface validity)混淆。表面效度是由外行)混淆。表面效度是由外行)混淆。表面效度是由外行)混淆。表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来似乎是测量所要测的东西;内容效度是由够资格的指测验表面上看来似乎是测量所要测的东西;内容效度是由够资格的指测验表面上看来似乎是测量所要测的东西;内容效度是由够资格的指测验表面上看来似乎是测量所要测的
38、东西;内容效度是由够资格的推断者(专家)详尽地、系统地对测验作评价而建立的。推断者(专家)详尽地、系统地对测验作评价而建立的。推断者(专家)详尽地、系统地对测验作评价而建立的。推断者(专家)详尽地、系统地对测验作评价而建立的。其次单元 效度评估的方法(2)二、构想效度(二、构想效度(construct-related validity)什么是构想效度什么是构想效度 指测验能够测量到理论上的构想或特质的程度,即测验的指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证明或说明某一理论的假设、术语或构想,说明结果是否能证明或说明某一理论的假设、术语或构想,说明的程度如何。的程度如何。构想
39、效度的估计方法构想效度的估计方法 1对测验本身的分析对测验本身的分析 2测验间的相互比较:相容效度、区分效度、因素分析法测验间的相互比较:相容效度、区分效度、因素分析法 3效标效度的探讨证明效标效度的探讨证明 4试验法和视察法证明试验法和视察法证明 其次单元 效度评估的方法(3)三、效标效度(criterion-related validity)什么是效标效度 效标效度又称实证效度,反映的是测验预料个体在某种情境下行为表现的有效性程度。依据效标资料是否与测验分数同时获得,又可分为同时效度和预料效度两类。一个好的效标必需具备以下条件:效标必需能最有效地反映测验的目标,即效标测量本身必需有效;效标
40、必需具有较高的信度,稳定牢靠,不随时间等因素而变更;效标可以客观地加以测量,可用数据或等级来表示;效标测量的方法简洁,省时省力,经济好用。其次单元 效度评估的方法(4)效标效度的评估方法 1相关法:相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。2区分法:区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。3命中率法 命中率法是当测验用来做取舍的依据时,用其正确确定的比例作为效度指标的一种方法。第三单元 效度的功能教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P390P390391391一、预料误差一、预料误差一、预料
41、误差一、预料误差 效度系数的实际意义常常以确定性系数来表示,意旨相效度系数的实际意义常常以确定性系数来表示,意旨相效度系数的实际意义常常以确定性系数来表示,意旨相效度系数的实际意义常常以确定性系数来表示,意旨相关系数的平方,它表示测验正确预料或说明的效标的方差关系数的平方,它表示测验正确预料或说明的效标的方差关系数的平方,它表示测验正确预料或说明的效标的方差关系数的平方,它表示测验正确预料或说明的效标的方差占总方差的比例。占总方差的比例。占总方差的比例。占总方差的比例。二、预料效标分数二、预料效标分数二、预料效标分数二、预料效标分数 假如假如假如假如X X与与与与Y Y两变量呈直线相关,只要确
42、定出二者间的回来两变量呈直线相关,只要确定出二者间的回来两变量呈直线相关,只要确定出二者间的回来两变量呈直线相关,只要确定出二者间的回来方程,就可以从一个变量推估出另一个变量。方程,就可以从一个变量推估出另一个变量。方程,就可以从一个变量推估出另一个变量。方程,就可以从一个变量推估出另一个变量。三、预料效率指数三、预料效率指数三、预料效率指数三、预料效率指数 E=100 E=100(1-K1-K)第四单元 影响效度的因素教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P391P391393393一、测验本身的因素一、测验本身的因素一、测验本身的因素一、测验本身的因素 测验取材的
43、代表性、测验长度、试题类型、难度、区测验取材的代表性、测验长度、试题类型、难度、区测验取材的代表性、测验长度、试题类型、难度、区测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式等都会影响效度。分度以及编排方式等都会影响效度。分度以及编排方式等都会影响效度。分度以及编排方式等都会影响效度。二、测验实施中的干扰因素二、测验实施中的干扰因素二、测验实施中的干扰因素二、测验实施中的干扰因素 主试的影响因素主试的影响因素主试的影响因素主试的影响因素 被试的影响因素被试的影响因素被试的影响因素被试的影响因素 三、样本团体的性质三、样本团体的性质三、样本团体的性质三、样本团体的性质 样本团体的
44、异质性样本团体的异质性样本团体的异质性样本团体的异质性 干涉变量干涉变量干涉变量干涉变量 四、效标的性质四、效标的性质四、效标的性质四、效标的性质第五节项目分析 第一单元 项目的难度教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P394P394396396一、定义一、定义一、定义一、定义 难度(难度(难度(难度(difficultydifficulty),顾名思义,是指项目的难易程度。),顾名思义,是指项目的难易程度。),顾名思义,是指项目的难易程度。),顾名思义,是指项目的难易程度。二、计算方法二、计算方法二、计算方法二、计算方法 二分法记分的项目二分法记分的项目二分法记分
45、的项目二分法记分的项目 非二分记分的项目非二分记分的项目非二分记分的项目非二分记分的项目 三、难度水平的确定三、难度水平的确定三、难度水平的确定三、难度水平的确定 项目的难度项目的难度项目的难度项目的难度:P:P值越接近于值越接近于值越接近于值越接近于0.500.50,区分力越高。,区分力越高。,区分力越高。,区分力越高。测验的难度测验的难度测验的难度测验的难度其次单元 项目的区分度教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P396P396398398一、定义一、定义一、定义一、定义 项目区分度(项目区分度(项目区分度(项目区分度(item discriminationi
46、tem discrimination),也叫鉴也叫鉴也叫鉴也叫鉴别力,是指测验项目对被试的心理特性的区分实力。别力,是指测验项目对被试的心理特性的区分实力。别力,是指测验项目对被试的心理特性的区分实力。别力,是指测验项目对被试的心理特性的区分实力。二、计算方法二、计算方法二、计算方法二、计算方法 鉴别指数鉴别指数鉴别指数鉴别指数 相关法相关法相关法相关法 1 1点二列相关点二列相关点二列相关点二列相关 2 2二列相关二列相关二列相关二列相关 3 3相关法相关法相关法相关法 三、区分度与难度的关系三、区分度与难度的关系三、区分度与难度的关系三、区分度与难度的关系第六节第六节 测验编制测验编制的一
47、般程序的一般程序 第一单元 测验的目标分析教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P399P399401401一、测验的对象一、测验的对象一、测验的对象一、测验的对象二、测验的用途二、测验的用途二、测验的用途二、测验的用途 显示性测验显示性测验显示性测验显示性测验:指测验题目和所要测量的心理特征指测验题目和所要测量的心理特征指测验题目和所要测量的心理特征指测验题目和所要测量的心理特征相像的测验。相像的测验。相像的测验。相像的测验。预料性测验预料性测验预料性测验预料性测验:指预料一些没被测量的行为的测验。指预料一些没被测量的行为的测验。指预料一些没被测量的行为的测验。指预
48、料一些没被测量的行为的测验。三、测验的目标三、测验的目标三、测验的目标三、测验的目标 工作分析工作分析工作分析工作分析 对特定概念下定义对特定概念下定义对特定概念下定义对特定概念下定义 确定测验的具体内容确定测验的具体内容确定测验的具体内容确定测验的具体内容其次单元 测题的编写(1)教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P401P401404404一、搜集资料一、搜集资料一、搜集资料一、搜集资料 已出版的标准测验已出版的标准测验已出版的标准测验已出版的标准测验 理论和专家的阅历理论和专家的阅历理论和专家的阅历理论和专家的阅历 临床视察和记录临床视察和记录临床视察和记录
49、临床视察和记录 二、命题原则二、命题原则二、命题原则二、命题原则 内容方面内容方面内容方面内容方面 文字方面文字方面文字方面文字方面 理解方面理解方面理解方面理解方面 社会敏感性方面社会敏感性方面社会敏感性方面社会敏感性方面 其次单元 测题的编写(2)三、编制要领1.选择题(留意事项)a题干所提的问题必需明确,尽量运用简洁而且明晰的词语。b选项切忌冗长 c.每题只给一个正确答案,其它属诱答。d.各选项长度应相等 e避开题干用词与选项用词一样 f选项最好用同一形式 2.是非题 是非题又叫正误题,是指出一个论点要被试推断是否正确,或是从是非两个答案做出选择,因此可以把是非题看作是两个备选答案的选择
50、题。其次单元 测题的编写(3)3.简答题 在客观测验试题中,只有简答题是供应型题目,它要求被试用一个正确的词或句子来完成或填充一个未完成句子的空白,或者是供应一个正确的答案。有时将前者称之为填充题,后者称之为简答题。4.操作题 操作题是介于一般认知结果的纸笔测验和在将来真实情境的实际活动之间的测验,是让被试实际操作,如画图、走迷津、拼配物体等,可作为纸笔测验题的补充。第三单元 测验的编排和组织(1)教材(基础学问)教材(基础学问)教材(基础学问)教材(基础学问)P404P404408408一、合成测验一、合成测验一、合成测验一、合成测验 选择与审定试题选择与审定试题选择与审定试题选择与审定试题