《心理测量学知识点.doc》由会员分享,可在线阅读,更多相关《心理测量学知识点.doc(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流心理测量学知识点.精品文档.心理测量学知识点什么是测量(一)简单的说,测量就是依据一定的法则用数字对事物加以确定。(二)测量定义的三个主要元素:1) 法则测量依据的规则和方法2) 数字某一事物或事务某一属性的量化3) 事物测量的对象(三)测量的“数字”具有自然数的特点,具有:1) 区分性;2) 序列型或等级性;3) 等距性;4) 可加性。数的这种逻辑性,是运算的基础。测量的两个要素任何测量都应该具备的两个要素是:1) 参照点;2) 单位。(一)参照点:1)参照点就是确定事物的量时,计算的起点;参照点不同,测量的结果便无法相互比较。2)参照点有
2、两种:绝对零点意义是“无”,表示什么都测不到,是理想的参照点。相对零点人为定的参照点。3)参照绝对零点可加减乘除,参照相对零点只能加减(心理测量参照相对零点)。(二)单位:1)好的单位是测量的基本要求,没有单位就无法进行测量。2)好的单位必须具备两个条件确定的意义;相同的价值相邻两个单位点之间的差别总是相等的。3)一般来说,心里测量的单位不够完善,既无统一的单位,也不符合等距的要求。测量量表测量的本质是在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。根据量表的精确程度,斯蒂文斯(S.S.Stevens)将测量从低级到高级分成4种水平:1) 命名量表;2) 顺序量表;3
3、) 等距量表;4) 等比量表。(一)命名量表:是测量水平最低的量表形式,只是用数字来代表事物或把事务归类。用1代表男,用2代表女等等,这样的量表通常叫命名量表。(二)顺序量表:比命名量表水平高,数字不仅指明类别,同时指明类别的大小或属性程度。我们通常将学生的考试结果按名次排队,这些名次属于顺序变量(三)等距量表:比顺序量表进一步,有相等的单位,其数值可以相互做加减运算;但没有绝对零点,因此不能做乘除运算。(四)等比量表:最高水平量表,有相等单位又有绝对零点,所得的数字可以做加减乘除运算。一般说来,心理测量是在顺序量表上进行的,主要用于分等级和排序。*斯蒂文斯的4种量表(水平从低到高)水平量表属
4、 性可进行大小关系相等单位绝对零点1命名量表无无无标记和分类,不能排序,也不能做加减乘除2顺序量表有无无分等级和排序3等距量表有有无加减运算4等比量表有有有加减乘除运算心理测量的定义心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。常模的功用,是给测验分数提供比较的标准,即提供某一标准化样组在某一测验上的平均分数和分数的分布情况。常模是否可靠,关键是看有没有一个有足够数量的有代表性的受测者样本。心理测量的性质心理测验具有独特的性质:1) 间接性;2) 相对性;3) 客观性。(标准化)一、按
5、测验的功能分类1) 智力测验;2) 特殊能力测验;3) 人格测验。二、按测验材料的性质分类1) 文字测验;2) 操作测验。三、按测验材料的严谨程度分类1) 客观测验;2) 投射测验。四、按测验的方式分类1) 个别测验;2) 团体测验。团体测验始于第一次世界大战,陆军甲种和乙种测验是第一个团体测验。五、按测验的要求分类1) 最高作为测验;(最好的回答,智力测验)2) 典型行为测验。(按通常习惯回答,各种人格测验)*心理测验的分类分类原则测验种类测验实例按功能分类智力测验比内-西蒙智力测验斯坦福一比内智力量表韦氏儿童成人智力量表特殊能力测验升学、职业指导,特殊工种人员筛选。临床应用较少人格测验MM
6、PI、16PF、EPQ、罗夏测验、主题统觉测验(TAT)按材料性质分类文字测验操作测验MMPI、EPQ、16PF、韦氏智力量表中的言语量表罗夏、TAT、瑞文测验、韦氏智力量表中的操作量表按材料严谨程度分类客观测验投射测验绝大多数心理测验均属此类罗夏、主题统觉、自由联想、句子完成按方式分类个别测验比内-西蒙智力量表;韦氏智力量表; 团体测验陆军甲种乙种测验按要求分类最高作为测验典型行为测验智力测验、成就测验均属最高作为测验各种人格测验均属典型行为测验注意:个别测验不能团体实施,团体测验可个别实施,如MMPI、EPQ、16PF等。错误的测验观1) 测验万能论;2) 测验无用论;3) 心理测验即智力
7、测验。正确的测验观1) 心理测验是重要的心理学研究方法之一,是决策的辅助工具;2) 心理测验作为研究方法和测量工具尚不完善。心理测验在心理咨询中的应用:(一)智力测验1)中国比内量表2)韦氏成人智力量表 WAIS-RC;2)韦氏儿童智力量表C-WISC、WISC-CR3)韦氏幼儿智力量表C-WYCSI4)瑞文测验:标准型 SPM、联合型 CRT(二)人格测验1)艾森克人格问卷 EPQ2)卡特尔16人格因素问卷16PF3)明尼苏达多相人格测验 MMPI(三)心理评定量表1)精神病评定量表2)躁狂评定量表3)抑郁量表4)焦虑量表5)恐怖量表记忆:W 韦科斯勒、韦氏S 量表;标准I 智力;调查表A
8、成人C 儿童;中国YC幼儿R 修订版T 测验R 瑞文Q 问卷P 人格科学心理测验的产生与发展1)首倡:1880s 英国生物学家和心理学家 高尔登(F.Galton)2)巨大贡献:1890s 美国心理学家卡特尔(J.M.Cattell)3)世界上第一个正式的心理测验: 1900比内(A.Binet)4) 20世纪以后,心理测验在如下几方面取得了长足发展a) 操作测验;b) 团体智力测验;c) 能力倾向测验;d) 人格测验。常模团体的性质常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。用一个标准的、规范的分数表示出来,以提供比较的基础。常模团体的选择一般包括:1) 确定一
9、般总体;(大学生)2) 确定目标总体;(计划实施各大学的大学生)3) 确定样本。(有代表性的大学生)常模团体的条件(一)群体的构成必须明确界定(二)常模团体必须是所测群体的代表性样本 一般采用随机取样或分层取样,有时可结合两种策略使用。(三)样本大小要适当1)实际工作中,样本量大小适当应从如下几方面考虑:a. 经济;b. 实用;c. 减少误差。2)常模样本量的大小,一般最低不小于30或 100。全国性常模,样本量一般要在20003000之间3)样本大小适当的关键是样本要有代表性。(四)标准化样组是一定时空的产物1)时空改变,标准化杨祖就失去标准化的意义,必须订修订。2)注意选择较为新近的常模取
10、样的方法取样是指从目标人群中选择有代表性的样本抽样的方法一般有1) 简单随机抽样;(随机表)2) 系统抽样;(总体N,选择1/K,第K个人)3) 分组抽样;4) 分层抽样。(先按某种变量分层,再随即取样,最后组合)a. 分层比例取样b. 分层非比例取样系统抽样法的关键是计算组距。常模分数与常模(一)常模常模是一种供比较的标准量数,由标准化样本测试结果计算而来,它是心理测验时用于比较和解释测验结果的参照分数标准。按照样本的大小和来源,通常有全国常模、区域常模和特殊常模;根据具体应用标准和分数特征,则有百分位常模和标准分常模等。(二)常模分数常模分数就是施测常模样本受测后,将受测者的原始分数按一定
11、规则转换出来的导出分数。发展常模发展常模,也称年龄量表。在年龄量表中,个人的分数指出了他的行为在按正常途径发展方面处于什么样的发展水平。(一)发展顺序量表最直观的发展常摸是发展顺序量表,发展顺序量表可以告诉人们某儿童的发育与其年龄相比:1) 正常;2) 超前;3) 滞后。最早的一个发展顺序量表的范例是葛塞尔发展程序表发展量表中的年龄量表最基本的假设是所测量的特质随年龄有系统地改变。所以,它的基本要素是:1) 一组可以区分不同年龄组的题目;2) 一个常模团体;3) 常模表。(二)智力年龄比内-西蒙量表中首先使用智力年龄的概念。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分
12、数叫智力年龄,简称智龄在吴天敏修订的比内一西蒙量表中,某儿童通过了 4岁组的全部题目,5岁组通过3题,6岁组通过2题,7岁组通过1题,其智龄为5岁。用陆志韦修订的比内-西蒙量表做测验,某儿童6岁组题目全部通过,7岁组通过4题,8岁组通过3题,9岁组通过2题,其智龄为7岁6 个月。(较高年龄水平答对每题得智龄2个月)(三)年级当量年级当量实际上就是年级量表,测验结果说明属哪一年级水平,二、百分位常模百分位常模包括:1) 百分等级;2) 百分点;3) 四分位数;4) 十分位数。(一)百分等级一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比,即个体在常模团体中所处的位置。(低低低)王红
13、在 30名同学中物理成绩是 80分,排列第五名,则其百分等级为85。(二)百分点处于某一百分等级的人对应的测验分数就叫百分点或百分位数高考的最高分为650,其百分等级为100,最低分为105分,百分等级为1,要录取20的学生进入大学,百分等级为80的百分位数540。(三)四分位数和十分位数四分位数、十分位数是百分位数的两个变式。四分位数是将量表分成四等份,相当于百分等级的25、50和75对应的三个百分数分成的四段十分位数110为第一段,91%100%为第十段三、标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。(一)线性转换的
14、标准分数Z(X)/SD式中,X为任一原始分数,为样本平均数。SD为样本标准差,ZABZ式中Z为转换后的标准分数,A、B为根据需要指定的常数。加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小从而去掉小数点。常见的标准分数有T分数、标准九分、标准十分、标准二十分、离差智商等。T分数是以 50 为平均数(即加上一个常数 50),以 10 为标准差(乘以一个常数 10)来表示的。标准九分是以5为平均数、以2为标准差的一个分数量表,最早时广泛应用于美国空军和某些教学情境中的分级。标准十分是以5.5为平均数,以1.5为标准差。标准二十分是以10为平均数,以3为标准差。使用最广、影响最大的离差智商是
15、以100为平均数,一般是以15为标 准差。(二)非线性转换的标准分数当原始分数不是常态分布时,也可以使之常态化,这一转换过程是非线性的。常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差。z分数(区别于线性转换的z分数)T分数:当以50为平均数,以10为标准差来表示时,通常叫T分数标准九分是另一较知名的标准分数系统,其量表是个9级的分数量表。它是以5为平均数,以2为标准差的一个量表标准十分,平均数为5.5,标准差为1.5标准二十分,平均数为10,标准差为3常用标准分数标准分数平均数标准差z分数01分数5010标准九分52标准十分5
16、.51.5标准二十分103离差智商10015(韦氏)最早使用T分数者是麦柯尔。四、智商及其意义若儿童的心理年龄高于其生理年龄,则智力较一般儿童高,若心理年龄低于其生理年龄,则智力较一般儿童低。但在实践中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性。(一)比率智商比率智商(IQ)被定义为心理年龄与实足年龄之比比率智商的计算公式是IQ(MACA)100由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄不同步增长,所以比率智商并不适合于年龄较大的受测者。(二)离差智商韦克斯勒将离差智商的平均数定为100,标准差定为15IQ100 + 15(X)SD是离差智商的计
17、算公式从不同测验获得的离差智商只有当标准差相同或接近时才可以比较。两种智商及其计算公式智 商计算公式比 率 智 商IQ(MACA)100离差智商(韦氏)IQ100 + 15(X)SD一、转换表法最简单而且最基本的表示常模的方法就是转换表,有时也叫常模表。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数做出有意义的解释二、剖面图法剖面图是将测验分数的转换关系用图形表示出来,从而可以很直观地看出受测者在各个分测验上的表现及其相对的位置信度的概念一、信度的定义信度是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一受测者,所得结果的一致程度。信度只受随机误差的影
18、响。在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率。二、信度的指标从公式中可以看出,测量的标准误与信度之间的关系是1) 信度越低,标准误越大;2) 信度越高,标准误越小。测量标准误的应用是解释个人分数的意义。信度的评估估计信度的方法:1) 重测信度;2) 复本信度;3) 内部一致性信度;4) 评分者信度。一、重测信度使用同一测验,在同样条件下对同一组受测者前后施测两次测验,求两次得分间的相关系数,叫重测信度,又称稳定性系数用重测法估计信度,最适宜的时距随测验的目的、性质和受测者的特点而异,一般是24周较宜,间隔时间最好不超过6个月二、复本信度复本信度又称等
19、值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得受测者在两个测验上得分的相关系数。复本信度反映的是测验在内容上的等值性。如果复本信度考虑到两个复本实施的时间间隔,并且两个复本的施测相隔一段时间,则称:1) 重测复本信度;2) 稳定与等值系数。复本信度的缺点有:1) 如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;2) 由于第二个测验只改变了题目的内容,已经掌握的解题原则可以很容易地迁移到同类问题;3) 对于许多测验来说,建立复本是十分困难的。三、内部一致性信度(一)分半信度分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位受
20、测者在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。斯皮尔曼一布朗公式rxx2rhh/(1rhh) (对分半信度的修正)式中rhh为一半分数的相关系数,rxx为测验在原长度时的信度估计值(二)同质性信度同质性信度主要代表测验内部所有题目间的一致性。库德-理查逊公式:适合于0、1记分克伦巴赫 a系数:适合于多重记分四、评分者信度随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度一般要求在成对的受过训练的评分者之间平均一致性达到0.90以上,才认为评分是客观的。信度与测验分数的解释一、解释真实分
21、数与实得分数的相关rxx为信度系数。rxx0:所有差异和变动都反映的是测量误差rxx1.00:完全没有测量误差二、确定信度可以接受的水平理想情况:rxx1.00一般原则是:rxx0.70 测验不能用于对个人做出评价或预测,而且不能作团体比较0.70rxx0.85可用于团体比较rxx0.85才能用来鉴别或预测个人成绩或作为另一原则:新编的测验信度应高于原有的同类测验或相似测验。三、解释个人分数的意义信度(测量标准误)在解释个人分数的意义时的作用是:1) 估计真实分数的范围;2) 了解实得分数再测时可能的变化情形。真分数的置信区间:X1.96SE XT X1.96SE“大约有 95的可能性真分数落
22、在所得分数1.96SE的范围内,或有5的可能性落在范围之外”四、比较不同测验分数的差异甲受测在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和 0.88,那么甲受测的操作智商不显著高于言语智商。影响信度的因素样本特征测验长度测验难度时间间隔一、 样本特征(一)样本团体异质性的影响一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,若获得信度的取样团体较为同质的话,往往会低估测验的信度。(二) 样本团体平均能力水平的影响二、测验长度一般来说,在一个测验中增加同质的题目,可
23、以使信度提高。1) 测验越长,测验的测题取样或内容取样就越有代表性;2) 测验越长,受测者受猜测因素的影响就越小;3) 测验太长,有时反而会引起受测者的疲劳和反感而降低可靠性。一个包括 40个题目的测验信度为 0.80,欲将信度提高到 0.90,通过斯皮尔曼一布朗公式的导出公式计算出至少应增加50个题数。K=0.9(1-0.8)/0.8(1-0.9)=2.25,即要取得0.9的信度,测验长度应为原来的2.25倍(而不是2.5倍),即需增加402.2540=50,习题74的正确选择应为三、测验难度对于不同平均能力水平的团体,题目的难度会影响信度系数。简答题:难度0.50各类选择题的理想平均难度为
24、:五择一测题,0.70;四择一测题,0.74;三择一测题,0.77;二择一题,0.85四、时间间隔只对重测信度和重测复本信度有影响。1)两次测验相隔时间越短,其信度系数越大2)两次测验相隔时间越久,其信度系数越低效度的概念一、效度的定义在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率,效度除受随机误差、系统误差的影响。可信的测验未必有效,而有效的测验必定可信。简言之,信度是效度的必要条件。二、效度的性质效度的两个性质:1) 相对性;2) 连续性。
25、效度具有相对性,因此,在评鉴测验的效度时,必须考虑测验的目的与功能。专栏5-4 信度和效度的关系 信度:随机误差效度:测量误差一、信度是效度的必要而非充分条件;二、效度是受信度制约的。评估信度的方法效度分为三个大类:即:1) 内容效度;2) 构想效度;3) 效标效度。一、内容效度(一)什么是内容效度内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。(二)内容效度的评估方法内容效度的评估方法有1) 专家判断法;2) 统计分析法;3) 经验推测法。1专家判断法专家判断法,就是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定
26、的内容。如果专家认为测验题目恰当地代表了所测内容,则测验具有内容效度。因此,内容效度有时又称逻辑效度。为了使内容效度的确定过程更为客观,弥补不同专家对同一测验的判断可能不一致,可采用的步骤是:1) 定义好测验内容的总体范围;2) 编制双向细目表;3) 制定评定量表来测量测验的整个效度。2统计分析法除了描述性语言外,内容效度的确定也可采用一些统计分析方法,如:1) 计算两个评分者一致性;2) 复本相关;3) 再测法。3经验推测法(三)内容效度的特性在编制测验时,表面效度是一个必须考虑的特性。如果是编制最高行为测验,除了内容效度,也要求有较高的表面效度。相反,典型行为测验却要求较低的表面效度。二、
27、构想效度(一)什么是构想效度构想效度1)也译为构思效度、结构效度。2)主要涉及的是心理学的理论概念问题,3)是指测验能够测量到理论上的构想或特质的程度,4)即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。(二)构想效度的估计方法1) 对测验本身的分析;2) 测验间的相互比较;3) 效标效度的研究证明;4) 实验法和观察法证实。1对测验本身的分析可以作为构思效度证据的有:1) 测验的内容效度;2) 测验的内部一致性指标;3) 分析受测者对题目的反应特点。2测验间的相互比较可以作为构思效度的测验间比较的有:1) 相容效度;2) 区分效度;3) 因素分析法。3效标效度的研究证
28、明4实验法和观察法证实三、效标效度(一)什么是效标效度又称实证效度。效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标。可分为:1) 同时效度;(智力测验,效标:当时学习成绩)2) 预测效度。(高考,进入大学后的学习成绩)在检验一个测验的效标效度时,难点在于找到合适的效标。因此效标的选择至关重要,一个好的效标必须具备如下条件:1) 效标必须能最有效地反映测验的目标,即效标测量本身必须有效;2) 效标必须具有较高的信度,稳定可靠,不随时间等因素而变化;3) 效标可以客观地加以测量,可用数据或等级来表示;4) 效标测量的方法简单,省时省力,经济实用
29、。(二)效标效度的评估方法效标效度的主要评估方法有1) 命中率法;2) 区分法;3) 相关法。1相关法相关法是求测验分数与效标资料间的相关,这一相关系数称为效度系数。根据变量的不同,可选用的计算方法有:1) 积差相关法;(连续变量)2) 点二列相关公式;(连续变量:二分变量)3) 二列相关公式;(连续变量:二分称名变量)4) 贾斯朋(Juspen)多系列相关公式。(连续变量:等级评定)2区分法区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。3命中率法命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。命中的情况是指:1) 预测成功而且实际也成功;2)
30、预测失败且实际上也失败。命中率的计算有两种方法,一是计算总命中率(PCT),另一种是计算正命中率(PCP)。效度的功能一、预测误差效度系数的实际意义常常以决定系数来表示,即效度系数的平方。表示正确测验或解释的效标方差占总方差的比例。另一表达方法是估计的标准误,简写为Sest,即预测误差大小的估计值。如测验的效度是 0.80,则测验的总方差中有64的方差是测验分数的方差。如果某测验的效度是0.70,则在测验中无法作出正确预测的比例是0.51。二、预测效标分数 a + byx是预测的效标分数。在计算中必须用到效度系数rxy。三、预测效标指数预测效率指数 E值的大小表明使用测验比盲目猜测能减少多少误
31、差。如一个测验的效度系数为 0.80,E40,这表明由于该测验的使用,使得我们在估计受测者的效标分数时减少了40的误差。影响效度的因素一、测验本身的因素二、测验实施中的干扰因素三、样本团体的性质四、效标的性质一、测验本身的因素要保证测验具有较高效度,测验本身的因素要做到:1) 测验材料必须对整个内容具有代表性;2) 测题设计时应尽量避免容易引起误差的题型(如是非题);3) 测题难度要适中,具有较高的区分度;4) 测验长度要恰当,测题的排列应先易后难。二、测验实施中的干扰因素测验实施中的干扰因素包括:1) 主测者的影响因素;2) 受测者的影响因素。三、样本团体的性质(一)样本团体的异质性与信度系
32、数一样,如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越低同小低异大高(二)干涉变量样本团体的性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和任何有关的特征。由于这些特征的影响,使得测验对于不同的团体具有不同的预测能力,故测量学上称这些特征为干涉变量美国心理学家吉赛利(E.E.Ghiselli)提出了如何找出干涉变量的一套方法:1) 用回归方程求得每个人的预测效标分数,将该分数与实际效标分数相比较,获得差异分数D。如果D的绝对值很大,说明测验中可能存在干涉变量;2) 根据样本团体的组成分析,找出对照组,分别计算效度,从而找出干涉变量;3) 对于预测团体,根据某些易见的干涉
33、变量将其区分为预测性高和预测性低的两个亚团体。对于预测性高的团体,获得的测验效度会有所提高。四、效标的性质效标测量本身的可靠性如何亦是值得考虑的一个问题。效标测量的可靠性即效标测量的信度。项目分析一般来说,测验的项目分析包括定性分析和定量分析。项目的定性分析包括:1) 考虑项目的内容效度,2) 题目编写的恰当性和有效性等。项目的难度一、定义难度是指项目的难易程度。用P代表。P值越大,难度越低。也称作易度。在能力测验中通常反映难度水平的指标,在非能力测验(如人格测验)中,类似的指标称通俗性。难度的指标通常以通过率表示。PR/N100在200个学生中,答对某项目的人数为120人,则该项目的难度为0
34、.6。二、计算方法(一)二分法记分的项目P(PHPL)/2吉尔福特为了平衡机遇对难度的影响,提出的难度校正公式是Cp(KP-1)/(K-1)在370名受测者中,选为高分组和低分组的受测者各有100人,其中高分组有70人答对第1题,低分组有40人答对第1题,则第1题的难度为0.55。(二)非二分记分的项目PX/Xmax100。数学测验的第7题满分为15分,该题考生的平均得分为9.6分,则该题的难度为0.64。三、难度水平的确定(一)项目的难度难度P值越接近于0或接近于1,越无法区分受测者之间能力的差异。相反,P值越接近于0.50,区别力越高。(二)测验的难度测验总分应该接近常态分配。正偏态分布:
35、偏难负偏态分布:过易正难负易一般来说,最后使测验中所包含的试题的难度在0.500.20之间,平均难度接近0.50。项目的区分度一、定义项目区分度也叫鉴别力,是指测验项目对受测者的心理特性的区分能力。二、计算方法(一)鉴别指数鉴别指数的计算步骤为:(1)按测验总分高低排列答卷;(2)确定高分组与低分组,每一组取答卷总数的27;(3)分别计算高分组与低分组在该项目上的通过率或得分率;(4)按下列公式估计出项目的鉴别指数:DPHPL。1965年,美国测验专家伊贝尔(L.Ebel)根据长期的经验提出用鉴别指数评价项目性能的标准,鉴别指数D为0.19以下,说明该项目差,必须淘汰。(二)相关法计算区分度最
36、常用的方法是相关法,常用的相关法有:1) 点二列相关;2) 二列相关;3) 相关; 三、区分度与难度的关系一般来说,较难的项目对高水平的受测者区分度高,中等难度的项目对中等水平的受测者区分度高。项目难度的分布一般以常态分布为好,这样不仅能保证多数项目具有较高的区分度,而且可以保证整个测验对受测者具有较高的区分能力。测验编制的一般程序测验的目标分析一、测验的对象在编制测验前首先要明确测量的对象,也就是该测验编成后要用于哪些团体。只有对受测者的如下几方面心中有数,编制测验时才能有的放矢:1) 年龄;2) 受教育程度;3) 社会经济水平;4) 阅读水平。二、测验的用途测验用途不同,编制测验时的取材范
37、围以及试题难度等也不尽相同。在测验编制前就应明确所编出的测验是要对受测者做1) 描述;2) 诊断;3) 选拔;4) 预测。(一)显示性测验显示性测验是指测验题目和所要测量的心理特征相似的测验。古德纳夫曾经将其分为样本测验和标记测验。(二)预测性测验三、测验的目标心理测验的目标是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。心理测验的目标分析以测验不同而异,一般可分为:1) 工作分析;2) 对特定概念下定义;3) 确定测验的具体内容。对于选拔和预测功用的预测性测验,它的主要任务就是要对所预测的行为活动作具体分析,我们称之为任务分析或工作分析(job analysis)。这种分析包
38、括如下步骤:1) 确定哪些心理特征和行为可以使要预测的活动达到成功;2) 建立衡量受测者是否成功的标准,这个标准我们称之为效标。测题的编写一、搜集资料题目来源分为三方面:1) 已出版的标准测验;2) 理论和专家的经验;3) 临床观察和记录。二、命题的一般原则心理测验命题的一般原则可以从几方面来考虑:1) 内容;2) 文字;3) 理解;4) 社会敏感性。(一)内容方面心理测验命题在内容方面的主要要求是:1) 内容符合测验的目的,避免贪多而乱出题;2) 内容取样要有代表性;3) 题目间内容相互独立。(二)文字方面心理测验命题在文字方面的主要要求是:1) 使用准确的当代语言;2) 语句简明扼要,排除
39、与答案无关的因素;3) 最好是一句话说明一个概念。(三)理解方面心理测验命题在理解方面的主要要求是:1) 有确切的答案,除创造力测验和人格测验外不应具有引起争议的可能;2) 内容不要超出受测团体的知识水平和理解能力;3) 格式要不被人误解。(四)社会敏感性方面有些测验必须涉及一些社会敏感性问题,菲力普(Phillips,D.L)列举了值得参考的几个策略:1) 命题时假定受测者具有某种行为;2) 命题时假定规范不一致;3) 指出该行为是常见的,虽然是违规的。三、测题的编制要领(一)选择题选择题要编好题干,也要编好选项,必须注意:1)题干问题明确,避免与选项用词一致;2)选项简明扼要;3)每题只给
40、一个正确答案;4)选项长度应相等5)避免题干用词与选项用词一致6)选项最好用同一形式。(二)是非题编制是非题应注意:1) 内容以有意义的概念、事实或基本原则为基础;2) 每道题只能包舍一个概念;3) 尽量避兔否定的叙述,尤其是双重否定;4) “是”、“非”题的数目应基本相等,随机排列。(三)简答题编制简答题的原则包括:1) 宜用问句形式;2) 填充形式的空格不宜太多;3) 每题应只有一个正确答案。(四)操作题编制操作测验的原则有:1) 明确所要测量的目标,并将其操作化;2) 尽量选择真实性程度较高的项目;3) 指导语要简明扼要;4) 制订评分标准,确定计分方法。测验的编排和组织一、合成测验(一
41、)选择与审定试题1选择试题的形式在选择题目形式时,需要考虑:1) 测验的目的和材料的性质;2) 接受测验的团体的特点; 3) 各种实际因素。 2审定题目审定试题要注意题目的:1) 范围应与测验计划的双向细目表相一致;2) 数量要比最后所需的数目多一倍至几倍,以备筛选和编制复份;3) 难度必须符合测验目的的需要;4) 说明必须清楚明白。(二)测题的编排测验编排的一般原则包括:1) 难度逐步上升,先易后难;2) 将同类型的测题组合在一起;3) 依各种类型测题本身的特点编排题目与选项。测题常见的排列方式有:1) 并列直进式;(韦氏智力测验)2) 混合螺旋式。(比内-西蒙量表)二、预测与项目分析预测应
42、注意1) 对象应取自将来正式测验准备应用的群体;2) 实施过程与情境应力求与将来正式测验时的情况相近似;3) 时限可稍宽一些,最好使每个受测者都能将题目做完;4) 预测过程中,随时记录受测者的反应情形。三、信度和效度考察四、常模制订五、编写指导手册测验指导手册的内容有:1) 测验的目的和功用;2) 编制的理论背景,选材的原则、方法;3) 实施测验的说明,测验的标准答案和记分标准;4) 测验的心理计量学特征、常模资料。专栏5-5 心理测验的编制过程心理测验的使用主试的资格一、知识结构主测者的知识结构是指开展心理测验工作所必须具备的:1) 基础知识;2) 专业相关知识 二、专业理论知识和专业技能(
43、一)专业理论知识主测者的心理测验专业理论知识,具体言之,包括:1) 对心理测验的特点、性质、作用和局限性的认识;2) 了解测验的基本特征(信度、效度、难度、区分度等);3) 熟悉保证心理测验标准化的必要性。(二)专业技能主测者必须具有实际操作心理测验的专业技能和经验,接受严格、系统的心理测验专业训练,熟悉有关测验的如下方面:1) 内容;2) 适用范围;3) 测验程序;4) 记分方法。三、职业道德主测者的职业道德包括:1) 测验的保密和控制使用;2) 测验中个人隐私的保护。心理测验的保密涉及到:1) 测验内容;2) 测验结果;3) 个人隐私。测验的选择选择测验必须注意两个方面:一、适合测量的目的
44、;二、符合心理测量学的要求。一、所选测验必须适合测量的目的二、所选测验必须符合心理测量学的要求测验前准备及注意事项一、测验的准备工作测验前的准备工作主要包括:1) 预告测验;2) 准备测验材料;3) 熟悉测验指导语;4) 熟悉测验的具体程序。二、测验中主试的职责测验中主测者的职责是指:1) 应按照指导语的要求实施测验;2) 测验前不讲太多无关的话;3) 主测者不应对受测者的反应做出任何暗示性反应;4) 对特殊问题要有心理准备。三、建立协调关系在心理测验实施中,主测者和受测者之间建立了一种友好的、合作的、能促使受测者最大限度地做好测验的关系,叫协调关系。测验实施的程序及其要素一、指导语测验指导语一般组成为:1)如何选择反应形式;2)如何记录这些反应;3)时间限制;4)如果不能确定正确反应时该如何操作5)例题6)有时告知受测者测验目的。二、时限