心理测量学知识点总结.pdf-淘文阁

资源描述

《心理测量学知识点总结.pdf》由会员分享，可在线阅读，更多相关《心理测量学知识点总结.pdf（15页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、心理测量学知识点总结1. 测量：是依据一定的法则用数字对事物加以确定。它包括事物、法则和数字（具有区分性、序列性或等级性、可加性、逻辑性的特点）。2. 测量的要素有参照点和单位。3. 参照点：是要确定事物的量，必须有的计算的起点。参照点分为绝对参照点（代表“无”）和相对参照点（不代表“无”）4. 好的单位必须具备两个条件：（1）有确定的意义；（2）有相同的价值。心理测量的单位不够完善，既无统一的单位，也不符合等距的要求。5. 测量的本质是根据某一法则将事物数量化。即在一个定有单位和参照点的连续体上把事物的属性表现出来，这个连续体称为量表。6. 命名量表。只是用数字来代表事物或把事物归类，数字

2、只用来做标记和分类，不能做数量化分析，即不能说ABC，也不能做加、减、乘、除的运算。7. 顺序量表。其中的数字不仅指明类别，同时指明类别的大小或含有某种属性的程度，这里的数字包含数量关系，即可以说ABC。主要用于分等或排出顺序。心理测量一般是在顺序量表上进行的。8. 等距量表。不但有大小关系，还有相等的单位，但没有绝对零点，即可以说ABC，也可以做加、减运算，但不能做乘、除运算。9. 等比量表。即有相等单位又有绝对零点，即可以说ABC，也能做加、减、乘、除的运算。1. 心理测验：是依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点做出推论

3、和数量化分析的一种科学手段。2. 心理测验的性质：间接性；相对性；客观性（包括测验的刺激是客观的、反应的量化是客观的和对结果的推论是客观的）。3. 按测验的功能分为：智力测验、特殊能力测验和人格测验。4. 按测验材料的性质分为：文字测验和操作测验。5. 按测验材料的严谨程度分为：客观测验和投射测验。6. 按测验的方式分为：个别测验和团体测验。7. 按测验的要求分为：最高作为测验和典型行为测验。8. 错误的测验观：测验万能论；测验无用论；心理测验即智力测验。9. 正确的测验观：心理测验是重要的心理学研究方法之一，是决策的辅助工具。心理测验作为研究方法和测量工具尚不完善。10.我国目前心理门诊中较

4、多的运用：智力测验、人格测验以及心理评定量表。1. 首先倡导科学心理测验的学者是英国生物学家和心理学家高尔顿，他的贡献主要有：提出人的不同气质特点和智能是按身体特点不同遗传的；设计了测量差异的方法，可以视为心理测验的开端。为心理测量学奠定了统计学基础。第一个提出了相关的概念，并由他的学生皮尔逊加以发展，创立了积差相关法。2. 卡特尔对促进心理测验发展得贡献有：1890 年，发表了心理测验与测量一文，这是心理测验第一次出现于心理学文献中。主张测验手续和考试方法应有统一规定，并要有常模以便比较。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - -

5、- - - - - - - -第 1 页，共 15 页 - - - - - - - - - - 3. 比内西蒙在1905 年发表了世界上第一个正式的心理测验。4. 20 世纪以后心理测验主要的发展方面：操作测验的发展；团体智力测验的发展；能力倾向测验的发展；人格测验的发展。5. 近年来我国的心理学家致力于测验的本土化，编制适合我们文化背景的智力测验、适应行为量表等，并已取得了初步成果。6. 常模团体是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。7. 常模总体的选择包括：确定一般总体；确定目标总体；确定样本。8. 常模团体的条件：群体的构成必须明确界定；常模团体必须是所测群体

6、的代表性样本；标准化样本是一定时空的产物；样本大小要适当（1）在实际工作中，应从经济、实用和减少误差等方面来考试样本的大小。在其他条件相同的情况下，样本越大越好；样本大小适当的关键是样本要有代表性。（2）总体数目小，只有几十个人，需要100%样本。总体数目大，相应的样本也大，一般最低不少于30 或 100 个。全国常模一般有20003000 人。1. 取样：从目标人群中选择有代表性的样本。方法有：简单随即抽样；系统抽样；分组抽样；分层抽样。2. 系统抽样要求目标总体无序可排，可无等级结构存在。其关键是计算组距（ K）3. 分组抽样用于总体数目较大，无法进行编号，而且群体又有多样性。4. 分

7、层抽样时确定常模时最常用的方法。5. 常模分数就是施测常模样本被试后，将被试者的原始分数按一定规则转换出来就是导出分数，所以常模分数又叫导出分数。导出分数的特点是：与原始分等值；具有意义；等单位；具有参照点。6. 常模分数所构成的分布，就是通常所说的常模，它是解释心理测量分数的基础。7. 发展常模：也叫年龄量表，是根据平均表现所制成的量表。在这个量表中，个人分数指出他的行为在按正常途径发展方面处于什么样的发展水平。最直观的发展常模是发展顺序量表。8. 发展顺序量表最早的一个范例是葛塞尔发展程序表，其中按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。婴儿的感觉运动发展是：4

8、周：能控制眼睛运动，去追随一个对象看。16 周：能使头保持平衡。28 周：能用手抓握东西并玩弄它。40 周：能控制躯干、坐立或爬行52 周：能控制腿脚运动、站立和行走。1. 皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展，尤其注重某些特殊概念的形成，其中最著名的工作就是对守恒的概念的研究。2. 守恒是指两种等量的物体只要无增无减，无论怎样改变组合，它们在质量、重量、长度、数量及容量等方面仍然是相等的一种认知。3. 皮亚杰发现，儿童不同时期出现不同守恒概念，通常儿童到5 岁时才会理解质量守恒；6 岁才会掌握重量守恒；7 岁才能有容量守恒的概念。精品资料 - - - 欢迎下载 - - - -

9、 - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 2 页，共 15 页 - - - - - - - - - - 4. 一个儿童在年龄量表上所得的分数，就是最能代表他的智力水平的年龄。这种分数叫做智力年龄，简称智龄。比内西蒙量表中首先使用智力年龄的概念。5. 智龄的算法：先算出基础年龄，即全部题目都通过的那组题目所代表的年龄。然后再所有个更高年龄水平上通过的题目，用月份计算，加在年龄上，儿童的智龄是基础年龄与较高年龄水平的题目上获得的附加月份之和。例如某个儿童6 岁的题目全部通过，7 岁组通过 4 题， 8 岁通过 3 题，9 岁组通过2 题，其智龄

10、为：6（岁） +42（月）+32（月） +22（月） =6 岁+18 月=7 岁 6 个月。6. 年级当量实际就是年龄量表，例如常模中6 年级的算术平均分为35，某儿童在算术测验中也得 35 分，那么就有“该儿童的算术水平是6 年级水平”的表述。7. 百分等级是指在常模样本中低于这个分数的人数百分比。8. 未分组资料的百分等级计算公式：10050100RN，其中R 是原始分数排列顺序数，N是指总人数（样本总人数）。例如小东在30 名同学中语文成绩是80 分，排列第五名，则其百分等级为：100 55010085309. 在分数量表上，相对于某一百分等级的分数点就叫百分点或百分位数。10.高考的最

11、高分时695，其中百分等级为100，最低分为 103，百分等级是1，要求录取20%的学生进入大学，百分等级为80 的百分位数（ PP）可以用以下公式计算：10088801695103PPPP，得 PP=575.40575 分将 103 到 695 分成 100 份，其中第80 分对应的分数。1. 四分位数是将量表分成四等份，相当于百分等级25%、50%和 75%对应的三个百分点分成的四段。十分位数也可以此类推。2. 标准分数常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为他的基本单位是标准差，所以叫标准分数。常见的标准分数有“z 分数、 Z 分数、 T 分数、标准九分数、离差智

12、商（IQ）等。标准分数可以通过线性转换和非线性装换得到。3.XXzSD其中 X 为任一原始分数，X 为样本平均数，SD 为样本标准差。由此可见，z 分数可以用来表示某一分数与平均数之差是标准差的基本。4.ZABz式中 Z 为转换后的标准分数，A、B 为根据需要制定的常数。加上一个常数是为了去掉负值，乘以一个常数是为了使单位变小从而去掉小数点。5. 当原始分数不是常态分布时，也可以使之常态化，这一转换过程就是非线性的。6. 常态化过程主要是将原始分数转化为百分等级，再将百分等级转化为常态分布上相应的离均值，并可以表示为任何平均数和标准差。平均数标准差T 分数50 10 标准九分5 2 标准十分5

13、.5 1.5 标准二十分10 3 离差智商100 15 或 16 精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 3 页，共 15 页 - - - - - - - - - - 1. 单纯用心理年龄来表示智力高低分方法缺乏不同年龄儿童间的可比性，因此，目前一般都用比率智商和离差智商来表示智力的高低。2. 比率智商（ IQ）被定义为心理年龄（MA ）与实足年龄（CA）之比。为避免小说，将商数乘以 100：公式是：100MAIQCA3. 由于个体智力增长是一个由快到慢再到停止的过程，即心理年龄与实足年龄发展不同

14、步增长，所以比率智商并不适合于年龄大的被试。4. 离差智商的优点有：离差智商是建立在统计学基础之上的。表示的是个体智力在年龄组所处的位置。表示智力高低的一种理想的指标5. 计算离差智商的公式是：10015IQz6. 不同的测验获得的离差智商只有当标准差同时或接近时才可以比较。7. 转换表，也叫常模表。是一种最简单、最基本的且常用的呈现常模资料的方式。它构成的要素为原始分数、导出分数和对常模团体的有关具体描述。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数，从而对测验的分数做出有意义的解释。8. 剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上

15、的表现及其相对的位置。9. 对某些特殊的群体来说，情况很具体而特殊，我们就需要制定特殊常模。标准分数与百分等级、T 分数等的关系标准分数2 2百分等级2 16 50 84 98 T 分数30 40 50 60 70 标准二十4 7 10 13 16 离差智商70 85 100 115 130 1. 信度是指同一被试者在不同时间内同一测验（或用另一套相等的测验）重复测量，所得结果的一致程度。信度只受随即误差的影响。2. 在测量理论中，信度被定义为：一组测量分数的真分数方差与总方差（实得分数的方差）的比率：22TxxXSrS3. 公式222TxxXTXSrrS和公式TXTXSrS表明信度指数的平方

16、就是信度系数。4.1xxxSESr公式中 SE 为测量的标准误，SX所得分数的标准差，rxx为测验的信度系数。从公式中可以看出，测量的标准误与信度之间的关系是：信度越低，标准误越大；信度越高，标准误越小。5. 信度的评估方法有：重测信度、复本信度、内部一致性信度和评分者信度。6. 重测信度：又称稳定性系数，它的计算方法是采用重测法，即使用同一测验，在同样条件下同一组被试者前后施测两次测验，求两次得分间的相关系数。7. 用重测法估计信度，最适宜的时距随测验的目的、性质和被试者的特点而异，一般是24周较宜，间隔时间最好不要超过6 个月。精品资料 - - - 欢迎下载 - - - - - - - -

17、 - - - 欢迎下载名师归纳 - - - - - - - - - -第 4 页，共 15 页 - - - - - - - - - - 8. 复本信度：又称等值性系数，它是以两个等值但题目不同的测验（复本）来测量同一群体，然后求的被试者在两个测验上得分的相关系数，这个相关系数就代表了复本信度的高低。9. 复本信度的优点是：能够避免重测信度的一些问题，如记忆效果、学习效应等。10.复本信度的局限性：复本信度只能减少练习的影响，而不能消除。由于第二个测验只改变题目的内容，已经掌握的解题原则，很容易就迁移到同类问题。建立复本对很多测验来说十分困难。11.如果复本信度考虑到两个复本实施的时间间隔，并

18、且两个复本的施测相隔一段时间，则称重测复本信度，或稳定与等值系数。1. 内部一致性信度主要反映的是题目之间的关系，表示测验能够测量相同内容或特质的程度。主要包括分半信度和同质性信度。2. 分办法通常是测验实施后将测验按奇、偶分为等值的两半，并分别计算每位被试在两半测验上的得分，求出这两半的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。3.分半法经常会低估信度，必须修正。一般用斯皮尔曼布朗公式：21hhxxhhrrr其中rhh为一半分数的相关系数，rxx为测验在原长度的信度估计值。4. 同质性信度主要代表测验内部所有题目的一致性。5. 计算同质性信度的公式有：库德理查逊公式。在测验是

19、二级评分（是非题、01 计分）的情况下，常用KR20公式，在难度相同或相近的情况下，还可以用KR21 公式。和伦巴赫系数。适合多重计分的测题。6. 为了衡量评分者之间信度高低，可随机抽取若干份测验卷，由两位评分者按评分标准分分别给分，然后再根据每份测验卷的两个分数计算相关，既得评分者信度。一般要求在成对受过训练的评分者之间平均一致性达到0.90 以上，才认为评分时客观的。7. 不同的信度反映测验误差的不同来源。1. 信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的，也就是测验的总变异种真分数造成的变异占百分之几。2. 一般能力测验和成就测验的信度系数都在0.90 以上，有的可以

20、达0.95；而人格测验、兴趣、态度、价值观等测验的信度一般在0.800.85 或更高些。3. 要确定信度可接受水平的一般原则是：当 rxx0.70 时，测验不能用于对个人作出评价或预测，而且不能做团体比较；当 0.70rxx0.85 时，可用于团体比较；当 rxx0.85 时，才能用来界别和预测个人成绩或作为。4. 新编的测验信度应高于原有的同类测验或相似测验。5. 信度系数在解释个人分数的意义时的作用：是估计真实分数的范围；了解实得分数再测时可能的变化情形。6. 某个被试的IQ 为 100，该智力测验的标准差为15，信度系数为0.84，则其 IQ 的测量标准误和可能范围分别为：精品资料 -

21、- - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 5 页，共 15 页 - - - - - - - - - - 1xxxSESr15 10.846.0SEIQ=100 1.966=10011.76 88112 我们说这个被试的真实IQ 有 95% 的可能落在88 到 112 之间。7. 若两个测验差异显著，那么两个测验的差异分数要比差异标准误（SEd）乘以 1.96 大。2xxyySEdSrr其中， SEd 为差异的标准误，S 代表两个测验使用的标准差，这两个标准差必须相同。8. 影响信度的因素：样本特征。（1）异质性（

22、一般而言，若获得信度的取样团体较为异质的话，往往会高估测验的信度，相反则会低估测验的信度）；（2）平均能力水平（不同那水平的团体，题目具有不同的难度，每个题目在难度上微小差异累计起来便会影响信度）测验长度。（1）测验越长，测验的测题取样或内容取样就越有代表性。（2）测验越长，被试的猜测因素影响就越小。增加测验长度的效果应遵循报酬递减率原则，测验过长是得不尝试的，有时反而会引起被试的疲劳和反感而降低可靠性。测验难度。（1）理论上，只有平均难度为50%时，才能使测验分数分布范围最大，求得的信度也最高。事实上，难度为0.50 只适合于简答型题目。（2）各类型选择题的理想平均难度为：五选一测题，0.7

23、0；四选一测题，0.74；三选一测题， 0.77；是非题， 0.85。时间间隔。（1）时间间隔只对重测信度和重测复本信度有影响。（2）以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越大；间隔时间越久，其他变因介入的可能性越大，受外界影响也越大，信度系数便会低。9. 增加题目的数量与测验的信度之间的关系公式：11kkxxxxkkKrrrr，其中 K 为改变后的长度与原来长度的比，rxx为原测验的信度，rkk为测验长度是原来K 倍时的信度估计。1. 效度是指所测量的与所要测量的心理特点的符合程度，或者简单地说是指一个心理测验的准确度。2. 在测验理论中，效度被定义为在一组测量中，与测量目

24、标有关的真实方差（或称有效方差）与总方差的比率，即：22VxyXSrS3. 效度的性质：效度具有相对性，在评鉴测验的效度时，必须考虑其目的与功能。效度具有连续性。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 6 页，共 15 页 - - - - - - - - - - 4. 信度和效度的关系：信度高是效度高的必要条件，也就是说可信的测验未必有效，有效的测验必然可信。即信度高，效度未必高；效度高，信度一定高。一个测验的效度总是受它的信度制约的。5. 美国心理学会在1974 年发行的教育与心理测量之

25、标准中一书将效度分为：内容效度、构想效度和校标效度。6. 内容效度指的是测验题目对有关内容或行为取样的适用性，从而确定测验是否是所欲测量的行为领域的代表性取样。1. 内容效度的评估方法有：专家判断法、统计分析法和经验推测法。2. 专家判断法：请有关专业对测验题目与原定内容的符合性作出判断，看测验的题目是否代表规定内容。如果专家认为测验题目恰当地代表了所测内容，则测验具有内容效度。由于这种估计效度的方法，是一个逻辑分析的过程，所以内容效度有时又称“逻辑效度” 。3. 为了使内容效度的确定过程更为客观，弥补不同专家对同一测验判断的可能不一致，可采用的步骤是：定义好测验内容的总体范围；编制双向细目表

26、；制定评定量表来测量测验的整体效度。4. 统计分析法包括：计算两个评分者一致性；复本相关；再测法。5. 最高行为测验要求有较高的表面效度；典型行为测验却要求较低的表面效度。6. 构想效度：又叫构思效度或结构效度。主要涉及的是心理学的理论概念问题，是指测验能够测量到理论上的构想或特质的程度，即测验的结构是否证实或解释某一理论的假设、术语或构想，解释的程度如何。7. 构想效度的评估方法有：对测验本身的分析；测验间的相互比较；较标效度的研究证明；实验法和观察法证实。8. 对测验本身的分析主要有：测验的内容效度可以作为构思效度的证据；测验的内部不一致性可以推断测验是测量单一特质还是测量多种特质，从而为

27、评估测验构思效度提供证据；分析被试者对题目的反应特点也可以作为构思效度的证据。9. 测验间的相互比较：相容效度：是构思效度的一个证据，是指需判断内容效度的测验与某个和该测验测量同一种心理特质，且已有测验效度的成熟测验的相关系数。区分效度：是构思效度的一个证据，是指需要判断内容效度的测验与某个和该测验测量不同心理特质，且已有测验效度的成熟测验的相关系数。相关系数越高，区分效度越低。若区分效度较低，则证明新测验的效度确实有问题。但若区分效度较高，却不能说明新测验效度较高。因素分析法。1. 较标效度：又称实证效度，反应的是测验预测个体在某种情景下行为表现的有效性程度。被预测的行为是检验标准的

28、标准，简称较标。2. 在检验一个测验的较标效度时，难点在于确定合适的效标。因此较标的选择至关重要，一个好的校标必须具备：效标必须能最有效地反映测验的目标，即效标测量本身必须有效。效标必须具有较高的信度，稳定可靠，不随时间等因素而变化。效标可以客观地加以测量，可用数据或等级来表示。效标测量的方法简单，省时省力，经济适用。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 7 页，共 15 页 - - - - - - - - - - 3. 效标效度的评估方法有：相关法；区分法；命中率法。4. 相关法：是求测验分数

29、与效标资料间的相关，这一相关系数成为效度系数。常用的方法有：积差相关法；点二列相关公式；二列相关公式；贾思朋多系列相关公式。5. 区分法：是检验测验分数能否有效地区分由效标所定义的团体的一种方法。6. 命中率法：是当测验用来做取舍的依据时，用其正确决定的比例作为效度指标的一种方法。命中的情况是指：预测成功而且实际也成功；预测失败而且实际也失败7. 效度的功能有：预测误差；预测效度分数；预测效度指数。8. 效度系数的实际意义常常以决定性系数来表示，就是相关系数的平方，它表示测验正确预测或解释的效标的方差的总方差比例。例如测验的效度是0.8，则测验的总方差中有64%的方差是测验分数的方差，即测验

30、分数正确预测的比例64%，其余36%无法做出正确的预测。1. 估计的标准误计算公式为：21xyySestSr，其中，2xys代表效度系数的平方，即决定系数，Sy为效标成绩的标准差。2. 最常用的 Y 对 X 的回归方程：yxa bYX，其中Y是预测的效标分数；a 是纵轴的截距，用来纠正平均数的差异；byx是斜率，亦即Y 向 X 回归的系数； X 为测验分数。3. E 值大小表明使用测验比盲目猜测能减少多少误差。例如一个测验的效度系数为0.80，那么20.601 0.80K，E=100（10.60 ） =40，这表明预测误差仅为随机猜测所产生误差的60% 。换句话说，由于该测验的使用，使得我们在

31、估计被试的效标分数时减少了 40% 的误差。4. 影响效度的因素：测验本身的因素；测验实施中的干扰因素；样本团体的性质；效标的性质。5. 要保证测验具有较高的效度，测验本身要做到：测验材料必须对整个内容具有代表性；测题设计时应尽量避免容易引起误差的题型（如是非题）；测题难度要适中，具有较高的区分度；测验长度要恰当，既要有一定的测题量；测题的排列按先易后难排序。6. 测验实施中的干扰因素主试的影响因素：（1）主试本身是否严格的按照测验对主试的要求进行测验的（2）对于效标效度，测验与效标实施时间间隔越长，测验与效标越容易受到很多机遇因素的影响，因那次所求的相关必然很低。（3）测验情景（场地的布置

32、、材料准备等等）也会影响测验的效度。被试的影响因素：被试的兴趣、动机、情绪、态度和身心状况、健康状态以及是否充分合作与尽力而为等都会影响测验结果的效度。反应定式也会降低测验的效度。7. 样本团体的性质包括：样本团体的异质性，如果其他条件相同，样本团体越同质，测验效度就会越低；样本团体越异质，测验效度越高。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 8 页，共 15 页 - - - - - - - - - - 干涉变量：是使得测验对于不同的团体具有不同的预测能力的特征，这些特征包括年龄、性别、教育水平

33、、智力、动机、兴趣、职业和任何有关的性质。美国心理学家吉赛利提出了如何找出干涉变量的一套方法，他们是：（1）获得差异分数D，如果 D 的绝对值很大，说明测验中可能存在干涉变量。（2）找出对照组，分别计算效度，找出干涉变量。（3）对于预测团体，根据某些易见的干涉因素分为预测性高和预测性低的两个亚团体。预测性高的团体，获得的测验效度会有所提高。8. 效标性质的影响主要体现在：效标本身的可靠性即效标测量的信度；效标与测验分数之间的关系是否是线性的，皮尔逊积差相关系数的前提就是两个变量的关系式现行的。1. 测验的项目分析包括定性和定量两个方面的。定性分析包括考虑内容效度，题目编写的恰当性和有效性等；

34、定量分析主要是指对题目难度和区分度等进行分析。2.难度：是指项目的难易程度。它一般用通过率来表示，即答对或通过该题的人数百分比来表示：100%RPN，其中P代表项目的难度，N 为全体被试者人数，R为答对或通过该项目的人数。3. 通过人数越多（P 值越大），难度越低； P 值越小，难度越高。4. 二分法积分的项目计算通过率，若人数较少可以直接采用上边的公式计算。若人数较多时。则可根据测验总成绩将被试分成三组：分数最高的27%被试为高分组，分数最低 27%为低分组，中间46%的被试为中间组。分别计算高分组和低分组的通过率，以两组通过率的平均值作为每一题的难度。其公式为：2HLPPP，其中 P 代

35、表难度， PH和 PL分别代表高分组和低分组通过率。5. 由于选择题可以猜测，所以通过率可能因机遇作用变大。为了平衡机遇对难度的影响，吉尔福特提出了一个校正公式：11PKPKC，其中 CP为校正后的通过率，P 为实际得到的通过率， K 为备选答案的数目。6. 非二分变量的项目计算通过率，一般用：max100%XPX, 其中 X 为全体被试在该题上的平均分，Xmax为该题的满分。7. P值越接近于0 或接近 1，越无法区分被试间能力的差异。相反P 值越接近0.50，区别力越高。8. 在实际选择题目时，最好使试题的平均难度接近0.50，而各题难度在0.500.20 之间。9. 对于是非题而言，其难

36、度值应该为0.75 最为合适；而对于四选一的题目，其难度值约为0.63 时最为合适。10.分数的分布时正偏态分布时，题目较难；为负偏态分布时，题目较易。1. 项目区分度，也叫鉴别力，是指测验项目队被试的心理特征的区分能力。2. 区分度的计算方法主要是：鉴别指数；相关法。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 9 页，共 15 页 - - - - - - - - - - 3. 鉴别指数法的主要步骤是：按测验总分高低排列答卷；确定高分组与低分组，每一组取答卷总数的27%；分别计算高分组与低分组在该项目

37、上的通过率或得分率；按下列公式计算鉴别指数：D=PHPL，其中， D 为鉴别指数， PH为高分组在该项目上的通过率或得分率，PL为低分组在该项目上的通过率或得分率。4. 若 D0，D 越大，说明该项目区分两种不同水平的程度越高。若 D0，则反映高水平组在该项目上的得分率反而低于低水平组，说明项目有问题。5. 相关法：以某一项目分数与效标成绩或测验总分的相关作为该项目区分度的指标。相关越高，表明项目越具有区分的功能。6. 相关法主要包括：点二列相关：适用于一类变量为二分称名变量，另一类变量为连续变量。二列相关：适用于两个连续变量，但其中一个变量被人为分成两类。相关法：适用于两个变量均为二分称名

38、变量时。7. 难度与区分度的关系，一般来说，较难的项目对高水平的被试者区分度高；较易的项目队低水平的被试者区分度高，中等难度的项目对中等水平的被试者区分度高。8. 项目难度的分布一般以常态分布为好，这样不仅能保证多数项目具有较高的区分度，而且可以保证整个测验对被试者具有较高的区分能力。1. 在编制测验前首先要明确测量的对象，也就是该测验编成后要用于那些团体。只有对受测者的年龄、受教育程度、社会经济水平、阅读水平等心中有数，编制测验时才能有的放矢。2. 测验用途不同，编制测验时的取材范围以及试题难度等也不尽相同，在测验前就应明确所编出的测验是要对被试者做描述、诊断、选拔还是预测。3. 测验的用途

39、，一般分为：显示和预测，由此测验可以分成：显示性测验和预测性测验。4. 显示性测验：是测验题目和所要测量的心理特征相似的测验。古德纳夫曾经在显示测验内部，又区分为样本测验和标记测验。5. 预测性测验：是预测一些没有被测量的行为的测验。6. 显示性测验和预测性测验区分不是绝对的，有时是统一的。7. 心理测验的目标：是编制测验是测什么的，即用来测量什么样的心理变量或行为特征。8. 目标分析以测验不同而异，一般可分为：工作分析；对特定概念下定义；确定测验的具体内容。9. 对于选拔和预测功用的预测性测验，它的主要任务就是要对所预测的行为活动作具体分析，我们称之为任务分析或工作分析。这种分析的步骤是：确

40、定哪些心理特征和行为可以使要预测的活动达到成功。建立衡量被试是否成功的标准，这个标准我们称之为效标。1. 题目的来源有：已出版的标准测验；理论和专家的经验；临床观察和记录。2. 心理测验命题的一般原则：内容方面：内容符合测验目的；避免贪多而乱出题目；内容取样要有代表性；题目间内容相互独立，互不牵连。文字方面：使用准确的当代语言；语句简明扼要；排除与答案无关的因素；最好是一句话说明一个概念；尽量少使用双重否定句。理解方面：题目应有确切的答案，除创造力测验和人格测验外不应具有引起争议的可精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - -

41、- - - - - -第 10 页，共 15 页 - - - - - - - - - - 能；题目的内容不要超出受测团体的知识水平和理解能力；题目的格式要不被人误解。社会敏感性方面菲利普列举的策略：（1）命题时假定被试具有某种行为，使他不得不在确实没有该行为时才否定，可避免否定答案过多的倾向；（2）命题时假定规范不一致；（3）指出该行为是常见的，虽然是违规的。3. 编制选择题时，既要编好题干，也要编好选项，必须注意：题干所提的问题必须明确，尽量使用简单而且明晰的词语。选项切记沉长，要简明扼要每题只给一个正确答案，其他属诱答。各选项长度应相等，尽量不要有长有短。避免题干用词与选项用词一致，否则

42、成了选择答案的线索。选项最好用同一形式。4. 编制是非题时应注意：内容应以有意义的概念、事实或基本原则为基础。每到题只能包含一个概念若是表达意见的题目，最好说明意见的来源和根据。尽量避免否定叙述，尤其是要避免用双重否定的叙述。“是”、 “非”题的数目应有适应比例，基本相等，且要随机排列。5. 编制简答题有三个原则：宜用问句形式如果是填充形式，空格不宜太多，所空出的应该是关键词句。每题应只有一个正确答案，而且答案要简短而具体。6. 编制操作题的四个原则：明确所要测验的目标，并将其操作化。尽量选择真实性程度较高的项目。指导语要简明扼要，主要让被试明白要他们做什么和在什么条件下做。制定评分标准，确定

43、计分方法。1. 在选择题目形式时，需要考虑由以下几点：测验的目的和材料的性质接受测验的团体的特点各种实际因素2. 审定题目时要注意：题目的范围应与测验计划所列的内容技能双向细目表相一致。题目的数量要比最后所需的数目至少多一倍至几倍，以备筛选和编制复份。题目的难度必须符合测验目的的需要。题目的说明必须清楚明白。3. 测题编排的一般原则是：测题的难度排列宜逐步上升。尽可能将同类型的测题组合在一起。注意根据各种类型测题本身的特点排列题目4. 常见的测题排列方式是：并列直进式和混合螺旋式。5. 预测时应注意：精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳

44、 - - - - - - - - - -第 11 页，共 15 页 - - - - - - - - - - 预测对象应取自将来正式测验准备应用的群体。预测的实施过程与情景应力求与将来正式测验时的情况相近似。预测的时间可稍宽一些，最好使每个被试都能将题目做完。在预测过程中，应对被试的反映情形随时加以记录。6. 测验指导手册的内容：测验的目的和功用。测验编制的理论背景以及测验中的材料是根据什么原则、应用什么方法选择出来的，许多手册还提供选择题目的统计指标。如何实施测验的说明。测验的标准答案和积分标准常模资料，包括常模表、常模适用的团体及对测验分数如何做解释。测验的基本特征，包括难度、鉴别力、信度、

45、效度和因素分析的资料，以及这些资料取得的条件和情景，包括调查的样本和时间。1. 主试资格主要包含技术和道德两方面的要求。技术方面主要是指一定的知识结构、心理测验专业理论知识和相应的专业技能。道德方面要求主试恪守测验工作者的职业道德。2. 主试者的知识结构：是开展心理测验工作所必须具备的基础知识和与专业相关的知识。3. 主试者的专业理论知识具体的说是：主试者对心理测验的特点和性质、它的作用和局限性有清楚的认识；了解测验的基本特征，如信度、效度、难度和区分度等心理测量学指标；熟悉保证心理标准化的必要性。4. 主试必须具有实际操作心理测验的专业技能和经验，接受严格、系统的心理测验专业训练熟悉有关测验

46、的内容、使用范围、测验程序和记分方法等。5. 主试者的职业道德包括：测验的保密和控制使用、测验中个人隐私的保护。6. 测验选择的要求是：（1）必须适合测量的目的；（2）必须符合心理测量学的要求。7. 测验前的准备工作主要包括：预告测验；准备测验材料；熟悉测验指导语；熟悉测验的具体程序。8. 测验中主试的职责：应按照指导语的要求实施测验测验前不讲太多无关的话不应对被试者的反映做出暗示性反应，应时刻保持和蔼、微笑的态度。对特殊问题要有心理准备9. 协调关系是主试和被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系。1. 指导语一般由以下内容组成：如何选择反应形式；如何记录这些反应

47、；时间限制；如果不能确定反应时该如何操作；例题；有时告知被试测验目的。2. 除了典型行为测验，大多数测验都有时间限制。3. 对测验环境条件的要求有：必须完全遵从测验手册的要求；记录下任何意外的测验环境因素；在解释测验结果时也必须考虑这一因素4. 被试者对测验的经验或应试技巧会影响测验成绩，“测验油子“的表现有：能觉察出正确答案与错误答案的细小差别；懂得合理分配测验时间；常常是各种题型都见过；熟悉测验的程序。5. 练习效应的具体表现为：精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 12 页，共 15 页

48、- - - - - - - - - - 教育背景较差、经验较少或智力较高者，受练习效应的影响较大；着重速度的测验，练习效应较为明显；重复实施相同的测验，受练习效应影响程度大于复本的测验；两次测验之间的时距越大，练习效应越小，相距三个月以上练习效应可忽略不计；一般的平均练习效应，约在1/5 个标准差以下，而且仅限于第一次及第二次重测，第三次以后练习效应不明显。6. 投射测验受应试动机的影响不太大。7. 影响测验焦虑的因素有哪些？能力高的人，测验焦虑一般较低，而对自己能力没把握的人，测验焦虑较高；抱负水平过高，求胜心切的人，测验焦虑较高；具有某种人格特点，如缺乏自信、患得患失、情绪不稳定的人易产生

49、测验焦虑；测验成绩与被试的关系重大，或被试受到的压力过大，容易使其产生测验焦虑；经常接受测验的人叫焦虑较低，而对测验程序不熟悉，尤其是测验中采取了新的题目形式或实施程序会增加测验焦虑。8. 适度的焦虑会提高智力测验、成就测验和能力倾向测验的成绩。1. 反应定势：又叫反应风格，是独立于测验内容的反应倾向，即由于每个人回答问题的习惯不同，而使能力相同的被试得到不同的测验分数。2. 除非“反应速度”本身即为重要的研究目标，否则应让被试有充分的时间反应，同时应该注明每道题的答题时间，以减少求“快”与求“精确”定势的影响。3. 在编制是非题时， “是”“否”题大致相等或答“否”题略多，是控制喜好正面叙述

50、的反应定势（肯定定势）的有效方法。4. 在测验编制过程中，正确答案的位置在整个测验中出现在各位置的概率相等，就可以控制喜好特殊位置定势。5. 在编制测验时，尽量使选项长度一致，就可以避免喜好较长选项的反应定势。6. 猜测的反应定势。敢于猜测的被试比谨慎的被试更容易得高分。1. 无论哪种测验，为使评分尽可能客观，有3 点要求：及时而清晰地记录反应情况。要有一张标准或正确反映的表格，即记分键。将被试的反应和记分键比较，对反应进行分类。2. 解释分数的原则：永远把测验分数视为一个范围，而不是一个点。如在韦氏测验中，通常用测得的IQ 加减 5（85%90%的可信限水平）的方法来判断IQ 值的波动范围。

展开阅读全文