心理测量学的知识(共14页).doc-淘文阁

资源描述

《心理测量学的知识(共14页).doc》由会员分享，可在线阅读，更多相关《心理测量学的知识(共14页).doc（14页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精选优质文档-倾情为你奉上第五章心理测量学知识第一节概述第一单元测量与测量量表一、什么是测量1.测量是依据一定的法则用数字对事物加以确定。该定义包括三个要素，即事物、数字和法则。2.数字具有区分性、序列性、等距性和可加性。二、则量要素（一）参照点1.要确定事物的量，必须有一个计算的起点，这个起点叫做参照点。2.参照点有两种：一是绝对零点。二是人为确定的参照点，即相对零点。3.理想的参照点是绝对零点，但在心理测量中很难找到绝对零点，多采用人为标定的测量零点。（二）单位：具备两个条件1.有确定的意义。2.有相同的价值。三、测量量表根据量表的精确程度，斯蒂文斯将测量从低级到高级分成四种水平：（

2、一）命名量表1.命名量表是测量水平最低的一种量表形式，只用数字来代表事物或把事物归类。2.这种量表分为两种：（1）代号用数字来代表个别事物。（2）类别用数字来代表具有某一属性的事物的全体。3.在命名量表中，数字只用来作标记和分类，而不能作数量化分析，既不能比大小，也不能做加、减、乘、除运算。（二）顺序量表1.顺序量表比命名量表水平高，其中的数字不仅指明类别，同时也指明类别的大小或含有某种属性的程度。2.数字包含有数量关系，代表符号是“”，如ABC等，主要用于分等或排出顺序。3.顺序量表既无相等单位，又无绝对零点，数字仅表示等级，并不表示某种属性的真正量或绝对值。（三）等距量表1.有大小关系，而

3、且具有相等的单位，其数值可做加、减运算，但因为没有绝对零点，所以不能做乘、除运算。2.等距量表的数值加上或减去一个常数，或者用一个常数去乘或除，不会破坏原来数据之间的等距关系。（四）等比量表1.等比量表是最高水平的量表，既有相等单位，又有绝对零点。2.长度、重量、时间等都是等比量表，其数值可以做加、减、乘、除运算。心理测量是在顺序量表上进行，利用某种统计方法，可以把顺序量表得到的数据换算为等距数据来进行统计。第二单元心理测量的基本概念一、心理测量的定义：依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段

4、。二、心理测量的性质（一）间接性（二）相对性（三）客观性第三单元心理测验的分类一、按测验的功能分类（一）智力测验：智力测验的功能是测量人的一般智力水平。（二）特殊能力测验：特殊能力测验偏重测量个人的特殊潜在能力。（三）人格测验：主要用于测量性格、气质、兴趣、态度、情绪、动机、信念等方面的个性心理特征，亦即个性中除能力以外的部分。二、按测验材料的性质分类（一）文字测验（二）操作测验：又称非文字测验。三、按测验材料的严谨程度分类（一）客观测验：绝大多数心理测验都属这类测验。（二）投射测验：代表性有罗夏测验、主题统觉测验、自由联想测验和句子完成测验。四、按测验的方式分类（一）个别测验（二）团体测验

5、：团体测验材料，也可以个别方式实施，但个别测验材料不能以团体方式进行。五、按测验的要求分类（一）最高行为测验（二）典型行为测验：各种人格测验均属典型行为测验。第四单元纠正错误的测验观一、错误的测验观（一）测验万能论（二）测验无用论（三）心理测验即智力测验二、正确的测验观（一）心理测验是重要的心理学研究方法之一，是决策的辅助工具。（二）心理测验作为研究方法和测量工具尚不完善第五单元心理测验在心理咨询中的应用一、智力测验二、人格测验三、心理评定量表第六单元心理测量的发展史一、科学心理测验的产生与发展1.首先倡导科学心理测验的学者是英国生物学家和心理学家高尔顿。2.高尔顿提出人的不同气质特点和

6、智能是按身体特点的不同而遗传的。为了研究差异的遗传性，便设计了测量差异的方法。3.高尔顿为心理测验奠定了统计学基础，第一个提出了相关的概念。4.皮尔逊创立积差相关法，这使判定心理测验的信度、效度和进行因素分析成为可能。5.卡特尔发表“心理测验与测量”一文，这是心理测验第一次出现于心理学文献中。心理测验如果有一个普遍的标准，则其科学的与实用的价值都可以增加。6.比内用一种测验的方法去辨别和发现智力落后的儿童，是世界上第一个正式的心理测验。（一）操作测验的发展（二）团体智力测验的发展（三）能力倾向测验的发展（四）人格测验的发展二、现代心理测验在我国的发展近年来，我国的心理学家正在致力于心理测验的本

7、土化，编制适合我国文化背景的智力测验、适应行为量表等，并已取得了初步成果。第二节测验的常模第一单元常模团体一、常模团体的性质1.掌柜团体是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。2.在确定常模团体时，先确定一般总体，再确定目村总体，最后确定样本。二、常模团体的条件（一）群体的构成必须明确界定（二）常模团体群体必须是所测群体的代表性样本（三）样本的大小要适当1.取样误差与样本大小成反比。2.应从经济的或实用的可能性和减少误差这两方面来综合考虑样本的大小。3.如果总体数目小，只有几十个人，则需要100%的样本；如果总体数目大，一般最低不小于30或100个；全国性常模，一

8、般应有20003000人为宜。4.样本大小适当的关键是样本要有代表性。（四）标准化样组是一定时空的产物三、取样的方法取样即是从目标人群中选择有代表性的样本。（一）简单随机抽样（二）系统抽样（又称等距抽样）：要求目标总体无等级结构存在，无内部循环规律存在。（三）分组抽样：可以先将群体进行分组，再在组内进行随机取样。（四）分层抽样：分为两种方法：即分层比例抽样和分层非比例抽样。四、常模与常模分数（一）常模：1.常模是一种供比较的标准量数，由标准化样本测试结果计算而来，它是心理测验时用于比较和解释测验结果的参照分数标准。2.按照样本的大小和来源，通常有全国常模、区域常模和特殊常模。3.根据具体应用

9、标准和分数特征，则有百分位常模和标准分常模等。（二）常模分数1.常模分数就是施测常模样本后，将受测者的原始分数按一定规则转换出来的导出分数。2.导出分数的特性包括等单位、带参照点的有意义的导出分数。第二单元常模的类型一、发展常模个人的成绩与各种发展水平的人的平均表现相比较。根据这种平均表现所制成的量表就是发展常模，亦称年龄量表。在此量表中，个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。（一）发展顺序量表1.最直观的发展常模是发展顺序量表，说明儿童发育情况：发育正常、发育超前和发育滞后。2.葛塞尔发展程序表，按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平

10、。3.婴儿的感觉运动发展是4周眼睛；16周头；28周手；40周躯干、坐、爬；52周腿脚、站、行走。4.皮亚杰最著名的工作就是对守恒概念的研究。儿童5岁时理解质量守恒，6岁掌握重量守恒，7岁有容量守恒概念。（二）智力年龄1.比内西蒙量表中首先使用智力年龄的概念。2.一个儿童在年龄量表上所得的分数，就是最能代表他的智力水平的年龄。这种分数叫做智力年龄，简称智龄。3.年级当量：常模样本中6年级的算术平均分为35,某儿童在算术测验中也得35分，那么，就有“该儿童的算术能力是6年级水平”的表述。二、百分位常模（一）百分等级：应用最广的表示测验分数的方法。（二）百分点：也称百分位数1.在分数量表上，相对于

11、某一百分等级的分数点就叫百分点或百分位数。2.由原始分数计算百分等级，又可以由百分等级确定原始分数。通过这样的双向方式编制的原始分数与百分等级对照表，就是百分位常模。（三）四分位数和十分位数1.百分位数是将量表分成100份，而四分位数是将量表分成四等份，相当于百分等级的25%、50%、75%对应的三个百分点分成的四段。2.十分位数也可以依此类推，1%10%为第一段，91%100%为第十段。三、标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。基本单位是标准差，所以叫标准分数。（一）线性转换的标准分数：Z分数为最典型的线性转换的标准分数。原始分数转换成标准分数：X为任

12、一原始分数，X为样本平均数，SD为样本标准差。转换形式为：Z=A+B Z为转换后的标准分数，A、B为根据需要指定的常数。加上一个常数是为了去掉负值，乘以一个常数是为了使单位变小从而去掉小数点。T分数是以50为平均数，以10为标准差来表示的。标准九分是以5为平均数、以2为标准差的一个分数量表。标准十分是以5.5为平均数，以1.5为标准差。标准二十分是以10为平均数，以3为标准差。离差智商是以100为平均数，一般是以15为标准差。（二）非线性转换的标准分数：当原始分数不是常态分布时，也可以通过非线性转换使之常态化。常态化过程主要是将原始分数转化为百分等级，再将百分等级转化为常态分布上相应的标准分数

13、。四、智商及其意义若心理年龄高于其生理年龄，则智力较一般儿童高，若心理年龄低于其生理年龄，则智力较一般儿童低。但在使用中发现，单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性，提出用比率智商和离差智商来表示智力的高低。（一）比率智商：心理年龄MA与实足年龄CA之比。由于个体心理年龄与实足年龄并不同步增长，所以比率智商并不适合于年龄较大的受测者。（二）离差智商：韦克斯勒将离差智商的平均数定为100,标准差定为15.离差智商建立在统计学的基础之上，它表示的是个体智力在年龄组中所处的位置，因而是表示智力高低的一种理想的指标。从不同测验获得的离差智商只有当标准差相同或相近时才可以比较，标准

14、差不同，其分数的意义便不同。第三单元常模分数的表示方法一、转换表法1.最简单、最基本的表示常模的方法就是转换表，也叫常模表。2.一个转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数百分位数、标准分数、T分数或者其他任何分数。3.测验的使用者利用转换表可将原始分数转换为与其对应的导出分数，从而对测验的分数作出有意义的解释。二、剖面图法：是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出受测者在各个分测验上的表现及其相对的位置。第三节测验的信度第一单元信度的概念一、信度的定义1.信度是指同一受测者在不同时间内用同一测验重复测量，所得结果的一致程度。2.信度只受随机

15、误差的影响，随机误差越大，信度越低。二、信度的指标（一）信度系数与信度指数1.信度是以信度系数为指标，它是一种相关系数。常常是同一受测者样本所得的两组资料的相关。2.信度指数也可作信度的指标。信度指数的平方就是信度系数。（二）测量标准误测量的标准误与信度之间有互为消长的关系：信度越高，标准误越小；信度越低，标准误越大。第二单元信度评估的方法不同的信度反映测验误差的不同来源。一、重测信度1.重测信度又称稳定性系数。它的计算方法是采用重测法，即使用同一测验，在同样条件下对同一组受测者前后施测两次，求两次得分间的相关系数。2.重测估计信度的优点：能提供有关测验是否随时间而变化的资料，可作为受测

16、者将来行为表现的依据。其缺点是易受练习和记忆的影响。最适宜的时距一般是两周到四周较宜，间隔时间最好不超过六个月。二、复本信度1.复本信度又称等值性系数。复本信度反映的是测验在内容上的等值性，故又称等值性系数。2.两个复本的施测相隔一段时间，则称重测复本信度或稳定与等值系数。3.复本信度的优点是能够避免重测信度的一些问题，局限性：其一，如果测量的行为易受练习的影响，则复本信度只能减少而不能完全消除这种影响；其二，由于第二个测验只改变了题目的内容，已经掌握的解题原则，可以很容易地迁移到同类问题上去；其三，对于许多测验来说，建立复本是十分困难的。三、内部一致性信度重测信度和复本信度主要考察了测验跨

17、时间的一致性（稳定性）和跨形式的一致性（等值性）。（一）分半信度：指采用分半法估计所得的信度系数。通常是在测验实施后将测验按项目编号的奇数、偶数分为等值的两半，并分别计算每位受测者在两半测验上的得分，求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。（二）同质性信度1.同质性主要代表测验内部所有题目间的一致性。2.所有题目看起来好像测量同一特质，但相关很低或为负相关时，其测验为异质。四、评分者信度为了衡量评分者之间的信度高低，可随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再根据每份测验卷的两个分数计算相关，即得评分者信度。一般要求在成对的受过训练的评分者之

18、间平均一致性达0.9以上，才认为评分是客观的。第三单元信度与测验分数的解释一、解释真实分数与实得分数的相关当rxx=0.9时，说明实得分数中有90%的变异是真分数造成的，仅10%是来自测验的误差。rxx=1.00,则表示完全没有测量误差，rxx=0,反映的是测量误差。信度系数的分布是从0.00到1.00的正数范围，代表了从缺乏信度到完全可信的所有状况。二、确定信度可以接受的水平一般的能力测验和成就测验的信度系数都在0.90以上，有的可以达0.95；而人格测验、兴趣、态度、价值观等测验的信度一般在0.800.85或更高些。一般原则是：当rxx0.70时，测验因不可靠而不能用；当0.70rxx0

19、.85时，可用于团体比较；当rxx0.85时，才能用来鉴别或预测个人成绩或作为。另一个原则是：新编的测验信度应高于原有的同类测验或相似测验。三、解释个人分数的意义1.主要体现在两个方面：一是估计真实分数的范围；二是为了解实得分数再测时可能的变化情形。人们一般采用95%的概率水平，其置信区间：X-1.96SEXTX+1.96SE四、比较不同测验分数的差异第四单元影响信度的因素一、样本特征（一）样本团体异质性的影响一般而言，若获得信度的取样团体较为异质的话，往往会高估测验的信度，相反则会低估测验的信度。（二）样本团体平均能力水平的影响二、测验长度1.测验长度，亦即测题的数量。一般来说，在一个测

20、验中增加同质的题目，可以使信度提高。第一，测验越长，测验的测题取样或内容取样就越有代表性。第二，测验越长，受测者的猜测因素影响就越小。增加测验长度的效果应遵循报酬递减率原则，测验过长是得不偿失的，有时反而会引起受测者的疲劳和反感而降低可靠性。三、测验难度难度对信度的影响，只存在于某些测验中，如智力测验、成就测验、能力倾向测验等，对于人格测验、兴趣测验、态度量表等不存在难度问题，因为这些测验的题目的答案没有正确或错误之分。四、时间间隔以再测法或复本法求信度，两次测验相隔进间越短，其信度系数越大；间隔时间越久，其他变因介入的可能性越大，受外界的影响也越大，信度系数便越低。第四节测验的效度第一单元

21、效度的概念一、效度的定义1.在心理测验中，效度是指所测量的与所要测量的心理特点之间的符合程度，或者简单地说是指一个心理测验的准确性。2.测量的效度除受随机误差影响外，还受系统误差的影响。可信的测验未必有效，而有效的测验必定可信。二、效度的性质（一）相对性：必须考虑其目的与功能（二）连续性第二单元效度评估的方法一、内容效度（一）内容效度：指的是测验题目对有关内容或铜佛取样的适用性，即该测验是否是所欲测量的行为领域的代表性取样。（二）内容效度的评估方法1.专家判断法：请有关专家对测验题目与原定内容的符合性做出判断，看测验的题目是否代表规定的内容。如果专家认为测验题目恰当地代表了所测内容，则测验

22、具有内容效度，内容效度有时又称“逻辑效度”。2.内容效度确定的三个步骤：（1）定义好测验内容的总体范围，描述有关的知识与技能及所用材料的来源；（2）编制双向细目表。（3）制定评定量表来测量测验的整个效度。2.统计分析法：除了描述性语言外，内容效度的确定也可采用一些统计分析方法，如计算两个评分者之间评定的一致性，复本相关，再测法。3.经验推测法（三）内容效度的特性1.表面效度是由外行对测验作表面上的检查确定的，它不反映测验实际测量的东西，只是指测验表面上看来好像是测量所要测的东西。2.内容效度是由够资格的判断者（专家）祥尽地、系统地对测验作评价而建立的。3.最高行为测验要求有较高的表面效度，典型

23、行为测验却要求较低的表面效度。二、构想效度（一）什么是构想效度（或结构效度）：涉及的是心理学的理论概念问题，是指测验能够测量到理论上的构想或特质的程度，即测验的结果是否能证实或解释某一理论的假设、术语或构想，解释的程度如何。（二）构想效度的估计方法1.对测验本身的分析：是通过研究测验内部结构来界定理论要想，从而为构想效度提供证据。如测验的内容效度，测验的内部一致性指标，分析受测者对题目的反应特点。2.测验间的相互比较：计算两种测验之间得分的相关，其中一个测验是待研究效度，另一个是已有效度证据的成熟的测验，但两者测量的是同一种心理特质。假如相关高，说明新测验能所测量的特质确实是老测验所反映的特质

24、或行为。两种测验之间的相关系数称为相容效度，相容效度是构想效度的证据之一。如区分效度，因素分析法。3.效标效度的研究证明（1）根据效标选取不同的受测者形成相对照的两组，再比较两组受测者的测验成绩，若测验分数能很好地将两组分开，则说明构想效度不错。（2）另一种证实构想效度的方法是分析心理持质的发展变化。4.实验法和观察法证实三、效标效度（一）什么是效标效度1.效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度。这种效度需要在实践中检验，所以又称实证效度。2.根据效标资料是否与测验分数同时获得，又可以分为同时效度和预测效度两类。同时效度和预测效度意义上的差异，主要不是来源于时间，而是来自

25、测验的目的，前者与用来诊断现状的测验有关，后者与预测将来结果的测验有关。3.一个好的效标必须具备四个条件：（1）效标必须能最有效地反映测验的目标，即效标测量本身必须有效。（2）效标必须具有较高的信度，稳定可靠，不随时间等因素而变化。（3）效标可以客观地加以测量，可用数据或等级来表示。（4）效标测量的方法简单，省时省力，经济实用。（二）效标效度的评估方法1.相关法：是评估效标效度最常用的方法，是求测验分数与效标资料间的相关，这一相关系数称为效度系数。计算效度系数最常用积差相关法。当测验成绩是连续变量，而效标资料是二分变量时，计算效度系数可用点二列相关公式或二列相关公式。点二列相关与二列相关的区别

26、是前者其中一个是真正的二分称名变量，而后者两个变量原来都是连续变量，其中一个由于某种原因，被人为地分为两个类别，变成了二分称名变量。当测验分数为连续变量，效标资料为等级评定时，用贾斯朋多系列相关公式计算。2.区分法：是检验测验分数能否有效地区分由效标所定义的团体的一种方法。3.命中率法：（1）预测成功而且实际也成功；预测成功但实际失败；预测失败而事实上成功；预测失败且实际上也失败。我们称正确的预测（决定）为命中，不正确的预测（决定）为失误。（2）正命中率高低常随划分测验分数成功与失败的临界分数的高低而变化，临界分数越高，正命中率越高；临界分数越低，则正命中率也越低。第三单元效度的功能一、预测

27、误差：效度系数的实际意义常常以决定性系数来表示，决定性系数是效度系数的平方，它表示测验正确预测或解释的效标的方差占总方差的比例。二、预测效标分数是预测的效标分数三、预测效率指数第四单元影响效度的因素凡能产生随机误差和系统误差的因素都会降低测验的效度。一、测验本身的因素要保证测验具有较高效度，要做好如下几点：第一，测验材料必须对整个内容具有代表性。第二，测题设计时应尽量避免容易引起误差的题型。第三，测题难度要适中，具有较高的区分度。第四，测验长度要恰当，要有一定的测题量。第五，测题的排列按先易后难的顺序排列。二、测验实施中的干扰因素（一）主测者的影响因素（二）受测者的影响因素三、样本团体的性

28、质（一）样本团体的异质性：与信度系数一样，如果其他条件相同，样本团体越同质，分数分布范围越小，测验效度就越低；样本团体越异质，分数分布范围越大，测验效度就越高。（二）干涉变量1.对于不同性质的团体，同一测验的效度会有很大的不同。这些性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和任何其他有关的特征。由于这些特征的影响，使得测验对于不同的团体具有不同的预测能力，故测量学上称这些特征为干涉变量。2.确定干涉变量引用美国心理学家吉赛利提出的一套方法：第一，用回归方程求得每个人的预测效标分数，将该分数与实际效标分数相比较，获得差异分数D。如果D的绝对值很大，说明测验中可能存在干涉变量。第二，根据

29、样本团体的组成分析，找出对照组，分别计算效度。第三，对于欲测团体，根据某些易见的干涉变量将其区分为预测性高和预测性低的两个亚团体。四、效标的性质：效标测量本身的可靠性即效标测量的信度，就是值得考虑的一个问题。第五节项目分析测验的项目分析包括定性分析和定量分析两个方面。定性分析包括考虑内容效度、题目编写的恰当性和有效性等；定量分析主要是指对题目难度和区分度等进行分析。第一单元项目的难度一、定义1.难度是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标，在非能力测验中，类似的指标是“通俗性”。2.公式：3.以通过率表示难度时，通过人数越多，难度越低；通过人数越小，难度越高。二、计算

30、方法（一）二分法记分的项目：通过记1分，错误记0分。其中PH和PL分别代表高分组和低分组通过率。（二）非二分记分的项目其中Xmax为该题的满分。三、难度水平的确定（一）项目的难度1.进行难度分析的主要目的是为了筛选项目，项目难度的大小，取决于测验的目的、性质以及项目的形式。2.P值一般应大于概率水平。对于是非题而言，其难度值应该为0.75最为合适；而对于四选一的题目，其难度值约为0.63最为合适。（二）测验的难度1.受测者样本具有代表性，对于中等难度的测验，其测验总分应该接近常态分布。2.最好使测验中所包含的试题的难度在0.500.20之间，平均难度接近0.50.第二单元项目的区分度一、定

31、义：也叫鉴别力，是指测验项目对受测者的心理特性的区分能力。实际水平高的受测者能顺利通过，百实际水平低的受测者不能通过，我们就可以认为该项目有较高的区分度。二、计算方法（一）鉴别指数：步骤第一，按测验总分的高低排列答卷。第二，确定高分组与低分组，每一组取答卷总数的27%。第三，分别计算高分组与低分组在该项目上的通过率或得分率。第四，按下列公式估计出项目的鉴别指数：高分组若在该测验上的得分率高于低分组，则D0,D越大，说明该项目区分两种不同水平的程度越高。若D0,则反映高水平组在该项目上的得分率低于低水平组，说明项目有问题。鉴别指数0.40以上，很好；鉴别指数0.19以下，差，必须淘汰。（二）相关

32、法：常用的计算方法有点二列相关、二列相关和相关法等。相关越高，表明项目越具有区分的功能。区分度取值范围介于-1至+1之间，若呈正相关，则区分度为正值；相关系数越大，区分度越高。三、区分度与难度的关系1.较难的项目对高水平的受测者来说区分度高，较易的项目对低水平的受测者来说区分度高，中等难度的项目对中等水平的受测者区分度高。2.项目难度的分布以常态分布为好，这样不仅能保证多数项目具有较高的区分度，而且可以保证整个测验对受测者具有较高的区分能力。第六节测验编制的一般程序第一单元测验的目标分析一、测验的对象：在编制测验前，首先要明确测量的对象，也就是该测验编成后要用于哪些团体。只有对受测者的年

33、龄、文化程度、社会经济状况以及阅读水平等做到心中有数，编制测验时才能有的放矢。二、测验的用途（一）显示性测验：是指测验题目和所要测量的心理特征相似的测验。古德纳夫分为样本测验和标记测验。（二）预测性测验：是指预测一些没被测量的行为的测验。三、测验的目标：是指编制的测验是测什么的，即用来测量什么样的心理变量或行为特征。（一）工作分析：步骤第一，确定哪些心理特征和行为可以使要预测的活动达到成功。第二，建立衡量受测者是否成功的标准，这个标准我们称之为效标。（二）对特定概念下定义（三）确定测验的具体内容第二单元测题的编写编制测验题目是心理测验编制过程中最重要的一环。一、搜集资料：题目的来源分三方面（

34、一）已出版的标准测验：最简单、最直接的方法是从已经出版的各种标准测验中选择合适的题目。（二）理论和专家的经验（三）临床观察和记录二、命题原则（一）内容方面：要求题目的内容符合测验的目的，避免贪多而乱出题目；内容取样要有代表性，题目之间的内容要相互独立。（二）文字方面：使用准确的当代语言，语句要简明扼要，既排除与答案无关的因素，最好是一句话说明一个概念。（三）理解方面：题目应有确切的答案，题目的内容不要超出受测团体的知识水平和理解能力；题目不可令人费解，更不能有歧义。（四）社会敏感性方面涉及这类社会敏感性问题鼓励受测者做出真实回答采取三条策略：第一，命题时假定受测者具有某种行为。第二，命题时假

35、定规范不一致。第三，指出该行为虽然是违规的，但是却是常见的。三、编制要领（一）选择题：分题干和选项。注意六点：第一，题干所提的问题必须明确。第二，选项切忌冗长，要简明扼要。第三每道题只给一个正确答案，其他属诱答。第四，各选项长度应相等，尽量不要有长有短。第五，避免题干用词与选项用词一致，否则成了选择答案的线索。第六，选项最好用同一形式。（二）是非题，又叫正误题，注意五点：第一，内容应以有意义的概念、事实或基本原则为基础。第二，每道题只能包含一个概念。第三，尽量避免否定的叙述，尤其是要避免用双重否定的叙述。第四，若是表达意见的题目，最好说明意见的来源和根据。第五，是非题的数目应有适当比例，基本相

36、等，且要随机排列。（三）简答题：三条原则第一，最好采用问句形式。第二，如果是填充形式，空格不宜太多。第三，每道题应只有一个正确答案，而且答案要简短而具体。（四）操作题：四条原则第一，明确所要测量的目标，并将其操作化。第二，尽量选择逼真度较高的项目。第三，指导语要简明扼要。第四，制订评分标准，确定记分方法。第三单元测验的编排和组织一、合成测验（一）选择与审定试题1.选择试题形式：关键是如何选择“最优”形式。考虑三点（1）测验的目的和材料的性质。（2）接受测验的团体的特点。（3）各种实际因素。2.审定题目：四个问题（1）题目的范围应与测验计划所列的内容技能双向细目表相一致。（2）题目的数量要比最

37、后所需的数目多一倍至几倍，以备筛选或编制复本。（3）题目的难度必须符合测验的目的。（4）题目的说明必须清楚明白。（二）测题的编排：1.原则第一，测题的难度排列宜逐步上升。第二，尽可能将同类型的测题组合在一起。第三，注意各种类型测题本身的特点。2.两种常见的测题排列方式：第一，并列直进式。第二，混合螺旋式。二、测验的预试（一）预测：注意四个问题第一，预测对象应取自将来正式测验准备应用的群体。第二，预测的实施过程与情境应力求与将来正式测验时的情况相近似。第三，预测的时限可稍宽一些，最好使每个受测者都能将题目做完，以搜集较充分的反应资料，使统计分析的结果更为可靠。第四，在预测过程中，应对受测者的反应

38、情形随时加以记录。（二）项目分析：包括质的分析和量的分析两个方面。三、信度和效度考察四、常模制订五、编写指导手册：内容第一，测验的目的和功用。第二，测验编制的理论背景以及测验中的材料是根据什么原则、应用什么方法选择出来的。第三，如何实施测验的说明。第四，测验的标准答案或记分标准。第五，常模资料。第六，测验的基本特征。第七节心理测验的使用第一单元主测者的资格主测者的资格包括技术和道德两方面的要求。一、知识结构：是指开展心理测验工作所必须具备的基础知识和专业知识。二、专业理论知识和专业技能（一）专业理论知识：包括要求主测者对心理测验的特点和性质、作用和局限性有清楚的认识；了解测验的基本特征；熟

39、悉心理测验标准化的必要性。（二）专业技能：主测者必须具有实际操作心理测验的专业技能和经验，接受严格、系统的心理测验专业训练，熟悉有关测验的内容、适用范围、测验程序和记分方法等。三、职业道德（一）测验的保密和控制使用（二）测验中个人隐私的保护第二单元测验的选择一、所选测验必须适合测量的目的二、所选测验必须符合心理测量学的要求第三单元测验前的准备及注意事项一、测验前的准备工作（一）预告测验（二）准备测验材料（三）熟悉测验指导语（四）熟悉测验的具体程序二、测验中主测者的职责第一，应按照指导语的要求实施测验，不带任何暗示。第二，测验前不讲太多无关的话。第三，对于受测者的反应，主测者不应做出点头、皱

40、眉、摇头等暗示性动作，会影响对受测者以后的施测，主测者应时刻保持和蔼、微笑的态度。第四，对特殊问题要有心理准备。三、建立协调关系：是主测者和受测者之间一种友好的、合作的、能促使受测者最大限度地做好测验的一种关系。第四单元测验实施的程序及要素一、指导语（一）对受测者的指导语：一般由以下内容构成：第一，如何选择反应形式。第二，如何记录这些反应。第三，时间限制。第四，如果不能确定正确反应时该如何操作。第五，例题。第六，有时告知受测者测验目的。（二）对主测者的指导语二、时限：大多数典型行为测验是不受时间限制的。三、测验的环境条件：对于测验的环境条件，不仅必须完全遵从测验手册的要求，而且还要记录任何意

41、外的测验环境因素，并且在解释测验结果时也必须考虑这一因素。第五单元受测者误差及控制方法一、应试技巧与练习效应（一）应试技巧：“测验油子”能觉察出正确答案与错误答案的细小差别，懂得合理分配测验时间，而且常常是各种题型都见过。（二）练习效应：测验成绩较高的表现有以下几种第一，教育背景较差、经验较少或智力较高者。第二，着重速度的测验，练习效应较为明显。第三，重复实施相同的测验。第四，两次测验之间的时距越大，练习效应越小，相距三个月以上的练习效应可忽略不计。第五，一般的平均练习效应约在1/5个标准差以下。二、动机与焦虑因素（一）应试动机：测量成就、智力和能力倾向等变量时，受测者的动机强烈。（二）测验

42、焦虑：适度的焦虑提高智力测验、成就测验和能力倾向测验的成绩。测验焦虑受五个因素影响：第一，能力高的人，测验焦虑一般较低，而对自己能力没有把握的人，测验焦虑较高。第二，抱负水平过高，求胜心切的人，测验焦虑较高。第三，具有某种人格特点。第四，测验成绩与受测者的关系重大，或受测者受到的压力过大，容易使其产生测验焦虑。第五，经常接受测验的人焦虑较低，而对测验程序不熟悉，尤其是测验中采取了新的题目形式或实施程序，会增加测验焦虑。三、反应定势：也称反应风格，是指独立于测验内容的反应倾向，即由于每个人回答问题的习惯不同，而使能力相同的受测者得到不同的测验分数。几种常见的反应定势对测验的影响如下：（一）求“快

43、”与求“精确”的反应定势。如果测验有时间限制，或测验本身属于速度测验，求“精确”的反应定势就可能降低测验成绩；如果纯粹是难度测验，则求“快”的反应定势就可能降低测验成绩。除非“反应速度”本身即为重要的研究目标，否则应让受测者有充分的时间反应，以减少求“快”与求“精确”定势的影响。（二）喜好正面叙述的反应定势。在编制是非题时，“是”、“否”题大致相等或答“否”题略多，是控制肯定定势的有效方法。（三）喜好特殊位置的反应定势，正确答案的位置在整个测验中出现在各位置的概率相等，就可以控制这种位置定势。（四）喜好较长选项的反应定势，在编制测验时，只要我们尽量使选项的长度一致，就不难避免这类问题。（五）猜

44、测的反应定势第六单元测验的评分一、原始分数的获得1.对于自由反应的题目，评分者之间很难取得完全一致，而选择题、是非题的评分较为客观，因此有人将由此类题目组成的测验称做客观性测验。2.为了使评分尽可能的客观，有如下要求：第一，及时而清楚地记录反应情况。第二，要有记分键。第三，将受测者的反应和记分键比较，对反应进行分类。二、原始分数的转换第七单元测验结果的报告一、测验分数的综合分析第一，应根据心理测验的特点进行分析。韦氏智力测验中，通常是用测得的IQ值加减5（85%-90%的可信限水平）的方法判断IQ值的波动范围。第二，不能把分数绝对化，更不能仅仅根据一次测验的结果轻易下结论。第三，为了对测验

45、分数做出确切的解释，只有常模资料是不够的，还必须有测验的信度和效度资料。要依据从最相近的团体、最匹配的情境中获得的资料。第四，对于来自不同测验的分数不能直接加以比较。人们常用等值百分位法将两种分数等值化，另一种方法是不用相同的百分等级作为中介，而用相同的标准分数作等值的基础，此种方法叫线性等值。二、报告分数的具体建议在报告分数时要注意如下七个问题：第一，应告知对于测验分数的解释，并非仅仅报告测验分数。第二，要避免使用专业术语。第三，要保证当事人知道这个测验测量或预测什么。第四，要使当事人知道他是和什么团体在进行比较。第五，要使当事人知道如何运用他的分数。第六，要考虑测验分数将给当事人带来的心理影响。第七，要让当事人积极参与测验分数的解释。专心-专注-专业

展开阅读全文