2022年心理与教育测量重点总结 .pdf-淘文阁

资源描述

《2022年心理与教育测量重点总结 .pdf》由会员分享，可在线阅读，更多相关《2022年心理与教育测量重点总结 .pdf（14页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、心理与教育测量第一章心理与教育测量概论（一）一般测量概论1. 测量：依据一定的法则使用量尺对事物的属性进行定量描述的过程。2. 测量的基本要素：（1）参照点 : 绝对参照点：以绝对的零点作为测量的起点，如长度测量相对参照点：以人为确定的零点为测量的起点，如对地势高度的测量。（2）测量的单位：要有确定的意义，即对同一单位，所有人的理解都是相同的。要有相等的价值，即第一个单位与第二个单位之间的距离等于第二个单位与第三个单位之间的距离。3. 测量的量表：能够使事物的特征数量化的数字的连续体。陈名量表 -用数字代表事物的成分或用数字对事物经行分类，但该类数字没有数量的意义。可细分为两种形式，一是命名

2、量表（用数字指代个别事物，如用数字给运动员编号）；二是类别量表（用数字指代事物的种类，如用1、2、3 分别代表不同的职业类型）。其适用的统计方法有百分比、次数、众数和卡方检验。顺序量表 -其中的数字不仅能够指代类别，而且能够表明不同类别的大小、等级或事物具有某种特征的程度，它既没有相等距离的单位，也没有固定的测量原点。适用的统计方法有中位数、百分位数、等级相关系数和肯德尔和谐系数等。等距量表 -不仅能够指代事物的类别和等级，而且具有相等距离的测量单位。没有绝对的零点，适用的统计方法有平均数、标准差、积差相关系数、等级相关系数以及t 检验和 F 检验。比率量表 -具有类别、等级和等距的特征外，还

3、具有绝对的零点或固定的原点。适用的统计方法除了与等距量表相同外，还与几何平均数、变异系数相同。（二）心理与教育测量的性质1. 心理与教育测量的定义：依据一定的心理学和教育学理论在测验上对人的心理特质和教育成就进行定量描述的过程。2. 心理与教育测量的量表属于顺序量表的原因：从所使用的参照点来说，教育测量和心理测量领域的参照点均为相对零点。从所使用的单位来说，教育与心理测量的单位远没有其他测量的单位成熟和完善。3.标准化需具备的条件：测验内容的标准化施测条件的标准化评分规则的标准化测验常模的标准化4. 心理与教育测验的种类：（1）常模参照测验-以常模为参照编制的测验（如高考只有百分之几的人可以进

4、入重点大学）标准参照测验（目标参照测验）-以标准为参照编制的测验（如，视力测验、考驾照）（2）智力测验 -测量个人的智力（一般认知能力）水平的高低能力倾向测验-测量个人的潜在才能，预测个人的能力发展倾向成就测验 -测量个人在接受教育后的学业成（3）个别测验 -同一主试在同一时间只能测量一个被试团体测验 -同一主试在同一时间内能够测量许多被试（4）难度测验 -识别个人能够达到的最高水平速度测验 -识别个人做题的最快速度精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 1 页，共 14 页 - - - - -

5、- - - - - 第二章心理与教育测量简史1.高尔顿：把统计方法应用到对个别差异资料的分析之中2.卡特尔：首次提出“心理测验”这个术语认为心理学只有立足于实验与测量，才能达到如同自然科学一样的准确性认为心理测验只有建立普遍的统一标准，并与常模相比较，才能充分地实现其科学价值和实用价值3.比内：1903 年，智力的实验研究问世，提出了智力的定义，认为智力是高级心理过程，包括推理、判断以及运用已知知识解决新问题的能力1904 年与其助手西蒙合作完成了世界上第一个智力测验量表-比内 -西蒙量表，因此成为了心理测验的鼻祖4.智力测验的发展：最著名的的是推孟于1916 年修订的斯坦福-比内量表。其

6、中影响最为深远的变动是推孟采用了比率智商的概念来表示智力水平的高低第一个团体测验-陆军甲种测验和陆军乙种测验30 年代后，瑞文相继编制了瑞文标准推理测验、瑞文彩色推理测验、瑞文高级推理测验韦克斯勒舍弃了比率智商，而用离差智商代之，从而克服了比率智商的局限；他编制的智力量表分为言语量表和操作量表两部分5.能力倾向测验的发展：最初被称为“学业能力倾向测验”，后来进一步扩展到职业咨询、工业部门及军事领域的人才选拔和安置工作领域。在编制成套能力倾向测验的过程中，因素分析方法起了重要的作用。6.成就测验的发展：20 世纪初，桑代克编制了第一个标准化的教育成就测验。因此而被公推为教育测量的鼻祖。1923

7、年，凯利、鲁奇和推孟合作编制了第一个成套成就测验- 斯坦福成就测验20 世纪 30 年代后期，在美国出现了跨州、跨区域乃至全国的测验程序7.人格测验的发展：20 世纪初叶，出现了自陈人格问卷。伍德沃斯用自陈问卷法编制了适用于诊断士兵神经症的个人资料调查表；卡特尔编制了卡特尔16 种人格问卷；埃森克编制成埃森克人格问卷；美国明尼苏达大学的哈撒韦和莫垦利编制成明尼苏达多项人格调查表。另一种技术是投射测验。罗夏克墨迹测验；哈罗尔编制了以团体方式实施的墨迹测验。第三章经典测验理论的基本假设1.心理特质：表现在一个人身上所特有的相对稳定的行为方式2.测量误差：（1）含义：在测量过程中由那些与测量目的无

8、关的变化因素所产生的一种不准确或不一致的测量效应（2）种类：随机误差 -由与测量目的无关的偶然因素引起的而又不易控制的误差，其方向和大小的变化完全是随机的。例如在进行手枪射击时，新手往往很难控制手臂的轻微摆动。系统误差 -由与测量目的无关的变因引起的一种恒定而有规律的效应。例如，在设计过程中，尽管射击手非常优秀，每次结果都很一致，但若是枪的准心有点儿毛病，则其射击结果将会有稳定的偏差。（3）来源：测量工具：心理测量量表是否稳定、是否真正测到了我们所要测的东西是测量工具造精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - -

9、- - -第 2 页，共 14 页 - - - - - - - - - - 成误差的两种主要原因。测量对象：主要原因是受测者的真正水平是否得到真正发挥。施测过程：主要是一些偶然因素（恒定因素较易控制）3.真分数：（1）概念：反映被试某种心理特质真正水平的那个数值称作该特质的真分数（简称T 分数），真分数是一个在理论上构想出来的抽象概念，在实际测量中是很难得到的。（2）数学模型：观察分数（记为X）与真分数（ T）之间是一种线性关系，并只相差一个随机误差（记之为 E）。即X=T+E （3）假设：若一个人的某种心理特质可以用平行的测验反复测量足够多次，则其观察分数的平均值会接近于真分数。真分数和

10、误差分数之间的相关为零。各平行测验上的误差分数之间相关为零。（4）推导：S2X =S2T + S2E即在一次测量中，被试观察分数的方差等于其真分数方差与误差分数方差之和。第四章测量信度1.概念：测量结果的稳定性程度。也是一致性，可靠性。2.定义：信度（信度系数）是一个被测团体的真分数的变异数与实得分数的变异数之比，即 rXY = S2T /S2X 信度是一个被试团体的真分数与实得分数的相关系数的平方。即rXY =2xT信度是一个测验x（A 卷）与它的任意一个“平行测验”x （B 卷）的相关系数，即rXY =xx3.作用

11、：（1）信度是测量过程中所存在的随机误差大小的反映（2）信度可以用来解释个人测验分数的意义标准误：每个人两次测量的分数之差可以构成一个新的分布，这个分布的标准差就是测量的标准误，它是此次测量中误差大小的客观指标，有了这一指标，我们就可以对团体中任何一个人的测验成绩做出恰当的解释。公式：SE=SX 1-rxx（SE是标准误， SX是实得分标准差，rxx是信度）置信区间：当测验满足经典测验理论的三大假设时，根据以上估计的测量标准误便可用以下方法构建测验真分数估计的置信区间：公式：x - ZCSE T x + ZCSE （x 是被试的观测分数，SE为测量标准误，ZC是对应于某个统计检验显著性水平的

12、标准正态分布下的临界值）注：例题参考 P52 最上面。4.信度的估计方法：（1）重测信度：定义 -用同一个量表对同一组被试施测两次所得结果的一致性程度。其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数：)()()(22yyxxyyxxrxx（x和是x第一次测量的实得分数及实得分数的平均值；y和y是第二次测量的实得分数及实得分数的平均值，精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 3 页，共 14 页 - - - - - - - - - - xxr是重测信度。公式不要求记，但要会用）使用的前

13、提 - A 所测量的心理特性必须是稳定的B 遗忘和练习的效果基本上相互抵消C 在两次实测的间隔期内，被试在所要测查的心理特质方面没有获得更多的学习和训练误差来源 -A 测验本身B 被试方面（个体差异）C 偶发因素干扰优缺点 -A能提供测验结果是否随时间而变化的资料，可作为预测被试特定行为的依据。B 易受练习和记忆的影响意义 -A反应的是在测验时间上的等值性B 适用于速度测验与人格测验，不适用于难度测验（2）复本信度：定义 -A 复本信度 -指两个平行的测验测量同一批被试所得结果的一致性程度。其大小等于同一批被试在两个副本测验上所得分数的皮尔逊积差相关系数。（同上面）B 等值性系数 -两个复本

14、测验是同时连续施测的。C 稳定性与等值性系数-两个复本测验相距一段时间分两次施测。D 平衡设计 -为低效施测的顺序效应，随机地选出一半被试先做A 卷后再做B 卷，另一半被试先做 B 卷再做 A 卷。使用的前提 -A首先要构造出两份或两份以上真正平行的测验（即A 、 B卷）B 被试要有条件接受两个测验。误差来源 -A 测验的两种形式是否等值（是否是平行测验）B 被试情绪波动，动机变化等测验情景变化、偶发因素干扰。优缺点 -A 代表性强，信度准，避免练习、记忆效应B 编制复本难，影响积极性，被试容易触类旁通意义 -A反应的是在测验内容上的等值性

15、（3）分半信度：定义 -将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。由于描述的是两半题目间的一致性，所以有时也称内部一致性系数。计算 - A 方法与复本信度的类似，但是被试在两半测验上的得分的相关系数只是半个测验的信度，所以还要用斯皮尔曼-布朗公式矫正：hhhhxxrrr12（xxr是两个分数间的相关系数，hhr是整个测验的信度值）B 上式只有在两半测验分数的变异数（即总体方差）相等时才能使用，否则，就用下面的弗朗那根公式或卢伦公式。)1(2222xbaxxSSSr（2aS和2bS分别表示所有被试在两半测验上的得分的变异数，2xS表示全体被试在整个测验上总得分的变异数）

16、精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 4 页，共 14 页 - - - - - - - - - - 22/1xdxxSSr（2dS表示同一组被试在两半测验上得分之差的变异数，其他与上式相同）使用前提 -A 在只能施测一次或没有复本的情况下使用B 当一个测验无法分成对等的两半时，不宜使用C 常用的分半方法有奇偶分半、按题目难度分半等注：速度测验不适合分半信度（4）同质性信度：定义 -A- 也叫做内部一致性系数，是指测验内部所有题目间的一致性程度。所谓一致性，是指所有题目测的都是同一种心理特质

17、以及所有题目得分之间都具有较高的正相关。B- 如果一个测验的同质性信度不高，则说明结果可能是几种心理特质的综合反映，所以结果不好解释。一种好办的方法就是把一个异质的测验分解成多个具有同质性的测验，再根据被试在分测验上的得分分别做出解释。C- 同质性高才是测验测的单一特质的充分条件。即一些表面上看起来是测量同一种心理特质的题目，如果其题目间不具有较高的正相关，则不能认为它们具有同质性。计算 -克龙巴赫系数：A 公式：)1(122xiSSKK（K 是题目数，2iS是所有被试在第i 题上的分数变异，2xS是测验总分的变异）B 适用范围：不要求测验题目仅是（0、1）记分，可以处理任何测验的内部一致

18、性系数的计算问题，此外，值还是所有可能的分半信度的平均值，它只是测量信度下界的一个估计值C 计算过程和例子：参考P58 （5）评分者信度：定义 -多个评分者给同一批人的答卷进行评分的一致性程度。（通常要求成对的受过训练的评分者之间平均一致性达到0.9 以上，才算公平。）计算 -当评分者人数多于两个时，评分者信度可用肯德尔和谐系数进行估计：A 公式：NNKNRRWii322212（K 是评分者人数，N 是被评的对象数，iR是第 i 个被评对象的水平等级之和）B 若评分中有相同等级出现，则使用下列公式：121233222nnKNNKNRRWii（n 为相同等级的个数）例题及计算方法：参考P60

19、精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 5 页，共 14 页 - - - - - - - - - - 5.影响测量信度的因素：（1）被试方面：单个被试 -身心健康状况、应试动机、注意力、耐心、求胜心、态度被试团体 -整个团体内部水平的离散程度以及团体的平均水平（2）主试方面：就施测者而言，不按指导手册规定施测就阅读评分者而言，评分标准掌握不一（3）施测情境：考场环境、设备是否良好、空间宽窄是否恰当等等（4）测量工具：试题取样 -利用斯皮尔曼 -布朗公式可以预测试题长度与信度的关系：公式：

20、11xxxxzzKK（K 为改变后的测验长度与原来长度之比，xx为原测验的信度，zz为测验长度增加为K 倍后的测验信度）试题之间的同质性程度试题的难度（5）两次施测的间隔时间：间隔时间越短，信度值越大，反之亦然。6.提高测量信度的方法：（1）适当增加测验的长度：新增项目必须与试卷中原有的项目同质新增项目的数量必须适度（2）使测验中所有的试题的难度接近正态分布，并控制在中等水平（3）努力提高测验试题的区分度（4）选取恰当的被试团体（5）主试者要严格执行实测规程，评分者要严格按标准给分。第五章测量效度1. 概念：指一个测验或量表实际能测出其所要测的心理特质的程度。准确性+有效性。2. 定义：（

21、 1）效度是一个相对的概念：效度是相对于一定的测量目的而言的心理测量只能达到某种程度上的准确（2）效度是测量的随机误差和系统误差的综合反映（3）判断一个测量是否有效要从多方面搜集证据：在测量理论中，效度被定义为在一列测量中，与测量目的有关的真实变异数（由所要测量的变因引起的有效变异）与总变异数（实得变异数）的比率，通常用2xyr表示，其定义为：222xVxySSr（xyr是效度系数，2VS是有效变异数，2xS是总变异数）3.与信度的关系：信度高是效度高的必要而非充分条件，即效度高一定信度高，反之不一定。（比如，用标准米尺来量身高是有效也是可信的，但是如果用英文来考一批母语为中文孩子的数学，虽

22、然多次测量的结果可能很一致（即信度高），但是它的测量效度未必高，因为考生的英文水平会影响数学水平的发挥。）测验的效度受它的信度制约。信度总是大于效度的。4.效度的评估：精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 6 页，共 14 页 - - - - - - - - - - （1）内容效度：定义 -指一个测验实际测到的内容与所要测量的内容之间的吻合程度。测量内容包括- A 欲测的知识范围B 该范围内各知识点所要求掌握的程度适用与不适用：A 适用于成就测验和某些用于选拔和分类的职业测验B 不适用于能力倾

23、向测验和人格测验与表面效度不同：表面效度不能算是一种效度，它不反应测验实际测量的东西，它是外行人对某个测验从表面上好像是测某种心理特质的一种现象。当外行人认为某测验能有效地测得某种心理特质时，该测验就被认为有较高的表面效度。一般来说，最佳行为测验（答案有正误之分、主试与被试目的一致，如高考）往往表面效度高，其他测验则希望表面效度低。确定方法： A 逻辑分析法 - -a明确欲测内容的范围，包括知识范围和能力要求两个方面。b 确定每个题目所要测的内容，并与双向细目表（考试蓝图）对照c 制定评定量表，对整个测验的有效性做出总的评价B 统计分析法 -从同一个教学内容总体中抽取两套独立的平行测验，用

24、着两个测验来测同一批被试，求其相关C 再测法 -在被试学习某种知识之前做一次测验，在学过该知识后再做同样的测验（2）结构效度：定义：一个测验实际测到所要测量的理论结构和特质的程度，或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。（也就是测验结果是否能够证实或解释某一理论、术语或构想，其解释的程度如何）特点： A 结构效度的大小首先取决于事先假定的心理特质理论B 当实际测量的资料无法证实我们的理论假设时，并不一定就表明该测验结构效度不高C 不可能有单一的数量指标来描述结构效度。主要应用于智力测验和人格测验估计方法：A 测验内部寻找证据法-a 考查该测验的内容效度b 分析被试的答题过

25、程c 计算测验的同质性信度B 测验之间寻找证据法-a 相容效度法 -考查新编测验与某个已知的能有效测量相同特质的旧测验之间的相关，若相关高，则新测验有较高效度。b 区分效度法 -考查新编测验与某个已知的能有效测量不同特质的旧测验之间的相关，若相关高，则新测验效度不高。c 因素分析法 -通过对一组测验进行因素分析，找出影响测验的共同因素，每个测验在共同因素上的负荷量（即测验与各因素的相关）就是测验的因素效度，测验分数总变异中来自有关因素的比例就是该测验结构效度的指标。C 考查测验的实证效度法-a 根据校标把人分成两类，考查其得分的差异。（如，一组被公认性格外向的人在测验中得分高，一组被公认性格内

26、向的人在测验中得分低，则说明测验能区分人的内外向特征，进而说明该测验在测量人的性格内外向方面有较高的结构效度）b 根据测验得分把人分成高分组和低分组，考查这两组人在所测特质方面是否确有差异。若差异显著，则结构效度高。D 多种特质 -多种方法矩阵法：参考P74 例子E 因素分析法 -探索性因素分析和验证性因素分析精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 7 页，共 14 页 - - - - - - - - - - （3）实证效度：概念：一个测验对于特定情境中的个体的行为进行估计的有效性。即一个测验是否

27、有效，应该以实践的效果作为检验的标准。也叫，校标关联效度。分类： A 同时效度 -校标资料与测验分数同时搜集的B 预测效度 -校标资料是在测验之后根据实际工作成绩来确定的校标： A 概念 -衡量一个测验是否有效的外在标准，它是独立于测验并可以从实践中直接获得我们所感兴趣的行为。但我们所感兴趣的行为往往是一个观念上的东西（观念校标），它必须用一个数字或等级来表达（效标测量）B 特性 -多样性、复杂性、特殊性和时间性。所以如果效标测量想要较好地体现观念校标，效标测量本身就必须是有效的、可靠的、客观和实用。C 常用校标 -学业成就、等级评定、临床诊断、专门的训练成绩。确定方法：明确观念校标确定校标测

28、量考查测验分数与校标测量的关系A 相关法 -计算测验分数与校标测量的相关系数B 区分法 -被试接受测验后，让他们工作一段时间，再根据工作成绩（校标测量）的好坏分成两组。再回头分析这两组被试原先接受测验的分数差异，若差异显著，则说明测验的效度较高。C 命中率 -a 正命中率 -被测验选出来的人真正被选对的人数的比率b 负命中率 -测验所淘汰的人中真正应该被淘汰的人数的比率c 总命中率 -测验选对了的人数和被淘汰了的人数之和与总人数之比D 其他 -a 基础率 -符合筛选要求的群体在整个人群总体中所占的比率b 灵敏度 -所有真正符合要求的人能被测验鉴别出来的人数的比率c 确认度 -所有不合要求的人能

29、被测验真正淘汰的人数的比率d 当基础率较低时，选用灵敏度高的测验才能比较有效。当基础率很高时，选用确认度高的测量工具比较有效。e 功利率 -使用测验所带来的好处应大大高于使用测验所耗费的时间、精力和经费。影响效度的因素：A 测验的构成B 测验的实测过程C 接受测验的被试D 所选校标的性质E 测量的信度提高效度的方法：A 精心编制测验量表，避免出现较大的系统误差B 妥善组织测验，控制随机误差C 创设标准的应试情境，让每个被试都能发挥正常水平D 选好正确的校标，定好恰当的校标测量，正确使用有关公式。第六章测验的项目分析1. 测验项目的难度（1）概念：被试完成测验项目任务时所遇到的困难程度（2）计

30、算：二分法记分项目的难度（结果只有对或错）A 通过率：不考虑被试作答是否因为猜测成功的机遇：精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 8 页，共 14 页 - - - - - - - - - - NRP（P 是项目难度， N 是全体被试数，R 为答对该项目的人数）B 极端分组法：被试人数较多时，将被试依照测验总分分为三组，总分最高的27%为高分组（），总分最低的 27%为低分组，分别计算高低分组的通过率，再求难度。2LHPPP或LLHHNRNRP21（HP、LP分别表示高低分组的通过率；HR、LR

31、分别表示高低分组通过该项目的人数；HN、LN分别表示高低分组的人数）非二分法记分项目的难度（结果从满分至零多种可能）maxXXP（X是被试在某一项目上的平均得分，Xmax是该项目的满分）（3）难度水平的确定：取决于测验的目的与测验的性质一般的标准化常模参照测验：难度值应尽量接近0.50 标准参照测验：A 如果测验目的是为了解被试对某方面知识技能的掌握情况，则可以不必过多地考虑难度，只要教育者认为是重要的内容就可以选用。B 如果测验目的是为了选拔和录用人员，就应该讲项目的难度控制在接近录取率左右测验性质不同：速度测验难度不宜太高，难度测验则在0.50 左右。2.测验的区分度（1）概念：指测验项目

32、对被试心理品质水平差异的区分能力（2）范围：介于 -1.00 至+1.00 之间。 D 为正值则为积极区分，负值为小鸡区分，0 为无区分（3）计算：项目鉴别指数法A 鉴别指数的计算：当测验总分是连续变量时，从分数分布的两端选出高低分组（同上面的分法一样），计算高低分组的通过率，两者之差就是鉴别指数。LHPPDB 极端组的划分：取27%的高分段被试组成高分组，27%的低分段被试组成低分组，其余的46%不作分析。若团体人数较少（少于100）则用 50%的规则。相关法（知道什么样的数据用什么样的方法，公式和例题参考P91-95）A 点二列相关系数：适用项目是0、1 记分（或二分变量），而校标

33、或测验总分是连续变量的数量资料。什么是校标分数B 二列相关：适用于连续的测量变量，但其中一个变量因为某种原因被人为地分成两类。例如一个测验的项目分数是连续的，但测验总分被分为及格或不及格两类。C“fai” （不知道怎么打出那个字母）相关：适用于两个变量是二点分配的资料，即两个变量都是二分名义变量。D 积差相关：当项目分数服从正态分布时，用项目得分与校标分数求积差相关系数，得到项目的区分度。（4）与难度的关系：难度D 越接近于 0.50，项目的潜在区分度越大。而难度D 越接近于1.00 或 0，项目的潜在区分度越小。（参考 P96 表格）（5）相对性： A 不同的计算方法，所得区分度值不同B

34、样本容量大小影响相关法区分度值的大小精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 9 页，共 14 页 - - - - - - - - - - C 分组标准影响鉴别指数值（D）D 被试样本的同质性程度影响区分度值的大小第七章测验常模1. 分数转换（1）原始分数：被试在接受测验后，根据测验的记分标准，对照被试的反应所计算出来的测验分数。（2）导出分数：在原始分数转换的基础上，按照一定的规则，经过统计处理后获得的具有一定参考点和单位，且可以相互比较的分数量表或符号系统。（3）为何转换：原始分数一般不能

35、直接反映出被试之间的差异状况，不能体现出被试相互比较后所处的地位，也不能说明被试在其他等值测验上应获得什么样的分数。所以，为了使原始分数本身具有意义，使不同测验的分数可以相互比较，须将原始分数转换成导出分数。2.百分等级分数（1）概念：在一个群体的测验分数中，得分低于这个分数的人数的百分比。（2）计算与评价：参考书本P106-108 不是重点。3.标准分数（1）概念：一种具有相等单位的量数，又称Z 分数。它是将原始分数与团体的平均数之差除以标准差所得的商数，是以标准差为单位度量原始分数离开其平均数的分数至上多少个标准差，或是在平均数之下多少个标准差。（2）计算及评估：参考书本P109-110.

36、 4.T 分数（1）概念：由标准分数转换而来，将Z 分数扩大10 倍（以消除小数）再加上50（消除负号）。T 在 0，100之间，平均数为50，标准差是10。5010ZT（2）评价：具有等单位的特点，便于进一步统计分析工作在正态分布下，可以利用正态分布表将各种导出分数与百分等级分数作换算在正态分布下，运用某种变式分数可以将几个测验上的分数作直接比较分数过于抽象，不易理解在非正态分布下，分布形态不同的变式分数，仍然不可以作相互比较及求和5.常模编制（1）常模概念：根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表（2）确定常模团体的注意事项：群体构成的界限必须明确

37、常模团体必须是所测群体的一个代表性样本取样过程必须明确且有详尽的描述样本大小要适当常模团体必须是近时的注意一般常模与特殊常模的结合第八章心理与教育测验的编制与实施1.基本程序（1）确定测验目的：明确测量对象明确测量目标明确测量用途（2）制定编题计划（3）编辑测验项目：收集测验资料选择项目形式编写测验项目（4）预测与项目分析：预测项目分析（5）合成测验：测验项目的选择测验项目的编排：总的原则是由易到难。常见排列方式如下：精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 10 页，共 14 页 - - - -

38、 - - - - - - A 并列直进式 -将整个测验按测验项目材料的性质归为若干分测验，在同一分测验的测验项目中，由易到难排列B 混合螺旋式 -将各类测验项目依难度分成若干不同的层次，再将不同性质的测验项目语义组合，做交叉式排列，难度渐次升进。编制复本（6）测验标准化：指测验的编制、施测、评分以及解释测验分数的程序的一致性。测验内容标准化施测过程标准化测验评分标准化：不同评分者的一致性达到90%以上测验分数的解释标准化（7）鉴定测验：信度-指测验的可靠性，即用同一测验多次测量同一团体，所得测验结果之间具有一致性效度 -指测验的有效性，即一个测验在多大程度上能够测得它所要测得的东西。测验量表与

39、常模（8）编写测验说明书第十一章学绩测验整一章都没有说到有重点，所以。。自己看吧。第十二章能力测验（上）1. 智力的心理测量学理论（1）智力二因素论：斯皮尔曼发现一系列心理能力测验之间存在普通的正相关，他利用因素分析方法，将这些相关归因于一种一般因素或共同因素的作用。他称这种因素为G 因素，并从三个方面对它定义：经验的领会、关系推断和相关推理。他认为G 因素对于同一个体是稳定的，它渗透于所有与智力行为有关的任务重，是一切心智活动的主题，个体间智力的差异就决定于个体拥有G 因素量的多寡。由于测验间并非完全相关，因而出于统计上相关分析的需要，他提出还存在特殊因素（S 因素），由此构成了他的智力

40、二因素论。但他始终强调G 因素才是智力的核心，而S因素只有在某些特殊情况下才会表现出来。（2）智力多因素论：瑟斯顿利用多重因素分析法提出（3）智力层次理论：弗农提出智力三层次模型2.智力的可变性：随年龄成熟而发展（记住智力成长曲线p218）A 智力发展在十二三岁以前呈直线上升趋势，13 岁后开始减慢B 一般智力高者发展速度快停止年龄晚，低者发展速度慢停止年龄早C 一般人的智力在1618 岁达到顶峰，近期研究结果又推迟至25 岁3.个体智力测验：（1）比内量表：比内西蒙量表：诊断异常儿童智力，于1905 年编制的世界上第一个智力量表斯坦福比内量表：最富盛名（2）韦克斯勒量表：应用最广泛的智力量表

41、有成人、儿童、幼儿三个量表成人智力量表的结构包括言语量表和操作量表4. 团体智力测验：（1）陆军测验：第一个团体智力测验陆军甲种测验-文字测验陆军乙种测验-非文字测验精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 11 页，共 14 页 - - - - - - - - - - （2）瑞文推理测验：是非文字型的图形测验，具有跨文化一致性，优点在于测验对象不受文化、种族与语言等条件的限制，适用的年龄范围也很广，而且不排除一些生理缺陷者。第十三章能力测验（下）1. 能力倾向测验：需知道哪些是能力倾向测验。如学

42、术能力倾向测验（SAT）、分辨能力倾向测验（DAT ）、一般能力倾向成套测验（GATB）、行政职业能力倾向测验等等。2. 吉尔福特的基本观点：智力操作中存在聚合与发散两种不同类型的思维发散思维在行为上表现出流畅性、变通性、独特性这三种特性将发散思维的特性视为人的创造性活动的特性，并因此将创造力定义为发散思维的能力，即对规定的刺激产生大量的、变化多端的而又独特的反应能力。第十四章人格测量1. 自陈量表的特点：题量较多，多数用于测量人格的若干特质通常采用纸笔测验积分规则简单而客观，施测手续比较简便，测量分数容易获得解释2.明尼苏达多项人格调查表（MMPI ）（1）作者：明尼苏大学哈撒韦和麦金

43、利与20 世纪 40 年代共同编制（2）适用人群： 16 岁以上的病态人群（3）特点：具有四个效度量表-说谎量表（ L）（分数高表示回答不真实）、诈病量表（F）（分数高表示诈病或确系严重偏执）、矫正量表（ K）（分数高表示一种自卫行为）、疑问量表（ Q）（答对超过30 题则被认为测验无效）3.卡特尔 16 种人格因素量表（16PF）（1）作者：卡特尔（2）适用人群：初中以上文化程度的人4.艾森克人格问卷（EPQ）团队测验，有四个分量表测验三种人格维度（1）作者：艾森克1975 年编制（2）适用人群：儿童问卷-715 岁受测者成人问卷 -16 岁以上受测者5.投射测验的特点：测验材料没

44、有明确的结构和确切的意义，为受测者提供了针对测验材料进行广阔的自由联想的机会和空间受测者对材料的反应不受限制，因此其对测验材料的解释取决于受测者的人格特征和当时的心理状态测验的目的具有明显的隐蔽性，即受测者事先并不知道施测者对他的反应作何心理学的解释，这就在很大程度上避免了受测者的伪装和防卫，使测验更能反应受测者真实的人格特征对测验结果的解释重在对受测者的人格特征获得整体性的了解，而不是对某个或某些单个人格特质的关注内容多为无明确意义的图片，测验时不受语言文字的限制，所以被广泛应用于人格的跨文化研究相对于自陈量表，最大的局限是记分上的困难，使得研究者对测验结果难以进行确定的定量分析6.罗夏

45、克墨迹测验（投射）（1）作者：罗夏克1921 年发表精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 12 页，共 14 页 - - - - - - - - - - （2）适用人群：精神病患者7.主题统觉测验（TAT）（投射）（1）作者：莫瑞和摩根于1935 年创制（2）与罗夏克墨迹测验相比的优缺点：优点： A 显示的刺激更有结构性B 要求更复杂，有意义更明确的言语表达缺点： A 没有标准化的施测程序B 临床上要以被试的年龄、性别等特征调整指导语C 施测图片的数量和种类由主试决定D 莫瑞提出的分析原则不能

46、作为评分标准使用第十五章其他心理与教育测验1. 利克特量表法（1）作者：利克特于1932 年提出，是总加量表中最常用的一种。（2）基本思路：假定每一项目或态度语有具有同等的量值，项目之间没有差别量值。要求受测者对每一个项目的态度强弱按五级或六级反应，用受测者在所有项目中评定等级的总和来估计结果。（3）项目表述与等级评定：项目表述上有正面陈述和负面陈述两种，在等级评定上都是相同的等级数，只是在总计分的时候要把负面陈述的分数颠倒（反向计分）（4）项目筛选：将所有受测者的得分按总分由高到低排列，然后计算高分组与低分组在每一项目上平均得分的差异（ T 检验），差异越大，鉴别力越好，反之则越差。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 13 页，共 14 页 - - - - - - - - - - 文档编码：KDHSIBDSUFVBSUDHSIDHSIBF-SDSD587FCDCVDCJUH 欢迎下载精美文档欢迎下载精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载名师归纳 - - - - - - - - - -第 14 页，共 14 页 - - - - - - - - - -

展开阅读全文