最新心理测量全套课件PPT课件.ppt-淘文阁

资源描述

《最新心理测量全套课件PPT课件.ppt》由会员分享，可在线阅读，更多相关《最新心理测量全套课件PPT课件.ppt（178页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、心理测量心理测量全套课件全套课件第一章测验的性质第一节测量l1905年第一个心理测量量表比纳-西蒙智力量表问世，心理测量学诞生。对心理测量学的两种错误态度：l妄加批评l盲目迷信 1-3-1 类别量表测量上最低的形式是分类，在这里根据法则指派给事物某一类别的数字或其他标志仅是符号或称呼，没有任何数量大小的含义，因此用这类数字表示的量表叫做类别量表。如：电话号码。1-3-2 等级量表等级量表除了具有类别量表的性质外，根据事物的性质和分派的法则，指派给每一类别的数字还具有等级性或序列性的特性，但不表示数与数之间的差距是相等的。如：学校考试的原始分数。1-3-3 等距量表等距量表除了具有类别和等

2、级量表的性质外，还要求一定数量差距在整个量表阶梯上都是相同的，换句话说，根据事物的性质和分派的法则，这时量表的各个部分的单位是相等的，但没有绝对的零点。如：摄氏温度量表。1-3-4 比率量表比率量表是测量的最高水平，也是科学家们最理想的量表。一个比率量表除了具有类别、等级和等距量表的性质外，还有一个具有实际意义的绝对零点。如：公制的长度（米）量表。1-4 心理测量属于哪一种测量水平从根本上讲，智能和人格测验的分数是等级量表，但心理学家却喜欢用等距量表来表现这些测量结果。这是因为大量的统计方法适合于等距量表。这就使我们面临两难的境地。若干变通的方法：l在统计上把测验分数转换成一个相等单位的量表，

3、如标准分数；l现实主义的态度；l实用主义的态度。第二节测验的定义心理测验实质上是行为样组的客观的标准化的测量。l行为样组l标准化l难度客观测量l信度l效度2-1 行为样组行为样组是指能正确测量出被试某方面心理特性的一组试题。而这组试题能否正确地测量出被试某方面的心理特性，取决于试题的性质和数量。如果试题没有代表性，或者只有另一方面的代表性，那就不能用它来进行正确的测量。2-2 标准化l标准化是指测验的编制、实施、记分以及测验分数解释的程序的一致性。l标准化的要求只是所有科学观察需要控制条件的一种特殊应用而已，这样，在测验的情境下，唯一的自变量是正在受到测定的个体的智能或人格特征。l常模是指某

4、一标准化样组在某一测验上的平均分数。常模的功用是给测验分数提供比较的标准，从而对测验分数加以解释。2-3 难度客观测量l完满的客观性实际上是不可取得的，但不论怎样，客观性总是测验编制的目标，并且在大多数测验中已达到一定的高度。l心理测量的客观性最主要的表现为测题（项目）或整个测验的难度水平必需客观2-4 信度测验的信度是指同一组被试用同一测验实施两次后所得分数的一致性；或者同一组被试经过一次测验，而后用一个等同形式的测验再测一次，两次所得分数的一致性。信度的种类有三：l稳定系数l等值系数l内在一致性系数稳定系数l稳定系数的求法是先对某个测验实施首测，过一段时间后对它再测，然后计算首测与再测所得

5、分数的相关系数。等值系数l等值系数的求法是先对同一测验的一型或A型施测，然后在最短的时间内实施第二型或B型，再求它们得分的相关系数。内在一致性系数l内在一致性系数的常用求法是将一个测验分裂为两个假定相等而独立的部分来记分的，一般以项目的奇数为一组，偶数为另一组，求两者相关系数，而后再用斯皮尔曼-布朗公式来估计整个测验的信度。2-5 效度l效度是指一个测验真能确实地测量到它所欲测量的东西的程度。考察一个测验效度的常用方法如下（以智力测验为例）：l求测验结果与另一种已知其效度的标准化测验的相关；l求测验结果与学生学业成绩的相关；l观察每项测题通过人数的百分比。是否依年龄或年级的增加而增加；l观测每

6、项测题与全量表是否有连贯性。第三节正确使用测验防止滥用 3-1 测验要保密。3-2 只有够资格的心理测验工作者才能使用心理测验。3-2-1 测验的选择要慎重。3-2-2 测验的实施应控制误差。3-2-3 测验的记分要客观。3-2-4 要懂得如何解释测验分数。3-3 不能把一个原来良好的测验，不分时间、地区到处乱用。3-4 主试要对被试在测验实施中的反映和行为作出切实而详细的记录。3-5 要正确地使用测验，就要对测验本身有一个正确的认识。3-6 一个好的测验工作者要有测验道德。第四节测验的实施和被试的主观状态4-1 主试在测验前的准备4-2 指导语4-3 测验的情境4-4 测验焦虑4-5

7、练习与应付技巧4-6 反应方式与反应心向4-7 与被试建立和睦的关系第五节测验的种类和功用5-1 测验的种类这里讲的测验是指标准化测验，而不是非标准化测验。标准化测验除了要有常模外，还要具备下列条件：（1）给所有被试实施有代表性的相同的一组测题，为他们的作业取得直接比较的基础；（2）实施测验的手续（包括测验指导语、测验时间限制、测验情境等）要有详细的规定，以保证每一被试有相同的测验条件；（3）记分方法要有详细的规定，使评分误差降低。上述三点与得分的步骤有关，常模（标准化样组的平均数）则给测验分数提供参照点。这样，一个测验就能作为测量人的某种心理特性的工具。5-1-1 按照测量的对象分5-1-

8、1-1 智能测验5-1-1-2 教育测验5-1-1-3 人格测验5-1-2 按照测验的人数来分5-1-2-1 个别测验个别测验只能由同一主试在同一时间内测量一个人。个别测验的优点是主试对被试的言语、情绪状态有仔细的观察，并且有充分的机会与被试合作；激起被试最大努力，所以其结果正确可靠。个别测验的缺点在于：时间不经济，测验的手续复杂，需要训练有素者方能胜任。5-1-2-2 团体测验团体测验可由一位主试同时测量许多人。各种教育测验都是团体测验，一部分智力测验也是团体测验。它的优点是时间经济，主试不必接受严格的专业训练即可担任。它的缺点在于对被试的行为不能做切实的控制，所得的结果不及个别测验正确可靠

9、。5-1-3 按测验的材料来分5-1-3-1 语言或文字测验：它可以测量人类高层次的心理功能，编制和实施都较容易。人类的心智能力不能完全以图形或实物测量出来，所以语言或文字测验应用范围较广，团体测验多采用它。然而它不能应用于语言有困难的人，而且无法比较语言文化背景不同的被试。5-1-3-2 非文字测验或操作测验：以图画、仪器、模型、工具、实物为测验材料，被试以操作表达。它的长处和短处，正好与语言或文字测验相反。5-1-4 按测验的功用来分5-1-4-1 预测测验和成就测验预测测验用于推测某人在某方面未来成功的可能性，智力测验和能力倾向测验就属于此。它多数根据作业分析的结果来选择测验材料。成就测

10、验在于考察某人在某方面目前的成绩，一般教育测验就属于此，因此它所测量的是学生现在的成绩，它往往是根据作业样本来选择测验材料。5-1-4-2 难度测验和速度测验难度测验的功用在于测量被试的程度高低。它的时间限制的标准通常是使95%的被试都有做完测验的机会。测题由易到难排列。以测量被试解决难题的最高能力。速度测验在于测量被试作业的快慢，它的测题难度相等，但严格限制时间、看规定时间内做对几题。5-1-4-3 普通测验和诊断测验普通测验在于考查一个人或一个年级学生在某方面的大概程度；诊断测验则进一步去诊断被试某方面的特殊优点和缺点。教育上的诊断测验偏重发现学生困难之处，作为改进教学方法或进行补救教育的

11、依据。5-2 测验的功用5-2-1 辨别智愚5-2-2 选拔人才5-2-3 指导就业5-2-4 诊断5-2-5 预测5-2-6 评价学生的成绩5-2-7 用来进行实验分组，使之等组化第二章心理测量的发展史心理测量的思想和实施在中国由来已久，我国的古代考试制度是现代心理测量的渊源。孔子l惟上智与下愚不移l中人以上，可以语上也；中人以下，不可语上也。孟子权，然后知轻重；度，然后知长短。物皆然，心为甚。科举制度隋唐至清末1300多年科举制盛行，对人才的选拔悉依考试结果为准则，自从利玛窦1582年来我国之后，我国的文物制度逐渐传入欧洲。科举制度一经传入欧洲，备受启蒙思想家伏尔泰的赞扬。于是，夺取政权

12、后的法国资产阶级于1791年参照我国的科举制度建立了自己的文官考试制度。随后，英美两国也相继建立。它们为受官任职制定了准绳，打破了门第或名人推荐的限制，扩大了资产阶级进入政府的通道。第一节心理测量的早期尝试与先驱者的探索1-1 冯特的实验心理学实验心理学的鼻祖冯特，1879年在德国莱比锡大学设立第一所心理实验室，用生理学和物理学的仪器及其方法来做心理实验，从此心理学开始成为一门实验科学。1-2 高尔顿的理想1-3 卡特尔的个别差异研究第二节比纳-西蒙智力量表的产生及其特点2-1 比纳-西蒙智力量表2-1-1 1905年量表这个量表共包括30个测验项目，具有如下两大特点：（1）项目种类繁多，

13、可以测量智力多方面的表现。（2）测验项目的排列，由浅而深，使同一量表可以测量智力高低不同的儿童。2-1-2 1908年量表2-1-3 1911年量表1905年量表测题举样1、看：用一支点燃的火柴在儿童面前慢慢移动，看儿童眼睛是否能跟随物体移动。8、图片之认识：给儿童看一图片，然后询问他图片上某物在何处。15、重述句子：每个句子有15个字母，先说一次给儿童听，然后要其背诵。22、比较重量：把五个重量不同（18、15、12、9和6克）的物品依此排列。30、抽象名词之意义：例如革命与进化、总统与皇帝有何不同？2-2 比纳方法的特性2-2-1 用年龄作准则2-2-2 明了心理过程有低级和高级之分2-3

14、比纳1911年量表的不足之处l诊断高级心理过程的测题不很多l没有一定的测验手续l有许多测题的位置不对斯坦福大学教授推孟对这类错误进行订正，遂有斯坦福-比纳智力测验问世。在心理学史上，假使我们称冯特为实验心理学的鼻祖，我们不得不称比纳为心理测量学的鼻祖。第三章智力测验第一节智力的性质 1-1 对智力的一般理解1-1-1 智力是抽象思维的能力1-1-2 智力是适应环境的能力1-1-3 智力是学习的能力1-1-4 综合的观点1-2 智力的种类l社会的智力l具体的智力l抽象的智力1-3 智力的结构1-3-1 因素分析的简解l因素分析是聚合彼此高度相关而又与其他测验变量群相对独立的一些测验变量群的

15、一种统计程序。1-3-2 智力结构的几种理论l斯皮尔曼的二因素论、塞斯顿的群因素论、吉尔福德的三维智慧结构理论都是采用因素分析的技术来揭示智力的结构的。1-3-2-1 二因素论二因素论认为人类的智力是由两个因素构成的，一个是一般因素称为g，一个是特殊因素称为s。g因素和s因素合并起来就构成一个人智慧活动的总体。根据这种说法，各种智慧活动都有一个共同的一般因素g，同时，又有其本身的一些特殊因素s。而一般因素g乃是智力测验的对象，目前许多智力测验的测题都是通过广泛取样而求出g。1-3-2-2 多因素论多因素论反对g因素的存在，认为一个人的智力，由许多分子组成。各种智力测验之间的相关，是由于各种能力

16、之间有共同元素。共同元素多，则相关高，反则反之。例如：甲能力=A+B+C+D+E+F+G乙能力=A+B+C+D+H+I+J丙能力=D+E+F+G+K+L+M上例内，甲能力与乙能力的共同元素是ABCD，甲能力与丙能力的共同元素是DEFG，而乙能力与丙能力的共同元素只有D。共同元素并不是一般能力，而是各种特殊元素偶然相同而已。1-3-2-3 群因素论在群因素论看来，智力不是多因素论所说的许多特殊能力的总和，也不是二因素论所说的g和s因素的综合体。群因素论认为各种智力活动系分属七群，每群有一共同的基本要素，决定该群共同的表现。这七种共同基本要素，又称七种基本智能，分别为：数字计算能力、言语理解能力、

17、空间知觉能力、词汇流畅性、推理能力、记忆能力、知觉速度。1-3-2-4 三维智力结构理论1-4 智商l智商（智商（IQ）智力年龄（智力年龄（MAMA）/实际年龄实际年龄（CACA）100100l智商是相对数值，我们就可用它比较各人的智智商是相对数值，我们就可用它比较各人的智力高低，而不必考虑年龄的大小。力高低，而不必考虑年龄的大小。l智商是相对稳定的（一般在智商是相对稳定的（一般在1/31/3标准差之内的标准差之内的变动可归因于测量误差）。变动可归因于测量误差）。l个体的生活环境和人格特征是影响其智力变化个体的生活环境和人格特征是影响其智力变化和发展的两大重要因素。和发展的两大重要因素。1-5

18、智力的个别差异第二节个别智力测验的举样个别智力测验最著名的是斯坦福-比纳量表和韦克斯勒量表。2-1 斯-比量表2-1-1 斯-比量表发展的简介2-1-2 1972年修订版测题举例2岁组（1）三洞形式板：把圆形、正方形、三角形的木块嵌入具有相应形状的洞内。（2）延迟反应：三只相距二吋间隔的纸盒放在小孩面前，让孩子观看主试把一只小猫玩具藏在三个纸盒中的一个内，十秒钟后，让小孩找出它来。（3）辨认人体的各部位：出示纸娃娃给小孩，并说：“把娃娃的头发指给我看。”然后用同样的问法问小孩有关嘴、脚等等。（4）搭积木。（5）看图说话。（6）词的组合。6岁组（1）词汇量：比如什么是信封、泥潭。（2）区别：

19、比如，鸟和狗，拖鞋和长靴，木材和玻璃。（3）图片缺失：指明图片哪一部分缺少，比如，拖车、茶壶、手套。（4）数概念。（5）相对应的类推：“鸟飞，鱼”。（6）走迷津。14岁组（1）更难的词汇量。（2）找出某些纸张折叠的规律。（3）推理作业：确定一件盗窃行为的时间。（4）用一个五升的容器和一个九升的容器，量出十三升的重量。（5）确定方向：“若你向西行走，然后向右转弯，你现在走向什么方向？”（6）对立物的一致：“冬和夏有什么相同”，“愉快和忧愁有什么相同”。2-1-3 测验的实施和记分方法l斯-比量表需要经受过严格训练的人当主试。l斯-比量表实施时，每个被试只接受适合年龄程度的项目。幼童测验时间不超过

20、40分钟，年龄大的不超过一小时半。对一个中等的孩子而言，可以从稍低于其实足年龄开始，譬如一个10岁的小孩，先从9岁开始，这样可以增强被试的信心。l从理论上讲，斯-比量表最高智龄是22岁10个月，可是这并不表示平均22岁10个月实足年龄人的成就。根据1972年常模。超过16岁8个月的人，智龄16岁8个月，IQ即等于100。2-1-4 信度和效度l斯-比量表对于年龄愈大的被试，其信度愈高。各年龄阶段的信度系数如下：（年龄）信度系数（2.5-5.5）0.83r0.91 （6-13）0.91r0.97 （14-18）0.95r0.98l斯-比量表与学校成绩、老师评定的效度系数大部分介于0.4-0.7

21、5之间。2-1-5 对斯-比量表的评介斯-比量表，语文材料较多，这体现着比纳、推孟等人对智力的理解，在他们看来智力是抽象思维过程，而抽象思维过程是概念形成的过程，这就要能运用语文、数字和其它符号，所以语文材料较多，运用在预测学习成功上它的效度就高，而对语文有障碍的人就不适用了。斯-比量表所得到的结果能说明被试的一般智能发展情形，而在显示特殊能力上就不甚好。该量表主要以儿童为对象，对年纪较大的青年人或成人不太适合。2-2 第三次订正中国比纳智力测验1924年，陆志韦发表了中国比纳测验，这套智力测验是根据斯-比量表修订的。1936年陆志韦和吴天敏又发表了第二次修订本。1979年吴天敏对该测验进行了

22、第三次修订，其特点是：（1）在辩证唯物主义哲学思想指导下，结合神经生理学和心理学等现代成就重新认识智力的本质，是在明确了智力测验测量什么东西之后，进行工作的。（2）测题按难易顺序排列，不以年龄分组，全部测题为54个，对原来测题进行了修订、删除，增添了新的测题。（3）放弃了比率智商，而采用了离差智商。2-3 韦克斯勒儿童智力量表1939年韦克斯勒在美国贝勒维精神病院编制了一套韦克斯勒-贝勒维智力量表，测量10-60岁的成人，而后他分别编制了韦克斯勒儿童智力量表（WISC-R，1949）、韦克斯勒成人智力量表（WAIS，1955）、韦克斯勒学龄前儿童和学龄初期儿童智力量表（WPPSI，1967），

23、这里只介绍1974年修订的WISC-R，它适用的范围是6岁至16岁的儿童。2-3-1 WISC-R的特点量表的以年龄为单位的，称为年龄量表，比纳的智力测验就属于此类。它所测量的是一个儿童的智力相当于哪一个年龄水平。现在要介绍的量表是作业差异度量表，韦克斯勒儿童智力量表就属于此类。在比纳量表上，测题或项目是按年龄排列的，而WISC-R不是这样，它将测题或项目按智力的不同侧面分类，分成了12个分测验，每种测验自成系统，譬如重述数目字，在比纳量表中重述三个数目字，隶属于某一年龄组，而重述四个数目字又隶属于另一年龄组，而在WISC-R中它们都属于数字广度的分测验中。各分测验里的测题均按先易后难顺序排

24、列。2-3-1-1 韦氏从整体智力观点出发把智力分成言语和操作两个部分在WISC-R的言语量表中有常识、类同、算术、词汇、理解、数字广度六个分测验；在操作量表中有图画补缺、图片排列、积木图案、物体拼组、译码、迷津六个分测验。在韦氏量表中，除了计算全量表的智商外，还可以分别计算言语智商和操作智商。2-3-1-2 采用离差智商作为估计采用离差智商作为估计智力的相对聪明程度。智力的相对聪明程度。某一被试的离差智商是视此人的测验分数某一被试的离差智商是视此人的测验分数与其同龄被试测验分数分布曲线上的均与其同龄被试测验分数分布曲线上的均数的离差大小而定的。即被试的分数处数的离差大小而定的。即被试的分数处

25、于同龄标准化样组均数之上或之下有多于同龄标准化样组均数之上或之下有多远，离差大且为正数，则智商高；而离远，离差大且为正数，则智商高；而离差大且为负数，则智商低。差大且为负数，则智商低。2-3-2 WISC-R测题简介2-3-2-1 常识它包括30个测题，测题的范围甚广，例如，“太阳从哪里升起？”“谁发现了美洲？”等。这些常识是被试在日常生活的接触中常碰到的。常识的丰富与否，可以反映被试的智力，因为智力愈高，则兴趣愈广，好奇心愈大，因此所获得的常识也愈多。常识测验可以测量被试的情绪，如情绪有问题的被试在常识上会有不正常的范围狭隘现象。有些人不是由于智力关系，而是由于情绪有问题，常表现为常识分数不

26、佳，所以在临床上常识测验有诊断人格的作用。2-3-2-2 类同这个分测验包括17组配成对的名词，要求儿童概括每一对词在什么地方相似。例如，“车轮与球在什么地方相似？”，“船与汽车在什么地方相似？”这可以测量出一个人的“一般因素”的分量。2-3-2-3 算术这个分测验有18个测题，被试在解答测题时，不能用纸和笔去打草稿，而只能用心算解决算术问题。这个测验是测定一个人的“机智”，这些测题不需要被试有很多的“知识”（不超过与他教育年龄相当的教学训练）。算术测验在智力测验中常常被广为应用因为它与各量表的总分数均有很高的相关，同时对于预测一个人未来的心智能力很有帮助。2-3-2-4 词汇这个分测验包括一

27、系列按难易程度排列的32个词，要求儿童对于给他们听或看到的词的一般意义加以解释，例如：“什么是公主？”“声明是什么意思？”该分测验对儿童一般智力的测定是一个很有价值的工具。它在临床上的价值，在于能帮助我们区别和发现被试思想历程的性质，以及在有些状况下被试的情感和情绪等。2-3-2-5 理解此分测验包括17个按难易排列的测题，要求被试解释为什么某种活动是合乎需要的，在某种情景下，更好的活动方式是什么？例如：“为什么寄信要贴邮票？”“假如你丢失了朋友的玩具，要做的是什么？”如果某个年龄阶段的儿童解答该分测验的成绩超过同年龄的一般儿童，则表示其有实用常识以及有评价和利用已由经验的能力。在临床上也能发

28、现被试的思维过程和背景以及情感和情绪状况等。2-3-2-6 数字广度此分测验是给儿童呈示一系列随机组合的不断增长的数字，要他顺背或倒背数字，这是一种即刻回忆的测验。它和具有效性的智力测验虽然相关不高，但在测定智力上有缺陷或大脑有机能损伤的人时，其效度却很高。心智有缺陷的人正背往往不能超过五个数目，而倒背则不能超过三个数目。大凡数字广度太低，尤其是不能倒背数目的人，对于困难的智能作业是很难引起注意并去解决的。2-3-2-7 图画补缺该分测验包括26张未完成的图画，要求被试说出缺少部分的名称，而不是真正把图画缺少的部分补足。例如，一只螺丝钉缺少顶缝。这种测验可测被试对于外物形态的辨认能力，或有区分

29、外物之重要和非重要部分的能力。2-3-2-8 图片排列有意打乱图片的顺序，要求被试重新排列图片，使之组成一个有意义的故事。测量被试的分析综合能力、观察因果关系的能力、社会计划性、预测能力和幽默感等。2-3-2-9 积木图案呈现10张红白相间的几何图案卡片，要求被试用4个或9个积木照样摆出来。主要测量视知觉、分析能力、空间定向能力和视觉-运动综合协调能力。该测验与操作量表总分相关很高，被认为是最好的操作测验。在临床上帮助诊断知觉障碍、分心、老年衰退等症状。2-3-2-10 拼图要求被试把一套切割成几块的图形板，拼成一个熟悉物体的完整画面。测量概括思维能力与知觉组织能力、辨别部分与整体关系的能力。

30、拼图2-3-2-11 译码主要测查注意力、简单感觉运动的持久力、建立新联系的能力和速度。文书工作人员得分高，具有强迫观念和强迫行为者得分高。女性比男性得分高。2-3-2-122-3-2-12 迷津迷津测量的是知觉运动速度、知觉组织能力、抑制冲测量的是知觉运动速度、知觉组织能力、抑制冲动反应的能力。动反应的能力。2-3-3 效度l原始分数随年龄增加而增加。l各个分测验之间有一定的相关。lWISC-R的言语IQ、操作IQ及全量表的IQ与斯坦福-比纳量表IQ的平均相关系数，分别为0.71、0.60和0.73。2-3-4 信度三组儿童的稳定系数年龄组言语量表操作量表全量表6岁半至7岁半0.900.9

31、00.9410岁半至11岁半0.950.890.9514岁半至15岁半0.940.900.952-3-5 对该量表的评价WISC-R不仅能测量出总体智商，而且也能测出言语智商和操作智商，各分测验可以对儿童智力的不同侧面进行诊断，这是斯-比量表所不及的。然而，用在学校教学上，斯-比量表预测效度比WISC-R要高。第三节团体智力测验的举样 3-1 团体测验的起源3-2 团体测验的优点与缺点3-2-1 优点l节省人力、物力和时间。l主试不必经受严格的专门训练，只要熟悉测题、正确地念出指导语和控制测验的场面。以及按时开始、按时结束即可。l团体量表的记分较个别量表如斯坦福-比纳量表更为严格而客观。l由

32、于样组规模相当大，更易建立常模。3-2-2 缺点l无法对被试详细观察，不易发现被试的特殊反应。l主试与被试之间无法建立和谐关系。l被试如果是儿童，则用个别测验比团体测验好。3-3 团体智力量表常用测验材料种类除了少数的例外，团体智力测验编制所根据的原则是：智力是一般能量，因此它可以从各种不同的心智活动中取样来测量，各种量表也由各种不同的测题综合而成，如：照令行事、算术、常识、理解、词汇解释、译码、图画补缺、图片排列、迷津，这些种类的材料在前面已有解释，下面介绍的几种是前面不曾提到过的。3-3-1 字句重组一种是散乱出现的字句，如“国字多的许中识人不是有”，要被试回答对不对，这一测题应回答对，因

33、为将它排顺后，是“中国字有许多人是不识的”；另一种是在散乱出现的字句中，有多余的字要被试勾掉，例如，“到棉夏穿冬衣人天”，这一句排顺后是“人到冬天穿棉衣”，在这里被试只要勾掉“夏”字即可。3-3-2 增补数字序列要求被试找出一系列数字的排列规律，例如，1 7 2 7 3 7 4 7，又如，26 22 18 14 10 6，这二例横线上的数字是要求被试增补的数字。3-3-3 对比要求被试对一个词写出或指出其相反的词。例如，老幼。假如一对词的意义是相反的，则需被试指出是相同的，还是相反的，例如：老-幼相同相反又假如一对意义相同的词，也需被试指出，例如：欺-骗相同相反 3-3-4 类推要

34、求被试回答A对B犹如C对D，例如：鞋：脚，帽：？3-3-5 完成句子要求被试将一个不完整的句子填上适当的字，使其完整。例如：夏天天气，冬天天气。3-3-6 非文字材料3-4 团体智力测验举样3-4-1 军队甲种量表3-4-2 军队乙种量表3-4-3 瑞文推理测验第四章教育测验教育测验旨在测量学生对某学科或某组学科经过学习或训练之后所获得的知识和技能，从而为评价教育目标实现的程度提供依据。教育测验有时又称为成就测验。第一节综合成就测验综合成就测验的内容范围包括大、中、小学的多种学科，由于它涉及学科范围广，所以测题取样所代表的是各学科中普遍的概念和技能。鉴于这种特点，它可以对学生的教育成就作概

35、况的了解。1-1 斯坦福成就测验这是最早的综合成就测验，于1923年出版，以后经过数次修订，这里介绍的是1973年修订版。它编制的目的是测量“公认为中、小学课程所应达到的结果”，即那些重要的理解、知识和技能。它适用于四种程度：幼级量表（适用于1至2年级）初级量表（适用于3至4年级）中级量表（适用于5至6年级）高级量表（适用于初中1至3年级）下面以中级量表的一些测题为例来阐述测验的内容。1-1-1 段落大意测验给学生一篇课文，将其分成若干段落，每个段落要求学生对二至四个问题从备选答案（选项）中选出一个正确的答案，使之与某一个段落的思想内容一致。例如：很久以前，秘鲁人不知道写字，为了计数，他们在不

36、同颜色的绳子上打结，每种颜色代表不同种的事物。1、在绳子上（1）打结（2）涂色（3）作圈（4）加捻2、代表（1）数的（2）叫的（3）写的（4）用的事物1-1-2 词义测验用学生经常接触的词来考查学生对词义的理解。例如：一件东西如果是，它就是巨大的。（1）很重要的（2）庞大的（3）爆炸了的（4）很远的1-1-3 拼写测验该测验要求学生从四个词中辨认哪个词拼写正确。例如：The guards moved(1)quitly(2)quietly(3)quitely(4)not given1-1-4 语言测验要求学生对配对词组（正确的或似是而非的）进行选择，从而分析学生对于大写、标点、句子意义、惯用法

37、以及语法的掌握情况。例如：Do you want(no more,any more)ice cream?1-1-5 算术推理测验 1-1-6 四则运算测验 1-1-7 社会科学测验 1-1-8 自然常识测验1-1-9 学习方法的测验1-2 教育进步序列测验l阅读理解测验l听力测验l写作短文质量的评定l写作知识的测验l数学测验l自然科学测验l社会科学测验l说明技能的测验1-3 学术能力倾向测验学术能力倾向测验（简称SAT）是美国三种大学入学考试中的一种。该测验自1926年开始使用，SAT实施时间长达3小时，现每年约举行六次左右。内容分为语言和数学两大部分，自2005年起，又增加了写作。第二节分

38、科成就测验 2-1 语文学科测验2-1-1 阅读测验l艾伟、王金桂合编小学国语默读测验l艾伟、杨清编小学国语默读诊断测验2-1-2 语句测验 2-1-2-1 艾伟、丁祖荫合编的语顺测验该测验是测量小学生的语句组织能力。测验中有50句句子，每句内，字的排列是散乱的，读起来不成为一个句子。例如：想可简法无直（排顺后，即为：简直无法可想）。2-1-2-2 艾伟编四言辞句测验该测验是测量学生对成语和辞句的意义了解的程度。它用四选一的格式，要学生找出正确的辞句。例如：（1）同心协力（2）同心胁力（3）同心洽力（4）同心惜力2-1-3 语法测验语法测验旨在发现学生在文字和语言的组织上的错误。现以陈鹤琴小学

39、语法测验来说明。2-2 算术学科测验l四则测验l应用题测验l诊断测验第三节教师自编测验前面所介绍的测验都是标准测验。这些测验是经测验专家根据测验编制的原理编制的。它们具有高信度和高效度，且测验分数具有确定的意义。但在日常应用时，仍以教师自编测验为好。这是因为标准成就测验的编制相当耗费人力、物力和时间，而且它的内容不一定能与教材内容或教学进度相符合。因此，目前考查学生成就的工具仍以教师自编测验为主。需要指出的是，这里所讲的教师自编测验，是指应用标准化测验的一些原理而编制的。即新法考试，以便克服旧法考试测题覆盖面小、评分不客观等缺点。3-1 教师自编测验的要点l测题内容要能够代表该学科重要教材的

40、全部。l测题的格式有多种多样，如是非法、选择法、填充法等。l教师的命题，应当多用推理思考的问题，少用记忆性质的问题。3-2 教师自编测验编制程序l确定教学目标l选择合适的测验材料l选定测题的格式l草拟测题l决定测题的数量l修正并选定测题l排列测题l规定做法的说明l准备标准答案和规定记分规则第四节教育测验在教育评价中的作用4-4-1 测验、测量和评价4-4-2 教育测验在教育评价中的地位4-4-3 教育测验如何更好地在教育评价中发挥效能第五章人格测验心理学上所讲的人格是指：个体与环境相互作用过程中所形成一种独特的身心组织，而此相对稳定的组织使个体于适应环境时，在动因（需要、动机、兴趣、爱好、

41、情感、态度、气质）和能力（一般能力、特殊能力）上各有其不同于其他个体之处。第一节自陈量表自陈量表是一种自我评定问卷，即对拟测量的人格特征编制许多测题（问句），使被试回答，从其答案来衡鉴这项特征。自陈量表以其编制的方法来讲有：1、经验准则记分法；2、因素分析法；3、按照人格理论编制测验。1-1 经验准则记分法1-1-1 武德沃斯个人资料记录武德沃斯个人资料记录是第一个人格量表。最初编制该量表的目的是：测量第一次世界大战时，美国士兵的情绪稳定性或是否有精神崩溃的迹象。他的问卷是这样设计出来的：参考有关心理咨询的文献，与精神科医生交谈，从而搜集精神病和患精神病前的一些共同特征，并根据这些症状设计出

42、各种问句。然后运用两种统计方法选定适合的问句。第一种方法是，如在预试时正常人有25%以上对某一问句表现不利，则删除它。第二种方法是，在预试时精神病患者组对某一问句表现不利的次数超过正常组的两倍，则该项目予以保留。1-1-2 萧孝嶸订正个人资料记录（第一种）1、别人很想专找你的错么？6、打雷的时候你怕么？8、你怕黑暗么？12、你梦见已经死去的人么？14、你有没有一个梦，曾经做了许多次？23、你平常都是快乐么？28、你能够忍受痛苦和别人一样么？40、你的眼睛常常发生痛苦么？42、你曾经昏倒过吗？56、你曾经觉得你是一个很坏的人么？1-1-3 明尼苏达多相人格调查表十个临床量表：lHs(疑病)lD(

43、抑郁)lHy(歇斯底里)lPd(病态人格)lMf(男子气-女子气)lPa(妄想)lPt(精神衰弱)lSc(精神分裂症)lMa(轻躁狂)lSi(社会内向)四个效度量表：lQ(疑问分数)lL(说谎分数)lF(效度分数)lK(校正分数)MMPI剖析图比较：1-2 因素分析方法卡特尔16种人格因素问卷l温情乐群l聪明伶俐l成熟镇静l支配攻击l热心健谈l谨慎固执l卤莽厚皮l敏感优柔l多疑善嫉l豪放淡泊l世故圆滑l焦虑不安l批评实验l自负自决l克己严格l紧张兴奋16PF剖析图比较1-3 根据人格理论编制测验艾德沃斯个人偏好量表艾德沃斯个人偏好量表按缪瑞所提出的15种需要来编制：l成就l顺从l秩序l表现l自

44、治l亲密l省察l求助l支配l谦逊l助人l变通l坚毅l性爱l攻击1-4 人格自陈量表的评价自陈量表往往存在一个难题，即被试是否坦率而真实回答测题。在应征工作（或入学许可）上进行该类测验时，往往偏向好的一面，即选择社会期望的答案。而在法律鉴定时，某个杀人犯在进行该类测验时，可能会尽量避免选择心理健康有关的项目，以便使别人误认为他真有严重的心理变态，而逃脱法律的制裁。但自陈量表的记分比较客观，解释比较容易，不必象投射测验那样，只有受过专业训练的人员才能正确的解释和实施。第二节投射技术投射技术是心理学上用来测量人格的一种方法。以墨渍测验为例（这是投射法中应用最为广泛的一种），当主试向被试呈示一张墨渍

45、图片时，被试完全可以自由地给该墨渍加以某种意义的解释。从而获知他的动机、情绪、价值观、愿望等。用此方法研究人格，是立足于如下的基本假设：个体不是被动地接受外界的各项刺激；而是主动地、有选择地给外界的刺激加上某种意义，而后再对之表现出适当的反应。事实上每个人各以其独特的方式来整理自己的经验，组织他所得到的来自各方面的资料，这正是他的人格功能。2-1 投射技术的性质l投射测验就是给被试一个模糊而暧昧的刺激情境，使被试有一个机会来表示出内在的需求，以及许多特殊的知觉，和对该情境所作的各种解释。通常有许多潜意识的东西，在自陈量表中常常不能显露出来，但在投射测验中就不同了。l自陈量表是有若干标准化了的问

46、题，要被试回答其在一些不同的情境中是如何感情和活动的。而投射测验不能告诉被试测验的目的，只能告诉这是一种想象测验，它只是提供被试相当自由的情境使其间接地充分说明他自己。l投射测验相比自陈量表更注重整体人格的分析。种类1、联想法文字联想测验，罗夏墨渍测验2、构造法主题统觉测验3、完成法句子完成测验4、表露法画人测验2-2 罗夏墨渍测验 2-2-1 罗夏墨渍测验的内容和实施最早将墨渍图片编为一套测验，用作测量人格工具的，乃是瑞士精神医学家罗夏。罗夏曾以许多墨渍图片，对精神病患者做实验，根据他的临床观察，各种不同症状的精神病人，对墨渍图片各有不同反应。对此，他加以分析，终于建立一套记分系统，

47、后来再加以改进，使之适合正常人。测验材料l在这十张图片中，有五张是黑白的（1,4,5,6,7），各张的墨色深浅不一；另有两张除黑白外还加有红色墨渍（2,3）；其余的三张是淡彩色(8,9,10)。l每张图片中的墨渍都是形状对称的。2-2-2 罗夏墨渍测验的记分定位(location):整体(W);部分(D);小部分(d);细节(Dd);空白(S)定性(Determinants):形状(F);黑白光度(K);色彩(C);运动(M)内容(Content):植物；动物；人类；风景；人为事物；解剖的部分；性(Sex)和其他独创和从众(Original and Popular)2-2-3 测验结果的解释2

48、-2-3-1 定位如被试有W分，表示他有组织能力和抽象思考的能力。D分数表示有具体的、实际的、少创见性的心理能力。Dd表示有特殊的知觉，有时表示有精确的批评能力。如果表现极端，则表示注意琐事。刻板而有规则的人，往往先有W，而后有D，接着Dd，最后有S，精神病患者的反应，往往先后次序混乱。2-2-3-2 形状被试如有F+或F，表示他对于心智的过程和做事上有控制能力。分裂型的人，其行为无组织，对事曲解，故常有F-分。F分过高，表示在社会适应性上会受限制。2-2-3-3 色彩被试只是反应色彩，则表示其冲动行为；FC表示具有情绪上的控制和社会适应能力；CF表示冲动和自我中心。2-2-3-4 黑白光度对

49、于黑白光度的反应，可视为与被试的需求、焦虑、压抑和不满足之感有连带关系。2-2-3-5 运动对正常人而言，有M分表示有丰富的社会生活和理想生活，加上较少的C分数还表示有创造性。如单有运动反应而无色彩反应，表示有内心的生活，这是内向的人格；运动反应少，色彩反应多，表示是外向的人格。此外，适应困难的人，有M分数表示幻想生活：躁狂症的人则表示自我中心的愿望满足。2-2-3-6 内容如果被试反应的范围很窄，可能表示其兴趣很窄。有时主试可以从内容上看出精神病的意义，如被试解释某一图片为“两眼看着我”，则为妄想的反应；而解释为“木偶”，则为精神分裂症的典型反映。2-2-3-7 独创与从众如果被试的反应与一

50、般人不同，则可能表示他有独特的见解，智力比较高，或者是有意歪曲事实，有与社会适应不良的倾向。反之，反应与一般人有许多雷同的地方，可能表示他的智力一般，或者社会适应良好。测测验验举举例例 1l被试的反应：有两只熊，熊掌贴着熊掌，好像在玩拍拍掌，或者也可能是在打架。测测验验举举例例 2两个食人族的野人。还两个食人族的野人。还要再看出什么来吗？两要再看出什么来吗？两个非洲土人正弯腰在一个非洲土人正弯腰在一口锅子上。大概在煮什口锅子上。大概在煮什么东西么东西希望不是在希望不是在吃人。我不该开玩笑吃人。我不该开玩笑老是爱幽默一下。老是爱幽默一下。（他们是男的还是女的（他们是男的还是女的？）可

展开阅读全文