《心理学考研之心理测量学笔记.doc》由会员分享,可在线阅读,更多相关《心理学考研之心理测量学笔记.doc(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流心理学考研之心理测量学笔记.精品文档.心理测量学第一章 心理测量的历史要了解当代心理学的各个领域不可不了解心理测验,因为测验是在当代心理学的各个领域从事理论研究和实际应用的重要手段。要研究心理测验,不可不考察它的发生发展的历史。第一节 心理测量在我国有着悠久的历史测验的历史根源虽然无从考究,但中国人最早使用测验,也最重视测验,这一点是举世公认的。一、我国古代的心理测验早在2500多年前,我国古代教育家孔子就曾根据自己的观察评定学生的个别差异,把人分为中人、中人以上和中人以下,这实际上相当于测量学中的命名量表和次序量表。所谓“中人以上可以语上也
2、,中人以下不可以语上也”,就是说智力比普通人高的可以给他高等教育,智力比普遍人低的不能给他高等教育。比孔子稍晚的孟子也说过:“权,然后知轻重;度,然后知短长。物皆然,心为甚”这就明确指出了心理现象进行测量的必要和可能。 三国时刘劭著的人物志一书,提出了心理观察的一条基本原理,即“观其感变,以审常度。”意思是霉根据一个人的行为变化便可推测他的一般心理特点。并提出通过词,以回答法(“应赞”)为手段来观察人的智力。这是一部论述能力问题的古代专著。1937年美国人把它译成英文,书名为人类能力的研究。6世纪初,南朝人刘勰在新论专学篇甲提到,“使左手画方,右手画圆,无一时俱成”,“由心不两用则手不并运也”
3、。这是世界上最早的心理测验,比西方分心测验的出现要早1300多年。世界上最早的婴儿发展测验也出自中国民间,自6世纪中叶以来,“周岁试儿”在我国江南就已经成为风俗。颜氏家训作者颜之推在风操篇中对此做了详细记载:“江南风俗,儿生一期(一周岁),为制新衣,盥浴装饰。男则用弓矢纸笔,女则刀尺针缕,并加饮食之物及珍宝服玩,置之儿前,观其发意所取以验贪廉、智愚,名之为试儿。”美国的盖塞尔(AGese11)到本世纪20年代才用类似方法在实验室条件下记录幼儿的动作和顺应行为等方面的发展。颜之推还根据心理与行为的密切关系强调客观了解心理的可能,在名实篇中写道,“人之虚实真假在于心,无不见乎迹。”自从隋炀帝创行开
4、科取仕,科举制度在我国通行了1300多。年。目前西方言语测验中常见的填字和类比,相当于我国科举考试中的贴经和对偶,早在7世纪的唐代就有了。欧美各国通过考试选拔官吏的方法是18世纪末、19世纪初从我国学去的。 清朝后期出现的益智图(通称七巧板),形状大小不同的七块小板能够组成近百种的生物和实物图样,这可以看作是创造力测验的最早方案之一。七巧板的操作属于典型的发散式思维活动,操作的成果是形象转化(见图11),值得高度重视。我国民间流行的九连环,其设计之巧妙,也可以和现代的魔方、魔棍相媲美见图12。西方直到1914年才有五巧板。后来刘湛恩先生用英文写了中国人用的非文字智力测验一书,把七巧板、九连环介
5、绍到国外,武德沃斯(Woodworth)对九连环极为赞赏,把它称作“中阻式的述津”。最近,五巧板、七巧板已经发展成为纸笔测验,可应用于团体,测试方便,计分准确,已达到标准化程度。二、民主革命时期测验运动的发展清朝末年,心理学由西方传人我国。1914年有人在广东测验了500名儿童的记忆和比喻理解。1920年,北京高等师范学校和南京高等师范学校建立了我国最早的两所心理实验室。廖世承和陈鹤琴在南京高师开设测验课,并用心理测验试测投考该校的学生。这便是我国正式开始的科学心理测验。1921年他俩正式出版智力测验法一书。1922年,比奈量表由费培杰译成中文,并在江、浙二省的一些小学生中进行过测验。同年美国
6、测验专家麦柯尔(WAMocall)博士应中华教育改进社聘请来华讲学,在他的指导下,北京师范大学、北京大学、燕京大学、北京女子高等师范、东南大学等校的教授和学生开始编制测验。据麦氏说:当时中国心理学家所编造的各种测验“至少都与美国的水平相等,有许多竟比美国的为优。”1923年,在教育改进社的主持下,进行了全国小学教育调查,调查地区包括22个城市和11个乡镇,测验了92000个儿童。这个大规模的调查,引起了当时教育界对测验的注意。1924年,陆志韦先生发表了订正比奈西蒙智力测验说明书,30年代又与吴天敏再次做了修订;1931年中国测验学会成立。1932年测验杂志创刊。根据不完全的资料统计,到抗日战
7、争前夕,我国心理学工作者制订或改编出合乎标准的智力测验和人格测验约20种,教育测验50多种。如廖世承团体智力测验,陈鹤琴图形智力测验,刘湛恩非文字智力测验,以及肖孝嵘修订的墨跋量表和画人测验(原编制者美FLGoode-nongh)、艾伟修订的宾特纳智慧测验等。在这一时期,测量工作者能比较正确地估计测验的效用和价值,并不满足于已有的方法和技术,因而力图改进和提高。但是抗日战争爆发后,绝大多数人不得不中断或推迟当时所进行的工作。解放前共出版心理的研究、王征葵的态度溅量法、沈有乾的心理与测验、王书林的心理与教育测量、陈选善的教育测验、艾伟的小学儿童能力测验、孙帮正的心理与教育测验等。林传鼎先生指出:
8、“民主革命时期我国心理学家在测验领域至少做了两方面有益的工作:一是为当时的语文教学改革提供科学根据。二是为探索我国青少年儿童心理特点积累一些客观材料。”三、心理测验在科学的春天中复苏解放后的近30年,由于多方面原因,心理测验一直成为禁区。粉碎“四人帮”后,心理测验才在科学的春天中复苏。1979年,林传鼎,张厚粲等参考国外材料编制了少年儿童学习能力测验同年,中国心理学会在天津开会时,医学心理专业委员会成立了心理测验协作组,建议由湖南医学院龚耀先主持修订韦氏成人智力量表。1980年初,北京师大心理学系首次开设心理测量课。同年5月,中国心理学会实验心理学专业委员会在武汉召开了全国心理测验研究协作会议
9、,决定由林传鼎,张厚粲主持修订韦氏儿童智力量表,吴天敏主持修订比奈量表。经过三年的努力,这些测验已基本修订完成。在这期间中国科学院心理研究所和北。京安定医院等单位协作修订了明尼苏达多相个性调查表,北京大学心理系陈仲庚先生等修订了艾森克人格问卷,北京师大心理系编制了镶嵌图形测验,还有其它许多单位也编制或修订了一些心理测验,如注意测验、记忆测验、气质测验、婴幼儿发展测验等,并在编制创造思维能力测验方面做了一些有益的尝试。随着心理测量教学和研究工作的开展,心理测验开始在实际部门应用,如飞行员的选拔,运动员的选材、精神病的诊断、儿童多动症以及超常与智力落后儿童的检查等都用到心理测验。1983年初,在昆
10、明召开的普通心理,实验心理专业年会上,就测验问题进行了讨论。总结了近几年测验工作中的经验,找出了问题,明确了方向。1984年末,在北京召开的第五届全国心理学年会上,成立了测验工作委员会,加强了对测验工作的指导。第二节 科学心理测验的产生与发展一心理测验的产生是社会的需要在西方一些国家,工业革命成功后,对劳动力的需要急剧增加,工厂大量采用童工,许多地方官与工厂主订约,每雇20个童工,必需带一个低能者。第个用科学方法研究低能者的是法国医生意太(Itard)。他的学生沈干(Seguin)继承其师半途而废的事业,用生理训练法进行了多年试验,并于1837年创办了第一所专门教育智力落后儿童的学校。后来,其
11、他一些欧美国家也陆续设立低能学校或在普通学校设特别班。在这种情况下,单靠长期观察和社会公认来鉴别智力落后儿童就很不够了。1864年,沈干出版了白痴:用生理学方法来诊断与治疗一书,介绍了在感觉辨别力和运动控制力方面训练落后儿童的方法,其中的一些方法如形式板被后来的非言语智力测验所采用。19世纪,由于社会上对智力落后和精神失常者实行人道主义在欧洲和美洲开设了一些护理精神病人的特别医院,因而急需确定收护标准和客观化的分类方法,首先必须区分精神错乱者与智力落后者。法国医生伊斯奎洛尔(Esquirol)经过种种尝试最后断定:一个人驾驶语言的能力,是他智力水平的最可靠的标志。另外,随着工业的发展,社会分工
12、日益精细,因而有了专才训练与职业指导的需要,这也是促使测验发展的重要因素。特别是后来各种特殊能力倾向测验更是直接应实践的需要而产生的。二、心理测验起源于个别差异的研究世界上的事物千差万别,既是同一种事物,也有个别差异,没有任何两个物体是完全相同的。身有胖瘦,面有俊丑,而人心之不同,更是胜过其面。有个别差异,才有测量的必要。科学家最初发现人的心理的个体差异的重要性是起因于天文学上的一个事件。1796年,英国格林威治天文台的皇家天文学家N马斯基林因为助手金内布鲁克观察量体通过的晚间比自己迟02秒,认为他“师心自用,不依法行事”而将他辞退。此事在20年后受到另一天文学家贝塞尔的注意,他通过研究认为,
13、这是一种不可避免的个人观察的误差。于是引起了学者们对个别差异的研究。但是,当时的心理学家们并不关心个别差异的测量。直到19世纪末时,心理物理学的发展才促进了对心理现象的量的测定。1879年,冯特(WWundt)在莱比锡大学设立第一所心理实验室。这一时期的实验心理学家长于生理学和物理学,主要目标是要发现人类行为的一般趋势,注意的焦点是行为的共同性而不是它的差异性。但是在研究中发现,对于同一刺激;各人的反应常常不同。起初以为这是由于实验手续上的错误。经过长时间的实验才认识到,此种差异并非由于偶然的错误,而是由于个人间能力上的真正差别。于是,引起了个别差异的研究。要研究个别差异必须有测量工具,由此便
14、引起了测量运动。另一方面,早期的心理实验提出了严格控制观察条件的要求。例如,在一个测量反应时的实验中,给予被试者的指导语可能明显地提高或降低被试者的反应速度。再如,周围环境的照度和色调可能明显地改变视觉刺激物的形象。这表明,只有在标准状况下被试者所作的观察报告才是有价值的。这种程序的控制为测验的标准化打下了基础。三、心理测验的早期尝试 首先倡导测验运动的是优生学创始人、英国生物学家和心理学家弗兰西斯,高尔顿爵士(Francis Gdllon)。1869年, 他出版了遗传的天才一书,提出人的能力是由遗传而来,并设想人的能力的分布是常态的,其差异是可以测量的。他在调查遗传问题的过程中,认识到有必要
15、测量那些有亲缘关系和没有亲缘关系的人们的特性,以确定其相似程度。为此,高尔顿促使一些学校保存了对学生所进行的系统测量记录。他还在1884年国际博览会上设立了一个人类测量实验室,参观者付三个便士就可以测量到自己的某些身体素质和视听觉的敏锐性:肌肉力量、反应时以及其他一些简单的感觉一运动功能,博览会闭幕后,这个实验室迁到伦敦的南圣顿博物院,在这里继续开办了六年之久。用这种方法系统积累了关于简单心理过程方面的个别差异的大量资料。高尔顿设计了许多简单的测验,如判断线条长短与物体轻重。等。他受17世纪英国教育家洛克“一切知识来之感官”的观点的影响,企图由各种感觉辨别力的测量结果以推估个人智力的高低。他在
16、1883年出版的人的能力研究一书中说:“外部世界”的信息是通过我们的感觉到达我们大脑的。我们的感觉越敏锐,获得的信息便越多,获得的信息越多,我们的判断与思维便越有用武之地”。高尔顿还注意到,白痴对于热、冷,痛鉴别能力较低。这一观察结果使他进一步确信,感觉辨别力“基本上是心智能力中最高的能力”。高尔顿还是应用等级评定量表、问卷法以及自由联想法的先驱。他的另一个很重要的贡献是把统计方法应用于对个别差异资料的分析。他将以前数学家们所研究出来的统计技术改造为简单形式,使那些未经专门训练的调查者也能使用。他不但扩充了古特莱特(Guetelet)的百分位法,还创造了一种粗浅的计算相关系数的方法。他的学生卡
17、尔皮尔逊(KarlPearson)推进其事业,创立积差相关法,成为测验学者寸步不能离的工具。在心理测验的发展史上,美国心理学家JM卡特尔(JMCattell)占据了一个特别突出的位置。卡特尔早年留学于德国,从师冯特。他将新兴的实验心理学与刚刚兴起的测验运动结合起来,不顾先生的反对,完成了题为反应时的个别差异的博士论文。1888年,在剑桥大学任教期间,与高尔顿过从甚密,深受其影响,在差异测量方面的兴趣得到加强。回美后,执宾夕法尼亚大学心理学之教鞭,合冯、高二氏之学,以各种心理测验来研究个别差异。他在自己的实验室内编制测验五十个,包括测量肌肉力量、运动速度、痛感受性、视听敏度,重量辨别力、反应时、
18、记忆力以及类似的一些项目。他于1890年发表的心理测验与测量一文,描述了这些测验。这篇论文首创了“心理测验”这个术语,还由高尔顿加上了一篇附录表示支持。在此文中,卡特尔说:“心理学若不立足于实验与测量上,决不能够有自然科学之准确。”又说:“心理测验若有一普遍的标准,则其科学的与实际的价值一定可增加不少。”他当时就极力主张测验手续和考试方法应有统一规定,并要有常模以便比较。所有这些都是测量学上的重要观念。但他的测验皆脱胎于冯特的实验室,测量的大多是感知和运动过程。对同一个人来说;几项测验的结果往往很不一致,而且测验得分与老师评定的智力;等级或学习成绩相关极低。因此在教育上缺乏实用价值。这启发后来
19、的研究者探索其他途径来研究智力的差异。 早在1889年,厄恩(Oehro)曾编制十组测验,测量知觉、记忆、联想和运动机能。1892年波尔顿(Bolton)用数字:测量儿童的记忆力。1895年包尔登(Bourdon)发明勾消测验,其结果虽与智力关系不大,但此法现在依然通行。1897年艾宾浩斯Ebbinghaus)用算术运算,记忆广度、句子填充测验施测于小学生,最复杂的要数句子填充,其结果与学业成绩十分相符,这大有别于卡特尔的低级心理过程的测验。1903年,克来(Kelly)已有以智龄为常模的思想,可惜此后来深深加研究。列举这些人的贡献是为了说明,科学的心理测验不是哪一个人独立造的,而是时代发展的
20、必然产物。 四、比奈的贡献著名美国学者波林(EGBoring)指出;在测验领域中“19世纪80年代是高尔顿的10年,90年代是卡特尔的10年,20世纪头10年则是比奈的10年。比奈(ABinet),1857年生于法国尼斯市,其父为医生,其母为艺术家。比奈在青年时学习医学,却对心理学更有兴趣,1886年发表第一部著作推理心理学,1889年同享利博尼 (HBeaunis)在索那建立第一所法国心理实验室,后任实验室主任,1891年发表个性的变化一书,后来他还对一些著名的计算家、棋手和盲棋手的思维活动做了研究,1895年他创办第一份法国心理学杂志心理学年报,同年他与享利联名发表文章,批评当时流行的测验
21、太偏重于感觉,过于集中在测量简单的、特定的能力方面。他们认为,测量比较复杂的功能,不必苛求精确度,因为这些功能的个别差异是较大的。1898年比奈在哲学杂志上发表个性心理学中的测量一文,提到许多测验,如画方形,比较线的长短,记忆数目,词句重组,回答含有道德判断的问题,了解抽象文章的意义,折纸等等,后来有许多采用在他的量表中。在这篇文章中,他还提出心理测量的根本原理在于将个人的行为与他人比较以归类,这是近代测验理论的基本思想。1903年,他的另一本著作智办的实验研究问世,在此书中他所讲的智力是广义的,包含一切高等心理过程,并且表现在推理,判断以及运用旧经验解决新问题的行为上,他以自己的两个女儿作为
22、被试者,所用的测验有填字、图片解释等。有些后来亦用于他的量表中。1904年法国教育部委派许多医学家、教育家与科学家组织一个委员会,专门研究公立学校中低能班之管理法。比奈亦是委员之一。他决心将测验的理论研究变为实际的应用,不顾众人的反对,极力主张用测验法去辨别有心理缺陷的儿童。经过细心研究,次年与其助手西蒙(TSimon)在心理学年报上发表一篇论文,题为诊断异常儿童智力的新方法,在这篇文章中介绍的就是第一个智力量表比西量表。1905年的量表有30个由易到难排列的项目,可用来测量各种各样的能力,特别侧重于判断,理解,推理,亦即比奈所谓智力的基本组成部分。虽然这些测验也包括了感、知觉的内容,但其中言
23、语部分所占的比例远较同时代的其他测验为大。不过该量表比较粗糙。1908年做了修订,采用智力年龄的方法计算成绩,并建立了常模,这是心理测验史上的一个创新。1911年做了第二次修订,就在这一年比奈不幸谢世,终年54岁。比奈的成功不是偶然的,他曾经测量过人的头盖骨,研究过面相、手相和字相,他是费了许多工夫,试了许多方法,走了许多歧路,才得到成功的。目前世界上的智力测验为数众多,其基本原理和主要方法都是由比奈奠定的,在心理测量的发展史上,比奈的贡献是不可磨灭的。因此,美国心理学家宾特纳(RPintner)说:“在心理学史上,假使我们称冯特为实验心理学的鼻祖,我们不得不称比奈为心理智力测量的鼻祖。”五、
24、心理测验的发展 比西量表问世后,迅即传至世界各地。各种语言的版本纷纷出现,其中最著名的是美国斯坦福大学推孟(LM,Terman)教授1916修订的斯比量表,其最大的改变是采用了智商的观念。早在1911年,德国汉堡大学心理学家斯腾(Stern)就曾提出用儿童的心理年龄除以实足年龄所得的“心理商数”来表示聪明程度。推孟在修订比西量表时将其改称为“智商”,从此智商一词便为全世界所熟悉。心理测验运动自本世纪初兴起,20年代进入狂热,40年代达到顶峰,50年低转向稳步发展。在此期间测验主要有以下几方面的发展:(一)编制出一批操作测验,既可弥补语言文字量表在理论上的缺陷,又可以用于文盲和有言语障碍的人,非
25、文字量表以宾特纳所编的最好。(二)编制出团体智力测验,扩大了测验的应用范围。促进团 体智力测验发展的原因,是第一次世界大战时美国军队对官兵选拔和分派兵种的需要,在推孟的研究生奥蒂斯(ASOtis)所编团体测验的基础上发展出军用甲,乙两种测验,对200多万官兵进行了智力检查。战后此种测验经改造广泛用于民间,为教育与工商各界普遍采用。(三)多重能力倾向测验逐渐受到重视。早在一次世界大战前,一些特殊能力(如音乐,美术、机械等厂倾向测验已经在实际应用中得到发展。30年代后,随着因素分析理论的发展,多项能力倾向测验在二次大战后编制出来,这种成套测验为分析个人心理品质的内部结构提供了适用的工具。普通能力倾
26、向(智力)测验也向多元分析形式发展。主要代表是美国学者韦科斯勒(DWechsler) 所编制的儿童智力量表(1949),成人智力量表 (1955)和学前智力量表(1967)。其特点一是用离差智商代替比率智商,二是由各个分测验结果可以得到言语,操作和全量表三个分数,即可以区分个别间差异,也可以评定个别内差异。对人的智力的描述,从笼统地谈聪明。不聪明,转向区分智力的不同侧面。说明人人皆有所长和所短。(四)正当心理学家们忙于发展智力测验的时候,传统的学校考试也正在进行一场改革,卡特尔的学生桑代克(ELThorndike)等人,利用心理测验原理,编造了第一批标准化的教育测验。因此后人尊称他为教育测验之
27、鼻祖。一些专门的教育测验机构也在一些国家陆续成立起来,美国教育测验中心成立于1947年,是目前世界上最大的测验编制和研究机构。它有心理学家,教育学家和各方面的学科专家2000余人,并配有现代化的计算设备。 (五)心理测验的另一领域涉及情感适应、人际关系、动机、兴趣、态度、性格等人格特点。人格测验的先驱是克瑞普林(EKraepelin),他最早用自由联想测验来诊断精神病人。人格问卷或自陈量表的原型是1917年武德沃斯设计用于士兵的个人资料调查表,以后一直被奉为情绪适应调查表的范本。而1921年问世的罗夏克(RorschacA)墨迹测验则是投射测验的发端。人格测验后来也发展到要求数量化,如明尼苏达
28、多相个性调查表等。(六)60年代后,由于认知心理学的崛起,将实验法与测验法结合,产生了信息加工测验,为了解心理能力提供了一些补充方法,使心理测验出现了新的发展趋势。 纵观心理测验的发展历史,可看出以下几点:(一)先是以解剖生理特征为根据,而后转向对心智活动的测量。(二)由测量简单的感知能力,发展到测量复杂的认知能力。(三)由笼统的单一量数以评定个别间差异的观念,转变为以多个量数兼顾个别差异与个别内差异的观念。(四)心理测量学是随着实验心理学的发展而产生的,二者在发展过程中由合到分,最后又走到一起来了。 目前的心理测验虽然看起来很简单,却是经过几代心理学家用了近一个世纪的时间反复探索才找到的,其
29、发展主要受了两方面因素的影响。一是心理学理论的发展。1904年英国心理学家斯皮尔曼(CSpearman)提出智力的二因论,认为人类智力可分为普通因素和特殊因素二部分,比奈测验所测得的只是普通因素。后来人们又对特殊因素发生兴趣,而编出各种特殊能力测验。30年代智力的多因论兴起,瑟斯顿(LLThurstone)由因素分析求得七种基本的心理能力,随之发展出一批多重能力侧向测验。60年代美国南加州大学教授吉尔福特(JPGuilord)的智力结构理论代之而起,提出发散思维为智力的因素之一,从而开拓测量创造力的新领域。二是统计学方法的进步。早期的心理测验主要应用相关法进行研究。30年代后,因素分析法盛行,
30、不但推进了能力测验的发展,还促进了人格理论与人格测验的发展,卡特尔16种人格因素测验就是采用因素分析法编制的。当代信息加工测验的发展与一系列新的数学模式的提出是同计算机的应用分不开的。 第二章 心理测量的性质与功能第一节 心理测量的性质美国心理学家桑代克和教育测量学家麦柯尔在几十年前曾先后提出“凡客观存在的事物都有其数量”,“凡有数量的东西都可以测量”。对物理现象的测量由来已久,其可能性已为世人所公认。对心理现象测量的可能性,直到现在尚受到一些人的怀疑。随着科学的发展,技术的进步,人们不但对物体的长度,重量,温度以及时间,空间,运动等物理特性做出了越来越精确的测量,而且不断地尝试着对人的感知,
31、记忆,思维、想象、注意、情绪以及能力,气质、性格等心理特性进行测量,并摸索出了一些方法,加深了对人类心理现象的了解,促进了心理学理论的发展。唯心主义者把人的心理归结为灵魂的活动。灵魂,自然是神秘不可测的。辩证唯物主义认为,心理是脑的机能,是客观现实的反映。人的心里既是主观的,又是客观的。其客观性不但表现在心理的产生具有客观的物质基础(外界刺激和脑的生理过程),还表现在心理要通过各种活动或行为表现出来。心理的客观性,存在性决定了心理的可知性、可测性。譬如我们平时说的“怕” 这种心理现象,虽不是物质实体,但也是种客观存在,伴随有一系列生理变化,并能用仪器测量出来。从脉博,呼吸、心跳,血压,皮肤电及
32、外显行为的改变,便可以推测其“怕”的程度。当然,由于心理现象本身十分复杂,目前的测量方法尚未完善,心理测量无论就其可靠性和准确性都远不如物理测量。但测得不准不等于不能测,现在不能测不等于将来不能测。不承认心理现象的可测性,是唯心主义的不可知论。一、什么是测量(一)测量的定义 简单地说,测量就是根据一定的法则用数字对事物加以确定。所谓“一定的法则”,指的是在测量时所采用的规则或方法。例如,用秤测物体的重量,依据的是杠杆原理,用温度计测物体的温度,依据的是热胀冷缩规律,用尺子测物体的长度,是把尺子的零点对准物体的一端,看物体的另一端所对着的刻度,测量人的智力,是根据智力理论编制测验,看被试者在测验
33、上的得分,如此等等。使用好的法则,可以得到准确的测量效果,使用坏的法则,则会得到不准确的测量效果。许多事物易于测量,因其使用的法则易于确立和遵守,心理现象难以测量,是因为我们很难设计清晰而良好的法则。随着人类认识的发展,测量法则不断完善,测量也就越来越真确。所谓“事物”,指的是我们所感兴趣的东西,说得更明确些,是引起我们兴趣的事物的属性或特征。测量就是确定这些属性或特征的差异。人与人的差别不只表现在有高有矮,有强有弱,有人跑得快、有人跳得高等身体外貌和体力特点上,也表现在较为抽象的心理能力和人格特点方面。例如有人活泼好动,有人沉静安详,有人勇敢豪放,有人谦逊细心,有人过目不忘,有人思维敏捷,有
34、人精于数理工程,有人擅长文学艺术等等。所有这些特性都是心理测量的对象。所谓“数字”,是个比数值意义更广泛的概念,可以表示数量,也可以不表示数量。一般说来,用数字对事物加以确定,就是确定出一个事物或事物的某一属性的量。但有时也可把数字当作一种事物的符号,而不反映事物的量,如“1班、2班、3班”等。通常人们说的测量,指的是前一种情况, 即根据特定的法则,采用一定的操作程序,给事物确定出一种数量化的价值。(二)测量的要素1参照点要确定事物的量,必须有一个计算的起点,这个起点叫参照点。参照点不同,测量的结果便无法相互比较。参照点有两种:一种是绝对的零点,如测量轻重、长短,都以零点为参照点,即以“恰恰没
35、有一点重量”、“恰恰没有一点长度”为计算的起点。另一种人定的参照点,如以海平面为测量陆地高度的起点,以冰点为测量温度的起点,这些都是人定的参照点。理想的参照点是绝对零点。心理测量中所用的参照点都是人定的,此种参照点有一个极大的限制,就是从该点起计算的数值不能以“倍数”的方式解释。如甲的智商为100,乙的智商为50,不能说甲的智力是乙的二倍,因为没有零智力。这个道理虽然简单,但往往为人们所忽略,因而常常对测验分数做出不恰当的解释。 测量长度以米、厘米等为单位,测量重量以公斤、克等为单位,测量时间以分、秒等为单位。没有单位,数量的多少、大小便无法表示。好的单位须符合两个条件,一为有确定意义,即同一
36、单位在大家看来意义相同,不允许有不同的解释。二为有相等的价值,即第一单位与第二单位间的距离等于第二单位与第三单位间的距离。上述测量长度、重量与时间所的单位符合这两个条件,而心理和教育测量所用的单位则不等值。如智龄是年龄作为智力的单位,因为智力发展的速度先快后,4岁与5岁之间的差别,明显大于14岁与15岁之间的差别。(三)测量的量表 要测量某个事物,必须先有一个定有单位和参照点的连续体,将要测的每个事物放在这个连续体的适当位置上,看他们距参照点的远近,便会得到一个测量值这种连续体就叫量表。由于制定量表的单位和参照点的种类不同,量表的种类也不同,根据测量的精确程度,其蒂文斯(S。SSfepens)
37、将测量从低级到高级有分成四种水平,高级量表除包括低级量表的条件假设和功能外,还有本身的特点。1命名量表这是测量水平最低的一种,只是用数字来代表事物或把事物归类。因为这里的数字没有数量化的关系,所以也有人认为它不能算是测量。这种量表又可分为两种,(1)代号用数字来代表个别事物,如学生和运动员的编号等。(2)类别用数字来代表具有某一属性的事物的全体,即把某些事物确定到不同性质的类别里,如用1代表男,用2代表女,或用不同数字代表不同职业等。在命名量表中,数字只用来作标记和分类,而不能作数量化分析,既不能说ABC,也不能做加,减,乘,除的运算。它所适用的统计有次数、众数、百分比、偶发事物相关(如四分相
38、关,相关)以及x2考验等。2二次序量表 它比命名量表水平高,不但指明类别的大小或含有某种属性的多少,如学生的考试名次、工资级别、能力等级、对某事物时喜爱程度等等。这里的数字包含有数量关系,代表符号是“”, 如ABC等,主要用于分等(当然也包含了分类)。在次序量表中,既无相等单位,又无绝对零点,数字仅表示等级。并不表示某种属性的真正量或绝对值。它所适用的统计有中位数,百分位数、斯皮尔蔓等级相关系数和肯德尔和谐系数等,但不能做加、减、乘、除运算。3等距量表它比次序量表又进一步,不但有大小关系,而且一定数量的差异在整个量表的所有部分都是相等的,也就是具有相等的单位,其数值可相互做加、减运算,但没有绝
39、对的零点,因此不能做乘除运算。典型例子是温度计,10与15的差别,同15与20的差别是一样的,我们可以说某物温度比另一物高多少,但不能说某物温度是另一物的多少倍,因为它的零点是人定的,0并不意味着没有温度。等距量表的数值加或减一个常数或用一个常数乘或除,不会破坏原来数据之间的关系,因此一个量表上的数值可以转换为另一个具有不同单位的量表上的数值,而且几个不同单位的测值可以转换到一个通用量表上以便于比较。如摄氏10度可以转换华氏50度。用此种量表获得的数值可计算平均数、标准差、积差相关、阶层相关,并作T和F检验。4比率量表 是最高水平的量表,既有相等单位又有绝对零点。此种量表在物理测量中容易见到,
40、长度、重量、时间等都是。所得的数值可做加,减,乘、除运算。如体重:甲80公斤,乙40公斤,我们既可以说甲的体重比乙多40公斤,也可以说甲的体重是乙的2倍。比率量表所适用的统计除上述几种外,还可以计算几何均数及变异系数等。由于大多数心理特征难以找到有意义的零点,所以本书不讨论用比率量表进行的测量。 二、什么是心理测量 所谓心理测量,就是根据一定的法则用数字对人的行为加以确定。即依据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。本书中所讨论的心理数量,是以测验作为工具的测量,而不是用实验,观察等方法对心理现象的测量。(一) 测验的定义 “测验”一词虽为大家所熟悉,但要给测
41、验下一个严格的定义却并不容易。目前,关于测验有许多定义,笔者较为赞成美国心理与教育测量学家布朗(FGBrown)的说法:测验是 “测量一个行为样本的系统程序”。通俗地说,心理测验就是通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析一种科学手段。 首先,测验测量的是人的行为,严格地讲,只是测量了做测验的行为,也就是一个人对测验题目所进行的反应。在这个意义上可以说,测验即引起某种行为的工具。 其次,一个测验不可能包含所要测量的行为领域的所有可能的题目,它所包含的只是全部可能题目的一个样本。当然,也有例外的情况;例如对幼儿施测一个10以内数字的加法测验,就可
42、以包括两个一位数字加法的全部各种组合。但这种情况是极少的,由于测验只是测量一个行为样本,因此测验题目的取样必须有代表性,而且在用同一领域的另一个等值的样本时,应该得到同样的分数。 第三,在编制、施测、评分和解释方面依据一套系统的程序。这种按照严格的科学程序去编制和使用的测验称之为标准化测验。标准化有三点好处,一是可以减少无关因素测验目的的影响,使测量准确、客观。二是有统一标准,便于对不同人的测验成绩进行比较和交流。三是同一份测验可用于许多人并可反复使用,较为经济。我们平时说的考试也是用来测量人的某种行为,藉以判定个别差异的工具,它们与测验的主要差别在于没有标准化,或标准化程度较低。通常只凭教师
43、各自经验出题施测和评分,对分数的解释也带有主观随意性。而测验不但要通过统计分析等科学程序编制出符合测验目的的题目,并有严格的实施程序与计分方法,而且要有关于测验的信度、效度以及如何解释分数的说明。(二)心理测量属于哪一种水平的测量一个标准化测验除了有一系列测题外,还有一个或几个标定得很好的量表,每个量表是一组符号或一组数量,用来描写所测量的特性的拥有程度。这些量表是属于哪一级水平呢?一般说来,心理测量是在次序量表上进行的。因为对于人的智力、性格、兴趣、态度等来说,绝对零点是难以确定的。有人从智力发展曲线推定出智力的、绝对零点是在出生前三个月,亦即受孕后六个月,这个时期恰恰相当于胎儿开始活动,中
44、枢神经系统开始控制肌肉运动这样一个成熟的时期。但此说尚未得到普遍承认。即便在某一学科的考试中得了零分,也不能认为被试在此学科方面的知识和能力为零。而且,在心理测量中,相等单位是很难获得的,例如,假定一个测验包含50个个难度不同的题目,每题1分,我们能否说10分和15分的差别与45分和50分的差别相等?表面看来,都是5分之差,似乎是相等的,但仔细考虑一下就会发现,4550之差比1015之差要大些,因为从45分提高到50分,要求再答对5个较难的题目,而从10分提高到15分却只要求再做对5个相对容易的题目。所以此量表实际上并没有相等间隔或单位。虽然心理现象适合在次序量表上进行测量,但大多数心理学家喜
45、欢把测验成绩表现在等距量表上。尽管目前在心理测验中还无法直接制定出等距量表,但可以采用统计方法把测验分数转换到一个有相等单位的量表上,最通常的转换方法是转换成标准分数。即把次序量表转变成以标准差为单位的等距量表。(三)心理测量的性质把心理测量同物理测量等量齐观,是导致人们对心理测验产生种种误解的原因。心理测量与物理测量有同也有异,总的看来,心理现象比物理现象更复杂,更难以测量。1心理测量的间接性 科学发展到今天,我们还无法直接测量人的心理,只能测量人的外显行为,也就是说,我们只能通过一个人对测验题目的反应来推论出他的心理特质。所谓特质是描述一组内部相关或内在联系的行为时所使用的术语,是在遗传与
46、环境影响下,个人对刺激作反应的一种内在倾向。例如,一个人喜欢阅读机械杂志,喜欢观看各种机器运转,热心为别人修理钟表、自行车,由此我们便可推论此人具有机械兴趣的特质。可见,特质乃是个体特有的(与他人不同)、稳定的(表现于多种情况)、可辨别的(可与其他特征分开)特征。但它又是一个抽象的产物,一个构想,而不是一个被直接测量到的有实体的个人特点。由于特质是从行为模式中推论出来的,所以心理测量永远是间接的。对这种间接测量有人持怀疑态度,认为所测量的不是所要要测的东西。实际上,这种间接测量的方法不仅在心理测量中采用,在生理学上,巴甫洛夫用狗的唾夜分泌推测大脑的高级神经活动,也是一种间接的测量。人的心理活动
47、与行为具有因果关系,由“果”推测“因”,这是科学研究的基本方法之一。 2心理测量的相对性在对人的行为做比较时,没有绝对的标准,亦即没有绝对零点,我们有的只是一个连续的行为序列;所谓测量就是看每个人处在这个序列的什么位置上,由此测得一个人智力的高低兴趣的大小等,都是与所在团体的大多数人的行为或某种人为确定的标准相比较而言的。3心理测量的客观性客观性是对一切测量的基本要求。在心理测量中要控制的变量比物理测量多得多,要做到客观颇不容易。测验的客观性实际上就是测验的标准化问题;量具必须标准化,这是对一切测量的共同要求。经过长期的努力探索,测验的标准化即客观性已经有了很大改进。 首先,测验用的题目或作业
48、、施测说明、施测者的言语态度及施测时的物理环境等,均经过标准化,测验的刺激是客观的。特别是对测验项目的选择不是随意的,而是在预测基础上,通过统计分析(难度、区分度等)确定的。其次,评分计分的原则和手续经过了标准化,对反应的量化是客观的。评分方面的客观性测验种类和题目类型而异。一般说来,投射测验的客观性差些,而选择题的客观性较好,因此后者有时又叫客观测验。最后,分数的转换和解释经过了标准化,对结果的推论是客观的。测验常模是通过对总体的代表性样本的预测确定的,测验的信度和效度也在一定程度上经过实践的检验,依据这些资料所做出的推论,自然较为可靠和客观。心理测验的客观性虽然尚需进一步提高,但它毕竟是测量人的心理特性的较为客观、较为科学的方法,目前,还没有更有效、更实用的方法能够取代它。 第二节 心理测验的种类及功能心理测验是判定个别差异的工具,个别差异包括很多方面,并可在不同的目的与不同的情境下去研究,这就使测验具有了不同的类别和功用。一、心理测验的种类心理测验的分类随采用的标准