《心理测量(心理咨询师班).ppt》由会员分享,可在线阅读,更多相关《心理测量(心理咨询师班).ppt(237页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、心理测量(心理咨询师班)Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第一节 概 述第二节 测验的常模第三节 测验的信度第四节 测验的效度第五节 项目分析第六节 测验编制的一般程序第七节 心理测验的使用第一节 概 述第一单元 测量与测量量表 一、什么是测量测量是依据一定的法则用数字对事物加以确定。包括三个要素:(1)事物;(2)数字;(3)法则。(08年11月三级题)“事物”指要测量的对象,准确地说,就是引起我们兴趣的事物的属性或特征。在心理测量中,就是心理能力和
2、人格特点等。由于这些心理现象不能直接测量,因此测量的实际是心理现象的外显行为。“数字”是代表某一事物或事物某一属性的量。数具有区分性,即1就是1,2就是2;数具有序列性或等级性,如12BC,也不能做加、减、乘、除的运算。(二)顺序量表它比命名量表水平高,其中的数字不仅指明类别,同时指明类别的大小或含有某种属性的程度,如学生的考试名次(06年11月三级题)、能力等级、对某事物的喜爱程度等。这里的数字包含有数量关系,如ABC等,主要用于分等或排出顺序。在顺序量表中,既无相等单位,又无绝对零点,数字仅表示等级(09年11月三级题),并不表示某种属性的真正量或绝对值。例如100米短跑比赛中甲得了第一名
3、,乙得了第二名,这样我们可以知道甲排在乙前面,但是我们不知道甲比乙快多少。(三)等距量表它不但有大小关系,而且具有相等的单位,其数值可以相互做加、减运算,但没有绝对的零点,因此不能做乘、除运算。例如,10与15的差别,同15与20的差别是一样的,可以说某物温度比另一物高多少,但不能说某物温度是另一物的多少倍,因为它的零点是人定的,0并不意味着没有温度。等距量表的数值加或减一个常数或用一个常数乘或除,不会破坏原来数据之间的关系。(四)等比量表是最高水平的量表,既有相等单位又有绝对零点。此种量表在物理测量中容易见到,长度、重量、时间等都是等比量表。所得的数值可以做加、减、乘、除运算(06年11月二
4、级题、08年5月二级题)。如体重:甲80公斤,已40公斤,既可以说甲的体重比乙多40公斤,也可以说甲的体重是乙的2倍。心理测量是在顺序量表上进行的。因为对于人的智力、性格、兴趣、态度等来说,绝对零点是难以确定的。在心理测量中,相等单位也是很难获得的。利用某种统计方法,可以把这种顺序量表得到的数据换算为等距数据来进行统计。第二单元 心理测量的基本概念一、心理测量的定义心理测量,是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。首先,心理测量的对象是人的行为,严格地说,只是测量了做测验的行为,也就是一个人
5、对测验题目的反应。在这个意义上,心理测验就是引起某种行为的工具。其次,心理测量往往只是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的心理特征。行为样本,是指有代表性的样本,或者说根据某些条件所取得的标准样本。由于所取得的标准样本只代表某些心理功能,并不能反映这种功能的全部,所以总不免有某种程度的偏差。因此只有在全部了解行为样本的意义后,才能正确使用心理测验。第三,为了使不同的被试者所获得的分数有比较的可能性,测验的条件对所有的被试者都必须是相同的。在测验编制时,测题的印刷和成批生产的器具要保证物理性质上的一致;对被试者的指导语尽管不能编得天衣无缝,但是要尽量编得凡是足以影响测验作业的
6、每一种情况,都有详细的说明,以保证被试者在反应时减少误差;评分标准也要在测验编制时规定清楚,必要时还应该举例说明,以使主试者评分时都可以按同样的标准规则记分。第四,个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。常模是给测验分数提供比较的标准,即提供某一标准化的样组在某一测验上的平均分数,从而对测验分数加以解释。常模是否可靠,关键是有无一个代表性的被试样本,即建立常模的这组被试要有足够的数量,而且是依据随机抽样和分层抽样的原则挑选出来的。二、心理测量的性质(08年11月三级题)由于心理现象比物理现象更加复杂,测量起来也更困难,因此心理测验具有独特的性质
7、。(一)间接性今天还无法直接测量人的心理活动,只能测量人的外显行为,也就是说,只能通过一个人对测验项目的反应来推论出他的心理特质。(二)相对性测验就是看每个人处在连续的行为序列的什么位置上,由此测得一个人智力的高低、兴趣的大小或性格的特性等。而这一连续序列是由某一团体或一群人的某类行为特点或心理特征构成的,所以每一个人被测得的结果都是与所在团体或人群的大多数人的行为或某种人为确定的标准相比较而言的。没有绝对的标准。(三)客观性测验的客观性实际上就是测验的标准化问题。心理测量的标准化包括以下内容:首先,测验用的项目或作业、施测说明、施测者的言语态度及施测时的物理环境等,均经过标准化,测验的刺激是
8、客观的。其次,评分记分的原则和手续经过了标准化,对反应的量化是客观的。一般来说,投射测验的客观性差些,而选择题的客观性较好。最后,分数转换和解释经过了标准化,对结果的推论是客观的。第三单元 心理测验的分类心理测验种类较多,据统计,仅以英语发表的测验就已达5000余种。其中,有许多因过时而废弃不用;有许多本来就流传不广,鲜为人知;有一部分测验应用广泛,经过一再修订,并为许多国家译制使用。1989年出版的心理测验年鉴第十版收集了常用的各种心理测验有近1800种。一、按测验的功能分类(09年11月三级题)(一)智力测验这类测验的功能是测量人的一般智力水平。如BinetSimon智力测验、Stanfo
9、rdBinet智力量表、Wechsler儿童和成人智力量表等。(二)特殊能力测验这类测验偏重测量个人的特殊潜在能力,多为升学、职业指导以及一些特殊工种人员的筛选所用。常用的如音乐、绘画、机械技巧、文书才能测验。(三)人格测验 这类测验主要用于测量性格、气质、兴趣、态度、品德、情绪、动机、信念等方面的个性心理特征,亦即个性中除能力以外的部分。一般有两类,一类是问卷法,一类是投射法。前者如MMPI、16PF、EPQ(07年5月三级题),后者如罗夏测验、主题统觉测验(TAT)。二、按测验材料的性质分类(一)文字测验文字测验所用的是文字材料,它以言语来提出刺激,被试者用言语做出反应。此类测验实施方便,
10、团体测验多采用此种方式编制,缺点是容易受被试者文化程度的影响。(二)操作测验操作测验也称非文字测验。测验题目多属于对图形、实物、工具、模型的辨认和操作,无须使用言语作答,所以不受文化因素的限制,可用于学前儿童和不识字的成人。缺点是大多不宜团体实施,在时间上不经济。两类测验常常结合使用。例如BinetSimon智力量表开始主要是文字测验,但以后修订的BinetSimon智力量表,Wechsler的三套智力量表(即幼儿、儿童和成人)每套均分成文字的和操作的两类测验。三、按测验材料的严谨程度分类(一)客观测验 此类测验所呈现的刺激词句、图形等意义明确,只需被试者直接理解,无须发挥想像力来猜测和遐想,
11、故称客观测验。绝大多数心理测验都属这类测验。(二)投射测验在此类测验中,刺激没有明确意义,问题模糊,对被试的反应也没有明确规定。被试者做出反应时,一定要凭自己的想像力加以填补,使之有意义。在这过程中,恰好投射出被试者的思想、情感和经验,所以称投射测验。具有代表性的有罗夏测验、主题统觉测验、自由联想测验和句子完成测验。四、按测验的方式分类(08年11月三级题)(一)个别测验指每次测验过程中是以一对一形式来进行的,即一次一个被试。这是临床上最常用的心理测验形式,如BinetSimon智力量表、Wechsler智力量表。其优点在于主试对被试的言语和情绪状态有仔细的观察,并且有充分的机会与被试合作,所
12、以其结果可靠。缺点是时间不经济,而且测验手续复杂,主试者需要较高的训练与素养。(二)团体测验 指每次测验过程中由一个或几个主试者对较多的被试者同时实施测验。心理测验史上著名的陆军甲种和乙种测验都是团体测验。优点在于时间经济,主试者不必接受严格的专业训练即可担任。缺点为主试者对被试者的行为不能作切实的控制,所得结果不及个别测验可靠,故在临床上很少使用。五、按测验的要求分类(06年5月二级题)(一)最高作为测验 要求被试者尽可能做出最好的回答,主要与认知过程有关,有正确答案。智力测验、成就测验均属最高作为测验。(二)典型行为测验要求被试者按通常的习惯方式做出反应,没有正确答案。一般来说,各种人格测
13、验均属典型行为测验。第四单元 纠正错误的测验观 一、错误的测验观(06年5月三级题)不客观态度大体分为两类:一是测验完美无缺,另一是测验无用且有害。(一)测验万能论 自测验问世以来,就有人认为心理测验可以解决一切问题,对测验甚至顶礼膜拜,奉若神明。(二)测验无用论 其一,某些人格测验侵犯了个人隐私,违背民主原则。其二,测验为宿命论和种族歧视提供了心理学依据。如早期智力测验的结果表明,黑人的平均IQ低于白人的平均IQ,于是下结论说黑人确实比白人差。但这种观点很快就受到正直的心理学家的批评,他们指出这是因为常模中黑人太少所致。(三)心理测验即智力测验心理测验=智力测验=智商(1Q)=遗传决定论。二
14、、正确的测验现(07年5月三级题)(一)心理测验是重要的心理学研究方法之一,是决策的辅助工具除实验法以外,心理测验法的出现是心理科学发展史上的一大进步,是心理学研究中不可缺少的研究方法之一。有许多高级心理过程目前尚无法在实验室进行研究,心理测验就是很好的办法,它可以弥补实验法的不足。(二)心理测验作为研究方法和测量工具尚不完善 心理测验的最大问题是理论基础不够坚实。比如,关于智力和人格的定义尚未争论清楚,还没有得到一个统一公认的定义,但智力测验和人格测验已被广泛使用。科学的态度是既要承认心理测验的不完善,又要科学地自信地使用心理测验。第五单元 心理测验在心理咨询中的应用 心理咨询和治疗的有效性
15、,有赖于对求助者心理特性、行为问题性质的正确评估和诊断,以便于提供适当的指导、帮助和行为矫正训练。因此,心理测验在心理咨询中有重要意义。心理门诊中运用较多的大致有这样3类心理测验:智力测验、人格测验以及心理评定量表。一、智力测验常用量表有:吴天敏修订的中国比内量表龚耀先等人修订的韦氏成人智力量表(WAISRC)、韦氏儿童智力量表(CWISC)和韦氏幼儿智力量表(CWYCSI)林传鼎等人修订的韦氏儿童智力量表(WISCCR)张厚粲主持修订的瑞文标准型测验(SPM)李丹等修订的联合型瑞文测验(CRT)等。二、人格测验应用较多的有:艾森克人格问卷(EPQ)卡特尔16人格因素问卷(16PF)明尼苏达多
16、项人格调查表(MMPl)等。人格测验有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解MMPI还有助于治疗者了解对方是否属于精神异常范围。三、心评定量表心理评定量表主要包括有精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表、恐怖量表等。这类量表用法及评分简便,多用于检查对方某方面心理障碍的存在与否或其程度如何,并可反映病情的演变。心理测验是分析求助者心理问题的重要工具。它不但可以检验咨询人员的判断是否正确,还能帮助其对求助者的问题进行深入的分析。但作为咨询者,有一点必须明确,那就是心理测验在咨询和心理治疗过程中并不是必不可少的一个环节,如果通过与咨询或治疗对象的交谈,对其问题
17、已形成明确的看法,就可放弃不必要的心理测验。有时过多的使用还会影响咨询、治疗的过程和效果。心理测验应在咨询关系尚未建立之前实施,进入正式的心理咨询程序之后,要尽量避免心理测验。当然也有例外。咨询过程无法进行下去,咨询者也不知如何进行下去的时候,由心理测验的结果可以再次确认与求助者的咨询关系,这种情况下,心理测验最好由其他心理学工作者、专家实施。第六单元 心理测量的发展史我国始于汉代、兴于隋唐的科举取士制度就被中外学者公认为世界上最早的心理测验的实践。在古希腊,测验作为教育的附加物,既测智力技能又测运动才干;在中世纪,欧洲的某些大学已开始使用考试方法。科学的心理测验则是工业革命成功后的19世纪的
18、欧洲发展起来的。一、科学心理测验的产生与发展首先倡导科学心理测验的学者是英国生物学家和心理学家高尔顿。他提出人的不同气质特点和智能是按身体特点的不同而遗传的。为了研究差异的遗传性,便设计了测量差异的方法。这虽然不是正式的心理测验,但可视为心理测验的开端。高尔顿也为心理测验奠定了统计学基础。他第一个提出了相关的概念,并由他的学生皮尔逊加以发展,创立积差相关法,这使判定心理测验的信度、效度和进行因素分析成为可能。对促进心理测验发展做出巨大贡献的是美国心理学家卡特尔。1890年,卡特尔在心理杂志上发表心理测验与测量一文,这是心理测验第一次出现于心理学文献中。卡特尔写到:“心理学若不立足于实验与测量上
19、,决不能够有自然科学之准确性。”又说:“心理测验如果有一个普遍的标准,则其科学的与实用的价值都可以增加。”1904年,法国教育部委派许多教育家、医学家和其他科学家组成一个委员会,专门研究公立学校中智力落后儿童的教育方法。作为委员之一,比内(Binet)极力主张用一种测验的方法去辨别和发现智力落后的儿童。经过他与助手西蒙(Simon)的精心研究,次年在心理学年报上发表了一篇文章,题为诊断异常儿童智力的新方法,在这篇文章中他介绍了一个包括30个项目的量表。这个量表很粗糙,但它在心理测验史上极其重要,是世界上第一个正式的心理测验(09年11月三级题)。纵观心理测验的发展,19世纪80年代是高尔顿的十
20、年90年代是卡特尔的十年20世纪头十年则是比内的智力测验的十年心理测验主要有以下几个方面的发展:1.操作测验的发展:由于理论上的缺陷和实际上的需要,所以就有操作测验的问世和发展。2.团体智力测验的发展:个别测验每次只能测查一个人,这在时间上是很不经济的。而运用团体测验则在同一时间可以测量许多被试,这是心理测验方式的极大进步,也扩大了测验的应用范围。团体测验始于第一次世界大战,在推孟的研究生奥蒂斯所编团体测验的基础上编制出陆军甲种和乙种智力测验,广泛用于美国军队对官兵选拔和分派兵种的需要。3.能力倾向测验的发展:20世纪30年代是因素分析盛行的十年,在此期间多项能力倾向测验被编制出来,这些测验为
21、分析个人心理品质的内部结构提供了适用的工具,并逐渐受到人们重视。普通能力倾向(智力)测验也向多元化发展。在这里要特别提及韦克斯勒所编的学前儿童、学龄儿童和成人智力量表,他将智力量表分为言语和操作两部分,而每个部分又包含有不同的分测验,这样不仅可计算IQ总分,也可区分智力的不同侧面。4.人格测验的发展:心理测验的另一领域是涉及情感或行为等非智力方面的人格评估,通常包括对性格、气质、情绪状态、人际关系、动机、兴趣和态度的测量。1920年问世的罗夏测验(Rorschach test)则是投射测验的发端。自40年代后,人格测验逐渐增多,并在技术上得到改进,如明尼苏达多相个性调查表(MMPl)、16种个
22、性因素问卷(16PF)、艾森克个性问卷(EPQ)等。二、现代心理测验在我国的发展我国近代心理测验大约源于1914年前后。二十世纪二三十年代,我国心理学家曾两次修订过比内西蒙量表。但自此之后的几十年间,我国的心理测验工作由于多种原因一直处于停顿状态。1979年后,全国各地的心理学家组织起多个协作组,先后对国外广泛采用的智力和人格测量工具进行修订。近些年来我国的心理学家正在致力于测验本土化,编制适合我国文化背景的智力测验、适应行为量表等,并已取得了初步成果。第二节 测验的常模第一单元 常模团体一、常模团体的性质常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。在制定常模时,
23、首先要确定常模团体,在对常模参考分数作解释时,也必须考虑常模团体的组成。对测验编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。包括:确定一般总体、确定目标总体、确定样本。例如研究大学生的价值观问题,其一般总体就是大学生;而目标总体是计划实施的对象,如计划实施的各大学的大学生;样本的选取则必须根据总体的性质(性别、年龄、专业、家庭背景等),找一个有代表性的样本来代表目标总体,也代表一般总体。满足所有条件后才可称为常模样本,才真正具有代表性。对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。因为标准化测验通常提供许多原始分数与各种常模团体的比较
24、转换表,被试的分数必须与合适的常模比较。例如在进行人员安置时,同一个测验分数就可与各种不同工种的常模进行比较。无论是测验编制者还是测验使用者,主要关心的是常模团体的成员。成就测验和能力倾向测验,适当的常模团体包括目前和潜在的竞争者;比较广泛的能力与性格测验,常模团体通常也包括同样年龄或同样教育水平的被试。在某些情况下,人的许多方面如性别、年龄、年级或教育水平、职业、社会经济地位、种族等都可以作为定义常模团体的标准。二、常模团体的条件(一)群体的构成必须明确界定在制定常模时,必须清楚地说明所要测量的群体的性质与特征。可以用来区分和限定群体的变量是很多的,如性别、年龄、职业、文化程度、民族、地理地
25、域、社会经济地位等。在群体内部也许有许多小团体,它们在一个测验上的作为也时常有差异。假如这种差异较为显著,就必须为每个小团体分别建立常模。例如在机械能力倾向测验上,男性通常比女性做得好些;而相反,在文书能力倾向测验上,女性分数高于男性。因此在这类测验上通常分别提供男性和女性的常模。(二)常模团体必须是所测群体的代表性样本当所要测量的群体很小时,将所有的人逐个测量,其平均分便是该群体的最可靠的常模。但在群体较大时,因为时间和人力物力的限制,只能测量一部分人作为总体的代表,这就提出了取样是否适当的问题。在实际工作中,由于从某些团体中较容易获得常模资料,所以存在着取样偏差的可能性。例如从城市收集样本
26、就比从农村容易。(三)样本的大小要适当一般来说,取样误差与样本大小成反比,所以在其他条件相同的情况下,样本越大越好,但也要考虑具体条件(人力、物力、时间)的限制。在实际工作中,应从经济的或实用的可能性和减少误差这两方面来综合考虑样本的大小。总体数目小,只有几十个人,则需要100的样本。如果总体数目大,相应的样本也大,一般最低不小于30或100个(07年5月三级题)。全国性常模,一般应有2000-3000人为宜。样本大小适当的关键是样本要有代表性(06年11月二级题、08年11月二级题、08年5月二级题)。(四)标准化样组是一定时空的产物在一定的时间和空间中抽取的标准化样组,只能反映当时当地的情
27、况。随着时间的推移,地点的变更,标准化的样组就失去了标准化的意义。这样常模就不适合现时现地的状况,必须定期修订。在选择合适常模时,要注意选择较为新近的常模。三、取样的方法(06年5月二级题)取样即从目标人群中选择有代表性的样本。(08年11月三级题)取样的方法有随机抽样和非随机抽样两种。前者是根据随机原则进行,而后者则没有随机性。随机原则是从总体中取样时,所取个案不是人为地主观决定的,每个个案被抽取的机会均等。(一)简单随机抽样 按照随机表顺序选择被试构成样本,或者将抽样范围内的每个人或者每个抽样单位编号,再随机选择,可以避免由于标记、姓名、性别或其他社会赞许性偏见而造成抽样误差。在简单随机抽
28、样中,每个人或抽样单位都有相同的机会作为常模中的一部分。(二)系统抽样在总体数目为N的情况下,若要选择K分之一的被试作为样本,则可在抽样范围内选择每个第K个人来构成样本。例如K为2,则样本为总体的一半;若K是20,则样本为总体的5。K为组距:K=Nn,若要抽取121名学生中的40人作为样本调查,则K=121403,可分40段。一般系统化样本中,第一个第K个人从哪里数起是随机的,如抽12的人为样本,从第5个人数起,则第二个第K个人就是第7个人,再就是第9个人,第11个人,第13个人系统抽样要求目标总体无序可排,也无等级结构存在(06年11月二级题、09年5月二级题)。如果发现排列有某种内部循环规
29、律存在,就不能如此进行了。如像军队那样,每8人为一班,若抽取18的人为样本,而且从部队花名册的第一人数起,那么被抽的全都是班长,因为班长在每班都排在第一位,这样的样本没有代表性。(三)分组抽样总体数目较大,无法进行编号,而且群体又有多样性,这时可以先将群体进行分组,再在组内进行随机取样。例如,在全国取样,可以先按行政区域划分组,再在组内依照一定的性质进行归类,然后从各类中按随机抽取样本,就是分组抽样。(四)分层抽样在确定常模时,最常用的是分层抽样方法。它是先将目标总体按某种变量(如年龄、文化程度)分成若干层次,再从各层次中随机抽取若干被试,最后把各层的被试组合成常模样本。分层抽样能够避免简单随
30、机抽样中样本集中于某种特性或缺少某种特性的现象。它使各层次差异显著,同层次保持一致,增加了样本的代表性。分层抽样:分层比例抽样和分层非比例抽样。四、常模与常模分数(一)常模常模是一种供比较的标准量数,由标准化样本测试结果计算而来,它是心理测验时用于比较和解释测验结果的参照分数标准。常模有:全国常模、区域常模和特殊常模;根据具体应用标准和分数特征:百分位常模、标准分常模。(二)常模分数常模分数就是施测常模样本后,将被试者的原始分数按一定规则转换出来的导出分数。(08年11月三级题、09年5月二级题)做了EPQ,得到四个分数:E(内外向)=20,P(精神质)=8,N(情绪稳定性)=12,L=7,这
31、些就是原始分数。它是通过将被试者的反应与标准答案相比较而获得的测验分数叫原始分数,是从测验中直接获得的。原始分数本身没有多大意义,比如上面提到的E=20,是什么意思?我们知道E表示艾森克人格问卷(EPQ)中的内、外向分量表,但是20究竟说明什么?它表示内向还是外向?这时我们必须有一个参照标准才行。在心理测验中,这种由原始分数构成的分布转换而来的分数,叫导出分数。导出分数具有(07年5月二级题)一定的参照点和单位,它实际上是一个有意义的测验量表,它与原始分数等值,可以进行比较。从原始分数转换为导出分数时,既要根据原始分数的分布特点,又要按照现代数理统计方法的基本原理,才能转换出有意义、等单位、带
32、参照点的导出分数。第二单元 常模的类型一、发展常模人的许多心理特质如智力、技能等,是随着时间以有规律的方式发展的,所以可将个人的成绩与各种发展水平的人的平均表现相比较。根据平均表现所制成的量表就是发展常模,亦称年龄量表。在此量表中,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。(08年11月二级题)(一)发展顺序量表最直观的发展常模是发展顺序量表,因为它告诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。最早的一个范例是葛塞尔发展程序表,其中按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。葛
33、塞尔强调早期行为的发展是有规律的,如婴儿的感觉运动发展是这样:4周,能控制眼睛运动,去追随一个对象看;16周,能使头保持平衡;28周,能用手抓握东西并玩弄它;40周,能控制躯干、坐立或爬行;52周,能控制腿脚运动、站立和行走。自60年代开始,瑞士心理学家皮亚杰的发展理论引起了人们的重视。皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展,尤其注重某些特殊概念的形成,其中最著名的工作就是对守恒概念的研究。守恒是指这样一种认识:两种等量的物体只要无增无减,无论怎样改变组合,它们在质量、重量、长度、数量及容量等方面仍然是相等的。皮亚杰发现,通常儿童到5岁时才会理解质量守恒;6岁才会掌握重量守恒;7岁
34、时才有容量守恒概念。后来,有人把皮亚杰在研究中所采用的一些作业和问题组织成标准化量表,用来研究儿童在某一发展水平的特性,以提供儿童实际能做什么的信息。(二)智力年龄比内西蒙量表中首先使用智力年龄的概念。(09年11月三级题)例如,某题若被大多数7岁儿童通过,则该题放在7岁水平,8岁儿童大多数能回答的题目则放在8岁水平。如果为每个年龄水平都编制一些适当的题目,便可得到个评价儿童智力发展水平的年龄量表。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫做智力年龄,简称智龄。智龄是年龄量表上度量智力的单位。求智龄的方法很简单,只要将儿童在测验上的分数与各年龄组的一般儿童比较,
35、便可给予一个年龄分数。例如在吴天敏修订的比内西蒙量表中,每个年龄都有6个测题,答对每题则得智龄2个月。假如某儿童6岁组的题目全部通过,7岁组通过4题,8岁组通过3题,9岁组通过2题,其智龄为:6(岁)+42(月)+32(月)+22(月)=6岁+18月=7岁6个月。(08年5月二级题)另外一种计算智力年龄的方法是不把题目分到各年龄组。在这种情况下,首先根据被试在整个测验中正确反应的题数或反应时间而得一原始分数,而将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每个人的智龄。例如某个儿童的原始分数等于8岁组的平均分数,则其智力年龄就是8岁。(三)年级当量年
36、级当量就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。如常模样本中6年级的算术平均分为35,某儿童在算术测验中也得35分,那么就有“该儿童的算术是6年级水平”的表述。年级量表的单位通常为10个月间隔,在一学年中假设两个月的假期在所测量目标上的发展是不重要的,因此以10个月为一个年级。例如,40(或40)表示四年级开始时的平均成绩,45(或45)表示学年中间的平均成绩。二、百分位常模百分位常模包括百分等级和百分点、四分位数和十分位数。(一)百分等级百分等级是应用最广的表示测验分数的方法。一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。例如,85的百分等级表示在
37、常模样本中有85的人比这个分数要低。百分等级的计算关键在于确定在常模团体中分数低于某一分数的人数比例,分两种情况:一种是未分组资料的百分等级计算,公式为:PR=100-(100R-50)/N其中R是原始分数排列顺序数,N是指总人数(样本的总人数)。例如小东在30名同学中语文成绩是80分,排列第五名,则其百分等级为:PR=100-(1005-50)/30=85百分等级为85是指,在100名被试中,语文成绩低于80分的有85人。另一种是分组资料的百分等级求法,虽然计算方法不同,但其百分等级的意义与未分组资料一样。(二)百分点百分点也称百分位数,百分等级是计算低于某测验分数的人数百分比,百分点则是计
38、算处于某一百分比的人对应的测验分数是多少。比如我们要挑选得分高的20的被试,我们就必须求出相当于80百分等级的测验分数。百分点的计算可根据直线内插法进行。例如,高考的最高分为695,其百分等级为100,最低分为103分,百分等级为1,要录取20的学生进入大学,百分等级为80的百分位数(PP)可以用下式计算得出:(100-80)/(695-PP)=(80-1)/(PP-103),得PP=575所以,如果想知道在全国录取20的考生,总分数线就该为575分。不管测验分数是否分组均可以用直线内插法计算出百分点。(三)四分位数和十分位数 四分位数和十分位数只是百分位数的两个变式,其含义相似。四分位数是将
39、量表分成四等份,相当于百分等级的25、50和75对应的三个百分分成的四段。十分位数也可以依此类推出,110为第一段,(08年11月二级题)91100为第十段。三、标准分常模 标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。常见的标准分数有:z分数、Z分数、T分数、标准九分数、离差智商(1Q)等。(09年11月三级题)标准分数可以通过线性转换(09年5月二级题),也可以通过非线性转换得到,由此可将标准分数分为两类:(一)线性转换的标准分数根据定义,可通过下式将原始分数转换成标准分数:z=(X-X)/SD其中X为任一原始分数,X为样本平均
40、数,SD为样本标准差(06年11月三级题)。由于在z分数中经常出现小数点和负数,而且单位过大,计算和使用很不方便,所以通常需要将z分数转换成另一种形式的量表分数。这一转换形式为:Z=A+Bz 这里Z为转换后的标准分数,A、B为根据需要指定的常数。加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小从而去掉小数点(06年5月三级题)。加或乘一个常数并不改变原来分数间的关系。(二)非线性转换的标准分数 当原始分数不是常态分布时,也可以使之常态化,这一转换过程就是非线性的(06年11月二级题)。常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平
41、均数和标准差。(08年11月二级题、08年5月二级题)计算步骤如下:1.对每个原始分数值计算累积百分比;2.在常态曲线面积表中,求出对应于该百分比的z分数。所得的z分数可将分布分成几部分,称之为z分数,以区别由线性转换所求得的z分数。常态化标准分数可以转换成任何方便的形式。当以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数10)来表示时,通常叫做T分数(由麦柯尔最早使用),即:T=50+10z 标准九分是另一较知名的标准分数系统,其量表是个9级的分数量表。它是以5为平均数,以2为标准差的一个分数量表,最早时广泛应用于美国空军和某些教学情境中的分级。标准十分和标准二十分。前者平
42、均数为5,标准差为1.5(06年5月三级题);后者平均数为10,标准差为3。(08年11月三级题)而其中使用最广、影响最大的一种常态化标准分数则是离差智商。四、智商及其意义在最早的比内西蒙智力测验中没有智商的概念,只用“心理年龄”(mental age,简称MA)来表示被试智力的高低。具体地说,比内西蒙量表以题目的难度按年龄分组,3岁儿童中约有50能通过的题目作为3岁组题目,4岁儿童中约有50能通过的题目作为4岁组题目,依次类推。通过测验知道了被试所能全部通过的最终题目组以及部分通过的题目组的题目数,就可以累加算出心理年龄。若心理年龄高于其生理年龄,则智力较一般儿童高,若心理年龄低于其生理年龄
43、,则智力较一般儿童低。单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性。(一)比率智商比内西蒙量表传人美国后,斯坦福大学推孟教授于1916年对其修订而成斯坦福比内量表。它在心理年龄的基础上,以智商表示测验结果,即以后所说的比率智商。比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。IQ=MA/CA 100比率智商提出后,普遍被心理学界和医学界所接受。但由于个体智力增长是个由快到慢再到停止的过程,即心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试;(08年11月二级题)另外,由于不同年龄组儿童的比率智商分布的情况是不一样的,因而相同的比率智商分数在不
44、同年龄就具有不同意义。(二)离差智商离差智商是一种以年龄组为样本计算而得的标准分数,为使其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定为100,标准差定为15(07年5月三级题、08年11月三级题)所以离差智商建立在统计学的基础之上,它表示的是个体智力在年龄组中所处的位置(07年5月二级题),是表示智力高低的一种理想的指标。具体公式如下:IQ=100+15z=100+15(X-X)/SD(06年5月三级题)由于离差智商的提出,过去曾使用比率智商的许多测验在后来也使用了离差智商,如在1960年修订的斯比测验中,就使用的是平均数为100,标准差为16(09年11月三级题)的标准分数量表。
45、必须指出,从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。第三单元 常模分数的表示方法一、转换表法最简单而且最基本的表示常模的方法就是转换表,有时也叫常模表(06年5月三级题)。一个转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数百分位、标准分数、T分数或者其他任何分数。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。简单的转换表就是将单项测验的原始分数转换成一种或几种导出分数。如表52所示。复杂的转换表通常包括几个分测验或几种常模团体的原始分数与导出分数的对应关系。如表53为几个分测验的常
46、模转换表,包括大学生常模中男、女生的常模,而且男、女常模中各是相同的四个分测验,因而也是分测验常模。二、剖面图法剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。现以韦克斯勒儿童智力量表的记录纸上的剖面图来说明。见图51。现简略解释一下:总的来讲该生智商在平均以上,从智力结构上讲该生言语智商相当高,操作智商一般。对于某些特殊的群体,情况很具体而特殊,就需要制定特殊常模。第三节 测验的信度信度是评价一个测验是否合格的重要指标之一,也是标准化心理测验的基本要求之一。用同一个心理测验测量同一个被试,如果今天所测的结果与明天所测的结果相差悬殊
47、,那么测验就不会有人运用它。第一单元 信度的概念一、信度的定义信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。(09年11月三级题)如果一个测验在大致相同的情况下,几次测量的分数也大体相同,便说明此测验的性能稳定;反之,几次测量的分数相差悬殊,便说明此测验的性能不稳,信度低。信度只受随机误差的影响(07年5月三级题)(08年11月三级题)。随机误差越大,信度越低。因此,信度亦可视为测验结果受机遇影响的程度。系统误差产生恒定效应,不影响信度。在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率。即:rxx=ST2/Sx
48、2信度也可以看作在总的方差中非测量误差的方差所占的比例。二、信度的指标(一)信度系数与信度指数信度是以信度系数为指标,它是一种相关系数。常常是同一被试样本所得的两组资料的相关,理论上说就是真分数方差与实得分数的方差的比值,公式是:rxx=rxt2=ST2/Sx2 公式中的rxt是真分数标准差与实得分数的标准差的比值,称信度指数。rxt=ST/Sx可见信度指数的平方就是信度系数。(二)测量标准误公式:公式中SE为测量的标准误,Sx 是所得分数的标准差,rxx为测验的信度系数。测量的标准误与信度之间有互为消长的关系:信度越高,标准误越小;信度越低,标准误越大(06年11月二级题)。第二单元 信度评
49、估的方法对信度的评估方法是没有通用法则的,每一种信度系数只能说明信度的不同方面,因而具有不同的意义。一、重测信度又称稳定性系数。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一被试者前后施测两次测验,求两次得分间的相关系数(06年11月三级题)。由于人的多数心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大变化。如果两次测验结果所得的分数差别较大,说明此测验未能反映较稳定的心理特征,而受了随机变量的影响。用重测法估计信度的优点在于能提供有关测验是否随时间而变异的资料,可作为被试将来行为表现的依据。缺点是易受练习和记忆的影响。如果两次施测时间太短,练习的影响较大
50、;如果相隔的时间太长,则身心的发展与学习经验的积累等足以改变测验分数的意义,而使相关降低。最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。二、复本信度 又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度反映的是测验在内容上的等值性,故又称等值性系数(06年5月二级题)。在应用上,应该有半数的被试先做A本再做B本,另一半被试先做B本再做A本,由此可以抵消施测顺序的效应。复本信度也要考虑两个复本实施的时间间隔。如果两个复本几乎是在同一时间内施测的,