《心理测量学知识点总结3.docx》由会员分享,可在线阅读,更多相关《心理测量学知识点总结3.docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精品名师归纳总结心理测量学学问点总结1. 测量:是依据肯定的法就用数字对事物加以确定。它包括事物、法就和数字(具有区分性、序列性或等级性、可加性、规律性的特点)。2. 测量的要素有参照点和单位。3. 参照点:是要确定事物的量,必需有的运算的起点。参照点分为确定参照点(代表“无”) 和相对参照点(不代表“无” )4. 好的单位必需具备两个条件: ( 1)有确定的意义。 ( 2)有相同的价值。心理测量的单位不够完善,既无统一的单位,也不符合等距的要求。5. 测量的本质是依据某一法就将事物数量化。即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。6. 命名量表。只是用数字来
2、代表事物或把事物归类,数字只用来做标记和分类,不能做数量化分析,即不能说A B C,也不能做加、减、乘、除的运算。7. 次序量表。其中的数字不仅指明类别,同时指明类别的大小或含有某种属性的程度,这里的数字包含数量关系,即可以说A B C。主要用于分等或排出次序。心理测量一般是在次序量表上进行的。8. 等距量表。不但有大小关系,仍有相等的单位,但没有确定零点,即可以说A B C, 也可以做加、减运算,但不能做乘、除运算。9. 等比量表。即有相等单位又有确定零点,即可以说A B C,也能做加、减、乘、除的运算。1. 心理测验:是依据心理学理论,使用肯定的操作程序,通过观看人的少数有代表性的行 为,
3、对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。2. 心理测验的性质:间接性。相对性。客观性(包括测验的刺激是客观的、反应的量化是客观的和对结果的推论是客观的)。3. 按测验的功能分为:智力测验、特别才能测验和人格测验。4. 按测验材料的性质分为:文字测验和操作测验。5. 按测验材料的严谨程度分为:客观测验和投射测验。6. 按测验的方式分为:个别测验和团体测验。7. 按测验的要求分为:最高作为测验和典型行为测验。8. 错误的测验观:测验万能论。测验无用论。心理测验即智力测验。9. 正确的测验观:心理测验是重要的心理学讨论方法之一,是决策的帮助工具。心理测验作为讨论方法
4、和测量工具尚不完善。10. 我国目前心理门诊中较多的运用:智力测验、人格测验以及心理评定量表。1. 第一提倡科学心理测验的学者是英国生物学家和心理学家高尔顿,他的奉献主要有:提出人的不同气质特点和智能是按身体特点不同遗传的。设计了测量差异的方法,可以视为心理测验的开端。为心理测量学奠定了统计学基础。第一个提出了相关的概念,并由他的同学皮尔逊加以进展,创立了积差相关法。2. 卡特尔对促进心理测验进展得奉献有:1890 年,发表了心理测验与测量一文,这是心理测验第一次显现于心理学文献中。主见测验手续和考试方法应有统一规定,并要有常模以便比较。可编辑资料 - - - 欢迎下载精品名师归纳总结3. 比
5、内西蒙在1905 年发表了世界上第一个正式的心理测验。4. 20 世纪以后心理测验主要的进展方面:操作测验的进展。团体智力测验的进展。才能倾向测验的进展。人格测验的进展。5. 近年来我国的心理学家致力于测验的本土化,编制适合我们文化背景的智力测验、适应行为量表等,并已取得了初步成果。6. 常模团体是由具有某种共同特点的人所组成的一个群体,或者是该群体的一个样本。7. 常模总体的挑选包括:确定一般总体。确定目标总体。确定样本。8. 常模团体的条件:群体的构成必需明确界定。常模团体必需是所测群体的代表性样本。标准化样本是肯定时空的产物。样本大小要适当( 1)在实际工作中, 应从经济、 有用和削减误
6、差等方面来考试样本的大小。在其他条件相同的情形下,样本越大越好。样本大小适当的关键是样本要有代表性。( 2)总体数目小,只有几十个人,需要100%样本。总体数目大,相应的样本也大,一般最低不少于30 或 100 个。全国常模一般有20003000 人。1. 取样:从目标人群中挑选有代表性的样本。方法有:简洁立即抽样。系统抽样。分组抽样。分层抽样。2. 系统抽样要求目标总体无序可排,可无等级结构存在。其关键是运算组距( K )3. 分组抽样用于总体数目较大,无法进行编号,而且群体又有多样性。4. 分层抽样时确定常模时最常用的方法。5. 常模分数就是施测常模样本被试后,将被试者的原始分数按肯定规章
7、转换出来就是导出 分数,所以常模分数又叫导出分数。导出分数的特点是:与原始分等值。具有意义。等单位。具有参照点。6. 常模分数所构成的分布,就是通常所说的常模,它是说明心理测量分数的基础。7. 进展常模:也叫年龄量表,是依据平均表现所制成的量表。在这个量表中,个人分数指出他的行为在按正常途径进展方面处于什么样的进展水平。最直观的进展常模是进展次序量表。8. 进展次序量表最早的一个范例是葛塞尔进展程序表,其中按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致进展水平。婴儿的感觉运动进展是:4 周:能掌握眼睛运动,去追随一个对象看。16 周:能使头保持平稳。28 周:能用手抓握东西并玩弄
8、它。40 周:能掌握躯干、坐立或爬行52 周:能掌握腿脚运动、站立和行走。1. 皮亚杰的讨论着重于从婴儿到十多岁儿童认知过程的进展,特别留意某些特别概念的形成,其中最闻名的工作就是对守恒的概念的讨论。2. 守恒是指两种等量的物体只要无增无减,无论怎样转变组合,它们在质量、重量、长度、数量及容量等方面仍旧是相等的一种认知。3. 皮亚杰发觉,儿童不同时期显现不同守恒概念,通常儿童到5 岁时才会懂得质量守恒。6 岁才会把握重量守恒。7 岁才能有容量守恒的概念。可编辑资料 - - - 欢迎下载精品名师归纳总结4. 一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫做智力年龄,简
9、称智龄。比内西蒙量表中第一使用智力年龄的概念。5. 智龄的算法:先算出基础年龄,即全部题目都通过的那组题目所代表的年龄。然后再全部个更高年龄水平上通过的题目,用月份运算, 加在年龄上, 儿童的智龄是基础年龄与较高年龄水平的题目上获得的附加月份之和。例如某个儿童 6 岁的题目全部通过, 7 岁组通过 4 题, 8 岁通过 3 题, 9 岁组通过 2 题,其智龄为: 6(岁) +4 2(月)+3 2(月) +2 2(月) =6 岁+18 月=7 岁 6 个月。6. 年级当量实际就是年龄量表,例如常模中6 年级的算术平均分为35,某儿童在算术测验中也得 35 分,那么就有“该儿童的算术水平是6 年级
10、水平”的表述。7. 百分等级是指在常模样本中低于这个分数的人数百分比。可编辑资料 - - - 欢迎下载精品名师归纳总结8. 未分组资料的百分等级运算公式:100100 R50 N,其中 R 是原始分数排列次序数,N可编辑资料 - - - 欢迎下载精品名师归纳总结是指总人数(样本总人数) 。例如小东在30 名同学中语文成果是80 分,排列第五名,就可编辑资料 - - - 欢迎下载精品名师归纳总结其百分等级为:1001005508530可编辑资料 - - - 欢迎下载精品名师归纳总结9. 在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。10. 高考的最高分时 695,其中百分等级为
11、100,最低分为 103,百分等级是 1,要求录用 20%的同学进入高校,百分等级为80 的百分位数( PP)可以用以下公式运算:可编辑资料 - - - 欢迎下载精品名师归纳总结10088801695PPPP103,得 PP=575.40 575 分可编辑资料 - - - 欢迎下载精品名师归纳总结将 103 到 695 分成 100 份,其中第 80 分对应的分数。1. 四分位数是将量表分成四等份,相当于百分等级25%、50% 和 75%对应的三个百分点分成的四段。非常位数也可以此类推。2. 标准分数常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。由于他的基本单位是标准差,所以叫标
12、准分数。常见的标准分数有“z 分数、 Z 分数、 T 分数、标准九分数、离差智商( IQ )等。标准分数可以通过线性转换和非线性装换得到。可编辑资料 - - - 欢迎下载精品名师归纳总结3. zXX 其中 X 为任一原始分数, X 为样本平均数, SD 为样本标准差。由此可见,SD可编辑资料 - - - 欢迎下载精品名师归纳总结z 分数可以用来表示某一分数与平均数之差是标准差的基本。4. ZABz 式中 Z 为转换后的标准分数, A 、B 为依据需要制定的常数。加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小从而去掉小数点。5. 当原始分数不是常态分布时,也可以使之常态化,这一转换过程
13、就是非线性的。6. 常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差。平均数标准差T 分数5010标准九分52标准非常5.51.5标准二非常103离差智商10015 或 16可编辑资料 - - - 欢迎下载精品名师归纳总结1. 单纯专心理年龄来表示智力高低分方法缺乏不同年龄儿童间的可比性,因此,目前一般都用比率智商和离差智商来表示智力的高低。2. 比率智商( IQ)被定义为心理年龄(MA )与实足年龄( CA )之比。为防止小说,将商可编辑资料 - - - 欢迎下载精品名师归纳总结数乘以 100:公式是: IQMA100 CA可
14、编辑资料 - - - 欢迎下载精品名师归纳总结3. 由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄进展不同步增长,所以比率智商并不适合于年龄大的被试。4. 离差智商的优点有:离差智商是建立在统计学基础之上的。表示的是个体智力在年龄组所处的位置。表示智力高低的一种抱负的指标可编辑资料 - - - 欢迎下载精品名师归纳总结5. 运算离差智商的公式是:IQ10015 z可编辑资料 - - - 欢迎下载精品名师归纳总结6. 不同的测验获得的离差智商只有当标准差同时或接近时才可以比较。7. 转换表,也叫常模表。是一种最简洁、最基本的且常用的出现常模资料的方式。它构成的要素为原始分数、
15、导出分数和对常模团体的有关详细描述。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数做出有意义的说明。8. 剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观的看出被试在各个分测验上的表现及其相对的位置。9. 对某些特别的群体来说,情形很详细而特别,我们就需要制定特别常模。标准分数与百分等级、 T 分数等的关系标准分数2 2百分等级216508498T 分数3040506070标准二十47101316离差智商70851001151301. 信度是指同一被试者在不同时间内同一测验(或用另一套相等的测验)重复测量,所得结果的一样程度。信度只受立即误差的影响
16、。2. 在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)2T的比率: r xxS 2S X23. 公式 rrST 和公式 rST 说明信度指数的平方就是信度系数。2SxxXT2XTSX X可编辑资料 - - - 欢迎下载精品名师归纳总结4. SESx1r xx 公式中 SE 为测量的标准误, SX 所得分数的标准差, rxx 为测验的信度可编辑资料 - - - 欢迎下载精品名师归纳总结系数。从公式中可以看出,测量的标准误与信度之间的关系是:信度越低,标准误越大。 信度越高,标准误越小。5. 信度的评估方法有:重测信度、复本信度、内部一样性信度和评分者信度。6. 重
17、测信度:又称稳固性系数,它的运算方法是采纳重测法,即使用同一测验,在同样条件下同一组被试者前后施测两次测验,求两次得分间的相关系数。7. 用重测法估量信度,最相宜的时距随测验的目的、性质和被试者的特点而异,一般是24周较宜,间隔时间最好不要超过6 个月。可编辑资料 - - - 欢迎下载精品名师归纳总结8. 复本信度:又称等值性系数,它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求的被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。9. 复本信度的优点是:能够防止重测信度的一些问题,如记忆成效、学习效应等。10. 复本信度的局限性:复本信度只能削减练习的影响,而不
18、能排除。由于其次个测验只转变题目的内容,已经把握的解题原就, 很简洁就迁移到同类问题。建立复本对很多测验来说非常困难。11. 假如复本信度考虑到两个复本实施的时间间隔,并且两个复本的施测相隔一段时间,就称重测复本信度,或稳固与等值系数。1. 内部一样性信度主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。主要包括分半信度和同质性信度。2rhh1rhh2. 分方法通常是测验实施后将测验按奇、偶分为等值的两半,并分别运算每位被试在两半测验上的得分,求出这两半的相关系数。这个相关系数就代表了两半测验内容取样的一样程度。可编辑资料 - - - 欢迎下载精品名师归纳总结3. 分半法常常会
19、低估信度,必需修正。一般用斯皮尔曼布朗公式:r xx可编辑资料 - - - 欢迎下载精品名师归纳总结其中 rhh 为一半分数的相关系数, rxx 为测验在原长度的信度估量值。4. 同质性信度主要代表测验内部全部题目的一样性。5. 运算同质性信度的公式有:库德理查逊公式。在测验是二级评分(是非题、 01 计分)的情形下,常用 K R20公式,在难度相同或相近的情形下,仍可以用 K R21 公式。和伦巴赫 系数。适合多重计分的测题。6. 为了衡量评分者之间信度高低,可随机抽取如干份测验卷,由两位评分者按评分标准分分别给分,然后再依据每份测验卷的两个分数运算相关,既得评分者信度。一般要求在成对受过训
20、练的评分者之间平均一样性达到 0.90 以上,才认为评分时客观的。7. 不同的信度反映测验误差的不同来源。1. 信度系数可以说明为总的方差中有多少比例是由真实分数的方差打算的,也就是测验的总变异种真分数造成的变异占百分之几。2. 一般才能测验和成就测验的信度系数都在0.90 以上,有的可以达0.95 。而人格测验、爱好、态度、价值观等测验的信度一般在0.800.85 或更高些。3. 要确定信度可接受水平的一般原就是:当 rxx 0.70 时,测验不能用于对个人作出评判或推测,而且不能做团体比较。当 0.70 rxx 0.85 时,可用于团体比较。当 rxx 0.85 时,才能用来界别和推测个人
21、成果或作为。4. 新编的测验信度应高于原有的同类测验或相像测验。5. 信度系数在说明个人分数的意义时的作用:是估量真实分数的范畴。明白实得分数再测时可能的变化情形。6. 某个被试的 IQ 为 100,该智力测验的标准差为15,信度系数为 0.84,就其 IQ 的测量标准误和可能范畴分别为:可编辑资料 - - - 欢迎下载精品名师归纳总结SESx1r xx可编辑资料 - - - 欢迎下载精品名师归纳总结SE15 10.846.0IQ=100 1.96 6=100 11.76 88112我们说这个被试的真实IQ 有 95%的可能落在 88 到 112 之间。7. 如两个测验差异显著,那么两个测验的
22、差异分数要比差异标准误(SEd)乘以 1.96 大。可编辑资料 - - - 欢迎下载精品名师归纳总结SEdS2r xxr yy可编辑资料 - - - 欢迎下载精品名师归纳总结其中, SEd 为差异的标准误,S 代表两个测验使用的标准差,这两个标准差必需相同。8. 影响信度的因素:样本特点。( 1)异质性(一般而言,如获得信度的取样团体较为异质的话,往往会高估测验的信度,相反就会低估测验的信度) 。( 2)平均才能水平(不同那水平的团体,题目具有不同的难度,每个题目在难度上微小差异累计起来便会影响信度)测验长度。( 1)测验越长,测验的测题取样或内容取样就越有代表性。( 2)测验越长,被试的推测
23、因素影响就越小。增加测验长度的成效应遵循酬劳递减率原就,测验过长是得不尝试的, 有时反而会引起被试的疲惫和反感而降低牢靠性。测验难度。( 1)理论上,只有平均难度为50%时,才能使测验分数分布范畴最大,求得的信度也最高。事实上,难度为0.50 只适合于简答型题目。( 2)各类型挑选题的抱负平均难度为:五选一测题,0.70。四选一测题, 0.74。三选一测题, 0.77。是非题, 0.85。时间间隔。( 1)时间间隔只对重测信度和重测复本信度有影响。( 2)以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大。间隔时间越久,其他变因介入的可能性越大,受外界影响也越大,信度系数便会低。可编
24、辑资料 - - - 欢迎下载精品名师归纳总结9. 增加题目的数量与测验的信度之间的关系公式:Kr kk 1 r xx 1r xxr kk,其中 K 为转变后可编辑资料 - - - 欢迎下载精品名师归纳总结的长度与原先长度的比,rxx 为原测验的信度, rkk 为测验长度是原先K 倍时的信度估量。1. 效度是指所测量的与所要测量的心理特点的符合程度,或者简洁的说是指一个心理测验的精确度。2. 在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方V22可编辑资料 - - - 欢迎下载精品名师归纳总结差)与总方差的比率,即:r xyS SX可编辑资料 - - - 欢迎下载精品
25、名师归纳总结3. 效度的性质:效度具有相对性,在评鉴测验的效度时,必需考虑其目的与功能。效度具有连续性。可编辑资料 - - - 欢迎下载精品名师归纳总结4. 信度和效度的关系:信度高是效度高的必要条件,也就是说可信的测验未必有效,有效的测验必定可信。 即信度高, 效度未必高。 效度高, 信度肯定高。一个测验的效度总是受它的信度制约的。5. 美国心理学会在 1974 年发行的 训练与心理测量之标准中一书将效度分为: 内容效度、构想效度和校标效度。6. 内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。1. 内容效度的评估方法有:专家判定法、统计
26、分析法和体会估量法。2. 专家判定法:请有关专业对测验题目与原定内容的符合性作出判定,看测验的题目是否代表规定内容。假如专家认为测验题目恰当的代表了所测内容,就测验具有内容效度。由于这种估量效度的方法, 是一个规律分析的过程, 所以内容效度有时又称 “规律效度” 。3. 为了使内容效度的确定过程更为客观,补偿不同专家对同一测验判定的可能不一样,可采纳的步骤是:定义好测验内容的总体范畴。编制双向细目表。制定评定量表来测量测验的整体效度。4. 统计分析法包括:运算两个评分者一样性。复本相关。再测法。5. 最高行为测验要求有较高的表面效度。典型行为测验却要求较低的表面效度。6. 构想效度:又叫构思效
27、度或结构效度。主要涉及的是心理学的理论概念问题,是指测验 能够测量到理论上的构想或特质的程度,即测验的结构是否证明或说明某一理论的假设、术语或构想,说明的程度如何。7. 构想效度的评估方法有:对测验本身的分析。测验间的相互比较。较标效度的讨论证明。试验法和观看法证明。8. 对测验本身的分析主要有:测验的内容效度可以作为构思效度的证据。测验的内部不一样性可以推断测验是测量单一特质仍是测量多种特质,从而为评估测验构思效度供应证据。分析被试者对题目的反应特点也可以作为构思效度的证据。9. 测验间的相互比较:相容效度:是构思效度的一个证据,是指需判定内容效度的测验与某个和该测验测量同一种心理特质,且已
28、有测验效度的成熟测验的相关系数。区分效度: 是构思效度的一个证据, 是指需要判定内容效度的测验与某个和该测验测量不同心理特质, 且已有测验效度的成熟测验的相关系数。相关系数越高, 区分效度越低。 如区分效度较低, 就证明新测验的效度的确有问题。但如区分效度较高,却不能说明新测验效度较高。因素分析法。1. 较标效度:又称实证效度,反应的是测验推测个体在某种情形下行为表现的有效性程度。被推测的行为是检验标准的标准,简称较标。2. 在检验一个测验的较标效度时,难点在于确定合适的效标。因此较标的挑选至关重要, 一个好的校标必需具备:效标必需能最有效的反映测验的目标,即效标测量本身必需有效。效标必需具有
29、较高的信度,稳固牢靠,不随时间等因素而变化。效标可以客观的加以测量,可用数据或等级来表示。效标测量的方法简洁,省时省力,经济适用。可编辑资料 - - - 欢迎下载精品名师归纳总结3. 效标效度的评估方法有:相关法。区分法。命中率法。4. 相关法:是求测验分数与效标资料间的相关,这一相关系数成为效度系数。常用的方法有:积差相关法。点二列相关公式。二列相关公式。贾思朋多系列相关公式。5. 区分法:是检验测验分数能否有效的区分由效标所定义的团体的一种方法。6. 命中率法:是当测验用来做取舍的依据时,用其正确打算的比例作为效度指标的一种方法。命中的情形是指:推测胜利而且实际也胜利。推测失败而且实际也失
30、败7. 效度的功能有:推测误差。推测效度分数。推测效度指数。8. 效度系数的实际意义常常以打算性系数来表示,就是相关系数的平方,它表示测验正确推测或说明的效标的方差的总方差比例。例如测验的效度是0.8,就测验的总方差中有64% 的方差是测验分数的方差,即测验分数正确推测的比例64%,其余 36%无法做出正确的推测。可编辑资料 - - - 欢迎下载精品名师归纳总结1. 估量的标准误运算公式为:SestSy12r xy ,其中,2sxy 代表效度系数的平方,即决可编辑资料 - - - 欢迎下载精品名师归纳总结定系数, Sy 为效标成果的标准差。可编辑资料 - - - 欢迎下载精品名师归纳总结2.
31、最常用的 Y 对 X 的回来方程: Ya byx X ,其中Y 是推测的效标分数。 a 是纵轴可编辑资料 - - - 欢迎下载精品名师归纳总结的截距,用来订正平均数的差异。byx 是斜率,亦即Y 向 X 回来的系数。 X 为测验分数。3. E 值大小说明使用测验比盲目推测能削减多少误差。例如一个测验的效度系数为0.80,那2么 K1 0.800.60 , E=100( 1 0.60 ) =40,这说明推测误差仅为随机推测所产生误差的 60%。换句话说,由于该测验的使用,使得我们在估量被试的效标分数时削减了 40%的误差。4. 影响效度的因素:测验本身的因素。测验实施中的干扰因素。样本团体的性质
32、。效标的性质。5. 要保证测验具有较高的效度,测验本身要做到:测验材料必需对整个内容具有代表性。测题设计时应尽量防止简洁引起误差的题型(如是非题)。测题难度要适中,具有较高的区分度。测验长度要恰当,既要有肯定的测题量。测题的排列按先易后难排序。6. 测验实施中的干扰因素主试的影响因素: (1)主试本身是否严格的依据测验对主试的要求进行测验的( 2)对于效标效度,测验与效标实施时间间隔越长,测验与效标越简洁受到很多机遇因素的影响,因那次所求的相关必定很低。(3)测验情形(场的的布置、材料预备等等)也会影响测验的效度。被试的影响因素:被试的爱好、动机、心情、态度和身心状况、健康状态以及是否充分合作
33、与尽力而为等都会影响测验结果的效度。反应定式也会降低测验的效度。7. 样本团体的性质包括:样本团体的异质性,假如其他条件相同,样本团体越同质,测验效度就会越低。样本团体越异质,测验效度越高。可编辑资料 - - - 欢迎下载精品名师归纳总结干涉变量: 是使得测验对于不同的团体具有不同的推测才能的特点,这些特点包括年龄、性别、训练水平、智力、动机、爱好、职业和任何有关的性质。美国心理学家吉赛利提出了如何找出干涉变量的一套方法,他们是:( 1)获得差异分数 D,假如 D 的确定值很大,说明测验中可能存在干涉变量。( 2)找出对比组,分别运算效度,找出干涉变量。( 3)对于推测团体, 依据某些易见的干
34、涉因素分为推测性高和推测性低的两个亚团体。推测性高的团体,获得的测验效度会有所提高。8. 效标性质的影响主要表达在:效标本身的牢靠性即效标测量的信度。效标与测验分数之间的关系是否是线性的,皮尔逊积差相关系数的前提就是两个变量的关系式现行的。1. 测验的项目分析包括定性和定量两个方面的。定性分析包括考虑内容效度,题目编写的恰当性和有效性等。定量分析主要是指对题目难度和区分度等进行分析。2. 难度:是指项目的难易程度。它一般用通过率来表示,即答对或通过该题的人数百分比可编辑资料 - - - 欢迎下载精品名师归纳总结来表示: PR100% ,其中 P 代表项目的难度,N 为全体被试者人数, R 为答
35、对或通N可编辑资料 - - - 欢迎下载精品名师归纳总结过该项目的人数。3. 通过人数越多( P 值越大),难度越低。 P 值越小,难度越高。4. 二分法积分的项目运算通过率,如人数较少可以直接采纳上边的公式运算。如人数较多时。就可依据测验总成果将被试分成三组:分数最高的 27%被试为高分组, 分数最低 27%为低分组,中间46%的被试为中间组。分别运算高分组和低分组的通过率,以两组通过可编辑资料 - - - 欢迎下载精品名师归纳总结率的平均值作为每一题的难度。其公式为:分别代表高分组和低分组通过率。PPH2PL ,其中 P 代表难度, PH 和 PL可编辑资料 - - - 欢迎下载精品名师归
36、纳总结5. 由于挑选题可以推测,所以通过率可能因机遇作用变大。为了平稳机遇对难度的影响,可编辑资料 - - - 欢迎下载精品名师归纳总结KP1P吉尔福特提出了一个校正公式:C,其中 C为校正后的通过率, P 为实际得可编辑资料 - - - 欢迎下载精品名师归纳总结PK1到的通过率, K 为备选答案的数目。X可编辑资料 - - - 欢迎下载精品名师归纳总结6. 非二分变量的项目运算通过率,一般用:上的平均分, Xmax 为该题的满分。PX max100%, 其中 X 为全体被试在该题可编辑资料 - - - 欢迎下载精品名师归纳总结7. P 值越接近于 0 或接近 1,越无法区分被试间才能的差异。
37、相反P 值越接近 0.50,区分力越高。8. 在实际挑选题目时,最好使试题的平均难度接近0.50,而各题难度在 0.50 0.20 之间。9. 对于是非题而言,其难度值应当为0.75 最为合适。而对于四选一的题目,其难度值约为0.63 时最为合适。10. 分数的分布时正偏态分布时,题目较难。为负偏态分布时,题目较易。1. 项目区分度,也叫鉴别力,是指测验项目队被试的心理特点的区分才能。2. 区分度的运算方法主要是:鉴别指数。相关法。可编辑资料 - - - 欢迎下载精品名师归纳总结3. 鉴别指数法的主要步骤是:按测验总分高低排列答卷。确定高分组与低分组,每一组取答卷总数的27%。分别运算高分组与
38、低分组在该项目上的通过率或得分率。按以下公式运算鉴别指数:D=P H PL,其中, D 为鉴别指数, PH 为高分组在该项目上的通过率或得分率, PL 为低分组在该项目上的通过率或得分率。4. 如 D 0,D 越大,说明该项目区分两种不同水平的程度越高。如 D 0,就反映高水平组在该项目上的得分率反而低于低水平组,说明项目有问题。5. 相关法:以某一项目分数与效标成果或测验总分的相关作为该项目区分度的指标。相关越高,说明项目越具有区分的功能。6. 相关法主要包括:点二列相关:适用于一类变量为二分称名变量,另一类变量为连续变量。二列相关:适用于两个连续变量,但其中一个变量被人为分成两类。 相关法
39、:适用于两个变量均为二分称名变量时。7. 难度与区分度的关系,一般来说,较难的项目对高水平的被试者区分度高。较易的项目队低水平的被试者区分度高,中等难度的项目对中等水平的被试者区分度高。8. 项目难度的分布一般以常态分布为好,这样不仅能保证多数项目具有较高的区分度,而且可以保证整个测验对被试者具有较高的区分才能。1. 在编制测验前第一要明确测量的对象,也就是该测验编成后要用于那些团体。只有对受测者的年龄、受训练程度、社会经济水平、阅读水公平心中有数,编制测验时才能有的放矢。2. 测验用途不同,编制测验时的取材范畴以及试题难度等也不尽相同,在测验前就应明确所编出的测验是要对被试者做描述、诊断、选
40、拔仍是推测。3. 测验的用途,一般分为:显示和推测,由此测验可以分成:显示性测验和推测性测验。4. 显示性测验:是测验题目和所要测量的心理特点相像的测验。古德纳夫曾经在显示测验内部,又区分为样本测验和标记测验。5. 推测性测验:是推测一些没有被测量的行为的测验。6. 显示性测验和推测性测验区分不是确定的,有时是统一的。7. 心理测验的目标:是编制测验是测什么的,即用来测量什么样的心理变量或行为特点。8. 目标分析以测验不同而异,一般可分为:工作分析。对特定概念下定义。确定测验的详细内容。9. 对于选拔和推测功用的推测性测验,它的主要任务就是要对所推测的行为活动作详细分析,我们称之为任务分析或工
41、作分析。这种分析的步骤是:确定哪些心理特点和行为可以使要推测的活动达到胜利。建立衡量被试是否胜利的标准,这个标准我们称之为效标。1. 题目的来源有:已出版的标准测验。理论和专家的体会。临床观看和记录。2. 心理测验命题的一般原就:内容方面:内容符合测验目的。防止贪多而乱出题目。内容取样要有代表性。题目间内容相互独立,互不牵连。文字方面:使用精确的当代语言。语句简明扼要。排除与答案无关的因素。最好是一句话说明一个概念。尽量少使用双重否定句。懂得方面:题目应有准确的答案,除制造力测验和人格测验外不应具有引起争议的可可编辑资料 - - - 欢迎下载精品名师归纳总结能。题目的内容不要超出受测团体的学问
42、水平和懂得才能。题目的格式要不被人误会。社会敏锐性方面菲利普列举的策略: ( 1)命题时假定被试具有某种行为,使他不得不在的确没有该行为时才否定,可防止否定答案过多的倾向。(2)命题时假定规范不一样。( 3)指出该行为是常见的,虽然是违规的。3. 编制挑选题时,既要编好题干,也要编好选项,必需留意:题干所提的问题必需明确,尽量使用简洁而且明晰的词语。选项切记沉长,要简明扼要每题只给一个正确答案,其他属诱答。各选项长度应相等,尽量不要有长有短。防止题干用词与选项用词一样,否就成了挑选答案的线索。选项最好用同一形式。4. 编制是非题时应留意:内容应以有意义的概念、事实或基本原就为基础。每到题只能包
43、含一个概念如是表达看法的题目,最好说明看法的来源和依据。尽量防止否定表达,特别是要防止用双重否定的表达。“是”、“非”题的数目应有适应比例,基本相等,且要随机排列。5. 编制简答题有三个原就:宜用问句形式假如是填充形式,空格不宜太多,所空出的应当是关键词句。每题应只有一个正确答案,而且答案要简短而详细。6. 编制操作题的四个原就:明确所要测验的目标,并将其操作化。尽量挑选真实性程度较高的项目。指导语要简明扼要,主要让被试明白要他们做什么和在什么条件下做。制定评分标准,确定计分方法。1. 在挑选题目形式时,需要考虑由以下几点:测验的目的和材料的性质接受测验的团体的特点各种实际因素2. 审定题目时要留意:题目的范畴应与测验方案所列的内容技能双向细目表相一样。题目的数量要比最终所需的数目至少多一倍至几倍,以备挑选和编制复份。题目的难度必需符合测验目的的需要。题目的说明必需清晰明白。3. 测题编排的一般原就是:测题的难度排列宜逐步上升。尽可能将同类型的测