《第十一章 人员素质测评质量分析.ppt》由会员分享,可在线阅读,更多相关《第十一章 人员素质测评质量分析.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第十一章 素质测评的质量分析目录效度效度信度信度项目分析项目分析其他分析方法其他分析方法第一节 效度 测评的效度就是指测评的有效性,即能测测评的效度就是指测评的有效性,即能测评到所要测评目标的程度。效度是评价测评好评到所要测评目标的程度。效度是评价测评好坏、选择测评的重要标准之一。坏、选择测评的重要标准之一。效度的作用比信度的作用更为重要。强调效度的作用比信度的作用更为重要。强调测评目标、工具与测评对象的统一。测评目标、工具与测评对象的统一。一、人员测评的有效性一、人员测评的有效性 效度的理论定义:与测评目标有关的真实效度的理论定义:与测评目标有关的真实分数方差与总分方差的比率。分数方差与总
2、分方差的比率。公式:公式:其中,其中,为测评效度;为测评效度;为有效方差;为有效方差;为总分方差。为总分方差。效度的性质效度的性质 实际上效度指的是实际上效度指的是“测评结果的效测评结果的效度度”,是指测评结果的准确性程度,而,是指测评结果的准确性程度,而并不是指测评本身。也反映了测评结果并不是指测评本身。也反映了测评结果对测评目标的体现程度。对测评目标的体现程度。二、如何评估人员测评的效度二、如何评估人员测评的效度(一)内容效度(一)内容效度 1 1、内内容容效效度度是是指指测测评评内内容容取取样样是是否否反反映测评的目标,适用于测评对象。映测评的目标,适用于测评对象。2 2内容效度的评估方
3、法内容效度的评估方法 测评内容范围明确;测评内容范围明确;测评内容的取样有代表性。测评内容的取样有代表性。采用如下步骤:采用如下步骤:1 1)确定总体范围;)确定总体范围;2 2)编制双向细目表;)编制双向细目表;3 3)制定评定量表。)制定评定量表。还可采用经验的方法、统计分析方法。还可采用经验的方法、统计分析方法。3 3内容效度的应用内容效度的应用 内容效度最适合于评估教育和职业成就测评。内容效度最适合于评估教育和职业成就测评。也适合于某些用于人员选拔和分类的测评。也适合于某些用于人员选拔和分类的测评。(二)效标关联效度(二)效标关联效度 效效标标关关联联效效度度,也也称称效效标标效效度度
4、,它它反反映映的的是是测测评评分分数数与与外外在在标标准准(效效标标)的的相相关关程程度度,即即测测评评分分数数对对个个体体的的效效标标行行为为表表现现进进行行预预测测的的有效性程度。有效性程度。效标是考察测评效用的外在参照标准。效效标是考察测评效用的外在参照标准。效标关联效度往往用于预测性测评。标关联效度往往用于预测性测评。1 1预测效度和同时效度预测效度和同时效度 预测效度的效标资料往往是测评结束后隔预测效度的效标资料往往是测评结束后隔一段时间才获得,它反映被试行为表现的预测一段时间才获得,它反映被试行为表现的预测程度。程度。同时效度的效标材料可以和测评分数差不同时效度的效标材料可以和测评
5、分数差不多同时搜集。多同时搜集。同时效度多用于诊断现在的状态,预测效同时效度多用于诊断现在的状态,预测效度多预测未来的结果。度多预测未来的结果。如:如:1 1)“某人成功了吗?某人成功了吗?”2 2)“某人会成功吗?某人会成功吗?”2 2效标和效标测评效标和效标测评 效标是衡量测评有效性的参照标准。效标是衡量测评有效性的参照标准。把效标转化为某种可以操作的测评指标,把效标转化为某种可以操作的测评指标,称为效标测评。称为效标测评。效效标标可可以以细细分分为为观观念念效效标标(即即效效标标的的实实质质概概念念内内容容)和和效效标标测测评评(即即效效标标的的具具体体度度量量方方法法)。例例如如,对对
6、于于筛筛选选销销售售人人员员的的观观念念效效标标是是“销销售售工工作作的的成成功功”,而而效效标标测测评评是是“年年销销售量售量”。3 3常用的效标常用的效标 (1 1)学术成就)学术成就 (2 2)特殊训练成绩)特殊训练成绩 (3 3)实际工作表现)实际工作表现(4 4)团体对照)团体对照(5 5)等级评定)等级评定 (6 6)先前有效的测评)先前有效的测评(三)构想效度(三)构想效度 构想效度是指测评能够测评到理论上的构构想效度是指测评能够测评到理论上的构想或特质的程度。所谓构想通常指一些抽象的、想或特质的程度。所谓构想通常指一些抽象的、假设性的概念或特质,如智力、创造力、言语假设性的概念
7、或特质,如智力、创造力、言语流畅性、焦虑等。流畅性、焦虑等。1 1确定构想效度的步骤确定构想效度的步骤 建建立立理理论论框框架架,以以解解释释被被试试在在测测评评上上的的表表现;现;依依据据理理论论框框架架,推推演演出出各各种种有有关关测测评评成成绩绩的假设;的假设;以逻辑和实证的方法来验证假设,根据累以逻辑和实证的方法来验证假设,根据累积材料决定这种理论是否能恰当地解释现有材积材料决定这种理论是否能恰当地解释现有材料;如果不能做出恰当解释,则应该修正上述料;如果不能做出恰当解释,则应该修正上述假设,直到能做出恰当的解释为止。假设,直到能做出恰当的解释为止。如:创造力测评构想效度。以测评分数与
8、如:创造力测评构想效度。以测评分数与根据创造力的心理学理论观察被试行为所做出根据创造力的心理学理论观察被试行为所做出的判断做相关分析。的判断做相关分析。2 2常见的确定构想效度的指标常见的确定构想效度的指标(1 1)发展变化)发展变化(2 2)与其他测评的相关)与其他测评的相关(3 3)因素分析)因素分析 因素分析是分析行为资料内部关系、结构因素分析是分析行为资料内部关系、结构特性的一种统计技术。特性的一种统计技术。(4 4)内部一致性)内部一致性 如果测评的所有题目被验证为具有很高的如果测评的所有题目被验证为具有很高的内部一致性,说明它们都是关于同一内容的,内部一致性,说明它们都是关于同一内
9、容的,属于同一种构想。属于同一种构想。用来考察内部一致性的方法主要有三种:用来考察内部一致性的方法主要有三种:1 1)考察总分数较高和较低两类人在各)考察总分数较高和较低两类人在各 题目上通过率的大小题目上通过率的大小 ,如果通过率低,应,如果通过率低,应淘汰或修改。淘汰或修改。2 2)计算题目与总分的相关,如未达显著水)计算题目与总分的相关,如未达显著水准,应予淘汰。准,应予淘汰。3 3)求分测评与总分的相关。各分测评与总)求分测评与总分的相关。各分测评与总分有显著相关,如果不是,则应予删除。分有显著相关,如果不是,则应予删除。(5 5)会聚效度和区分效度)会聚效度和区分效度 会聚效度:测评
10、与测评相同特质或构想等会聚效度:测评与测评相同特质或构想等理论上有关的变量高相关;理论上有关的变量高相关;区分效度:测评与测评不同特质或构想等区分效度:测评与测评不同特质或构想等理论上无关的变量低相关。理论上无关的变量低相关。如,一个数学推理能力测评与数学课成绩如,一个数学推理能力测评与数学课成绩的相关就是会聚效度;而该测评与阅读理解能的相关就是会聚效度;而该测评与阅读理解能力测评的相关显著低,就是区分效度。力测评的相关显著低,就是区分效度。三、影响效度的因素三、影响效度的因素测评本身带来的影响因素测评本身带来的影响因素 1 1测评题目的质量测评题目的质量 2 2实施测评时的于扰因素实施测评时
11、的于扰因素 3 3被试的影响因素被试的影响因素 4 4测评的长度测评的长度 样本团体的性质样本团体的性质 效标的性质效标的性质 如果其他条件相同,所测评的行为或心理如果其他条件相同,所测评的行为或心理特质与效标行为或特质越相似,效度系数就越特质与效标行为或特质越相似,效度系数就越高。高。第二节 信度 一、信度的定义一、信度的定义 信度主要是指测评结果的可靠性或一致性。信度主要是指测评结果的可靠性或一致性。由测评工具否精确引起的误差叫系统误差。由测评工具否精确引起的误差叫系统误差。由操作是否到位引起的误差叫随机误差。由操作是否到位引起的误差叫随机误差。信度考虑两方面的问题。信度考虑两方面的问题。
12、一是稳定性:不同时间、不同测评条件下所得一是稳定性:不同时间、不同测评条件下所得分数之间的一致性有多大;一个人的所得分数与分数之间的一致性有多大;一个人的所得分数与“真实分数真实分数”之间接近程度有多大;是否可以达之间接近程度有多大;是否可以达到实际应用的程度等。到实际应用的程度等。二是影响稳定性的原因:什么因素造成了这种二是影响稳定性的原因:什么因素造成了这种差异;这些影响的相对作用有多大。差异;这些影响的相对作用有多大。二、二、信度的作用信度的作用 信度高低的指标通常以相关系数表示,称信度高低的指标通常以相关系数表示,称为信度系数。信度系数一般是同一样本所得的为信度系数。信度系数一般是同一
13、样本所得的两组资料的相关,在理论上表示为实得分数与两组资料的相关,在理论上表示为实得分数与真实分数相关的平方。信度系数公式:真实分数相关的平方。信度系数公式:它是它是其中其中:真实分数标准差与实得分数标准差的比率。真实分数标准差与实得分数标准差的比率。其其中中,r rxrxr 有有时时也也称称为为信信度度指指数数,它它是是真真实实分分数标准差与实得分数标准差的比率。数标准差与实得分数标准差的比率。还可通过分析个人分数再测时的变化(误差)来考察信度。两次测评分数的差异越大,信度就越低。在人员测评中,对信度系数进行确定通常有以下两方面的作用:方差:即每个被测评者得分与其算术平均数差的平方和与总个数
14、之商。公式:标准差公式:1 1解释真实分数与实得分数的相关性解释真实分数与实得分数的相关性 总的方差(即标准差的平方的缩略语)中总的方差(即标准差的平方的缩略语)中有多少比例是由真实分数的方差决定的。有多少比例是由真实分数的方差决定的。2 2说明可以接受的信度水准说明可以接受的信度水准 一般的能力与成就测评的信度系数在一般的能力与成就测评的信度系数在0 09090以上;人格、兴趣等测评的信度系数通常在以上;人格、兴趣等测评的信度系数通常在0 080800.850.85之间。之间。r rxxxx0 07070时,不能用测时,不能用测评对个人作评价,也不能在团体间作比较;评对个人作评价,也不能在团
15、体间作比较;当当r rxxxx0 07070时,可用于团体间比较;时,可用于团体间比较;r rxxxx0 08585时,可用于鉴别个人情况。时,可用于鉴别个人情况。三、三、如何评估人员测评的信度如何评估人员测评的信度 1.1.重测信度又称为稳定性系数重测信度又称为稳定性系数 用同一测评,在不同时间对同一群体施测用同一测评,在不同时间对同一群体施测 N N为两次测评结果数据配对总数;为两次测评结果数据配对总数;x x被分析的测被分析的测评结果;评结果;y y为重复测评得到的结果。为重复测评得到的结果。在进行重测在进行重测信度的评估时,还应注意以下两个重要问信度的评估时,还应注意以下两个重要问题:
16、题:1 1)重测信度一般只反映由随机因素导致的)重测信度一般只反映由随机因素导致的变化,而不反映被试行为的长久变化。变化,而不反映被试行为的长久变化。2 2)不同行为受随机误差的影响不同。)不同行为受随机误差的影响不同。两次,这两次测评分数的相关系数即为重测系两次,这两次测评分数的相关系数即为重测系数。一个测评的重测信度越高,说明测评的结数。一个测评的重测信度越高,说明测评的结果越一致、越可靠。积差相关公式:果越一致、越可靠。积差相关公式:2.2.复本信度又称等值性系数。复本信度又称等值性系数。它是以两个测评复本(功能等值但题目内它是以两个测评复本(功能等值但题目内容不同)来测评同一群体,然后
17、求得应试者在容不同)来测评同一群体,然后求得应试者在这两个测评上得分的相关系数(积差相关)。这两个测评上得分的相关系数(积差相关)。复本信度的高低反映了这两个测评复本在内容复本信度的高低反映了这两个测评复本在内容上的等值性程度。两个等值的测评互为复本。上的等值性程度。两个等值的测评互为复本。3 3内部一致性信度内部一致性信度 内部一致性信度主要反映的是测评内部题内部一致性信度主要反映的是测评内部题目之间的关系,考察测评的各个题目是否测评目之间的关系,考察测评的各个题目是否测评了相同的内容或特质。了相同的内容或特质。1 1)分半信度)分半信度 分半信度系数是通过将测评分成两半,计分半信度系数是通
18、过将测评分成两半,计算这两半测评之间的相关性而获得的信度系数。算这两半测评之间的相关性而获得的信度系数。分半法经常会低估信度,必须进行修正。斯分半法经常会低估信度,必须进行修正。斯皮尔曼一布朗公式可以估计增长或缩短一个测皮尔曼一布朗公式可以估计增长或缩短一个测评对其信度系数的影响,用这个公式进行修正评对其信度系数的影响,用这个公式进行修正的前提条件为:两半测评的方差相等。的前提条件为:两半测评的方差相等。分半法中的斯皮尔曼一布朗修正公式为:分半法中的斯皮尔曼一布朗修正公式为:其其中中,r rhhhh为为两两半半测测评评的的相相关关系系数数,r rxxxx为为估估计或修正后的信度。计或修正后的信
19、度。当两半测评的方差不同时,应采用卢伦当两半测评的方差不同时,应采用卢伦公式或弗拉纳根公式进行修正。公式或弗拉纳根公式进行修正。卢伦公式只要求将被试在两半测评的分数卢伦公式只要求将被试在两半测评的分数之差的方差(之差的方差(S Sd d2 2)和测评总分的方差)和测评总分的方差(S(Sx x2 2)代入代入如下公式即可直接计算分半信度:如下公式即可直接计算分半信度:其中其中S Sd d2 2为两测评分数之差的方差;为两测评分数之差的方差;S Sx x2 2为测为测评总分的方差。评总分的方差。也可以采用弗拉纳根公式直接计算分半信也可以采用弗拉纳根公式直接计算分半信度:度:S Sa a2 2与与S
20、 Sb b2 2为两个分测评分数的方差;为两个分测评分数的方差;S Sx x2 2为总分方差。为总分方差。2 2)同质性信度)同质性信度 同质性是指所有测评题目测评的只是单一同质性是指所有测评题目测评的只是单一特质或内容,表现为所有测评题目得分的一致特质或内容,表现为所有测评题目得分的一致性。乐观情绪特质和外向特质、预测和决策、性。乐观情绪特质和外向特质、预测和决策、监督与控制等都是不太容易区分的。监督与控制等都是不太容易区分的。如果需要在一个测评中测评不同的内容,如果需要在一个测评中测评不同的内容,就应该将测评设计为几个分测评,每个分测评就应该将测评设计为几个分测评,每个分测评测评一种内容。
21、例如,测评一种内容。例如,16PF16PF人格测评就是包含人格测评就是包含1616个分量表的测评,每个分量表只对一种人格个分量表的测评,每个分量表只对一种人格特质进行测评。特质进行测评。常用的同质性信度计算方法是库德常用的同质性信度计算方法是库德理查理查逊估计方法。计算公式有库德逊估计方法。计算公式有库德理查逊理查逊2020号公号公式(简称(式(简称(KR20KR20)和)和2121号公式(号公式(KR21KR21)。)。下面是KR20公式:其中其中n n为测评题目数,为测评题目数,为通过为通过 题的人数比例;题的人数比例;q qi i为未通过该题的人数比例;为未通过该题的人数比例;=1;=1
22、;为所有题目答对与答错人数百分比乘积的总和。为所有题目答对与答错人数百分比乘积的总和。四、四、评分者信度评分者信度 在有些测评中,评分者的评判也是误差的在有些测评中,评分者的评判也是误差的来源之一。来源之一。评分者信度是指不同评分者对同样对象进评分者信度是指不同评分者对同样对象进行评定时的一致性。最简单的估计方法就是随行评定时的一致性。最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法。相关系数的计算可以用积差相关方法。如如果果
23、评评分分者者在在三三人人以以上上,而而且且又又采采用用等等级级记记分分时时,就就需需要要用用肯肯德德尔尔和和谐谐系系数数来来求求评评分分者者信度。其公式为:信度。其公式为:其中,K为评分者人数,N为被评定的人数或答卷数;Ri为评分者给某人(或某一答卷)评分之和。为每一个对象被评等级。评分者答卷编号一二三四五六甲431256乙532146丙412356丁641235Ri1911681723例如,有4名评分者,对6份答卷进行评分,所评等级如下:五、影响信度的因素五、影响信度的因素1 1样本团体的性质样本团体的性质1)1)样本团体的分数分布样本团体的分数分布 分数分布越广,信度系数就相对越高,分数分
24、数分布越广,信度系数就相对越高,分数分布越窄,信度系数就会越低。分布越窄,信度系数就会越低。2)2)样本团体的异质性样本团体的异质性 一般来说,取样团体的异质性越大,信度一般来说,取样团体的异质性越大,信度系数就相对越高。系数就相对越高。但但是是在在测测评评中中,往往往往会会因因为为团团体体过过于于同同质质或或过过于于异异质质而而出出现现信信度度被被低低估估或或高高估估的的情情况况。这这种种情情况况下下,可可以以采采用用下下面面的的公公式式对对求求出出的的信信度进行修正:度进行修正:其中其中,为估计的信度;为取样的信度;为估计的信度;为取样的信度;S SX X为为取样团体的标准差;取样团体的标
25、准差;为估计团体(取样的为估计团体(取样的总体)的标准差。总体)的标准差。3)3)不同团体间能力水平的差异不同团体间能力水平的差异2.2.测评的长度测评的长度 信度还会受测评长度(即题目的多信度还会受测评长度(即题目的多少)的影响。一般来说,测评越长,信少)的影响。一般来说,测评越长,信度值越高。度值越高。3.3.测评的难度测评的难度 测评的难度也会对信度产生影响。测评的难度也会对信度产生影响。如果一个测评的难度太低,出现天花板如果一个测评的难度太低,出现天花板效应;如果难度太大,出现地板效应,效应;如果难度太大,出现地板效应,第三节 项目分析l项目适合度项目适合度 在素质测评中,项目不仅仅是
26、试题,更多的在素质测评中,项目不仅仅是试题,更多的是一些咨询问题或观察评定点(指标),它们是一些咨询问题或观察评定点(指标),它们无难易之分,适合度指的是被测者行为符合项无难易之分,适合度指的是被测者行为符合项目测评标准的程度。目测评标准的程度。当项目为试题时,适合度即难度;当项目为试题时,适合度即难度;当项目是问卷中的问题时,适合度即所有选对当项目是问卷中的问题时,适合度即所有选对的被测者人数与总人数之比;的被测者人数与总人数之比;当项目为观察评定量表中的指标时,适合度即当项目为观察评定量表中的指标时,适合度即所有被测得分平均值与指标满分值之比。所有被测得分平均值与指标满分值之比。项目区分度
27、项目区分度 又称鉴别力,指项目得分对被试实际能力又称鉴别力,指项目得分对被试实际能力或心理特质水平的区分能力或鉴别力,也或心理特质水平的区分能力或鉴别力,也即项目得分的高低与被试实际能力或心理即项目得分的高低与被试实际能力或心理特质水平高低的一致性程度。项目区分度特质水平高低的一致性程度。项目区分度的计算方法主要有相关分析法(包括积差的计算方法主要有相关分析法(包括积差相关法、二列相关法和点二列相关法)、相关法、二列相关法和点二列相关法)、极端组法(鉴别度指数、临界比)和因素极端组法(鉴别度指数、临界比)和因素分析法分析法项目独立性项目独立性 在能力测评中,常常需要项目之间有一定在能力测评中,
28、常常需要项目之间有一定的独立性。所谓独立性即非相关性或低相的独立性。所谓独立性即非相关性或低相关性。独立性的分析一般采用项目间分数关性。独立性的分析一般采用项目间分数的相关系数揭示,根据实际得分分布是否的相关系数揭示,根据实际得分分布是否均匀,可以分别采用均匀,可以分别采用rr系数法和列联表系数法和列联表检验法。检验法。第四节 其他指标的分析客观性客观性 测评的客观性由测评方法的客观性与测测评的客观性由测评方法的客观性与测评者的客观性两方面构成评者的客观性两方面构成总体分布与水平总体分布与水平 总体分布指测评结果在各水平层次上的总体分布指测评结果在各水平层次上的分布情况,总体水平一般指对测评结
29、果分布情况,总体水平一般指对测评结果集中量的分析。集中量的分析。区分性与差异性区分性与差异性 测评工具的区分性是指把不同水平的被测测评工具的区分性是指把不同水平的被测者区分开来的程度,测评区分性一般通过者区分开来的程度,测评区分性一般通过测评结果差异性的分析来揭示。测评结果差异性的分析来揭示。误差误差 误差是指通过测评结果的定性定量分析,误差是指通过测评结果的定性定量分析,判断测评结果是否受到心理效应的严重影判断测评结果是否受到心理效应的严重影响。分析的主要内容是心理误差、标准误响。分析的主要内容是心理误差、标准误差以及单个测评结果的致信区间。差以及单个测评结果的致信区间。误差误差 心理误差心
30、理误差哈罗效应误差哈罗效应误差哈罗效应又称晕轮效应,是指测评者往往会因为哈罗效应又称晕轮效应,是指测评者往往会因为对被测评者整体印象的好坏从而影响他对每个素对被测评者整体印象的好坏从而影响他对每个素质的测评。例如因看到一个人相貌端庄、严肃,质的测评。例如因看到一个人相貌端庄、严肃,就容易产生此人责任感很强的看法。由哈罗效应就容易产生此人责任感很强的看法。由哈罗效应引起的误差叫哈罗效应误差。引起的误差叫哈罗效应误差。哈罗效应还表现为因对某个重要因素的印象好坏哈罗效应还表现为因对某个重要因素的印象好坏而对整体评价产生影响,所谓一好百好,一丑白而对整体评价产生影响,所谓一好百好,一丑白丑。虽然这是一
31、种泛化影响,而前者是一种演绎丑。虽然这是一种泛化影响,而前者是一种演绎影响。影响。趋中心理误差趋中心理误差趋中心理误差是指因为测评者既不愿趋中心理误差是指因为测评者既不愿把被测评的过好,也不愿把被测评的过把被测评的过好,也不愿把被测评的过差而过于集中在中间段而产生的误差。差而过于集中在中间段而产生的误差。这种误差使有差异的被测得到相同或相这种误差使有差异的被测得到相同或相近的分数,缺乏区分性。可以通过测量近的分数,缺乏区分性。可以通过测量结果的分布及差异量分析来揭示这种误结果的分布及差异量分析来揭示这种误差的情况。差的情况。宽大心理误差宽大心理误差宽大心理误差指因测评者不坚持测评的标准要宽大心
32、理误差指因测评者不坚持测评的标准要求就高不就低的测评而产生的误差。这种误差表求就高不就低的测评而产生的误差。这种误差表现为皆大欢喜,高分低能。另一种负向宽大心理现为皆大欢喜,高分低能。另一种负向宽大心理误差,则是过于严格,以一些脱离实际的高标准误差,则是过于严格,以一些脱离实际的高标准去测评人的素质,测评结果普遍较低。去测评人的素质,测评结果普遍较低。逻辑误差逻辑误差逻辑误差指测评者不是实事求是的对每逻辑误差指测评者不是实事求是的对每个素质独立地测评,而是依据其是否相关个素质独立地测评,而是依据其是否相关的特点而进行逻辑上的推断。的特点而进行逻辑上的推断。对比效应误差对比效应误差对比效应误差指
33、测评者在测评过程中因被测与对比效应误差指测评者在测评过程中因被测与标准间存在某种明显的反差而产生的误差。这标准间存在某种明显的反差而产生的误差。这种误差又叫托衬效应误差。种误差又叫托衬效应误差。例如鹤立鸡群,绿叶丛中一点红。例如鹤立鸡群,绿叶丛中一点红。接近效应误差接近效应误差接近效应误差是指测评者往往会把在时间、内接近效应误差是指测评者往往会把在时间、内容、形状等特征相似或相近的两个对象,给以容、形状等特征相似或相近的两个对象,给以同样的评价,而不论他们实际上是否有差别。同样的评价,而不论他们实际上是否有差别。例如某个素质低的人夹杂在两个素质好的人之例如某个素质低的人夹杂在两个素质好的人之间
34、,其测评分数就容易偏高,相反,一个素质间,其测评分数就容易偏高,相反,一个素质高的人夹杂在两个素质好的人之间,他的分高的人夹杂在两个素质好的人之间,他的分数就有可能偏低。数就有可能偏低。概念与思考题概念与思考题:重测信度、复本信度、内部一致性、信度、重测信度、复本信度、内部一致性、信度、分半信度、同质性信度、评分者信度、内容效分半信度、同质性信度、评分者信度、内容效度、效标关联效度、构想效度、效标效度、相度、效标关联效度、构想效度、效标效度、相容效度、预测效度、同时效度、会聚效度、观容效度、预测效度、同时效度、会聚效度、观念效度、区分效度、效标测评念效度、区分效度、效标测评 1 1什么是测评的
35、系统误差和随机误差?什么是测评的系统误差和随机误差?2 2重测信度和复本信度考察的内容有区别吗?重测信度和复本信度考察的内容有区别吗?3 3什么是内部一致性信度?它的意义是什么?什么是内部一致性信度?它的意义是什么?4 4用分半法求信度为什么通常要进行修正?用分半法求信度为什么通常要进行修正?5 5怎样检查评分者评定的可靠性?怎样检查评分者评定的可靠性?6.6.信度和效度是什么关系?信度和效度是什么关系?7 7内容效度能用量化方法测评或表示吗?内容效度能用量化方法测评或表示吗?8 8内内容容效效度度适适用用于于能能力力倾倾向向测测评评和和人人格格测测评吗?为什么?评吗?为什么?9 9主观评价能否用来做效标?为什么?主观评价能否用来做效标?为什么?1010什什么么是是构构想想效效度度?对对人人员员测测评评的的启启示示是什么?是什么?