《心理学研究方法测量.pptx》由会员分享,可在线阅读,更多相关《心理学研究方法测量.pptx(78页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节测量及其层次测量测量是一个为确定某个特定分析单位的特定属性值的过程。是一个为确定某个特定分析单位的特定属性值的过程。心理心理测量是依据一定的心理学原理和技术,对人的心理现象或测量是依据一定的心理学原理和技术,对人的心理现象或行为进行测量,并根据测量结果进行推断和数量化分析的一种行为进行测量,并根据测量结果进行推断和数量化分析的一种手段。手段。心理测量的特性心理测量的特性:间接性、相对性、客观性。:间接性、相对性、客观性。第1页/共78页四种测量层次数据的测量层次数据的测量层次定名测量定名测量定名测量定名测量定序测量定序测量定序测量定序测量定距测量定距测量定距测量定距测量比率测量比率测量比
2、率测量比率测量第2页/共78页定名测量1.1.测量层次最低测量层次最低2.2.对事物进行平行的分类对事物进行平行的分类3.3.各类别可以指定数字代码表示各类别可以指定数字代码表示4.4.使用时必须符合类别穷尽和互斥的要求使用时必须符合类别穷尽和互斥的要求5.5.数据表现为数据表现为“类别类别”6.6.具有具有=或或 的数学特性的数学特性例如:例如:性别、学校类型、专业等性别、学校类型、专业等第3页/共78页定序变量1.1.对事物分类的同时给出各类别的顺序对事物分类的同时给出各类别的顺序2.2.比定类尺度精确比定类尺度精确3.3.未测量出类别之间的准确差值未测量出类别之间的准确差值4.4.数据表
3、现为数据表现为“类别类别”,但有序,但有序5.5.具有具有 或或 或吗?可以 或 吗?第6页/共78页比率测量1.对事物的准确测度对事物的准确测度2.2.与定距尺度处于同一层次与定距尺度处于同一层次3.3.数据表现为数据表现为“数值数值”4.4.有绝对零点有绝对零点 (如成绩、身高、速度等)(如成绩、身高、速度等)5.5.具有具有 或或 的数学特性的数学特性第7页/共78页定距测量举例:IQ定比测量举例:收入 95115110105100¥0¥10,000¥20,000¥50,000¥40,000¥30,000图6 6-1-1 测量层次第8页/共78页四种测量层次的比较四种测量的比较四种测量的
4、比较定名尺度定名尺度 定序尺度定序尺度 定距尺度定距尺度 定比尺度定比尺度 分类(,分类(,)排序(排序()间距(间距(+,-)比值(比值(,)测量层次数学特性“”表示该尺度所具有的特性第9页/共78页第10页/共78页定名数据的整理(可计算的指标)1.频 数:落在各类别中的数据个数2.比 例:某一类别数据占全部数据的比值3.百分比:将对比的基数作为100而计算的比值4.比 率:不同类别数值的比值第11页/共78页定名数据整理频数分布表(实例)【例1】为为研研究究学学生生对对专专业业选选择择的的情情况况,一一所所高高校校在在某某中中学学随随机机抽抽取取200200名名学学生生就就专专业业问问题
5、题做做了了邮邮寄寄问问卷卷调调查查,其其中中的的一一个个问问题题是是“您您比比较较倾倾向向于于选选择择哪哪一个专业?一个专业?”1 1工工科科;2 2文文科科;3 3理理科科;4 4农农科科;5 5地科;地科;6 6其他。其他。表表1 某中学学生关注专业类型的频数分布某中学学生关注专业类型的频数分布 专业类型专业类型人数人数(人人)比例比例百分比百分比(%)工科工科 文科文科 理科理科 农科农科 地科地科 其他其他112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100第12页/共78页定名数据的图示条形图
6、 (Bar charts)1.条条形形图图是是用用宽宽度度相相同同的的条条形形的的高高度度或或长长短短来表示数据变动的图形来表示数据变动的图形2.条形图有单式、复式等形式条形图有单式、复式等形式3.在在表表示示定定类类数数据据的的分分布布时时,是是用用条条形形图图的的高度来表示各类别数据的频数或频率高度来表示各类别数据的频数或频率第13页/共78页定名数据的图示条形图(由 SPSS 绘制的条形图)第14页/共78页定名数据的图示饼图 (Pie charts)1.1.是用圆形及圆内扇形的面积来表示数值大小的图形是用圆形及圆内扇形的面积来表示数值大小的图形2.2.主主要要用用于于表表示示总总体体中
7、中各各组组成成部部分分所所占占的的比比例例,对对于于研研究究结构性问题十分有用结构性问题十分有用3.3.在在绘绘制制饼饼图图时时,总总体体中中各各部部分分所所占占的的百百分分比比用用圆圆内内的的各各个个扇扇形形面面积积表表示示,这这些些扇扇形形的的中中心心角角度度,是是按按各各部部分分百百分比占分比占3603600 0的相应比例确定的的相应比例确定的4.4.例例如如,选选择择文文科科专专业业的的人人数数占占总总人人数数的的百百分分比比为为25.5%25.5%,那那么么其其扇扇形形的的中中心心角角度度就就应应为为3603600 025.5%25.5%91.891.80 0,其其余类推余类推第15
8、页/共78页定类数据的图示饼图(由 SPSS 绘制的饼图)第16页/共78页定序数据的整理(可计算的指标)1.累计频数:将各类别的频数逐级累加2.累计频率:将各类别的频率(百分比)逐级累加第17页/共78页定序数据频数分布表(实例)【例例2 2】在在一一项项大大学学生生住住宿宿条条件件问问题题的的研研究究中中,研研究究人人员员在在甲甲乙乙两两所所大大学学各各抽抽样样调调查查300300名名学学生生,其其中中的的一一个个问问题题是是:“您您对对目目前前的的住住宿宿状状况况是是否否满满意意?1 1非非常常不不满满意意;2 2不不满满意意;3 3一一般般;4 4满满意;意;5 5非常满意。非常满意。
9、表表2 甲大学学生对住宿状况评价的频数分布甲大学学生对住宿状况评价的频数分布回答类别回答类别甲大学甲大学人数人数(人人)百分比百分比(%)向上累积向上累积 向下累积向下累积 人数人数(人人)百分比百分比(%)人数人数(人人)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2424108108939345453030836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.0第18页/共78页定序数据频数分布表(实例)表表3 乙大学学生对住宿状况评价的频
10、数分布乙大学学生对住宿状况评价的频数分布回答类别回答类别乙大学乙大学人数人数(人人)百分比百分比(%)向上累积向上累积 向下累积向下累积 人数人数(人人)百分比百分比(%)人数人数(人人)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计合计300100.0第19页/共78页定序数据的图示饼图(由SPSS 绘制)第20页/共78页定序数据的图示条形簇状图第2
11、1页/共78页实验研究的信度和效度如何评价一个实验?如何评价一个实验?第一,实验是否明确、有效、可操作;第一,实验是否明确、有效、可操作;第二,实验是否可重复、验证。第二,实验是否可重复、验证。效度:效度:实验结果的准确性和有效性程度;实验结果的准确性和有效性程度;信度:信度:实验结果的可靠性和前后一致性程度。实验结果的可靠性和前后一致性程度。第22页/共78页第二节测量的效度一、何谓效度效度效度(validity)(validity):是指测验的有效性,即测量得到的记分是否反映了欲测的特:是指测验的有效性,即测量得到的记分是否反映了欲测的特征及其程度。征及其程度。实验目的是验证假设,验证自变
12、量和因变量之实验目的是验证假设,验证自变量和因变量之间的关系,使实验结果的推论可用以解释和预间的关系,使实验结果的推论可用以解释和预测其他同类现象。测其他同类现象。实验效度主要包括内部效度和外部效度。实验效度主要包括内部效度和外部效度。第23页/共78页二、测量效度内容效度内容效度准则效度准则效度结构效度结构效度三、研究效度内部效度内部效度外部效度外部效度第24页/共78页第三节测量的信度一、何谓信度实施任何一项测验时,测验使用者都希望相同实施任何一项测验时,测验使用者都希望相同个体在相似的情境下再次测试的结果能够一致。个体在相似的情境下再次测试的结果能够一致。信度是指实验结论的可靠性和前后一
13、致性程度。信度是指实验结论的可靠性和前后一致性程度。是估计误差的最重要的量化指标之一。是估计误差的最重要的量化指标之一。如:一个人站在测量体重的磅秤上,前后几次如:一个人站在测量体重的磅秤上,前后几次称出几个明显不同的重量,那么磅秤本身必定称出几个明显不同的重量,那么磅秤本身必定有问题,说明这架磅秤是不可靠的。有问题,说明这架磅秤是不可靠的。测量测量的信度有问题!的信度有问题!第25页/共78页二、两种信度的评定方方法1、并行法(复本信度)根据一组被试在两个平行(根据一组被试在两个平行(等值等值)测验上测验上的得分计算的相关系数,为复本信度。因为的得分计算的相关系数,为复本信度。因为它反映两个
14、测验之间的等值程度,因此又叫它反映两个测验之间的等值程度,因此又叫等值性系数,其计算方法与重测信度相同。等值性系数,其计算方法与重测信度相同。第26页/共78页 在估计复本信度时,可以连续试测,也可以间隔适当时间分两次施测。要注意:在估计复本信度时,可以连续试测,也可以间隔适当时间分两次施测。要注意:1 1、两个测验要等值,如内容、形式、数量、难易、时限、指导、两个测验要等值,如内容、形式、数量、难易、时限、指导语等方面相同或相似。语等方面相同或相似。2 2、两次试测间隔时间适当。、两次试测间隔时间适当。第27页/共78页2、重测信度 用同一个测验,对同一组被试前后两次试测,两次测验分数所得的
15、相关系数为重测信度。因为它能反映用同一个测验,对同一组被试前后两次试测,两次测验分数所得的相关系数为重测信度。因为它能反映两次测验结果有无变动,即测验分数的稳定程度,故也成稳定性系数。两次测验结果有无变动,即测验分数的稳定程度,故也成稳定性系数。第28页/共78页重测信度只能在一定条件下进行计算l所测量的心理特征必须是稳定的。所测量的心理特征必须是稳定的。l遗忘和练习的效果基本上相互抵消。遗忘和练习的效果基本上相互抵消。l在两次施测的间隔时期内,被试在所要测量的心在两次施测的间隔时期内,被试在所要测量的心理特质方面没有更多的学习和训练。理特质方面没有更多的学习和训练。第29页/共78页重测法应
16、该注意:l间隔时间适当间隔时间适当l适用人格测验、速度测验适用人格测验、速度测验l注意提高积极性注意提高积极性第30页/共78页3、分半信度 按照正常的程序实施测验,然后将全部项按照正常的程序实施测验,然后将全部项目分成相等的两半,根据个人在两半测验的分目分成相等的两半,根据个人在两半测验的分数计算其相关系数。数计算其相关系数。如何分半?通常采用奇偶分半法。第31页/共78页4、同质性信度 同质性,也称内部一致性,指的是测验内同质性,也称内部一致性,指的是测验内部所有题项间的一致性。分半法实际上就是对部所有题项间的一致性。分半法实际上就是对测验内部一致性的一个粗略的估计。测验内部一致性的一个粗
17、略的估计。常用的同质性信度是克伦巴赫系数,也常用的同质性信度是克伦巴赫系数,也叫叫a a系数。系数。第32页/共78页 5.1.35.1.3信度检验 本研究采用内部一致性信度本研究采用内部一致性信度(Cronbach(CronbachAlphaAlpha系数系数)为检验问卷信度的指标,考察问卷内部所有为检验问卷信度的指标,考察问卷内部所有项目间的一致性程度,分别计算分量表与总量表项目间的一致性程度,分别计算分量表与总量表的的a a系数。从表系数。从表5.25.2可以看出,可以看出,ECR-RECR-R依恋量表各维依恋量表各维度的度的a a系数均很高。系数均很高。表表5.2 5.2 各分量表与总
18、量表的各分量表与总量表的a a系数系数 回避回避 焦虑焦虑 总问卷总问卷 a a系数系数 0.842 0.85 0.8860.842 0.85 0.886第33页/共78页5 5、评分者信度 考察评分者信度的方法是随机抽取部分试卷,考察评分者信度的方法是随机抽取部分试卷,由两个以上评分者独立按照评分标准打分,然由两个以上评分者独立按照评分标准打分,然后求其间的相关。后求其间的相关。第34页/共78页影响信度的因素被试的样本(被试样本)样本团体的异质性越大,分数分布的范围样本团体的异质性越大,分数分布的范围越广,信度系数系数就越高。越广,信度系数系数就越高。测验在不同团体中使用时,需要重新估测验
19、在不同团体中使用时,需要重新估计其信度。比如使用计其信度。比如使用SCL-90SCL-90第35页/共78页测验的长度(行为样本)一般说,测验越长,信度值越高。一般说,测验越长,信度值越高。l原因:原因:1 1)测验加长,改进测验代表性,从而更好接近真实水平。)测验加长,改进测验代表性,从而更好接近真实水平。2 2)测验项目越多,在每个项目上的随机误差就可以相互)测验项目越多,在每个项目上的随机误差就可以相互抵消。抵消。理论上如此,但是,实际操作必须考虑时间的代价和心理论上如此,但是,实际操作必须考虑时间的代价和心理疲劳的因素。理疲劳的因素。第36页/共78页测验的难度和区分度 测验难度与信度
20、没有直接对应的关系,测验难度与信度没有直接对应的关系,但是,当测验太难或者太易,则测验分数的但是,当测验太难或者太易,则测验分数的分布范围就会缩小,从而降低信度。显然,分布范围就会缩小,从而降低信度。显然,只有测验难度可以使测验分数的分布范围最只有测验难度可以使测验分数的分布范围最大时,测验的信度才会最高。大时,测验的信度才会最高。人格测验的区分度也是如此。人格测验的区分度也是如此。第37页/共78页三、信度和效度的关系测量误差 随机误差和系统误差随机误差 与测量的目的无关的偶然因素引起的变化与测量的目的无关的偶然因素引起的变化无规律的误差,使得多次测量结果不一致,这无规律的误差,使得多次测量
21、结果不一致,这种误差的大小和方向是随机。只要样本足够大,种误差的大小和方向是随机。只要样本足够大,往往能相互抵消,总和接近于零。往往能相互抵消,总和接近于零。比如,比如,“在人际交往中,我的自我感觉好在人际交往中,我的自我感觉好极了。极了。”这样的题项测量就很大程度上受到近这样的题项测量就很大程度上受到近来人际交往状况这个随机因素的影响。来人际交往状况这个随机因素的影响。第38页/共78页 系统误差 是由测量目的无关的因素引起的恒定的有规律的误差,它是由测量目的无关的因素引起的恒定的有规律的误差,它稳定地存在于每一次测量中,是定型式的,因素间不能相互抵稳定地存在于每一次测量中,是定型式的,因素
22、间不能相互抵消掉。消掉。比如比如“在人际交往中,我的自我感觉好极了。在人际交往中,我的自我感觉好极了。”由于受到由于受到社会期许性的影响,而发生偏离,自我评价的分数总是比实际社会期许性的影响,而发生偏离,自我评价的分数总是比实际的分数要略高一些。的分数要略高一些。第39页/共78页 随机误差 系统误差 第40页/共78页 真分数模型:真分数真分数(T或ST 2 2)本本质质涵涵义义:反反映映个个体体真真实实水水平平的的分分数数,也也就是观测分数剔除误差后获得的分数。就是观测分数剔除误差后获得的分数。操作定义:无数次测验结果的平均值。操作定义:无数次测验结果的平均值。案例:比如测量视力、身高案例
23、:比如测量视力、身高 跳远、学习成绩测验跳远、学习成绩测验第41页/共78页信度的真分数模型个体而言:个体而言:X XT TE E X X是观测分数,是观测分数,T T是真分数,是真分数,E E是测量误差是测量误差。团体而言:团体而言:S SX X2 2S ST T2 2 +S+SE E 2 2即观测分数变异数(即观测分数变异数(S SX X2 2)等于真分数变异数()等于真分数变异数(S ST T 2 2)加上误差分数变异数()加上误差分数变异数(S SE E 2 2)。)。这里误差分数变异数只是涉及到随机误差的变异这里误差分数变异数只是涉及到随机误差的变异第42页/共78页效度的真分数模型
24、真分数是无数次测量结果的平均值。那么系统误真分数是无数次测量结果的平均值。那么系统误差也包含在真分数中。差也包含在真分数中。用公式表示:用公式表示:S ST T 2 2 S SV V 2 2 S SI I 2 2 ,即真分数变异数(即真分数变异数(S ST T 2 2)可以分成与测量目的有关的(即有效的)可以分成与测量目的有关的(即有效的)变异(变异(S SV V 2 2)和与测量目的无关的(无效)变异)和与测量目的无关的(无效)变异(S SI I 2 2)。)。所以:所以:S SX X2 2 S SV V 2 2 S SI I 2 2 +S+SE E 2 2 ,即观测分数的变异(即观测分数的
25、变异(S SX X2 2)是由与测验目的有关的变异()是由与测验目的有关的变异(S SV V 2 2)、稳定)、稳定的但与测验目的无关的变异(系统误差)(的但与测验目的无关的变异(系统误差)(S SI I 2 2)和随机误差变异()和随机误差变异(S SE E 2 2)三部分组成。)三部分组成。第43页/共78页信度的理论公式信度的理论公式S SX X 2 2 S ST T 2 2 +S+SE E 2 2 r r信信=S=ST T 2 2 /S/SX X 2 2 =(=(S SV V 2 2 S SI I 2 2)/S)/SX X 2 2即信度是一组测验分数真变异与总变异(实测变异)即信度是一
26、组测验分数真变异与总变异(实测变异)的比值。的比值。效度的理论公式效度的理论公式S SX X 2 2 S SV V 2 2 S SI I 2 2+S+SE E 2 2 r r效效=S=SV V 2 2 /S/SX X 2 2即效度是与测验目的有关的变异(有效变异)与总变即效度是与测验目的有关的变异(有效变异)与总变异(实测变异)的比值。异(实测变异)的比值。r效 r信一个测验的效度总是受到其信度的制约,总一个测验的效度总是受到其信度的制约,总小于信度。小于信度。第44页/共78页测验的信度受随机误差的影响测验的信度受随机误差的影响r信信=ST 2/SX 2=(SX 2 SE 2)/SX 2测验
27、的效度除受随机误差影响外,还受系统误差的影响。测验的效度除受随机误差影响外,还受系统误差的影响。r效效=SV 2/SX 2=(SX 2 SE 2 SI 2 )/SX 2一个测验的效度总是受到其信度的制约,总小于信度。一个测验的效度总是受到其信度的制约,总小于信度。r效 r信结论:结论:可信的测验未必有效,而有效的测验必定可信。可信的测验未必有效,而有效的测验必定可信。简简言之,信度是效度的必要条件言之,信度是效度的必要条件。第45页/共78页信度和效度皆高信度效度皆不高信度高但缺乏效度第46页/共78页20022002年年论述题论述题2 2:什么事心理学研究的外部效度?影响外部效度的因素:什么
28、事心理学研究的外部效度?影响外部效度的因素都有哪些?都有哪些?信度低,效度不可能高信度低,效度不可能高信度高,效度未必高信度高,效度未必高效度低,信度可能高效度低,信度可能高效度高,信度也必然高效度高,信度也必然高第47页/共78页大家辛苦了大家辛苦了!第48页/共78页内容效度是指测量在多大程度上包含了欲测的内容范围。具备较好的内容效度的必要条件:要确定好内容范围,并使测验的全部项目均在要确定好内容范围,并使测验的全部项目均在此范围内。此范围内。测验项目应该是内容范围的代表性样本。测验项目应该是内容范围的代表性样本。在成就测验中,试题应该包含考试范围的基础、在成就测验中,试题应该包含考试范围
29、的基础、重点和难点。在人格测验中,题项所描述的行为重点和难点。在人格测验中,题项所描述的行为应该是表现人格特质的典型行为样本。应该是表现人格特质的典型行为样本。第49页/共78页内容效度的估计方法l专家判断法:专家判断法:即由专家对测验项目与所设计的内容即由专家对测验项目与所设计的内容范围进行符合性判断,定性分析方法。范围进行符合性判断,定性分析方法。l复本法:复本法:克伦巴赫认为,内容效度可由一组被试在克伦巴赫认为,内容效度可由一组被试在来自同样内容范围的两个测验复本上得分的相关来来自同样内容范围的两个测验复本上得分的相关来作数量上的估计。如果相关低则至少有一个缺乏内作数量上的估计。如果相关
30、低则至少有一个缺乏内容效度,相关高则内容效度高。容效度,相关高则内容效度高。l重测法:重测法:先进行前测,然后让被试学习新的知识,先进行前测,然后让被试学习新的知识,或参与某种训练课程后再测一次。或参与某种训练课程后再测一次。如果后测的成绩如果后测的成绩显著地优于前测的成绩,说明测验到的内容是新近显著地优于前测的成绩,说明测验到的内容是新近学的知识和受到的训练,表明了该测验有较高的内学的知识和受到的训练,表明了该测验有较高的内容效度。容效度。l经验法:经验法:比如,社会适应能力测量,现实经验上,比如,社会适应能力测量,现实经验上,高年级学生要强于低年级学生。如果测验结果相反,高年级学生要强于低
31、年级学生。如果测验结果相反,则测验的内容效度有问题。则测验的内容效度有问题。第50页/共78页准则效度是以测验分数与作为外在标准的效标行为之间的关联程度来表示的一种效度。即衡量测验有效性的一个重要方法就是看根据测验做出的预测即衡量测验有效性的一个重要方法就是看根据测验做出的预测能否被证实。如果一个测验的预测与将来发生的事情非常接近,能否被证实。如果一个测验的预测与将来发生的事情非常接近,那么这就是一个好测验。被预测的行为是衡量测验是否有效的那么这就是一个好测验。被预测的行为是衡量测验是否有效的标准,简称效标。标准,简称效标。第51页/共78页效标效度的类型:同时效度:比如心理素质与心理健康同时
32、测量。同时效度:比如心理素质与心理健康同时测量。预测效度:人才选拔中的运用。预测效度:人才选拔中的运用。效标的选择:外显、客观:智力与学习成绩外显、客观:智力与学习成绩简单、省事:社会适应性量表的编制。简单、省事:社会适应性量表的编制。科学、权威:比如用心理健康指标作为心理素科学、权威:比如用心理健康指标作为心理素质的效标。质的效标。第52页/共78页效标效度的估计方法1.1.相关法:计算测验分数与效标测量的相关系数。相关法:计算测验分数与效标测量的相关系数。2.2.区分法:根据效标将被试分成两组,再来分析这两组原来测验区分法:根据效标将被试分成两组,再来分析这两组原来测验分数的差异。分数的差
33、异。第53页/共78页第54页/共78页3.3.命中率法命中率法总命中率命中/(命中失误)100 (BC)/(ABCD)100正命中率成功人数/选择人数100 B/(AB)100 效标成绩效标成绩测验成绩测验成绩 失败()失败()成功()成功()成功()成功()A(失误)(失误)B(命中)(命中)失败()失败()C(命中)(命中)D(失误)(失误)第55页/共78页结构效度是测验对理论上的构想或特质的测量程度。测验对理论上的构想或特质的测量程度。确定结构效度的基本步骤 首先从某一理论出发,提出某一心理特质的假设,即构成心理首先从某一理论出发,提出某一心理特质的假设,即构成心理特质的成分或因素,
34、然后设计和编制测验并进行试测,最后对特质的成分或因素,然后设计和编制测验并进行试测,最后对测验的结果采用相关或因素分析等方法分析,验证与理论假设测验的结果采用相关或因素分析等方法分析,验证与理论假设的相符程度。的相符程度。第56页/共78页估计结构效度的方法测验内估计题项、分量表和总量表之间的相关题项、分量表和总量表之间的相关 题项与分量表的相关题项与分量表的相关 题项与总量表的相关题项与总量表的相关 分量表内题项相关分量表内题项相关 分量表间题项相关分量表间题项相关 分量表间相关分量表间相关 分量表与总量表相关分量表与总量表相关第57页/共78页第58页/共78页第59页/共78页测验间估计
35、:通过计算测验与标准化测验的相关来获取效度证据。因素分析建立结构效度最常用的方法。建立结构效度最常用的方法。原理:相关矩阵或协方差矩阵的分类原理:相关矩阵或协方差矩阵的分类指标:项目负荷、贡献率、因素项指标:项目负荷、贡献率、因素项第60页/共78页第61页/共78页第62页/共78页多特质多方法矩阵信度系数信度系数:同一结构使用同样测量方法,理想值最高。同一结构使用同样测量方法,理想值最高。聚合效度系数聚合效度系数:对同一结构使用不同的测量方法,理想值较高。对同一结构使用不同的测量方法,理想值较高。区分效度系数区分效度系数:对不同结构使用同一种测量方法,理想值较低。对不同结构使用同一种测量方
36、法,理想值较低。第63页/共78页案例:多特质多方法矩阵数据 来自D.L.Moser,罪恶感测量,美国心理学会1968年方方法法1 方方法法2ABCABC 1 迫选题:迫选题:A 隐私罪恶感隐私罪恶感.95B 敌对罪恶感敌对罪恶感.39.76C 道德良心道德良心.55.26.842 完成句子:完成句子:A 隐私罪恶感隐私罪恶感.64.17.37.48B敌对罪恶感敌对罪恶感.22.67.19.15.41C 道德良心道德良心.31.17.56.41.30.58第64页/共78页研究的内部效度:是指在研究的自变量与因变量之间存在因果关系的明确程度。所研究的变量之间,特别是自变量和因变量之间是否所研究
37、的变量之间,特别是自变量和因变量之间是否有关系?有关系?是否是自变量的变化引起了因变量的变化?其确切程是否是自变量的变化引起了因变量的变化?其确切程度如何?度如何?一项实验的内部效度高,就意味着因变量的变化确系一项实验的内部效度高,就意味着因变量的变化确系一项实验的内部效度高,就意味着因变量的变化确系一项实验的内部效度高,就意味着因变量的变化确系由特定的自变量引起的。由特定的自变量引起的。由特定的自变量引起的。由特定的自变量引起的。第65页/共78页内部效度和外部效度的联系内部效度和外部效度的联系提高实验内部效度的措施可能会降低其外部提高实验内部效度的措施可能会降低其外部效度,而提高实验外部效
38、度的措施又可能会效度,而提高实验外部效度的措施又可能会降低其内部效度。降低其内部效度。这两种效度的相对重要性,主要取决于实验这两种效度的相对重要性,主要取决于实验的目的和实验的要求。的目的和实验的要求。第66页/共78页影响内部效度的因素:1 1、历史、历史 在实验过程中,与实验变量同时发生,并对实验在实验过程中,与实验变量同时发生,并对实验结果产生影响的特定事件。结果产生影响的特定事件。2 2、成熟、成熟 实实验验过过程程中中随随着着时时间间的的延延续续,被被试试发发生生了了生生理理和和心理的成熟。心理的成熟。3 3、统计回归效应统计回归效应在进行重复测量时,初测时获得极端分数者的成在进行重
39、复测量时,初测时获得极端分数者的成绩实验处理后的测验分数有回归到平均数的趋绩实验处理后的测验分数有回归到平均数的趋向。向。第67页/共78页4 4、被试的缺失、被试的缺失实实验验过过程程中中,由由于于种种种种原原因因是是实实验验组组或或控控制制组组中中有有较较多多被被试试流流失失,这这样样会会使使不不等等组组的的情情况况出出现现,从从而而使结果无法解释。使结果无法解释。5 5、被试特征、被试特征实实验验过过程程中中,由由于于没没有有采采取取随随机机化化的的方方法法来来选选择择和和分配被试,因而造成实验处理前组与组的不相等。分配被试,因而造成实验处理前组与组的不相等。6 6、研究工具的使用、研究
40、工具的使用实验过程中使用仪器不当或仪器失灵,测验材料出实验过程中使用仪器不当或仪器失灵,测验材料出现问题等或主试身心发生变化。现问题等或主试身心发生变化。第68页/共78页7 7、前测验、前测验在在一一般般正正常常情情况况下下,前前后后两两次次测测量量的的结结果果会会有有一一定定的的差差异异,后后测测的的分分数数将将比比前前测测的的高高。这这中中间间包包括括练练习习因因素素、临临场场经经验验、以以及及对对实实验验目目的的的的敏敏感感程程度,从而提高了后测的成绩。度,从而提高了后测的成绩。8 8、主试和被试的交互作用、主试和被试的交互作用安慰剂效应和期望效应安慰剂效应和期望效应9 9、无关变量的
41、交互作用、无关变量的交互作用第69页/共78页l研究的外部效度:就是将研究结果推广到研究外情景的程度,即研究结就是将研究结果推广到研究外情景的程度,即研究结果的普遍代表性和适用性。果的普遍代表性和适用性。l任何一项实验研究都想将其结果推广,希望能用自己的研究结任何一项实验研究都想将其结果推广,希望能用自己的研究结果,对同类现象做出解释,预测和控制。这就需要提高实验研果,对同类现象做出解释,预测和控制。这就需要提高实验研究的外在效度。究的外在效度。第70页/共78页1 1)用其他的被试人群也能得到同样的结果吗?)用其他的被试人群也能得到同样的结果吗?2 2)用其他的实验材料也能得到同样的结果吗?
42、)用其他的实验材料也能得到同样的结果吗?3 3)用其他不同类型的测验会出现同样的结果吗?)用其他不同类型的测验会出现同样的结果吗?4 4)用不同的实验处理和不同的自变量操作方式也)用不同的实验处理和不同的自变量操作方式也能出现同样的结果吗?能出现同样的结果吗?第71页/共78页影响外部效度的因素1 1、实验条件的人为性、实验条件的人为性即即克克服服实实验验的的过过分分人人工工情情境境化化。一一般般的的实实验验室室实实验验都都是是在在严严密密控控制制条条件件下下进进行行的的,这这样样的的结结果果用用来解释日常生活中的问题,可能不太切合实际。来解释日常生活中的问题,可能不太切合实际。2 2、实验处
43、理的多重性、实验处理的多重性同一被试多次接受实验处理会使被试产生练习或同一被试多次接受实验处理会使被试产生练习或疲劳效应,如被试内设计。疲劳效应,如被试内设计。第72页/共78页3 3、被试取样的代表性、被试取样的代表性取取样样时时一一定定注注意意随随机机化化和和代代表表性性的的问问题题,抽抽样样要要随随机机,要要增增加加取取样样的的层层次次,这这样样会会使使样样本本的的代代表表性性增增大大。但但是是心心理理学学实实验验的的被被试者通常是自愿的。试者通常是自愿的。4 4、测量工具的局限性、测量工具的局限性考虑变量操作性定义的片面性。例如不同成就动机量表。考虑变量操作性定义的片面性。例如不同成就
44、动机量表。第73页/共78页在进行一项语文教学研究中,为了验证某种教在进行一项语文教学研究中,为了验证某种教学方法是否更适合于语文成绩较差者的学习改学方法是否更适合于语文成绩较差者的学习改进,研究者就对同一个年级的学生进行语文水进,研究者就对同一个年级的学生进行语文水平前测,根据前测的成绩将排名前平前测,根据前测的成绩将排名前2727的同学的同学作为学优组、排名后作为学优组、排名后2727的同学作为学差组。的同学作为学差组。然后采用这种教学方法进行一个时期的教学,然后采用这种教学方法进行一个时期的教学,接着进行语文水平后测。结果发现,接着进行语文水平后测。结果发现,学差组学学差组学生的语文成绩
45、要比学优生的成绩进步更多。生的语文成绩要比学优生的成绩进步更多。你的结论是你的结论是第74页/共78页对一个年级的学生进行语文水平前测,还是根对一个年级的学生进行语文水平前测,还是根据前测成绩把学生分成学优组和学差组;然后,据前测成绩把学生分成学优组和学差组;然后,在未经过任何教育训练、中间时间间隔也很小在未经过任何教育训练、中间时间间隔也很小的情况下,再用结构与难度相当的测试卷对学的情况下,再用结构与难度相当的测试卷对学生进行后测。生进行后测。结果你看到结果你看到学优组平均成绩有所下降、学差组学优组平均成绩有所下降、学差组平均成绩有所上升。平均成绩有所上升。第75页/共78页学优组平均成绩有
46、所下降、学差组平均成绩有所上升,学优组平均成绩有所下降、学差组平均成绩有所上升,都出现了向全年级的平均成绩靠拢的趋势,这就是都出现了向全年级的平均成绩靠拢的趋势,这就是所谓的所谓的“统计回归统计回归”,它不是任何教育训练引起。那又是由什么因素引起的呢?这就是统计学问题。它不是任何教育训练引起。那又是由什么因素引起的呢?这就是统计学问题。第76页/共78页统计回归效应的真正原因就是统计回归效应的真正原因就是偶然因素变化导致的随机误差偶然因素变化导致的随机误差,以及仅仅根据一次测试结果划分高分组和低,以及仅仅根据一次测试结果划分高分组和低分组。测试中随机误差的影响越大,统计回归效应也就会越大;反之越小。分组。测试中随机误差的影响越大,统计回归效应也就会越大;反之越小。第77页/共78页谢谢您的观看!第78页/共78页