《内隐联合测验实验报告.docx》由会员分享,可在线阅读,更多相关《内隐联合测验实验报告.docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 内隐联合测验实验报告 内隐联合测验实验报告 陈滋正 (浙江大学心理与行为科学系,杭州, 310028) 摘要 内隐联合测验 ( Implicit Association Test, IAT)是一种相对有效的研宄内隐社会认知的工 具,且应用范围广泛。但它毕竟是刚出现不久的新方法,信、效度指标还不够完善,对其测验原理 还存在许多争议,需要深入探讨。本实验旨在对 Greenwald的经典的内隐联合测验实验(花虫测验) 进行验证,了解 IAT方法的实验范式及其结果的处理,并进一步探讨 IAT范式的特点及其影响因 素。 关键词 内隐社会认知;内隐联合测验;花虫测验 1 导言 内隐社会认知起源于内隐记忆
2、的相关研宄,是 新近兴起的社会认知领域的研宄热点。由于内隐社 会认知发生的过程具有无意识、自动化的特征,因 此,很难通过传统的自陈式量表直接进行测量,因 此,在内隐社会认知研宄方面比较常用的间接测量 方法有句子填充法、投射测验法、传记分析法、反 应时法和情景测验法等。 内隐联合测验 ( Implicit Association Test, IAT) 是 Greenwald 等人 ( Greenwald, McGhee, &Schwartz, 1998)于 1998年提出的一种计算机化的辨别分类 任务,采用反应时为指标,通过测量概念词和属性 词之间联系的紧密程度,从而推断个体内隐态度的 一种新的
3、研宄方法,是反应时范式在社会认知研宄 中的拓展。其基本原理是当两个概念联系紧密时, 人们容易对其样例作同一反应;反之,当两个概念 联系不紧密甚至存在冲突时,对它们的样例作同一 反应则较为困难。利用人们对不同概念的样例作同 一反应的难易程度便可获得个体对不同概念的内 隐认知层面上的联系强度。 在经典 IAT范式中,要求被试对呈现的刺激 (文 字或图片)进行分类,并记录反应时。刺激材料分 属两类词:概念词与属性词。例如,花卉(如玫瑰、 月季)和昆虫(蚂蚁、蜘蛛 ) 构成了概念词,而积 极(快乐、奖励 ) 和消极( 灾难、悲伤 ) 则构成属 性词。测验中包含两类任务:相容任务 ” (compatib
4、le task)和 “ 不相容任务 ” ( incompatible task)。 相容 和不相容是针对被试的内隐认知结构而言,前者指 被归为一类中的概念词和属性词与被试的内隐认 知结构相一致(例如,花卉对应积极、昆虫对应消 极),而后者则相反(例如,花卉对应消极、昆虫 对应积极)。因此,在相容任务中,概念词和属性 词在被试内隐认知结构中联系紧密,表现为被试的 联合任务的反应时较短;而在不相容任务中,由于 概念词和属性词会引起被试的认知冲突, 从而导致 联合任务的反应时延长。最后,这两类任务的平均 反应时之差即反映了被试的内隐态度。 尽管 IAT得到了非常广泛的应用,而且有关的 研宄层出不穷,
5、但关于 IAT的内在作用机制,至今 为止并没有一个真正意义上的、完整的解释。 关于 IAT的原理, Greenwald等人只做出了如 下假设:如果两个概念密切联系,那么当它们对应 同一个反应时会比较容易,对应不同的反应则比较 难。而对 IAT的有效性主要还是通过间接地提供有 关的效度和信度指标来加以说明。 由于 IAT非常适合于测量自动化的、不要求有 意识回忆的不合理信念。因此,许多研宄者采用 IAT 在临床心理学方面进行了深入系统的研宄,尤其是 在对抑郁、焦虑和恐怖症者的治疗效果评估以及根 据内隐认知对行为的预测方面取得了一些有益的 研宄成果。 尽管 IAT是一种相对有效的研宄内隐社会认知
6、的工具,且应用范围也日趋广泛。但它毕竟是刚出 现不久的新方法,信、效度指标还不够完善,对其 测验原理还存在许多争议,需要深入探讨。在应用 IAT及对其结果加以解释时,应当谨慎。 本实验旨在对 Greenwald的经典的内隐联合测 验实验(花虫测验)进行验证,了解 IAT方法 的实 1 内隐联合测验实验报告 验范式及其结果的处理,并进一步探讨 IAT范式的 特点及其影响因素。 2 实 验 方 法 2.1被试 浙江大学心理与行为科学系 68名大二学生, 男生 31名,女生 37名。 CI组 34人, IC组 34人。 2.2仪器与材料 IBM-PC计算机一台,认知心理学教学管理系 统。认知心理学教
7、学管理系统。本实验呈现的刺激 材料包含四种词汇:花卉词、昆虫词、积极词和消 极词(各类词汇详见附录)。 2.3实验设计与流程 本实验采用单因素被试内设计。自变量为任务 的性质,共有 2个水平:相容任务和不相容任务, 因变量为反应时。任务的顺序在被试间对抗平衡。 经典 IAT实验的具体流程参见表 2-1。实验分 为练习和正式两部分,一半的被试先进行相容任务, 后进行不相容任务;另一半被试则先进行不相容任 务,后进行相容任务。 被试先进行练习,相容任务(或不相容任务) 的练习共有两部分组成:( 1)概念词(花卉与昆 虫)的分类任务; ( 2)属性词(积极与消极 ) 的 分类任务。在进行相容任务的练
8、习时,首先进行概 念词(花卉与昆虫 ) 的分类任务。此时,屏幕一左 一右分别呈现一个类别词,左侧为 “ 花卉 ” ,右侧为 “ 昆虫 ” 。而后在屏幕中央呈现一个词(如 “ 蒲公英 ” ) , 被试的任务是判定该词属于左侧类别还是属于右 侧类别,属于左侧类别按左键 ( 默认为键), 属于右侧类别按右键( 默认为 “r 键)。概念词的分 类任务结束后,进入属性词的分类任务。同样,屏 幕一左一右分别呈现一个类别词,左侧为 “ 积极 ” , 右侧为 “ 消极 ” 。而后在屏幕中央呈现一个词 ( 如 “ 甜 蜜 ” ),被试的任务是判定该词属于左侧类别还是 属于右侧类别,属于左侧类别按左键 ( 默认为
9、 “ F” 键),属于右侧类别按右键 ( 默认为 “r 键 ); 而在 进行不相容任务的练习时 ,首先进行概念词(花卉 与昆虫 ) 的分类任务,屏幕一左一右分别呈现一个 类别词,左侧为 “ 昆虫 ” ,右侧为 “ 花卉 ” 。而后在屏 幕中央呈现一个词(如 “ 蒲公英 ” ),被试的任务是 判定该词属于左侧类别还是属于右侧类别,属于左 侧类别按左键 ( 默认为 “ F” 键),属于右侧类别按 右键 ( 默认为 “ J” 键)。概念词的分类任务结束后, 进入属性词的分类任务。同样,屏幕一左一右分别 呈现一个类别词,左侧为 “ 积极 ” ,右侧为 “ 消极 ” 。 而后在屏幕中央呈现一个词(如 “
10、 甜蜜 ” ),被试的 任务是判定该词属于左侧类别还是属于右侧类别, 属于左侧类 别按左键 ( 默认为 “ F” 键),属于右侧 类别按右键 ( 默认为 “ J” 键)。 正式实验则要求被试对概念词和属性词进行 联合反应。在相容任务条件下,屏幕一左一右分别 呈现两个类别词,左侧为 “ 花卉或积极 ” ,右侧为 “ 昆 虫或消极 ” ,而后在屏幕中央呈现一个词(如 “ 蒲公 英 ” ),被试的任务是判定该词属于左侧类别还是 属于右侧类别,属于左侧类别按左键 ( 默认为 “ F” 键),属于右侧类别按右键 ( 默认为 “r 键 ); 在不 相容任务条件下,同样,屏幕一左一右分别呈现两 个类别词,左
11、侧为 “ 昆虫或积极 ” ,右侧为 “ 花卉或消 极 ” ,而后在屏幕中央呈现一个词(如 “ 蒲公英 ” ), 被试的任务是判定该词属于左侧类别还是属于右 侧类别,属于左侧类别按左键 ( 默认为 “ F” 键), 属于右侧类别按右键 ( 默认为 “r 键)。 相容任务(不相容任务 ) 的练习共 100次(其 中,50次为概念词归类, 50次为属性词归类)。 被试做出按键反应后,无论反应正确、错误或超时 均有反馈,并提示反应时,但结果不予以记录。练 习正确率达到90%以上方可进入相容任务 ( 或不相 容任务 ) 的正式实验。正式实验在被试做出正确反 应后没有提示,反应错误或反应超时则会有提示。
12、相容任务 (不相容任务 ) 的正式实验共有 200次试 验,分 4组(每组 50次),组与组之间分别有一 中断,被试可自行控制休息时间。整个实验持续约 40分钟。 内隐联合测验实验报告 表 2-1经典 I AT实验序列(花与虫 ) 组 任务性质 任务类型 试验次数 功能 左 键 对 项 目 右 键 对 项 目 B1 概念词分类 50 练习 花卉 昆虫 B2 相容 属性词分类 50 练习 积极 消极 B3 联合分类 200 正式 花卉或积极 昆虫或消极 B4 概念词分类 50 练习 昆虫 花卉 B5 +相容 属性词分类 50 练习 消极 积极 B6 联合分类 200 正式 昆虫或积极 花卉或消极
13、 注:对于一半的被试, Bl、 B2、 B3组分别与 B4、 B5、 B6组互换,即相容与相容任务顺序互换。 3 结 果 分 析 对原始数据进行处理,以任务性质(相容或不 相容)为横坐标,反应时为纵坐标,绘制柱形图 3-1。 图 3-1反应时与任务性质的关系图 分别采用以下三种方法对 IAT的实验结果进行 计算,并对其是否存在顺序效应进行检验: (1) 分别计算相容与不相容条件下的平均反 应时,并计算两者的差值 mRT,计算结果如表 3-1 所示。对相容一不相容和不相容一相容两种顺序的 被试的 mRT进行单因素方差分析,发现存在顺序 效应,且非常显著 ( F=7.656, p=.007)。 表
14、 3-1方法一的实验结果 实验顺序 任务性质 反时 / ms mRT / ms 相容一 +相容 相容任务 +相容任务 594.70 832.36 237.66 +相容一相容 相容任务 +相容任务 595.80 759.48 163.67 综合 相容任务 +相容任务 595.24 796.45 201.20 (2) 将相容阈不相容条件下的反应时对数化(自 然对数 ) ,并计算两者的差值 mLOG,计算结果如 表 3-2所示。对相容一不相容和不相容一相容两种 顺序的被试的 mLOG进行单因素方差分析,发现存 在顺序效应 , 且显著 ( F= =6.511, p=.013)。 表 3-2方法二的实验
15、结果 实验顺序 任务性质 反应时(对数化) mLOG 相容一 +相 相容任务 6.36 0.30 容 小相容任务 6.65 +相容一相 相容任务 6.35 0.23 容 小相容任务 6.57 综合 相容任务 6.35 0.26 小相容任务 6.61 (3) 分别计算相容阈不相容条件下的平均反 应时和两者的联合标准差,并计算两者对应的差值 mD,计算结果如表 3-3所示。对相容一不相容和不 相容一相容两种顺序的被试的 mD进行单因素方差 分析,发现不存在顺序效应 ( F=1.039, p=.312)。 表 3-3方法三的实验结果 实验顺序 mRT / ms 标准差 mD 相容一 +相容 237.
16、66 100.71 2.36 +相容一相容 163.67 110.97 1.47 综合 201.2 158.10 1.27 以 50个 trials为一个区组,以区组为横坐标, 以mD值为 IAT效应, IAT效应为纵坐标,绘制折 线图,如图 3-2,研宄 IAT效应与练习增加的关系。 对练习区组和实验顺序对 IAT效应进行重复测量的 多因素方差分析,发现练习区组的效应显著 (F=5.426, p=.002 ),实验顺序的效应不显著 (F=1.601, p=.215),练习区组与实验顺序的交互 作用也不显著 ( F=1.055, p=.372)。 内隐联合测验实验报告 图 3-2 I AT效应
17、与练习增加的关系 4 讨论 4. 1分别比较上述三种计算方法的优缺点 均数法是将不相容任务的平均反应时与相容 任务的平均反应时相减,将其差值作为 IAT效应。 这种计算方法具有计算简单方便快捷的优点,但是 由他计算出的 I AT效应易受到顺序效应、联系效应、 个体加工速度(年龄与反应速度)的影响。 对数法是将反应时转化为自然对数,再将不相 容任务的平均数减去相容任务的平均数,将其差值 作为 IAT效应。由于反应时的分布是一种偏态分布, 这种计算方法通过对数处理将反应时的分布正态 化,这样可以使数据具有满意的方差稳定性。但这 种方法依旧不能排除个体加工速度 ( 年龄与反应速 度)的影响。 D值法
18、是计算不相容与相容任务的平均反应时 之差,然后除以两个任务上所有反应时的标准差, 将其商作为 IAT效应。这种方法可以保持较高的内 隐效应与外显主观测量结果的相关程度,而且比较 稳定。同时,他能够显著的降低个体加工速度(年 龄与反应速度 ) 和先前测验经历对 IAT效应的影响。 4.2相容与不相容条件下的差值反映了被试的何 种内隐态度? IAT的基本原理如下:两个概念联系紧密,人 们容易对其样例作一致反应,因此反应时较短;反 过来,两个概念联系不紧密甚至存在冲突,人们不 易对它们的样例作一致反应,因此反应时较长 。 IAT 范式中包含两种条件,相容与不相容。相容条件下, 向被试呈现的概念词与属
19、性词与被试的内隐认知 结构一致,基于上述原理,反应时应该较短;不相 容条件下则相反。 人们在这两种条件下的反应时之差即反应了 被试的内隐态度。即相容与不相容条件下反应时差 值的正负和大小分别反应了被试对不同概念内隐 认知层面的倾向和程度。 本实验中通过三种计算方法获得的结果都显 示,被试在相容任务中比不相容任务反应时更短, 被试更倾向于将花卉类词汇与积极类词汇联系在 一起,将昆虫类词汇与消极类词汇联系在一起。 4.3 IAT在研究被试的内隐态度方面有何优势? 首先, IAT范式具有很强的适应性。由于 IAT 范式可以使用词汇或图形来表征绝大多数的概念, 因此绝大多数内隐社会认知研宄领域都可以应
20、用 IAT。 比如他可以用来测量各种内隐态度、各种刻 板印象、内隐自尊和各种自我概念,而且还可以用 来测量群体归属或社会认同。 其次, IAT范式具有很高的稳定性。众多研宄 都发现 IAT的 cx系数较高 .在 0.77 0.95之间,有文 献 ( GawroskiB., 2002)报告了德国被试对土耳其 人和亚洲人内隐态度的 IAT测验的 a系数分别为 0.55和 0.56,可能是研宄中最低的一个(其外显测 验的 ct系数也仅为0.61和 0.68),说明 IAT测验具 有很好的内部一致性。同时, Greenwald等发现分 别利用完整和不完整姓名作为客体材料的 IAT测验 的相关为 0.8
21、5 (Greenwald etal., 1998),这说明 IAT测验平行测验的复本信度很高,高于其他的范 式。 4.4 IAT的联网测试对未来心理学的大数据研究有 何启示? 以蔡华俭的 “ 中国人的自恋 ” 为例,可以得到如 下启示: 首先,由于中国世界第一的网民数量,联网测 试收集来的大数据能够获得多 样化、异质化的大样 本,甚至极难获得的特异样本。拥有如此得天独厚 的优势的未来心理学家可以极大地拓展研宄领域、 验证未解的命题。 其次,中国人正处在巨变的时代,极易变得迷 茫,急需了解自己和他人,因此像 IAT 类的能够 帮助被试了解自己和别人的实验会大受追捧。未来 心理学可以向这个方向发展
22、,达到借时代潮流之势 的目的。 最后,应该利用大数据来研宄人类。因为通过 网络收集来的大数据,由于参加者动机相对单纯, 内隐联合测验实验报告 能减少社会期许效应和其他动机性污染,而且没有 主试的参与,减少实验者效应。因此大数据分析得 来的结果更具有生态效度、更具有可推广性。 4.5进 _步分析实验数据,你还可以发现什么现 象? 对图 3-2进行分析,可以看出, IAT效应随练 习的增加而减小,而且练习次数的变化对 IAT效应 的影响显著。这说明 IAT测验中存在联系效应的系 统误差。 对表 3-1、 3-2、 3-3进行分析,可以发现在三 种计算方法下,先相容任务后不相容任务的 IAT效 应都
23、比先不相容任务后相容任务大,且差异显著。 这说明 IAT测验中存在顺序效应,而且不相容任务 在前会减小 IAT效应。 综上,说明 IAT测验还存在进一步的改良空间。 5 结论 本实验中通过三种计算方法,处理原始数据得 到IAT效应值。获得的结果一致显示,被试在相容 任务中比不相容任务反应时更短,即被试更倾向于 将花卉类词汇与积极类词汇(比如关怀、自由、健 康、喜爱等)联系在一起,将昆虫类词汇与消极类 词汇(比如虐待、崩溃、污秽、谋杀等)联系在一 起。 参考文献 1 侯珂,邹泓,张秋凌 .内隐联想测验:信度、效度及原理 J. 心理科学进展, 2004, 12 (2):223-230 2 崔丽娟,
24、张高产 .内隐联结测验 ( TAT)研究冋顾与展望 .心理 科学, 2004, 27(1): 161-164 3 杨治良,实验心理学 .浙江教育出版社, 1998:227-263 4 朱滢,实验心理学 .第 2版 .北京大学出版社, 2009:40-57 5 Greenwald A G, McGhee D E, Schwartz J L K. Measuring Individual Differences in Implicit Cognition: The Implicit Association Test. Journal of Personal and Social Psycholog
25、y, 1998, 74(6): 1464 1480 6 Gawronski B. What Does the Implicit Association Test Measure? A Test of the Convergent and Discriminate Validity of Prejudice-Related IATs. Experimental Psychology, 2002, 49(3): 171180 7 T. Talhelm et al., Large-Scale Psychological Differences Within China Explained by Ri
26、ce Versus Wheat Agriculture. Science 344, 603 (2014) 6 思 考 题 如果要研究人们对单一事物(如日本、伊斯兰 教)的内隐态度,应如何设计 IAT实验,实验中应 注意哪些问题? 因为经典 TAT实验不宜用来测量单一概念,因 此使用 TAT实验的变式来解决这个问题。在本题中, 最适用的范式为 Wigboldus IAT (WIAT)。 在任务 中,要求被试再看到积极的词和与日本或伊斯兰信 仰有关的词(如艺伎或古兰经)时按左键,看到消 极的词时按右键。第二个任务则要求被试看到积极 的词按左键,看到消极的词和与日本或伊斯兰信仰 有关的词按右键。如果被试在第一个任务上做得更 好则说明对日本或伊斯兰态度比较积极,反之亦然。 实验中应该注意选择同样字数的词语,避免被 试通过字数来判断词语种类;要注意平衡顺序效应 ; 要注意练习效应。 内隐联合测验实验报告