内隐联合测验实验报告.docx-淘文阁

资源描述

《内隐联合测验实验报告.docx》由会员分享，可在线阅读，更多相关《内隐联合测验实验报告.docx（7页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、内隐联合测验实验报告内隐联合测验实验报告陈滋正 (浙江大学心理与行为科学系，杭州， 310028) 摘要内隐联合测验（ Implicit Association Test， IAT)是一种相对有效的研宄内隐社会认知的工具，且应用范围广泛。但它毕竟是刚出现不久的新方法，信、效度指标还不够完善，对其测验原理还存在许多争议，需要深入探讨。本实验旨在对 Greenwald的经典的内隐联合测验实验（花虫测验）进行验证，了解 IAT方法的实验范式及其结果的处理，并进一步探讨 IAT范式的特点及其影响因素。关键词内隐社会认知；内隐联合测验；花虫测验 1 导言内隐社会认知起源于内隐记忆

2、的相关研宄，是新近兴起的社会认知领域的研宄热点。由于内隐社会认知发生的过程具有无意识、自动化的特征，因此，很难通过传统的自陈式量表直接进行测量，因此，在内隐社会认知研宄方面比较常用的间接测量方法有句子填充法、投射测验法、传记分析法、反应时法和情景测验法等。内隐联合测验（ Implicit Association Test， IAT) 是 Greenwald 等人（ Greenwald， McGhee， &Schwartz， 1998)于 1998年提出的一种计算机化的辨别分类任务，采用反应时为指标，通过测量概念词和属性词之间联系的紧密程度，从而推断个体内隐态度的一种新的

3、研宄方法，是反应时范式在社会认知研宄中的拓展。其基本原理是当两个概念联系紧密时，人们容易对其样例作同一反应；反之，当两个概念联系不紧密甚至存在冲突时，对它们的样例作同一反应则较为困难。利用人们对不同概念的样例作同一反应的难易程度便可获得个体对不同概念的内隐认知层面上的联系强度。在经典 IAT范式中，要求被试对呈现的刺激 (文字或图片）进行分类，并记录反应时。刺激材料分属两类词：概念词与属性词。例如，花卉（如玫瑰、月季）和昆虫（蚂蚁、蜘蛛）构成了概念词，而积极（快乐、奖励）和消极（灾难、悲伤）则构成属性词。测验中包含两类任务：相容任务 ” (compatib

4、le task)和 “ 不相容任务 ” （ incompatible task)。相容和不相容是针对被试的内隐认知结构而言，前者指被归为一类中的概念词和属性词与被试的内隐认知结构相一致（例如，花卉对应积极、昆虫对应消极），而后者则相反（例如，花卉对应消极、昆虫对应积极）。因此，在相容任务中，概念词和属性词在被试内隐认知结构中联系紧密，表现为被试的联合任务的反应时较短；而在不相容任务中，由于概念词和属性词会引起被试的认知冲突，从而导致联合任务的反应时延长。最后，这两类任务的平均反应时之差即反映了被试的内隐态度。尽管 IAT得到了非常广泛的应用，而且有关的研宄层出不穷，

5、但关于 IAT的内在作用机制，至今为止并没有一个真正意义上的、完整的解释。关于 IAT的原理， Greenwald等人只做出了如下假设：如果两个概念密切联系，那么当它们对应同一个反应时会比较容易，对应不同的反应则比较难。而对 IAT的有效性主要还是通过间接地提供有关的效度和信度指标来加以说明。由于 IAT非常适合于测量自动化的、不要求有意识回忆的不合理信念。因此，许多研宄者采用 IAT 在临床心理学方面进行了深入系统的研宄，尤其是在对抑郁、焦虑和恐怖症者的治疗效果评估以及根据内隐认知对行为的预测方面取得了一些有益的研宄成果。尽管 IAT是一种相对有效的研宄内隐社会认知

6、的工具，且应用范围也日趋广泛。但它毕竟是刚出现不久的新方法，信、效度指标还不够完善，对其测验原理还存在许多争议，需要深入探讨。在应用 IAT及对其结果加以解释时，应当谨慎。本实验旨在对 Greenwald的经典的内隐联合测验实验（花虫测验）进行验证，了解 IAT方法的实 1 内隐联合测验实验报告验范式及其结果的处理，并进一步探讨 IAT范式的特点及其影响因素。 2 实验方法 2.1被试浙江大学心理与行为科学系 68名大二学生，男生 31名，女生 37名。 CI组 34人， IC组 34人。 2.2仪器与材料 IBM-PC计算机一台，认知心理学教学管理系统。认知心理学教

7、学管理系统。本实验呈现的刺激材料包含四种词汇：花卉词、昆虫词、积极词和消极词（各类词汇详见附录）。 2.3实验设计与流程本实验采用单因素被试内设计。自变量为任务的性质，共有 2个水平：相容任务和不相容任务，因变量为反应时。任务的顺序在被试间对抗平衡。经典 IAT实验的具体流程参见表 2-1。实验分为练习和正式两部分，一半的被试先进行相容任务，后进行不相容任务；另一半被试则先进行不相容任务，后进行相容任务。被试先进行练习，相容任务（或不相容任务）的练习共有两部分组成：（ 1)概念词（花卉与昆虫）的分类任务；（ 2)属性词（积极与消极）的分类任务。在进行相容任务的练

8、习时，首先进行概念词（花卉与昆虫）的分类任务。此时，屏幕一左一右分别呈现一个类别词，左侧为 “ 花卉 ” ，右侧为 “ 昆虫 ” 。而后在屏幕中央呈现一个词（如 “ 蒲公英 ” ），被试的任务是判定该词属于左侧类别还是属于右侧类别，属于左侧类别按左键（默认为键），属于右侧类别按右键（默认为 “r 键）。概念词的分类任务结束后，进入属性词的分类任务。同样，屏幕一左一右分别呈现一个类别词，左侧为 “ 积极 ” ，右侧为 “ 消极 ” 。而后在屏幕中央呈现一个词（如 “ 甜蜜 ” ），被试的任务是判定该词属于左侧类别还是属于右侧类别，属于左侧类别按左键（默认为

9、 “ F” 键），属于右侧类别按右键（默认为 “r 键）；而在进行不相容任务的练习时，首先进行概念词（花卉与昆虫）的分类任务，屏幕一左一右分别呈现一个类别词，左侧为 “ 昆虫 ” ，右侧为 “ 花卉 ” 。而后在屏幕中央呈现一个词（如 “ 蒲公英 ” ），被试的任务是判定该词属于左侧类别还是属于右侧类别，属于左侧类别按左键（默认为 “ F” 键），属于右侧类别按右键（默认为 “ J” 键）。概念词的分类任务结束后，进入属性词的分类任务。同样，屏幕一左一右分别呈现一个类别词，左侧为 “ 积极 ” ，右侧为 “ 消极 ” 。而后在屏幕中央呈现一个词（如 “

10、甜蜜 ” ），被试的任务是判定该词属于左侧类别还是属于右侧类别，属于左侧类别按左键（默认为 “ F” 键），属于右侧类别按右键（默认为 “ J” 键）。正式实验则要求被试对概念词和属性词进行联合反应。在相容任务条件下，屏幕一左一右分别呈现两个类别词，左侧为 “ 花卉或积极 ” ，右侧为 “ 昆虫或消极 ” ，而后在屏幕中央呈现一个词（如 “ 蒲公英 ” ），被试的任务是判定该词属于左侧类别还是属于右侧类别，属于左侧类别按左键（默认为 “ F” 键），属于右侧类别按右键（默认为 “r 键）；在不相容任务条件下，同样，屏幕一左一右分别呈现两个类别词，左

11、侧为 “ 昆虫或积极 ” ，右侧为 “ 花卉或消极 ” ，而后在屏幕中央呈现一个词（如 “ 蒲公英 ” ），被试的任务是判定该词属于左侧类别还是属于右侧类别，属于左侧类别按左键（默认为 “ F” 键），属于右侧类别按右键（默认为 “r 键）。相容任务（不相容任务）的练习共 100次（其中，50次为概念词归类， 50次为属性词归类）。被试做出按键反应后，无论反应正确、错误或超时均有反馈，并提示反应时，但结果不予以记录。练习正确率达到90%以上方可进入相容任务（或不相容任务）的正式实验。正式实验在被试做出正确反应后没有提示，反应错误或反应超时则会有提示。

12、相容任务（不相容任务）的正式实验共有 200次试验，分 4组（每组 50次），组与组之间分别有一中断，被试可自行控制休息时间。整个实验持续约 40分钟。内隐联合测验实验报告表 2-1经典 I AT实验序列（花与虫 ) 组任务性质任务类型试验次数功能左键对项目右键对项目 B1 概念词分类 50 练习花卉昆虫 B2 相容属性词分类 50 练习积极消极 B3 联合分类 200 正式花卉或积极昆虫或消极 B4 概念词分类 50 练习昆虫花卉 B5 +相容属性词分类 50 练习消极积极 B6 联合分类 200 正式昆虫或积极花卉或消极

13、注：对于一半的被试， Bl、 B2、 B3组分别与 B4、 B5、 B6组互换，即相容与相容任务顺序互换。 3 结果分析对原始数据进行处理，以任务性质（相容或不相容）为横坐标，反应时为纵坐标，绘制柱形图 3-1。图 3-1反应时与任务性质的关系图分别采用以下三种方法对 IAT的实验结果进行计算，并对其是否存在顺序效应进行检验： (1) 分别计算相容与不相容条件下的平均反应时，并计算两者的差值 mRT,计算结果如表 3-1 所示。对相容一不相容和不相容一相容两种顺序的被试的 mRT进行单因素方差分析，发现存在顺序效应，且非常显著（ F=7.656, p=.007)。表

14、 3-1方法一的实验结果实验顺序任务性质反时 / ms mRT / ms 相容一 +相容相容任务 +相容任务 594.70 832.36 237.66 +相容一相容相容任务 +相容任务 595.80 759.48 163.67 综合相容任务 +相容任务 595.24 796.45 201.20 (2) 将相容阈不相容条件下的反应时对数化（自然对数），并计算两者的差值 mLOG,计算结果如表 3-2所示。对相容一不相容和不相容一相容两种顺序的被试的 mLOG进行单因素方差分析，发现存在顺序效应 , 且显著（ F= =6.511， p=.013)。表 3-2方法二的实验

15、结果实验顺序任务性质反应时（对数化） mLOG 相容一 +相相容任务 6.36 0.30 容小相容任务 6.65 +相容一相相容任务 6.35 0.23 容小相容任务 6.57 综合相容任务 6.35 0.26 小相容任务 6.61 (3) 分别计算相容阈不相容条件下的平均反应时和两者的联合标准差，并计算两者对应的差值 mD,计算结果如表 3-3所示。对相容一不相容和不相容一相容两种顺序的被试的 mD进行单因素方差分析，发现不存在顺序效应（ F=1.039, p=.312)。表 3-3方法三的实验结果实验顺序 mRT / ms 标准差 mD 相容一 +相容 237.

16、66 100.71 2.36 +相容一相容 163.67 110.97 1.47 综合 201.2 158.10 1.27 以 50个 trials为一个区组，以区组为横坐标，以mD值为 IAT效应， IAT效应为纵坐标，绘制折线图，如图 3-2,研宄 IAT效应与练习增加的关系。对练习区组和实验顺序对 IAT效应进行重复测量的多因素方差分析，发现练习区组的效应显著 (F=5.426, p=.002 ),实验顺序的效应不显著 (F=1.601, p=.215),练习区组与实验顺序的交互作用也不显著（ F=1.055, p=.372)。内隐联合测验实验报告图 3-2 I AT效应

17、与练习增加的关系 4 讨论 4. 1分别比较上述三种计算方法的优缺点均数法是将不相容任务的平均反应时与相容任务的平均反应时相减，将其差值作为 IAT效应。这种计算方法具有计算简单方便快捷的优点，但是由他计算出的 I AT效应易受到顺序效应、联系效应、个体加工速度（年龄与反应速度）的影响。对数法是将反应时转化为自然对数，再将不相容任务的平均数减去相容任务的平均数，将其差值作为 IAT效应。由于反应时的分布是一种偏态分布，这种计算方法通过对数处理将反应时的分布正态化，这样可以使数据具有满意的方差稳定性。但这种方法依旧不能排除个体加工速度（年龄与反应速度）的影响。 D值法

18、是计算不相容与相容任务的平均反应时之差，然后除以两个任务上所有反应时的标准差，将其商作为 IAT效应。这种方法可以保持较高的内隐效应与外显主观测量结果的相关程度，而且比较稳定。同时，他能够显著的降低个体加工速度（年龄与反应速度）和先前测验经历对 IAT效应的影响。 4.2相容与不相容条件下的差值反映了被试的何种内隐态度？ IAT的基本原理如下：两个概念联系紧密，人们容易对其样例作一致反应，因此反应时较短；反过来，两个概念联系不紧密甚至存在冲突，人们不易对它们的样例作一致反应，因此反应时较长。 IAT 范式中包含两种条件，相容与不相容。相容条件下，向被试呈现的概念词与属

19、性词与被试的内隐认知结构一致，基于上述原理，反应时应该较短；不相容条件下则相反。人们在这两种条件下的反应时之差即反应了被试的内隐态度。即相容与不相容条件下反应时差值的正负和大小分别反应了被试对不同概念内隐认知层面的倾向和程度。本实验中通过三种计算方法获得的结果都显示，被试在相容任务中比不相容任务反应时更短，被试更倾向于将花卉类词汇与积极类词汇联系在一起，将昆虫类词汇与消极类词汇联系在一起。 4.3 IAT在研究被试的内隐态度方面有何优势？首先， IAT范式具有很强的适应性。由于 IAT 范式可以使用词汇或图形来表征绝大多数的概念，因此绝大多数内隐社会认知研宄领域都可以应

20、用 IAT。比如他可以用来测量各种内隐态度、各种刻板印象、内隐自尊和各种自我概念，而且还可以用来测量群体归属或社会认同。其次， IAT范式具有很高的稳定性。众多研宄都发现 IAT的 cx系数较高 .在 0.77 0.95之间，有文献（ GawroskiB., 2002)报告了德国被试对土耳其人和亚洲人内隐态度的 IAT测验的 a系数分别为 0.55和 0.56,可能是研宄中最低的一个（其外显测验的 ct系数也仅为0.61和 0.68),说明 IAT测验具有很好的内部一致性。同时， Greenwald等发现分别利用完整和不完整姓名作为客体材料的 IAT测验的相关为 0.8

21、5 (Greenwald etal.， 1998)，这说明 IAT测验平行测验的复本信度很高，高于其他的范式。 4.4 IAT的联网测试对未来心理学的大数据研究有何启示？以蔡华俭的 “ 中国人的自恋 ” 为例，可以得到如下启示：首先，由于中国世界第一的网民数量，联网测试收集来的大数据能够获得多样化、异质化的大样本，甚至极难获得的特异样本。拥有如此得天独厚的优势的未来心理学家可以极大地拓展研宄领域、验证未解的命题。其次，中国人正处在巨变的时代，极易变得迷茫，急需了解自己和他人，因此像 IAT 类的能够帮助被试了解自己和别人的实验会大受追捧。未来心理学可以向这个方向发展

22、，达到借时代潮流之势的目的。最后，应该利用大数据来研宄人类。因为通过网络收集来的大数据，由于参加者动机相对单纯，内隐联合测验实验报告能减少社会期许效应和其他动机性污染，而且没有主试的参与，减少实验者效应。因此大数据分析得来的结果更具有生态效度、更具有可推广性。 4.5进 _步分析实验数据，你还可以发现什么现象？对图 3-2进行分析，可以看出， IAT效应随练习的增加而减小，而且练习次数的变化对 IAT效应的影响显著。这说明 IAT测验中存在联系效应的系统误差。对表 3-1、 3-2、 3-3进行分析，可以发现在三种计算方法下，先相容任务后不相容任务的 IAT效应都

23、比先不相容任务后相容任务大，且差异显著。这说明 IAT测验中存在顺序效应，而且不相容任务在前会减小 IAT效应。综上，说明 IAT测验还存在进一步的改良空间。 5 结论本实验中通过三种计算方法，处理原始数据得到IAT效应值。获得的结果一致显示，被试在相容任务中比不相容任务反应时更短，即被试更倾向于将花卉类词汇与积极类词汇（比如关怀、自由、健康、喜爱等）联系在一起，将昆虫类词汇与消极类词汇（比如虐待、崩溃、污秽、谋杀等）联系在一起。参考文献 1 侯珂，邹泓，张秋凌 .内隐联想测验：信度、效度及原理 J. 心理科学进展， 2004， 12 (2):223-230 2 崔丽娟，

24、张高产 .内隐联结测验（ TAT)研究冋顾与展望 .心理科学， 2004， 27(1)： 161-164 3 杨治良，实验心理学 .浙江教育出版社， 1998:227-263 4 朱滢，实验心理学 .第 2版 .北京大学出版社， 2009:40-57 5 Greenwald A G, McGhee D E, Schwartz J L K. Measuring Individual Differences in Implicit Cognition: The Implicit Association Test. Journal of Personal and Social Psycholog

25、y, 1998, 74(6): 1464 1480 6 Gawronski B. What Does the Implicit Association Test Measure? A Test of the Convergent and Discriminate Validity of Prejudice-Related IATs. Experimental Psychology, 2002, 49(3): 171180 7 T. Talhelm et al., Large-Scale Psychological Differences Within China Explained by Ri

26、ce Versus Wheat Agriculture. Science 344, 603 (2014) 6 思考题如果要研究人们对单一事物（如日本、伊斯兰教）的内隐态度，应如何设计 IAT实验，实验中应注意哪些问题？因为经典 TAT实验不宜用来测量单一概念，因此使用 TAT实验的变式来解决这个问题。在本题中，最适用的范式为 Wigboldus IAT (WIAT)。在任务中，要求被试再看到积极的词和与日本或伊斯兰信仰有关的词（如艺伎或古兰经）时按左键，看到消极的词时按右键。第二个任务则要求被试看到积极的词按左键，看到消极的词和与日本或伊斯兰信仰有关的词按右键。如果被试在第一个任务上做得更好则说明对日本或伊斯兰态度比较积极，反之亦然。实验中应该注意选择同样字数的词语，避免被试通过字数来判断词语种类；要注意平衡顺序效应 ; 要注意练习效应。内隐联合测验实验报告

展开阅读全文