《(08)第8章方差分析(T8)ppt课件(完整版).pptx》由会员分享,可在线阅读,更多相关《(08)第8章方差分析(T8)ppt课件(完整版).pptx(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、(08)第8章 方差分析(T8)ppt课件(完整版)8 - 2统计学(第 8 版)贾俊平2022-5-192022-5-19统 计 学 ( (第第8 8版版) )8 - 3统计学(第 8 版)贾俊平2022-5-192022-5-198 - 4统计学(第 8 版)贾俊平2022-5-192022-5-19 方差分析的步骤方差分析的步骤思维导图思维导图方差分析方差分析单因子方差分析提出假设:因子效应不显著效应检验F 检验效应量分析R 方多重比较LSD 方法HSD 方法双因子方差分析提出假设:因子A 效应不显著因子B 效应不显著交互效应不显著效应检验F 检验效应量分析多重R 方多重比较LSD 方法
2、HSD 方法方差分析的假定及其检验正态性检验图示法P-P图或Q-Q图检验法检验S-W和K-S检验方差齐性检验图示法残差图检验法莱文检验独立性检验A实验单元B因子C效应8 - 5统计学(第 8 版)贾俊平2022-5-192022-5-19不同运动队的平均成绩之间是否有显著差 思考以下问题思考以下问题组组韩国韩国( (金牌金牌) )中国中国( (银牌银牌) )法国法国( (铜牌铜牌) )1 19 99 99 99 97 710107 78 87 78 89 9101010108 88 87 78 89 92 2101010109 99 98 810108 88 810109 99 910109
3、99 99 99 99 98 83 3101010108 810109 910109 98 810109 99 910108 87 79 99 98 88 84 49 99 910109 910109 910108 8101010109 910109 910109 99 98 88 88 - 6统计学(第 8 版)贾俊平2022-5-192022-5-19 方差分析的基本原理 方差分析的原理方差分析的原理什么是方差分析什么是方差分析(ANOVA)(ANOVA)l方差分析是在20世纪20年代由英国统计学家Ronald A.Fisher在进行实验设计时为解释实验数据而首先引入的 l分析类别自变量对
4、数值因变量影响的一种统计方法 l研究分类型自变量对数值型因变量的影响 一个或多个分类自变量;两个或多个 (k 个) 处理水平或分类一个数值型因变量l有单因子方差分析和双因子方差分析单因子方差分析:涉及一个分类的自变量双因子方差分析:涉及两个分类的自变量【例例8-18-1】一家超市连锁店进行一项研究,想确定超市所在的位置和竞争者的数量对销售额是否有显著影响,将超市位置按居民区、商业区和写字楼分成三类,并在不同位置分别随机抽取3家超市,竞争者数量按零个、一个、二个和三个及以上分成四类,获得的年销售额数据(单位:万元)竞争者数量(竞争者数量(B B)零个零个一个一个二个二个三个及以上三个及以上超超市
5、市位位置置(A)(A)居民区居民区265265290290445445430430310310350350480480428428220220300300500500530530商业区商业区410410380380590590470470305305310310480480415415450450390390510510390390写字楼写字楼1801802202202902902462462902901701702832832752753303302562562602603203208 - 7统计学(第 8 版)贾俊平2022-5-192022-5-19 方差分析的原理方差分析的原理误差分解
6、误差分解l总误差总误差(total error)反映全部观测数据的误差所抽取的全部30个地块的产量之间差异l处理误差处理误差(treatment error)组间误差(between-group error)由于不同处理造成的误差,它反映了处理(品种)对观测数据(产量)的影响,因此称为处理效应(treatment effect)l随机误差随机误差(random error)组内误差(within-group error)由于随机因子造成的误差,也简称为误差(error) l数据的误差用平方和(sum of squares)表示,记为SSl总平方和(sum of squares for tota
7、l),记为SST反映全部数据总误差大小的平方和l处理平方和(treatment sum of squares),记为SSA反映处理误差大小的平方和也称为组间平方和(between-group sum of squares)l误差平方和(sum of squares of error),记为SSE反映随机误差大小的平方和称为误差平方和也称为组内平方和(within-group sum of squares) 方差分析的基本原理8 - 8统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析单因子方差分析数学模型数学模型l数据的误差用平方和(sum of squares),
8、记为SSl总平方和(sum of squares for total),记为SST反映全部数据总误差大小的平方和l设因子A有I种处理(比如品种有“品种1”、“品种2”、“品种3”3种处理),单因子方差分析可用下面的线性模型来表示 单因子方差分析8 - 9统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析效应检验效应检验提出假设提出假设8 - 10统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析方差分析表方差分析表误差来源误差来源平方和平方和SSSS自由度自由度dfdf均方均方M
9、SMS检验统计量检验统计量F F处理效应处理效应误差误差总效应总效应8 - 11统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析效应检验效应检验例题分析例题分析SPSSSPSS实现实现将表将表8-18-1的数据转化为的数据转化为SPSSSPSS所需的数据格式所需的数据格式第第1 1步:步:选择【数据】【重构】【将选定变量重构为个案】。点击【下一步】。第2步:在弹出的对话框【您希望重构多少个变量组?】中选择【一个】。点击【下一步】。第第3 3步:步:在弹出的对话框中,将各超市位置选入【目标变量】,并将目标变量名称修改为“销售额”,在【使
10、用个案号】下选择【无】。点击【下一步】。第第4 4步:步:在弹出的对话框【您希望创建多少个索引变量?】中选择【一个】。点击【下一步】。 第第5 5步:步:在弹出的对话框【索引值是什么类型?】下选择【变量名】,将【名称】下的“索引1”改为“竞争者数量”。点击【完成】(结果如表8-4 所示)8 - 12统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析效应检验效应检验例题分析例题分析SPSSSPSS输出输出【例例8-28-2】SPSSSPSS输出输出描述统计量(供参考)描述统计量(供参考)方差分析表(用于决策)方差分析表(用于决策)8 -
11、13统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析效应检验效应检验例题分析例题分析SPSSSPSS输出输出【例例8-28-2】SPSSSPSS输出输出参数估计参数估计均值图均值图8 - 14统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析多重比较多重比较Fisher Fisher 的的 LSDLSD方法方法lL S D 是 最 小 显 著 差 异 ( l e a s t significant difference)的缩写,由统计学家Fisher提出来的,因此也称为Fish
12、er的最小显著差异方法,简称LSD方法lLSD的适用场合:如果研究者在事先就已经计划好要对某对或某几对均值进行比较,不管方差分析的结果如何(拒绝或不拒绝原假设),都要进行比较,这时适合采用LSD方法8 - 15统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析多重比较多重比较Fisher Fisher 的的 LSDLSD方法方法8 - 16统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析多重比较多重比较Tukey-Kramer Tukey-Kramer 的的 HSD HSD方法
13、方法lHSD是真实显著差异(honestly significant difference)的缩写,因此也被称为真显著差异方法l该检验方法是由Jone W.Tukey于1953年提出的,因此也被称为Tukey的HSD方法。由于Tukey的HSD方法要求各处理的样本量相同,当各处理的样本量不相同时,该方法就不再适用。20世纪50年代中期,对Tukey的HSD方法做了一些修正,从而使其适用于样本量不同的情形。修正后的HSD检验称为Tukey-Kramer方法,简称为Tukey-Kramer的HSD方法l该方法的适用场合是:研究者事先并未计划进行多重比较,只是在方差分析决绝原假设后,才需要对任意两个
14、处理的均值进行比较,这时采用HSD方法比较合适8 - 17统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析多重比较多重比较Tukey-Kramer Tukey-Kramer 的的 HSD HSD方法方法8 - 18统计学(第 8 版)贾俊平2022-5-192022-5-19 单因子方差分析 单因子方差分析单因子方差分析多重比较多重比较例题分析例题分析SPSSSPSS输出输出【例例8-38-3】和和【例例8-38-3】【例8-2】的数据SPSS输出8 - 19统计学(第 8 版)贾俊平2022-5-192022-5-19 双因子方差分
15、析 双因子方差分析双因子方差分析数学模型数学模型l分析两个因子(因子A和因子B)对实验结果的影响 l如果两个因子对实验结果的影响是相互独立的,分别判断因子A和因子B对实验数据的单独影响,这时的双因子方差分析称为只考虑主效应的双因子方差分析或无重复双因子方差分析(Two-factor without replication)l如果除了因子A和因子B对实验数据的单独影响外,两个因子的搭配还会对结果产生一种新的影响,这时的双因子方差分析称为考虑交互效应的双因子方差分析或可重复双因子方差分析 (Two-factor with replication)l设因子A有I种处理因子B有J种处理双因子方差分析可
16、用下面的线性模型来表示 8 - 20统计学(第 8 版)贾俊平2022-5-192022-5-19 双因子方差分析 双因子方差分析双因子方差分析主效应分析主效应分析误差分解误差分解8 - 21统计学(第 8 版)贾俊平2022-5-192022-5-19 双因子方差分析 双因子方差分析双因子方差分析主效应分析主效应分析方差分析表方差分析表误差来源误差来源平方和平方和SSSS自由度自由度dfdf均方均方MSMS检验统计量检验统计量F F因子因子A A的的处理效应处理效应SSA因子因子B B的的处理效应处理效应SSB误差误差SSE总效应总效应SSTSST8 - 22统计学(第 8 版)贾俊平202
17、2-5-192022-5-19 双因子方差分析 双因子方差分析双因子方差分析主效应分析主效应分析例题分析例题分析SPSSSPSS输出输出8 - 23统计学(第 8 版)贾俊平2022-5-192022-5-19 双因子方差分析 双因子方差分析双因子方差分析主效应分析主效应分析例题分析例题分析SPSSSPSS输出输出【例【例8-58-5】效应经验参数估计8 - 24统计学(第 8 版)贾俊平2022-5-192022-5-19 双因子方差分析 双因子方差分析双因子方差分析主效应分析主效应分析例题分析例题分析SPSSSPSS输出输出【例【例8-58-5】主效应均值图8 - 25统计学(第 8 版)
18、贾俊平2022-5-192022-5-19 双因子方差分析 双因子方差分析双因子方差分析交互效应分析交互效应分析误差分解误差分解SSASSASSBSSBSSABSSABSSESSE8 - 26统计学(第 8 版)贾俊平2022-5-192022-5-19 双因子方差分析 双因子方差分析双因子方差分析交互效应分析交互效应分析例题分析例题分析8 - 27统计学(第 8 版)贾俊平2022-5-192022-5-19 双因子方差分析 双因子方差分析双因子方差分析交互效应分析交互效应分析例题分析例题分析 【例【例86】交互均值图8 - 28统计学(第 8 版)贾俊平2022-5-192022-5-19
19、 方差分析的假定及其检验 方差分析的假定及其检验方差分析的假定及其检验l正态性正态性(normality)(normality)。每个总体都应服从正态分布,即对于因子的每一个水平,其观测值是来自正态分布总体的简单随机样本在例81中,要求每个品种的产量必须服从正态分布检验总体是否服从正态分布的方法有很多,包括对样本数据作直方图、茎叶图、箱线图、正态概率图做描述性判断,也可以进行非参数检验等 l方差齐性方差齐性(homogeneity variance)(homogeneity variance)。各个总体的方差必须相同,对于分类变量的个水平,有12=22=k2在例81中,要求不同品种的产量的方差
20、都相同l独立性独立性(independence)(independence)。每个样本数据是来自因子各水平的独立样本(该假定不满足对结果影响较大)在例81中,3个样本数据是来自不同品种的3个独立样本8 - 29统计学(第 8 版)贾俊平2022-5-192022-5-19 方差分析的假定及其检验 方差分析的假定方差分析的假定正态性检验正态性检验图示法图示法例题分析例题分析l当每个处理的样本量足够大时,可以对每个样本绘制正态概率图来检查每个处理对应的总体是否服从正态分布l当每个处理的样本量比较小时,正态概率图中的点很少,提供的正态性信息很有限。这时,可以将每个处理的样本数据合并绘制一个正态概率图
21、来检验正态性【例例8-78-7】沿用例8-1。绘制正态P-P图,检验不同位置的销售额是否服从正态分布。数据合并后的正态数据合并后的正态P P图图8 - 30统计学(第 8 版)贾俊平2022-5-192022-5-19 方差分析的假定及其检验 方差分析的假定方差分析的假定正态性检验正态性检验检验法检验法l当样本量较小时,正态概率图的应用就会受到很大限制,这时可以使用标准的统计检验,如夏皮洛-威尔克(Shapiro-Wilk)检验(简称S-W检验)和柯尔莫戈洛夫-斯米诺夫(Kolmogorov-Smirnov)检验(简称K-S检验)等l这些检验的原假设是因变量服从正态分布。如果检验获得的P值小于
22、指定的显著性水平,则拒绝原假设,表明总体不服从正态分布,如果P值较大不能拒绝原假设时,可以认为总体满足正态分布l由于这些检验对正态性的轻微偏离是敏感的,检验往往会导致拒绝原假设。而方差分析对正态性的要求则相对比较宽松,当正态性略微不满足时,对分析结果的影响不是很大l实际中应谨慎使用这些检验(有关这些检验的详细信息请参见第6章。)8 - 31统计学(第 8 版)贾俊平2022-5-192022-5-19 方差分析的假定及其检验 方差分析的假定方差分析的假定正态性检验正态性检验检验法检验法例题分析例题分析8 - 32统计学(第 8 版)贾俊平2022-5-192022-5-19 方差分析的假定及其
23、检验 方差分析的假定方差分析的假定方差齐性检验方差齐性检验图示法图示法l方差齐性(homogeneity variance)。假定各个总体的方差必须相同,即:12=22=I2l检验方差齐性方法:图示法和检验法检验方差齐性的图形有箱线图和残差图等Bartlett方差齐性检验和Levene方差齐性检验 残差图残差图8 - 33统计学(第 8 版)贾俊平2022-5-192022-5-19 方差分析的假定及其检验 方差分析的假定方差分析的假定方差齐性检验方差齐性检验LeveneLevene检验检验【例【例8-98-9】沿用例8-1。以超市位置的单因子方差分析为例,用莱文方差齐性检验方法检验各位置超市
24、的销售额是否满足方差齐性。(=0.05)8 - 34统计学(第 8 版)贾俊平2022-5-192022-5-19 实验设计初步 实验设计初步实验设计初步完全随机化设计完全随机化设计例题分析例题分析l“处理”被随机地指派给实验单元的一种设计“处理”是指可控制的因素的各个水平“实验单元(experiment unit)”是接受“处理”的对象或实体l在实验性研究中,感兴趣的变量是明确规定的,因此,研究中的一个或多个因素可以被控制,使得数据可以按照因素如何影响变量来获取l完全随机化设计除符合“随机化”要求外,还必须符合“可重复性”原则,重复重复(replication)是指在一个实验中每个实验条件都
25、可以“复制”【例【例8-10】一家种业开发股份公司研究出3个新的小麦品种:品种1、品种2、品种3。公司需要分析不同品种对产量的影响。为此需要选择一些地块,在每个地块种上不同的品种,然后获得产量数据,进而分析小麦品种对产量的影响是否显著品种品种1 1品种品种2 2品种品种3 33683683863863513513493493833833483483513513703703363363423423573573313318 - 35统计学(第 8 版)贾俊平2022-5-192022-5-19 实验设计初步 实验设计初步实验设计初步完全随机化设计完全随机化设计例题分析例题分析【例【例8-10】数据
26、分析l分析完全随机化设计数据的方法就是单因子方差分析l由于显著性为0.009=0.05,表示小 麦 品 种 对 产 量 影 响 显 著 。R2=0.652,表示品种因子解释了产量误差的65.18%,其余的34.82%可以看作是随机因子的影响8 - 36统计学(第 8 版)贾俊平2022-5-192022-5-19 实验设计初步 实验设计初步实验设计初步随机化区组设计随机化区组设计例题分析例题分析l先按一定规则将实验单元划分为若干同质组,称为“区组(block)”l再将各种处理随机地指派给各个区组比如在上面的例子中,首先根据土壤的好坏分成几个区组,假定分成4个区组:区组1、区组2、区组3、区组4
27、,每个区组中有三个地块在每个区组内的3个地块以抽签的方式决定所种的小麦品种l分组后再将每个品种(处理)随机地指派给每一个区组的设计就是随机化区组设计l实验数据采用无主效应方差分析【例【例8-11】假定对3个小麦品种通过随机化区组设计后,得到的数据如表8-21所示。分析小麦品种的产量的影响是否显著区组区组1 1区组区组2 2区组区组3 3区组区组4 4品种品种1 1355355349349341341337337品种品种2 2377377369369361361356356品种品种3 33493493463463313313393398 - 37统计学(第 8 版)贾俊平2022-5-192022-5-19 实验设计初步 实验设计初步实验设计初步随机化区组设计随机化区组设计例题分析例题分析【例【例8-11】SPSS输出输出由于检验“品种”的显著性水平为0.000=0.05,没有证据表明小麦品种与施肥方式的搭配对产量有显著影响8 - 40统计学(第 8 版)贾俊平2022-5-192022-5-19 THANKS THE END2022-5-19 THE END THANKS避免检验过分