《第六章,方差分析.doc》由会员分享,可在线阅读,更多相关《第六章,方差分析.doc(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章,方差分析第六章 方差分析 第一节 Simple Factorial过程 6.1.1 主要功能 6.1.2 实例操作 第二节 General Factorial过程 6.2.1 主要功能 6.2.2 实例操作 第三节 Multivarite过程 6.3.1 主要功能 6.3.2 实例操作方差分析是R.A.Fister发明的用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响研究所得的数据呈现波动状造成波动的原因可分成两类一是不可控的随机因素另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小从而确定可控因素对研究结果影
2、响力的大小。 方差分析主要用于:1、均数差别的显著性检验2、分离各有关因素并估计其对总变异的作用3、分析因素间的交互作用4、方差齐性检验。 第一节 Simple Factorial过程6.1.1 主要功能 调用此过程可对资料进行方差分析或协方差分析。在方差分析中可按用户需要作单因素方差分析(其结果将与第五章第四节相同)或多因素方差分析(包括医学中常用的配伍组方差分析);当观察因素中存在有很难或无法人为控制的因素时则可对之加以指定以便进行协方差分析。 返回目录 返回全书目录 6.1.2 实例操作 例6-1下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据考虑到身高与肺活量有关而一般运动员
3、的身高高于大学生为进一步分析肺活量的差异是否由于体育锻炼所致试作控制身高变量的协方差分析。 运 动 员 大 学 生 身高 肺活量 身高 肺活量 184.9 167.9 171.0 171.0 188.0 179.0 177.0 179.5 187.0 187.0 169.0 188.0 176.7 179.0 183.0 180.5 179.0 178.0 164.0 174.0 4300 3850 4100 4300 4800 4000 5400 4000 4800 4800 4500 4780 3700 5250 4250 4800 5000 3700 3600 4050 168.7 17
4、0.8 165.0 169.7 171.5 166.5 165.0 165.0 173.0 169.0 173.8 174.0 170.5 176.0 169.5 176.3 163.0 172.5 177.0 173.0 3450 4100 3800 3300 3450 3250 3600 3200 3950 4000 4150 3450 3250 4100 3650 3950 3500 3900 3450 38506.1.2.1 数据准备 激活数据管理窗口定义变量名:组变量为group(运动员=1大学生=2)身高为x肺活量为y按顺序输入相应数值建立数据库结果见图6.1。 图6.1 原始数据
5、的输入6.1.2.2 统计分析 激活 Statistics 菜单选ANOVA Models中的Simple Factorial.项弹出Simple Factorial ANOVA对话框(图6.2)。在变量列表中选变量y点击钮使之进入Dependent框;选分组变量group点击钮使之进入Factor(s)框中, 并点击Define Range.钮在弹出的Simple Factorial ANOVA:Define Range框中确定分组变量group的起止值(1,2);选协变量x点击钮使之进入Covariate(s)框中。 图6.2 协方差分析对话框点击Options.框弹出Simple Fac
6、torial ANOVA:Options对话框。系统在协方差分析的方法(Method)上有三种选项: 1、Unique:同时评价所有的效应; 2、Hierarchical:除主效应外逐一评价各因素的效应; 3、Experimental:评价因素干预之前的主效应。 本例选Unique方法之后点击Continue钮返回Simple Factorial ANOVA对话框再点击OK钮即可。 6.1.2.3 结果解释 在结果输出窗口中可见如下统计数据: 先输出肺活量总均数和两组的肺活量均数总均数为4033.25运用员组均数为4399.00大学生组为3667.50。 接着协方差分析表明混杂因素_(身高)两
7、组间是有差异的(F=10.679P=0.002)控制其影响后两组间肺活量的差别依然存在(F=9.220P=0.004)故可以认为两组间肺活量的均数在消除了身高因素的影响之后仍有差别运动员的肺活量大于大学生即体育锻炼会提高肺活量。 最后系统输出公共回归系数= 36.002该值可用于求修正均数: = - ( - ) 本例为= 4399.00 - 36.002(178.175 - 174.3325)= 4260.6623 = 3667.50 - 36.002(170.49 - 174.3325)= 3805.8377Y by GROUP Total Population 4033.25 ( 40)G
8、ROUP 1 2 4399.00 3667.50 ( 20) ( 20) Y by GROUP with _ UNIQUE sums of squares All effects entered simultaneously Sum of Mean Sig Source of Variation Squares DF Square F of F Covariates 1630763 1 1630762.635 10.679 .002 _ 1630763 1 1630762.635 10.679 .002 Main Effects 1407847 1 1407847.095 9.220 .004
9、 GROUP 1407847 1 1407847.095 9.220 .004 Explained 6981685 2 3490842.568 22.860 .000 Residual 5649992 37 152702.496Total 12631678 39 323889.16740 cases were processed. 0 cases (.0 pct) were missing. Covariate Raw Regression Coefficient _ 36.002返回目录 返回全书目录第二节 General Factorial过程6.2.1 主要功能 调用此过程可对完全随机设
10、计资料、配伍设计资料、析因设计资料、正交设计资料等等进行多因素方差分析或协方差分析。 返回目录 返回全书目录6.2.2 实例操作 例6-2下表为三因素析因实验的资料请用方差分析说明不同基础液与不同血清种类对钩端螺旋体的培养计数的影响。 基础液 (A) 血清种类(B) 兔血清浓度(C) 胎盘血清浓度(C) 5 8 5 8 缓冲液 648 1246 1398 909 1144 1877 1671 1845 830 853 441 1030 578 669 643 1002 蒸馏水 1763 1241 1381 2421 1447 1883 1896 1926 920 709 848 574 933
11、 1024 1092 742 自来水 580 1026 1026 830 1789 1215 1434 1651 1126 1176 1280 1212 685 546 595 5666.2.2.1 数据准备 激活数据管理窗口定义变量名:基础液为base血清种类为sero血清浓度为pct钩端螺旋体的培养计数为_按顺序输入相应数值建立数据库。 6.2.2.2 统计分析 激活Statistics菜单选ANOVA Models中的General Factorial.项弹出General Factorial ANOVA对话框(图6.3)。在对话框左侧的变量列表中选变量x点击钮使之进入Dependent
12、 Variable框;选要控制的分组变量base、sero和pct点钮使之进入Factor(s)框中并分别点击Define Range钮在弹出的General Factorial ANOVA:Define Range对话框中确定各变量的起止值本例变量base的起止值为1、3变量sero的起止值为1、2变量pct的起止值为1、2。之后点击OK钮即可。 图6.3 析因方差分析对话框6.2.2.3 结果解释 在结果输出窗口中系统显示48个观察值进入统计三个因素按其各自水平共产生12种组合。 分析表明模型总效应的F值为10.55P值 单因素组间比较: A:基础液(BASE) F = 4.98P = 0
13、.012说明三种培养基培养钩体的计数有差别; B:血清种类(SERO) F = 61.265P C:血清浓度(PCT) F = 3.49P = 0.070说明两种血清浓度培养钩体的计数无差别。 两因素构成的一级交互作用: AB:基础液(BASE)血清种类(SERO) F = 5.16P = 0.011交互作用明显; BC:血清种类(SERO)血清浓度(PCT) F = 15.96P AC:基础液(BASE)血清浓度(PCT) F = 0.78P = 0.465交互作用不明显。 三因素构成的二级交互作用: ABC:基础液(BASE)血清种类(SERO)血清浓度(PCT) F = 6.75P =
14、0.003交互作用明显。 48 cases accepted. 0 cases rejected because of out-of-range factor values. 0 cases rejected because of missing data. 12 non-empty cells. 1 design will be processed. - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Univariate Homogeneity of Variance Tests Variabl
15、e . _ Cochrans C(3,12) = .34004, P = .036 (approx.) Bartlett-Box F(11,897) = 1.69822, P = .069 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - _ _ _ _ _ _ A n a l y s i s o f V a r i a n c e - design 1 _ _ _ _ _ _ Tests of Significance for _ using UNIQUE sums of squares Sou
16、rce of Variation SS DF MS F Sig of F WITHIN+RESIDUAL 2459233.75 36 68312.05 BASE 679967.38 2 339983.69 4.98 .012 PCT 238713.02 1 238713.02 3.49 .070 SERO 4184873.52 1 4184873.5 61.26 .000 BASE BY PCT 107005.54 2 53502.77 .78 .465 BASE BY SERO 705473.04 2 352736.52 5.16 .011 PCT BY SERO 1089922.69 1
17、1089922.7 15.96 .000 BASE BY PCT BY SERO 922307.37 2 461153.69 6.75 .003 (Model) 7928262.56 11 720751.14 10.55 .000 (Total) 10387496.31 47 220.56R-Squared = .763 Adjusted R-Squared = .691返回目录 返回全书目录第三节 Multivarite过程6.3.1 主要功能 调用此过程可进行多元方差分析。此外对于一元设计如涉及混合模型的设计、分割设计(又称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等此过
18、程均能适用。 返回目录 返回全书目录6.3.2 实例操作 例6-3甲地区为大城市乙地区为县城丙地区为农村。某地分别调查了上述三类地区8岁男生三项身体生长发育指标:身高、体重和胸围数据见下表问:三类地区之间男生三项身体生长发育指标的差异有无显著性?学生编号 甲地区 乙地区 丙地区 身高 体重 胸围 身高 体重 胸围 身高 体重 胸围 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 119.80 121.70 121.40 124.40 120.00 117.00 118.10 118
19、.80 124.20 124.90 124.70 123.00 125.30 124.20 127.40 128.20 126.10 128.70 129.50 126.90 126.50 128.20 131.40 130.80 133.90 130.40 131.30 130.20 136.00 141.00 22.60 21.50 19.10 21.80 21.40 20.10 18.80 22.00 21.30 24.00 23.30 22.50 22.90 19.50 22.90 22.30 22.70 23.50 24.50 25.50 25.00 26.10 27.90 26.8
20、0 27.20 24.40 24.40 23.00 26.30 31.90 60.50 55.50 56.50 60.50 57.70 57.00 57.10 61.70 58.40 60.80 60.00 60.00 65.20 53.80 59.50 60.00 57.40 60.40 51.00 61.50 63.90 63.00 63.10 61.50 65.80 62.60 59.50 62.60 60.00 63.70 125.10 127.00 125.70 114.90 124.90 117.60 124.20 117.90 120.40 115.00 126.20 125.1
21、0 114.90 121.50 114.00 118.70 120.60 122.90 119.60 112.30 121.30 121.20 120.20 120.30 120.00 123.30 122.10 123.30 109.90 125.60 23.00 21.50 23.40 17.50 23.50 18.90 20.80 20.30 20.00 19.70 21.20 22.10 19.70 22.00 19.00 19.10 20.00 18.50 19.50 20.00 20.00 21.20 23.10 21.00 22.20 20.10 21.00 21.50 17.8
22、0 23.30 62.00 59.00 61.50 52.50 58.50 57.00 58.50 61.00 56.00 56.50 56.50 58.50 56.00 57.00 54.50 54.50 55.50 56.00 59.50 58.00 58.00 59.00 59.50 59.50 59.50 56.50 57.50 61.00 56.50 60.50 118.30 121.30 121.80 124.20 123.50 123.00 134.90 123.70 105.20 112.20 118.60 112.00 121.50 124.50 119.50 122.50
23、115.50 122.50 124.50 125.00 117.50 127.30 122.30 121.30 120.50 116.00 120.50 114.50 131.00 122.50 20.40 20.00 26.60 22.10 23.20 22.90 32.30 22.70 20.20 20.80 21.00 23.20 24.00 21.50 20.50 23.00 19.00 22.50 25.00 25.50 23.00 22.50 22.00 21.00 22.00 19.00 20.00 19.00 25.50 24.50 54.40 54.30 61.10 58.6
24、0 60.20 58.20 64.80 59.90 54.50 57.50 57.60 58.20 60.30 55.60 55.50 56.70 54.20 57.60 57.90 60.30 59.00 58.90 58.20 55.60 55.10 53.50 54.40 53.40 58.30 58.706.3.2.1 数据准备 激活数据管理窗口定义变量名:地区为G身高为_1体重为_2胸围为_3按顺序输入相应数值变量G的数值是:甲地区为1乙地区为2丙地区为3。 6.3.2.2 统计分析 激活Statistics菜单选ANOVA Models中的Multivarite.项弹出Multiv
25、arite ANOVA 对话框(图6.8)。首先指定供分析用的变量x1、x2、x3故在对话框左侧的变量列表中选变量x1、x2、x3点击钮使之进入Dependent Variable框;然后选变量g(分组变量)点击钮使之进入Factor(s)框中并点击Define Range钮确定g的起始值和终止值。 图6.4 多元方差分析对话框点击Options.钮弹出Multivarite ANOVA:Options对话框选择需要计算的指标。在Factor(s)栏内选变量g点击钮使之进入Display Means for框要求计算平均值指标;在Matriced Within Cell栏内选Correlati
26、on、Covariance、SSCP项要求计算单元内的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Error Matrices栏内也选上述三项要求计算误差的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Diagnostics栏内选Homogeneity test项要求作变量的方差齐性检验。之后点击Continue钮返回Multivarite ANOVA对话框最后点击OK钮即可。 6.3.2.3 结果解释 在结果输出窗口中将看到如下分析结果: 系统首先显示共90个观察值进入统计分析因分组变量g为三个地区故分析的单元数为3。然后输出3个应变量(x1、x2、x3)的方差齐性检验结果
27、分别输出了Cochran C检验值及其显著性水平P值、Bartlett-Box F检验值及其显著性水平P值。其中 身高:C = 0.39825P = 0.540;F = 1.01272P = 0.363; 体重:C = 0.43787P = 0.227;F = 4.48624, P = 0.011; 胸围:C = 0.47239, P = 0.089;F = 2.06585, P = 0.127; 可见3项指标的方差基本整齐(P值均大于0.05)。 90 cases accepted. 0 cases rejected because of out-of-range factor values
28、. 0 cases rejected because of missing data. 3 non-empty cells.1 design will be processed.CELL NUMBER 1 2 3 Variable G 1 2 3Univariate Homogeneity of Variance Tests Variable . _1 Cochrans C(29,3) = .39825, P = .540 (approx.) Bartlett-Box F(2,17030) = 1.01272, P = .363 Variable . _2 Cochrans C(29,3) =
29、 .43787, P = .227 (approx.) Bartlett-Box F(2,17030) = 4.48624, P = .011 Variable . _3 Cochrans C(29,3) = .47239, P = .089 (approx.) Bartlett-Box F(2,17030) = 2.06585, P = .127Cochran C检验和Bartlett-Box F检验对考查协方差矩阵的相等性比较方便但还不够。于是系统接着分别输出了三类地区(即各个单元)各生长发育指标的离均差平方和交叉乘积矩阵和方差协方差矩阵。之后作Box M检验Box M检验提供矩阵一致性的
30、多元测试本例Boxs M = 36.93910在基于方差分析的显著性检验中F = 2.92393;在基于2的显著性检验中2 = 35.09922, 两者P 1、Pillai轨迹:V = 2、Wilks 值:W = 3、Hotelling轨迹:T = 4、Roy最大根:R = 式中max为最大特征值, i为第i个特征值,s为非零特征值个数。根据这些值变换的F检验均有显著性(P _1: SS = 662.88356, F = 12.16335 _2: SS = 121.56200, F = 10.04439 _3: SS = 114.90200, F = 7.49893 差别均有显著性说明三项生长
31、发育指标各地区间的差别均有显著性。 bined Observed Means for G Variable . _1 G 1 WGT. 126.46667 UNWGT. 126.46667 2 WGT. 120.52000 UNWGT. 120.52000 3 WGT. 120.92000 UNWGT. 120.92000 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable . _2 G 1 WGT. 23.50667 UNWGT. 23.50667 2 WGT. 20.69667
32、 UNWGT. 20.69667 3 WGT. 22.49667 UNWGT. 22.49667 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable . _3 G 1 WGT. 60.00667 UNWGT. 60.00667 2 WGT. 57.86667 UNWGT. 57.86667 3 WGT. 57.41667 UNWGT. 57.41667 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
33、 - - - - WITHIN+RESIDUAL Correlations with Std. Devs. on Diagonal _1 _2 _3 _1 5.220 _2 .747 2.460 _3 .490 .713 2.768 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Statistics for WITHIN+RESIDUAL correlations Log(Determinant) = .00000 Bartlett test of sphericity = . with 3
34、D. F. Significance = . F(max) criterion = 4.50308 with (3,87) D. F.WITHIN+RESIDUAL Variances and Covariances _1 _2 _3 _1 27.249 _2 9.599 6.051 _3 7.086 4.852 7.661 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - WITHIN+RESIDUAL Sum-of-Squares and Cross-Products _1 _2 _3 _1
35、2370.683 _2 835.081 526.458 _3 616.497 422.147 666.527 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - EFFECT . G Adjusted Hypothesis Sum-of-Squares and Cross-Products _1 _2 _3 _1 662.884 _2 230.323 121.562 _3 269.117 78.193 114.902 - - - - - - - - - - - - - - - - - - - - -
36、 - - - - - - - - - - - - - - - - Multivariate Tests of Significance (S = 2, M = 0, N = 41 1/2) Test Name Value Approx.F Hypoth. DF Error DF Sig. of F Pillais .51227 9.87080 6.00 172.00 .000 Hotellings .70427 9.85978 6.00 168.00 .000 Wilks .55014 9.86643 6.00 170.00 .000 Roys .31265 Note. F statistic
37、 for WILKS Lambda is exact. - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - EFFECT . G (Cont.) Univariate F-tests with (2,87) D. F. Variable Hypoth. SS Error SS Hypoth. MS Error MS F Sig. of F _1 662.88356 2370.68267 331.44178 27.24923 12.16335 .000 _2 121.56200 526.45800 6
38、0.78100 6.05124 10.04439 .000 _3 114.90200 666.52700 57.45100 7.66123 7.49893 .001之后按单元输出各项指标的观察值均数(Obs.Mean)、调整均数(Adj.Mean)、估计均数(Est.Mean)、粗误差(Raw Resid)、标准化误差(Std.Resid)以及不分地区的总均数(ined Adjusted Means for G)。 Adjusted and Estimated Means Variable . _1 CELL Obs. Mean Adj. Mean Est. Mean Raw Resid. S
39、td. Resid. 1 126.467 126.467 126.467 .000 .000 2 120.520 120.520 120.520 .000 .000 3 120.920 120.920 120.920 .000 .000 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Adjusted and Estimated Means (Cont.) Variable . _2 CELL Obs. Mean Adj. Mean Est. Mean Raw Resid. Std. Resid
40、. 1 23.507 23.507 23.507 .000 .000 2 20.697 20.697 20.697 .000 .000 3 22.497 22.497 22.497 .000 .000 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Adjusted and Estimated Means (Cont.) Variable . _3 CELL Obs. Mean Adj. Mean Est. Mean Raw Resid. Std. Resid. 1 60.007 60.007
41、60.007 .000 .000 2 57.867 57.867 57.867 .000 .000 3 57.417 57.417 57.417 .000 .000 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - bined Adjusted Means for G Variable . _1 G 1 UNWGT. 126.46667 2 UNWGT. 120.52000 3 UNWGT. 120.92000 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable . _2 G 1 UNWGT. 23.50667 2 UNWGT. 20.69667 3 UNWGT. 22.49667 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable . _3 G 1 UNWGT. 60.00667 2 UNWGT. 57.8