《双因素方差分析.ppt》由会员分享,可在线阅读,更多相关《双因素方差分析.ppt(24页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第 八八 章章 方差分析和回归分析方差分析和回归分析 在工农业生产中产量的高低、质量的优劣,经济管理中效果在工农业生产中产量的高低、质量的优劣,经济管理中效果的好坏等,往往是由许多因素所至。这就要从众多因素中找出的好坏等,往往是由许多因素所至。这就要从众多因素中找出主要因素,分析该因素处在何种状态时,使产量高、质量优、主要因素,分析该因素处在何种状态时,使产量高、质量优、管理效果好。管理效果好。要解决这类问题:要解决这类问题:一、设计一个试验(试验设计);一、设计一个试验(试验设计);二、如何分析多因素多状态下试验结果的差异性?二、如何分析多因素多状态下试验结果的差异性?当两个总体方差相等时
2、,可用当两个总体方差相等时,可用 t 检验来检验两个总体均值间检验来检验两个总体均值间的差异性;当总体是三个或三个以上时如何检验呢?就要用本的差异性;当总体是三个或三个以上时如何检验呢?就要用本章的方差分析。它是在二十世纪章的方差分析。它是在二十世纪20 年代由英国著名统计学家年代由英国著名统计学家R.Fisher首先应用到农业试验中的。首先应用到农业试验中的。由于试验设计不同,方差分析的方法也有所不同。本章重点由于试验设计不同,方差分析的方法也有所不同。本章重点介绍单、双因素方差分析。介绍单、双因素方差分析。方差分析的作用:方差分析的作用:从方差的角度分析试验数据、判断各因素从方差的角度分析
3、试验数据、判断各因素各状态对试验结果影响大小。各状态对试验结果影响大小。例例1 检验某种激素对羊羔增重的效应。选用检验某种激素对羊羔增重的效应。选用3个剂量进行试验,个剂量进行试验,加上对照(不用激素)在内,每次试验要用加上对照(不用激素)在内,每次试验要用4只羊羔,若进行只羊羔,若进行4次重复,则共需要次重复,则共需要16只羊羔。研究激素用量对羊羔增重的影响只羊羔。研究激素用量对羊羔增重的影响是否显著。是否显著。羊羔的增重(kg/每头/每200日)试试验验中中,我我们们所所关关心心的的指指标标,即即羊羊羔羔的的增增重重数数量量,称称为为试试验验指指标标或或响响应应值值;影影响响增增重重数数量
4、量(响响应应值值)的的指指标标是是激激素素,称称为为因因素素;激激素素用用量量(因因素素的的状状态态)称称为为因因素素的的水水平平或或简简称称水水平平。本例中有本例中有1个因素,个因素,4个水平,故称为个水平,故称为单因素试验单因素试验。几个概念几个概念 处理处理 重复重复1(对照对照)234147505754252545365362676974451575759 在方差分析中,通常取在方差分析中,通常取1-3个个因素因素进进行研究。因素的每一个状行研究。因素的每一个状态态称称为为一个水平,一个水平,水平可以是数量化的,也可以是定性的水平可以是数量化的,也可以是定性的。例例1为单因素四水平试验
5、。也就是四个总体的比较问题。为单因素四水平试验。也就是四个总体的比较问题。本例中有一因素本例中有一因素(激素激素,记为记为A)四个不同水平四个不同水平(分别记为分别记为A1,A2,A3,A4)。可认为一个激素水平的增重量就是一个总体,在方差分。可认为一个激素水平的增重量就是一个总体,在方差分析中总假定析中总假定各总体独立地服从同方差的正态分布各总体独立地服从同方差的正态分布,即第,即第j个激素水个激素水平的增重量是一个随机变量,它服从分布平的增重量是一个随机变量,它服从分布N(j,2)i=1,2,3,4.要检验假设要检验假设 若拒绝若拒绝H0,我们就认为这四个激素水平的平均增重量之间有显,我们
6、就认为这四个激素水平的平均增重量之间有显著差异;反之,就认为各激素水平间增重量的不同是由随机因素著差异;反之,就认为各激素水平间增重量的不同是由随机因素引起的。引起的。方差分析是检验同方差的若干正态母体均值是否相等的一种统方差分析是检验同方差的若干正态母体均值是否相等的一种统计分析方法。计分析方法。1.1.单因素方差分析单因素方差分析 例例2 一批由同种原料织成的同一种布,用不同染整工艺处理,一批由同种原料织成的同一种布,用不同染整工艺处理,然后进行缩水率试验,考察染整工艺对缩水率的影响,在其它条然后进行缩水率试验,考察染整工艺对缩水率的影响,在其它条件尽可能相同时,测得缩水率(件尽可能相同时
7、,测得缩水率(%)如下表。)如下表。水平水平 重复重复A1 A2A3A4A514.3(x11)6.1(x12)6.5(x13)9.3(x14)9.5(x15)27.8(x21)67.3(x22)8.3(x23)8.7(x24)8.8(x25)33.3(x31)4.2(x32)8.6(x33)7.2(x34)11.4(x35)46.5(x41)4.1(x42)8.2(x42)10.1(x44)7.8(x45)由于由于xijN(j,2),所以假定所以假定xij具有下述数据结构式:具有下述数据结构式:其中其中 ijN(j,2)且相互独立。且相互独立。要检验的假设是:要检验的假设是:一般地,一般地,设
8、单设单因素因素试验试验中,中,因素因素A有有k个水平个水平(总总体体),记为记为A1,A2,Ak,相,相应应的响的响应值应值(试验结果)试验结果)X1,X2,Xk 是是 k个相互独立的总体,且个相互独立的总体,且XjN(j,2)(j=1,2,k)。)。今今对对第第j个个总总体体进进行行nj次重复次重复观测观测,得到得到nj个观测数据个观测数据xij(i=1,2,nj),这可以看成是取自),这可以看成是取自Xj的一个容量为的一个容量为nj的样本。的样本。这里,并不要求这里,并不要求n1,n2,nk完全相同。完全相同。观测数据及计算列表如下。观测数据及计算列表如下。单因素方差分析数据及计算表单因素
9、方差分析数据及计算表 由于由于xijN(j,2),所以假定所以假定xij具有下述数据结构式:具有下述数据结构式:其中其中 ijN(0,2)且相互独立。且相互独立。要检验的假设是:要检验的假设是:为了方便起见,把参数的形式改变,并记为了方便起见,把参数的形式改变,并记 称称为一般平均,为一般平均,j为因素为因素A的第的第j个水平个水平Aj的效应,容易看出,的效应,容易看出,k个效应满足关系式:个效应满足关系式:单因子方差分析模型中的数据结构式可以写成:单因子方差分析模型中的数据结构式可以写成:xij=+j+ij,j=1,2,k;i=1,2,nj;所要检验的假设可以写成:所要检验的假设可以写成:H
10、0:a1=a2=ak=0 引起诸引起诸xij波动的原因有两个:一个是假设波动的原因有两个:一个是假设H0为真时,为真时,xij的波动的波动纯粹是随机性引起的;另一个可能是假设不真而引起的。因而我纯粹是随机性引起的;另一个可能是假设不真而引起的。因而我们就想用一个量来刻划诸们就想用一个量来刻划诸xij之间的波动,并把引起波动的上述两之间的波动,并把引起波动的上述两个原因从中分离出来,用另外两个量表示出来,通过比较这两个个原因从中分离出来,用另外两个量表示出来,通过比较这两个量来检验量来检验H0的真实性。记的真实性。记总离差平方和总离差平方和:它反映了观测数据它反映了观测数据总的变异程度总的变异程
11、度组间平方和组间平方和:反反映映因因子子A A的的不不同同水水平效应间的差异平效应间的差异组内组内(误差误差)平方和平方和:反映了随机误差反映了随机误差 ijij 对响应值影响的总和对响应值影响的总和可以证明可以证明St=SA+Se 平方和分解公式平方和分解公式 E(Se)=(n-k)若若0 0成立,成立,则则当当H0为真时,为真时,是是 2的两个无偏估计,故的两个无偏估计,故比值比值不应太大。当不应太大。当F值过大时,可以认为假设值过大时,可以认为假设H0不真。不真。可以证明,可以证明,当当假设假设H0为真时,有为真时,有于是于是 对于对于 显著性水平显著性水平,查出临界值,查出临界值F(k
12、-1,n-k).若若 FF(k-1,n-k),则则在在 水平下拒绝水平下拒绝H0,即认为有些水平对即认为有些水平对响应值的影响有显著差异。响应值的影响有显著差异。单因素方差分析表单因素方差分析表 记记St,SA,Se的自由度为的自由度为ft,fA,fB,可以证明如下自由度分解可以证明如下自由度分解公式:公式:ft=fA+fB 设在某试验中,有二个因素设在某试验中,有二个因素A、B在变动。在变动。因素因素A取取m个不同水平个不同水平 A1,A2,Am,因素因素B取取r个不同水平个不同水平 B1,B2,Br,在在(Ai,Bj)水平组合下的试验结果独立地服从水平组合下的试验结果独立地服从N(ij,2
13、)分布。分布。观测数据及计算表见教材表观测数据及计算表见教材表9.8。数学模型为。数学模型为2 2 双因素方差分析双因素方差分析 例例3 将土质基本相同的一块耕地分成均等的五个地块,每块将土质基本相同的一块耕地分成均等的五个地块,每块又分成均等的四个小区。有四个品种的小麦,在每一地块内随又分成均等的四个小区。有四个品种的小麦,在每一地块内随机分种在四个区上,每小区的播种量相同,测得收获量如下表机分种在四个区上,每小区的播种量相同,测得收获量如下表(单位:公斤),试以显著性水平(单位:公斤),试以显著性水平 1=0.05,2=0.01考察品种和考察品种和地块对收获量的影响是否显著。地块对收获量的
14、影响是否显著。这是一个双因素无重复试验的方差分析问题。这是一个双因素无重复试验的方差分析问题。一、双因素无重复试验的方差分析一、双因素无重复试验的方差分析 若若 ij=+i+j,我我们们称称该该方方差差分分析析模模型型为为无无交交互互作作用用的的方方差差分分析析模模型型。此此时时,我我们们只只需需对对(Ai,Bj)的的每每个个组组合合各各做做一一次次试试验验,记记其其结结果果为为xij,则则 xij=+i+j+ij。因因此此,无无交交互互作用的方差分析模型为作用的方差分析模型为假设有两个:假设有两个:H01:1=2=am=0H02:1=2=r=0 若检验结果拒绝若检验结果拒绝H01(H02),
15、则认为因子,则认为因子A(B)的不同水平对结的不同水平对结果有显著影响,若二者均不拒绝,那就说明因子果有显著影响,若二者均不拒绝,那就说明因子A与与B的不同水的不同水平组合对结果无显著影响。平组合对结果无显著影响。因素A的偏差平方和反映因素A的水平间的差异引起的波动。因子B的偏差平方和反映了因素B的水平间的差异引起的波动。误差平方和反映了随机误差引起的波动。总的偏差平方和反映了数据xij总的波动大小。在在H01,H02为真时为真时对给定的显著性水平对给定的显著性水平,当,当 FAF(m-1,(m-1)(r-1)时拒绝时拒绝H01,FBF(r-1,(m-1)(r-1)时拒绝时拒绝H02.例例3
16、将土质基本相同的一块耕地分成均等的五个地块,每块又将土质基本相同的一块耕地分成均等的五个地块,每块又分成均等的四个小区。有四个品种的小麦,在每一地块内随机分分成均等的四个小区。有四个品种的小麦,在每一地块内随机分种在四个区上,每小区的播种量相同,测得收获量如下表(单位:种在四个区上,每小区的播种量相同,测得收获量如下表(单位:公斤),试以显著性水平公斤),试以显著性水平1=0.05,2=0.01考察品种和地块对收获考察品种和地块对收获量的影响是否显著。量的影响是否显著。查表得临界值查表得临界值F0.05(4,12)=3.26,F0.01(3,12)=5.95。由于由于FBF0.05(4,12)
17、,故认为地块不同对收获量无显著影响。故认为地块不同对收获量无显著影响。由于由于FAF0.01(3,12),故认为品种不同对收获量影响极显著。故认为品种不同对收获量影响极显著。二、双因素等重复试验的方差分析二、双因素等重复试验的方差分析 若若 ij +i+j,则称,则称 =ij-i-j为因子为因子A的第的第i个个水平与因子水平与因子B的第的第j个水平的交互效应,它们满足关系式:个水平的交互效应,它们满足关系式:为了研究交互效应是否对结果有显著影响,那么在(为了研究交互效应是否对结果有显著影响,那么在(Ai,Bj)水平组合下至少要做水平组合下至少要做t(2)次试验,记其结果为次试验,记其结果为xi
18、jk,则,则要检验假设要检验假设:H01:1=2=m=0H02:1=2=r=0H03:对一切对一切i,j 有有 ij=0 将总的离差平方和分解:将总的离差平方和分解:Se反映了误差的波动;反映了误差的波动;SA,SB,SAB除反映误差的波动外还分除反映误差的波动外还分别反映了因子别反映了因子A的效应的差异,因子的效应的差异,因子B的效应的差异,交互效应的效应的差异,交互效应的差异所引起的波动。我们分别称它们为误并的偏差平方和,因的差异所引起的波动。我们分别称它们为误并的偏差平方和,因子子A的偏差平方和,因子的偏差平方和,因子B的偏差的平方和以及交互作用的偏差的平方和以及交互作用AB的的偏差平方
19、和。偏差平方和。对给定的显著性水平,例例4 在某化工生产中为了提高收率,选了三种不同浓度,四种在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。在同一浓度与温度组合下各做两次试验,其收不同温度做试验。在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列(数据均已减去率数据如下面计算表所列(数据均已减去75)。试在)。试在=0.05显著显著性水平下检验不同浓度、不同温度以及它们间的交互作用对收率性水平下检验不同浓度、不同温度以及它们间的交互作用对收率有无显著影响。有无显著影响。解解 经计算的方差分析表经计算的方差分析表 方差分析结果表明,只有因子方差分析结果表明,只有因子A是显著的(因为是显著的(因为4.093.89)即浓度不同将对收率产生显著影响;而温度及交互作用的影响都即浓度不同将对收率产生显著影响;而温度及交互作用的影响都不显著,这说明要提高收率必须把浓度控制好。不显著,这说明要提高收率必须把浓度控制好。