《【教学课件】第六章方差分析.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第六章方差分析.ppt(122页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章第六章 方差分析方差分析第一节第一节 方差分析的基本原理方差分析的基本原理第二节第二节 多重比较多重比较第三节第三节 方差分析的线性模型与期望均方方差分析的线性模型与期望均方第四节第四节 单向分组资料的方差分析单向分组资料的方差分析第五节第五节 两向分组资料的方差分析两向分组资料的方差分析第六节第六节 方差分析的基本假定和数据转换方差分析的基本假定和数据转换第一节第一节 方差分析的基本原理方差分析的基本原理 所谓所谓方差分析方差分析(analysis of variance)(analysis of variance),是关于是关于k(k3)个样本个样本平均数的假设测验方法,是将总变异剖
2、分为各个变异来源的平均数的假设测验方法,是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。一种统计分析方法。假设测验的依据是假设测验的依据是:扣除了各种试验原因所引起的扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计变异后的剩余变异提供了试验误差的无偏估计 。这里采用均方来度量试验处理产生的变异和误差引起的这里采用均方来度量试验处理产生的变异和误差引起的变异变异.方差方差是平方和除以自由度的商。是平方和除以自由度的商。一、自由度和平方和的分解一、自由度和平方和的分解 设有设有
3、k组数据,每组皆具组数据,每组皆具n个观察值,则该资料共有个观察值,则该资料共有nk个观个观察值,其数据分组如表察值,其数据分组如表6.1。表表6.1 每每组组具具n个个观观察察值值的的k 组组数据的符号表数据的符号表组别组别观察值观察值(yij,i=1,2,k;j=1,2,n)总总和和平均平均均方均方1y11y12y1jy1nT12y21y22y2jy2nT2iyi1yi2yijyinTikyk1yk2ykjyknTk 在表在表6.1中,总变异是中,总变异是nk个观察值的变异,故其自由度个观察值的变异,故其自由度v=nk1,而其平方和,而其平方和SST则为:则为:(61)其中的其中的C称为矫
4、正数:称为矫正数:(62)对于第对于第 i 组的变异,有组的变异,有从而总变异从而总变异(61)可以剖分为可以剖分为:(63)即即 总平方和总平方和=组内组内(误差误差)平方和平方和+处理平方和处理平方和 组间变异由组间变异由k个个 的变异引起,故其自由度的变异引起,故其自由度 v=k1,组组间平方和间平方和 SSt 为:为:组内变异为各组内观察值与组平均数的变异,故每组具有组内变异为各组内观察值与组平均数的变异,故每组具有自由度自由度 v=n1和平方和和平方和 ;而资料共有;而资料共有k 组,故组组,故组内自由度内自由度 v=k(n1),组内平方和组内平方和 SSe 为:为:(65)(64)
5、因此,得到表因此,得到表6.1类型资料的自由度分解式为:类型资料的自由度分解式为:(66)总自由度总自由度DFT=组间自由度组间自由度DFt+组内自由度组内自由度DFe 求得各变异来源的自由度和平方和后,进而可得求得各变异来源的自由度和平方和后,进而可得:(67)例例6.1 以以A、B、C、D 4种药剂处理水稻种子,其中种药剂处理水稻种子,其中A为对照,每处理各得为对照,每处理各得4个苗高观察值个苗高观察值(cm),其结果如表,其结果如表6.2,试分解其自由度和平方和。试分解其自由度和平方和。表表6.2 水稻不同水稻不同药剂处药剂处理的苗高理的苗高(cm)(cm)药剂药剂苗高苗高观观察察值值总
6、和总和Ti 平均平均 A18 21 20 137218B20 24 26 229223C10 15 17 145614D28 27 29 3211629T=336 =21 根据根据(66)进行总自由进行总自由度的剖分:度的剖分:总变异自由度总变异自由度DFT=(nk1)=(44)1=15 药剂间自由度药剂间自由度DFt=(k1)=41=3 药剂内自由度药剂内自由度DFe=k(n1)=4(41)=12根据根据(63)进行总平方和的剖分:进行总平方和的剖分:或或 或或 药剂药剂A内:内:药剂药剂B内:内:药剂药剂C内:内:药剂药剂D内:内:所以所以 进而可得均方:进而可得均方:二、二、F分布与分布
7、与F测验测验 在一个平均数为在一个平均数为 、方差为、方差为 的正态总体中,随机抽的正态总体中,随机抽取两个独立样本,分别求得其均方取两个独立样本,分别求得其均方 s12 和和 s22,将,将 s12 和和 s22 的比值定义为的比值定义为F:(68)此此F值具有值具有s12 的自由度的自由度 v1 和和 s22 的自由度的自由度 v2。所谓所谓F F分布分布,就是在给定的,就是在给定的 v1 和和 v2 下按上述方法从正下按上述方法从正态总体中进行一系列抽样,就可得到一系列的态总体中进行一系列抽样,就可得到一系列的F 值而作成值而作成一个分布。一个分布。F分布下一定区间的概率可从已制成的统计
8、表查出。分布下一定区间的概率可从已制成的统计表查出。F分布曲线特征:分布曲线特征:(1)具有平均数)具有平均数 =1(2)取值区间为)取值区间为0,;(3)某一特定曲线的形)某一特定曲线的形状则仅决定于参数状则仅决定于参数 v1和和 v2。在在 v1=1或或 v1=2时,时,F分布分布曲线是严重倾斜成反向曲线是严重倾斜成反向J型;型;当当 v13时,曲线转为偏态时,曲线转为偏态(图图6.1)。图图6.1 F分布曲线分布曲线(随(随v1和和v2的不同而不同)的不同而不同)F测验需具备条件:测验需具备条件:(1)变数变数y遵循正态分布遵循正态分布N(,),(2)s12 和和 s22 彼此独立彼此独
9、立。另外,在另外,在F 测验中,如果作分子的均方小于作分母的测验中,如果作分子的均方小于作分母的均方,则均方,则F0.05,应接受,应接受H0。例例6.2 测定东方红测定东方红3号小麦的蛋白质含量号小麦的蛋白质含量10次,得均方次,得均方 s12=1.621;测定农大;测定农大139小麦的蛋白质含量小麦的蛋白质含量5次,得均方次,得均方 s22=0.135。试测验东方红。试测验东方红3号小麦蛋白质含量的变异是否比号小麦蛋白质含量的变异是否比农大农大139为大。为大。假设假设H0:东方红小麦总体蛋白质含量的变异和农大:东方红小麦总体蛋白质含量的变异和农大139一样,即一样,即 ,对,对 。显著水
10、平显著水平 =0.05,v1=9,v2=4时,时,F0.05=6.00。测验计算测验计算:F=1.621/0.135=12.01 此此FF0.05,即,即PF0.01F0.05 。推断:否定推断:否定 ,接受,接受 ;即药剂间;即药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不同效应的。同效应的。例例6.1和例和例6.3的分析结果可以归纳在一起,列出方差的分析结果可以归纳在一起,列出方差分析表,如表分析表,如表6.3所示。所示。表表6.3 水稻水稻药剂处药剂处理苗高方差分析表理苗高方差分析表变变异来源异来源DFSSMSF显显著著F值
11、值药剂处药剂处理理间间 3504168.0020.56F 0.05(3,12)=3.49 药剂处药剂处理内理内(误误差差)12 98 8.17F 0.01(3,12)=5.95总总15602第二节第二节 多重比较多重比较 所谓所谓多重比较(多重比较(multiple comparisonsmultiple comparisons)是指一个试验是指一个试验中中k个处理平均数间可能有个处理平均数间可能有k(k1)/2个比较,亦称为个比较,亦称为复式复式比较比较。多重比较有多种方法,本节将介绍常用的三种:多重比较有多种方法,本节将介绍常用的三种:最小显著差数法最小显著差数法 复极差法复极差法(q法法
12、)Duncan氏新复极差法氏新复极差法一、最小显著差数法一、最小显著差数法 最小显著差数法最小显著差数法(least significant difference,简称,简称LSD法法),法实质上是第五章的法实质上是第五章的t 测验。测验。其程序是:其程序是:(1)在处理间的)在处理间的F测验为显著的前提下,计算出显著水测验为显著的前提下,计算出显著水平为平为 的最小显著差数的最小显著差数 ;(2)任何两个平均数的差数)任何两个平均数的差数(),如其绝对值,如其绝对值 ,即为在水平上差异显著;反之,则为在水平上差异不显著。,即为在水平上差异显著;反之,则为在水平上差异不显著。已知:已知:若若|
13、t|,即为在即为在 水平上显著。水平上显著。因此,最小显著差数为:因此,最小显著差数为:(69)当两样本的容量当两样本的容量n相等时,相等时,在方差分析中,上式的在方差分析中,上式的se2有了更精确的数值有了更精确的数值 MSe(因(因为此自由度增大),因此为此自由度增大),因此(69)中中 的为:的为:(610)例例6.4 试以试以LSD法测验法测验表表6.2资料各种药剂处理的苗高平资料各种药剂处理的苗高平均数间的差异显著性。均数间的差异显著性。由由(例例6.3)计算得计算得F=20.56为显著,为显著,MSe=8.17,DFe=12,故故 由附表由附表4,v=12时,时,t0.05=2.1
14、79,t0.01=3.055故故 LSD0.05=2.1792.02=4.40(cm)LSD0.01=3.0552.02=6.17(cm)然后将各种药剂处理的苗高与对照苗高相比,差数大然后将各种药剂处理的苗高与对照苗高相比,差数大于于4.40cm为差异显著;大于为差异显著;大于6.17cm为差异极显著。为差异极显著。二、二、q法法 q测验是测验是Student-Newman-Keul基于极差的抽样分布理论基于极差的抽样分布理论提出来的,或称复极差测验,有时又称提出来的,或称复极差测验,有时又称SNK测验或测验或NK测验。测验。q法是将一组法是将一组k个平均数由大到小排列后,根据所比较的个平均数
15、由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差值显著极差值 的。的。q测验因是根据极差抽样分布原理的,其各个比较都可测验因是根据极差抽样分布原理的,其各个比较都可保证同一个保证同一个 显著水平。显著水平。q测验尺度值构成为:测验尺度值构成为:(611)(612)式中式中2pk,p是所有比较的平均数按大到小顺序排列所是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数计算出的两极差范围内所包含的平均数个数(称为称为秩次距秩次距)。SE为平均数的标准误,可见在每一显著水平下该法有为平
16、均数的标准误,可见在每一显著水平下该法有k1个尺度值。个尺度值。平均数比较时,尺度值随秩次距的不同而异。平均数比较时,尺度值随秩次距的不同而异。例例6.5 试对表试对表6.2资料的各平均数作资料的各平均数作q测验。测验。由由6.1资料得:资料得:查附表查附表7 q值表,当值表,当DF=12时时,p=2,3,4的的 值,并值,并由由(611)计算出尺度值计算出尺度值 ,列于表,列于表6.4。pq0.05q0.01LSR0.05LSR0.0123.084.324.406.1833.775.045.397.2144.205.506.017.87表表6.4 表表6.2资料资料 值的计算值的计算(q测验
17、测验)由表由表6.2可知可知,=29cm,=23cm,=18cm,=14cm。:由此可得到由此可得到-当当p=2时时,=6(cm)5水平上水平上显显著;著;=5(cm)5水平上水平上显显著;著;=4(cm)不不显显著。著。当当p=3时时,=11(cm)1水平上水平上显显著;著;=9(cm)1水平上水平上显显著。著。当当p=4时时,=15(cm)1水平上水平上显显著。著。三、新复极差法三、新复极差法新复极差法新复极差法是是D.B.Duncan(1955)基于不同秩次距基于不同秩次距p下下的最小显著极差变幅比较大而提出的,又称的最小显著极差变幅比较大而提出的,又称最短显著极差最短显著极差法法(sh
18、ortest significant ranges(shortest significant ranges,SSR SSR )。查得查得 后,有后,有(613)此时,在不同秩次距此时,在不同秩次距p下,平均数间比较的显著水平下,平均数间比较的显著水平按两两比较是按两两比较是 ,但按,但按p个秩次距则为保护水平个秩次距则为保护水平 例例6.6 试对表试对表6.2资料的各平均数作新复极差测验。资料的各平均数作新复极差测验。已知已知 =29cm,=23cm,=18cm,=14cm,MSe=8.17,查附表查附表8,得值,由,得值,由(613)算得在算得在p=2,3,4时的值时的值(表表6.5),即为
19、测验不同,即为测验不同p时的平均数间极差显著性的尺度值。时的平均数间极差显著性的尺度值。pSSR0.05SSR0.01LSR0.05LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69表表6.5 表表6.2资料资料LSR值的计算值的计算(新复极差测验新复极差测验)当当p=2时,时,=6(cm)5水平显著;水平显著;=5(cm)5水平显著;水平显著;=4(cm)不显著。不显著。当当p=3时,时,=11(cm)1水平上显著;水平上显著;=9(cm)1水平上显著。水平上显著。当当p=4时,时,=15(cm)1水平上显著。水平上显著。结论
20、:表结论:表6.2资料的资料的4个处理的苗高,除处理个处理的苗高,除处理A与与C差异差异不显著外,其余处理间均达显著差异,本例结果与上面介绍不显著外,其余处理间均达显著差异,本例结果与上面介绍的的q测验法相同,但测验法相同,但q法的法的 要比新复极差法的要比新复极差法的 大。大。四、多重比较结果的表示方法四、多重比较结果的表示方法(一一)列梯形表法列梯形表法(二二)划线法划线法(三三)标记字母法标记字母法 将全部平均数从大到小顺次排列,然后算出各平将全部平均数从大到小顺次排列,然后算出各平均数间的差数。凡达到均数间的差数。凡达到 =0.05水平的差数在右上角水平的差数在右上角标一个标一个“*”
21、号,凡达到号,凡达到 =0.01水平的差数在右上角水平的差数在右上角标两个标两个“*”号号,凡未达到凡未达到 =0.05水平的差数则不予水平的差数则不予标记。若以列梯形表法表示,则成表标记。若以列梯形表法表示,则成表6.6。(一一)列梯形表法列梯形表法处处理理平均数平均数()差差 异异 14 18 23D2915*11*6*B239*5*A184C14表表6.6 表表6.2资料的差异显著性资料的差异显著性(新复极差测验新复极差测验)优点优点:十分直观,:十分直观,缺点缺点:占篇幅较大,特别是处理平均数较多时。:占篇幅较大,特别是处理平均数较多时。(二二)划线法划线法 将平均数按大小顺序排列,以
22、第将平均数按大小顺序排列,以第1个平均数为标准与以后个平均数为标准与以后各平均数比较,在平均数下方把差异不显著的平均数用横线各平均数比较,在平均数下方把差异不显著的平均数用横线连接起来,依次以第连接起来,依次以第2,k1个平均数为标准按上述方法个平均数为标准按上述方法进行。这种方法称划线法。下面就是表进行。这种方法称划线法。下面就是表6.2资料用划线法标出资料用划线法标出0.01水平下平均数差异显著性结果水平下平均数差异显著性结果(q法法)。29cm(D)23cm(B)18cm(A)14cm(C)优点优点:直观、简单方便,所占篇幅也较少。:直观、简单方便,所占篇幅也较少。(三三)标记字母法:标
23、记字母法:(1)将全部平均数从大到小依次排列。)将全部平均数从大到小依次排列。(2)在最大的平均数上标上字母)在最大的平均数上标上字母a;将该平均数与以下;将该平均数与以下各平均数相比,相差不显著的,都标上字母各平均数相比,相差不显著的,都标上字母a,直至某一个,直至某一个与之相差显著的平均数则标以字母与之相差显著的平均数则标以字母b(向下过程向下过程),(3)再以该标有)再以该标有b的平均数为标准,与上方各个比它大的平均数为标准,与上方各个比它大的平均数比,凡不显著的也一律标以字母的平均数比,凡不显著的也一律标以字母b(向上过程向上过程);再以该标有再以该标有b的最大平均数为标准,与以下各未
24、标记的平均的最大平均数为标准,与以下各未标记的平均数比,凡不显著的继续标以字母数比,凡不显著的继续标以字母b,直至某一个与之相差显,直至某一个与之相差显著的平均数则标以字母著的平均数则标以字母c。(4)如此重复进行下去,直至最小的一个平均数有了)如此重复进行下去,直至最小的一个平均数有了标记字母且与以上平均数进行了比较为止。标记字母且与以上平均数进行了比较为止。(5)这样各平均数间,凡有一个相同标记字母的即为)这样各平均数间,凡有一个相同标记字母的即为差异不显著,凡没有相同标记字母的即为差异显著。差异不显著,凡没有相同标记字母的即为差异显著。在实际应用时,可以小写字母表示在实际应用时,可以小写
25、字母表示 =0.05显著水平,显著水平,大写字母表示大写字母表示 =0.01显著水平。显著水平。(1)在表)在表6.7上先将各平均数按大小顺序排列,并在行上先将各平均数按大小顺序排列,并在行上标上标a。(2)由于)由于 与与 呈显著差异,故呈显著差异,故 上标上标b。(3)然后以)然后以 为标准与为标准与 相比呈显著差异,故标相比呈显著差异,故标c。(4)以)以 为标准与为标准与 比,无显著差异,仍标比,无显著差异,仍标c。同理,可进行同理,可进行4个在个在1水平上的显著性测验,结果列水平上的显著性测验,结果列于表于表6.7。例例6.7 试对例试对例6.6测验结果作出字母标记。测验结果作出字母
26、标记。表表6.7 表表6.2资资料的差异料的差异显显著性著性(新复极差新复极差测验测验)处 理苗 高平均数(cm)差异显著性0.050.01D29 a AB23 b ABA18 c BCC14 c C 由表由表6.7就可清楚地看出,该试验除就可清楚地看出,该试验除A与与C处理无显著差处理无显著差异外,异外,D与与B及及A、C处理间差异显著性达到处理间差异显著性达到 =0.05水平。水平。处理处理B与与A、D与与B、A与与C无极显著差异;无极显著差异;D与与A、C,B与与C呈极显著差异。呈极显著差异。五、多重比较方法的选择五、多重比较方法的选择多重比较方法选用原则:多重比较方法选用原则:(1)试
27、验事先确定比较的标准,凡与对照相比较,或)试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法;与预定要比较的对象比较,一般可选用最小显著差数法;(2)根据否定一个正确的)根据否定一个正确的H0和接受一个不正确的和接受一个不正确的H0的相对重要性来决定。的相对重要性来决定。方差分析的基本步骤是:方差分析的基本步骤是:(1)将资料总变异的自由度和平方和分解为各变异原)将资料总变异的自由度和平方和分解为各变异原因的自由度和平方和,并进而算得其均方;因的自由度和平方和,并进而算得其均方;(2)计算均方比,作出)计算均方比,作出F 测验,以明了各变异因素的测验,以
28、明了各变异因素的重要程度;重要程度;(3)对各平均数进行多重比较。)对各平均数进行多重比较。第三节第三节 方差分析的线性模型与期望均方方差分析的线性模型与期望均方一、方差分析的线性数学模型一、方差分析的线性数学模型 方差分析的理论依据:方差分析的理论依据:线性可加模型,线性可加模型,即总体每一个即总体每一个变量可以按其变异的原因分解成若干个线性组成部分。变量可以按其变异的原因分解成若干个线性组成部分。例如表例如表6.1数据的线性模型可表示为:数据的线性模型可表示为:(614)其中,为总体平均数,为试验处理效应,为随机其中,为总体平均数,为试验处理效应,为随机误差具有分布误差具有分布N(0,)。
29、象表。象表6.1类型的资料,其每一观测类型的资料,其每一观测值都由这三个部分相加而成。值都由这三个部分相加而成。在以样本符号表示时,样本的线性组成为:在以样本符号表示时,样本的线性组成为:(615)其中,是的无偏估计量,是的无偏估计量,其中,是的无偏估计量,是的无偏估计量,为其所属亚总体误差方差的无偏估计量。为其所属亚总体误差方差的无偏估计量。当测验当测验H0:时,假定时,假定 和和 ,可看作是总体可看作是总体 的无偏估计量。的无偏估计量。也是也是 的无偏估计量。的无偏估计量。因而因而 对于对于 t i 部分,每一样本的平方和是部分,每一样本的平方和是 ,故,故k个样本的平方和是个样本的平方和
30、是 ,而处理间方差,而处理间方差st2为:为:(616)因为因为 ,故,故 估计了估计了 ,或或 。或写为:。或写为:(617)二、期望均方二、期望均方 在线性可加模型中,关于在线性可加模型中,关于 部分的假定,由于对部分的假定,由于对 有有不同的解释产生了不同的解释产生了固定模型固定模型()()和和随机模型随机模型()()。固定模型固定模型是指各个处理的平均效应是指各个处理的平均效应 是固定是固定的一个常量,且满足的一个常量,且满足 (或或 ),但常数未,但常数未知;主要是研究并估计处理效应;固定模型中所得的结论知;主要是研究并估计处理效应;固定模型中所得的结论仅在于推断关于特定的处理;仅在
31、于推断关于特定的处理;随机模型随机模型是指各个处理效应是指各个处理效应 不是一个常量,而是从不是一个常量,而是从平均数为零、方差为平均数为零、方差为 的正态总体中得到的一个随机变量,的正态总体中得到的一个随机变量,即即 N(0,)。主要是研究并估计总体变异即方差。主要是研究并估计总体变异即方差。而随机模型中试验结论则将用于推断处理的总体而随机模型中试验结论则将用于推断处理的总体.(一一)固定模型(固定模型(fixed model)例例6.8 以以5个水稻品种作大区比较试验,每品种作个水稻品种作大区比较试验,每品种作3次次取样,测定其产量,所得数据为单向分组资料。本试验需明取样,测定其产量,所得
32、数据为单向分组资料。本试验需明确各品种的效应,故为固定模型,其方差分析和期望均方的确各品种的效应,故为固定模型,其方差分析和期望均方的参数估计列于表参数估计列于表6.8。表表6.8 5个水稻品种个水稻品种产产量的方差分析和期望均方表量的方差分析和期望均方表变变异来源异来源DFSSMS期望均方期望均方(EMS):固定模型固定模型品品 种种 间间 487.621.90品种内品种内(试验误试验误差差)1024.0 2.40为固定效应的方差为固定效应的方差 本例中品种内本例中品种内MS估计了估计了 ,因而,因而 ;品种间品种间MS估计了估计了 因而因而 固定模型的固定模型的F测验测验 若若 ,则,则F
33、值等于值等于1。所以固定模型是测验假设所以固定模型是测验假设H0:(i=1,2,k)对对HA:,即测验,即测验H0:。因而,一般比较处理效应的试验都应当采用固定模型因而,一般比较处理效应的试验都应当采用固定模型 (二二)随机模型随机模型(random model)例例6.9 研究籼粳稻杂交研究籼粳稻杂交F5代系间单株干草重的遗传变异,代系间单株干草重的遗传变异,随机抽取随机抽取76个系进行试验,每系随机取个系进行试验,每系随机取2个样品测定干草重个样品测定干草重(g/株株)。因这。因这76个系是随机抽取的样本,要从这些样本来估个系是随机抽取的样本,要从这些样本来估计计F5代系间单株干草重的遗传
34、变异,故这是随机模型。其单代系间单株干草重的遗传变异,故这是随机模型。其单向分组分析结果见表向分组分析结果见表6.9。表表6.9 籼粳籼粳杂杂种种F5代干草重的方差分析和期望均方代干草重的方差分析和期望均方 变变 异异 来来 源源DFMS期望均方期望均方(EMS):随机模型随机模型系系 统统 间间7572.79系系统统内内(试验误试验误差差)7617.77为随机效应的方差为随机效应的方差 本例中系统内本例中系统内MS估计了估计了 ,因而,因而 ;系统间系统间MS估计了估计了 ,因而因而 随机模型的随机模型的F测验测验若假设若假设 ,则,则F=1。因而,随机模型的假设为因而,随机模型的假设为H0
35、:对对HA:。显然,这是测验处理效应的变异度显然,这是测验处理效应的变异度(方差方差),而不是测,而不是测验处理效应本身。验处理效应本身。随机模型方差分析在数量遗传学中的应用随机模型方差分析在数量遗传学中的应用:如果如果F测验显著则表示处理间的变异是显著的。本例测验显著则表示处理间的变异是显著的。本例F=72.79/17.77=4.09F0.05,说明,说明 是存在的。是存在的。=25.71测度了系统间变异。测度了系统间变异。本例中,本例中,(或记为或记为 )代表了系间遗传型的变异;代表了系间遗传型的变异;代表了环境条件所致的变异代表了环境条件所致的变异(记作记作 )。代表了系间的表型变异,代
36、表了系间的表型变异,因而可求出遗传型变异占表型变异的份量,这就是数量遗因而可求出遗传型变异占表型变异的份量,这就是数量遗传中常用的遗传率,即:传中常用的遗传率,即:(618)当试验因素在当试验因素在2个或个或2个以上时,可以在固定模型和随个以上时,可以在固定模型和随机模型的基础上产生第三种模型:机模型的基础上产生第三种模型:混合模型混合模型(记作模型记作模型)。)。混合模型混合模型乃既包括有固定模型的试验因素,又包括有乃既包括有固定模型的试验因素,又包括有随机模型的试验因素的模型。随机模型的试验因素的模型。这类模型凡随机因素仍用这类模型凡随机因素仍用 表示,固定模型用表示,固定模型用 表表示。
37、示。混合模型中的期望均方组成因包括有不同的成份,应混合模型中的期望均方组成因包括有不同的成份,应选择恰当的均方进行选择恰当的均方进行F测验。测验。第四节第四节 单向分组资料的方差分析单向分组资料的方差分析 单向分组资料是指观察值仅按一个方向分组的资料示。单向分组资料是指观察值仅按一个方向分组的资料示。所用的试验设计为完全随机试验设计。所用的试验设计为完全随机试验设计。一、组内观察值数目相等的单向分组资料的方差分析一、组内观察值数目相等的单向分组资料的方差分析二、组内观察值数目不等的单向分组资料的方差分析二、组内观察值数目不等的单向分组资料的方差分析三、组内又分亚组的单向分组资料的方差分析三、组
38、内又分亚组的单向分组资料的方差分析分类分类一、组内观察值数目相等的单向分组资料的方差分析一、组内观察值数目相等的单向分组资料的方差分析这是在这是在k组处理中,每处理皆含有组处理中,每处理皆含有n个供试单位的资料如个供试单位的资料如表表6.16.1。在作方差分析时,其任一观察值的线性模型皆由在作方差分析时,其任一观察值的线性模型皆由 表示,方差分析如表表示,方差分析如表6.10。表表6.10 组组内内观观察察值值数目相等的数目相等的单单向分向分组资组资料的方差分析料的方差分析 变 异来 源自由度DF平方和SS均 方MSF期望均方EMS固定模型随机模型处理间 k1MStMSt/MSe误 差 k(n
39、 1)MSe总变异 nk 1 例例6.10 作一水稻施肥的盆栽试验,设作一水稻施肥的盆栽试验,设5个处理,个处理,A和和B系分别施用两种不同工艺流程的氨水,系分别施用两种不同工艺流程的氨水,C施碳酸氢铵,施碳酸氢铵,D施尿素,施尿素,E不施氮肥。每处理不施氮肥。每处理4盆盆(施肥处理的施肥量每盆施肥处理的施肥量每盆皆为折合纯氮皆为折合纯氮1.2克克),共,共54=20盆,随机放置于同一网室盆,随机放置于同一网室中,其稻谷产量中,其稻谷产量(克克/盆盆)列于表列于表6.11,试测验各处理平均数,试测验各处理平均数的差异显著性。的差异显著性。表表6.11 水稻施肥盆栽水稻施肥盆栽试验试验的的产产量
40、量结结果果处 理观察值(yij)(克/盆)A(氨水1)24 30 28 2610827.0 B(氨水2)27 24 21 269824.5 C(碳酸氢铵)31 28 25 3011428.5 D(尿素)32 33 33 2812631.5 E(不施)21 22 16 218020.052626.3(1)自由度和平方和的分解自由度和平方和的分解 总变异自由度总变异自由度DFT=nk1=541=19 处理间自由度处理间自由度DFt=k1=51=4 误差误差(处理内处理内)自由度自由度DFe=k(n1)=5(41)=15 矫正数矫正数 (2)F测验测验将上述结果录入表将上述结果录入表6.12表表6.
41、12 表表6.11资资料的方差分析料的方差分析变变异来源异来源DFSSMSFF0.05F0.01 处处 理理 间间4301.275.3011.19*3.064.89 处处理内理内(试验误试验误差差)15101.06.73 总总 变变 异异19402.2 假设假设H0:,HA:不全相等。不全相等。为了测验为了测验H0,计算处理间均方对误差均方的比率,计算处理间均方对误差均方的比率,算得算得 F=75.3/6.73=11.19 查查F表当表当 v1=4,v2=15时,时,F0.01=4.89,现实得,现实得F=11.19F0.01,故否定,故否定H0,推断这个试验的处理平均数间是有极显著差异的。推
42、断这个试验的处理平均数间是有极显著差异的。(3)各处理平均数的比较各处理平均数的比较算得单个平均数的标准误算得单个平均数的标准误 根据根据 =15,查,查SSR表得表得p=2,3,4,5时的时的SSR0.05与与SSR0.01值,将值,将 值分别乘以值分别乘以SE值,即得值,即得 值,列值,列于表于表6.13。进而进行多重比较。进而进行多重比较(表表6.14)。pSSR0.05SSR0.01LSR0.05LSR0.0123.014.173.905.4133.164.374.105.6743.254.504.225.8453.314.584.295.94表表6.13 多重比较时的多重比较时的 值
43、计算值计算表表6.14 施肥效果的施肥效果的显显著性著性(SSR测验测验)处处 理理平均平均产产量量(克克/盆盆)差异差异显显著性著性5%1%尿尿 素素31.5 a A 碳酸碳酸氢铵氢铵28.5 ab AB 氨水氨水1 127.0 bc AB 氨水氨水2 224.0 c BC 不不 施施20.0 d C 推断:根据表推断:根据表6.14多重比较结果可知,施用氮肥多重比较结果可知,施用氮肥(A、B、C和和D)与不施氮肥有显著差异,且施用尿素、碳酸氢铵、氨与不施氮肥有显著差异,且施用尿素、碳酸氢铵、氨水水1与不施氮肥均有极显著差异;尿素与碳酸氢铵、碳酸氢与不施氮肥均有极显著差异;尿素与碳酸氢铵、碳
44、酸氢铵与氨水铵与氨水1、氨水、氨水1与氨水与氨水2处理间均无显著差异。处理间均无显著差异。二、组内观察值数目不等的单向分组资料的方差分析二、组内观察值数目不等的单向分组资料的方差分析 若若k个处理中的观察值数目不等,分别为个处理中的观察值数目不等,分别为n1,n2,nk,在方差分析时有关公式因,在方差分析时有关公式因ni 不相同而需作相应改变。不相同而需作相应改变。主要区别点如下:主要区别点如下:(1)自由度和平方和的分解自由度和平方和的分解(619)(620)(2)多重比较多重比较平均数的标准误为:平均数的标准误为:上式的上式的nA和和nB系两个相比较的平均数的样本容量。但系两个相比较的平均
45、数的样本容量。但亦可先算得各亦可先算得各ni 的平均数的平均数n0。然后有:然后有:或或(622)(621)(623)(624)例例6.11 某病虫测报站,调查四种不同类型的水稻田某病虫测报站,调查四种不同类型的水稻田28块,每块田所得稻纵卷叶螟的百丛虫口密度列于表块,每块田所得稻纵卷叶螟的百丛虫口密度列于表6.15,试问不同类型稻田的虫口密度有否显著差异?试问不同类型稻田的虫口密度有否显著差异?表表6.15 不同不同类类型稻田型稻田纵纵卷叶螟的虫口密度卷叶螟的虫口密度 稻田稻田类类型型编编 号号ni123456781213141515161710214.5771410111314117312
46、.176 9 21011121312118010.008121110 9 810127210.297T=327 11.68 28 该资料该资料 =7+6+8+7=28 故故 总变异自由度总变异自由度 DFT=1=281=27 稻田类型间自由度稻田类型间自由度 DFt=k1=41=3 误差自由度误差自由度 DFe=k=284=24 求得:求得:表表6.16 表表6.15资资料的方差分析料的方差分析变变异来源异来源DFSSMSFF0.01稻田稻田类类型型间间 396.1332.045.91*4.72误误 差差24129.985.42总总 变变 异异27226.11 表表6.16所得所得F=5.91
47、F0.01,因而应否定,因而应否定H0:即即4块麦田的虫口密度间有极显著差异。块麦田的虫口密度间有极显著差异。F测验显著,再作平均数间的比较。需进一步计算测验显著,再作平均数间的比较。需进一步计算n0,并求得,并求得SE(LSR测验)或测验)或 (LSD测验测验)。如在此可有:如在此可有:三、组内又分亚组的单向分组资料的方差分析三、组内又分亚组的单向分组资料的方差分析 单向分组资料,如果每组又分若干个亚组,而每个亚单向分组资料,如果每组又分若干个亚组,而每个亚组内又有若干个观察值,则为组内又有若干个观察值,则为组内分亚组的单向分组资料组内分亚组的单向分组资料,或称或称系统分组资料系统分组资料。
48、系统分组并不限于组内仅分亚组,亚组内还可分小组,系统分组并不限于组内仅分亚组,亚组内还可分小组,小组内还可分小亚组,小组内还可分小亚组,如此一环套一环地分下去。,如此一环套一环地分下去。这种试验称为这种试验称为巢式试验巢式试验(nested experiment (nested experiment)。设一系统分组资料共有设一系统分组资料共有l组,每组内又分组,每组内又分m个亚个亚组,每一亚组内有组,每一亚组内有n观察值,则该资料共有观察值,则该资料共有lmn个观个观察值,其资料类型如表察值,其资料类型如表6.17。组别亚组观 察 值亚组总和Tij亚组均 数组总和Ti组均数1T12T2i1yi
49、11yi12yi1kyi1nTi1Ti2yi21yi22yi2kyi2nTi2jyij1yij2yijkyijnTijmyim1yim2yimkyimnTimlTl表6.17 二级系统分组资料个观察值的数据结构(i=1,2,l;j=1,2,m;k=1,2,n)表表6.17中每一观察值的线性可加模型为:中每一观察值的线性可加模型为:(625)其中其中 为总体平均;为总体平均;为同一亚组中各观察值的随机变异,具有为同一亚组中各观察值的随机变异,具有N(0,)。为组效应或处理效应为组效应或处理效应固定模型固定模型()随机模型随机模型 N(0,)为同组中各亚组的效应为同组中各亚组的效应固定模型固定模型
50、()随机模型随机模型 N(0,)表表6.17的任一观察值的总变异可分解为的任一观察值的总变异可分解为3种来源的变异:种来源的变异:(1)组间)组间(或处理间或处理间)变异;变异;(2)同一组内亚组间变异;)同一组内亚组间变异;(3)同一亚组内各重复观察值间的变异。)同一亚组内各重复观察值间的变异。其自由度和平方和的估计如下:其自由度和平方和的估计如下:(1)总变异总变异 自由度自由度(626)(627)(628)(2)组间组间(处理间处理间)变异变异(629)(3)同一组内亚组间的变异同一组内亚组间的变异(630)(4)亚组内的变异亚组内的变异(631)表表6.18 二二级级系系统统分分组资组