《田间试验与统计分析.ppt》由会员分享,可在线阅读,更多相关《田间试验与统计分析.ppt(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章第三章 方差分析方差分析Chapter 3 ANOVA(Analysis of Variance)方差分析是判断方差分析是判断多组数据(多组数据(K3)之间平均数差异是之间平均数差异是否显著的一种假设测验方法。否显著的一种假设测验方法。2个样本平均数可用个样本平均数可用 t 或或U测验测验的方法来评定其差数的显著性。如果有的方法来评定其差数的显著性。如果有K个平均数,且个平均数,且K3,若仍然用两两比较的方法来测验,则需要作,若仍然用两两比较的方法来测验,则需要作K(K-1)/2次测次测验,如果验,如果K10,则需要,则需要45次测验,不但测验程序繁琐,而次测验,不但测验程序繁琐,而且在
2、理论上,其显著水平已经扩大了。因此,对于多样本平且在理论上,其显著水平已经扩大了。因此,对于多样本平均数的假设测验,需采用一种更为合适的统计方法,即方差均数的假设测验,需采用一种更为合适的统计方法,即方差分析法(分析法(Fisher,1923)。)。第三章第三章 方差分析方差分析方差是平方和除以自由度的商。方差是平方和除以自由度的商。方差分析是将总变异分裂为各个因素的相应变异,作方差分析是将总变异分裂为各个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程出其数量估计,从而发现各个因素在变异中所占的重要程度,而且除了可控制因素所引起的变异后,其剩余变异又度,而且除了可控制因素
3、所引起的变异后,其剩余变异又可提供试验误差的准确而无偏的估计,作为统计假设测验可提供试验误差的准确而无偏的估计,作为统计假设测验的依据。的依据。第三章第三章 方差分析方差分析例如,若有例如,若有5组数据要比较,则共需要比较组数据要比较,则共需要比较(54)/2=10次。次。若若H0正确,每次接受的概率为正确,每次接受的概率为1,10次都接受的概率次都接受的概率为,因此,为,因此,=1,即犯第一类错误的概率为,这显然,即犯第一类错误的概率为,这显然是不能接受的。是不能接受的。本章主要内容:本章主要内容:第一节第一节 方差分析的基本原理和方法。方差分析的基本原理和方法。第二节第二节 单向分组资料的
4、方差分析。单向分组资料的方差分析。第三节第三节 两向分组资料的方差分析。两向分组资料的方差分析。第三章第三章 方差分析方差分析第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法1.自由度和平方和的分解自由度和平方和的分解2.F分布分布(F Distribution)3.多重比较多重比较(multiple comparisons)4.方差分析的基本假定方差分析的基本假定5.数据转换数据转换第三章第三章 方差分析方差分析1、自由度和平方和的分解、自由度和平方和的分解 设有设有K组样本,每样本均具有组样本,每样本均具有n个观察值,则该资料共有个观察值,则该资料共有nk个观察值,数据如下表
5、。个观察值,数据如下表。组别组别12in总和总和平均平均均方均方1.J.kX11X12X1jX1nX21X22X2jX2nXi1Xi2XijXinX1nX2nXjnXknT1T2TiTk表表 每组具每组具n个观察值的个观察值的k组样本的符号表组样本的符号表第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法Xij,i=1,2,k,j=1,2,n。总变异是总变异是nk个观察值的变异,故其自由度为个观察值的变异,故其自由度为nk1,平方和,平方和SST为:为:式中,式中,C 称为矫正数。称为矫正数。总平方和总平方和(SST)第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法总
6、平方和总平方和SST组内平方和组内平方和SSe处理平方和处理平方和SSt总平方和总平方和SST的计算:的计算:组内的变异为各组内观察值与组平均数的相差,故每组组内的变异为各组内观察值与组平均数的相差,故每组具有具有n1个自由度,平方和为个自由度,平方和为 ,而总共有,而总共有k 组资料,组资料,故组内自由度为故组内自由度为k(n1),而组内平方和),而组内平方和SSe为:为:第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法 上述总变异的自由度和平方和可分解为组间和组内两个上述总变异的自由度和平方和可分解为组间和组内两个部分。组间变异即部分。组间变异即k个平均数的变异,故其自由度为
7、个平均数的变异,故其自由度为k1,平方和平方和 SSt 为:为:因此,上述资料的自由度和平方和的分解式为:因此,上述资料的自由度和平方和的分解式为:总自由度组间自由度总自由度组间自由度 组内自由度组内自由度 (nk-1)()(k1)+k(n-1)总平方和组间平方和总平方和组间平方和 组内平方和组内平方和第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法均方的计算:均方的计算:第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法方差分析表方差分析表变异来源平方和SS自由度DF均方MSF值处理间SStK-1St2St2/Se2处理内/误差SSeK(n-1)Se2总变异SSTn
8、k-1第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法例1:测定东小麦品种东方红3号的蛋白质含量()10次,得其平均数为,方差为;测定农大139号的蛋白质含量5次,得其平均数为,方差为。试测验东方红3号小麦蛋白质含量的变异是否比农大139为大。假设假设:H0:1222;HA:1222。显著水平显著水平:0.05,DF1=9,DF2=4时,F0.05,(9,4)。推断:推断:此F,所以,P0.05接受接受HA,即东方红,即东方红3号小麦蛋白质含量的变异大于农大号小麦蛋白质含量的变异大于农大139。第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法分析分析:两样本分别来自
9、于两个不同的总体,总体方差均为未知,不能假设1222。可采用近似t 分布两尾测验的方法。假设假设:H0:12;HA:12。显著水平显著水平:。回顾t测验法:东方红3:均数:,方差:,n1=10农大139:均数:,方差:,n2=5计算;计算;两个样本的样本容量不同,需转换自由度。推断:推断:接受HA,否定H0,即两品种蛋白质含量有极显著差异。在12时的t 测验,如果两个样本的样本容量相同n1=n2=n,则在t 测验时,可不必进行自由度的转换,可直接取自由度为n1。查表查表,t0.05,11。计算值|t|=5.98 t0.05,11,故计算t值;例2:以A、B、C、D4种药剂处理水稻种子,其中A为
10、对照,每处理得4个苗高观察值,结果如下表,试进行自由度和平方和的分解,并测验药剂间变异是否显著大于药剂内变异?表水稻不同药剂处理的苗高假设假设:H0:1222;HA:1222。显著水平显著水平:0.05,DF1=3,DF2=12时,F0.05,(3,12)。药剂ABCD19232113212427202018191522252722总和76927296T336平均数1923182421第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法自由度分解:自由度分解:总变异自由度总变异自由度44115 药剂间自由度药剂间自由度413 药剂内自由度药剂内自由度4(41)12平方和分解:平方和分
11、解:SST=222 SSt=104 SSe=SST-SSt=222-104=118均方:均方:ST2 St2=104/3=Se2=118/12=其中,其中,Se2为为4种药剂内变异的合并种药剂内变异的合并均方,是试验误差的估计值;药剂均方,是试验误差的估计值;药剂均方均方St2则为试验误差加上不同药剂则为试验误差加上不同药剂对苗高的效应。对苗高的效应。第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法推断推断:接受:接受HA,即测验药剂间变异显著地大,即测验药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高具有不于药剂内变异,不同药剂对水稻苗高具有不同效应。同效应。查表查表5(F值
12、表)值表):自由度(自由度(3;12)第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法F.05;F.01变异平方和自由度均方处理间104334.67误差118129.83总变异2221514.8方差分析表方差分析表平方和平方和 自由度自由度 均方均方 F FSSt=104 3 St2=104/3=34.67 St2/Se2SSe=SST-SSt=118 12 Se2=118/12=SST=222 15 ST2变异来源自由度DF平方和SS 均方MSF值处理间K-1SStSt2=SSt/df1F=St2/Se2误差K(n-1)SSeSe2=Sse/df2总变异nk-1SST第一节第一
13、节 方差分析的基本原理和方法方差分析的基本原理和方法2.F分布分布F Distribution第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法 此此F值具有值具有S12的自由度的自由度1和和S22的自由度的自由度2。如果我们在。如果我们在给定的给定的1和和2下进行一系列抽样,就可得到一系列的下进行一系列抽样,就可得到一系列的F值,值,这一系列的这一系列的F值呈值呈F分布。理论统计研究证明,分布。理论统计研究证明,F分布具有平分布具有平均数均数F1和取值区间为【和取值区间为【0,】的一组曲线,而某一特】的一组曲线,而某一特定的曲线的形状则仅决定于参数定的曲线的形状则仅决定于参数1和
14、和2。1 1或或12时,时,F分布曲线呈反向分布曲线呈反向“J”型;当型;当13时,时,曲线呈偏态。曲线呈偏态。定义:在一个平均数为,方差为的正态总体中,随机抽取两个独立样本,并求得其均方S12和S22,我们将这两个两个均方的比值均方的比值定义为F。F Distribution15,2411,2512,25012345670.20.40.60.81.0因自由度不同的F分布曲线F Distribution当当1 1或或12时,时,F分布曲线呈反向分布曲线呈反向“J”型;型;当当13时,曲线呈偏态。时,曲线呈偏态。f(F)FF分布下一定区间的概率可从已制成的统计表查出。附表5系各种v1和v2下右尾
15、概率和时的临界F值(一尾概率表)。如查附表5,v1=3,v2=12时,F,F,即表示如以v1=3(n1=4)、v2=12(n2=13)在一正态总体中进行连续抽样,则所得F值大于的仅有5%,而大于的仅有1%。所以附表5的数值实际是专供测验S12的总体方差12是否显著大于S22的总体方差22而用的。(H0:1222;HA:1222)。在作F则验时,应以取大值的均方(S12)作分子、取小值的均方(S22)作分母计算F值。若所得FF或F。则该F值即为在或水平上显著,应否定H0,接受HA;若所得FF,则接受H0。F Distribution在方差分析的体系中,F测验某项变异因素的效应或方差是否真实存在。
16、所以在计算F值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异因素(如试验误差项)的均方作分母。这个问题与方差分析的模型和各项变异来源的期望均方有关。在此测验中,如果作分子的均方小于作分母的均方,则F1;此时不必查F表即可确定P0.05,应接受H0。F F 测验需具备:测验需具备:(1)变数x 遵循正态分布N(,2)(2)S12和S22彼此独立两个条件。当资料不符合这些条件时,需作适合转换。F Distribution3.多重比较多重比较(multiple comparisons)在上例中,接受了在上例中,接受了HA,仅是指出了东方红,仅是指出了东方红3号小麦蛋白号小麦蛋白质含量的
17、变异大于农大质含量的变异大于农大139的。但是,是否各个平均数彼此间的。但是,是否各个平均数彼此间都有显著差异呢?还是仅有一部分平均数间有显著差异而另都有显著差异呢?还是仅有一部分平均数间有显著差异而另一部分平均数间没有显著差异?仅根据上述分析结果是无法一部分平均数间没有显著差异?仅根据上述分析结果是无法确定的。要明确各个平均数彼此间的差异显著性,还必须对确定的。要明确各个平均数彼此间的差异显著性,还必须对各平均数进行多重比较。各平均数进行多重比较。、最小显著差数测验法、最小显著差数测验法、最小显著极差测验法、最小显著极差测验法 (1)Duncans新复极差测验法(新复极差测验法(Duncan
18、,1955)(2)q测验测验、比较方法的选择、比较方法的选择 3.1 最小显著差数测验法最小显著差数测验法 least significant difference,简称,简称LSD法。法。用此法测验多个平均数时,首先算得平均数差数用此法测验多个平均数时,首先算得平均数差数的标准误:的标准误:式中,式中,Se2为方差分析时的误差均方值,为方差分析时的误差均方值,n为样本容量。然后为样本容量。然后查查t表得表得Se2所具有自由度下两尾概率值为所具有自由度下两尾概率值为的临界的临界t值值t,计算,计算得最小显著差数:得最小显著差数:若两个平均数的差数若两个平均数的差数LSD,即为在,即为在水平上显
19、著。水平上显著。multiple comparisons例3:以A、B、C、D4种药剂处理水稻种子,各药剂处理后的苗高平均数依次为19、23、18、24cm,作多重比较。假设:假设:H0:B=A,C=A,D=A;HA:BA,CA,DA。显著水平:显著水平:multiple comparisons药剂ABCD19232113212427202018191522252722总和76927296T336平均1923182421已经算得Se2,A为对照。SS DF MS F F 118 12 DF12时,时,显著水平:显著水平:查查t分布表分布表,t,可以看出,只有可以看出,只有XD与对照在上有显著差
20、异,其余两个药与对照在上有显著差异,其余两个药剂和对照无显著差异。剂和对照无显著差异。平均数A19B23C18D24multiple comparisons SS DF MS F F 118 12 注:注:用用LSD法测验多个样本的所有平均数间的差异显法测验多个样本的所有平均数间的差异显著性是不合理的,因为著性是不合理的,因为LSD 实质是实质是t测验。测验。3.2 3.2 最小显著极差测验法最小显著极差测验法 least significant ranges,简称,简称LSR法。此法的特点是法。此法的特点是不同平均数间的比较采用不同的显著差数标准不同平均数间的比较采用不同的显著差数标准,克服
21、了克服了LSD法的局限性,可用于多样本平均数间的差异显著性比法的局限性,可用于多样本平均数间的差异显著性比较。这里主要介绍两种类型:较。这里主要介绍两种类型:(1)Duncans新复极差测验法新复极差测验法(Duncan,1955)又称最短显著极差(又称最短显著极差(Shortest significant ranges,SSR)。)。式中,式中,SE为平均数的标准误;为平均数的标准误;Se2为误差均方,为误差均方,n为样本容量。为样本容量。multiple comparisons 查查SSR表,查得表,查得Se2所具有自由度下,所具有自由度下,P2,3,k 时的时的SSR值,其中值,其中P为
22、两极为两极差间所包含的平均数个数。根据上述公式利差间所包含的平均数个数。根据上述公式利用用SSR值值计算最小显著极差计算最小显著极差LSR 值。值。具体做法是:将各平均数按大小顺序排具体做法是:将各平均数按大小顺序排列,用各个列,用各个P的的LSR值测验平均数极差的显值测验平均数极差的显著性,著性,凡凡两极差两极差LSR LSR 者为接受者为接受H H0 0;凡;凡两极两极差差LSR LSR 者为接受者为接受H HA A。multiple comparisons例3:以A、B、C、D4种药剂处理水稻种子,各药剂处理后的苗高平均数依次为19、23、18、24cm,作多重比较。由于已经算得由于已经
23、算得Se2,且,且A为对照为对照。假设:假设:H0:B=A,C=A,D=A;HA:B A,C A,D A。显著水平显著水平:查查SSR表表,DF12,P2时,时,SSR,LSR同理可得,同理可得,DF12,P3时,时,SSR,LSR同理可得,同理可得,DF12,P4时,时,SSR,LSRmultiple comparisons平均数A19B23C18D24SS DF MS F F118 12 平均数从大到小排序:平均数从大到小排序:D 24B 23A 19C 18D与与B比:比:242314.84;不显著不显著D与与A比:比:241955.23;显显 著著B与与A比:比:231944.84;不
24、显著不显著B与与C比:比:231855.07;不显著不显著A与与C比:比:191814.84;不显著不显著比较依据比较依据:(显著水平:(显著水平:)P2时,时,LSR1.57 P3时,时,LSR1.57 P4时,时,LSR1.57 multiple comparisons平均数从大到小排序:平均数从大到小排序:D 24B 23A 19C 18D与与B比:比:242316.78;不显著不显著D与与A比:比:241957.35;不显著不显著B与与A比:比:231946.78;不显著不显著B与与C比:比:231857.14;不显著不显著A与与C比:比:19181=3时,三种测验方法的显著尺度是不同
25、的。时,三种测验方法的显著尺度是不同的。LSD法最低、法最低、q测验法最高、测验法最高、SSR测验法介于两者之间。因此,对测验法介于两者之间。因此,对于试验结论事关重大或有严格要求的试验,宜采用于试验结论事关重大或有严格要求的试验,宜采用q测验;测验;一般试验可采用一般试验可采用SSR测验;试验中各个处理测验;试验中各个处理皆与皆与对照相比时,对照相比时,可用可用LSD测验。测验。LSD测验必须经过测验必须经过F测验确认各平均数间有显著差异之后,测验确认各平均数间有显著差异之后,才宜应用;而才宜应用;而SSR和和q测验可以不经过测验可以不经过F测验。测验。p234LSR0.054.845.92
26、6.59LSR0.016.787.918.64p234LSR0.054.845.075.23LSR0.016.787.147.35LSD=4.84 LSD最小显著差数最小显著差数法法新复极差测验新复极差测验q测验法测验法multiple comparisons 方差分析的基本步骤小结:方差分析的基本步骤小结:将资料总变异的自由度和平方和分解为各变异因素将资料总变异的自由度和平方和分解为各变异因素的自由度和平方和。的自由度和平方和。计算均方。计算均方。计算均方比,做出计算均方比,做出F测验,以明确各个变异因素的重测验,以明确各个变异因素的重要程度。要程度。对各个平均数进行多重比较。对各个平均数进
27、行多重比较。第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法4、方差分析的基本假定、方差分析的基本假定方差分析的数学模型方差分析的数学模型期望均方期望均方方差分析的基本假定方差分析的基本假定第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法 设在一个平均数为设在一个平均数为,方差为,方差为2的正态总体中随机抽取容的正态总体中随机抽取容量为量为n的一组样本。由于随机误差,每一个的一组样本。由于随机误差,每一个xi都和总体平均数都和总体平均数 有差别,这个差别就是有差别,这个差别就是随机误差随机误差i。另外,不同处理也会。另外,不同处理也会有一定差异,因而可得,有一定差异
28、,因而可得,方差分析的数学模型方差分析的数学模型4、方差分析的基本假定、方差分析的基本假定 是总体平均数,是总体平均数,i为试验处理效应为试验处理效应(i=i-),i为为随机误差,具有分布随机误差,具有分布N(0,2)。组组 12 i n均数均数12.kX11X12X1jX1nX21X22X2jX2nXi1Xi2XijXinXk1Xk2XkjXkn方差分析是建立在一定的方差分析是建立在一定的线性可线性可加模型加模型的基础上,即每一个观察值的基础上,即每一个观察值可以按照变异原因划分为若干个线可以按照变异原因划分为若干个线性组成部分,这是分解平方和和自性组成部分,这是分解平方和和自由度的理论依据
29、。由度的理论依据。将总体分成将总体分成K个组,使每组成为该总体的一个亚总体,个组,使每组成为该总体的一个亚总体,分别给予不同的处理,处理效应为分别给予不同的处理,处理效应为ti,则各个亚总体的平,则各个亚总体的平均数为:均数为:任一个亚组总体的任一个观察值任一个亚组总体的任一个观察值 xij 的线性模型为:的线性模型为:即,每一个观察值皆由共同即,每一个观察值皆由共同原总体平均数原总体平均数、处理效应处理效应和和随机误差随机误差三个部分相加而成。三个部分相加而成。由样本所估计的线性模型为:由样本所估计的线性模型为:4、方差分析的基本假定、方差分析的基本假定由总体的线性模型为:由总体的线性模型为
30、:样本的线性组成为:是 的无偏估计量,ti是i的无偏估计量,是所属亚总体误差方差i2的无偏估计。但假设H0:1=2=时时 可以看作是总可以看作是总体体2的无偏估计。4、方差分析的基本假定、方差分析的基本假定总体的线性模型为:K K个样本的平方和是个样本的平方和是,处理间的方差是:处理间的方差是:因为因为,故,故估计了估计了或写为:不同类型资料的线性可加模型是各不相同的。不同类型资料的线性可加模型是各不相同的。处理效应处理效应t ti i:每一个样本的平方和是:每一个样本的平方和是4、方差分析的基本假定、方差分析的基本假定期望均方期望均方 主要分析主要分析(处理效应处理效应)的假定的假定方差分析
31、的线性模型可分为固定模型(fixedmodel)和随机模型(randommodel):从理论上讲,固定模型是指各处理的平均效应(=i-)是固定的一个常量,且满足i=0,但常数未知;随机模型是指各处理效应i不是一个常量,而是从平均数为0,方差为2 的正态总体中得到的一个随机变量,即iN(0,2)。固定模型主要研究并估计处理效应估计处理效应:即仅在供试范围内了解处理间的效应。如,不同品种、肥料、农药,不同处理方法的差异等。随机模型主要研究并估计总体变异估计总体变异:即通过样本推断总体特征,因为样本仅是总体的随机变量。4、方差分析的基本假定、方差分析的基本假定固定模型仅在供试处理范围内了解处理间的不
32、同效应。例如,欲了解不同药剂的防治效果、不同品种的产量或抗病性差异、肥料、密度处理效应差异等。如果想通过不同处理对这些处理所属总体进行推断,则属于随机模型处理的范围。例如通过一个地方的药剂防治试验想了解某种药剂在该地区或更大范围的应用效果如何?或通过品种试验欲了解该品种在该地区的变异情况如何,则属于随机模型的处理范围。4、方差分析的基本假定、方差分析的基本假定固定模型(fixedmodel)例:有5个品种,各取样3次,组成简单的方差分析资料。组组12345均均数数123X11X12X13X21X22X23X31X32X33X41X42X43X51X52X53变异来源变异来源 SS DF MS
33、期望均方期望均方 品种间品种间 品种内品种内 24.0 10 2.4 2 111.6 14 固定模型中i属于固定效应,限制条件为i=0。为固定效应的方差,即:方差分析表为:品种内均方估计了品种间均方估计了固定效应的方差4、方差分析的基本假定、方差分析的基本假定固定模型的F测验:若处理效应=0(H0:1=2=k),则F的期望值1。该例中F1,则接受HA:0。比较处理效应的试验都应该用固定模型。4、方差分析的基本假定、方差分析的基本假定随机模型(randommodel)例:研究水稻杂交F5代系间单株干草重量的遗传变异,随机抽取76个系进行测验,每系取2个样品测定干草重(g/株)。测定结果的方差分析
34、表如下:变异变异 SS DF MS 期望均方期望均方 系间系间 5459.25 75 72.79 系内系内 1350.52 76 17.77 2 随机模型中i是从总体中随机抽出,服从N(0,2)。这里为随机效应的方差。4、方差分析的基本假定、方差分析的基本假定随机模型的F测验:查表:当n1=75,n2=76时,F.05;F.01该例F,说明系间差异大于系内变异。若处理效应=0(H0:1=2=k),则F的期望值1。该例中F1,则接受HA:0。4、方差分析的基本假定、方差分析的基本假定 变异变异 SS DF MS 期望均方期望均方 系间系间 5459.25 75 72.79 系内系内 1350.5
35、2 76 17.77 2 该例F1,说明存在,即系间差异存在。进一步分析系间差异。这里表示系间差异,即系间遗传变异。2代表环境条件所导致的变异,记作。代表系间表型变异。数量遗传学中的遗传率(h2)为:即F5代家系的表型变异中有60是归属于遗传变异的原因。4、方差分析的基本假定、方差分析的基本假定固定模型与随机模型的区别固定模型与随机模型的区别固定模型随机模型目的研究特定处理处理,即了解几个固定处理的值,对一个试验讲,年间试验处理不变。用效应说明结果。了解处理所在总体总体的某个性状的变异,即了解的变异度,所以每个试验应是随机的,年间试验处理可变。结论仅能说明本试验的结果,不能外推。可以外推到有限
36、总体的变异。F测验 H0:1=2=kH0:0,HA:0表达效应的方差方差分析的基本假定方差分析的基本假定方差分析是建立在一定的线性模型的基础上的。它具有三类原因或效应:(1)处理原因或效应,(2)环境原因或效应,(3)试验误差(这是处理内和环境内的其他非可控因素的变异),故其线性模型为x=+i+j+ij建立这一模型,有如下3个基本假定:4、方差分析的基本假定、方差分析的基本假定方差分析的基本假定方差分析的基本假定处理效应与环境效应应该是处理效应与环境效应应该是“可加性可加性”的。对于的。对于非可加性资料,一般需作对数转换或其他转换,非可加性资料,一般需作对数转换或其他转换,使其效应变为可加性,
37、才能符合方差分析的线性使其效应变为可加性,才能符合方差分析的线性模型。模型。试验误差应该是试验误差应该是随机随机的、彼此的、彼此独立独立的,而且作正的,而且作正态分布,具有平均数为零。态分布,具有平均数为零。N(0,2)所有试验处理必须具有共同的误差方差,即所有试验处理必须具有共同的误差方差,即误差误差同质性同质性假定。假定。4、方差分析的基本假定、方差分析的基本假定(1)处理效应与环境效应等应该是“可加性可加性”依据(xij-)=(i+j+ij)上式两边各取平方求其总和,则得平方和为:(x-)2=bi2aj2ij2因为三类原因均各自独立,所以右边有三个乘积和,即、和,皆为零值。因而得到总平方
38、和等于处理效应平方和加环境效应平方和再加上试验误差平方和。4、方差分析的基本假定、方差分析的基本假定可加性特性是方差分析的主要特性,是根据线性模型而产生的必然结果。当从样本估计时,则为(x-x0)2=b(xi.-x0)2+a(x.j-x0)2+(x-xi.-x.j+x0)2或SST=SSA+SSB+SSe由于方差分析具有效应必须可加的假定,故必然导致试验中的=0,=0和=0。一般言之,即各种效应总和与试验误差总和皆等于零。4、方差分析的基本假定、方差分析的基本假定(2)试验误差应该是随机的、彼此独立的随机的、彼此独立的,而且作正态分布,具有平均数为零。以为多样本的F测验是假定k个样本从k个正态
39、总体中抽取的,所以一定是随机性的。在田间试验中,处理安排在每一区组中均用独立的随机步骤决定独立的随机步骤决定而不用顺序排列;这些措施都是为了保证各个误差的彼此独立性和随机性。顺序排列设计的主要缺点是不能获得无偏的试验误差估计,以致方差分析不能进行。如果试验误差不作正态分布,则将表现为一个处理的误差趋向于作为处理平均数的一种函数关系。例如,在二项分布数据,平均数为p,方差为p(1-p)/n,方差与平均数有函数关系。如果这种函数关系是已知的,则可对观察值进行反正旋转换或对数转换、平方根值转换,从而使误差作成近似的正态分布。4、方差分析的基本假定、方差分析的基本假定(3)所有试验处理必须具有共同的误
40、差方差即误差同质误差同质性性假定因为方差是将各处理的的误差合并而获得一个共同的误差方差,因此必须假定资料中有这样一个共同的方差存在,即假定各处理的都具有N(0,2)的,这就是所谓误差的同质性假定。如果各处理的误差都具有异质性(i22),则在假设测验中必然会使某些处理的效应得不到正确的反映。所以,如果发现各处理内的方差相差比较悬殊,一般可用Bartlett氏法测验其是否同质,如果不同质(i22),可将方差特别大或变异特殊的处理从从全试验中剔除剔除,或者将试验分成几个部分分成几个部分,使每一部分具有比较同质的误差方差,以作出较为准确的假设测验。4、方差分析的基本假定、方差分析的基本假定处理处理可加
41、性可加性倍加性倍加性倍加性取对数倍加性取对数1组组2组组1组组2组组1组组2组组A102010201.001.30B304030601.481.78表表 可加模型与非可加模型的比较可加模型与非可加模型的比较“可加性可加性”5 5、数据转换、数据转换第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法注意注意1组到组到2 组的变化组的变化5 5、数据转换、数据转换v平方根转换:如果样本平均数与其方差有比例关系,平方根转换:如果样本平均数与其方差有比例关系,采用平方根转换可获得一个同质的方差,也可减少采用平方根转换可获得一个同质的方差,也可减少非可加性的影响。非可加性的影响。v对数转换:
42、对于成倍加性或可乘性资料常采用对数对数转换:对于成倍加性或可乘性资料常采用对数转换,可获得一个同质的方差。转换,可获得一个同质的方差。v反正弦转换:对于成数或百分数资料,当反正弦转换:对于成数或百分数资料,当或或时需作时需作反正弦转换。反正弦转换。如如:第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法8020数据(01)比较三种方法是否有差异:A:75、62、71、58、73;B:81、85、68、92、90;C:73、79、60、75、81。地区1(a)地区2(b)处理苗期拔节灌浆苗期拔节灌浆14.008.007.004.010.012.025.007.008.006.012.014.036.009.009.003.59.011.543.003.005.003.56.07.0054.003.006.005.07.06.0063.004.506.002.05.09.0071.003.001.002.003.08.0081.003.002.004.003.58.0092.003.001.501.502.57.00数据(02)比较不同生育期间是否有差异?作业题:作业:P128,;6.9数据(01)、(02)