《生物统计学课件教学内容.ppt》由会员分享,可在线阅读,更多相关《生物统计学课件教学内容.ppt(87页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、生物统计学课件 上章介绍了一个或两个样本平均数的假设测验方法。本章将介绍k(k3)个样本平均数的假设测验方法,即方差分析方差分析(analysis of variance)。这种方法的基本特点是:将所有将所有k k个个样本的观察值和平均数作为一个整体加以考虑,样本的观察值和平均数作为一个整体加以考虑,把观察值总变异的自由度和平方和分解为不同变把观察值总变异的自由度和平方和分解为不同变异来源的自由度和平方和,进而获得不同变异来异来源的自由度和平方和,进而获得不同变异来源的总体方差估计值。源的总体方差估计值。*其中,扣除了各种试验原因所引起的变异扣除了各种试验原因所引起的变异后的剩余变异提供了试验
2、误差的无偏估后的剩余变异提供了试验误差的无偏估计,作为假设测验的依据计,作为假设测验的依据。*5.1.1 自由度和平方和的分解自由度和平方和的分解 方差方差是平方和除以自由度的商。要将一个试验资料的总变异分解为各个变异来源的相应变异,首先必须将总自由度和总平方和分解为各个必须将总自由度和总平方和分解为各个变异来源的相应部分变异来源的相应部分。因此,自由度和平方和的分解是方差分析的第一步。下面我们首先用一个例子来说明这一问题。*例5.1以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),试分解其自由度和平方和。药剂苗高观察值总和Ti平均数 A1821201372
3、18B202426229223C101517145614D2827293211629T=336=215*1 1、总变异、总变异 把表中的全部观察值作为一个组看待即把4个处理(4组、每组有4个观察值)合并成一组,共有24个观察值,根据前面讲过的计算平方和的公式,可以计算出总变异的平方和和自由度*自由度DFT=nk-1=44-1=15。表中的每一个观察值,即包括有处理的效应(不同药剂对苗高的影响)又受到误差的影响。其中:称为矫正数矫正数,用C表示。*2 2、误差效应、误差效应表中处理内(组内)各观察值之间,若不存在误差,则各观察值应该相等,由于误差是客观存在的,因而处理内(组内)各观察值之间必然是
4、有差异的,因此,可以用组内(处理内)的差异度量误差效应:*药剂A内:药剂B内:药剂C内:药剂D内:*从理论上讲,这4个误差平方和除以相应的自由度得的误差均方都可以作为总体误差方差的无偏估计值。但是,用它们的加权平均值来估计总体误差方差,则效果更佳。所以:每个组内(处理内)的自由度为:n-1=4-1=3,10*所以误差的自由度为:DFe=k(n-1)=4(4-1)=123 3、处理效应、处理效应如果没有处理效应,表中各个处理(组)平均数来度量处理效应。从理论上讲均应该相等,因此可以用*需要注意的是,系样本平均数的方差,为了进行正确的F 测验,必须使它们都是估的估值,而则是是的估值。因而,处理(组
5、间)平方和计同一参数应为:*13*本例中 平方和:602=504+98自由度:15=3+12因此误差平方和可以采用简单的办法计算SSe=SST-SSt=602-504=98。进而可得均方:*平方和与自由度的分解归纳为下表变异来源DFSSMS处理间(组间)k-1MSt误差(组内)k(n-1)MSe总变异kn-1将上述例子推广到一般,设有k组数据,每组皆具n个观察值,则资料共有nk个观察值,其数据分组如表6.1(P99)。*5.1.2 F分布与分布与F测验测验一、一、F F 分布分布 在一个平均数为、方差为2的正态总体中随机抽取两个独立样本,分别求得和,将和的比值定义为F:其均方*按上述方法从正态
6、总体中进行一系列抽样,就可得到一系列的F值而作成一个F分布。它是具平均数F=1和取值区间为0,的一组曲线;而某一特定曲线的形状仅决定于参数1和2。F分布下一定区间的概率可从已制成的统计表中查出。附表5给出了各种1和2下右尾概率=0.05和=0.0117*二、二、F F 测验测验 在方差分析的体系中,F测验可用于检测某项变异因素的效应或方差是否存在。所以在计算F值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异(如误差项)作分母。时的临界F 值。其值是专供测验的总体方是否显著大于的总体方差差而设计的(H0:对HA:)。*F测验需具备的条件:(1)变数y遵循N(,2);例6.3 在例6
7、.1中算得药剂间均方=168.00,药剂内均方=8.17,具有自由度1=3,2=12。试测验药剂间变异是否显著大于药剂内变异?假设H0:对HA:=0.05和彼此独立。(2)*查附表5在1=3,2=12时 F0.05=3.49,F0.01=5.95实得F F0.01 P0.01测验计算:20*将例6.1和例6.3的分析结果归纳在一起,列出方差分析表如下:变异来源DFSSMSF显著F值药剂处理间3504168.0020.56F0.05=3.49药剂处理内(误差)12988.17F0.01=5.95总变异15602水稻药剂处理苗高方差分析表推断:否定H0:,接受HA:*5.2 多重比较多重比较5.2
8、.1 5.2.1 最小显著差数法最小显著差数法最小显著差数法最小显著差数法5.2.2 5.2.2 q q 法法法法5.2.3 5.2.3 新复极差法新复极差法新复极差法新复极差法5.2.4 5.2.4 多重比较方法的选择多重比较方法的选择多重比较方法的选择多重比较方法的选择22*5.2.1 最小显著差数法最小显著差数法最小显著差数法最小显著差数法(least significant differrence,简称LSD法)*例6.4 试以LSD法测验各种药剂处理的苗高平均数之间的差异显著性。由附表4,=12时,t0.05=2.179,t 0.01=3.055故 LSD0.05=2.1792.02
9、=4.40(cm)LSD0.01=3.0552.02=6.17(cm)24*处理苗高平均数差异显著性0.050.01D29B23A18C14不同药剂处理水稻苗高平均数比较(LSD法)abccAABBCC*5.2.2 q 法法 q q 测验方法测验方法是将k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差LSR值的。*例6.5 试以q法测验各种药剂处理的苗高平均数之间的差异显著性。查附表7,得到当DF=12时,p=2,3,4的q值27*LSR值Pq 0.05q 0.01LSR0.05LSR0.0123.084.324.406.1833.775.04
10、5.397.2144.205.506.017.87处理苗高平均数差异显著性0.050.01D29aAB23 b ABA18 c BCC14 c C不同药剂处理水稻苗高平均数比较(q法)*5.2.3 新复极差法新复极差法 新复极差法新复极差法,又称最短显著极差法(shortest significant range),与q法相似。计算LSR值查的是SSR值(附表8)而不是q表。LSRLSR 值值PSSR 0.05SSR 0.01LSR0.05LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69*5.2.4 多重比较方法的选择多重比较
11、方法的选择1、试验事先确定比较的标准,凡是与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法;2、根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。*方差分析的基本步骤:方差分析的基本步骤:(1)分解平方和与自由度;(2)F测验;(3)平均数的多重比较。31*5.3 方差分析的线性模型与期望均方方差分析的线性模型与期望均方5.3.1 5.3.1 方差分析的线性数学模型方差分析的线性数学模型方差分析的线性数学模型方差分析的线性数学模型5.3.2 5.3.2 期望均方期望均方期望均方期望均方32*5.3.1 方差分析的线性数学模型方差分析的线性数学模型 方差分析是建立在
12、一定的线性可加模型的基础上的。所谓线性可加模型是指总体每一个变量可按其变异的原因分解成若干个线性组成部分,它是方差分析的基础。*表6.1数据的线性模型可表示为:式中,为总体平均数,i为试验处理效应,ij为随机误差具有N(0,2)。34*在以样本符号表示时,样本的线性组成为:是的无偏估计值,*36*5.3.2 期望均方期望均方 在线性可加模型中,由于对i有不同解释产生了固定模型(I)和随机模型(II)。一、固定模型一、固定模型(fixed model(fixed model)指试验的各处理都抽自特定的处理总体,其处理效应i=(i-)是一个固定的常量,我们的目的就在于研究i,所测验的假设是H0:i
13、=0或H0:i=。*一般的栽培和饲养试验,如肥料试验、药效试验、密度试验、饲料试验、品种试验等均属于固定模型。例6.8以5个水稻品种作大区比较试验,每品种作3次取样,测定其产量,所得数据为单向分组资料。本试验需明确各品种的效应,故为固定模型,方差分析和期望均方的参数列入下表:*5个水稻品种产量的方差分析与期望均方表变异来源DFSSMS期望均方(EMS):固定模型品种间品种内41087.624.021.92.40固定模型的处理效应(本例为品种效应)i属于固定效应,固定效应的方差用表示。固定模型的F测验*二、随机模型二、随机模型(random model)(random model)指试验中的各处
14、理皆是抽自N(0,)的一组随机样本,因而处理效应i是随机的,它会因试验的不同而不同;故我们的目的不在于研究i而在于研究i的变异度。随机模型在遗传、育种和生态的研究试验方面有较广泛的用处。*例6.9研究籼粳杂交F5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重(g/株)。因这76个系是随机抽取的样本,要从这些样本来估计F5代系间单株干草重的遗传变异,故这是随机模型。其方差分析的结果如下:变异来源DFMS期望均方(EMS):固定模型系统间系统内757672.7917.77*随机模型的F 测验本例中系统内 MS 估计了2,因而;系统间MS估计了因而*这是测验处理效
15、应的变异度,而不是测验处理效应本身。本例F72.79/17.77=4.09F0.05,说明单株干草重存在遗传变异。43*5.4 单向分组资料的方差分析单向分组资料的方差分析5.4.1 5.4.1 组内观察值数目相等的单向分组内观察值数目相等的单向分组内观察值数目相等的单向分组内观察值数目相等的单向分组资料的方差分析组资料的方差分析组资料的方差分析组资料的方差分析5.4.25.4.2组内又分亚组的单向分组资组内又分亚组的单向分组资组内又分亚组的单向分组资组内又分亚组的单向分组资料的方差分析料的方差分析料的方差分析料的方差分析44*5.4.1 组内观察值数目相等的单向分组资料的方组内观察值数目相等
16、的单向分组资料的方差分析差分析每组具n个观察值的k组数据的符号表组别观察值(yij,i=1,2,k;j=1,2,n)总和 平均 均方1y11y12y1jy1nT12y21y22y2jy2nT2:iyi1yi2yijyinTi:kyk1yk2ykjyknTk T=yij=y *变 异 来 源自由度DF平方和SS均方MSF期望均方EMS固定模型随机模型处理间k-1误 差 k(n-1)总变异nk-1组内观察值数目相等的单向分组资料的方差分析46*5.4.2组内又分亚组的单向分组资料的方差分析组内又分亚组的单向分组资料的方差分析组别亚组观察值亚组总和Tij亚组均数组总和Ti组均数1:T12:T2:i1
17、yi11yi12yi1kyi1nTi1Ti2yi21yi22yi2kyi2nTi2:jyij1yij2yijkyijnTij:myim1yim2yimkyimnTim:lTi*设一系统分组资料共有l组,每组内有m个亚组,每一亚组内有n个观察值,则该资料共有lmn个观察值。其观察值的线性模型为:将该线性模型变型得:*等式的左边是总效应,它是由右边的(1)组间变异;(2)同一组内亚组间变异;(3)同一亚组内各重复观察值间的变异所构成。其自由度和平方和的估计如下:1、总变异自由度DFT=lmn-149*2、组间(处理间)变异 自由度DFt=l-13、同一组内亚组间的变异 自由度*4、亚组内变异 自由
18、度*二级系统分组资料的方差分析变异来源DFSSMSF期望均方(EMS)混合模型随机模型组间l-1组内亚组间l(m-1)亚组内 lm(n-1)总变异lmn-1*例6.12在温室内以4种培养液(l=4)培养某种作物,每种3盆(m=3),每盆4株(n=4),一个月后测定其株高生长量(mm),结果如下表,试作方差分析。培养液ABCD总和盆号A1A2A3B1B2B3C1C2C3D1D2D3生长量503545505555856570606065553540456045607070558565403040505065908070354585354050455055856570707575盆总和Tij1801
19、40175190215220320280280220265290T=2725培养液总和Ti495625880775培养液平均41.352.173.364.6*一、自由度和平方和分解一、自由度和平方和分解总自由度DFT=lmn-1=(434)-1=47培养液间自由度DFt=l-1=4-1=3培养液内盆间自由度DFe1=l(m-1)=4(3-1)=8盆内株间自由度DFe2=lm(n-1)=43(4-1)=36*55*56*2 2、培养液间差异、培养液间差异二、二、F F 测验测验1 1、盆间差异、盆间差异假设H0:,求得:F=157.81/89.06=1.77此F值小于1=8,2=36 F0.05
20、=2.22,所以接受H0假设,求得:*推断:该试验同一培养液内盆间的生长量无显著差异;而不同培养液间的生长量有极显著的差异。F=2375.25/157.81=15.05此F值大于1=3,2=8F0.01=7.59,故否定,接受。*变异来源DFSSMSFF0.05F0.01培养液间37126.562375.5215.054.077.59培养液内盆间81262.50157.811.772.223.04盆内株间363206.2589.06总变异4711595.31方差分析表59*三、各培养液平均数间的比较三、各培养液平均数间的比较pSSR0.05SSR0.01LSR0.05LSR0.0123.264
21、.7411.8317.2133.395.0012.3118.1543.475.1412.6018.664种培养液的LSR值(新复极差测验)*4种培养液植株生长量(mm)的差异显著性培养液平均生长量差异显著性0.050.01C73.3aAD64.6a ABB52.1 b BC A41.3 b C*5.5 两向分组资料的方差分析两向分组资料的方差分析5.5.1 5.5.1 组合内只有单个观察值的两向组合内只有单个观察值的两向组合内只有单个观察值的两向组合内只有单个观察值的两向分组资料的方差分析分组资料的方差分析分组资料的方差分析分组资料的方差分析5.5.2 5.5.2 组合内有重复观察值的两向组合
22、内有重复观察值的两向组合内有重复观察值的两向组合内有重复观察值的两向分组资料的方差分析分组资料的方差分析分组资料的方差分析分组资料的方差分析62*5.5.1 组合内只有单个观察值的两向分组资组合内只有单个观察值的两向分组资料的方差分析料的方差分析设有A和B两个因素,A因素有a个水平,B因素有b个水平,每一处理组合仅有一个观察值,则全试验共有ab个观察值,其资料类型如下表:A因素B因素TiB1B2BbA1y11y12y1bT1.A2y21y22y2bT2.:Aaya1ya2yabTa.T.jT.1T.2T.bT.*观察值的线性模型为:因此,总变异可分解成A因素效应、B因素效应和误差效应三个部分。
23、其自由度和平方和的分解如下表:变异来源DFSSMSF混合模型EMS(A固定,B随机)A因素a-1B因素b-1误 差(a-1)(b-1)总变异ab-1*注意:这种类型资料,其误差项是误差与互作的混合项。因此只有AB不存在互作时,才能正确估计误差。另外,为提高试验的精确性。误差自由度不能小于12。*例5.13采用5种生长素处理豌豆,未处理为对照,待种子发芽后,分别每盆中移植4株,每组6盆,每盆一个处理,试验共有4组24盆,并按组排列于温室中,使同组各盆的环境条件一致。当务盆见第一朵花时记录4株豌豆的总节间数,结果见下表,试作方差分析。66*处理(A)组(B)总和Ti.平均IIIIIIIV未处理(C
24、K)6062616024360.8赤霉素6565686526365.8动力精6361616024561.3吲哚乙酸硫酸腺嘌呤马来酸64626167656263626261646525525325063.863.362.5总和T.j375382377375T1509*(1)自由度和平方和的分解68*变异来源DFSSMSFF0.05F0.01组间35.451.821处理间565.8713.174.562.904.56误差1543.302.89总变异23114.62方差分析表(2)F测验组间效应:假设F1.48/2.89 1*推断:组间环境条件无显著差异,不同生长素处理有显著差异。处理间效应:假设F
25、13.17/2.89=4.56(3)处理间比较此例有预先指定的对照,故用LSD 法。70*查得15时,t0.05=2.131,t0.01=2.947LSD0.05=1.2022.131=2.56,LSD0.01=1.202 2.947=3.54处理平均数与对照的差数对照(CK)赤霉素动力精吲哚乙酸硫酸腺嘌呤马来酸60.865.861.363.863.362.55.0*0.53.0*2.51.7*5.5.2 组合内有重复观察值的两向分组资料的组合内有重复观察值的两向分组资料的方差分析方差分析 设有A、B两个试验因素,A因素有a 个水平,B因素有b个水平,共有ab个处理组合,每个组合有n个观察值,
26、则该资料共有abn个观察值。如果试验按完全随机设计,则其资料类型如下表:*A因素B因素总和Ti.平均B1B2BbA1y111y121y1b1T1.y112y122y1b2y11ny12ny1bnTij.T11.T12.T1b.A2y211y221y2b1T2.y212y222y2b2y21ny22ny2bnTij.T21.T22.T2b.Aaya11ya21yab1Ta.ya12ya22yab2ya1nya2nyabnTij.Ta1.Ta2.Tab.T.j.T.1.T.2.T.b.T.73*线性模型为:各变异来源的自由度和平方和的估计为:变异来源DFSSMS处理组合ab-1 A因素a-1 B因
27、素b-1 AB互作(a-1)(b-1)试验误差ab(n-1)总变异abn-1*例6.14施用A1、A2、A33种肥料于B1、B2、B33种土壤,以小麦为指示作物,每处理组合种3盆,得产量结果(g)如下表,试作方差分析。变异来源MS期望均方(EMS)固定模型随机模型混合模型(A随机、B固定)A因素B因素AB互作试验误差期望均方*肥料种类(A)盆土壤种类(B)总和Ti.平均B1(油沙)B2(二合)B3(白僵)A1121.419.617.6169.218.8221.218.816.6320.116.417.5Tij.62.754.851.7A2112.013.013.3118.213.1214.21
28、3.714.0312.112.013.9Tij.38.338.741.2A3112.814.212.0122.013.6213.813.614.6313.713.314.0Tij.40.341.140.6总和T.j.141.3134.6133.5T=409.4平均15.715.014.876*1、自由度和平方和的分解*2、F 测验将上述结果及自由度录于方差分析表中,以固定模型作F测验78*变异来源DFSSMSFF0.01处理8202.5825.2227.283.71肥料间2179.3889.6996.656.01土类间23.961.982.136.01 肥料土类419.244.815.184.
29、58试验误差1816.700.928总变异26219.28*3、平均数的比较(1)各处理组合平均数的比较p23456789SSR0.052.973.123.213.273.323.353.373.39SSR0.014.074.274.384.464.534.594.644.68LSR0.051.651.731.781.821.851.861.871.88LSR0.012.262.372.442.482.522.552.582.60各处理组合平均数的LSR值*各处理平均数的新复极差测验各处理平均数的新复极差测验处理组合平均数(g)差异显著性0.050.01A1B120.9aAA1B218.3 b
30、 BA1B317.2 b BA2B313.7 c CA3B213.7 c CA3B313.5 c CA3B113.4 c CA2B212.9 c CA2B112.8 c C*(2)各肥类平均数的比较pSSR 0.05SSR 0.01LSR 0.05LSR 0.0122.974.070.951.3033.124.271.001.37肥料种类平均数差异显著性0.050.01A118.8aAA313.6 b BA213.1 b B肥类平均数的LSR测验*5.6 方差分析的基本假定与数据转换方差分析的基本假定与数据转换5.6.1 5.6.1 方差分析的基本假定方差分析的基本假定方差分析的基本假定方差分
31、析的基本假定5.6.2 5.6.2 数据转换数据转换数据转换数据转换83*5.6.1 方差分析的基本假定方差分析的基本假定1 1、可加性、可加性(additivity)(additivity)处理效应与环境效应是可加的,如:2 2、正态性、正态性(normality)(normality)试验误差 应该是随机的、彼此独立的,具有平均数为0而且作正态分布。3 3、同质性、同质性(homogeneity)(homogeneity)所有试验处理必须具有共同的误差方差。*5.6.2 数据转换数据转换1 1、平方根转换、平方根转换(square root transformation)(square r
32、oot transformation)如果样本平均数与其方差有比例关系,则用此转换。2 2、对数转换、对数转换(logarithmic transformation)(logarithmic transformation)如果数据表现出倍加性,则用此转换。*3 3、反正弦转换、反正弦转换(acrsine transformation)(acrsine transformation)如果资料系成数或百分数,则它将作二项分布,而已知这一分布的方差是决定于平均数p的。所以,在理论上如果p0.7则需要作反正弦转换,以获得一个比较一致的方差。4 4、用几个观察值的平均数作方差分析、用几个观察值的平均数作方差分析。*此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢