《生物统计学教案(8).doc》由会员分享,可在线阅读,更多相关《生物统计学教案(8).doc(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、生物统计学教案第八章 单因素方差分析教学时间:5学时教学方法:课堂板书讲授教学目的:重点掌握方差分析的方法步骤,掌握单因素和两因素的方差分析 ,了解多重比较的一些常用方法讲授难点:掌握单因素和两因素的方差分析8.1 方差分析的基本原理8.1.1 方差分析的一般概念第五章讲过两个平均数差异性的比较可用t检验,在多组数据之间作比较便需要通过方差分析来完成。在多组数据之间作比较可以在两两平均数之间比较,但会提高犯I型错误的概率。最简单的方差分析是单因素方差分析。下面举例说明。 例1 调查5个不同小麦品系株高,结果见下表: 品 系 I II III IV V1 64.6 64.5 67.8 71.8
2、69.2 2 65.3 65.3 66.3 72.1 68.23 64.8 64.6 67.1 70.0 69.84 66.0 63.7 66.8 69.1 68.35 65.8 63.9 68.5 71.0 67.5 和 326.5 322.0 336.5 354.0 343.0 平均数 65.3 64.4 67.3 70.8 68.6 例2 从每窝均有4只幼仔的初生动物中,随机选择4窝,称量每只动物的出生重,结果如下: 窝 别 I II III IV 1 34.7 33.2 27.1 32.9 2 33.3 26.0 23.3 31.4 3 26.2 28.6 27.8 25.7 4 31
3、.6 32.3 26.7 28.0 和 125.8 120.1 104.9 118.0 平均数 31.450 30.025 26.225 29.500这两个例子都只有一个因素,例1是“品系”,例2是“窝别”。在每个因素下,又有a个水平(或称为处理),例1有5个品系,例2有4个窝别。a个水平可以认为是a个总体,表中的数据是从a个总体中抽出的a个样本。方差分析的目的就是由这a个样本推断a个总体。因为上述实验都只有一个因素,对这样的数据所进行的方差分析称为“单因素方差分析”。单因素方差分析的典型数据见下表。 X1 X2 X3 Xi Xa 1 x11 x21 x31 xi1 xa1 2 x12 x22
4、 x32 xi2 xa2 3 x13 x23 x33 xi3 xa3 j x1j x2j x3j xij xaj n x1n x2n x3n xin xan平均数 x1. x2. x3. xi. xa.表中的xij表示第i次处理下的第j次观测值,下标中的“.”表示求和,具体说明如下:8.1.2 不同处理效应与不同模型线性统计模型:模型中的xij是在i水平下的第j次观测值。是对所有观测值的一个参数,称为总平均数。i是仅对第i次处理的一个参数,称为第i次处理效应。ij是随机误差成分,要求误差是服从N(0,2)的独立随机变量。固定因素:因素的水平确定后,因素的效应即被确定。因素的a个水平是人为特意选
5、择的。方差分析所得结论只适用于所选定的a个水平。固定效应模型:处理固定因素所使用的模型。随机因素:因素的水平确定之后,其效应并不固定。因素的a个水平是从水平总体中随机抽取的。从随机因素的a个水平所得到的结论,可推广到该因素的所有水平上。随机效应模型:处理随机因素所使用的模型。8.2 固定效应模型8.2.1 线性统计模型其中i是处理平均数与总平均数的离差,因这些离差的正负值相当,因此如果不存在处理效应,各i都应当等于0,否则至少有一个i0。因此,零假设为: H0:12 a0备择假设为: HA:i 0(至少有一个i)8.2.2 平方和与自由度的分解对于每个固定的xi .,因此,以SST表示总平方和
6、,SSA表示处理平方和,SSe表示误差平方和,三者关系为: SSTSSASSe自由度可做同样的分割: dfTdfA + dfe dfTan1 dfAa1 dfeana为了得出检验统计量,以处理平方和与误差平方和除以相应的自由度,得出相应的均方。 MSeSSe/dfe MSASSA/dfA。8.2.3 均方期望与统计量FMSe是2的无偏估计量,证明如下:用同样的方法可以得出MSA的均方期望。因为E(ij)=0, 故所有包含ij乘积项的数学期望都等于0于是:由以上结果可以看出,误差均方MSe是2的无偏估计量。对处理项来说,只有当i0时,MSA才是2的无偏估计量。用MSA和MSe比较,便可以反映出i
7、的大小。为此,使用统计量F作为检验统计量,做上尾单侧检验。F=MSA / MSe,具dfA,dfe自由度,当FF时拒绝零假设,处理平均数间差异显著。在中,令则处理均方可表示为这时的零假设可以记为H0:2 = 0。备择假设记为HA:2 0。将上述结果列在方差分析表中 变差来源 平方和 自由度 均方 F 均方期望 处理间 SSA a1 MSA MSA/MSe 2+n2 误 差 SSe naa MSe 2 总 和 SST na18.2.4 平方和的简易计算令C称为校正项。误差平方和 SSe SSTSSA将例1中的每个数据都减去65,编码后列成下表。 品 系 I II III IV V 1 0.4 0
8、.5 2.8 6.8 4.2 2 0.3 0.3 1.3 7.1 3.2 3 0.2 0.4 2.1 5.0 4.8 4 1.0 1.3 1.8 4.1 3.3 5 0.8 1.1 3.5 6.0 2.5 总和 xi . 1.5 3.0 11.5 29.0 18.0 57.0 xi .2 2.25 9.00 132.25 841.00 324.00 1308.50 xij2 1.93 3.40 29.43 174.46 68.06 277.28将以上结果列成方差分析表:变差来源 平方和 自由度 均方 F 品系间 131.74 4 32.94 42.23* 误 差 15.58 20 0.78 总
9、 和 147.32 24 * 0.01F4,20,0.052.87,F4,20,0.014.43。F F0.01。PFa-1,an-a,时拒绝H0。MSA的期望组成除包含误差方差外,还包含处理项方差,表明不同处理间存在差异。方差分析的程序与固定模型相同,但由于获得样本的方式不同,使之所得结果也不同。随机模型适用于水平总体,而固定模型仅适用于所选定的a个水平。以下是例2的计算结果,将每一数据均减去30。 4.7 3.2 2.9 2.9 3.3 4.0 6.7 1.4 3.8 1.4 2.2 4.3 1.6 2.3 3.3 2.0 总和 xi . 5.8 0.1 15.1 2.0 11.2 xi
10、.2 33.64 0.01 228.01 4.00 265.66 xij2 49.98 33.49 69.03 32.86 185.36将上述结果列成方差分析表 变差来源 平方和 自由度 均方 F 窝间 58.575 3 19.525 1.97 误差 118.945 12 9.912 总和 177.620 15F3,12,0.053.49,F0.05,接受H0。结论是不同窝别动物出生重没有显著差异。8.4 多重比较8.4.1 最小显著差数法(LSD)平均数差数的显著性检验公式为:当n1n2时,当差异显著时后边式子,大于号的右侧称为最小显著差数,记为LSD。8.4.2 Duncan检验检验程序:
11、 将需要比较的a个平均数依次排列好,使之:并将每一对平均数的差列成下表:算出不同对平均数的差的临界值Rk。 其中 上式中的k是要比较的两个平均数之间所包含的平均数的个数。当两个平均数相邻时k2,中间隔一个时k=3等。平均数共有a个,所以需从附表9中查出a1个r,得到a1个临界值Rk。每两个平均数的差与相应的临界值比较,显著的打上一个星花“*”,极显著的打上两个星花“*”。下面对5个小麦品系株高平均数做duncan多重比较.首先将平均数按从高到低顺序排列好。 品系号 IV V III I II 平均数 70.8 68.6 67.3 65.3 64.4 顺序号 1 2 3 4 5根据MSe0.78,n5,dfa(n1)20,k2,3,4,5。将临界值列成表。k 2 3 4 5 k 2 3 4 5r0.05 2.95 3.10 3.18 3.25 r0.01 4.02 4.22 4.33 4.40Rk 1.165 1.225 1.256 1.284 Rk 1.588 1.667 1.710 1.738再以0.05和0.01水平上的临界值与下表中的平均数的差做比较,差异显著的打上“*”,差异极显著的打上“*”。8.5.1 方差分析应具备的条件 1、可加性:各处理效应与误差效应是可加的。2、正态性:NID(0,2)3、方差齐性:各处理的误差方差应具备齐性。77