《方差计算方法.pptx》由会员分享,可在线阅读,更多相关《方差计算方法.pptx(145页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 1、检验过程烦琐 例如,一试验包含5个处理,采用t检验法要进行 =10次两两平均数的差异显著性检验;若有k个处理,则要作 k(k-1)/2次类似的检验。下一张 主 页 退 出 上一张 第1页/共145页 2、无统一的试验误差,误差估计的精确性和检验的灵敏性低 对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用 t 检验法作两两比较,由于每次比较需计算一个 ,故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。下一张 主 页 退 出 上一张 第2页/共145页 例如,试验有5个处理,每个处理 重复 6次,共有30个
2、观测值。进行t检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为 2(6-1)=10;若利用整个试验的30个观测值估计试验误差,显然估计的精确性高,且误差自由度为5(6-1)=25。可见,在用t检法进行检验时,由 于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。下一张 主 页 退 出 上一张 第3页/共145页 3、推断的可靠性低,检验的 I 型错误率大 即使利用资料所提供的全部信息估计了试验误差,若用t 检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因 而 会增大犯 I型错误的概率,降低推断的可靠性。由
3、于上述原因,多个平均数的差异显著性检验不宜用 t 检验,须采用方差分析法。方差分析(analysis of variance)是由英国统计学家于1923年提出的。第4页/共145页 这种方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。“方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术”,方差分析实质上是关于观测值变异原因的数量分析。下一张 主 页 退 出 上一张 第5页/共145页
4、 几个常用术语:1、试验指标(experimental index)为 衡 量 试 验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(如血糖含量、体高、体重)等。下一张 主 页 退 出 上一张 第6页/共145页 2、试验因素(experimental factor)试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试
5、验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A、B、C、等表示。下一张 主 页 退 出 上一张 第7页/共145页 3、因素水平(level of factor)试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如比较3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平;研究某种饲料中4种不同能量水平对肥育猪瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因素的4个水平。下一张 主 页 退 出 上一张 第8页/共145页 因素水平用代表该因素的字母加添足标1,2,来表
6、示。如 A1、A2、,B1、B2、,等。4、试验处理(treatment)事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时,试验因素的一个水平就是一个处理。下一张 主 页 退 出 上一张 第9页/共145页 在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验,整个试验共有33=9个水平组合,实施在试验单位(试验猪)上的具体项目就是某品种与某种饲料的
7、结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理。下一张 主 页 退 出 上一张 第10页/共145页 5、试验单位(experimental unit)在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。下一张 主 页 退 出 上一张 第11页/共145页 6、重复(repetition)在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用
8、某种饲料喂4头猪,就说这个处理(饲料)有4次重复。下一张 主 页 退 出 上一张 第12页/共145页第一节 方差分析的基本原理与步骤 本节结合单因素试验结果的方差分析介绍其原理与步骤。一、线性模型与基本假定 假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如表6-1所示。下一张 主 页 退 出 上一张 第13页/共145页 表6-1 k个处理每个处理有n个观测值的 数据模式下一张 主 页 退 出 上一张 第14页/共145页 表中 表示第i个处理的第j个观测值 (i=1,2,k;j=1,2,n);表示第i个处理n个观测值的和;表示全部观测值的总和;表示
9、第i个处理的平均数;表示全部观测值的总平均数;可以分解为下一张 主 页 退 出 上一张 第15页/共145页 (6-1)表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将 再进行分解,令 (6-2)(6-3)则 (6-4)其中 表示全试验观测值总体的平均数;下一张 主 页 退 出 上一张 第16页/共145页 ai 是 第 i 个 处理的效应(treatment effects)表示处理i对试验结果产生的影响。显然有 (6-5)ij是试验误差,相互独立,且服从 正态分布N(0,2)。(6-4)式叫做 单因素试验 的 线 性 模 型(linear model)亦称数学模型。在这个模型
10、中Xii表示为总平均数、处理效应i、试验误差ij之和。下一张 主 页 退 出 上一张 第17页/共145页 由ij 相 互独立且服从正态分布 N(0,2),可知各处理Ai(i=1,2,k)所属总体亦应具正态性,即服从正态分布N(i,2)。尽管各总体的均数 可以不等或相等,2则必须是相等的。所以,单因素试验的数学模型可归纳为:效 应 的 可 加 性 (additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。这也是进行其它类型方差分析的前提或基本假定。下一张 主 页 退 出 上一张 第18页/共145页 若 将 表 (6-1)中 的 观 测 值 xij(
11、i=1,2,k;j=1,2,n)的数据结构(模型)用样本符号来表示,则 (6-6)与(6-4)式比较可知,分 别是、(i-)=、(xij-)=的估计值。下一张 主 页 退 出 上一张 第19页/共145页 (6-4)、(6-6)两式告诉我们:每 个 观 测 值 都包含处理效应(i-或 ),与误差(或 ),故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。第20页/共145页二、平方和与自由度的剖分 在方差分析中是用样本方差即均方(mean squares)来度量资料的变异程度的。表6-1中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将 总 均
12、方 分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。下一张 主 页 退 出 上一张 第21页/共145页 (一)总平方和的剖分 在表6-1中,反映 全部观测值总变异的总平方和是各观测值xij与总平均数的离均差平方和,记为SST。即下一张 主 页 退 出 上一张 第22页/共145页因为第23页/共145页 其中 所以 (6-7)(6-7)式中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复 n 次的处理间变异,称
13、为处理间平方和,记为SSt,即下一张 主 页 退 出 上一张 第24页/共145页 (6-7)式中,为 各处 理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即于是有 SST=SSt+SSe (6-8)这个关系式中三种平方和的简便计算公式如下:下一张 主 页 退 出 上一张 第25页/共145页 (6-9)其中,C=/kn称为矫正数。(二)总自由度的剖分 在计算总平方和时,资料中的各个观测值要受 这一条件的约束,故总自由度等于资料中观测值的总个数减1,即kn-1。总自由度记为dfT,即dfT=kn-1。下一张 主 页 退 出 上一张 第26页/共14
14、5页 在计算处理间平方和时,各处理均数 要受 这一条件的约束,故处理间自由度为处理数减1,即k-1。处理间自由度记为dft,即dft=k-1。在计算处理内平方和时,要受k个条件的约束,即 (i=1,2,k。故处理内自由度为资料中观测值的总个数减k,即kn-k。处理内自由度记为dfe,即dfe=kn-k=k(n-1)。下一张 主 页 退 出 上一张 第27页/共145页 因为 所以 (6-10)综合以上各式得:(6-11)下一张 主 页 退 出 上一张 第28页/共145页 各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为 MST(或 )、MSt(或 )和MSe(或 )
15、。即 (6-12)总均方一般不等于处理间均方加处理内均方。下一张 主 页 退 出 上一张 第29页/共145页 【例6.1】某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。下一张 主 页 退 出 上一张 第30页/共145页 表6-2 饲喂不同饲料的鱼的增重 (单位:10g)下一张 主 页 退 出 上一张 第31页/共145页 这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下:矫正数 总平方和 下一张 主 页 退 出 上一张 第32页/共145页处理间平方和处理内
16、平方和第33页/共145页 总自由度 处理间自由度 处理内自由度 用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方MSe。因为方差分析中不涉及总均方的数值,所以不必计算之。下一张 主 页 退 出 上一张 第34页/共145页三、期望均方 如前所述,方差分析的一个基本假定是要求各 处 理 观 测 值 总 体 的 方 差 相 等 ,即 (i=1,2,k)表示第i个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求,那么各处理的样本方差S21,S22,S2k 都 是 2 的 无 偏 估 计(unbiased estimate)量。S2i(i=1,2,k)是由试验资
17、料中第i个处理的n个观测值算得的方差。下一张 主 页 退 出 上一张 第35页/共145页 显然,各S2i的合并方差 (以各处理内的自由度n-1为权的加权平均数)也是2的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各 的合并。下一张 主 页 退 出 上一张 第36页/共145页 其中SSi、dfi(i=1,2,k)分别表示由试验资料中第i个 处理的n个观测值算得的平方和与自由度。这就是说,处理内均方MSe是误差方差2的无偏估计量。试验中各处理所属总体的本质差异体现在处理效应 的差异上。我们把 称为效应方差,它也反映了各处理观测值总体平均数 的变异程度,记为 。下一张 主 页
18、退 出 上一张 第37页/共145页 (6-13)因为各i未知,所以无法求得 的 确切值,只能通过试验结果中各处理均数的差异去估计。然而,并非 的无偏估计量。这是因为处理观测值的均数间的差异实际上包含了两方面的内容:一 是各处理本质上的差异即i(或i)间的差异,二 是本身的抽样误差。统计学上已经证明,是 +2/n的无偏估计量。因而,我们前面所计算的处理间均方MSt实际上是n +2的无偏估计量。下一张 主 页 退 出 上一张 第38页/共145页 因为MSe是2的无偏估计量,MSt是n +2的无偏估计量,所以2为MSe的数学期望(mathematical expectation),n +2为MS
19、t的数学期望。又因为它们是均方的期望值(expected value),故 又 称 期 望 均 方,简 记 为 EMS (expected mean squares)。当处理效应的方差 =0,亦即各处理观测值总体平均数 (i=1,2,,k)相等时,处理间均方MSt与处理内均方一样,也是误差方差2的估计值,方差分析就是通过 MSt 与MSe的比较来推断 是否为零即 是否相等的。下一张 主 页 退 出 上一张 第39页/共145页 四、F分布与F检验 (一)F分布 设想我们作这样的抽样试验,即在一正态总体N(,2)中随机抽取样本含量为n的样本k个,将 各 样本观测值整理成 表6-1 的形式。此时所
20、谓的各处理没有真实差异,各处理只是随机分的组。因此,由(6-12)式算出的 和 都是误差方差 的估计量。以 为分母,为分子,求其比值。统计学上把两个均方之比值称为F值。即 下一张 主 页 退 出 上一张 第40页/共145页 (6-14)F具有两个自由度:若在给定的k和n的条件下,继续从该总体进行一系列抽样,则可获得一系列的F值。这些F值 所 具 有 的 概 率 分 布 称 为 F 分 布(F distribution)。F 分 布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称,如图6-1所示。下一张 主 页 退 出 上一张 第41页/共
21、145页 F分布的取值范围是(0,+),其平均值 =1。用 表示F分布的概率密度函数,则其分布函数 为:(6-15)因而F分布右尾从 到+的概率为:(6-16)下一张 主 页 退 出 上一张 第42页/共145页 附 表 4 列 出 的 是 不 同 df1 和 df2 下,P(F )=0.05和P(F )=0.01时的F值,即右尾概率=0.05和=0.01时的临界F值,一般记作 ,。下一张 主 页 退 出 上一张 第43页/共145页 (二)F检验 附表4是专门为检验 代表的总体方差是否比 代表的总体方差大而设计的。若实际计算的F值大于 ,则 F 值在=0.05的水平上显著,我们以95%的 可
22、靠性(即冒5%的风险)推断 代 表 的总体方差大于 代表的总体方差。这种用F值出现概率的大小推断两个总体方差是否相等的方法称为 F检验(F-test)。下一张 主 页 退 出 上一张 第44页/共145页 在方差分析中所进行的F 检验目的在于推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零。因此,在计算F 值时总是以被检验因素的均方作分子,以误差均方作分母。应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。下一张 主 页 退 出 上一张 第45页/共145页 在单因素试验结果的方差分析中,无效假设为H0:1=2=k,备择假设为 HA:各i不全相等,或H0:
23、=0,HA:0;F=MSt/MSe,也就是要判断处理间均方是否显著大于处理内(误差)均方。如果结论是肯定的,我们将否定H0;反之,不否定H0。下一张 主 页 退 出 上一张 第46页/共145页 反过来理解:如果H0是正确的,那么MSt与MSe都是总体误差2的估计值,理论上讲F值等于1;如果H0是不正确的,那么 MSt之期望均方中的就不等于零,理论上讲 F 值就必大于1。但是由于抽样的原因,即使H0正确,F值也会出现大于1的情况。所以,只有F值大于1达到一定程度时,才有理由否定H0。下一张 主 页 退 出 上一张 第47页/共145页 实际进行F检验时,是将由试验资料所算得的F值与根据df1=
24、dft (大均方,即分子均方的自由度)、df2=dfe(小均方,即分母均方的自由度)查附表4所得的临界F值 ,相比较作出统计推断的。若F ,即P0.05,不 能 否定H0,统计学上,把这一检验结果表述为:各处理间差异不显著,在F值的右上方标记“ns”,或 不标记符号;第48页/共145页 若 F ,即0.01P0.05,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异显著,在F值的右上方标记“*”;若F ,即P0.01,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异极显著,在 F 值 的 右上方标记“*”。下一张 主 页 退 出 上一张 第49页/共145页
25、对于【例6.1】:因为 F=MSt/MSe=38.09/5.34=7.13*;根据 df1=dft=3,df2=dfe=16 查附表4,得F0.01(3,16);因为 FF0.01(3,16)=5.29,P0.01 表明四种不同饲料对鱼的增重效果差异极显著,用不同的饲料饲喂,增重是不同的。下一张 主 页 退 出 上一张 第50页/共145页 表6-3 表6-2资料方差分析表 下一张 主 页 退 出 上一张 在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表,见表6-3。第51页/共145页 在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及F检验可在
26、方差分析表上进行。下一张 主 页 退 出 上一张 第52页/共145页五、多重比较 F值显著或极显著,否定了无效假设HO,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。下一张 主 页 退 出 上一张 第53页/共145页 因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。多重比较的方法甚多,常用的有最小显著差数法(LSD法
27、)和 最小显著极差法(LSR法),现分别介绍如下。第54页/共145页 (一)最小显著差数法 (LSD法,least significant difference)此法的基本作法是:在F检验显著的 前提下,先 计 算 出 显 著 水 平为的最小显著差数 ,然后将任意两个处理平均数的差数的绝对值 与其比较。下一张 主 页 退 出 上一张 第55页/共145页 若 LSD时,则 与 在水平上差异显著;反之,则在水平上差异不显著。最小显著差数由(6-17)式计算。(6-17)式中:为在F检验中误差自由度下,显著水平为的临界t值,为 均 数差异标准误,由(6-18)式算得。(6-18)下一张 主 页
28、退 出 上一张 第56页/共145页 其中 为F检验中的误差均方,n为各处理的重复数。当显著水平=0.05和0.01时,从t值表中查出 和 ,代入(6-17)式得:(6-19)利用LSD法进行多重比较时,可按如下步骤进行:(1)列出平均数的多重比较表 比较表中各处理按其平均数从大到小自上而下排列;第57页/共145页 (2)计算最小显著差数 和 ;(3)将平均数多重比较表中两两平均数的差数与 、比较,作出统计推断。对于【例6.1】,各 处 理 的多重比较如 表6-4所示。下一张 主 页 退 出 上一张 第58页/共145页 表6-4 四种饲料平均增重的多重比较表 (LSD法)注:表中A4与 A
29、3的差数3.22用q检验法与新复极差法时,在=0.05的水平上不显著。第59页/共145页 因为 查t值表得:t0.05(dfe)=t0.05(16)=2.120 t0.01(dfe)=t0.01(16)=2.921 所以,显著水平为0.05与0.01的最小显著差数为下一张 主 页 退 出 上一张 第60页/共145页 将表6-4中的6个差数与 ,比较:小于 者不显著,在差数的右上方标记“ns”,或不标记符号;介于 与 之间者显著,在差数的右上方标记“*”;大于 者极显著,在差数的右上方标记“*”。第61页/共145页 检验结果除差数 1.68、1.54不显著、3.22 显著外,其余两个差数6
30、.44、4.90极显著。表明 A1饲料对鱼的增重效果极显著高于A2 和 A3,显著高于A4;A4饲料对鱼的增重效果极显著高于A3饲料;A4 与A2、A2 与A3的增重效果差异不显著,以A1饲料对鱼的增重效果最佳。第62页/共145页 关于LSD 法的应用有以下几点说明:1、LSD 法实质上就是t检验法。它是将 t 检验中由所求得的t之绝对值 与临界ta值的比较转为将各对均数差值的绝对值 与最小显著差数 的 比较而作出统计推断的。但是,由于LSD法是利用F检验中的误差自由度 df e 查 临界t值,利用误差均 方 计 算 均 数 差 异 标 准误 ,因而法又不同于每次利用两组数据进行多个 平 均
31、 数 两 两 比较的检验法。它 解 决了本章开头指出的 检 验 法 检验过 程 烦 琐,无统 一 的下一张 主 页 退 出 上一张 第63页/共145页试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但 法并未解决推断的可靠性降低、犯I型错误的概率变大的问题。2、有人提出,与检验任何两个均数间的差异相 比较,LSD法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更适用的方法有顿纳特(Dunnett)法(关于此法,读者可参阅其它有关统计书籍)。第64页/共145页 3、因为LSD法实质上是t检验,故有人指出其最适宜的比较形式是:在进行试验设计时就确定各处
32、理只是固定的两个两个相比,每个处理平均数在比较中只比较一次。例如,在一个试验中共有4个处理,设 计 时 已 确 定 只是处理1与处理2、处理3与处理4(或1与3、2与4;或1与4、2与3)比较,而 其它的处理间不进行比较。因为这种比较形式实际上不涉及多个均数的极差问题,所以不会增大犯I型错误的概率。下一张 主 页 退 出 上一张 第65页/共145页 综上所述,对于多个处理平均数所有可能的两两比较,LSD法的优点在于方法比较简便,克服一般检验法所具有的某些缺点,但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯I型错误概率增大的问题。为克服此弊病,统计学家提出了
33、最小显著极差法。下一张 主 页 退 出 上一张 第66页/共145页 (二)最小显著极差法 (LSR法,Least significant ranges)LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平上依秩次距k的不同而采用的不同的检验尺度叫做 最小显著极差LSR。第67页/共145页 例如有10 个要相互比较,先将10个 依其数值大小顺次排列,两 极 端平均数的差数(极差)的显著性,由 其 差 数 是 否 大于秩次距k=10时的最小显著极差决定(为显著,为不显著);而后是秩次距 k
34、=9 的平均数的极差的显著性,则由极差是否大于k=9 时 的最小显著极差决定;直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距 k=2 时的最小显著极差决定为止。因此,有 k个平均数相互比较,就有 k-1 种秩次距 (k,k-1,k-2,2),因而需求得k-1个最小显著极差(LSR,k),分别作为判断具有相应秩次距的平均数的极差是否显著的标准。下一张 主 页 退 出 上一张 第68页/共145页 因为LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。LSR法克服了LSD法的不足,但检验的工作量有所增加。常用的LSR法有
35、q检验法和新复极差法两种。1、q检验法(q test)此法是以统计量q的概率分布为基础的。q值由下式求得:(6-20)第69页/共145页 式中,为极差,为标准误,分布依赖于误差自由度dfe及秩次距k。利用q检验法进行多重比较时,为了简便起见,不是将由(6-20)式算出的q值 与 临界 q值 比较,而是将极差与 比较,从而作出统计推断。即为水平上的最小显著极差。下一张 主 页 退 出 上一张 第70页/共145页 (6-21)当显著水平=0.05和0.01时,从 附 表5(q值表)中根据自由度 及 秩 次 距 k 查出 和 代入(6-21)式得 (6-22)实际利用q检验法进行多重比较时,可按
36、如下步骤进行:第71页/共145页 (1)列出平均数多重比较表;(2)由自由度dfe、秩次距k查临界q值,计算最小显著极差LSR0.05,k,LSR0.01,k;(3)将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k,LSR0.01,k比较,作出统计推断。对于【例6.1】,各处理平均数多重比较表同表6-4。在表6-4中,极差1.54、1.68、3.22的秩次距为2;极差3.22、4.90的秩次距为3;极差6.44的秩次距为4。下一张 主 页 退 出 上一张 第72页/共145页 因为,MSe=5.34,故标准误 为 根据dfe=16,k=2,3,4 由 附表5查出=0.05、
37、0.01水平下临界q值,乘以标准误求 得各最小显著极差,所得结果列于表6-5。第73页/共145页 表6-5 q值及LSR值下一张 主 页 退 出 上一张 第74页/共145页 将表6-4中的极差1.54、1.68、3.22 与表6-5中的最小显著极差 3.099、4.266比较;将极差3.22、4.90与3.770、4.948比较;将极差6.44与4.184、5.361比较。检验结果,除A4与 A3的差数3.22由LSD法比较时的差异显著变为差异不显著外,其余检验结果同法。第75页/共145页 2、新复极差法(new multiple range method)此法是由邓肯(Duncan)于
38、1955年提出,故又称Duncan法,此法还称SSR法(shortest significant ranges)。新复极差法与q检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查SSR表(附表6)而不是查q值表。最小显著极差计算公式为 (6-23)下一张 主 页 退 出 上一张 第76页/共145页 其中是根据显著水平、误差自由度dfe、秩次距k,由SSR表查得的临界SSR,。=0.05 和=0.01 水平下 的 最小显著极差为:(6-24)对于【例6.1】,各处理均数多重比较表同表6-4。已算出 =1.033,依dfe=16 k=2,3,4,由附表6查临界SSR0.05(16,k)和S
39、SR0.01(16,k)值,乘以 =1.033,求得各最小显著极差,所得结果列于表6-6。第77页/共145页 表6-6 SSR值与LSR值 下一张 主 页 退 出 上一张 第78页/共145页 将表6-4中的平均数差数(极差)与表6-6中的最小显著极差比较,检验结果与 q检验法 相同。当各处理重复数不等时,为简便起见,不论LSD法还是LSR法,可用(6-25)式计算出一个各处理平均的重复数n0,以代替计算 或 所需的n。(6-25)式中k为试验的处理数,(i=1,2,k)为第i处理的重复数。第79页/共145页 以上介绍的三种多重比较方法,其检验尺度有如下关系:LSD法新复极差法q检验法 当
40、秩次距k=2时,取等号;秩次距 k 3时,取小于号。在多重比较中,LSD法的尺度最小,q检验法尺度最大,新复极差法尺度居中。用 上述排列顺序前面方 法 检 验 显 著 的 差 数,用 后 面 方 法 检 验 未 必 显著;用后面 方 法 检 验 显 著 的 差 数,用 前 面 方 法 检 验必 然 显 著。一 般 地 讲 ,一 个下一张 主 页 退 出 上一张 第80页/共145页试验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的 H0 和接受一个不正确的H0的相对重要性来决定。如果否定正确的 H0是事关重大或后果严重的,或对试验要求严格时,用检验法较为妥当;如果接受一个不正确的H
41、0是事关重大或后果严重的,则宜用新复极差法。生物试验中,由于试验误差较大,常采用新复极差法;F检验显著后,为了简便,也 可采用LSD法。第81页/共145页 (三)多重比较结果的表示法 各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。1、三角形法 此法是将多重比较结果直接标记在平均数多重比较表上,如表6-4所示。此法的优点是简便直观,缺点是占的篇幅较大。2、标记字母法 此法是先将各处理平均数由大到小自上而下排列;然后在最大平均数后标记字母,并 将 该 平 均数与 以 下 各 平 均 数依次相比,凡 差 异 不 显著标 记 同 一 字 母,直到某一个与其差异显著的平
42、均数标记字母b;下一张 主 页 退 出 上一张 第82页/共145页 再以标有字母b的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标b,直至显著为止;再以标记有字母 b的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母b,直至某一个与其差异显著的平均数标记c;如此重复下去,直至最小一个平均数被标记、比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。用小写拉丁字母表示显著水平=0.05,用大写拉丁字母表示显著水平=0.01。在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,
43、在科技文献中常见。第83页/共145页 对于【例6.1】,现根据表6-4所表示的 用新复极差法进行多重比较结果用字母标记如表6-7所示(注意,用新复极差法进行多重比较,表6-4中A4与A3的差数3.22在=0.05的水平 上不显著,其余的与LSD法同)。表6-7 表6-4多重比较结果的字母标记(SSR法)下一张 主 页 退 出 上一张 第84页/共145页 在表6-7中,先将各处理平均数由大到小自上而下排列。当显著水平=0.05时,先 在平均 数31.18行上标记字母a;由于31.18与27.96 之差为3.22,在=0.05水平上显著,所以 在 平均数27.96行上标记字母b;然后以标记字母
44、b的平均数27.96 与 其 下方的 平均数 26.28 比较,差数为1.68,在=0.05水平上不显著,所以在平均数26.28行上标记字母b ;再将平均数27.96与平均数24.74比较,差数为3.22,在=0.05水平上不显著,所以在平均数24.74行上标记字母b。类似地,可以在=0.01 将 各 处理平均数标记上字母,结果见表6-7。q检验结果与SSR法检验结果相同。下一张 主 页 退 出 上一张 第85页/共145页 由表6-7看到,A1饲料对鱼的平均增重极显著地高于A2和A3饲料,显著高于A4饲料;A4、A2、A3 三 种 饲料对鱼的平均增重差异不显著。四种饲料其中以A1饲料对鱼的增
45、重效果最好。应当注意,无论采用哪种方法表示多重比较结果,都应注明采用的是哪一种多重比较法。下一张 主 页 退 出 上一张 第86页/共145页 七、方差分析的基本步骤 方差分析的基本步骤归纳如下:(一)计算各项平方和与自由度;(二)列出方差分析表,进行F检验;(三)若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。下一张 主 页 退 出 上一张 第87页/共145页第二节 单因素试验资料的方差分析 根据各处理内重复数是否相等,单因素试验资料的方差分析又分为重复数相等和重复
46、数不等两种情况。本节各举一例予以说明。下一张 主 页 退 出 上一张 第88页/共145页一、各处理重复数相等的方差分析 【例6.3】抽测5个不同品种的若干头母猪的窝产仔数,结果见表6-12,试检验不同品种母猪平均窝产仔数的差异是否显著。表6-12 五个不同品种母猪的窝产仔数下一张 主 页 退 出 上一张 第89页/共145页 这是一个单因素试验,k=5,n=5。现对此试验结果进行方差分析如下:1、计算各项平方和与自由度 下一张 主 页 退 出 上一张 第90页/共145页第91页/共145页 2、列出方差分析表,进行F检验 表6-13 不同品种母猪的窝产仔数的 方差分析表下一张 主 页 退
47、出 上一张 第92页/共145页 根据df1=dft=4,df2=dfe=20查临界F值 得:F0.05(4,20)=2.87,F0.05(4,20)=4.43 因为FF0.01(4,20),即P0.01,表明品种间产仔数的差异达到1%显著水平。3、多重比较 采用新复极差法,各处理平均数多重比较表见表6-14。下一张 主 页 退 出 上一张 第93页/共145页 表6-14 不同品种母猪的平均窝产仔数 多重比较表(SSR法)下一张 主 页 退 出 上一张 第94页/共145页 因为MSe=3.14,n=5,所以 为:根据dfe=20,秩次距k=2,3,4,5由附表6查出=0.05和=0.01的
48、各临界SSR值,乘以 =0.7925,即得各最小显著极差,所得结果列于表6-15。下一张 主 页 退 出 上一张 第95页/共145页 表6-15 SSR值及LSR值下一张 主 页 退 出 上一张 第96页/共145页 将表6-14中的差数与表6-15中相应的最小显著极差比较并标记检验结果。检验结果表明:5号品种母猪的平均窝产仔数极显著高于2号品种母猪,显著高于4号和1号品种,但与3号品种差异不显著;3号品种母猪的平均窝产仔数极显著高于2号品种,与1号和4号品种差异不显著;1号、4号、2号品种母猪的平均窝产仔数间差异均不显著。五个品种中以5号品种母猪的窝产仔数最高,3号品种次之,2号品种母猪的
49、窝产仔数最低。下一张 主 页 退 出 上一张 第97页/共145页二、各处理重复数不等的方差分析 设处理数为k;各处理重复数为n1,n2,nk;试验观测值总数为N=ni。则 (6-28)下一张 主 页 退 出 上一张 第98页/共145页 【例6.4】5个不同品种猪的育肥试验,后期30天增重(kg)如表6-16所示。试比较品种间增重有无差异。表6-16 5个品种猪30天增重下一张 主 页 退 出 上一张 第99页/共145页 此例处理数k=5,各处理重复数不等。现对此试验结果进行方差分析如下:1、计算各项平方和与自由度 下一张 主 页 退 出 上一张 第100页/共145页下一张 主 页 退
50、出 上一张 第101页/共145页 2、列出方差分析表,进行F检验 临界F值为:F0.05(4,20)=2.87,F0.01(4,20)=4.43,因为品种间的F值 5.99F0.01(4,20),P0.01,表明品种间差异极显著。下一张 主 页 退 出 上一张 第102页/共145页 表6-17 5个品种育肥猪增重方差分析表下一张 主 页 退 出 上一张 第103页/共145页 3、多重比较 采用新复极差法,各处理平均数多重比较表见表6-18。因为各处理重复数不等,应先由(6-25)式计算出平均重复次数n0来代替标准误 中的n,此例于是,标准误 为:下一张 主 页 退 出 上一张 第104页