生物统计学方差分析.pptx

上传人:莉*** 文档编号:36583275 上传时间:2022-08-27 格式:PPTX 页数:167 大小:1.84MB
返回 下载 相关 举报
生物统计学方差分析.pptx_第1页
第1页 / 共167页
生物统计学方差分析.pptx_第2页
第2页 / 共167页
点击查看更多>>
资源描述

《生物统计学方差分析.pptx》由会员分享,可在线阅读,更多相关《生物统计学方差分析.pptx(167页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、基本概念 方差分析:方差分析是对两个或两个以上样本平均数差异显著性检验的方法。 例:为研究某种生物材料的生物学性能,将材料分成三组,分别与成骨细胞共培养1,7,11天后测试细胞活性。为避免误差,每组测试5个样品,试判断材料的生物学性能。第1页/共167页基本概念第2页/共167页两个样本数据平均数比较两个样本数据平均数比较1、当总体方差、当总体方差 和和 已知,或总体方差已知,或总体方差 和和 未未知,但两样本均为大样本知,但两样本均为大样本21212222u 检验检验2、当总体方差、当总体方差 和和 未知,且两样本均为小样本未知,且两样本均为小样本2122t 检验检验检验,然后再检验,考察成

2、组数据:首先检验成对数据:直接tFt2121or第3页/共167页例:例:生产某种纺织品,要求棉花纤维长度平均在生产某种纺织品,要求棉花纤维长度平均在30mm30mm以上。以上。现有一棉花品种,以现有一棉花品种,以n n400400进行抽样,测得纤维平均长度为进行抽样,测得纤维平均长度为30.2mm,30.2mm,标准差为标准差为2.5mm2.5mm,问该棉花品种的纤维长度是否合格?,问该棉花品种的纤维长度是否合格?分析:分析:1 1)已知已知 , , u检验检验 2 2)由于只能大于由于只能大于30mm30mm才能合格,故才能合格,故单尾单尾检验检验400,5 . 2;2 .30;0 .30

3、;0nmmsmmxmm解:解:(1 1)假设)假设 ,即该棉花品种纤维长度不能达到,即该棉花品种纤维长度不能达到纺织品生产要求含量。对纺织品生产要求含量。对30:00H0:AH (2 2)选取显著水平)选取显著水平05. 0(3 3)检验计算)检验计算125. 04005 . 2nssx(4 4)推断)推断 u0.05 ,显著水平上接受显著水平上接受H H0 0,拒绝,拒绝H HA A。即认为该棉花品种纤维长度不符合纺织品种生产要即认为该棉花品种纤维长度不符合纺织品种生产要求求6 . 1125. 00 .302 .30 xsxu第4页/共167页 例 为了探讨不同窝的动物的出生重是否存在差异,

4、随机选取4窝动物,每窝中均有4只幼仔,结果如下: 表表 4窝动物的出生重(克)窝动物的出生重(克) 动物号动物号窝窝 别别1234和和34.733.326.231.6125.833.226.028.632.3120.127.123.327.826.7104.932.931.425.7 28.0118.0平均数平均数31.45030.02526.22529.500 通过对以上数据的分析,判断不同窝别动物通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。出生重是否存在差异。 第5页/共167页方差分析的意义方差分析的意义k个样本均数的比较:个样本均数的比较: 如果仍用如果仍用t检验或检验或

5、u检验,需比较次数为:检验,需比较次数为: 次)!2( ! 2!2kkCk 例如例如4 4个样本均数需比较次数为个样本均数需比较次数为6 6次。次。假设每次比较所确定的检验水准为假设每次比较所确定的检验水准为0.050.05, 则每次检验拒绝则每次检验拒绝H H0 0不犯第一类错误的概率为不犯第一类错误的概率为1-0.05=0.951-0.05=0.95; 那么那么6 6次检验都不犯第一类错误的概率为次检验都不犯第一类错误的概率为(1-0.05)6=0.7351(1-0.05)6=0.7351, 而犯第一类错误的概率为而犯第一类错误的概率为0.26490.2649第6页/共167页方差分析的意

6、义方差分析的意义k个样本均数的比较:个样本均数的比较: 如果仍用如果仍用t检验或检验或u检验,有以下问题:检验,有以下问题: 1 1、检验过程繁琐、检验过程繁琐 2 2、无统一的试验误差,误差估计的精确性和检、无统一的试验误差,误差估计的精确性和检 验的灵敏性低验的灵敏性低 3 3、推断的可靠性降低,犯第、推断的可靠性降低,犯第1 1类错误的概率增加类错误的概率增加第7页/共167页方差分析:是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。u 检验和t 检验可以判断两组数据平均数的差异的显著性, 而方差分析则可以同时判断多组数据平均数之间的差异的显著性。当然,在多组数据

7、的平均数之间做比较时,可以在平均数的所有对之间做 t 检验。但这样做会提高犯型错误的概率,因而是不可取的。 第8页/共167页 方差分析方差分析由英国由英国统计学家统计学家R.A.FisherR.A.Fisher首首创,为纪念创,为纪念FisherFisher,以,以F F命名,故方差分析又命名,故方差分析又称称 F F 检验检验 (F F -test -test)。)。用于推断用于推断多个总体均多个总体均数数有无差异有无差异 第9页/共167页方差分析的定义方差分析的定义 方差分析方差分析是对两个或多个样本平均数差异显著性是对两个或多个样本平均数差异显著性检验的方法。它是将测量数据的总变异按

8、照变异检验的方法。它是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并做出其数量来源分解为处理效应和试验误差,并做出其数量估计。估计。 它将所有处理的观测值作为一个整体,一次比较就对它将所有处理的观测值作为一个整体,一次比较就对多有各组间样本平均数是否有差异做出判断。如果差多有各组间样本平均数是否有差异做出判断。如果差异不显著,则认为它们都是相同的;如果差异显著,异不显著,则认为它们都是相同的;如果差异显著,再进一步比较是哪组数据与其它数据不同。再进一步比较是哪组数据与其它数据不同。第10页/共167页方差分析的意义方差分析的意义方差分析基本思想:方差分析基本思想:1 1、把、把k

9、k个总体当作一个整体看待个总体当作一个整体看待2 2、把观察值的总变异的平方和及自由度分、把观察值的总变异的平方和及自由度分 解为不同来源的平方和及自由度解为不同来源的平方和及自由度3 3、计算不同方差估计值的比值、计算不同方差估计值的比值4 4、检验各样本所属的平均数是否相等、检验各样本所属的平均数是否相等 实际上是观察值变异原因的数量分析实际上是观察值变异原因的数量分析 第11页/共167页方差分析的应用条件和用途方差分析的应用条件和用途方差分析应用条件:方差分析应用条件: 1 1、各样本须是相互独立的随机样本、各样本须是相互独立的随机样本 2 2、各样本来自正态分布总体、各样本来自正态分

10、布总体 3 3、各总体方差相等,即方差齐、各总体方差相等,即方差齐 方差分析基本用途:方差分析基本用途: 1 1、多个样本平均数的比较、多个样本平均数的比较 2 2、多个因素间的交互作用、多个因素间的交互作用 3 3、回归方程的假设检验、回归方程的假设检验 4 4、方差的同质性检验、方差的同质性检验第12页/共167页第一节第一节 方差分析的基本原理方差分析的基本原理第13页/共167页 试验指标试验指标(Experimental index)(Experimental index):试验测定的项目:试验测定的项目或者性状。或者性状。 日增重、产仔数、瘦肉率日增重、产仔数、瘦肉率 试验因素试验

11、因素(Experimental factor)(Experimental factor):影响试验指标:影响试验指标的因素,也称:的因素,也称:处理因素处理因素,简称,简称因素因素或或因子因子。 1 1、可控因素(固定因素):人为可控、可控因素(固定因素):人为可控 2 2、非控因素(随机因素):不能人为控制、非控因素(随机因素):不能人为控制试验因素的表示:试验因素的表示: 大写字母大写字母A A, , B B, , C C, , 等来表示等来表示一、相关术语一、相关术语第14页/共167页 因素水平因素水平(Level of factor)(Level of factor):试验因素所处的

12、特定:试验因素所处的特定状态或者数量等级。简称状态或者数量等级。简称水平水平水平的表示方法:水平的表示方法:用代表该因素的字母添加下标表示,如用代表该因素的字母添加下标表示,如A A1 1,A A2 2,B B1 1,B B2 2 试验处理试验处理(Treatment)(Treatment):实施在试验单位上的具体:实施在试验单位上的具体项目项目, ,简称简称处理处理。 单因素:试验因素的一个水平单因素:试验因素的一个水平 多因素:试验因素的一个水平组合多因素:试验因素的一个水平组合一、相关术语一、相关术语第15页/共167页 试验单位试验单位(Experimental unit)(Exper

13、imental unit):试验载体,即根:试验载体,即根据研究目的而确定的观测总体据研究目的而确定的观测总体 重复重复(Repetition)(Repetition):一个处理实施在两个或者两:一个处理实施在两个或者两个以上的试验单位上,称为处理有重复。个以上的试验单位上,称为处理有重复。试验单位数称为处理的重复数试验单位数称为处理的重复数一、相关术语一、相关术语第16页/共167页 方差分析方差分析是关于是关于k k( (k k3)3)个样本平均数的假设测个样本平均数的假设测验方法,是将验方法,是将总变异总变异按照来源分为按照来源分为处理效应处理效应和和试验试验误差误差,并做出其数量估计。

14、,并做出其数量估计。 发现各变异原因在总变异中相对重要程度的一发现各变异原因在总变异中相对重要程度的一种统计分析方法。种统计分析方法。 二、方差分析的基本原理二、方差分析的基本原理第17页/共167页 总变异总变异分解为分解为组间变异组间变异和和组内变异组内变异。组内变异组内变异是个体差异所致,是抽样误差。是个体差异所致,是抽样误差。组间变异组间变异可能由两种原因所致,可能由两种原因所致, 一是一是抽样误差抽样误差; 二是二是处理不同处理不同。 在抽样研究中抽样误差是不可避免的,故在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原因导致组间变异的第一种原因肯定存在;

15、第二种原因是否存在,需通过假设检验作出推断是否存在,需通过假设检验作出推断二、方差分析的基本原理二、方差分析的基本原理第18页/共167页三、数学模型三、数学模型处理A1 A2 Ai Ak 重复x11 x21 xi1 xk1x12 x22 xi2 xk2 x1j x2j xij xkj x1n x2n xin xkn总和Ti.T1. T2. Ti. Tk.平均 每组具有每组具有n个观测值的个观测值的k组样本数据资料组样本数据资料 ix 1x 2x ix kxxijxT第19页/共167页 例 2.1调查了5个不同小麦品系的株高,结果列于表21。 在这个例子中,只出现“品系”这样一个因素(fac

16、tor),故称单因素。共有5 个不同的品系,我们称品系这一因素共有5个水平(level)。5个品系可以认为是5个总体,表 21的数据是从5个总体中抽出的5个样本,通过比较这5个样本,判断这5个总体是否存在差异。表表 21 5个小麦品系株高调查结果个小麦品系株高调查结果 株号株号株株 高高 1 2 3 4 5 和和 64.665.364.866.065.8326.5 64.565.364.663.763.9322.0 76.866.367.166.868.5336.5 71.872.170.069.171.0354.0 69.268.269.868.367.5343.0 平均数平均数65.364

17、.467.370.868.6第20页/共167页 例 2.2 为了探讨不同窝的动物的出生重是否存在差异,随机选取4窝动物,每窝中均有4只幼仔,结果如下: 表表22 4窝动物的出生重(克)窝动物的出生重(克) 动物号动物号窝窝 别别1234和和34.733.326.231.6125.833.226.028.632.3120.127.123.327.826.7104.932.931.425.7 28.0118.0平均数平均数31.45030.02526.22529.500 通过对以上数据的分析,判断不同窝别动物出生重是否存在通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。差异。 第21页

18、/共167页 以上两个例子的共同点是:每个实验都只有一个因素,该因素有a个水平或称为有a个处理(treatment),这样的实验称为单因素实验。 从单因素实验的每一处理所得到的结果都是一随机变量X i。对于a个处理,各重复n次(或者说做n次观察)的单因素方差分析的一般化表示方法见表23 。表表 23单因素方差分析的典型数据单因素方差分析的典型数据 X1X2X3 X i X a 123 :j nx11 x12x13:x1j:x1nx21 x22x23:x2j:x2nx31 xi1 xa1x32 xi2 xa2x33 xi3 xa3: : :x3j xij xaj: : :x3n xin xan平

19、均数平均数x1 x2 x3 xi xa 第22页/共167页每一个观察值可以通过如下常用的所谓线性统计模型(linear statistical model)描述:) 12(, 2 , 1, 2 , 1njaixijiij其中:其中:xij 是在第是在第 i 水平(处理)下的第水平(处理)下的第 j 次观次观察值。察值。是对所有观察值的一个参量,称为是对所有观察值的一个参量,称为总总平均数平均数(overall mean)。i是仅限于对第是仅限于对第 i 次次处 理 的 一 个 参 量 , 称 为 第处 理 的 一 个 参 量 , 称 为 第 i 次次 处 理 效 应处 理 效 应(treat

20、ment effect)。方差分析的目的,就是要方差分析的目的,就是要检验处理效应的大小或有无。检验处理效应的大小或有无。 ij是随机误差成是随机误差成份。份。第23页/共167页 上述模型中,包括两类不同的处理效应。第一类处理效应称为固定效应(fixed effect),它是由固定因素(fixed factor)所引起的效应。若因素的a个水平是经过特意选择的,则该因素称为固定因素。例如,几个不同的实验温度,几个不同的化学药物或一种药物的几种不同浓度,几个作物品种以及几个不同的治疗方案和治疗效果等。第24页/共167页 在这些情况中,因素的水平是特意选择的,所检验的是关于ai 的假设,得到的结

21、论只适合与方差分析中所考虑的那几个水平,并不能将其结论扩展到未加考虑的其它类似水平上。所以上述的那些因素:温度、药物、品种等,称为固定因素。处理这样的因素所用的模型称为固定效应模型(fixed effect model)。例2.1中的5个小麦品系是特意选择的,目的是从这5 个品系中,选出最优者,因而“品系”这个因素属于固定因素,所用的模型是固定效应模型。 第25页/共167页 第二类处理效应称为随机效应(ran-dom effect),它是由随机因素(random factor)所引起的效应。若因素的a 个水平,是从该因素全部水平的总体中随机抽出的样本,则该因素称为随机因素。从随机因素的a 个

22、水平所得到的结论,可以推广到这个因素的所有水平上。处理随机因素所用的模型称为随机效应模型(random effect mo-del)。例2.2 的动物窝别,是从动物所有可能的窝别中随机选出来的,实验的目的是考查在窝别之间,出生重是否存在差异,因而“窝别”是随机因素。 第26页/共167页 有时固定因素和随机因素很难区分,除上述所讲的原则外,还可以从另一角度鉴别。固定因素是指因素水平,可以严格地人为控制。在水平固定之后,它的效应值也是固定的。例如,研究三种温度对胰蛋白酶水解产物的影响。因为温度水平是可以严格控制的,即每一温度水平,在各个重复之间都可以准确地控制在一个固定值上,所以在重复该实验时,

23、水解产物的产量也是固定的。简单地说,在水平(不同温度)固定以后,其效应值(产量)也是固定的。因此,温度是固定因素。 第27页/共167页 随机因素的水平是不能严格地人为控制的,在水平确定之后,它的效应值并不固定。例如,在研究不同农家肥施用量对作物产量的影响试验中,农家肥是因素,不同施用量是该因素的不同水平,作物的产量是它的效应值。由于农家肥的有效成份很复杂,不能像控制温度那样,将农家肥的有效成份严格地控制在某一个固定值上。在重复试验时即使施以相同数量的肥料,也得不到一个固定的效应值。即在因素的水平(施肥量)固定之后,它的效应值(产量)并不固定,因而农家肥是一随机因素。 第28页/共167页三、

24、数学模型三、数学模型), 0(:2Njiijixxijijiijijiij分布相互独立,且服从正态要求个观测值的试验误差,个处理的第第数个处理观测值总体平均第个观测值个处理的第第kiik11,有:对于总体平均数第29页/共167页三、数学模型三、数学模型为试验误差处理的效应为样本的第为样本平均数模型为:对于由样本估计的线性即有:个处理效应,则为第令ijiijiijijiijiiieitxetxxxi第30页/共167页三、数学模型三、数学模型混合模型固定模型、随机模型和可分为:的不同假定,数学模型根据对处理效应i的估计和比较分析的目的是应,且是由固定因素引起的效是固定的一个常量,效应固定模型:

25、各个处理的iii0估计和检验即侧重在效应的方差的的变异程度,还有效应研究的目的不仅是处理随机变量的正态总体中得到一个是一个随机变量,是从因素所引起的效应。不是一个常量,由随机效应随机模型:各个处理的iiiiN), 0(2混合模型因素,则该试验对应于又包括随机效应的试验应的试验因素,验中,若既包括固定效混合模型:在多因素试第31页/共167页四、平方和与自由度的分解四、平方和与自由度的分解全部观测值的总变异可以用总体方差来度量。全部观测值的总变异可以用总体方差来度量。 方差即均方是离均差平方和除以自由度。方差即均方是离均差平方和除以自由度。把一个实验资料的总变异按变异来源分解为相应的变把一个实验

26、资料的总变异按变异来源分解为相应的变异,首先要将总平方和与总自由度分解为各个变异来异,首先要将总平方和与总自由度分解为各个变异来源的相应部分。源的相应部分。则考察总方差可以考察处理间方差和处理内的方差则考察总方差可以考察处理间方差和处理内的方差第32页/共167页四、平方和与自由度的分解四、平方和与自由度的分解平方和的分解:平方和的分解:总总平方和平方和= =处理处理间间平方和处理平方和处理内内平方和平方和tTeitijijTetTSSSSSSCTnSSCxnkTxSSnkTCSSSSSS那么:令矫正系数:即:222221)()(第33页/共167页四、平方和与自由度的分解四、平方和与自由度的

27、分解自由度的分解:自由度的分解:总总自由度自由度= =处理处理间间自由度处理自由度处理内内自由度自由度) 1() 1() 1(11nkknkdfdfdfkdfnkdfdfdfdftTetTetT即:第34页/共167页四、平方和与自由度的分解四、平方和与自由度的分解计算方差:计算方差:eeetttdfSSsdfSSs22处理内方差处理间方差第35页/共167页五、统计假设的显著性检验五、统计假设的显著性检验F检验检验F F检验的目的:推断处理间的差异是否存在检验的目的:推断处理间的差异是否存在2222022:1etAetetHH即:相等,与误差方差认为处理间方差,的变量假设来同一总体无效假设是

28、把各个处理、假设:、确定显著性水平2第36页/共167页五、统计假设的显著性检验五、统计假设的显著性检验F检验检验223etssF处理内方差处理间方差、计算”或不标记符合值右上方标记“在说明处理间差异不显著,则接受,则如果所计算的值。下的和值表中查出在,从根据确定的显著水平、推断ns,05. 04005. 0FHPFFFdfdfFet”号;值右上方标记“在水平,说明处理间差异达显著,接受,否定,则若FHPFFet,05. 022005. 0”号;值右上方标记“在显著水平,说明处理间差异达极,则若FPFF01. 001. 0注意:注意:方差分析中的方差分析中的F F检验总是检验总是单尾检验单尾检

29、验, ,而且为而且为右尾检验右尾检验第37页/共167页 F F越大,越大,越说明越说明组间方差组间方差是主要方差来源,是主要方差来源, 因子影响越显著;因子影响越显著;F F越小,越小,越说明越说明随机方差随机方差是主要的方差来源,是主要的方差来源, 因子的影响越不显著因子的影响越不显著五、统计假设的显著性检验五、统计假设的显著性检验F检验检验第38页/共167页 egeg. . 某水产研究所为了比较四种不同配合饲料对鱼的饲某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼喂效果,选取了条件基本相同的鱼2020尾,随机分成尾,随机分成4 4组,投喂不同饲料,经组,投喂

30、不同饲料,经1 1个月以后,各组鱼的增重个月以后,各组鱼的增重(g g)资料如下表,试进行方差分析资料如下表,试进行方差分析饲饲料料重复重复A1A1A2A2A3A3A4A41 13193192482482212212702702 22792792572572362363083083 33183182682682732732902904 42842842792792492492452455 5359359262262258258286286 分析分析:1 1个因素,个因素,4 4个水平,个水平,5 5个重复的方差分析个重复的方差分析第39页/共167页 解解:22220:1etAetHH则、假设

31、:05. 02、确定显著性水平01. 0,极显著性水平223etssF 、计算AVERAGESUMi求解采用函数平均数求解采用函数总和xTiSUMSQ平方和求解采用函数第40页/共167页tTeitijTSSSSSSCTnSSCxSSnkTCnk35.11435105.1998605.1517454153744105.15174544555095,42222平方和计算:由题有:163193141191451tTetTdfdfdfkdfnkdf自由度计算:第41页/共167页、推断4”号。值右上方标记“在显著水平,说明处理间差异达极,则因为FPFF01. 001. 0不同饲料饲喂鱼增重的方差分析

32、表不同饲料饲喂鱼增重的方差分析表第42页/共167页二、 固定效应模型 在固定效应模型中, i 是处理平均数与总平均数的离差,且是个常量,因而 )22(01aiia 要检验a个处理效应的相等性,就要 i 判断各是否等于0。若各 i 都等于0,则各处理效应之间无差异。因此,零假设为: 0:210aH备择假设为: HA: i0(至少有1个i)。若接受H0,则不存在处理效应,每个观察值都是由平均数加上随机误差所构成。若拒绝H0,则存在处理效应,每个观察值是由总平均数、处理效应和误差三部分构成。 第43页/共167页 例 2.1调查了5个不同小麦品系的株高,结果列于表21。 在这个例子中,只出现“品系

33、”这样一个因素(factor),故称单因素。共有5 个不同的品系,我们称品系这一因素共有5个水平(level)。5个品系可以认为是5个总体,表 24的数据是从5个总体中抽出的5个样本,通过比较这5个样本,判断这5个总体是否存在差异。表表 21 5个小麦品系株高调查结果个小麦品系株高调查结果 株号株号株株 高高 1 2 3 4 5 和和 64.665.364.866.065.8326.5 64.565.364.663.763.9322.0 76.866.367.166.868.5336.5 71.872.170.069.171.0354.0 69.268.269.868.367.5343.0 平

34、均数平均数65.364.467.370.868.6第44页/共167页解:在方差分析中,为了简化计算可以用编码法。方差分析的编码,必须将全部数据均减去同一个共同的数。在例2.1中,每一个xij都减去65,列成下表,株号株号品品 系系123450.40.30.21.00.80.50.30.41.31.12.81.32.11.83.56.87.15.04.16.04.23.24.83.32.5总总 和和x ix 2ixi j1.52.251.933.09.003.411.5132.2529.4329.0841.0174.4618.0324.068.06571308.50277.28 第45页/共1

35、67页58.1574.13132.14774.13196.129550.1308112tTeaiitSSSSSSCxnSS先计算校正项C 96.129555722naxC再计算32.14796.12928.2771122112CxnaxxSSainjijainjijT第46页/共167页将以上结果列成方差分析表(见表25): 表25 不同小麦品系株高方差分析表 变变 差差 来来 源源平平 方方 和和自自 由由 度度均均 方方 F品品 系系 间间误误 差差131.7415.5842032.720.7841.95* 总总 和和147.3224 * 0.01 当分子自由度为4,分母自由度为20时,F

36、4,20,0.052.87,F4,20,0.014.43,FF0.01。因此,不同小麦品系的株高差异极显著。习惯上用“*”表示在0.05水平上差异显著,用“*”表示在0.01水平上差异显著,常常称为差异“极显著”(highly significant)。 第47页/共167页三、 随机效应模型 在实验中,经常回遇到某个因素有许多可能的水平,若参加实验的a个水平,是从该因素的水平总体中随机选出的,那么这一因素称为随机因素。其方差分析是通过随机选取的a个水平对该因素的水平总体做推断。要求水平的总体是无暇总体,即使不是无限总体,也应相当大,以至于可以认为是无限总体。例2.2中动物的“窝”是随机因素,

37、每一窝是一个水平,这种动物所有的窝构成一水平总体。从该总体中随机选择4个水平(4窝)做实验,实验的目的是希望由这4窝动物去推断该种动物所有不同的窝别之间幼仔出生重是否存在差异。第48页/共167页 固定效应模型中 i0的假设在这里不再适用。在随机模型中,对单个处理效应的检验是无意义的,所要检验的是关于 i的变异性的假设,因而, H0: 20HA: 2 0 如果接受H0: 20,则表示处理之间没有差异;若拒绝H0而接受HA: 20,则表示处理之间存在差异,方差分析的做法仍然是将总平方和分解, )142( etTSSSSSS第49页/共167页自由度做同样分解, etTdfdfdf 由此可得出MS

38、t和MSe。然后用F 单侧检验(具dft ,dfe 自由度), etMSMSF 方差分析的程序与固定效应模型的方差分析程序完全一样,但是结论不同。随机效应模型适用于全部水平的总体,而固定效应模型只适用于所选水平的总体。下面计算例 2.2,并对结果加以解释。第50页/共167页 例 2.2 为了探讨不同窝的动物的出生重是否存在差异,随机选取4窝动物,每窝中均有4只幼仔,结果如下: 表表22 4窝动物的出生重(克)窝动物的出生重(克) 动物号动物号窝窝 别别1234和和34.733.326.231.6125.833.226.028.632.3120.127.123.327.826.7104.932

39、.931.425.7 28.0118.0平均数平均数31.45030.02526.22529.500第51页/共167页 4.7 3.2 2.9 2.9 3.3 4.0 6.7 1.4 3.8 1.4 2.2 4.3 1.6 2.3 3.3 2.0 总总 和和 c c i 5.80 0.10 15.10 2.00 c c 2i 33.64 0.01 228.01 4.00 c c2i j 49.98 33.49 69.03 32.8611.20 265.66 185.36解:将表22中的每一个数值都减去30,列成下表, 第52页/共167页945.118575.5852.177575.5884

40、. 7466.265152.17784. 736.18584. 7162 .111211222tTeaiitainjijTSSSSSSCxnSSCxSSanxC第53页/共167页将上述结果列成方差分析表: 表26 动物出生重方差分析 变变 差差 来来 源源平平 方方 和和自自 由由 度度均均 方方F 窝窝 别别 误误 差差58.575118.94531219.5259.9121.97总总 和和177.5215 查表得知,F3,12,0.053.49,因FF0.05,所以差异不显著。通过对4窝动物出生重的调查,可以推断不同窝别动物的出生重没有显著差异。 第54页/共167页Excel方差分析方

41、差分析OfficeOffice的默认安装中没有的默认安装中没有“数据分析数据分析”要指定才会安装。一旦安装,要指定才会安装。一旦安装,“工具工具”菜单下出菜单下出现现“数据分析数据分析”条,可以用它来方便的做方差分析等统计推断分析。条,可以用它来方便的做方差分析等统计推断分析。可通过运行可通过运行AnalysisAnalysis中的模板文件中的模板文件 ANALYS32.XLLANALYS32.XLL调入此宏调入此宏第55页/共167页加载数据分析加载数据分析如如“工具工具”菜单下没有菜单下没有“数据分析数据分析”单击单击“加载宏加载宏”第56页/共167页Excel解方差分析解方差分析 选一

42、批单元格输入原始数据选一批单元格输入原始数据; ;第57页/共167页Excel解方差分析解方差分析 选选“工具工具”“”“数据分析数据分析”; ;第58页/共167页Excel解方差分析解方差分析选选“工具工具”“”“数据分析数据分析”“单因素方差分析单因素方差分析”第59页/共167页Excel解方差分析解方差分析“单因素方差分析单因素方差分析”对话框中:对话框中: 输入区域,分组方式,输出选项输入区域,分组方式,输出选项第60页/共167页Excel解方差分析解方差分析“单因素方差分析单因素方差分析”对话框中:填入信息后单击对话框中:填入信息后单击“确定确定”按钮按钮第61页/共167页

43、Excel解方差分析解方差分析分析结果分析结果第62页/共167页Excel解方差分析解方差分析方差分析结果表中各项目的含义方差分析结果表中各项目的含义SS SS 平方和平方和df df 自由度自由度MS MS 均方均方F F及及 F crit FF crit F值及值及F F临界值,临界值, F crit=FINV(a, dfF crit=FINV(a, df1 1,df,df2 2) )P-value FP-value F分布概率分布概率 P-value=FDIST(F,dfP-value=FDIST(F,df1 1,df,df2 2) )第63页/共167页 F F检验检验如果否定了如果

44、否定了H H0 0,接受了,接受了H HA A,表明试验的,表明试验的总变异主要来源于处理间的变异总变异主要来源于处理间的变异六、多重比较六、多重比较 多重比较:多重比较:假设对一个固定效应模型经过方假设对一个固定效应模型经过方差分析之后,结论是拒绝差分析之后,结论是拒绝H H0 0,处理之间存在处理之间存在差异。但这并不说在每对处理之间多存在差异。差异。但这并不说在每对处理之间多存在差异。为了弄清究竟在哪些对之间存在显著差异,哪为了弄清究竟在哪些对之间存在显著差异,哪些对之间无显著差异,必须在个处理平均数之些对之间无显著差异,必须在个处理平均数之间一对一对地做比较,这就是多重比较。即:间一对

45、一对地做比较,这就是多重比较。即:多个平均数的相互比较多个平均数的相互比较第64页/共167页六、多重比较六、多重比较 常用的:常用的: 1 1、最小显著差数法(、最小显著差数法(LSDLSD法)法) 2 2、最小显著极差法(、最小显著极差法(LSRLSR法)法) 新复极差检验(新复极差检验(SSRSSR法)法) qq检验检验LSD称为最小显著差数(least significant difference)它的计算方法简述如下: 第65页/共167页 对于任意两组数据的平均数,差数(x1x2)的差异显著性检验,可以用成组数据 t 检验, 2121112121nnMSSSxxtexxxx当n1n

46、2时 nMSSexx221最小显著差数法(最小显著差数法(LSD法)法)样本平均数的差数样本平均数的差数样本平均数差数样本平均数差数的标准误的标准误第66页/共167页 其中MSe为误差方差,即处理内方差,n为每一处理的观察次数,于是 nMSxxte221具k(nk(n1)1)自由度,当t tt t0.050.05时差异显著,当 t tt t0.010.01时差异极显著。因此,当差异显著时 05. 0212tnMSxxe最小显著差数法(最小显著差数法(LSD法)法)第67页/共167页并可得到,当)162(205. 021nMStxxe时差异显著。t0.052MSen 称为最小显著差数,记为

47、LSD。每一对平均数的差与LSD比较,当x1x2 LSD时,差异显著;否则差异不显著。 LSD是一种很有用的检验方法,计算起来很方便,也容易比较。但是它有难以克服的缺点,即这种比较方法将会加大型错误的概率。 最小显著差数法(最小显著差数法(LSD法)法)第68页/共167页LSDLSD法的步骤:法的步骤:nMSsexxji2.最小显著差数法(最小显著差数法(LSD法)法)1 1、计算平均数、计算平均数差差数标准误数标准误2 2、由、由t逆逆函数函数( (TINVTINV) )和平均数差数标准误计算出达到和平均数差数标准误计算出达到差异显著的最小差数,记为差异显著的最小差数,记为LSDLSD.)

48、(jiexxdfstLSDLSDxxji3、将全部平均数、将全部平均数从大到小从大到小依次排列,并比较若依次排列,并比较若 即为在给定的水平上差异显著,即为在给定的水平上差异显著, 反之亦然反之亦然第69页/共167页 说明说明 实质上是实质上是 t t 检验,但统一了标准误检验,但统一了标准误 简单、灵敏(降低了检验标准、夸大了差异的显著性)简单、灵敏(降低了检验标准、夸大了差异的显著性) I I 类错误概率增大类错误概率增大, , 控制单次比较的控制单次比较的I I类错误时应用类错误时应用 无法控制所有比较的总体无法控制所有比较的总体 I I 类错误类错误最小显著差数法(最小显著差数法(L

49、SD法)法)第70页/共167页2、求解达到差异显著的最小差数、求解达到差异显著的最小差数(LSD)临界值:临界值:t0.05(16)=2.120, t0.01(16)= 2.921 LSD0.05(16)=2.120*14.622=31.0 LSD0.01(16)=2.921*14.622=42.7622.145/475.534221.nMSsexxji误、求解平均数差数标准例:3、将全部平均数、将全部平均数从大到小从大到小依次排列,并比较依次排列,并比较第71页/共167页excel数据的排序数据的排序工具数据分析排序与百分比第72页/共167页excel数据的排序数据的排序第73页/共1

50、67页处理处理平均数平均数A1311.864.4*49.0*32.2*A4279.632.2*16.8nsA2262.815.4nsA3247.44 .247.ix8 .262.ix6 .279.ix四种饲料饲喂鱼增重差异显著性四种饲料饲喂鱼增重差异显著性(LSD检验,梯形法检验,梯形法)4、分析结果:、分析结果:A1饲料对鱼增重效果极显著高于饲料对鱼增重效果极显著高于A3和和A2,显著高于,显著高于A4;A4饲料对鱼增重效果显著高于饲料对鱼增重效果显著高于A3;A4和和A2,A2和和A3饲料对鱼增重效果没有显著差异饲料对鱼增重效果没有显著差异第74页/共167页四种饲料饲喂鱼增重差异显著性四

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁