i第八章 单因素方差分析培训讲学.doc

上传人:1595****071 文档编号:51384289 上传时间:2022-10-18 格式:DOC 页数:51 大小:1.47MB
返回 下载 相关 举报
i第八章 单因素方差分析培训讲学.doc_第1页
第1页 / 共51页
i第八章 单因素方差分析培训讲学.doc_第2页
第2页 / 共51页
点击查看更多>>
资源描述

《i第八章 单因素方差分析培训讲学.doc》由会员分享,可在线阅读,更多相关《i第八章 单因素方差分析培训讲学.doc(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Good is good, but better carries it.精益求精,善益求善。i第八章 单因素方差分析-幻灯片1【例】调查了5个不同小麦品系的株高,结果如下。试判断这5个品系的株高是否存在显著性差异。5个小麦品系株高(cm)调查结果株号品系12345和平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.6幻灯片2第八章单因素方差分析One-f

2、actoranalysisofvariance幻灯片3本章内容第一节方差分析简述第二节固定效应模型第三节随机效应模型第四节多重比较第五节方差分析应具备的条件幻灯片4第一节方差分析简述一、方差分析的一般概念1、概念方差分析(analysisofvariance,ANOVA):是同时判断多组数据平均数之间差异显著性的统计假设检验,是两组数据平均数差异显著性t检验的延伸。ANOVA由英国统计学家R.A.Fisher首创,用于推断多个总体均数有无差异。幻灯片5单因素方差分析(一种方式分组的方差分析):研究对象只包含一个因素(factor)的方差分析。单因素实验:实验只涉及一个因素,该因素有a个水平(处

3、理),每个水平有n次实验重复,这样的实验称为单因素实验。水平(level):每个因素不同的处理(treatment)。幻灯片6方差分析AnalysisofVariance(ANOVA)因素也称为处理因素(factor)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。一个因素(水平间独立)单向方差分析(第八章)两个因素(水平间独立或相关)双向方差分析(第九章)一个个体多个测量值重复测量资料的方差分析ANOVA与回归分析相结合协方差分析目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。幻灯片7【例】随机选取4窝动物,每窝中均有4只幼仔,称量每

4、只幼仔的出生重,结果如下。判断不同窝的动物出生重是否存在显著性差异。4窝动物的出生重单位:g32.931.425.728.0118.029.50027.123.327.826.7104.926.22533.226.028.632.3120.130.02534.733.326.231.6125.831.4501234和平均数窝别动物号幻灯片82、单因素方差分析的数据格式:yi1yi2yi3yijyinYiya1ya2ya3yajyany31y32y33y3jy3ny21y22y23y2jy2ny11y12y13y1jy1n123jn平均数YaY3Y2Y1幻灯片9二、不同处理效应与不同模型1、方差

5、分析中每一观测值的描述线性统计模型yij:在第i水平下的第j次观测值;:总平均数,是对所有观测值的一个参数;i:处理效应,是仅限于对第i次处理的一个参数;ij:随机误差成分。幻灯片102、固定效应:由固定因素所引起的效应。固定因素:所研究因素各个水平是经过特意选择的,这样的因素称为固定因素。固定因素的水平可以严格地人为控制,在水平固定之后,它的效应值也是固定的。固定模型:处理固定因素所用的模型。在固定模型中,方差分析所得到的结论只适合于选定的那几个水平,不能将结论扩展到未加考虑的其它水平上。幻灯片113、随机效应:由随机因素所引起的效应。随机因素:所研究因素各个水平是从该因素水平总体中随机抽出

6、的,这样的因素称为随机因素。随机因素的水平是不能严格人为控制的,在水平确定之后,它的效应值并不固定。随机模型:处理随机因素所用的模型。在随机模型中,方差分析所得到的结论,可以推广到这个因素的所有水平上,是对水平总体的推断。幻灯片12第二节固定效应模型一、线性统计模型要检验a个处理效应的相等性,就要判断各i是否为0。H0:1=2=a=0HA:i0(至少有1个i)若接受H0,则不存在处理效应,每个观测值是由总平均数加上随机误差构成;若拒绝H0,则存在处理效应,每个观测值是由总平均数、处理效应及误差三部分构成。幻灯片13处理间(组间)变异总变异误差或处理内(组内)变异l 总变异是测量值yij与总的均

7、数间的差异。l 处理间变异是由处理效应引起的变异。处理内变异是由随机误差引起的变异。用离均差平方和的平均(均方、方差)反映变异的大小幻灯片14二、平方和与自由度的分解1.总平方和(totalsumofsquares,SST):每个测量值与总平均数离差的平方和的总和,反应了一组数据总的变异程度。计算公式为:dfT=N-1=an-1校正项(校正系数,correction):幻灯片152.处理间平方和(sumofsquaresamongtreatments,SSA):各个处理组的平均数与总平均数离差的平方和,SSA反映了各处理组均数的变异程度。计算公式为:dfA=a-1(含有误差成分)处理均方(tr

8、eatmentmeansquare,MSA):处理间平方和除以自由度。幻灯片163在同一处理组内虽然每个受试对象接受的处理相同,但观测值仍各不相同,这是由随机因素(误差)引起的。误差平方和(errorsumofsquares,SSe)或称处理内平方和(sumofsquareswithintreatment):各处理内部观测值与相应处理平均数离差的平方和,SSe反映了各处理组内观测值的变异程度。计算公式为:dfe=dfT-dfA=an-a误差均方(errormeansquare,MSe):误差平方和除以误差自由度。MSe反映了随机因素所造成的方差的大小。幻灯片17三种变异之间的关系SST=SSA

9、+SSedfT=dfA+dfe处理内变异:随机误差处理间变异:处理因素随机误差幻灯片18One-FactorANOVAPartitionsofTotalVariationTotalVariationSSTVariationDuetoTreatmentSSBVariationDuetoRandomSamplingSSW=+l Commonlyreferredtoas:l SumofSquaresWithin,orl SumofSquaresError,orl WithinGroupsVariationCommonlyreferredtoas:l SumofSquaresAmong,orl Sum

10、ofSquaresBetween,orl SumofSquaresModel,orAmongGroupsVariation幻灯片19均方差,均方(meansquare,MS)幻灯片20三、检验统计量F,做F单侧上尾检验当FF时,拒绝零假设,处理平均数间差异显著,MSA显著高于MSe,产生的变异是由处理因素造成的。幻灯片21F值与F分布,幻灯片22四、方差分析表单因素固定效应模型方差分析表F均方自由度平方和变差来源处理间MSA/MSeMSAa-1SSAa(n-1)MSe误差或处理内SSena-1SST总和幻灯片23五、方差分析的指导思想与基本原理方差分析的指导思想:是将所有测量值间的总变异按照其

11、变异的来源分解为多个部分,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。幻灯片24方差分析的基本原理:将总平方和分解为处理平方和和误差平方和,根据相应的自由度,得到相应的均方;处理均方反映处理因素所造成的方差的大小,误差均方反映随机因素(误差)所造成的方差的大小;处理均方除以误差均方反映处理效应的显著性。幻灯片25六、单因素方差分析与成组数据t检验的异同单因素方差分析成组数据t检验相同平均数差异显著性检验平均数差异显著性检验两个平均数差异的检验多个平均数差异的分析不同利用平均数的差利用平均数的方差计算统计量t计算统计量F幻灯片26七、实例【例8.1】调查了5个不同小麦品系的株高,

12、结果如下。试判断这5个品系的株高是否存在显著性差异。5个小麦品系株高(cm)调查结果株号品系12345和平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.6幻灯片27解:列出方差分析计算表:(编码法-65)序号品系12345-0.40.3-0.21.00.81.52.251.93-0.50.3-0.4-1.3-1.1-3.09.003.42.81.32.

13、11.83.511.5132.2529.436.87.15.04.16.029.0841.00174.464.23.24.83.32.518.0324.0068.06总和57.01308.50277.28利用公式计算各项平方和:幻灯片28列出方差分析表:不同小麦品系株高方差分析表F均方自由度平方和变差来源42.2332.940.78420131.7415.58品系间误差24147.32总和=0.05=0.01F4,20,0.05=2.866F4,20,0.01=4.431FF0.01结论:选定的5个不同小麦品系的株高差异极显著。幻灯片29下结论注意:当组数为2时,完全随机设计的方差分析结果与两

14、样本均数比较的t检验结果等价,对同一资料,有:幻灯片30第三节随机效应模型一、随机效应模型的方差分析1、方差分析的程序与固定效应模型方差分析的程序一样。2、随机效应模型方差分析所得结论适用于水平的总体,固定效应模型方差分析所得结论只适用于所选定的a个水平。幻灯片31二、实例【例8.2】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的出生重,结果如下。判断不同窝的动物出生重是否存在显著性差异。4窝动物的出生重单位:g32.931.425.728.0118.029.50027.123.327.826.7104.926.22533.226.028.632.3120.130.02534.733.3

15、26.231.6125.831.4501234和平均数窝别动物号幻灯片32解:列出方差分析计算表(-30):总和-11.2265.66185.362.91.4-4.3-2.0-2.04.0032.86-2.9-6.7-2.2-3.3-15.1228.0169.033.2-4.0-1.42.30.10.0133.494.73.3-3.81.65.833.6449.981234窝别序号计算各项平方和:幻灯片33列出方差分析表:动物出生重方差分析表15147.32总和1.9719.5259.91231258.575118.945窝间误差F均方自由度平方和变差来源=0.05=0.01F3,12,0.0

16、5=3.49FF0.05结论:不同窝别动物的出生重没有显著差异。幻灯片34三、不等重复时平方和和自由度的计算dfA=a-1dfe=N-adfT=N-1幻灯片35第四节平均值之间的多重比较接受H0(FF),表示各处理组均数不全相等,差异有统计学意义。哪两均数之间差异显著?哪两均数之间差异不显著?需要进一步做多重比较幻灯片36多重比较(multiplecomparison):经过方差分析,若结论是各处理均数差异显著(FF,拒绝H0),则必须在各处理均数之间一对一对地做比较,以判断究竟在哪些对均数之间存在显著差异,哪些对之间没有显著差异,这种比较称为多重比较。幻灯片37累积类错误的概率为当有k个均数

17、需作两两比较时,比较的次数共有c=k!/(2!(k-2)!)=k(k-1)/2设每次检验所用类错误的概率水准为,累积类错误的概率为,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积类错误概率与c有下列关系:1(1)c(8.6)例如,设0.05,c=3(即k=3),其累积类错误的概率为1(1-0.05)3=1-(0.95)3=0.143幻灯片38一、最小显著差数(LeastSignificantDifference,LSD)法1、最小显著差数法:把任意两组数据平均数差的绝对值与LSD比较,以判断不同组数据平均数差异显著性的多重比较方法。2、LSD的公式推导:成组

18、数据t检验当n1=n2称为最小显著差数,记为LSD。幻灯片393、LSD检验程序:计算LSD列表计算每一对平均数差的绝对值|dx|;|dy|与LSD比较,得出结论。当|dy|LSD时,该对平均数差异显著;否则差异不显著。幻灯片40二、Duncan多范围检验Duncanmultiplerangetest1、Duncan多范围检验程序:将需要比较的a个平均数依照从大到小的次序重新排列。原始处理组号平均数重新排序号12a-1ay1y2ya-1ya计算每一对平均数间的差(大值小值),列成表。幻灯片41计算临界值Rk,列表。不同对平均数的差有不同的临界值Rk。r(k,df)的值由附表9(多重比较中的Du

19、ncan表)查出。df=a(n-1),是误差项自由度。dfka(n-1)23a-1ar0.05Rkr0.01Rkk=2,3,ak是相比较的两个平均数间包含的平均数的个数(包括这两个平均数),计算公式是两平均数下标的差加上1。有a个平均数,有a-1个k值,需查出a-1个r,分别乘以Sy,得到a-1个Rk值。幻灯片42比较每一对平均数差与相应的Rk,得出结论。若平均数差大于相应的Rk,说明这一对平均数之间差异显著或者极显著,以符号“”或“”表示;若平均数差小于相应的Rk,说明这一对平均数之间差异不显著。幻灯片432、实例【例8.1】调查了5个小麦品系的株高,结果如下。经方差分析判断这5个品系的株高

20、存在显著性差异,试做多重比较分析。5个小麦品系株高(cm)调查结果株号品系12345和平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.6幻灯片44解:排序:品系号平均数排序号70.8168.6267.3365.3464.45求差:543212346.44.22.90.95.53.32.03.51.32.2列表计算Rk:234520Rkr0.01Rkr0

21、.05kdf1.5881.6671.7101.7384.024.224.334.401.1651.2251.2561.2842.953.103.183.25结论:品系和间株高差异不显著,品系和间株高差异显著,其余各品系间株高差异极显著。幻灯片45二、SNK法SNK(student-Newman-Keuls)法又称q检验,是根据q值的抽样分布作出统计推论(例8-1)。1将各组的平均值按由大到小的顺序排列:顺序(1)(2)(3)(4)平均值28.018.718.514.8原组号BCAD2.计算两个平均值之间的差值及组间跨度k,见表8-3第(2)、(3)两列。3.计算统计量q值4.根据计算的q值及查

22、附表6得到的q界值(p286),作出统计推断。幻灯片46附表6幻灯片47Bonferroni法的适用性当比较次数不多时,Bonferroni法的效果较好。但当比较次数较多(例如在10次以上)时,则由于其检验水准选择得过低,结论偏于保守。幻灯片48三、Tukey法幻灯片49第五节方差分析应具备的条件一、方差分析应满足的三个条件1、可加性:每个处理效应和误差效应是可加的;2、正态性:实验误差应当是服从正态分布的独立随机变量;3、方差齐性:各处理的误差方差应具备齐性。幻灯片50二、多个方差齐性检验Bartlett检验1、Bartlett检验基本原理:当a个随机样本是从独立正态总体中抽取时,可以计算出

23、统计量K2。当n=minni充分大时(n3),K2的抽样分布非常接近于a-1自由度的x2分布。幻灯片512、Bartlett检验程序:假设:H0:12=22=a2HA:至少有两个i2不相等计算检验统计量K2当各处理样本含量相同时结论:当K2x2a-1,时拒绝零假设,方差不齐,应做数据变换;否则,接受零假设,方差具有齐性。幻灯片523、变换平方根变换将每个观测值取其平方根,做方差齐性检验,若方差整齐,然后对平方根进行方差分析。属于泊松分布的数据,常常需要采取平方根变换;当观测数值很小时,如有几个数小于10时,为了矫正,可以使用观测值加上1再取平方根的变换。幻灯片53平方根反正弦变换取每个观测值平

24、方根的反正弦值,然后做方差分析。适用于以百分数表示的二项分布数据。百分数的变化范围很大时,要使用反正弦变换,变换后的数据可以从附表10中查出;百分数的变化范围在020,用平方根变换;百分数的变化范围在80100,先用100减去各百分数,然后做平方根变换;百分数的变化范围在3070,可以不做变换。幻灯片54对数变换取每个观测值对数值,然后做方差分析。大范围的正整数适用于对数变换;对于一些小的数值,如小于10时,每一观测值都加上1再变换。幻灯片55三、方差分析总程序:1、多个方差齐性检验Bartlett检验当K2x2a-1,时,方差不齐,应做数据变换;否则,方差具有齐性,可以进入方差分析程序。2、

25、方差分析列出方差分析计算表(编码法)利用公式计算各项平方和FF时表示各处理组均数差异显著需要进一步做多重比较。列出方差分析表结论3、Duncan多范围检验排序求差计算Rk结论4、得出结论,给予生物学解释幻灯片56第四节方差分析的假定条件和数据转换一、方差分析的假定条件(上述条件与两均数比较的t检验的应用条件相同。)1.各处理组样本来自随机、独立的正态总体(D法、W法、卡方检验);2.各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)二、方差齐性检验1.Bartlett检验法2.Levene等3.最大方差与最小方差之比3,初步认为方差齐同。幻灯片571.Bartlet

26、t检验法幻灯片582.Levene检验法将原样本观察值作离均差变换,或离均差平方变换,然后执行完全随机设计的方差分析,其检验结果用于判断方差是否齐性。因为levene检验对原数据是否为正态不灵敏,所以比较稳健。目前均推荐采用LEVENE方差齐性检验幻灯片59l 三、数据变换l 改善数据的正态性或方差齐性。使之满足方差分析的假定条件。平方根反正弦变换适用于二项分布率(比例)数据。平方根变换适用于泊松分布的计数资料对数变换适用于对数正态分布资料幻灯片60第五节完全随机设计方法简介将120名高血脂患者完全随机分成4个例数相等的组1.编号:120名高血脂患者从1开始到120,见下面表第1行;2.取随机数字:从附表15中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,见下面表的第2行;幻灯片613.排序:按随机数字从小到大(数据相同则按先后顺序)编序号,见下面表的第3行。4.事先规定:序号1-30为甲组,序号31-60为乙组,序号61-90为丙组,序号91-120为丁组,见下面表的第4行。幻灯片62作业:习题第2、3题。-

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁