《《方差分析研》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《方差分析研》PPT课件.ppt(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第十十章章黄志刚公共卫生学院流行病与统计教研室10/27/2022110/27/2022210/27/20223不能用t检验分析两组以上多个均数的比较1、与资料最初的设计要求不符、与资料最初的设计要求不符2、增加犯第一类错误的概率、增加犯第一类错误的概率10/27/2022410/27/20225实例演示样本编号1234567891012.6110.859.239.1110.99.249.5510.289.128.75 S4.295.443.936.554.834.863.883.895.384.08从已知从已知正态总体正态总体N(10,52)随机抽取随机抽取10个样本(个样本(ni=10)
2、的结果)的结果10/27/20226比较组1与31与61与71与91与10t2.0612.3292.3722.2722.918P0.0130.0250.0230.0290.00645次比较中5次有统计学意义的结果实际犯第一类错误的概率:实际犯第一类错误的概率:10/27/20227Analysis of Variance Analysis of Variance(ANOVAANOVA)由英国统计学家首)由英国统计学家首创,为纪念创,为纪念FisherFisher,以,以F F命命名,故方差分析又称名,故方差分析又称F F 检检验验 (F F test test)。用于推断)。用于推断多个总体均
3、数多个总体均数有无差异有无差异.10/27/20228方差分析的含义方差分析的含义方差方差是描述研究对象变异程度的一种指标是描述研究对象变异程度的一种指标方差分析是一种假设检验的方法,就是对变异方差分析是一种假设检验的方法,就是对变异的分析的分析用于两组或两组以上多个均数之间的比较用于两组或两组以上多个均数之间的比较第一节 方差分析的基本思想和应用条件10/27/20229 例例:某研究者为研究煤矿粉尘作业环境对尘肺的影响,将某研究者为研究煤矿粉尘作业环境对尘肺的影响,将24只只Wistar 大鼠随机分到甲、乙、丙三个组,每组大鼠随机分到甲、乙、丙三个组,每组8只,只,分别在地面分别在地面办公
4、楼、煤炭仓库和矿井下染尘,办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重周后测量大鼠全肺湿重,三三组大鼠的全肺湿重有无差别?组大鼠的全肺湿重有无差别?10/27/202210样本均数的差异,可能有两种原因所致样本均数的差异,可能有两种原因所致:1 1、可能由随机误差所致,随机误差包括两种、可能由随机误差所致,随机误差包括两种成分成分个体间的变异个体间的变异和测量误差和测量误差两部分;两部分;2 2、可能是由于各组所接受的处理不同,不同、可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组的处理引起不同的作用和效果,导致各处理组之间均数不同。之间均数不同。10/2
5、7/202211方差分析的基本思想方差分析的基本思想:将所有观察值之间的变异(称总变异)根据离将所有观察值之间的变异(称总变异)根据离均差平方和划分的原理,按设计和需要分解成均差平方和划分的原理,按设计和需要分解成两个或多个部分。每一部分变异都反映了研究两个或多个部分。每一部分变异都反映了研究工作中某种特定的内容(如某种处理因素的作工作中某种特定的内容(如某种处理因素的作用、随机误差的影响等),通过对平均变异的用、随机误差的影响等),通过对平均变异的比较,做出相应的统计判断。比较,做出相应的统计判断。10/27/202212总变异(总变异(Total variation):全部测量值与总均数)
6、:全部测量值与总均数 间间的差别的差别组间变异(组间变异(between group variation)各组的均数各组的均数 与总均数与总均数 间的差异间的差异组内变异(组内变异(within group variation)每组的每组的8个测量值个测量值(观察值)与该组均数(观察值)与该组均数 的差异的差异10/27/20221324只大鼠的全肺湿重大小各不相等,它们之间只大鼠的全肺湿重大小各不相等,它们之间的变异称为总变异。的变异称为总变异。用每个观察值与总均数的离均差平方和来表示,用每个观察值与总均数的离均差平方和来表示,称为总离均差平方和称为总离均差平方和SS总总 1.总变异总变异1
7、0/27/202214SSSS组间组间反映了反映了各组均数各组均数 间间的的变变异程度异程度组间变异组间变异随机误差随机误差+处理因素效应处理因素效应 2.组间变异组间变异m mi m mj在同一处理组内,虽然在同一处理组内,虽然每个受试对象接受的处每个受试对象接受的处理相同,但测量值仍各理相同,但测量值仍各不相同,这种变异称为不相同,这种变异称为组内变异。组内变异。SSSS组内组内仅仅反映了仅仅反映了随机误随机误差差的影响。也称的影响。也称SSSS误差误差3.组内变异组内变异 m m i三种三种“变异变异”之间的关系之间的关系均方均方(mean square,MS)均方之比均方之比F 值值方
8、差分析的检验假设:方差分析的检验假设:H H0 0:为各样本来自均数相等的总体:为各样本来自均数相等的总体 H H1 1:为各总体均数不等或不全相等:为各总体均数不等或不全相等 如果组间变异与组内变异相等,两者的比值即如果组间变异与组内变异相等,两者的比值即统计量统计量F F为为1 1;由于存在抽样误差,两者往往不恰好;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量相等,但相差不会太大,统计量F F应接近于应接近于1 1。因此。因此不拒绝不拒绝H H0 0,可认为各样本均数间的差异,是由于抽,可认为各样本均数间的差异,是由于抽样误差所致,而不是由于处理因素的作用所致。样误差所致,
9、而不是由于处理因素的作用所致。10/27/202220如果各样本均数间的差异,不仅是由抽样误差所如果各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远大致,还有处理因素的作用。此时的组间变异远大于组内变异,两者的比值即统计量于组内变异,两者的比值即统计量F F 明显大于明显大于1 1。因此就要拒绝因此就要拒绝H H0 0,接受,接受H H1 1,可认为各样本均数间的,可认为各样本均数间的差异,并不是由于抽样误差所致,而是处理因素差异,并不是由于抽样误差所致,而是处理因素的作用。的作用。10/27/202221F值要大到何种程度才有统计学意义呢?即,F值要大到何种程度
10、才能认为各组均数间的差各组均数间的差异异是由处理因素处理因素引起而非随机误差呢?可以通过查F界值表,确定P值作出统计推断附表附表7(F界值表)P34110/27/202222F 界值表界值表附表附表7 7 F F界界值值表(方差分析用,表(方差分析用,单侧单侧界界值值)上行:上行:P P=0.05 =0.05 下行:下行:P P分母自由度分母自由度2 2分子的自由度,分子的自由度,1 11 12 23 34 45 56 61 1161161200200216216225225230230234234405240524999499954035403562556255764576458595859
11、2 218.5118.5119.0019.0019.1619.1619.2519.2519.3019.3019.3319.3398.4998.4999.0099.0099.1799.1799.2599.2599.3099.3099.3399.3325254.244.243.393.392.992.992.762.762.602.602.492.497.777.775.575.574.684.684.184.183.853.853.633.63710/27/20222410/27/202225方差分析的基本思想方差分析的基本思想将将总变异总变异分解为分解为组间变异组间变异和和误差(组内)变异误差
12、(组内)变异,然,然后比较两者的均方,即计算后比较两者的均方,即计算F值值,若,若F值大于某个值大于某个临界值,表示处理组间的效应不同,若临界值,表示处理组间的效应不同,若F值接近值接近1时,时,表示处理组间效应相同表示处理组间效应相同(差异仅仅由随机原因所致差异仅仅由随机原因所致)。对于不同设计的方差分析,其基本思想都一样,对于不同设计的方差分析,其基本思想都一样,即均将处理间平均变异与误差平均变异比较。不即均将处理间平均变异与误差平均变异比较。不同之处在于同之处在于变异分解的项目变异分解的项目因设计不同而异。因设计不同而异。10/27/202226方差分析的应用条件:方差分析的应用条件:各
13、样本须是相互独立的随机样本(各样本须是相互独立的随机样本(独立性独立性)各样本来自正态分布总体(各样本来自正态分布总体(正态性正态性)各总体方差相等(各总体方差相等(方差齐性方差齐性)10/27/20222710/27/202228正态分布的判断方法正态分布的判断方法利用利用频数表或频数图频数表或频数图进行判断进行判断 根据专业知识判断:根据专业知识判断:疾病的潜伏期、住院天数和疾病的潜伏期、住院天数和 临床生化指标大多为偏态临床生化指标大多为偏态 经验判断经验判断 若若 ,可认为资料呈偏态分布,可认为资料呈偏态分布 若若 ,则有理由怀疑资料呈偏态分布,则有理由怀疑资料呈偏态分布 正态性检验正
14、态性检验(W检验、检验、D检验)检验)10/27/202229方差齐性的判断方法方差齐性的判断方法 经验判断经验判断 S2MAX/S2MIN5,认为方差不齐;,认为方差不齐;否则认为方差齐性。否则认为方差齐性。方差齐性检验方差齐性检验 10/27/202230方差分析的用途:方差分析的用途:两个或多个样本均数间的比较两个或多个样本均数间的比较分析两个或多个因素间的交互作用分析两个或多个因素间的交互作用回归方程的线性假设检验回归方程的线性假设检验多元线性回归分析中偏回归系数的假设检验多元线性回归分析中偏回归系数的假设检验两样本的方差齐性检验等两样本的方差齐性检验等10/27/202231第二节
15、完全随机设计的方差分析完全随机设计(完全随机设计(completely random design)又称成组设计又称成组设计在实验研究中,按随机化原则将受试对象随机在实验研究中,按随机化原则将受试对象随机分配到某一研究因素的多个水平中去,然后观分配到某一研究因素的多个水平中去,然后观察实验效应;察实验效应;在调查研究中,按一个研究因素的不同水平分在调查研究中,按一个研究因素的不同水平分组,比较各组的效应。组,比较各组的效应。10/27/202232临床研究中,还可能遇到:临床研究中,还可能遇到:比较几种不同疗法治疗某种疾病后某指标的变化,比较几种不同疗法治疗某种疾病后某指标的变化,以评价它们的
16、疗效;以评价它们的疗效;比较某种疾病不同类型之间某一指标有无差别等比较某种疾病不同类型之间某一指标有无差别等均属于一个因素不同水平间几个样本均数的比较,均属于一个因素不同水平间几个样本均数的比较,可用单因素的方差分析(可用单因素的方差分析(one-way ANOVAone-way ANOVA)来处)来处理此类资料理此类资料。10/27/202233处理(研究)因素和水平处理(研究)因素和水平研究因素:血型研究因素:血型 不同水平:不同水平:A B AB O处理因素:药物处理因素:药物 不同水平:同一药物的不同剂量不同水平:同一药物的不同剂量 不同药物不同药物判断原则:判断原则:在统计学上,仅当
17、实验条件有在统计学上,仅当实验条件有2种或种或2种以上的具体表种以上的具体表现时,才称其为现时,才称其为“因素因素”,其具体表现称为,其具体表现称为“水平水平”。10/27/202234例题10/27/202235随机分组方法随机分组方法:1.编号编号,确定分组方案(如较小确定分组方案(如较小12个随机数为个随机数为A组组,中间中间12个数为个数为B组,较大组,较大12个随机数为个随机数为C组)组)2.产生随机数字(查表或电脑),排序产生随机数字(查表或电脑),排序 3.按方案分组按方案分组10/27/202236方差分析的步骤建立假设建立假设 H0:1=2=3(三(三组组大鼠大鼠NO含量含量
18、总总体均数相等)体均数相等)H1:1、2、3不等或不全相等不等或不全相等 a=10/27/202237计算统计量计算统计量10/27/202238列出方差分析表10/27/202239做出统计推断:做出统计推断:查附表查附表7可知,本例可知,本例F=5.564F,。,。按水准,拒绝按水准,拒绝H0,接受,接受H1,认为三组的差别,认为三组的差别具有统计学意义,即可以认为三组的具有统计学意义,即可以认为三组的NO水平水平不同或不全相同。不同或不全相同。10/27/202240第三节随机区组设计的方差分析10/27/202241随机区组设计随机区组设计randomized block design
19、 又称为配伍组设计,是配对设计的扩展。具又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程、动物窝性别、体重、年龄、职业、病情、病程、动物窝别等)将受试对象配成区组别等)将受试对象配成区组(block)(block),再分别将,再分别将各区组内的受试对象随机分配各区组内的受试对象随机分配到各处理或对照组到各处理或对照组10/27/20224210/27/20224310/27/20224410/27/20224510/27/202246变异分解变异分解总变异:总变异:所有观察值之间的变异所
20、有观察值之间的变异处理间变异:处理因素随机误差处理间变异:处理因素随机误差区组间变异:区组因素随机误差区组间变异:区组因素随机误差误差变异:误差变异:随机误差随机误差10/27/202247随机区组设计总变异总变异SS总总和处理组间变异处理组间变异 SS组间组间的计算与完全随机设计的方差分析相同SS区组的计算:10/27/202248数理统计上可以证明,随机区组设计的总变异和自由度可以分解为三部分:10/27/20224910/27/202250随机区组设计方差分析的步骤1、建立假设,确定检验水准、建立假设,确定检验水准 对于处理组对于处理组 H0:1=2=3(即即3种种营营养素养素对对小白鼠
21、体重增加作用相同小白鼠体重增加作用相同)H1:1、2、3不等或不全相等不等或不全相等 a=对于区组对于区组 H0:十个区组的总体均数相等十个区组的总体均数相等 H1:十个区组的总体均数不等或不全相等十个区组的总体均数不等或不全相等 a=10/27/20225110/27/20225210/27/20225310/27/202254随机区组设计的方差分析随机区组设计的方差分析 总变异总变异 和完全随机设计的方差分析相比,误差减和完全随机设计的方差分析相比,误差减小了,统计检验效率提高了。小了,统计检验效率提高了。处理组间变异处理组间变异区组间变异区组间变异误差误差组内变异组内变异10/27/20
22、2255第四节 多个样本均数的两两比较常用的两种方法:常用的两种方法:SNK(Student-Newman-Keuls)检验)检验也称也称q检验,检验,适用于探索性研究,对任意两个样适用于探索性研究,对任意两个样本均数都进行检验本均数都进行检验。LSD-t(least significant difference)最小显著性)最小显著性差异检验差异检验适用于多个处理组与对照组的比较,或某几个处适用于多个处理组与对照组的比较,或某几个处理组间的比较。理组间的比较。10/27/202256SNK-q 检验检验 检验统计量q的计算公式为:式中式中 为两个对比组的样本均数,为两个对比组的样本均数,是方
23、差分析中的误差均方(或组内均方),是方差分析中的误差均方(或组内均方),为两对比组的样本例数。为两对比组的样本例数。v v误差误差 为方差分析中误差均方的自由度。为方差分析中误差均方的自由度。10/27/202257 例例:某研究者为研究煤矿粉尘作业环境对尘肺的影响,将24只Wistar大鼠随机分到甲、乙、丙三个组,每组8只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重,三组大鼠的全肺湿重有无差别?10/27/20225810/27/20225910/27/20226010/27/20226110/27/2022623.确定确定P值,做出统计推断值,做出统计推断 q界值不但
24、考虑自由度,而且考虑组数a,即任意两对比组包含的组数。以组数组数a和查附表8(q界值表)。10/27/202263LSD-t检验检验适用于多个处理组与对照组的比较,或某几个处理组间的比较,一般在设计阶段设计阶段确定哪些均数需进行多重比较。检验统计量t值的计算公式为:10/27/20226410/27/20226510/27/20226610/27/20226710/27/20226810/27/202269小 结方差分析的基本思想方差分析的基本思想完全随机设计方差分析完全随机设计方差分析随机区组设计方差分析随机区组设计方差分析多个样本均数的两两比较方法:多个样本均数的两两比较方法:SNK(Student-Newman-Keuls)q检验检验LSD-t(least significant difference)最小显著)最小显著性差异检验性差异检验10/27/202270