《多个样本均数比较的方差分析2010.3.29.ppt》由会员分享,可在线阅读,更多相关《多个样本均数比较的方差分析2010.3.29.ppt(100页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多个样本均数比较的方差分析AnalysisofVariance1uu用途比较某实验(处理)因素不同水平样本均数间差别有无统计学意义,从而说明该实验因素某水平是否有作用的方法。uu种类根据实验因素的数量分为:单因素方差分析多因素(两因素及以上)方差分析u方差分析由R.A.Fisher(英)首创,又称F检验缩写:ANOV A2RonaldAylmerFisher爵士(18901962)是现代统计学的奠基人之一。他年青时在剑桥大他年青时在剑桥大学主修数学,研究误差学主修数学,研究误差理论、统计力学和量子理论、统计力学和量子理论。理论。他对统计理论与方法的他对统计理论与方法的主要贡献:相关系数的主要贡
2、献:相关系数的抽样分布、方差分析、抽样分布、方差分析、实验设计原则。实验设计原则。3第一节 方差分析的基本思想和应用条件4一、名词解释处理因素和水平u研究者对研究对象人为地施加某种干预措施,称为处理因素(factor)或实验因素;u处理因素所处的不同状态称为水平(level)。处理因素的水平数2,即实验的组数。5 三组战士行军后体温增加数()不饮水定量饮水不限量饮水 1.91.40.91.81.20.71.61.10.91.71.41.11.51.10.91.61.30.91.31.10.81.41.01.01.61.20.9处理因素:饮水方式水平数=36单因素实验实验中的处理因素只有一个,这
3、个处理因素包括g(g2)个水平,分析不同水平实验结果的差别是否有统计学意义。多因素实验实验中的处理因素2,各处理因素的水平2,分析各处理因素各水平的实验结果有无差别、有无交互作用。7u研究一种降血脂新药的临床疗效u研究对象:高血脂病人(120例)处理因素:降血脂药物水平:服降血脂新药2.4g组服降血脂新药4.8g组服降血脂新药7.2g组安慰剂组u试验效应:低密度脂蛋白测量值(mmol/L)单因素实验8安慰剂组3.53 4.59 4.34 2.662.59 30 3.43 102.91 367.85降血脂新药2.4g组2.42 3.36 4.32 2.342.31 30 2.72 81.46 2
4、33.00降血脂新药4.8g组2.86 2.28 2.39 2.281.68 30 2.70 80.94 225.54降血脂新药7.2g组0.89 1.06 1.08 1.273.71 30 1.97 58.99 132.13低密度脂蛋白测量值(mmol/L)分组 n4个处理组低密度脂蛋白测量值合计1202.70324.30958.529u研究饲料中脂肪含量高低、蛋白含量高低对小鼠体重的影响u研究对象:小白鼠处理因素:含脂肪饲料、含蛋白饲料水平:脂肪含量高低蛋白含量高低高低u试验效应:小鼠体重增加量多因素实验10组间变异总变异组内变异二、方差分析的基本思想(单因素)11 三组战士行军后体温增加
5、数()不饮水定量饮水不限量饮水1.91.40.91.81.20.71.61.10.91.71.41.11.51.10.91.61.30.91.31.10.81.41.01.01.61.20.9i=1,2,gj=1,2,n 12组间离均差平方和(处理因素+随机误差)组内离均差平方和(随机误差)总离均差平方和sumofsquaresofdeviationsfrommean,SS1314meansquare,MS15u如果处理因素无作用:组间变异组内变异 F=如果处理因素有作用:组间变异组内变异 FuF界值表(附表3)说明处理因素对实验结果有影响单侧1617三、应用条件1.各样本是相互独立的随机样本
6、;2.各样本数据均服从正态分布;3.相互比较的各样本的总体方差相等,即方差齐性(homogeneityofvariance)。1819第二节完全随机设计资料的方差分析20一、完全随机设计completelyrandomdesign各组例数可以相等或不等甲处理(n1)乙处理(n2)丙处理(n3)试验对象(N)随机化分组21例为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验。完全随机设计分组结果随机数260 873 373 204 056 930 160 905 886 958220 634序 号24 106 39 15 3 114
7、 13 109 108 11716 75编 号1 2 3 4 5 6 7 8 9 10119 120结果 甲 丁 乙 甲 甲 丁 甲 丁 丁 丁 甲 丙 130甲3160乙6190丙91120丁22安慰剂组3.53 4.59 4.34 2.662.59 30 3.43 102.91 367.85降血脂新药2.4g组2.42 3.36 4.32 2.342.31 30 2.72 81.46 233.00降血脂新药4.8g组2.86 2.28 2.39 2.281.68 30 2.70 80.94 225.54降血脂新药7.2g组0.89 1.06 1.08 1.273.71 30 1.97 58
8、.99 132.13低密度脂蛋白测量值(mmol/L)分组 n4个处理组低密度脂蛋白测量值合计1202.70324.30958.52Xij=+Ti+eij23二、变异分解总变异处理因素组间变异组内变异随机误差测量误差个体变异随机误差测量误差个体变异24完全随机设计资料方差分析公式变异来源SS MSF值 校正数:N1总变异组间g1组内Ng25三、分析步骤H0:1=2=3=4H1:i不等或不全相等=0.052627方差分析表变异来源SS MSFP总82.10119组间32.16310.7224.930.01组内49.941160.43附表4结论:按=0.05水平,拒绝H0,接受H1,认为四组均数的
9、差异有统计学意义,不同剂量药物对血脂中低密度脂蛋白降低有影响。28注意:u当拒绝H0,接受H1,不能说明各组总体均数两两间都有差别,要进行多个均数间多重比较。u29第三节随机区组设计资料的方差分析30u又称配伍组设计 是配对设计的扩大u先按影响实验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组,再分别将区组内的受试对象随机分配到各处理组或对照组。一、随机区组设计randomizedblockdesignu将区组间变异从组内变异中分离出来,减少了组内变异,提高了统计检验效率。31例:比较三种抗癌药物对小白鼠肉瘤抑瘤效果处理因素:抗癌药物(A、B、C)实验对象及例数:
10、染肉瘤小白鼠15只实验效应:肉瘤重量控制因素:小白鼠体重实验设计:随机区组设计方法:将体重相近的3只小白鼠配为一个区组,共5个区组;在区组内随机分配处理因素。32 不同药物作用后小白鼠肉瘤重量(g)区组 A药 B药 C药1 0.82 0.65 0.51 1.982 0.73 0.54 0.23 1.503 0.43 0.34 0.28 1.054 0.41 0.21 0.31 0.935 0.68 0.43 0.24 1.353.07 2.17 1.57 6.810.614 0.434 0.314 0.4542.0207 1.0587 0.5451 3.624533例如何按随机区组设计,分配5
11、个区组的15只小白鼠接受甲、乙、丙三种抗癌药物?5个区组小白鼠按随机区组设计分配结果区组号 1 2 3 4 5小白鼠随机数 68 35 26 00 99 53 93 61 28 52 70 05 48 34 56序 号 3 2 1 1 3 2 3 2 1 2 3 1 2 1 31 2 3 4 5 6 7 8 9 10 11 12 13 14 15结果 丙 乙甲 甲丙 乙 丙 乙 甲 乙 丙 甲 乙 甲 丙34二、变异分解总变异处理因素处理间变异随机误差测量误差个体变异组内变异随机误差测量误差个体变异区组因素区组间变异随机误差测量误差个体变异35随机区组设计资料方差分析公式变异来源SS MSF值
12、 N1总变异处理间g1误差(n-1)(g-1)区组间n136三、分析步骤H0:1=2=3H1:i不等或不全相等=0.05373839方差分析表变异来源SS MSFP总0.532814处理间0.228020.114011.880.01区组间0.228440.05715.950.05误差0.076480.0096结论:按=0.05水平,拒绝H0,接受H1,认为三组均数的差异有统计学意义,三种抗癌药物对小白鼠肉瘤抑瘤效果有差别。40变异来源SS MSFP总0.532814处理间0.228020.114011.880.01区组间0.228440.05715.950.05误差0.076480.0096区
13、组间差别有统计学意义解释由于控制了区组因素(体重),误差由0.0254减少到0.0096,提高了检验效率。处理间0.228020.11404.490.05区组+误差0.3048120.025441第四节 拉丁方设计资料的方差分析42设计方法研究目的非处理因素控制完全随机设计处理因素随机化分组平衡随机区组设计处理因素区组(行方向)可控制一个主要非处理因素拉丁方设计处理因素行与列方向可控制二个主要非处理因素一、拉丁方设计latin-squaredesign43 拉丁方是用拉丁字母排列为KK的方阵K=处理因素水平数例:K=4列12341ABCD行2BCDA3CDAB4DABC44u行和列安排两个需控
14、制的非处理因素u拉丁字母个数代表处理因素水平数u行数=列数=处理水平数u处理的每个水平在行或列中只出现一次u使用时应对基本拉丁方随机化 列 12341ABCD行2BCDA3CDAB 4DABC45研究目的:比较6种不同药物对家兔注射后产生的皮肤疱疹大小处理因素:药物处理因素水平:甲、乙、丙、丁、戊、己实验对象:家兔6只实验效应:皮肤疱疹大小控制因素1:不同受试对象(6只家兔)控制因素2:每只家兔不同注射部位(6个)46ABCDEFBAFEDCCDABFEDFEACBECBFADFEDCBA66基本拉丁方47行变换:随机数220634725282秩次213546对调列变换:随机数27299972
15、6853秩次126543对调分配处理:药物甲乙丙丁戊己随机数355627092486秩次453126字母DECABF66基本拉丁方随机化 4866基本拉丁方行与列随机对调家兔编号注射部位编号(列区组)(行区组)1234561ABCEDF2BAEFCD3EDFCBA4FCBDAE5CFDAEB6DEABFC处理因素(药物):ABCDEF49家兔编号注射部位编号(列区组)(行区组)1234561A73B75C67E61D69F792B83A81E99F82C85D873E73D60F73C77B68A744F58C64B64D71A77E745C64F62D64A81E85B716D77E75A7
16、3B59F85C82处理因素(药物):ABCDEFXijk=+Ti+Rj+Ck+eijk6种药物注射家兔后产生皮肤疱疹大小(mm2)50家兔注射部位编号编号1234561A73B75C67E61D69F7942470.72B83A81E99F82C85D8751786.23E73D60F73C77B68A7442570.84F58C64B64D71A77E7440868.05C64F62D64A81E85B7142771.26D77E75A73B59F85C8245175.26种药物注射家兔后产生皮肤疱疹大小(mm2)合计Ci42841744043146946771.369.573.371.8
17、78.277.8药物DECABF合计Tk42846743945942043971.377.873.276.570.073.2合计Rj51二、变异分解总变异处理间变异不同药物随机误差随机误差行区组间变异不同家兔随机误差列区组间变异不同注射部位随机误差52拉丁方设计资料方差分析公式变异来源SS MSF值 N1总变异处理间g1行区组g1列区组g1误差(g-1)(g-2)53三、分析步骤54变异来源 SS MS F P总变异 3036.00 35 药物间 268.67 5 53.73 0.98 0.05家兔间 383.33 5 76.67 1.39 0.05部位间 1283.33 5 256.67 4
18、.66 0.01误差 1100.67 20 55.03方差分析表55结论:u处理因素:按=0.05水准,可以认为6种药物注射家兔后产生皮肤疱疹大小均数的差别无统计学意义。u非处理因素:按=0.05水准,认为6只家兔皮肤疱疹大小均数的差别无统计学意义。6个注射部位皮肤疱疹大小均数的差别有统计学意义。56拉丁方设计的缺点u实验设计要求行数=列数=处理水平数,该条件实际工作中一般不易满足。u在处理的水平数较少时,试验的重复数较少(如33拉丁方设计,重复例数为3),此时检验效率较低。57第五节两阶段交叉设计资料的方差分析58一、两阶段交叉设计Cross-overDesign59完全随机分组设计例:比较
19、两种药物(试验药与对照药)疗效 试验组(n1)将N个受试对象随机分组对照组(n2)特点:每个受试对象接受一种处理,然后比较两组受试对象的试验效应。60完全随机分组设计缺点1.完全随机分组设计组间非处理因素的分布不可能完全一致(特别是例数较少时)。2.处理因素的试验效应通过受试者反映,试验效应受个体差异影响。3.当非处理因素影响较大时,所需样本例数较多。61消除(减少)个体变异方法1.试验前后设计每个研究对象只接受一种处理2.配对(配伍)设计每个研究对象只接受一种处理3.交叉设计每个研究对象可接受两种处理62两阶段交叉设计模式随机试验阶段分组甲组(n1)甲药乙药N乙组(n2)乙药甲药63两阶段交
20、叉设计优点1.每个试验对象先后接受两种处理,可成倍使用试验对象,例数少于完全随机分组设计。2.试验设计采用自身对照,可减少个体变异对试验效应的影响,试验结果较准确,统计检验效率高于完全随机分组设计。641.两阶段间常安排洗脱(washout)阶段,比完全随机分组设计试验时间长。2.两阶段间不能有延滞(carry-over)效应。即前一时期处理的效应不能延续到后一时期的处理效应上。3.多用于治疗慢性病药物(如安眠、降血压等)的疗效比较。两阶段交叉设计缺点65二、两阶段交叉设计举例1.完全随机设计安排受试对象例 用A、B两种闪烁液测定10名受试者血浆中3H-cGMP的交叉试验2.随机区组设计安排受
21、试对象66随机数22191678039323155857秩号54391106287规定秩号奇数处理先A后B,偶数先B后A12345678910受试对象编号受试对象编号阶段1阶段21AB2BA3AB4AB 67受试者阶段受试者合计编号Bi1A760B77015302B860A85517153A568B602117010B800A8031603阶段合计S1=7271S2=7370处理合计TA=7289TB=7352 X=14641两种闪烁液测定血浆中3H-cGMP的交叉试验Xijk=+Ti+Oj+Sk+eijk68三、两阶段交叉设计数据的方差分析总变异A、B处理间变异受试者间变异、阶段间变异随机误
22、差697071 方差分析表变异来源DFSSMSFP总变异19552194.95AB处理间1198.45198.454.020.05阶段间1490.05490.059.920.05受试者间9551111.4561234.611240.070.01误差8395.0049.3872结论:1.还不能认为A与B两种闪烁液的测定结果有差别试验目的2.可认为测定阶段对测定结果有影响控制因素3.可认为各受试者的3H-cGMP值不同控制因素73单因素处理资料方差分析小结设计方法总变异分解完全随机处理间+随机误差随机区组处理间+区组间+随机误差拉丁方处理间+行间+列间+随机误差两阶段交叉处理间+受试者间+阶段间+
23、随机误差不同设计的目的主要是减少随机误差,显示处理因素的作用。74第六节多个样本均数间的多重比较75当方差分析结果的处理因素间有统计学意义,只说明各总体均数不全相等;若了解各总体均数两两之间差别情况,需作多个样本均数间多重比较。目的方法1.一对或几对在专业上有LSD-t检验特殊意义样本均数比较2.各实验组与一个对照组Dunnett-t检验样本均数多重比较3.多个样本均数两两间的SNK-q检验全面比较76多个样本均数间比较不能采用t检验,否则将增大犯1类错误概率。对某一资料中3组数据用t检验作两两比较比较组别检验水准不犯1型错误概率A组与B组=0.05(10.05)A组与C组=0.05(10.0
24、5)B组与C组=0.05(10.05)3次均不犯1型错误概率为(1 0.05)3总的检验水准为=1(1 0.05)3=0.1477一.LSD-t检验最小显著差异(leastsignificantdifference)t检验78 LSD-t检验与t检验异同LSD-t检验t检验t界值表(附表2)t界值表(附表2)79例降血脂新药2.4g组与安慰剂组比较降血脂新药2.4g组安慰剂组80SPSS计算结果81二、Dunnett-t检验由C.W.Dunnett于1955年提出82 Dunnett-t检验与t检验区别Dunnett-t检验t检验Dunnett-t检验临界值表(附表5)t界值表(附表2)83例
25、三个不同剂量降血脂新药组与安慰剂组比较降血脂新药2.4g组安慰剂组84各实验组与安慰剂组比较组别Dunnett-t值P值安慰剂组3.432.4g组2.724.180.014.8g组2.704.290.017.2g组1.978.590.0185三、SNK-q检验SNK(Student-Newman-Keuls)检验,亦称q检验。86 SNK-q检验与t检验区别SNK-q检验t检验q界值表(附表4)t界值表(附表2)87 不同药物作用后小白鼠肉瘤重量(g)区组 A药 B药 C药1 0.82 0.65 0.51 1.982 0.73 0.54 0.23 1.503 0.43 0.34 0.28 1.
26、054 0.41 0.21 0.31 0.935 0.68 0.43 0.24 1.353.07 2.17 1.57 6.810.614 0.434 0.314 0.4542.0207 1.0587 0.5451 3.624588例三种药物的抑瘤效果两两之间是否有差别?服用药物C药B药A药小鼠肉瘤重量均数0.3140.4340.614从小到大序次12389三种药物抑瘤效果比较比较组 aqq0.05,8q0.01,8PBC0.1222.733.264.750.05AC0.3036.854.045.640.01AB0.1824.113.264.750.05a为均数排序后对比组间所包含的组数,a越大
27、,q0.05,越大,避免犯型错误。结论:B药与C药抑瘤效果差别无统计学意义,服A药后小鼠肉瘤重量高于服C药与B药的,A药抑瘤效果比C药与B药的差。90总 结方差分析(F检验)是多个均数间整体性的比较,如果F值无统计学意义,说明处理因素无作用。均数间的多重比较整体比较有统计学意义后进行均数间两两比较,常用方法:LSD-t、Dunnett-t检验91第七节 多样本方差齐性检验一、Bartlett法二、Levene法92一、Bartlett法例 试分析各处理组的低密度脂蛋白值是否满 足方差齐性?9394结论:按=0.10水平,不拒绝H0,还不能认为4个试验组的低密度脂蛋白值不满足方差齐性。95二、Levene法 所分析资料可不具有正态性9697注意1.在实际应用中,完全随机设计多组数据均数的比较,一定要做方差齐性检验。2.如不满足方差齐性假定,应改用秩和检验做比较。3.Bartlett检验法要求资料具有正态性。4.用Levene检验法进行方差齐性检验时,不要求资料具有正态性。98 本章重点 1.方差分析基本思想2.完全随机设计资料方差分析随机区组设计资料方差分析3.多个样本均数间的多重比较99Thankyou!100