《方差分析 (2)优秀课件.ppt》由会员分享,可在线阅读,更多相关《方差分析 (2)优秀课件.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、方差分析(2)第1页,本讲稿共29页方差分析的意义:方差分析的意义:前述的前述的t检验和检验和u检验适用于两个样本均数的比较,对于检验适用于两个样本均数的比较,对于k个样个样本均数的比较,如果仍用本均数的比较,如果仍用t检验或检验或u检验,需比较次,如四个样检验,需比较次,如四个样本均数需比较次。假设每次比较所确定的检验水准本均数需比较次。假设每次比较所确定的检验水准=0.05,则每,则每次检验拒绝次检验拒绝H0不犯第一类错误的概率为不犯第一类错误的概率为1-0.05=0.95;那么;那么6次检验次检验都不犯第一类错误的概率为都不犯第一类错误的概率为(1-0.05)6=0.7351,而犯第一类
2、错误,而犯第一类错误的概率为的概率为0.2649,因而,因而t检验和检验和u检验不适用于多个样本均数的比较。检验不适用于多个样本均数的比较。用方差分析比较多个样本均数用方差分析比较多个样本均数,可有效地控制第一类错误。可有效地控制第一类错误。第2页,本讲稿共29页 方差分析方差分析(analysis of variance),简称简称ANOVA,由由英国统计学家英国统计学家R.A.Fisher首先提出,后人为纪念首先提出,后人为纪念Fisher,以,以F命名方差分析的统计量,故方差分析又称命名方差分析的统计量,故方差分析又称F检验。检验。样本均数的差异,可能有两种原因所致样本均数的差异,可能有
3、两种原因所致:1、可能由随机误差所致随机误差包括两种成分个、可能由随机误差所致随机误差包括两种成分个体间的变异和测量误差两部分;体间的变异和测量误差两部分;2、可能是由于各组所接受的处理不同,不同的处理、可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组之间均数不同。引起不同的作用和效果,导致各处理组之间均数不同。第3页,本讲稿共29页个体之间各不相同,是繁杂的生物界的特点;测量误差也是不个体之间各不相同,是繁杂的生物界的特点;测量误差也是不可避免的,因此随机变异肯定存在,而处理因素导致的变异是否可避免的,因此随机变异肯定存在,而处理因素导致的变异是否存在,这正是假设
4、检验要回答的问题,只要能证明它不等于存在,这正是假设检验要回答的问题,只要能证明它不等于0,就等同于证明了处理因素的确存在影响。就等同于证明了处理因素的确存在影响。总变异总变异=随机变异随机变异+处理因素导致的变异处理因素导致的变异第4页,本讲稿共29页方差分析的基本思想方差分析的基本思想:将所有观察值之间的变异(称总变异)根据离均差平将所有观察值之间的变异(称总变异)根据离均差平方和划分的原理,按设计和需要分解成两个或多个部分。方和划分的原理,按设计和需要分解成两个或多个部分。每一部分变异都反映了研究工作中某种特定的内容(如某每一部分变异都反映了研究工作中某种特定的内容(如某种处理因素的作用
5、、随机误差的影响等),通过对平均变种处理因素的作用、随机误差的影响等),通过对平均变异的比较,做出相应的统计判断。异的比较,做出相应的统计判断。第5页,本讲稿共29页方差分析的应用条件:方差分析的应用条件:各样本须是相互独立的随机样本(独立性)各样本须是相互独立的随机样本(独立性)各样本来自正态分布总体(正态性)各样本来自正态分布总体(正态性)各总体方差相等(方差齐性)各总体方差相等(方差齐性)第6页,本讲稿共29页方差分析的用途:方差分析的用途:两个或多个样本均数间的比较;两个或多个样本均数间的比较;分析两个或多个因素间的交互作用;分析两个或多个因素间的交互作用;回归方程的线性假设检验;回归
6、方程的线性假设检验;多元线性回归分析中偏回归系数的假设检验;多元线性回归分析中偏回归系数的假设检验;两样本的方差齐性检验等。两样本的方差齐性检验等。第7页,本讲稿共29页方差分析的检验假设:方差分析的检验假设:H0:为各样本来自均数相等的总体:为各样本来自均数相等的总体H1:为各总体均数不等或不全相等:为各总体均数不等或不全相等若不拒绝若不拒绝H0时,可认为各样本均数间的差异是由于抽样误时,可认为各样本均数间的差异是由于抽样误差所致,而不是由于处理因素的作用所致。理论上,此时的差所致,而不是由于处理因素的作用所致。理论上,此时的组间变异与组内变异应相等,两者的比值即统计量组间变异与组内变异应相
7、等,两者的比值即统计量F为为1;由于;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量F应接近于应接近于1。第8页,本讲稿共29页若拒绝若拒绝H0,接受,接受H1时,可认为各样本均数间的差异,不仅是时,可认为各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远大于组由抽样误差所致,还有处理因素的作用。此时的组间变异远大于组内变异,两者的比值即统计量内变异,两者的比值即统计量F明显大于明显大于1。在实际应用中,当统。在实际应用中,当统计量计量F值远大于值远大于1且大于某界值时,拒绝且大于某界值时,拒绝H
8、0,接受,接受H1,即意味,即意味着各样本均数间的差异,不仅是由抽样误差所致,还有处着各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。理因素的作用。第9页,本讲稿共29页如完全随机设计资料的方差分析,将总变异分解为处理如完全随机设计资料的方差分析,将总变异分解为处理间变异和组内变异两部分,常将后者称为误差。将各部分变间变异和组内变异两部分,常将后者称为误差。将各部分变异除以误差部分,得到统计量异除以误差部分,得到统计量F值,并根据值,并根据F值确定值确定P值作推断。值作推断。由于方差分析是根据实验设计将总变异分成若干部分,因此由于方差分析是根据实验设计将总变异分成若干部分,因此设
9、计时考虑的因素越多,变异划分的越精细,各部分变异的涵义设计时考虑的因素越多,变异划分的越精细,各部分变异的涵义越清晰明确,结论的解释也越容易,同时由于变异划分的精细,越清晰明确,结论的解释也越容易,同时由于变异划分的精细,误差部分减小,提高了检验的灵敏度和结论的准确性。误差部分减小,提高了检验的灵敏度和结论的准确性。第10页,本讲稿共29页一、完全随机一、完全随机设计资料的方差分析料的方差分析医学医学实验中,根据某一中,根据某一实验因素,用随机的方法,将受因素,用随机的方法,将受试对象分配到各象分配到各组,各,各组分分别接受不同的接受不同的处理后,理后,观察各种察各种处理的效果,比理的效果,比
10、较各各组均数之均数之间有无差有无差别。临床研究中,床研究中,还可能遇到:比可能遇到:比较几种不同几种不同疗法治法治疗某种疾病后某种疾病后某指某指标的的变化,以化,以评价它价它们的的疗效;或比效;或比较某种疾病不同某种疾病不同类型之型之间某一指某一指标有无差有无差别等。等。这些都是一个因素不同水平(或状些都是一个因素不同水平(或状态)间几几个个样本均数的比本均数的比较,可用,可用单因素的方差分析(因素的方差分析(one-way ANOVAone-way ANOVA)来来处理此理此类资料。料。第11页,本讲稿共29页完全随机设计(完全随机设计(completely random design)属单
11、因)属单因素研究设计,它是将随机抽取的受试对象,随机地分配到两个或素研究设计,它是将随机抽取的受试对象,随机地分配到两个或多个水平(处理)组中,观察和比较不同处理所产生的效应。本多个水平(处理)组中,观察和比较不同处理所产生的效应。本设计易于理解,实施简便。分组时可采用简单随机化来实现,即设计易于理解,实施简便。分组时可采用简单随机化来实现,即将随机抽取的足够量的受试对象,按某种标识进行编号,如就诊将随机抽取的足够量的受试对象,按某种标识进行编号,如就诊日期、出生时间或体重大小等,采用随机数字表或随机函数法等,日期、出生时间或体重大小等,采用随机数字表或随机函数法等,将受试对象分配到各组中。将
12、受试对象分配到各组中。第12页,本讲稿共29页例例1、将建模成功的某恶性肿瘤小白鼠将建模成功的某恶性肿瘤小白鼠40只,随机分为只,随机分为4个处个处理组,对照组注射蒸馏水理组,对照组注射蒸馏水1.0ml,另,另3组分别注射不同剂量的组分别注射不同剂量的三菱莪术注射液,半月后处死小白鼠称瘤重(三菱莪术注射液,半月后处死小白鼠称瘤重(g),结果如),结果如表。表中表。表中组为对照组,组为对照组,组、组、组和组和组分别给予组分别给予0.5ml,1.0ml和和1.5ml三菱莪术注射液。试比较不同处理组间瘤重有无差别三菱莪术注射液。试比较不同处理组间瘤重有无差别?第13页,本讲稿共29页将将24只大鼠分
13、只大鼠分4组进行实验,并要求组进行实验,并要求n相等。相等。(1)首先给动物按体重编号;)首先给动物按体重编号;(2)任意指定随机数字表中第)任意指定随机数字表中第3行,从第行,从第7、8列开始由上向下抄列开始由上向下抄录录24个两位的随机数;个两位的随机数;(3)将抄录的随机数排序,用)将抄录的随机数排序,用R表示;表示;(4)因各组例数相等,规定)因各组例数相等,规定R为为1-6者分入甲组,者分入甲组,7-12者分入乙,者分入乙,13-18者分入丙组,者分入丙组,19-24者分入丁组。分组过程如下:者分入丁组。分组过程如下:第14页,本讲稿共29页编号123456789101112随机数2
14、7126645470303341422784R12171815209101213824所属组别甲丁乙丙丙丁乙乙乙丙乙丁编号131415161718192021222324随机数17245918656754468127834R4617521622141932311所属组别甲甲丙甲甲丙丁丙丁甲丁乙第15页,本讲稿共29页分组结果:分组结果:甲组甲组6例,编号为:例,编号为:1,13,14,16,17,18,22;乙组乙组6例,编号为:例,编号为:3,7,8,9,11,24;丙组丙组6例,编号为:例,编号为:4,5,10,15,18,20;丁组丁组6例,编号为:例,编号为:2,6,12,19,20,
15、21,23。第16页,本讲稿共29页某药对小白鼠某药对小白鼠Ehrlich腹水癌的作用实验资料腹水癌的作用实验资料I 组3.64.54.24.43.7 5.674.154.5II组32.32.41.143.7 2.7 1.9 2.61.3III 组0.41.72.34.53.6 1.3 3.232.12.5IV 组3.31.202.733.2 0.6 1.4 1.23.1第17页,本讲稿共29页 总均数总均数样本的本的组内内误差差(随机随机误差差)两个样本均数间比较两个样本均数间比较 k:组别组别 n:例数例数第18页,本讲稿共29页二、随机区组设计资料的方差分析二、随机区组设计资料的方差分析
16、随机区组设计随机区组设计(randomized block design)也称配伍也称配伍组设计,它是将受试对象按一定条件划分为若干个区组组设计,它是将受试对象按一定条件划分为若干个区组(配伍组),并将各区组内的受试对象随机地分配到各个(配伍组),并将各区组内的受试对象随机地分配到各个处理组中的一种设计类型。处理组中的一种设计类型。随机区组设计在医学科研中较为常见,例如在实验随机区组设计在医学科研中较为常见,例如在实验研究中,将动物按窝别配伍,再随机分配到各个处理组;研究中,将动物按窝别配伍,再随机分配到各个处理组;在观察性研究中,按年龄、性别或地区配伍来抽取和组成在观察性研究中,按年龄、性别
17、或地区配伍来抽取和组成研究因素的各个水平组等等。研究因素的各个水平组等等。第19页,本讲稿共29页随机区组设计的多个样本均数的比较可用无重复数据的两因随机区组设计的多个样本均数的比较可用无重复数据的两因素的方差分析(素的方差分析(two-way ANOVA)。)。两个因素是指主要的研究两个因素是指主要的研究因素(处理因素)和区组因素。按这两个因素纵横排列时,每个格因素(处理因素)和区组因素。按这两个因素纵横排列时,每个格子中仅有一个数据,故称无重复数据。子中仅有一个数据,故称无重复数据。第20页,本讲稿共29页值得注意的是,同一受试对象不同时间(或部位)重复多次测值得注意的是,同一受试对象不同
18、时间(或部位)重复多次测量所得到的资料称为重复测量数据(量所得到的资料称为重复测量数据(repeated measurement data),对该类资料不能应用随机区组设计的两因素方差分析进行),对该类资料不能应用随机区组设计的两因素方差分析进行处理,需用重复测量数据的方差分析。处理,需用重复测量数据的方差分析。第21页,本讲稿共29页三、析因设计资料的方差分析三、析因设计资料的方差分析 析因设计(析因设计(factorial design)是一种两因素或多因素各)是一种两因素或多因素各水平完全交叉分组组合的实验设计,它不仅可以进行每个因水平完全交叉分组组合的实验设计,它不仅可以进行每个因素各
19、个水平间的比较,还可进行因素间交互作用的分析。素各个水平间的比较,还可进行因素间交互作用的分析。最简单的析因设计方案是分析两个因素(分别记为最简单的析因设计方案是分析两个因素(分别记为A和和B),每个因素各有两个水平(分别记为),每个因素各有两个水平(分别记为a1,a2和和b1,b2),共有共有224种不同的组合,也称为种不同的组合,也称为22析因设计。析因设计。第22页,本讲稿共29页四、四、多个样本均数间两两均数间的比较多个样本均数间两两均数间的比较 方差分析方差分析结果若拒果若拒绝H H0 0,接受,接受H H1 1,其含,其含义是指各个是指各个样本所来自的本所来自的正正态总体其体其总体
20、均数不全相等,但不能推断哪些体均数不全相等,但不能推断哪些总体均数之体均数之间有差有差别,若用两若用两样本均数比本均数比较t t检验(或(或u u检验)对多个多个样本均数本均数进行两两行两两检验,则会增大第一会增大第一类错误,特,特别是两两比是两两比较的次数的次数较多多时。第23页,本讲稿共29页 例如例如:六个样本均数做两两比较时,若用六个样本均数做两两比较时,若用t 检验两两比较按检验两两比较按排列组合原理:排列组合原理:,则需比较,则需比较 =15次,若检验水准次,若检验水准 每次均取每次均取0.05,则每次比较不犯第一类错误,则每次比较不犯第一类错误的概率为(的概率为(1-0.05),
21、),15次比较都不犯第一类错误的概率为(次比较都不犯第一类错误的概率为(1-0.05)15=0.4633,而此时犯第一类错误的概率不再是,而此时犯第一类错误的概率不再是0.05,而是而是1-(1-0.05)15=0.5367 了。因此多个样本均数的比较不宜用了。因此多个样本均数的比较不宜用 t 检验。检验。第24页,本讲稿共29页 1 1、BonferroniBonferroni法:法:2 2、TukeyTukey法(法(henestly signifacant difference,HSDhenestly signifacant difference,HSD)第25页,本讲稿共29页3 3、
22、多个多个样本均数本均数间每两个均数之每两个均数之间的比的比较常用常用q q检验,也,也 称称SNK(Student-New-man-Keuls)SNK(Student-New-man-Keuls)法法。序序 号号 均均 数数样本含量本含量原原 组 别162.16A降脂降脂药组254.996对 照照 组332.747B降脂降脂药组427.297C降脂降脂药组第26页,本讲稿共29页四四组家兔血清家兔血清ACE均数的两两比均数的两两比较(q检验)对比比组q值组数数aq界界值P值q0.05q0.01A药组与与对照照组7.114.711.5122.954.020.05A药组与与B药组29.364.54
23、6.4733.584.640.01A药组与与C药组34.814.547.6743.965.020.01对照照组与与B药组22.254.544.9022.954.020.01对照照组与与C药组27.704.546.1033.584.640.05第27页,本讲稿共29页4 4、多个、多个实验组与一个与一个对照照组均数均数间的比的比较:LSDLSD法(最小法(最小显著差法)著差法)q检验对检验对k个均数的两两比较需个均数的两两比较需k(k-1)/2次。若次。若k=8,则需比较,则需比较28最小显著差(最小显著差(the least significant difference,LSD)法可以简化两两
24、比)法可以简化两两比较的计算步骤。其检验假设也为:较的计算步骤。其检验假设也为:H0:,:,H1:。方:。方法为:首先计算拒绝法为:首先计算拒绝H0,接受,接受H1所需样本均数差值的最小值,即所需样本均数差值的最小值,即LSD。然后各对比组的与相应的。然后各对比组的与相应的LSD比较,只要对比组的大于或比较,只要对比组的大于或等于等于LSD,即拒绝,即拒绝H0,接受,接受H1;否则,得到相反的推断结论。;否则,得到相反的推断结论。DuncanDuncan新法(新复极差法)新法(新复极差法)第28页,本讲稿共29页四四组家兔血清家兔血清ACE均数的两两比均数的两两比较(LSD-t检验)对 比比 组LSD0.05LSD0.01P值A药组与与对照照组7.1113.8218.780.05A药组与与B药组29.3613.3218.10.01A药组与与C药组34.8113.3218.10.01对照照组与与B药组22.2513.3218.10.01对照照组与与C药组27.713.3218.10.05第29页,本讲稿共29页