《方差分析-最常用的统计学分析.ppt》由会员分享,可在线阅读,更多相关《方差分析-最常用的统计学分析.ppt(60页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 共654页END 返回章目录返回总目录SY.W ANG方差分析q 第五节 多个方差的齐性检验q 第二节 单因素方差分析q 第三节 双因素方差分析q 第四节 多个样本均数间的两两比较q 第一节 方差分析的基本思想q 第六节 变量变换第4 章方差分析 第1 页 共654页END 返回章目录返回总目录SY.W ANG第四章 方差分析 学习要求:1。掌握方差分析的基本思想;2。掌握单因素、双因素方差分析的应用条件、意义及计 算方法;3。熟悉多个均数间两两比较的意义及方法;4。了解方差齐性检验和t检验的意义及方法;5。熟悉变量变换的意义和方法。第4 章方差分析 第2 页 共654页END 返回章目录返
2、回总目录SY.W ANG第一节 方差分析的基本思想 一、方差分析的用途及应用条件 方差分析(analysis of variance,缩写为ANOVA)是常用的统计分析方法之一。其应用广泛,分析效率高,节省样本含量。主要用途有:进行两个或两个以上样本均数的比较;可以同时分析一个、两个或多个因素对试验结果的作用和影响;分析多个因素的独立作用及多个因素之间的交互作用;进行两个或多个样本的方差齐性检验等。方差分析对分析数据的要求及条件比较严格,即要求各样本为随机样本,各样本来自正态总体,各样本所代表的总体方差齐性或相等。第4 章方差分析 第3 页 共654页END 返回章目录返回总目录SY.W AN
3、Gv 二、方差分析的基本思想v 处理因素可分为若干个等级或不同类型,通常称为水平。在不同的水平下进行若干次试验并取得多个数据,可以将在每个水平下取得的这些数据看作一个样本。若某个因素有四个水平,每个水平的数据代表一个样本,则获得四个样本的数据。v设有k个相互独立的样本,分别来自k个正态总体X1,X2,Xk,且方差相等,v即要求检验假设为 此假设的意义为,在某处理因素的不同水平下,各样本的总体均数相等。第4 章方差分析 第4 页 共654页END 返回章目录返回总目录SY.W ANG 1。设某因素有多个水平,即试验数据产生多个样本。由多个样本的全部数据可以计算出总变异,称为总的离均差平方和。即S
4、S总。2。数理统计证明,SS总可以由几个部分构成。单因素方差分析中,SS总由组间变异和组内变异构成。SS总SS组间SS组内。3。组间变异主要受到处理因素和个体误差两方面影响,组内变异主要受个体误差的影响。当H0 为真时,由于处理因素不起作用,组间变异只受个体误差的影响。此时,组间变异与组内变异相差不能太大。第4 章方差分析 第5 页 共654页END 返回章目录返回总目录SY.W ANG表42 PCNA在三种不同胃组织中的表达结果第4 章方差分析 第6 页 共654页END 返回章目录返回总目录SY.W ANG 4。各种变异除以相应的自由度,称为均方,用MS表示,也就是方差。当H0为真时,组间
5、均方与组内均方相差不大,两者比值F值约接近于1。即 F组间均方组内均方1。5。当H0不成立时,处理因素产生了作用,使得组间均方增大,此时,F1,当大于等于F临界值时,则P0.05。可认为H0不成立,各样本均数不全相等。第4 章方差分析 第7 页 共654页END 返回章目录返回总目录SY.W ANG 三、方差分析的类型 1。单因素方差分析(one-way ANOVA)也称为完全随机设计(completely random design)的方差分析。该设计只能分析一个因素下多个水平对试验结果的影响。2。双因素方差分析(two-way ANOVA)称为随机区组设计(randomized block
6、 design)的方差分析。该设计可以分析两个因素。一个为处理因素,也称为列因素;一个为区组因素,也称为行因素。第4 章方差分析 第8 页 共654页END 返回章目录返回总目录SY.W ANG3。三因素方差分析 也称为拉丁方设计(Latin square design)的方差分析。该设计特点是,可以同时分析三个因素对试验结果的作用,且三个因素之间相互独立,不能有交互作用。4。析因设计(factorial design)的方差分析 当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计来进行分析。该设计不仅可以分析多个因素的独立作用,也可以分析多个因素间的交互作用,是一种高效率的方差分析
7、方法。第4 章方差分析 第9 页 共654页END 返回章目录返回总目录SY.W ANG5。正交试验设计的方差分析 如果要分析的因素有三个或三个以上,可进行正交试验设计(orthogonal experimental design)的方差分析。当分析因素较多时,试验次数会急剧增加,用此设计进行分析则更能体现出其优越性。该设计利用正交表来安排各次试验,以最少的试验次数,得到更多的分析结果。第4 章方差分析 第10 页 共654页END 返回章目录返回总目录SY.W ANG 四、方差分析的基本步骤 1。计算总变异:指所有试验数据的离均差平方和。2。计算各部分变异:单因素方差分析中,可以分出组间变异
8、(SS组间)和组内变异(SS组内);双因素方差分析中,可以分出处理组变异(SS处理),区组变异(SS区组)或称为配伍组变异(SS配伍)及误差变异(SS误差)。第4 章方差分析 第11 页 共654页END 返回章目录返回总目录SY.W ANG 3。计算各部分变异的均方 在方差分析中,方差也称为均方,是各部分的离均差平方和除以其相应的自由度,用MS表示。基本公式为:MSSS。4。计算统计量F值 F值是指两个均方之比。一般是用较大的均方除以较小的均方。故F值一般不会小于1。5。确定P值,推断结论 根据分子1,分母2,查F界值表(方差分析用),得到F值的临界值(critical value),即:如
9、果FF界值,则P0.05,在=0.05水准上拒绝H0,接受H1。可以认为各样本所代表的总体均数不全相等。如果想要了解哪两个样本均数之间有差异,可以继续进行各样本均数的两两比较。第4 章方差分析 第12 页 共654页END 返回章目录返回总目录SY.W ANG第二节 单因素方差分析 1。特点 单因素方差分析是按照完全随机设计的原则将处理因素分为若干个不同的水平,每个水平代表一个样本,只能分析一个因素对试验结果的影响及作用。其设计简单,计算方便,应用广泛,是一种常用的分析方法,但其效率相对较低。该设计中的总变异可以分出两个部分,即SS总SS组间SS组内。2。常用符号及其意义(1)Xij意义为第i
10、组的第j个数据。其中下标 i 表示列,j 表示行。(2)意义为将第i组的全部j个数据合计。第4 章方差分析 第13 页 共654页END 返回章目录返回总目录SY.W ANG(3)将第i组的j个数据合计后平方,再将所有各i组的平方值合计。(4)变异来源 SS总:表示变异由处理因素及随机误差共同所致;SS组 间:表示变异来自处理因素的作用或影响;SS组 内:表示变异由个体差异和测量误差等随机因素所致。第4 章方差分析 第14 页 共654页END 返回章目录返回总目录SY.W ANG计算公式第4 章方差分析 第15 页 共654页END 返回章目录返回总目录SY.W ANG 三。计算实例 例4.
11、1 科研人员研究细胞增殖核抗原(PCNA)在胃癌组织(A组),胃癌旁组织(B组)及正常胃粘膜组织(C组)中的表达状况。检测结果用表达指数来表示。数据见表42。试分析PCNA在三种胃组织中的表达有无差异。第4 章方差分析 第16 页 共654页END 返回章目录返回总目录SY.W ANG表42 PCNA在三种不同胃组织中的表达结果第4 章方差分析 第17 页 共654页END 返回章目录返回总目录SY.W ANG 检验步骤及方法 建立检验假设 H0:PCNA在三种组织中的表达指数相同,123;H1:PCNA在三种组织中的表达指数不全相同。0.05,计算检验统计量F值 由表4-2的数据计算有:校正
12、系数 C(X)2N(874)22728291.70 SS总X2C39236-28291.70=10944.3 总N1=27-1=26第4 章方差分析 第18 页 共654页END 返回章目录返回总目录SY.W ANG 组间k-1=3-1=2 SS组内SS总SS组间10944.3-8965.98=1978.32第4 章方差分析 第19 页 共654页END 返回章目录返回总目录SY.W ANG(3)列方差分析表 见表4-3。(4)确定P值 根据0.05,1组间2,2组内24,查附表4,F界值表,得F界值:F0.01(2,24)=5.61。本例F54.39,大于界值F0.01(2,24)=5.61
13、,则P0.01。(5)推断结论 由于P0.01,在0.05水准上拒绝H0,接受H1,差异有统计学意义。可以认为PCNA在三种不同胃组织中的表达指数不全相同。该结论的意义为,至少有两种组织的PCNA表达指数不同。如果想确切了解哪两个组织的PCNA表达指数有差异,可进一步作多个样本均数的两两比较。第4 章方差分析 第20 页 共654页END 返回章目录返回总目录SY.W ANG表43方差分析表第4 章方差分析 第21 页 共654页END 返回章目录返回总目录SY.W ANG第三节 双因素方差分析 一、特点及意义 1.特点 按照随机区组设计的原则来分析两个因素对试验结果的影响及作用。其中一个因素
14、称为处理因素,一般作为列因素;另一个因素称为区组因素或配伍组因素,一般作为行因素。两个因素相互独立,且无交互影响。双因素方差分析使用的样本例数较少,分析效率高,是一种经常使用的分析方法。但双因素方差分析的设计对选择受试对象及试验条件等方面要求较为严格,应用该设计方法时要十分注意。该设计方法中,总变异可以分出三个部分:SS总SS处理SS区组SS误差第4 章方差分析 第22 页 共654页END 返回章目录返回总目录SY.W ANG 2.常用符号及其意义:将 第i 个 处 理 组 的j 个 数 据 合 计 后 平 方,再 将所 有i 个处理组的平方值合计。:将第j 个区组的i 个数据合计后平方,再
15、将所有j 个区组的平方值合计。各种变异来源 SS总:总 变 异,由 处 理 因 素、区 组 因 素 及 随 机 误 差 的 综 合 作 用 而 形成。SS处理:各处理组之间的变异,可由处理因素的作用所致。SS区组或SS配伍:各区组之间的变异,可由区组因素的作用所致。SS误 差:从 总 变 异 中 去 除SS处 理及SS区 组后 剩 余 的 变 异。此 变 异 由 个体差异和测量误差等随机因素所致。第4 章方差分析 第23 页 共654页END 返回章目录返回总目录SY.W ANG计算公式第4 章方差分析 第24 页 共654页END 返回章目录返回总目录SY.W ANG 三、计算实例 例4.2
16、 某医院研究五种消毒液对四种细菌的抑制效果。抑制效果用抑菌圈直径(mm)表示。数据见表4-5。试分析五种消毒液对细菌有无抑制作用,对四种细菌的抑制效果有无差异。第4 章方差分析 第25 页 共654页END 返回章目录返回总目录SY.W ANG表45消毒液对不同细菌的抑制效果 第4 章方差分析 第26 页 共654页END 返回章目录返回总目录SY.W ANG 检验步骤及方法(1)建立检验假设 1)对处理因素作用的检验假设 H0:五种消毒液的消毒效果相同,1 2 3 45;H1:五种消毒液的消毒效果不全相同。0.05 2)对区组因素作用的检验假设 H0:四种细菌的抑菌圈直径相同,1234;H1
17、:四种细菌的抑菌圈直径不全相同。0.05第4 章方差分析 第27 页 共654页END 返回章目录返回总目录SY.W ANG(2)计算统计量F值 由表45数据计算,有:校正系数 C=(X)2/N=(348)2/20=6055.2 SS总X2C67166055.2660.8 总N120119 处理k1514第4 章方差分析 第28 页 共654页END 返回章目录返回总目录SY.W ANG 区组b1413 SS误差SS总SS处理SS区组 660.8 31.3 566=63.5 误差(k-1)(b-1)(51)(41)12第4 章方差分析 第29 页 共654页END 返回章目录返回总目录SY.W
18、 ANG 误差总处理区组(41)(51)12 MS处理SS处理 处理(31.3)47.825 MS区组SS区组 区组(566)3188.667 MS误差SS误差 误差(63.5)125.292 F处理MS处理MS误差 7.8255.292=1.4796 F区组MS区组MS误差 188.6675.292=35.65第4 章方差分析 第30 页 共654页END 返回章目录返回总目录SY.W ANG表4-6双因素方差分析表第4 章方差分析 第31 页 共654页END 返回章目录返回总目录SY.W ANG 4)确定P值 根据 0.05,1处理4,2误差12,查附表4,F界值表,得F0.05(4,1
19、2)3.26,F0.01(4,12)5.41,再由 1区组3,2误差12,查F界值表,得F0.05(3,12)3.49,F0.01(3,12)5.95。本例F处理35.65,P0.05,在0.05水准上不拒绝H0,差异无统计学意义。可以认为五种消毒液之间的消毒效果相同。区组间P0.05,在0.05水准上拒绝H0,接受H1,差异无统计学意义。可认为不同细菌的抑菌圈直径不全相同,即消毒液对不同细菌类型的抑菌效果不全相同。第4 章方差分析 第32 页 共654页END 返回章目录返回总目录SY.W ANG第四节 多个样本均数间的两两比较 一、均数两两比较的特点和意义 1。当分析结果为P,拒绝H0时,
20、得出的结论只是指各总体均数不全相等。如果想要确切了解哪两个样本均数之间的差异有统计学意义(总体均数不等),哪两个样本均数之间的差异无统计学意义(总体均数相等),可以进行多个样本均数的两两比较。2。当有三个及三个以上样本均数比较时,如果仍使用一般的t检验对样本均数两两组合后进行比较,会使检验水平值增大,即增大第一类错误的概率,这样,就可能把本来无差别的两个总体均数判为有差别。例如,有4个样本均数进行两两比较,如用一般的t检验,则可以比较 第4 章方差分析 第33 页 共654页END 返回章目录返回总目录SY.W ANG 例如,有4个样本均数进行两两比较,如用一般的t检验,则可以比较 6次,即可
21、有6个对比组。若每次比较的检验水准0.05,则每次比较不犯第一类错误的概率为(10.05)=0.95。那么根据概率的乘法法则,比较6次均不犯第一类错误的概率为(1-0.05)60.7351。此时,总的显著性水平变为:10.73510.2649。此值已远远大于规定的检验性水平0.05。第4 章方差分析 第34 页 共654页END 返回章目录返回总目录SY.W ANG 二、SNKq 检验法(一)特点及意义 SNKq检验法,全称为Student-Newman-Keuls q检验法,也简称为SNK法。这是国内外常用而较为经典的检验方法。可以对所有对照组及处理组的样本均数进行两两比较。式中:q 为检验
22、统计量,及 为任意比较的两样本均数,为两样本均数差值的标准误。第4 章方差分析 第35 页 共654页END 返回章目录返回总目录SY.W ANG 当两样本n相等时 自由度误差 当两样本n不相等时 上式中MS误差在单因素方差分析中即为MS组内。第4 章方差分析 第36 页 共654页END 返回章目录返回总目录SY.W ANG(三)计算步骤及方法 1.首先将多个样本均数由大到小顺序排列。2.按照两均数组合原则,计算出每两个样本均数比较的统计量q 值。3.根据误差的自由度和两样本间隔组数a,查q界值表得q界值。注意:组数a的计算方法:由于各样本均数已由大到小顺序排列,因此,相邻两样本均数比较时,
23、组数a=2,中间间隔一个样本均数时,组数a=3,间隔两个样本均数时,组数a=4,余类推。第4 章方差分析 第37 页 共654页END 返回章目录返回总目录SY.W ANG(四)计算实例 例4.3 仍以例4.1为计算实例说明计算方法。例4.1的数据经单因素方差分析,P0.01,拒绝H0,接受H1。可以认为三种胃组织的PCNA表达指数不全相等。进一步作样本均数的两两比较。(1)建立检验假设 H0:任意两样本的总体均数相等,A B H1:任意两样本的总体均数不相等,A B 0.05(2)计算统计量q值 1)将三个样本均数由大到小顺序排列,见表4-7。第4 章方差分析 第38 页 共654页END
24、返回章目录返回总目录SY.W ANG 表4-7 三个样本均数顺序排列结果 第4 章方差分析 第39 页 共654页END 返回章目录返回总目录SY.W ANG 表4-8 样本均数两两比较q检验表 第4 章方差分析 第40 页 共654页END 返回章目录返回总目录SY.W ANG 推断结论在=0.05水准上拒绝H0,接受H1,各样本均数的两两比较的差异均有统计学意义。可以认为,胃癌组织,胃癌旁组织及正常胃粘膜组织的PCNA表达指数各不相同。计算统计量q值。应用第(2)栏数据除以第(4)栏数据即得q值。例如,1与2组比较有:第4 章方差分析 第41 页 共654页END 返回章目录返回总目录SY
25、.W ANG(一)特点及意义 LSD英文全称为least-significant-difference,译为最小显著差异法或最小有意义差异法,也可简称为LSD法。LSD法实际上是一种t检验法,但它与以前描述的一般t检验法有所不同。两种t检验法的主要区别在于计算标准误中的合并方差及自由度的不同。LSD法在计算标准误时,用MS组内或MS误差取代一般 t 检验标准误中的,自由度则用MS误差的自由度误差NK或误差(k-1)(b-1)取代一般t检验法中的自由度 n1+n22。根据及,查一般的t值表得t界值,与LSD计算的统计量t值的大小进行比较,并确定P值。据此作出判断和结论。三、LSDt检验法第4 章
26、方差分析 第42 页 共654页END 返回章目录返回总目录SY.W ANG(二)计算公式 自由度误差 第4 章方差分析 第43 页 共654页END 返回章目录返回总目录SY.W ANG(三)计算步骤及方法 LSDt检验法在查t值表确定t界值时,不需要组数a,故各样本均数也不需要按大小顺序排列。各样本均数两两比较时,仍需要进行组合。组合计算公式及方法与q检验法相同。其它计算步骤与一般t检验法相同。第4 章方差分析 第44 页 共654页END 返回章目录返回总目录SY.W ANG(四)计算实例 例4.4 仍用例4.1为计算实例,说明LSD法的计算过程。(1)建立检验假设 H0:任意两样本的总
27、体均数相等,AB H1:任意两样本的总体均数不相等,AB 双侧0.05(2)计算统计量t值 列出样本均数两两比较t检验表,见表4-9。第4 章方差分析 第45 页 共654页END 返回章目录返回总目录SY.W ANG 表4-9 样本均数两两比较t检验表第4 章方差分析 第46 页 共654页END 返回章目录返回总目录SY.W ANG(2)计算标准误和t值;(3)推断结论 在=0.05水准上拒绝H0,接受H1,各样本均数的两两比较的差异均有统计学意义。此结论与q检验法的结论完全相同。第4 章方差分析 第47 页 共654页END 返回章目录返回总目录SY.W ANG(一)特点及意义 在进行科
28、研时,经常需要设立一个对照组和若干个实验组或处理组。按照研究目的和设计要求,有时只需要将各个处理组的试验结果与一个对照组进行比较,而各处理组之间并不需要比较。此时,仍可应用前述SNKq检验法或LSDt检验法处理资料。因为前两种检验方法均包括所有各组之间的比较。但处理此类资料也有非常常用而经典的方法,称为Dunnettt检验法。该法在大型统计软件中的应用非常广泛。四、多个处理组与一个对照组均数间的两两比较第4 章方差分析 第48 页 共654页END 返回章目录返回总目录SY.W ANG(二)计算公式 Dunnett-t检验计算公式为:当比较组两样本含量ni相等时 当比较组两样本含量ni不相等时
29、 第4 章方差分析 第49 页 共654页END 返回章目录返回总目录SY.W ANG(四)计算实例 例4.5 以例4.2为计算实例,说明该方法的计算过程。表4-10 各组均数排列顺序 第4 章方差分析 第50 页 共654页END 返回章目录返回总目录SY.W ANG 表4-11 Dunnettt检验表第4 章方差分析 第51 页 共654页END 返回章目录返回总目录SY.W ANG 计算均数差值的标准误:计算1与3比较组的标准误。(3)推断结论 本例只有1与3比较组P0.01,故在0.05水准上拒绝H0,接受H1,差异有统计学意义。可以认为消毒液对大肠杆菌和葡萄球菌的抑制效果不相同;其它
30、各对比组的P0.05,不拒绝H0,差异无统计学意义。则可认为消毒液对大肠杆菌,绿脓杆菌和痢疾杆菌的抑制效果相同。第4 章方差分析 第52 页 共654页END 返回章目录返回总目录SY.W ANG第五节 多个方差的齐性检验 一、概念及意义 Bartlett 检验法的基本思想是,设各总体方差相等,均等于其合并方差。则各样本方差与合并方差相差不会很大。如果相差很大,则计算的样本的 值较大,当超过X2界值时,则P。可以认为各样本所代表的总体方差不全相等。注意:统计软件中,最常用的是Levene方差齐性检验。可用于正态分布及非正态分布的资料。Bartlett 检验法:主要用于正态分布的资料,对于非正态
31、分布的资料不适用。具体内容自学。第4 章方差分析 第53 页 共654页END 返回章目录返回总目录SY.W ANG第六节 变量变换 一、概念及意义(一)概念 变量变换(data transformation)也称为变量代换,是指将原始数据X经过某种数学方法转换为其它的数据形式,使其达到统计学上的某种要求,以利于对资料进行统计处理。如对变量X取对数lgX或取平方根等。常用的变量变换方法有:对数变换,平方根变换,倒数变换,平方根反正弦变换,概率单位变换,logit变换,乘方变换等。第4 章方差分析 第54 页 共654页END 返回章目录返回总目录SY.W ANG(二)意义 原始数据经变量变换后
32、主要应该达到下列几个目的:1.使非正态分布的原始数据达到正态分布或近似正态分布。2.使各样本方差不齐的数据达到方差齐性。3.作曲线回归方程时,使之直线化。4.按照统计学要求,经变量变换后简化运算过程。第4 章方差分析 第55 页 共654页END 返回章目录返回总目录SY.W ANG(一)对数变换 对数变换(logarithm transformation)是将原始数据X取对数,并以对数值作为统计分析的新数据,一般对原始数据取常用对数。对数变换常用于:正偏态分布的资料,尤其是数据呈等比关系的资料,使之成为正态分布或近似正态分布。这类资料也称为对数正态分布资料。各样本方差不齐。各样本方差与均数呈
33、正比关系。公式为 Y=lgX 当原始数据有小值或零值时 Y=lg(X+1),Y=lg(X+k),Y=lg(X-k)二、常用变量变换第4 章方差分析 第56 页 共654页END 返回章目录返回总目录SY.W ANG平方根变换(square root transformation)是将原始数据 X开平方,以平方根值作为统计分析新的变量值。平方根变换的用途:可以将泊松分布的数据转化为正态分布或近似正态分布;轻度正偏态分布的资料转化为近似正态分布;各样本方差不齐或样本方差与均数之间呈正比关系时,可以达到方差齐性,消除或削弱样本方差与均数的正比关系。(二)平方根变换第4 章方差分析 第57 页 共65
34、4页END 返回章目录返回总目录SY.W ANG 平方根反正弦变换(square root arcsine transformation)是将原始数据取平方根后,再计算反正弦函数值,得到转换后的新变量值。当P0%时用下式 当P100%时用下式(三)平方根反正弦变换第4 章方差分析 第58 页 共654页END 返回章目录返回总目录SY.W ANG 主要用于百分率的转换。百分率服从二项分布,如各种疾病的患病率、发病率、死亡率以及各种百分率等相对数。尤其是当百分率偏离50较远如大于70或小于30时,二项分布偏离正态分布较远。经过将百分率转换后,可使新变量值接近正态分布,且往往达到方差齐性。据此,可对百分率p的均数进行t检验或方差分析。例题:自学内容。平方根反正弦变换的用途:第4 章方差分析 第59 页 共654页END 返回章目录返回总目录SY.W ANGTHANKYOUFORLISTENING第4 章方差分析 第60 页