《单因素方差分析PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《单因素方差分析PPT讲稿.ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、单因素方差分析第1页,共43页,编辑于2022年,星期五基基 本本 概概 念念 试验指标试验指标试验结果。试验结果。可控因素可控因素在影响试验结果的众多因素中,可人为在影响试验结果的众多因素中,可人为 控制的因素。控制的因素。水平水平可控因素所处的各种不同的状态。每个水可控因素所处的各种不同的状态。每个水 平又称为试验的一个处理。平又称为试验的一个处理。单因素试验单因素试验如果在一项试验中只有一个因素改变,如果在一项试验中只有一个因素改变,其它的可控因素不变,则该类试验称为其它的可控因素不变,则该类试验称为 单因素试验。单因素试验。因素因素影响一个试验的指标变化的原因。影响一个试验的指标变化的
2、原因。第2页,共43页,编辑于2022年,星期五例例1 为了比较为了比较4种单层皱纹海运集装箱的抗压程度,从每种集装箱中种单层皱纹海运集装箱的抗压程度,从每种集装箱中各随机选取各随机选取6个进行最大抗压试验,得到数据如下表显示,假设集装个进行最大抗压试验,得到数据如下表显示,假设集装箱的抗压程度服从正态分布。问:不同种类的海运集装箱的抗压强度箱的抗压程度服从正态分布。问:不同种类的海运集装箱的抗压强度是否有显著差别?若有差异,哪一种抗压程度高?是否有显著差别?若有差异,哪一种抗压程度高?集装箱类型 最大抗压强度平均抗压强度1655.5 788.3 734.3 721.6679.4699.471
3、3.082789.2772.5 786.9 686.1732.1774.8756.933737.1639.0 696.3 671.7712.2727.1697.234535.1628.7 542.4 559.0586.9520.0562.02第3页,共43页,编辑于2022年,星期五集装箱的最大抗压程度集装箱的最大抗压程度试验指标试验指标 集装箱类型集装箱类型试验因素试验因素(唯一的一个)(唯一的一个)四种类型集装箱(四种类型集装箱(1,2,3,4)四个水平四个水平 因此,本例是一个因此,本例是一个四水平的单因素试验四水平的单因素试验。引引 例例 用用X1,X2,X3,X4分别表示四种集装箱的
4、最大抗压程度,分别表示四种集装箱的最大抗压程度,即为四个总体。假设即为四个总体。假设X1,X2,X3,X4相互独立,且服从相互独立,且服从方差相同的正态分布,即方差相同的正态分布,即XiN(i,2)()(i=1,2,3,4)本例问题归结为检验假设本例问题归结为检验假设 H0:1=2=3=4 是否成立是否成立 第4页,共43页,编辑于2022年,星期五 我们的目的是通过试验数据来判断因素我们的目的是通过试验数据来判断因素 A 的不同水平的不同水平对试验指标是否有影响。对试验指标是否有影响。设设 A 表示欲考察的因素,它的表示欲考察的因素,它的 个不同水平,对应个不同水平,对应的指标视作的指标视作
5、 个总体个总体 每个水平下每个水平下,我们作我们作若干次重复试验,同一水平的若干次重复试验,同一水平的 个结果,就是这个总体个结果,就是这个总体 的的一个样本:一个样本:单因素等重复试验的方差分析单因素等重复试验的方差分析因此,因此,相互独立,且与相互独立,且与 同分布。同分布。第5页,共43页,编辑于2022年,星期五单因素试验资料表单因素试验资料表水平水平重复重复 1.r(水平组内平均值)(水平组内平均值)(总平均值)(总平均值)试验结果试验结果第6页,共43页,编辑于2022年,星期五 纵向个体间的差异称为纵向个体间的差异称为随机误差(组内差异),随机误差(组内差异),由试验造成;横向由
6、试验造成;横向个体间的差异称为个体间的差异称为系统误差(组间差异),系统误差(组间差异),由因素的不同水平造成。由因素的不同水平造成。品种品种重复重复123例:五个水稻品种单位产量的观测值例:五个水稻品种单位产量的观测值第7页,共43页,编辑于2022年,星期五 由于同一水平下重复试验的个体差异是随机误差,所以由于同一水平下重复试验的个体差异是随机误差,所以设:设:其中其中 为试验误差,相互独立且服从正态分布为试验误差,相互独立且服从正态分布线性统计模型线性统计模型 单因素试验的方差分析的数学模型单因素试验的方差分析的数学模型具有具有方差齐性。方差齐性。相互独立,从而各子样也相互独立。相互独立
7、,从而各子样也相互独立。首先,我们作如下假设:首先,我们作如下假设:即即 第8页,共43页,编辑于2022年,星期五则则线性统计模型线性统计模型变成变成于是检验假设:于是检验假设:等价于检验假设:等价于检验假设:整个试验的均值整个试验的均值 称为因素称为因素A的的第第 个水平个水平 的效应的效应。令令 称其为因素称其为因素A的的总体平均值总体平均值。第9页,共43页,编辑于2022年,星期五考察统计量考察统计量经恒等变形,可分解为:经恒等变形,可分解为:其中其中组间平方和(系组间平方和(系统离差平方和)统离差平方和)反映的是各水平平均值偏离总平均值的偏离程度。反映的是各水平平均值偏离总平均值的
8、偏离程度。如果如果H0 成立,则成立,则SSA 较小。较小。若若H0成立,则成立,则总离差平方和总离差平方和 见书见书P251 第10页,共43页,编辑于2022年,星期五组内平方和组内平方和误差平方和误差平方和反映的是重复试验中随机误差的大小。反映的是重复试验中随机误差的大小。第11页,共43页,编辑于2022年,星期五若假设若假设 成立,则成立,则 由抽样分布定理由抽样分布定理5.2及基本假设可推得:及基本假设可推得:将将 的自由度分别记作的自由度分别记作则则(各子样同分布)(各子样同分布),称该关系式为自由度分解公式,称该关系式为自由度分解公式第12页,共43页,编辑于2022年,星期五
9、则则(记(记 ,称作均方和),称作均方和)对给定的检验水平对给定的检验水平 ,由,由得得H0 的拒绝域为:的拒绝域为:F 单侧检验单侧检验 结论:结论:方差分析方差分析实质上实质上是假设检验是假设检验,从分析离差平方和,从分析离差平方和入手,找到入手,找到F统计量统计量,对对同方差同方差的多个正态总体的均值是的多个正态总体的均值是否相等进行假设检验否相等进行假设检验。单因素试验中两个水平的均值检验可。单因素试验中两个水平的均值检验可用第七章的用第七章的T检验法。检验法。第13页,共43页,编辑于2022年,星期五(1)若若 ,则称因素的,则称因素的差异极显著差异极显著(极有极有统计意统计意义)
10、,或称因素义),或称因素A的影响的影响高度显著高度显著,这时作标记,这时作标记 ;约约 定定 (2)若)若 ,则称因素的,则称因素的差异显著差异显著(差异(差异有有统计意义),或称因素统计意义),或称因素A的的影响显著影响显著,作标记,作标记 ;(3)若)若 ,则称因素,则称因素A有一定影响有一定影响,作,作标记标记();(4)若)若 ,则称因素,则称因素A无显著影响(差异无显著影响(差异无无统计意义)。统计意义)。注意注意:在方差分析表中,习惯于作如下规定:在方差分析表中,习惯于作如下规定:第14页,共43页,编辑于2022年,星期五单因素试验方差分析表单因素试验方差分析表方差来源方差来源组
11、间组间组内组内总和总和平方和平方和 自由度自由度均方和均方和F 值值F 值临界值值临界值简便计算公式:简便计算公式:其中其中同一水平下同一水平下观测值观测值之和之和 所有观测所有观测值之和值之和第15页,共43页,编辑于2022年,星期五例2 在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:试比较三种饲料对鸡的增肥作用是否相同。第16页,共43页,编辑于2022年,星期五表8.1.1 鸡饲料试验
12、数据 饲料A鸡 重(克)A110731009 1060 1001 1002 1012 10091028A21107109299011091090 107411221001A310931029 1080 1021 1022 1032 10291048第17页,共43页,编辑于2022年,星期五将原始数据减去1000,列表给出计算过程 表8.1.2 例2的计算表水平数据(原始数据-1000)TiTi2A173 96012129281943763610024A210792-101099074122158534222560355A393 29802122322948354125316209841133
13、50517791363第18页,共43页,编辑于2022年,星期五 利用计算公式,可算得各偏差平方和为:把上述诸平方和及其自由度填入方差分析表第19页,共43页,编辑于2022年,星期五表8.1.3 例8.1.2的方差分析表 来源平方和自由度均方和F比因子9660.083324830.04173.5948 误差28215.9584211343.6171总和37876.041723若取=0.05,则F0.95(2,21)=3.47,由于F=3.59483.47,故认为因子A(饲料)是显著的,即三种饲料对鸡的增肥作用有明显的差别。第20页,共43页,编辑于2022年,星期五 例例2 以以 A、B、
14、C 三种饲料喂猪,得一个月后每猪三种饲料喂猪,得一个月后每猪所增体重(单位:所增体重(单位:500g)为下表,试作方差分析。)为下表,试作方差分析。饲料饲料ABC增重增重51 40 43 4823 25 2623 28解解:第21页,共43页,编辑于2022年,星期五解:解:第22页,共43页,编辑于2022年,星期五不同的饲料对猪的体重的影响不同的饲料对猪的体重的影响极有统计意义极有统计意义。方差分析表方差分析表方差来源方差来源组间组间组内组内总和总和平方和平方和 自由度自由度均方和均方和F 值值F 值临界值值临界值第23页,共43页,编辑于2022年,星期五方差分析的基本步骤小结:方差分析
15、的基本步骤小结:将资料总变异的自由度和平方和分解为各变异因素的自将资料总变异的自由度和平方和分解为各变异因素的自由度和平方和。由度和平方和。计算均方。计算均方。计算均方比,做出计算均方比,做出F测验,以明确各个变异因素的重要程测验,以明确各个变异因素的重要程度。度。对各个平均数进行多重比较。对各个平均数进行多重比较。第24页,共43页,编辑于2022年,星期五定理定理 在单因素方差分析模型中,有在单因素方差分析模型中,有 如果如果H0不成立不成立,则,则 所以,所以,即即H0不成立不成立时,时,有大于有大于1的趋势。的趋势。所以所以H0为真时的小概率事件应取在为真时的小概率事件应取在F值较大的
16、一侧。值较大的一侧。第25页,共43页,编辑于2022年,星期五 四、多重比较四、多重比较 F 值显著或极显著,否定无效假设值显著或极显著,否定无效假设HO,表明试验中各处理平均数间存在显著或极显著表明试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差差异,但并不意味着每两个处理平均数间的差异都显著或极显著的,也不能具体说明哪些处异都显著或极显著的,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不理平均数间有显著或极显著差异,哪些差异不显著。显著。第26页,共43页,编辑于2022年,星期五 有必要有必要进行两两处理平均数间的比较进行两两处理平均数间的比较
17、,以,以具体判断两两处理平均数间的差异显著性。具体判断两两处理平均数间的差异显著性。统计学上把多个平均数两两间的相互比较统计学上把多个平均数两两间的相互比较称为多重比较称为多重比较。多重比较的方法很多,常用的有多重比较的方法很多,常用的有最小显著最小显著差数法差数法(LSD法法)和和最小显著极差法最小显著极差法(LSR法法)。第27页,共43页,编辑于2022年,星期五 此法的基本作法是:此法的基本作法是:在在F 检验显著的前提检验显著的前提下下,先,先 计计 算算 出出 显显 著著 水水 平为平为的的 最最 小显著差小显著差数数 ,然后将任意两个处理平均数的差数的,然后将任意两个处理平均数的
18、差数的绝对值绝对值 与其比较:与其比较:(一)最小显著差数法(一)最小显著差数法(LSDLSD法法)第28页,共43页,编辑于2022年,星期五 若若 LSD,则,则 与与 在在水平上差异水平上差异显著;反之,则在显著;反之,则在水平上差异不显著。水平上差异不显著。最小显著差数由下式计算:最小显著差数由下式计算:式中:式中:为在为在F检验中误差自由度下,显著检验中误差自由度下,显著水平为水平为的临界的临界t值,值,为均数差数标准误,为均数差数标准误,第29页,共43页,编辑于2022年,星期五 其中其中 为为F检验中的误差均方,检验中的误差均方,n为各处理为各处理的重复数。的重复数。当显著水平
19、当显著水平=0.05和和0.01时,从时,从t值表中查值表中查出出 和和 ,得:得:利用利用LSD法进行多重比较时,可按如下步骤法进行多重比较时,可按如下步骤进行:进行:第30页,共43页,编辑于2022年,星期五 (2)计算最小显著差数计算最小显著差数 和和 ;(3)将平均数多重比较表中两两平均数的差将平均数多重比较表中两两平均数的差数与数与 、比较,作出统计推断。比较,作出统计推断。(1)列出平均数多重比较表列出平均数多重比较表 比较表中各处理比较表中各处理按其平均数从大到小自上而下排列;按其平均数从大到小自上而下排列;第31页,共43页,编辑于2022年,星期五 (二二)最小显著极差法最
20、小显著极差法(LSR法法)LSR 法的特点是把平均数的差数看成是平法的特点是把平均数的差数看成是平均数的均数的极差极差,根据极差范围内所包含的处理数根据极差范围内所包含的处理数(称为称为秩次距秩次距)k k 的不同而采用不同的检验尺度的不同而采用不同的检验尺度,以克服以克服LSD法的不足法的不足。这些在显著水平。这些在显著水平上依上依秩次距秩次距 k 的不同而采用的不同的检验尺度叫做的不同而采用的不同的检验尺度叫做最小显著极差最小显著极差(LSR)。第32页,共43页,编辑于2022年,星期五 因为因为LSRLSR法是一种极差检验法,所以当一个平法是一种极差检验法,所以当一个平均数大集合的极差
21、不显著时,其中所包含的各个均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理较小集合极差也应一概作不显著处理。常用的常用的LSR法有法有q检验法和新复极差法两种。检验法和新复极差法两种。1 1、q q 检验法检验法 此法是以统计量此法是以统计量q的概率分布为基础的。的概率分布为基础的。q值值由下式求得:由下式求得:第33页,共43页,编辑于2022年,星期五 上式中,上式中,w为为极差极差,为为标准误标准误,分布依赖于误差自由度分布依赖于误差自由度 dfe 及秩次距及秩次距 k。利用利用q检验法进行多重比较时检验法进行多重比较时,为了简便起为了简便起见,不是将算出的见,
22、不是将算出的 q 值值 与与 临临 界界 q 值值 比较,而是比较,而是将极差与将极差与 比较,从而作比较,从而作出统计推断出统计推断。为为水平上的最小显著水平上的最小显著极差:极差:第34页,共43页,编辑于2022年,星期五 (1)列出平均数多重比较表;列出平均数多重比较表;(2)由自由度由自由度 dfe、秩次距秩次距k查临界查临界q值,计值,计算最小显著极差算最小显著极差LSR0.05,k,LSR0.01,k;(3)将平均数多重比较表中的各极差与相应将平均数多重比较表中的各极差与相应的最小显著极差的最小显著极差LSR0.05,k ,LSR0.01,k 比较,作比较,作出统计推断。出统计推
23、断。第35页,共43页,编辑于2022年,星期五 2、SSR法法 此法是由邓肯此法是由邓肯 (Duncan)于于1955年提出,年提出,又称为又称为Duncan法法,或,或新复极差法新复极差法。新复极差法与新复极差法与q法的检验步骤相同,唯一不法的检验步骤相同,唯一不同的是计算最小显著极差时需同的是计算最小显著极差时需查查SSR表表(附表附表9)而不是查而不是查q值表。最小显著极差计算公式为:值表。最小显著极差计算公式为:第36页,共43页,编辑于2022年,星期五 以上介绍的三种多重比较方法,以上介绍的三种多重比较方法,其检验其检验尺度有如下关系:尺度有如下关系:LSD LSD 法法 SSR
24、 SSR 法法 q q 法法 当秩次距当秩次距k=2k=2时,取等号;秩次距时,取等号;秩次距 k3k3时,时,取小于号。在多重比较中,取小于号。在多重比较中,LSDLSD法的尺度最小,法的尺度最小,q q检验法尺度最大,新复极差法尺度居中。检验法尺度最大,新复极差法尺度居中。用用上述排列顺序前面方法检验显著的差数,用后上述排列顺序前面方法检验显著的差数,用后面方法检验未必显著;用后面方法检验显著的面方法检验未必显著;用后面方法检验显著的差数,用前面方法检验必然显著。差数,用前面方法检验必然显著。第37页,共43页,编辑于2022年,星期五 生物试验中,由于试验误差较大,常生物试验中,由于试验
25、误差较大,常采用采用SSRSSR法法 ;F F检验显著后,为了简便,也可采用检验显著后,为了简便,也可采用LSDLSD法。法。第38页,共43页,编辑于2022年,星期五 此法是将多重比较结果直接标记在平均数此法是将多重比较结果直接标记在平均数多重比较表上,如表多重比较表上,如表 8.8所示。由于在多重比所示。由于在多重比较表中各个平均数差数构成一个三角形阵列,较表中各个平均数差数构成一个三角形阵列,故称为故称为三角形法三角形法。此法的。此法的优点是简便直观,缺优点是简便直观,缺点是占的篇幅较大。点是占的篇幅较大。1 1、三角形法、三角形法(三)多重比较结果的表示方法(三)多重比较结果的表示方
26、法第39页,共43页,编辑于2022年,星期五 2 2、标记字母法、标记字母法 先将各处理平均数由大到小自上而下先将各处理平均数由大到小自上而下排列;然后在最大平均数后标记字母排列;然后在最大平均数后标记字母a a,并,并将该平均数与将该平均数与 以下各平均数依次相比,凡以下各平均数依次相比,凡差异不显著标记同一差异不显著标记同一 字母字母 a a,直到某一与,直到某一与其差异显著的平均数标记字母其差异显著的平均数标记字母 b b 为止;为止;再以标有字母再以标有字母b b的平均数为标准,与上的平均数为标准,与上方比它大的各个平均数比较方比它大的各个平均数比较 ,凡差异不显,凡差异不显著一律再
27、加标著一律再加标b b ,直至显著为止;,直至显著为止;第40页,共43页,编辑于2022年,星期五 再以标记有字母再以标记有字母b b的最大平均数为标准,与的最大平均数为标准,与下面各未标记字母的平均数相比下面各未标记字母的平均数相比 ,凡差异不显,凡差异不显著,继续标记字母著,继续标记字母b b,直至某一个与其差异显著,直至某一个与其差异显著的平均数标记的平均数标记c c为止;为止;如此重复下去,直至最小一个平均数被标记、如此重复下去,直至最小一个平均数被标记、比较完毕为止。比较完毕为止。这样,各平均数间凡有一个相同字母的即为这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的
28、即为差异显著。差异不显著,凡无相同字母的即为差异显著。用小写拉丁字母表示显著水平用小写拉丁字母表示显著水平=0.05=0.05,用,用大写拉丁字母表示显著水平大写拉丁字母表示显著水平=0.01=0.01。第41页,共43页,编辑于2022年,星期五 在利用字母标记法表示多重比较结果时,常在在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。三角形法的基础上进行。此法的优点是占篇幅小,此法的优点是占篇幅小,在科技文献中常见。在科技文献中常见。第42页,共43页,编辑于2022年,星期五 方差分析的基本步骤方差分析的基本步骤:(一一)计算各项平方和与自由度;计算各项平方和与自由度;(二二)列出方差分析表,进行列出方差分析表,进行 F F 检验;检验;(三三)若若 F F 检验显著,进行多重比较。检验显著,进行多重比较。多重比较的方法有多重比较的方法有最小显著差数法最小显著差数法(LSDLSD法法)和和最小显著极差法最小显著极差法(LSRLSR法:包括法:包括 q q 法法 和和 SSRSSR法法)。表示多重比较结果的方法有表示多重比较结果的方法有三角形法三角形法和和标记标记字母法字母法。第43页,共43页,编辑于2022年,星期五