《正交试验方差分析通俗易懂.doc》由会员分享,可在线阅读,更多相关《正交试验方差分析通俗易懂.doc(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十一章 正交设计试验资料的方差分析在实际工作中 ,常常需要同时考察 3个或3个以上的试验因素 ,假设进展全面试验,那么试验的规模将很大 ,往往因试验条件的限制而难于实施 。 正交设计是安排多因素试验 、寻求最优水平组合的一种 高效率试验设计方法。 第一节、正交设计原理与方法 (一) 正交设计的根本概念 正 交 设 计 是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选局部有代表性的水平组合进展试验,通过对这局部试验结果的分析了解全面试验的情况,找出最优水平组合。例如, 研究氮、磷、钾肥施用量对某小麦品种产量的影响: A因素是氮肥施用量,设A1、A2、
2、A3 3个水平 ; B因素是磷肥施用量,设B1、B2、B3 3个水平 ; C因素是钾肥施用量,设C1、C2、C3 3个水平。 这是一个3因素每个因素3水平的试验 ,各因素的水平之间全部可能的组合有27种。如果进展全面试验 ,可以分析各因素的效应 ,交互作用,也可选出最优水平组合。 但全面试验包含的水平组合数较多,工作量大 ,由于受试验场地、经费等限制而难于实施 。 如果试验的主要目的是寻求最优水平组合,那么可利用正交设计来安排试验。 正交设计的根本特点是:用局部试验来代替全面试验,通过对局部试验结果的分析,了解全面试验的情况。 正交试验是用局部试验来代替全面试验,它不可能像全面试验那样对各因素
3、效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。如对于上述3因素每个因素3水平试验,假设不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最正确的生产条件。一、正交设计的根本原理表11-1 33试验的全面试验方案正交设计就是从全面试验点水平组合中挑选出有代表性的局部试验点水平组合来进展试验。图1中标有9 个试验点,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即: (1)A1B1C1 (2)A1B2C2 (3)A1B3C3 (4)A2B1C2 (5)A2B2C3 (6)A2B3
4、C1 (7)A3B1C3 (8)A3B2C1 (9)A3B3C2上述选择 ,保证了A因素的每个水平与B因素 、 C 因 素的各个水平在试验中各搭配一次。 从图1中可以看到,9个试验点分布是均衡的 ,在立方体的每个平面上 有且仅有3个试验点;每两个平面的交线上有且仅有1个试验点。 9个试验点均衡地分布于整个立方体内 ,有很强的代表性,能够比拟全面地反映全面试验的根本情况。 二、正交表及其特性 (一) 正交表 表 11-2 是L8(27)正交表,其中 “L代表正交表;L 右下角的数字“8表示有8行,用这张正交表安排试验包含8个处理 (水平组合) ;括号内的底数“2 表示因素的水平数,括号内 2的指
5、数“7表示有7列,用这张正交表最多可以安排7个2水平因素。 表11-2 L8(27)正交表2水平正交表还有L4(23)、L16(215)等; 3水平正交表有L9(34)、L27(313) 、 等。 (二) 正交表的特性 1、任一列中,不同数字出现的次数一样 例如L8(27)中不同数字只有1与2,它们各出现4次;L9(34)中不同数字有1、2与3,它们各出现3次 。2、任两列中,同一横行所组成的数字对出现的次数一样 例如 L8(27)的任两列中(1, 1), (1, 2), (2, 1), (2, 2)各出现两次;L9(34)任两列中 (1, 1), (1, 2), (1, 3), (2, 1)
6、, (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)各出现1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,说明任意两列各个数字之间的搭配是均匀的。 用正交表安排的试验,具有均衡分散与整齐可比的特点。 均衡分散,是指用正交表挑选出来的各因素 水 平 组合在全部水平组合中的分布是均衡的 。 由 图11-1可以看出,在立方体中 ,任一平面内都包含 3 个 试验点, 任两平面的交线上都包含1个试验点。整齐可比是指每一个因素的各水平间具有可比性。 因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比拟某因素不同水平时,其它因素的效应都彼此抵消。如
7、在A、B、C 3个因素中,A因素的 3 个水平 A1、A2、A3 条件下各有 B、C 的 3 个不同水平,即: 在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式不同,但B、C皆处于同等地位,当比拟A因素不同水平时,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消。所以A因素3个水平间具有可比性。同样,B、C因素3个水平间亦具有可比性。(三) 正交表的类别 1、一样水平正交表 各列中出现的最大数字一样的正交表称为一样水平正交表。 L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为两水平正交表; L9(34)、L27(313)等各列中最大数
8、字为3,称为3水平正交表。2、 混合水平正交表 各列中出现的最大数字不完全一样的正交表称为 混合水平正交表。 L8(4124)表中有一列最大数字为4,有4列最大数字为2。 也就是说该表可以安排1个4水平因素与4个2水平因素。 L16(4423),L16(4212)等都混合水平正交表。三、正交设计方法 【例111】 某水稻栽培试验选择了3个水稻优良品种(A):二九矮、高二矮、窄叶青 , 3种密度(B): 15、20、25万苗/666.7m2;3种施氮量(C): 3、5、8kg/666.7m2,试采用正交设计安排一个试验方案。 (一) 确定试验因素及其水平, 列出因素水平表表11-3 因素水平表(
9、二) 选用适宜的正交表 根据因素、水平及需要考察的交互作用的多少来选择适宜的正交表。 选用正交表的原那么是:既要能安排下试验的全部因素(包括需要考察的交互作用),又要使局部水平组合数处理数尽可能地少。一般情况下,试验因素的水平数应恰好等于正交表记号中括号内的底数;因素的个数包括需要考察交互作用应不大于正交表记号中括号内的指数;各因素及交互作用的自由度之与要小于所选 正交表 的 总 自由度,以便估计试验误差。 假设各因素及交互作用的自由度之与等于所选正交表总自由度,那么可采用有重复正交试验来估计试验误差。此例有3个3水平因素,假设不考察交互作用,那么各因素自由度之与为因素个数 (水平数-1) =
10、 3 (3-1) =6,小于L9(34)总自由度 9-1=8,故可以选用L9(34); 假设要考察交互作用,那么应选用L27(313),此时所安排的试验方案实际上是全面试验方案。(三) 表头设计 表头设计就是把挑选出的因素与要考察的交互作用分别排入正交表的表头适当的列上。 在不考察交互作用时,各因素可随机安排在各列上;假设考察交互作用,就应按该正交表的交互作用列表安排 各 因 素与交互作用。此例不考察交互作用,可将品种(A)、密度(B)与施氮量 (C)依次安排在L9(34)的第1、2、3列上,第4 列 为空列,见表2-4。表11-4 表头设计L934表头设计L8(27) 表头设计(四) 列出试
11、验方案 把正交表中安排因素的各列(不包含欲考察的交互作用列)中的每个数字依次换成该因素的实际水平,就得到一个正交试验方案。 表11-5 正交试验方案第二节 正交试验资料的方差分析 假设各号试验处理都只有一个观测值,那么称之为单个观测值正交试验;假设各号试验处理都有两个或两个以上观测值,那么称之为有重复观测值正交试验。一、 单个观测值正交试验资料的方差分析 对【例11-1】用L9(34)安排试验方案后,各号试验只进展一次,试验结果列于表2-6。试对其进展方差分析。表11-6 正交试验结果计算表Ti为各因素同一水平试验指标之与 ,T为9个试验号的试验指标之与; 为各因素同一水平试验指标的平均数。
12、该试验的9个观测值总变异由A因素、B因素、C因素及误差变异4局部组成,因而进展方差分析时平方与与自由度的分解式为: SST = SSA + SSB + SSC+SSe dfT = dfA + dfB + dfC + dfe 用n表示试验(处理)数;a、b、c表示A、B、C因素的水平数;ka、kb、kc表示A、B、C因素的各水平重复数。本例,n=9、a=b=c=3、 ka=kb=kc=3。 1、计算各项平方与与自由度 矫正数 C = T2/n = 37112/9 = 1530169.00 总平方与 SST =x2-C =22+2 =21238.00 A因素平方与 SSA=/ka-C =222B因
13、素平方与 SSB = /kb-C 222C因素平方与 SSC=/kc-C 222 =5492.17 误差平方与 SSe=SST-SSA-SSB-SSC =3062.16 总自由度 dfT =n-1=9-1=8 A因素自由度 dfA =a-1=3-1=2 B因素自由度 dfB =b-1=3-1=2 C因素自由度 dfC =c-1=3-1=2 误差自由度 dfe = dfT-dfA-dfB-dfC = 8-2-2-2 = 22、列出方差分析表,进展F检验表11-7 方差分析表F 检验结果说明,三个因素对产量的影响都不显著。究其原因可能是本例试验误差大且误差自由度小(仅为2),使检验的灵敏度低,从而
14、掩盖了考察因素的显著性。 由于各因素对增重影响都不显著,不必再进展各因素水平间的多重比拟。此时,可从表11-6中选择平均数大的水平A2、B3、C3组合成最优水平组合 A2B3C3。假设F检验结果3个因素对试验指标的影响显著或极显著,进展各因素水平间多重比拟常采用SSR法。 本例是选用一样水平正交表 L9(34)安排的试验,A、B、C因素各水平重复数一样,即ka=kb=kc=3,它们的标准误一样,即单个观测值正交试验资料的方差分析,其误差是由“空列来估计的。然而“空列并不空,实际上是被未考察的交互作用所占据。 这种误差既包含试验误差,也包含交互作用,称为模型误差。 假设交互作用不存在,用模型误差
15、估计试验误差是可行的;假设因素间存在交互作用,那么模型误差会夸张试验误差,有可能掩盖考察因素的显著性。试验误差应通过重复试验值来估计。所以,进展正交试验最好能有二次以上的重复。正交试验的重复,可采用完全随机或随机区组设计。二、 有重复观测值正交试验资料的方差分析 【例114】 为了探讨花生锈病药剂防治效果的好坏,进展了药剂种类A、浓度B、剂量C3因素试验,各有3个水平,选用正交表L9(342)见表1110,对试验结果进展方差分析。用r表示试验处理的重复数(区组数); n,a、b、c,ka、kb、kc的意义同上。此例 r=2; n=9, a=b=c=3, ka=kb=kc=3。表11-10 防治
16、花生锈病药剂种类、浓度、剂量正交试验方案及结果计算表Ti为各因素同一水平试验指标之与 ,T为9个试验号的试验指标之与; 为各因素同一水平试验指标的平均数。 对于有重复、且重复采用随机区组设计的正交试验,总变异可以划分为处理间、区组间与误差变异三局部,而处理间变异可进一步划分为A因素、B因素、C因素与模型误差变异四局部。此时,平方与与自由度分解式为: SST=SSt+SSr+SSe2 dfT = dft + dfr + dfe2 而 SSt=SSA+SSB+SSC+SSe1 dft = dfA + dfB + dfC + dfe1于是 SST= SSA+SSB+SSC+SSr+SSe1+ SSe
17、2 dfT = dfA + dfB + dfC + dfr + dfe1 + dfe2其中:SSr为区组间平方与;SSe1为模型误差平方与;SSe2为试验误差平方与;SSt为处理间平方与; dfr 、 dfe1 、dfe2 、dft 为相应自由度。注意 ,对于重复采用完全随机设计的正交试验,在平方与与自由度划分式中无 SSr、dfr项。 1、计算各项平方与与自由度 矫正数 C =T2/ r n =2/2 总平方与 SST=x2-C =22+2 区组间平方与 SSr=T2r /n-C =22处理间平方与 SSt = T2t / r - C 22+2 A因素平方与 SSA = T2A / kar
18、- C = 222)/(3 B因素平方与 SSB =T2B / kbr - C 222)/(3 =45.24 C因素平方与 SSC = T2C / kcr - C =222)/(32) -16744.50 =78.77 模型误差平方与 SSe1 = SSt SSA SSB - SSC =245.96- 25.72- 45.24.- 78.77 = 96.23 试验误差平方与 SSe2 =SST SSr - SSt =246.62- 0.22- 245.96 = 0.44 总自由度 dfT=rn-1=29-1=17 区组自由度 dfr=r-1=2-1=1 处理自由度 dft=n-1=9-1=8
19、A因素自由度 dfA=a-1=3-1=2 B因素自由度 dfB=b-1=3-1=2 C因素自由度 dfC=c-1=3-1=2模型误差自由度 dfe1 = dft-dfA-dfB-dfC = 8-2-2-2= 2 试验误差自由度 dfe2=dfT-dfr-dft =17-1-8 = 82、列出方差分析表,进展F检验表11-10 有重复观测值正交试验资料的方差分析表首先检验MSe1与MSe2差异的显著性,假设经F检验不显著,那么可将其平方与与自由度分别合并,计算出合并的误差均方,进展F检验与多重比拟,以提高分析的精度;假设F检验显著,说明存在交互作用 ,二者不能合并 , 此时只能以MSe2进展F检
20、验与多重比拟。本例MSe1 / MSe2=802.00* ,模型误差均方 MSe1 与试验误差均方 MSe2 差异极显著,说明试验因素间交互作用极显著,只能以试验误差均方 MSe2 进展F检验与多重比拟。F检验结果说明,药剂种类A、浓度B、剂量C3 因素对花生产量都有极显著影响;区组间差异不显著 。3、 多重比拟 (1) 假设模型误差显著,说明试验因素间存在交互作用,各因素所在列有可能出现交互作用的混杂,此时各试验因素水平间的差异已不能真正反映因素的主效,因而进展各因素水平间的多重比拟无多大实际意义,但应进展试验处理间的多重比拟,以寻求最处理,即最优水平组合。进展各试验处理间多重比拟时选用试验
21、误差均方MSe2。模型误差显著,还应进一步试验,以分析因素间的交互作用。 (2) 假设模型误差不显著 ,说明试验因素间交互作用不显著,各因素所在列有可能未出现交互作用的混杂,此时各因素水平间的差异能真正反映因素的主效,因而进展各因素水平间的多重比拟有实际意义,并从各因素水平间的多重比拟中选出各因素的最优水平相组合,得到最优水平组合。 进展各因素水平间的多重比拟时,用合并的误差均方 MSe=SSe1+ SSe2/dfe1+ dfe2 此时可不进展试验处理间的多重比拟。本例模型误差极显著,说明因素间存在交互作用,不必进展各因素水平间的多重比拟,应进展试验处理间的多重比拟 , 以寻求最处理,即最优水
22、平组合。为了让读者了解多重比拟的方法,下面仍对各因素水平间、各试验处理间进展多重比拟。1A、B、C因素各水平平均数的多重比拟表11-12 A因素各水平平均数的多重比拟表(SSR法)表11-13 B因素各水平平均数的多重比拟表(SSR法)表11-14 C因素各水平平均数的多重比拟表(SSR法)因为由dfe=8与k=2, 3, 查得SSR值并计算出LSR值列于表11-15。 表11-15 SSR值与LSR值表多重比拟结果说明: A因素各水平平均产量间 、B因素各水平平均产量间 、C因素各水平平均产量间差异显著或极显著。各因素的最优水平为A1、B1、C2。注意,本例模型误差显著,试验因素间存在交互作
23、用 ,不宜从各因素水平间的多重比拟中选出各因素的最优水平相组合来得到最优水平组合。2各试验处理平均数间的多重比拟表11-16 各试验处理平均数多重比拟表(LSD法)因为由dfe=8, 查得t0.05(8)=2.306,t0.01(8)=3.355,计算出LSD值为:LSD0.05= t0.05(8) 0.245=0.565 LSD0.01= t0.01(8) 0.245=0.822 各试验处理间平均数多重比拟结果,除第2号试验处理与第7号试验处理 、第3号试验处理与第 6 号试验处理平均产量差异不显著外,其余各试验处理平均产量间差异极显著或显著,最优水平组合为第 2 号试验处理A1B2C2或第7号试验处理A3B1C3 本例模型误差显著,试验因素间存在交互作用,应以试验处理间的多重比拟寻求的最优水平组合, 即第2号试验处理 A1B2C2 或第7号试验处理 A3B1C3 为该试验的最优水平组合。 第 16 页