《第六章--方差分析与正交试验设计(共18页).doc》由会员分享,可在线阅读,更多相关《第六章--方差分析与正交试验设计(共18页).doc(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上第六章 方差分析与正交试验设计 在生产实践和科学研究中,经常要分析各种因素对试验指标是否有显著的影响。例如,工业生产中,需要研究各种不同的配料方案对生产出的产品的质量有无显著差异,从中筛选出较好的原料配方;农业生产中,为了提高农作物的产量,需要考察不同的种子、不同数量的肥料对农作物产量的影响,并从中确定最适宜该地区种植的农作物品种和施肥数量。 要解决诸如上述问题,一方面需要设计一个试验,使其充分反映各因素的作用,并力求试验次数尽可能少,以便节省各种资源和成本;另一方面就是要对试验结果数据进行合理的分析,以便确定各因素对试验指标的影响程度。6.1 单因素方差分析 仅考虑
2、一个因素对试验指标有无显著影响,可以让取个水平:,在水平下进行次试验,称为单因素试验,试验结果观测数据列于下表: 序号水平1 2 并设在水平下的数据来自总体,。 检验如下假设: , 不全相等检验统计量为其中,称为组间差平方和。 ,称为组内差平方和。这里 ,。 对于给定的显著性水平,如果,则拒绝,即认为因素对试验指标有显著影响。 实际计算时,可事先对原始数据作如下处理:再进行计算,不会影响值的大小。例1 下表给出在30只小白鼠身上接种三种不同菌型的伤寒病菌后的存活日数:菌型接种后的存活日数2 3 3 2 4 7 7 2 5 45 6 8 5 10 7 12 6 67 11 6 6 7 9 5 1
3、0 6 3 10试分析三种不同的菌型对小白鼠的平均存活日数影响是否显著?解: , ,说明三种不同菌型的伤寒病菌对小白鼠的平均存活日数的影响高度显著。6.2 双因素方差分析 同时考察两个因素和对试验指标有无显著影响,可以让取个水平:,让取个水平:,在各种水平配合下进行试验,称为双因素试验。一、无交互作用的双因素方差分析 在每一种水平配合下作一次试验,称为无交互作用的双因素试验,试验结果观测数据列于下表: 因素因素 并设在水平配合下的数据来自总体,。 检验如下假设: , 不全相等 , 不全相等分别用如下检验统计量其中,称为的组间差平方和。 ,称为的组间差平方和。 ,称为组内差平方和。这里 ,。对于
4、给定的显著性水平,如果,则拒绝,即认为因素对试验指标有显著影响;如果,则拒绝,即认为因素对试验指标有显著影响。 实际计算时,可事先对原始数据作如下处理:再进行计算,不会影响值的大小。例1 为了解三种不同配比的饲料对仔猪生长影响的差异,对3种不同品种的仔猪各选3头进行试验,分别测得其一段时间体重增加量,如下表所示(代表饲料,代表品种): 因素因素 51 56 4553 57 4952 58 47试分析不同饲料与不同品种对仔猪的生长有无显著影响?解:所有数据减去50后计算结果如下: ,说明不同饲料对仔猪的生长无显著影响。,说明品种的差异对仔猪生长的影响高度显著。二、有交互作用的双因素方差分析在每一
5、种水平配合下重复作次试验,称为有交互作用的双因素试验,试验结果观测数据列于下表:试验结果因素因素 并设在水平配合下的数据来自总体,。检验如下假设: , 不全相等 , 不全相等 全相等, 不全相等分别用如下检验统计量其中,称为的组间差平方和。 ,称为的组间差平方和。 ,称为的组间差平方和。,称为组内差平方和。这里 ,。对于给定的显著性水平,如果,则拒绝,即认为因素对试验指标有显著影响;如果,则拒绝,即认为因素对试验指标有显著影响;如果,则拒绝,即认为因素与因素之间的交互效应对试验指标有显著影响。实际计算时,可事先对原始数据作如下处理:再进行计算,不会影响值的大小。例2 考察合成纤维弹性影响因素为
6、拉伸倍数与收缩率。与各取4个水平,每个水平配合下做2次试验,结果数据见下表:试验结果因素(0)(4)(8)(12)因素(460)(520)(580)(640)71 7372 7375 7377 7373 7576 7478 7774 7476 7379 7774 7574 7375 7373 7270 7169 69试分析因素、因素对合成纤维弹性的影响是否显著?以及因素与因素之间的交互效应对合成纤维弹性的影响是否显著?解: ,说明拉伸倍数对合成纤维弹性无显著影响。,说明收缩率对合成纤维弹性的影响高度显著。 ,说明因素与因素之间的交互效应对合成纤维弹性的影响高度显著。6.3 正交试验设计前面介绍
7、了单因素与双因素试验的方差分析,但是在实际问题中遇到的因素往往超过两个,需要考察各个因素对试验结果是否有显著影响。从理论上讲可以导出多因素的方差分析法,但是一来公式会变得很复杂,二来总试验次数也要明显增多。例如,考虑7个因素的试验,每个因素有6个水平,若在每一种组合水平上都做一次试验,需要做次试验,这是根本不可能的! 为了减少试验次数,希望在所有组合水平中挑选一部分出来,在这些组合水平上做试验,即局部地进行试验。正交试验设计是利用一套现成的规格化的表正交表,科学地安排试验和分析试验结果的一种数理统计方法,该方法的主要优点是能在很多试验条件中选出代表性强的少数试验方案,同时通过对这少数试验方案的
8、结果进行分析,从中找出最优方案。 正交表1944年起源于美国。第二次世界大战后在日本开发了使用正交表进行试验设计的技术体系,并在日本全国进行大力普及推广、应用,取得了显著的经济效益。 实践证明,正交设计是促进生产率提高的一种有效手段,目前已经广泛应用于科学研究、产品设计、工艺改革等技术领域以及经营、计划等管理领域。一、正交表 正交表记为,表示至多安排个因素,每个因素有种水平,共作次试验的正交表。下面就是两个常用的正交表,。 列号 水平试验号1 2 3 4 列号 水平试验号1 2 3 4 5 6 7 1234567891 1 1 11 2 2 21 3 3 3 2 1 2 32 2 3 12 3
9、 1 2 3 1 3 23 2 1 33 3 2 1123456781 1 1 1 1 1 11 1 1 2 2 2 2 1 2 2 1 1 2 2 1 2 2 2 2 1 1 2 1 2 1 2 1 22 1 2 2 1 2 12 2 1 1 2 2 12 2 1 2 1 1 2其中符号含义如下:正交表符号;试验次数(正交表的行数);水平数;因素个数(正交表的列数)。 从上面两个正交表容易看出它们具有如下性质:(1)表中任何一列所含不同的数字出现的次数相同。如表每一列有三个不同的数字“1”、“2”、“3”,它们各出现3次。(2)将表中任意两列同一行的两个数字看成有序数对,每种数对出现的次数相
10、同。如表的有序数对为(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)共9个,它们各出现一次。 以上性质说明正交表中各因素的水平搭配均衡,并可大大减少试验次数。二、无交互作用的正交设计及其结果的直观分析1、如何用正交表安排试验 下面用一个实例来说明。例1 某化工厂进行合成氨试验,需要设计寻找最优生产条件的试验方案。 我们分如下几个步骤设计试验方案,以便寻找最优工艺条件。第一步:明确试验的目的,确定试验指标。 本试验的目的是寻找合成氨的最优生产条件,试验指标是氨的产量,高者为优。第二步:挑因素,选水平。 根据以往经验和相关专业资料列出以下因
11、素水平表。 因素水平A反应温度()B反应压力(Pa)C催化剂种类1460250甲2490270乙3520300丙第三步:选择合适的正交表,进行表头设计。选择正交表时,首先要求正交表中的水平数与每个因素水平数一致,其次要求正交表中因素个数大于或等于实际因素个数,然后适当选用试验次数较小的正交表。 本例是一个三水平试验,因此要从型中选择正交表。若不考虑交互作用,本例共有三个因素,所以应选一张的最小的表,因此选用是合适的。 将A,B,C随机地放到的表头各列中,叫做表头设计。因素ABC空列列号1234第四步:列出试验方案表,按其做试验。 确定表中各列水平号码的具体内容。如对因素A列的数字“1”、“2”
12、、“3”分别填上460,490,520;类似地确定因素B,C列中水平号码的具体内容,就得到如下表所示的试验方案。 正交表的每一行就代表一个试验方案。 严格按照表中所规定的9个试验条件做试验,并把试验结果的数据填写在表中的最后一列。 因素 列号试验号ABC空列产量(吨)12341234567891(460)112(490)223(520)331(250)2(270)3(300)1231231(甲)2(乙)3(丙)2313121233122311.721.821.801.921.831.981.591.601.812、单指标试验的直观分析 试验指标只有一个的试验叫做单指标试验。直观分析法也叫做极差
13、分析法。 下面以例1说明它的步骤如下:(1)计算第列上第个水平的试验结果总和。 类似地可以计算出 (2)计算的平均值,其中为第列上第个水平出现的次数。 类似地可以计算出 (3)计算第列的极差。 类似地可以计算出。(4)选择最优生产条件。 极差的意义是:越大,说明该因素的水平变化对试验指标的影响越大,即该因素越重要;反之,越小,该因素越不重要。由此可以根据的大小顺序排出因素的主次。例如在例1中,由于,因此A,B,C的主次顺序为。 因为之间的差别仅仅是由引起的,而与B,C取什么水平无关,因此一般地可以通过比较的大小来确定A的最佳水平。在例1中,由于最大,说明A取水平最好。类似地,可以确定B的最佳水
14、平为,C的最佳水平为,由此得最优配方为。 但是在上述9个试验方案中,并没有。这说明,用正交表安排试验不仅可以从表上看到9次试验中的最好配方,而且还可以推断出全面试验中的最优配方条件是。 关于空白列,也需要分析它的极差,若它的极差很小,则可以认为因素之间的交互作用很小,可以忽略不计。否则若它的极差比所有因素的极差都大,则说明因素之间可能存在有不可忽略的交互作用,或是忽略了对试验结果有重要影响的其它因素。3、多指标试验的直观分析 试验指标多于一个的试验称为多指标试验。在多指标试验设计中,各指标的最优方案之间可能存在一定的矛盾,如何兼顾各个指标,找出使每个指标都尽可能好的生产方案呢?也就是说,应如何
15、分析多指标试验的结果呢?下面介绍两种常用方法。(1)综合评分法 综合评分法是由专业人员根据实际生产的要求,对每号试验评出其各项指标的综合得分,作为这号试验的总指标,从而把多项试验指标转化为单项试验指标,再应用单项指标试验的直观分析法进行分析。 下面以例2说明它的步骤。例2 某工厂5吨冷风炼铁炉在现有的设备条件和原料供应的情况下,探索好的生产条件,以达到在铁水温度平均为1400以上且熔化速度为每小时5吨左右的前提下,尽量减少焦炭的消耗,提高总焦铁比的目的。为此确定铁水温度、熔化速度、总焦铁比为试验指标,并选出4个因素,每个因素取3个水平,列于下表。 因素水平A熔化带炉缺直径(mm)B一排、二排风
16、口尺寸(mm)C风压(mm/kg)D批焦铁比焦:铁1760620406,40613013.52740550306,25616014.53720550206,25615012.5 这是一个4因素3水平试验,选正交表,并将因素A,B,C,D分别放到1,2,3,4列上即可得试验方案,把方案和试验结果列于下表。水平 因 素试验号ABCD试验指标综合评分铁水温度熔化速度总焦铁比12341234567891112223331231231231232313121233122311408139714091409140514121415141514195.35.25.65.24.95.15.45.35.111.
17、713.212.311.912.513.013.312.213.52766921241433上表中综合评分的方法如下:由于试验的目的是在保证铁水温度平均在1400以上,且熔化速度为每小时5吨左右的前提下,尽量减少焦炭的消耗,提高总焦铁比,因此可以规定一个评分办法:铁水温度以1400为标准,每高1就加1分,每低1就扣1分;熔化速度以每小时5吨为标准,每多0.1吨或少0.1吨都扣1分,总焦铁比以1:12为标准,每高0.1就加1分,每低0.1就扣1分;最后对各号试验结果把三者合并起来就是该号试验综合评分的分数。第号试验的综合评分可以写成 按上式计算出的综合评分见上表中最后一列。 再用类似于例1的单指
18、标试验的直观分析法进行分析,分别计算出 由此可以看出四个因素的主次顺序是。 直接从表上看出9个试验方案中的好条件是,即第9号试验。而由表中数据经计算的好条件是,该结果不在这9个试验中。(2)综合平衡法 综合平衡法就是先分别对各个指标进行与单指标一样的计算分析,然后把各个指标的分析结果进行综合平衡,得出结论。下面仍以例2说明它的步骤。 对各个指标进行单指标计算,结果列于下表。平均铁水温度/平均熔化速度/(t/h)总焦铁比(1:12)ABCDABCDABCD421442324235423216.115.915.715.337.236.936.938.7422642174225422415.215.
19、415.515.737.437.938.639.5424942404229423315.815.815.916.139.038.838.136.414051411141214115.375.305.235.1012.4012.3012.3012.9014091406140814085.075.135.175.1712.4712.6312.8713.1714161413141014115.275.275.305.3713.0012.9312.7012.1335231090.90.50.40.81.81.91.73.1从表中可以看出:4个因素的主次顺序为平均铁水温度:ABCD平均熔化速度:ADBC
20、总焦铁比:DBAC各指标的最优试验条件为对铁水温度:(数值大者为优)对熔化速度:(数值小者为优)对焦铁比:(数值大者为优) 三个指标分析出的条件互不一致,因此需要视因素的主次关系进行综合平衡。因素A对铁水温度和熔化速度是首要因素,对总焦铁比是次要因素。因此,在确定A的最佳水平时,应重点考虑对铁水温度和熔化速度为最优的水平。故因素A取最佳水平为;同理,因素B取最佳水平为;因素C在三个指标中都不占主要地位,综合考虑C取较好些;因素D在主次因素中排在末位,从上表可以看出,因素D对焦铁比影响最大,取最好,但对另两个指标取为好,综合以上分析可以得出两个最优生产条件与,其中与综合评分得出的结论一致,而是正
21、交设计表中的第9号试验条件,该试验条件不仅是综合平衡法得到的最好方案,也是综合评分法得到的最好方案。三、有交互作用的正交设计及其结果的直观分析 为了能够用正交表安排具有交互作用的正交试验,在许多正交表的后面都附有相应的交互作用表专供表头设计时使用。下表就是正交表所对应的交互作用表。 列号列号 1 2 3 4 5 6 7 (1) 3 2 5 4 7 6 (2) 1 6 7 4 5 (3) 7 6 5 4 (4) 1 2 3 (5) 3 2 (6) 1 (7) 上表中所有的数字都是列号。正交表中任何两列的交互作用列都可以从交互作用表中查到。只要在交互作用表中找到这两列的列号,这两个列号所在行、列的
22、交叉点上的数字就是交互作用列的列号。例如,要查第3列与第5列的交互作用列,只要找(3)行与(5)列的交叉点6,即表中第6列为第3列与第5列的交互作用列。这就是说,在正交设计时,若要考虑A与B的交互作用,且A,B分别安排在第3列与第5列上,则交互作用AB就要安排在第6列上。这时,第6列就不能再安排其他因素,以免发生效应之间的“混杂”。在做试验时,交互作用列对安排试验不起作用,试验条件的安排方法与不考虑交互作用时完全一样,只是安排了因素的列内的水平去做试验就行了。但在分析试验结果时,AB仍然作为一个单独因素计算它的极差,极差的大小反映了AB交互作用的大小。例3 花莱留种培育问题,对花莱留种的生产条
23、件进行考察,通过试验确定A、B、C、D四个因素2个水平及交互作用AB,AC对指标影响的重要性,并找出最优生产方案。考察的因素与水平列于下表中。 因素水平A浇水次数B喷药次数C施肥方法D进室时间1浇水12次随机喷开花期施11月初2随时浇定期喷施四次11月中 这是一个4因素2水平且具有交互作用AB,AC的试验,因此选用的2水平正交表至少要有6列,满足该条件的2水平正交表最小,故选用的交互作用列表做试验方案。 首先,作表头设计。把因素A,B分别安排在的第1列和第2列,查的交互作用列表知,AB占用第3列;为避免混杂,又把因素C安排在第4列,查的交互作用列表知,AC应占第5列;而因素D可以排在第6、7列
24、中的任何一列,现在把因素D排在第7列,于是第6列为空白列。这样便得到因素与交互作用不会混杂的表头设计。 按以上表头设计,把试验方案和试验结果列于下表:列号 因 素试验号ABABCACD产量123456712345678111122221122112211222211121212121212212112211221122121125025125125-100-50-2575325-100-7530012510050175200251507510012581.25-25-18.757531.252512.543.75506.2537.518.752531.25425375251251757525由
25、上表可以看到的好条件为第3、4号试验,即和。由极差一行可知,因素的主次顺序为A,B,AC,C,D,AB。从主次顺序看A为首要因素,因,取A的最优水平;类似地,取B的最优水平;而因素C比交互作用AC还次要,因此C的水平的选取还要由AC决定。为此先计算因素A与C的搭配表,如下表所示: 由上表知,为最优搭配,故取C的最优水平,对最次要因素D,可以从方便、经济的角度出发在2水平中任取一个,记为。故由上个表中的数据经计算的最优条件为。四、正交试验设计的方差分析 前面介绍了对正交试验的结果进行直观分析的方法,其优点是简单、直观、计算量较小,便于普及和推广,对于生产实际中的一般问题用直观分析法能够得到很好地
26、解决。但直观分析法不能估计试验过程中以及试验结果测定中必然存在的误差大小,因而不能真正区分某因素各水平所对应的试验结果的差异究竟是由于水平的改变所引起的,还是由于试验误差所引起的。因此,直观分析法得到的结论不够精确。而且,对影响试验结果的各因素的重要程度,不能给出精确的数量估计,也不能提供一个标准来考察、判断因素对试验结果的影响是否显著。特别,对于水平数大于等于3且要考虑交互作用的试验,直观分析法不便于使用。 下面介绍的方差分析法能够弥补直观分析法的这些不足。 若用正交表安排试验,且每列同水平的试验次数为,总试验次数为,试验结果为,试验结果的总偏差平方和记为 其中 记 称为第列因素的偏差平方和
27、,若因素A安排在第列上,也记。可以证明 且与的自由度分别为, AB交互作用列偏差平方和的自由度。 正交表上空白列的偏差平方和不是由任何因素引起的,因此应是误差引起的。故误差平方和为所有空白列的偏差平方和之和。的自由度为 各因素(包括交互作用)的自由度之和 检验第列因素对试验结果是否有显著影响的统计量是 其中 。 对于给定的显著性水平,若由样本观察值计算出的,则认为该列安排的因素对试验结果影响显著。否则,认为影响不显著。 在实际应用中,一般先计算出各列的,若,就认为第列影响不显著,并把当做误差平方和与合并;若有几列都是如此,则把这些列的加起来当做误差平方和与合并在一起作为新的误差平方和,相应的自
28、由度与合并作为的自由度,然后再构造检验统计量 若,则认为该列安排的因素对试验结果影响显著。否则,认为影响不显著。例4 苯酚合成工艺条件试验。某化工厂为提高苯酚的产率选了合成工艺条件中的5个因素2个水平作试验,数据列于下表中。 因素水平A反应温度()B反应时间(分)C压力(Pa)D催化剂种类ENaOH用量(L)130020200甲80232030250乙100这是一个5因素2水平试验,应选用正交表。表头设计、试验结果见下表。现用方差分析法检验各因素对试验结果的影响是否显著。列号 因 素试验号ABCDE试验结果12345671234567811112222112211221122221112121
29、21212122121122112211221211283.484.087.384.887.388.092.390.4339.5358.0342.7354.8350.1347.4350.3347.2348.4349.1345.9351.6348.5349.018.512.12.73.10.75.70.542.7818.300.911.200.064.060.03 由于第3列、第7列为空白列,其方差是由随机误差引起的,因此 又由于 故将并入误差平方和中,得 相应的自由度也并入中,得 由于 故因素A、B对试验结果的影响是高度显著的,而因素E对试验结果的影响是显著的。因素C、D对试验结果无显著影响。
30、例5 对例3 花莱留种培育问题的正交试验结果作方差分析。 下表给出例3中的表头及经上述公式计算的各列的偏差平方和。因素ABABCACD产量列号123456722578.1317578.1378.131953.133828.13703.1378.13由于第6列为空白列,其方差是由随机误差引起的,因此 又由于 故将并入误差平方和中,得 相应的自由度也并入中,得 按例4中类似地算出各列的F值,分别是 故因素A、B对试验结果的影响是高度显著的,而交互作用AC对试验结果的影响是显著的。因素C、D和交互作用AB对试验结果无显著影响。 通过前面的分析可以看出,设计试验时若正交表上没有空白列,一般不能做方差分析。为了做方差分析通常是把因素的偏差平方和明显偏小的列作为误差列来处理,或是取较大的正交表做试验,但这要增加试验次数,因此在实际问题中应视具体情况采用相应的数据分析方法。专心-专注-专业