《第四章方差分析与正交实验设计 (2)精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章方差分析与正交实验设计 (2)精选文档.ppt(151页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、本讲稿第一页,共一百五十一页本章主要内容本章主要内容41 方差分析(略)42 正交试验的基本概念与正交表43 无交互作用的正交设计与数据分析44 有交互作用的正交设计与数据分析45 有重复试验的情况46 水平数不等的试验设计与数据分析47 筛选试验48 多指标的数据分析49 饱和设计本讲稿第二页,共一百五十一页第一节第一节 方差分析方差分析所谓方差分析,是通过比较因素的方差与试验误差的方差,来检验因素对试验指标的影响是否显著。其实质是假设多个总体方差相等的情况下,判断它们的均值是否相等。也就是将试验数据的总波动平方和分解成各因素和交互作用以及试验误差的波动平方和,并比较它们的方差,以判断因素影
2、响的显著性。方差分析(Analysis of Variance,简称ANOVA)能够解决多个均值是否相等的检验问题。节省时间是这种方法明显的优点,它的另一个好处是,由于进行分析时是将所有的样本资料结合在一起,因而增加了稳定性。例如,有30个样本,每一个样本包括10个观察单位。如果用T检验法,一次只能研究两个样本,20个观察单位,而使用方差分析则可以把300个观察单位结合在一起进行研究。所以说,方差分析是一种实用、有效的分析方法。方差分析是一种因素分析方法,广泛应用于优化设计、理化分析、绩效考核中。本讲稿第三页,共一百五十一页(一)方差分析的内容(一)方差分析的内容方差分析是对多个总体均值是否相
3、等这一假设进行检验。下面通过一个例子说明方差分析的内容。例4-1某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。随机从五家超级市场上收集了前一期该种饮料的销售量,如表4-6所示。问饮料的颜色是否对销售量产生影响。表46该饮料在五家超市的销售情况本讲稿第四页,共一百五十一页这是一个方差分析问题。即对四种饮料销售量均值是否相等进行检验。由于饮料是同一厂家生产的,它们的营养含量、味道、价格、装潢等可能影响销售量的因素全部相同,如果检验结果为1、2、3、4不相等,如图4-5(a)所示,则意味着它们来自于不同的总体,表明饮料颜色对销售量产生影响。反之,如果检验结
4、果为1、2、3、4不存在显著影响,则可以认为饮料的颜色对销售量没有影响,它们来自于相同的总体。见图45(b)。本讲稿第五页,共一百五十一页图4-5(a)不同总体的情况图45(b)相同总体的情况本讲稿第六页,共一百五十一页在方差分析中,常常用到一些术语。一个是因素,因素是一个独立的变量,也是方差分析研究的对象。在前面的例子中,饮料的颜色就是一个因素。因素中的内容称为水平。上例因素中的水平有四个,即饮料的四种不同颜色。如果方差分析只针对一个因素进行,称为单因素方差分析。如果同时针对多个因素进行,称为多因素分析。在多因素方差分析中,双因素方差分析是最常见的。在方差分析中,通常假定各个水平的观察数据是
5、来自于服从正态分布总体中的随机样本,各个总体相互独立,且方差相同。实际应用中严格地满足这些假定,特别是对社会经济现象的分析,确实过于苛刻。但一般应近似地符合上述要求。本讲稿第七页,共一百五十一页(二)方差分析的原理(二)方差分析的原理从方差分析的目的看,是要检验各个水平的均值1、2、3、4是否相等,而实现这个目的的手段是通过方差的比较。观察值之间存在着差异,差异的产生来自于两个方面,一个方面是由因素中的不同水平造成的,例如饮料的不同颜色带来不同的销售量,对此我们可以称为系统性差异;另一个方面是由于抽选样本的随机性而产生的差异,例如,相同颜色的饮料在不同的商场销售量也不同。两个方面产生的差异可以
6、用两个方差来计量,一个称为水平之间的方差,一个称为水平内部的方差。前者既包括系统性因素,也包括随机性因素。后者仅包括随机性因素。本讲稿第八页,共一百五十一页如果不同的水平对结果没有影响,如前例饮料的颜色对销售量不产生影响,那么在水平之间的方差中,就仅仅有随机因素的差异,而没有系统性差异,它与水平内部方差就应该近似,两个方差的比值就会接近于1;反之,如果不同的水平对结果产生影响,在水平之间的方差中就不仅包括了随机性差异,也包括了系统性差异。这时,该方差就会大于水平内方差,两个方差的比值就会显著地大于1许多,当这个比值大到某个程度,或者说达到某临界点,就可以作出判断,说不同的水平之间存在着显著性差
7、异。因此,方差分析就是通过不同方差的比较,作出接受原假设或拒绝原假设的判断。本讲稿第九页,共一百五十一页(三)(三)F分布分布水平间(也称组间)方差和水平内(也称组内)方差之比是一个统计量。数理统计证明,这个统计量服从F分布(F Distribution)。F分布有这样几个特征:统计量F是大于零的正数。F分布曲线为正偏态,它的尾端以横轴为渐进线趋于无穷。F分布是一种连续的概率分布,不同的自由度组合有不同的F分布曲线,如图4-6所示:本讲稿第十页,共一百五十一页也就是将试验数据的总波动平方和分解成各因素和交互作用以及试验误差的波动平方和,并比较它们的方差,以判断因素影响的显著性。方差分析是一种因
8、素分析方法,广泛应用于优化设计、理化分析、绩效考核中。其具体步骤如下:(1)统计模型;(2)平方和分解;(3)F比;(4)计算。4、最佳条件的选择与对应条件下指标均值的估计。(四)绘制效应图(五)验证实验本讲稿第十一页,共一百五十一页图4-6不同自由度下F分布曲线由上图可以看出,随着分子和分母自由度的增加,F分布以对称的正态分布为极限。许多类型的假设检验需要利用F分布,方差分析是其中的重要一种。本讲稿第十二页,共一百五十一页二、单因素方差分析二、单因素方差分析(一)单因子试验例:茶是一种饮料,它含有叶酸(folacin),这是一种维他命B。如今要比较各种茶叶中的叶酸含量。现选定绿茶,这是一个因
9、子,用A表示。又选定四个产地的绿茶,记为A1,A2,A3,A4,它是因子A的四个水平。为测定试验误差,需要重复。各水平重复数相等的设计称为平衡设计.各水平重复数不等的设计称为不平衡设计.如今我们选用不平衡设计,即A1,A2,A3,A4分别制作了7,5,6,6个样品,共有24个样品等待测试。本讲稿第十三页,共一百五十一页这里一次测试就是一次试验。试验次序要随机化,为此把这24次试验按序编号。这里一次测试就是一次试验。试验次序要随机化,为此把这24次试验按序编号。在1到24个试验号中一个接一个地随机抽取,得到如下序列:9,13,2,20,18,10,5,7,14,1,6,15,23,本讲稿第十四页
10、,共一百五十一页把试验结果“对号入座”,填写试验结果。四个产地绿茶叶酸含量的打点图(dotplot)本讲稿第十五页,共一百五十一页四个产地绿茶叶酸含量的打点图(四个产地绿茶叶酸含量的打点图(dotplotdotplot)图上表示叶酸含量,线表示样本均值。下述一些直观的印象是重要.图中每种绿茶的叶酸含量有高有低.从样本均值看,A1与A2的叶酸含量偏高一些.从样本极差看,A1,A2,A3 的极差接近,A4的略小一点。本讲稿第十六页,共一百五十一页(二)单因素方差分析的步骤由前面的内容和例子可知,不同水平下销售量由前面的内容和例子可知,不同水平下销售量x x的概率分布服从的概率分布服从正态分布,并且
11、有相同方差。因此,水平的差异必然体现在水平正态分布,并且有相同方差。因此,水平的差异必然体现在水平均值的差异上。于是作为单因素的方差分析,其目标是检验水平均值的差异上。于是作为单因素的方差分析,其目标是检验水平均值均值j j是否相等。如果相等,我们说该因素(如前例中饮料的颜是否相等。如果相等,我们说该因素(如前例中饮料的颜色)对色)对x x不产生影响;反之,就认为该因素对不产生影响;反之,就认为该因素对x x存在影响。存在影响。为便于叙述,也便于理解,可以将方差分析按其过程划为几步。为便于叙述,也便于理解,可以将方差分析按其过程划为几步。1、计算水平均值不妨令不妨令 表示第表示第j j种水平的
12、样本均值,种水平的样本均值,本讲稿第十七页,共一百五十一页式中,是第j种水平下的第i个观察值,nj表示第j种水平的观察值个数。结合前面表4-6中的数据,将计算结果列表4-7如下:下表中,计算总均值的一般表达式为式中,n=nj本讲稿第十八页,共一百五十一页表47 四种颜色饮料销量及均值 本讲稿第十九页,共一百五十一页2、计算离差平方和、计算离差平方和 在单因素方差分析中,离差平方和有三个,它们分别是总离差平方和,误差项离差平方和以及水平项离差平方和。首先看总离差平方和,不妨用SST(Sum of Squares for Total)代表,则:SST=它反映了离差平方和的总体情况。在表4一7中己知
13、,=28.695,由上式,我们可以计算出:SST(265-28695)2+(287-28.695)2+(32.8-28.695)2=1159295再看误差项离差平方和,用SSE(Sum of Squares for Error)表示,其计算公式为:本讲稿第二十页,共一百五十一页对公式分析不难发现SSE反映的是水平内部,或组内观察值的离散状况。正如前面分析的,SSE 实质上反映了随机因素带来的影响。在表4-7的例子中,对于水平1(即第一组),有类似地,可以对其他三个组进行计算:(31.2-29.56)2(29.6-29.56)2=8.72(27.9-26.44)2(26.5-26.44)213.
14、22(30.8-31.46)2(32.8-31.46)2=6.632从而得到:SSE10688+857213192+6632=39.084SSE=本讲稿第二十一页,共一百五十一页最后一个是水平项离差平方和。为了后面叙述方便,可以把单因素方差分析中的因素称为A。于是水平项离差平方可以用SSA(Sum of Squares for FactorA)表示。SSA的计算公式为SSA=用各组均值减去总均值的离差的平方,乘以各组观察值个数nj,然后加总,即可得到SSA。可以看出,它所表现的是组间差异。其中既包括随机因素,也包括系统因素。SST,SSE,SSA 之间存在着一定的联系。这种联系表现在:SST=
15、SSE+SSA 因为本讲稿第二十二页,共一百五十一页在各组同为正态分布,等方差条件下,等式右边最后一项为零,故有:即SST=SSE+SSA在上面例子中,己计算出SST=115.9295,SSE=39.084,故:SSA=SSTSSE=115.9295-39.084=76.8455本讲稿第二十三页,共一百五十一页3、计算平均平方、计算平均平方用离差平方和除以自由度即可得到平均平方(Mean Square)。离差平方的计算前面己经介绍,关键是如何确定各离差平方和的自由度。对SST来说,其自由度为n-1,因为它只有一个约束条件,对SSA来说,其自由度为r-1,这里r表示水平的个数。如前面例子中,有四
16、个水平,即饮料的四种不同颜色,故r=4。SSA反映的是组间的差异,它也有一个约束条件,即要求:对SSE来说,其自由度为n-r,因为对每一种水平而言,其观察值个数为nj,该种水平下的自由度为nj,总共有r个水平,因此拥有的自由度个数为;r(nj-1)=n-r其实,与离差平方和一样,SST,SSA,SSE之间的自由度也存在着如上式中的关系,因为显然:n-1=(r-1)+(n-r)本讲稿第二十四页,共一百五十一页这样对于SSA,其平均平方MSA为:对于SSE,其平均平方MSE为:在上例中:本讲稿第二十五页,共一百五十一页4、方差分析表、方差分析表在上例中:为了将方差分析的主要过程表现的更清楚,通常把
17、有关计算结果列成方差分析表,如表48所示。表48方差分析表使用计算机进行方差分析,其输出结果的构造与表48类似。本讲稿第二十六页,共一百五十一页5、均值的、均值的F检验检验在介绍方差分析的主要步骤以后,让我们回到问题的起点,对若干均值是否相等进行F检验。仍以前面饮料颜色对销售量影响为例,对所关心的问题提出原假设和替换假设:H0:1=2=3=4 颜色对销售量没有影响H1:1、2、3、4不全相等 颜色对销售量有影响由前已知,计算出的F值为F=10.4860若a=0.05查表知:Fa(r-1,n-r)F0.05(3,16)3.24括号中r-1,n-r分别为分子项和分母项的自由度。由于FFa故拒绝原假
18、设,接受替换假设。即通过检验知,j不全相等,说明饮料的颜色对销售量有显著影响,见图4一7。本讲稿第二十七页,共一百五十一页图47F检验示意图对上题,Excel软件输出的分析结果为:表49 Excel输出的方差分析表本讲稿第二十八页,共一百五十一页(二)单因素方差分析中的其他问题(二)单因素方差分析中的其他问题表中,F crit相当于进行检验的临界点(前面我们四舍五入取了3.24),P-value的结果表明,在图47中,横轴F10.486 2的右侧,F曲线下的面积仅有0.0466%。(二)单因素方差分析中的其他问题在介绍了方差分析的基本过程之后,对单因素方差分析可能涉及到的问题再做几点说明。1、
19、进行方差分析所需要的数据如表410中的结构:表410 方差分析数据结构本讲稿第二十九页,共一百五十一页表表410 方差分析数据结构方差分析数据结构可以把方差分析的因素放在列的位置,也可以放在行的位置,但通常放在列的位置。如表4-10所示,这样与计算机中数据库的结构相一致,便于计算一机处理。本讲稿第三十页,共一百五十一页2、进行方差分析各个水平下的样本容量可以相同,也可以不同。前面的例子是样本容量相同的情况,下面看一个样本容量不同的例子。例42 某课程结束后,学生对该授课教师的教学质量进行评估,评估结果分为优、良、中、差四等。教师对学生考试成绩的评判和学生对教师的评估是分开进行的,他们互相都不知
20、道对方给自己的打分。有一种说法,认为给教师评为优秀的这组学生的考试分数,可能会显著地高于那些认为教师工作仅是良、中或差的学生的分数。同时认为,对教师工作评价差的学生,其考试的平均分数可能最低。为对这种说法进行检验,从对评估的每一个等级组中,随机抽取出共26名学生。其课程分数如表411所示。本讲稿第三十一页,共一百五十一页表411 26名学生考试成绩本讲稿第三十二页,共一百五十一页试检验各组学生的分数是否有显著差别(=0.05)。解:若各组学生的平均成绩之间没有显著差别,则表明学生对教师的评估结果与他们的成绩之间没有必然的联系。H0:各组平均分数相等;Hl:各组平均分数不全相等。利用Excel软
21、件,将计算结果列表412。表4-12学生平均成绩方差分析表本讲稿第三十三页,共一百五十一页由于FF crit,故接受原假设。可以认为学生的成绩与它们对教师教学质量的评估意见之间没有关系。3、方差分析可以对若干平均值是否相等同时进行检验,这是此种方法的特点和长处。但如果检验结果拒绝原假设,接受替换假设,这仅表明进行检验的这几个均值不全相等。至于是哪一个或哪几个均值与其他均值不等,方差分析并没有告诉答案。如果要对此问题进一步分析,可采用多重比较方法(此处从略)。本讲稿第三十四页,共一百五十一页三、双因素方差分析三、双因素方差分析(一)双因素方差分析的类型在实际问题的研究中,有时需要考虑两个因素对实
22、验结果的影响。例如上一节中饮料销售量的例子,除了关心饮料颜色之外,我们还想了解销量地区是否影响销售量,如果在不同的地区,销售量存在显著的差异,就需要分析原因,采用不同的推销策略,使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位,在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解,接受该产品。若把饮料的颜色看作影响销售量的因素A,饮料的销售地区则是影响因素B。对因素A和因素B同时进行分析,就属于双因素方差分析。双因素方差分析的内容,是对影响因素进行检验,究竟一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。本讲稿第三十五页,共一百五十一页双因素方差分析有两种类型
23、:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它佣定因素A和因素B的结合会产生出一种新的效应。例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景,否则,就是无交互作用的背景。有交互作用的双因素方差分析已超出本书的范围,这里仅仅介绍无交互作用的双因素方差分析。本讲稿第三十六页,共一百五十一页(二)数据结构(二)数据结构双因素方差分析的数据结构如表4一13所示:表413 双因素方差分析数据结构本讲稿第三十七页,共一百五十一页上表中,因素A
24、位于列的位置,共有r个水平,代表第j种水平的样本平均数;因素B位于行的位置,共有k个水平,代表第i种水平的样本平均数。为样本总平均数,样本容量n=rk。每一个观察值看作由A因素的r个水平和B因素的k个水平所组合成的rk个总体中抽取样本容量为1的独立随机样本。这rk个总体的每一个总体均服从正态分布,且有相同的方差。这是进行双因素方差分析的假设条件。本讲稿第三十八页,共一百五十一页(三)离差平方和的分解(三)离差平方和的分解与单因素方差分析类似,进行双因素方差分析,需要将总离差平方和SST进行分解;区别在于,这里需要将总离差平方和分解为三个组成部分,即:SSA、SSB和SSE,以分别反映因素A的组
25、间差异,因素B的组间差异和随机误差SSE的离散状况。它们的计算公式分别为:本讲稿第三十九页,共一百五十一页与各个离差平方和相对应的自由度分别是:总离差平方和SST的自由度为r,rK-1=n-1;因素A的离差平方和SSA的自由度为r-1;因素B的离差平方和的自由度为K-1;随机误差SSE的自由度为(r-1)(K-1)=n-r-K+l。由离差平方和与自由度,可以计算出均方差。对因素A而言:对因素B而言:对随机误差项而言:由此可以编制出双因素方差分析表,如表4-14所示。本讲稿第四十页,共一百五十一页表414 双因素方差分析表上表中,FA是因素A的F统计量,它是MSAH和MSE的比值,可以看出,其计
26、算过程与单因素方差分析中计算F的方式相同;FB因素B的统计量,它MSB和MSE的比值,其计算方式与FA的计算方式类似。本讲稿第四十一页,共一百五十一页(四)应用实例(四)应用实例下面通过一个例题,说明双因素方差分析的整个过程。【例43】某商品有三种不同的包装方式(因素A),在五个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如表4-15所示。表4-15 某种商品不同地区不同包装的销售资料本讲稿第四十二页,共一百五十一页现欲检验包装方式和销售地区对该商品销售是否有显著性影响(=0.05)。解:若五种包装方式的销售的均值相等,则表明不同的包装方式在
27、销售上没有差别;同理,若五个地区的销售的均值相等,则表明不同地区在销售上没有影响。故方差分析的过程为:1、建立假设:对因素A:H0:1=2=3=4 包装方式之间无差别H1:1,2,3,4不全相等 包装方式之间有差别 对因素B:H0:1=2=3=4 地区之间无差异H1:1,2,3,4不全相等 地区之间有差异本讲稿第四十三页,共一百五十一页2 2、计算、计算F F值:值:由表由表4-154-15中数据计算得:因素中数据计算得:因素A A的列均值分别为:的列均值分别为:=21.6=21.6,=12.4=12.4,=16.4=16.4,=13.2=13.2,=11.6=11.6因素因素B B的行均值分
28、别为:的行均值分别为:总均值总均值=15.04=15.04。于是有,于是有,SST=SST=(20-15.0420-15.04)2 2+(10-15.0410-15.04)2 2=880.96=880.96SSA=5SSA=5(21.6-15.0421.6-15.04)2 2+5+5(11.6-15.0411.6-15.04)2 2=335.36=335.36SSB=5SSB=5(15.2-15.0415.2-15.04)2 2+5+5(18.8-15.0418.8-15.04)2 2=199.36=199.36SSE=880.96-335.36-199.36=346.24SSE=880.96
29、-335.36-199.36=346.24接下来:接下来:本讲稿第四十四页,共一百五十一页MSA=335.36(5-l)=83.84MSB=199.36(5-1)=49.84MSE=346.24(51)(51)=21.46因此:FA=MSA/MSE=83.84/21.64=3.874307FB=MSB/MSE=49.84/21.64=2.303142若使用计算机,Excel的输出结果如下:表416双因素方差分析表本讲稿第四十五页,共一百五十一页3、统计决策由表由表4 41616知,对于因素知,对于因素A A,因为:,因为:对于因素对于因素A A:F FA A=3.88704307=3.8870
30、4307F crit=3.006 917F crit=3.006 917故拒绝故拒绝H H0 0,接受,接受H H1 1,说明不同的包装方式对该商品的销售,说明不同的包装方式对该商品的销售产生不同的影响。产生不同的影响。对于因素对于因素B B,因为:,因为:F FB B=2.303142=2.303142F crit=3.000917F crit=3.000917故接受故接受H H0 0,说明不同地区之间在该商品的销售上没有显著,说明不同地区之间在该商品的销售上没有显著的差异。的差异。本讲稿第四十六页,共一百五十一页42 正交试验的基本概念与正交表一、试验设计的基本概念一、试验设计的基本概念二
31、、正交试验设计的基本概念二、正交试验设计的基本概念三、试验设计的一般指南三、试验设计的一般指南四、正交表简介四、正交表简介五、正交表的性质五、正交表的性质本讲稿第四十七页,共一百五十一页什么是试验?目的在于回答一个或几个经过精心构思的问题的实践活动称为目的在于回答一个或几个经过精心构思的问题的实践活动称为“试验试验”或或“实验实验”。例:精心构思的问题有:例:精心构思的问题有:为提高产品的产量和质量而寻找最佳的或满意的工业参数的搭配;为提高产品的产量和质量而寻找最佳的或满意的工业参数的搭配;为开发新产品而寻找性能稳定和成本低廉的设计方案;为开发新产品而寻找性能稳定和成本低廉的设计方案;为控制生
32、产过程而寻找描述过程的数学模型;为控制生产过程而寻找描述过程的数学模型;为证明一种新药对控制某种疾病是否在统计学意义上确有疗效;为证明一种新药对控制某种疾病是否在统计学意义上确有疗效;试验的目的的差异会影响试验的设计与分析。试验的目的的差异会影响试验的设计与分析。本讲稿第四十八页,共一百五十一页一、试验设计的基本概念一、试验设计的基本概念(一)概念:试验设计是一种多因素的选优方法,它广泛用于产品开发(一)概念:试验设计是一种多因素的选优方法,它广泛用于产品开发设计、工艺优化、配方研制等方面,以降低误差和生产费用,减少设计、工艺优化、配方研制等方面,以降低误差和生产费用,减少试验工作量并对试验结
33、果进行科学分析的一种科学方法试验工作量并对试验结果进行科学分析的一种科学方法 。早在早在19201920年英国著名统计学家费雪年英国著名统计学家费雪(R.A.Fisher)(R.A.Fisher)首创了首创了“实验设计法实验设计法”,并首先应用在农业中。第二次世界大战后英美将试验设计广泛应用于,并首先应用在农业中。第二次世界大战后英美将试验设计广泛应用于工业生产中,工业生产中,2020世纪世纪6060年代年代“正交试验设计正交试验设计”产生,产生,7070年代日本著年代日本著名质量工程学家田口玄一博士发明了稳健设计,名质量工程学家田口玄一博士发明了稳健设计,8080年代我国数学家王年代我国数学
34、家王元和方开泰教授又发明了均匀设计。元和方开泰教授又发明了均匀设计。本讲稿第四十九页,共一百五十一页试验设计的基本概念试验设计的基本概念此外专门研究配方的此外专门研究配方的“混料设计混料设计”以及将正交设计以及将正交设计和回归分析结合在一起的和回归分析结合在一起的“正交回归设计正交回归设计”等均等均应运而生,并且得到广泛的应用。应运而生,并且得到广泛的应用。试验设计方法就是一种同时研究多个输入因素(试验设计方法就是一种同时研究多个输入因素(X X S)S)对输出(对输出(Y Y)的影响的方法,它是通过对选定的)的影响的方法,它是通过对选定的输入因素进行精确、系统的人为调整(变化)来输入因素进行
35、精确、系统的人为调整(变化)来观察输出变量的变化情况;并通过对结果的分析,观察输出变量的变化情况;并通过对结果的分析,最终确定影响结果的关键因素及其最有利于结果最终确定影响结果的关键因素及其最有利于结果的取值的方法。举例如下图所示:的取值的方法。举例如下图所示:本讲稿第五十页,共一百五十一页图41本讲稿第五十一页,共一百五十一页 试验设计方法允许在同一试验中包含多个变量。传统的试验分析方法是多次单因素试验,将影响输出的众多输入变量在同一时间只允许有一个变量变化,其他相对固定,如下图所示:图42图42本讲稿第五十二页,共一百五十一页上图分析可得知传统试验方法明显具有以下缺点:1试验周期长,浪费时
36、间,这可能导致试验成本大幅提高,并影响产品推向市场的时机。2试验方法粗糙,因为在试验其中一个因素时,其他因素保持不变,这样得出的结论可能和实际不符,这可能导致以高价卖给消费者低品质的产品。与传统方法不同,试验设计允许在同一时间存在多个输入变量的变化,下面(表41)是一张有7个输入变量、每个变量有两个取值(两水平)的试验设计表(后续将详细讲解)。本讲稿第五十三页,共一百五十一页表41本讲稿第五十四页,共一百五十一页 从上表可知,如按传统方法进行试验,需要的试验次数为27=2222222=128次,按试验设计方法只需8次即可达到同样效果,其效率不言自明。读者可能会问,将试验次数由128次降至8次,
37、这样试验精度是否会变差?试验设计其实质是一种在128次完全组合中抽取最具代表性的组合进行试验的方案,目前所用的试验表均为统计专家在做大量分析、试验的基础上确定的,保证了较高的置信度,即试验设计能以较少的试验次数获得较优或最优的结果,以最有效最经济的手段获取最有价值的结果。本讲稿第五十五页,共一百五十一页(二)试验设计的用途(二)试验设计的用途 试验设计自产生起就被广泛应用,尤其在日本,田口方法在“质量立国”的战略中起到了巨大的作用,被用到从造航天器到烤面包寻找最佳配方的角角落落,日本人认为不懂田口方法的工程师不能算合格的工程师。六西格玛方法诞生后,试验设计的应用又被提升到一个新的层次,成了设计
38、及过程改善中必不可少的一环,使用它的公司也因此取得从几万元至上亿元的收益。1、实验设计的目标 在工作实践中,我们无时无刻不在进行试验,只不过有时无意识罢了,通过试验我们可以达成以下目标:本讲稿第五十六页,共一百五十一页(1)确定、验证和优化制造过程的主要影响变量及其影响。(2)创造对物料和部品变化不敏感的制造过程。(3)设计对使用环境不敏感(即受环境的影响小)的产品。(4)降低总的设计周期。(5)减少ECN(设计变更通知书)数量。(6)提高新设计产品的工艺性。(7)为制造过程列出问题及解决方案。(8)减少对产品的检查和测试。本讲稿第五十七页,共一百五十一页2、试验设计的用途具体包括以下几个方面
39、:(1)在进行基础研究时,试验设计可用来:A、发现变量间的联系。B、明确技术要点。(2)在进行产品设计时,试验设计可用来:A、做灵敏度分析。B、建立可靠公差。C、确定部品特性。D、确定设计布局。E、使用较低等级的材料和半成品以降低成本。F、减少变异。G、改善新设计产品的性能。(3)在进行制造过程(工艺)设计时,试验设计可用来:本讲稿第五十八页,共一百五十一页A、进行过程变量研究。B、变量的优化设置。C、建立可靠的公差。D、发现低成本的解决方案。E、减少过程变化。F、将过程均值逼近目标值。G、缩短制造周期。H、消除缺陷。I、提升产品可靠性。(4)在过程改善时,试验设计可用来:A、解决问题。B、确
40、定过程变量间的相互关系。C、进行过程能力研究。D、比较设备与方法的影响度。(5)计量时,试验设计可用来:A、进行量具研究。B、确定主要误差。C、将测量误差降至最小。本讲稿第五十九页,共一百五十一页3、试验设计方法与“实践是检验真理的惟一标准”的著名论断不谋而合 六西格玛系统讲究“用事实和数据说话”。往往经过大量推理、统计分析的结论,其价值根本无法和试验设计得出的结论相提并论,因为后者是建立在事实基础上的。所以试验设计在设计、改善等阶段、领域都有巨大的应用价值。但由于种种原因,目前,试验设计在我国企业中的应用还非常有限,由此造成的损失无法估量,如果我国有一半企业在产品设计、制造中应用试验设计方法
41、,所节约的资金将数以千亿计。本章只介绍“正交试验设计”。本讲稿第六十页,共一百五十一页二、正交试验设计的基本概念二、正交试验设计的基本概念(一)正交试验设计的概念:它是利用一种规格化的表“正交表”,科学地挑选试验条件,合理地分析试验结果。即利用“正交表”来选择最佳的或满意的试验条件,也就是通过安排若干个条件进行试验,并利用正交表的特点进行数据分析的一种常用的试验设计的方法。(二)正交设计的特点:可以总结为五个字:“多”、“快”、“好”、“省”、“易”。1、多:可以考虑多因素多指标的选优问题;2、快:试验周期短,实验方案一气呵成;3、好:以找到最佳方案;4、省:减少试验次数,节省经费;5、易:方
42、法简易、规范化、易于普及推广。(三)指标、因子与水平:本讲稿第六十一页,共一百五十一页1、指标:在试验中用来衡量试验结果好坏的特征值叫试验指标,又称响应变量。(1)定量指标:用测量结果表示的指标(用测量仪器)如:电阻器的电阻、橡胶件的温度、粮食的产量。(2)定性指标:用等级评分等表示的指标,(组织专家评判组)如:药物的疗效、布料的柔软度、平面的光滑度等。2、因子:将在试验中要加以考察而改变状态的因素称为因子(影响试验结果的因素),常用大写字母A、B、C等表示。3、水平:因子在试验中所取的状态称为水平。如果一个因子在实验中取了k个不同状态,就称该因子有k个不同水平,个不同因子的水平分别用代表该因
43、子的字母加下标表示,记为:A1、A2AK;B1、B2BK等。在试验中,绝大多数试验设计的因素均取2或3水平。本讲稿第六十二页,共一百五十一页4、可控因子:对其水平可做审慎改变的因子,如:反映温度、反映时间、原料产地、原料配比等。5、不可控因子(又称噪声因子或误差因子):在实际操作中不能控制其水平的因子。或难以控制其水平的因子。或要花费昂贵才能控制其水平的因子。或试验人员尚未意识到对试验结果会有影响的因子。如:环境的温度和湿度、机器的老化、电源电压的波动等。6、处理(试验条件):在一次试验中每个因子总取一个特定的水平,称各因子水平的一个组合为一个处理或一个试验条件。本讲稿第六十三页,共一百五十一
44、页(四)试验指标与试验结果:(四)试验指标与试验结果:1、试验指标:是指衡量试验条件好坏的特性(可以是质量特性也可以是数量特性),它是一个随机变量。2、试验结果:在一个特定的试验中特性的观察值称为试验结果,用Y表示,且假定:Y=+,其中是一个依赖于试验条件的常量,随试验条件的变化而变化,是一个随机变量,常假定它服从正态分布N(0,2)3、试验误差:测量值Y与真值之间的偏差=Y-称为试验误差,简称误差。误差是不可避免的,它时隐时现、时大时小、时正时负,以不可预测的方式出现,故误差是一个随机变量。本讲稿第六十四页,共一百五十一页(五)通用符号(五)通用符号在试验表中,一般用“+”、“-”号或“1”
45、、“2”、“3”来表示因素的不同水平。当因素只有高低两个水平时,用“+”号代表高,“-”号代表低水平(数值较低),当因素有3个以上水平时,用“1”、“2”、“3”来依次表示从低到高的水平,值得一提的是,在同一试验表中,只能出现同类符号,比如“+”,“-”或“1”(低水平)、“2”(中间水平)、“3”(高水平),而不可混用。本讲稿第六十五页,共一百五十一页三、试验设计的一般指南三、试验设计的一般指南1、有关人员要对试验目的清楚(目的是什么?)、理解(为什么要这么做?)和接受(这样做是对的);2、选好指标,确定测量指标的仪器或量具;3、选好可控因子和水平;4、选择试验设计方案;5、按计划完成每一个
46、试验,记录试验结果;6、进行统计分析,获得一些统计推断的结果;7、验证试验,确认无误时再写出下报告,提出今后的行动建议。本讲稿第六十六页,共一百五十一页四、正交表简介四、正交表简介正交表是一套已经制作好的规格化的表格,是正交试验设计的基本工具。(一)表式:其基本表式如下:表表4 42 L2 L4 4(2 23 3)列号试验号1231111212232124221本讲稿第六十七页,共一百五十一页表头 L4(23)的意义:L表示正交表,L的下标4表示试验的次数(正交表的行数)。括号中的23表示试验因素(因子)数与水平数,3表示因子数,本表最多安排三个因素;2表示每个因素的水平数。表中列号表示因素(
47、因子),试验号表示试验的次数,即第几次试验。(二)正交表的特点正交性,即:1、每列中不同的数字重复次数相同(如上表);2、将任意两列的同行数字看成一个数对,那么一切可能数对重复次数相同。本讲稿第六十八页,共一百五十一页(三)正交表的类型:(三)正交表的类型:常用的正交表有两类:即水平数相等的正交表和水平数不等的正交表(亦称为混合水平的正交表)1、水平数相等的正交表水平数相等的正交表,按水平数的多少由分为二水平正交表,如L4(23),L8(27),;三水平正交表,如L9(34),L27(313),等。下面以L8(27)为例说明水平数相等的正交表的共同特点。(1)每一列都恰有4个1和4各2,这说明
48、每一列各水平记号重复次数相等;本讲稿第六十九页,共一百五十一页(2)任两列同一横行形成的8个数字对中,(1,1),(1,2),(2,1),(2,2)这四种搭配方式各出现两次。这说明任两列水平的各种搭配方式重复次数也相等。这两个特点是所有正交表的共性,称为正交表的正交性。正是因为这种正交性,才使得用正交表安排的试验,均衡分散,整齐可比,进而具有很强的代表性。一般的水平数相等的正交表,可以用记号Ln(qp)表示,其中各字母的意义如下:L正交表,n行数(试验次数),q水平数(号码个数),p列数(因素个数),其中水平数q只能为素数或素数的幂,且一般情况下n、q、p满足下面的关系式:本讲稿第七十页,共一
49、百五十一页n-1=p(q-1),或p=(n-1)/(q-1),n=qk,k=2,3,4,n-1称为正交表的总自由度,q-1是每一列的自由度。上式表明,正交表的总自由度等于各列的自由度之和。如:二水平正交表L8(27):8=23,8-1=7(2-1);三水平正交表L27(313):27=33,27-1=13(3-1);四水平正交表L16(45):16=42,16-1=5(4-1);五水平正交表L25(56):25=52,25-1=6(5-1)等本讲稿第七十一页,共一百五十一页2、交互作用表、交互作用表若因素A对试验指标的影响与因素B的水平有关,反之亦然,则称因素A与因素B之间存在交互作用,并记为
50、AB。在多因素的试验中,如考虑交互作用,必须按交互作用表设计表头。每一张水平数相等的正交表,其后面均有一张交互作用表。如L8(27)的交互作用表为P386。在多因素试验中,当考虑交互作用时,可以用交互作用表来设计表头和安排试验。例如若用L8(27)安排试验,如因素A排第1列,因素B 排在第2列,则AB必须排在第3列。本讲稿第七十二页,共一百五十一页3、不考虑交互作用的正交表:、不考虑交互作用的正交表:即正交表的行数、列数、水平之间不满足上述的两个关系(自由度分解公式),往往只能考察各因子的影响,不能用这些正交表来考察因子之间的交互作用。如:二水平正交表:L12(211),L20(219);三水