《实验设计与数据分析-1绪论.pdf》由会员分享,可在线阅读,更多相关《实验设计与数据分析-1绪论.pdf(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1实验设计与数据分析实验设计与数据分析城环学院硕士课程城环学院硕士课程1授课人:阳春授课人:阳春Experimental Design and Data Analysis2授课内容授课内容 实验设计基本介绍 误差和数据处理 有限数据统计处理 离群值检验 假设检验 方差分析3授课内容授课内容 相关和回归分析 随机化区组、拉丁方和相关设计 析因实验设计 正交实验设计 响应曲面法 实例分析4参考书目参考书目 田胜元,萧曰嵘.实验设计与数据处理M.北京:中国建筑工业出版社.2000 刘振学,黄仁和,田爱民.实验设计与数据处理M.北京:化学工业出版社教材出版中心.2005.Montgomery DC.D
2、esign and Analysis of Experiments M.US:John Wiley&.Sons,Inc.2005(English Ver.)Montgomery DC.实验设计与分析(第6版)M.北京:人民邮电出版社,2009(中文版)5实验设计基本介绍实验设计基本介绍Introduction of DoE6自然科学研究的方法自然科学研究的方法 调查研究调查研究(Investigation):研究者只是“被动”地观察客观实际情况,不对研究对象施加任何干预措施-调查设计调查设计 实验研究实验研究(Experimentation):研究者给研究对象人为地施加干预因素人为地施加干预因
3、素,然后观察这种干预因素产生的效应-实验设计实验设计自然科学自然科学理论科学理论科学实验科学实验科学抽样调查抽样调查科学试验科学试验7试验?实验?试验?实验?试验试验(test,trial):为了察看某事的结果或某物的性能而从事某种活动。实验实验(experiment/experimentation):为了检验某种科学理论或假设而进行某种操作或从事某种活动。是科学拟定科学拟定的试验试验,是为了简明某一现象而创造特定的条件,以便观察变化和结果的过程。实验设计实验设计是一门关于如果利用统计学基本知识对实验进行有效率和科学地有效率和科学地设计和数据汇报的课程。8实验设计实验设计直接影响着实验结果的准
4、确性、可靠性、严密性和代表性,是实验数据的前提,决定着科学研究的成败。包括专业设计和统计设计。?专业设计专业设计:专业知识:专业知识的把握能力,直接影响着实验的深度和水平。?统计设计统计设计:统计知识:统计知识的正确应用,直接影响着科学实验的质量。对实验进行系统的安排,要做到以最少的人力和物力来获得可靠的结论与信息。9实验设计应用于工程实验实验设计应用于工程实验 减少新产品和工艺的设计时间 提高现有工艺的运行水平 提高现有产品的可靠性 实现产品和工艺的稳健性 对新材料的评价等10实验设计的历史发展实验设计的历史发展 18世纪中叶,James Lind为治疗坏血病而进行了一系列分组可控实验,被认
5、为是最早的实验设计;19世纪,Charles S.Pierce开始提出和实施基于统计原理的随机化实验基于统计原理的随机化实验,并且首次开始采用提出回归模型回归模型;20世纪初,Ronald A.Fisher 出版了著作The Design of Experiment,书中提出了现代实验设计的基本原理,将析因设计析因设计和方差分析方差分析应用于农业科学。11 1951 late 1970s,Box&Wilson提出了响应曲面法(response surface),应用于化学和加工工业。late 1970s 1990,田口法(Taguchi)和系统稳健设计(robust design),在许多公司
6、应用于质量提高控制。1990至今,现代实验设计时期,各种新的理论层出不穷。TaguchiTaguchi GenichiGenichi12实验设计的基本原则实验设计的基本原则 随机化随机化(Randomization)以随机顺序开展实验 是使用统计方法的基石 随机化可以保证观测值(或误差)是独立分布的随机变量;抵消潜在因素(lurking factors)效应 保证非处理因素均衡一致13实验设计的基本原则实验设计的基本原则 重复重复(Replication)每个因子水平组合的独立重复 可以得到一个实验误差估计实验误差估计,该估计是确定数据之间的观测差是否具有统计意义的基本度量单位 可以使样本均值
7、样本均值更接近真值真值 反映实验间实验间与实验内实验内的变异 与重复测量重复测量相区别14实验设计的基本原则实验设计的基本原则 区组化区组化(Blocking)用以处理讨厌因素(nuisance factors)可控因子controllable:区组化解决原材料的不同批次、某一天的不同时间等 不可控因子uncontrollable:协方差分析(可测量时)如环境的相对湿度、温度等;噪声因子noise factors:稳健性设计通过可控因子的设置来降低噪声因子15实验设计基本策略实验设计基本策略 最佳猜测实验最佳猜测实验(best-guess,B-G)使用较多;缺点明显,但是比预想效果好,经验要求
8、高;一次一因素实验一次一因素实验 One-factor-at-a-time(OFAT)可结合科学和工程方法 效率较低、不能解决交互作用 统计设计实验统计设计实验(statistically designed)基于 Fisher的析因(factorial)概念16 析因实验析因实验(factorial experiments):mK:m(水平数),K(因素数)考查各因素各水平的全组合 分数析因实验分数析因实验(fractional FE)考查各因素各水平的部分组合 正交实验正交实验(orthogonal)源于Taguchi法(田口玄一Taguchi Genichi),数学家张里千教授发明了中国型
9、正交试验设计法17析因设计析因设计高尔夫球实验高尔夫球实验 球杆的种类 球的种类 走路 vs.乘车 饮料的种类 回合数 天气 高尔夫钉种类 其它221822析因设计析因设计19多因素析因设计多因素析因设计(23,24)20多因素析因设计分式析因设计多因素析因设计分式析因设计21L4(23)正交表)正交表 列列 号号 试验号试验号 1(A)2(B)3(C)1 1 1 1 2 1 2 2 3 2 1 2 4 2 2 1 则第则第 1 试验点为试验点为 A1B1C1,第第 2 试验点为试验点为 A2B2C2,第第 3 试验点为试验点为 A2B1C2,第第 4 试验点为试验点为 A2B2C1。正交设计
10、正交设计例如:例如:3 因素因素 2 水平(即水平(即 23型)的全面试验次数为型)的全面试验次数为 23=8 次。次。22 非统计学知识对于实验的成功很重要;尽可能早地进行统计学思考;统计学思考;实验前的策划(步骤1-3)很关键 先思考后实验(采用 KISS 原则)Keep It Simple,Stupid.区分实际的显著性和统计学的显著性 实验通常是迭代的(初步实验重要)实验的策划、进行和分析实验的策划、进行和分析tips23实验的策划、进行和分析基本程序实验的策划、进行和分析基本程序1.问题的识别和陈述2.因变量的选择3.因素、水平和范围的选择4.实验设计的选择(B-G?OFAT?Fac
11、torial?)5.进行实验6.统计学分析7.结论和建议24实验研究的普遍方法实验研究的普遍方法1.问题的识别和陈述问题的识别和陈述依赖于专业知识,通过文献综述等;1.1需要针对某一个具体问题问题如:水处理中混凝剂的最佳投量1.2 针对这个问题提出假设假设混凝剂最佳投量有一个适宜的pH范围。25实例实例1:论文中的假设:论文中的假设Layton AC,et al.(2000)Environmental Science&Technology26实验研究的普遍方法实验研究的普遍方法2.确定因变量(响应变量)因变量(响应变量)(混凝剂的投量)3.确定自变量自变量及其水平和范围(可人为调整的变量,如:
12、溶液的pH值、水温等)通过分析简化影响因素,确定自变量通过人为改变自变量来观察因变量的变化,并且通过统计学基本理论来检验假设成立与否。(本课程的任务!)27因果图因果图(cause-and-effect diagram)的运用的运用28 针对利用ANO中试装置分析污水厂总氮达标排放的问题绘制因果图 将自变量因子按照可控设计因子、不可控因子、讨厌因子(区组)和保持常量因子进行分组分析294./5.材料和实验方法材料和实验方法(实验设计和实验过程)(实验设计和实验过程)a.各种测定的因素(单因素?多因素?因素的取值水平,测定仪器和方式);b.样品采集的方式c.实验的重复次数(减少偶然误差带来的影响
13、);d.实验材料和设备(通常有图示:判断实验程序是否可靠;帮助他人重现实验)。e.质量控制(空白的选取、对照的选取等)30316.1 实验结果的汇报与讨论实验结果的汇报与讨论a.文字阐述(数据汇报+意义解释)b.图最佳(Origin,Excel等绘制)、表格其次c.运用统计学原理6.2 可能的实验误差可能的实验误差试验中还有哪些因素可能对实验结果造成影响。7.1 结论结论用来阐述结果为什么支持支持/不支持不支持假设。7.2 建议和下一步的研究建议和下一步的研究本实验的实际运用、还有哪些值得研究的问题?32实例实例2:一个小型实验的设计:一个小型实验的设计 背景:学生被要求制作一个纸螺旋并进行测
14、试 题目:翼展对纸螺旋下落时间的影响。(针对一个具体问题)自变量:翼展(厘米);因变量:下落时间(秒)33 假设:如果翼展增加,那么下落时间也增加。(下落时间与翼展成正相关)其它非测试因素(在研究中保持不变):投放高度、投放方式、纸螺旋结构、纸螺旋自重等。自变量水平:自变量的取值(离散点,但足以反映出规律)重复次数:自变量每一个取值的重复测试次数(n3)34手抓住中部投放每次从相同高度投放35实验结果实验结果实验结果基础数据翼展翼展(cm)平均下落时间平均下落时间(s)下落时间下落时间(s)各次实验结果各次实验结果1 2 3567893 5 4 44 5 6 56 7 5 67 8 6 79
15、7 8 836翼展对下落时间的影响分析图翼展对下落时间的影响分析图0123456789012345678910平均翼展平均翼展(cm)平均下落时间平均下落时间(s)37结果分析结果分析虽然每次测试之间数据存在一定的变化,但是随着翼展从5厘米增加至9厘米,平均下落时间也从4秒增加至8秒。这显示了两者在实验条件下的相关性。可能的误差分析可能的误差分析尽管实验数据支持假设,但是室内气流和响应时间(计时和投放的时间差)仍然会对结果构成影响,造成错误的结论。38结论结论 实验结果支持了假设,即翼展与下落时间呈正相关。(支持/不支持?)这一结果是由于翼展的增加加大了空气接触面,从而获得了更大的升力,从而延长了在空中的停留时间。(实验的理论解释)实验意义、建议和今后的工作实验意义、建议和今后的工作 增加翼展可以提高升力,这在直升机设计中可以用来节省油耗;下一步实验:改变旋翼形状、增加旋翼数量等