《(整理)试验设计与数据处理(整理).docx》由会员分享,可在线阅读,更多相关《(整理)试验设计与数据处理(整理).docx(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、(整理)试验设计与数据处理(整理) 第四章 1、误差的来源: 主要有四个方面:1.设备仪表误差:包括所使用的仪器、器件、引线、传感器及提供检定用的标准器等,均可引入误差。2.环境误差:周围环境的温度、湿度、压力、振动及各种可能干扰测量的因素,均能使测量值发生变化,使测量失准,产生误差;3.人员误差:测量人员分辨能力、测量经验和习惯,影响测量误差的大小。4.方法误差:研究与实验方法引起的误差。 2、误差的分类: 粗大误差、系统误差、随机误差;粗大误差的特点是测量值显著异常。处理方法是在对实验结果进行数据处理之前,须先行剔除坏值。系统误差的特点是在测量条件一定时,误差的大小和方向恒定,当测量条件变
2、化时,误差按某一确定规律变化。处理方法:由于误差是按某一确定规律变化的,即误差变化可用函数式或用曲线图形描述偶然出现,误差很大,数据异常。可以理论分析、实验验证,找到规律并修正。随机误差的特点是测量时,每一次测量的误差均不相同,时大时小,时正时负,不可预定,无确定规律。处理方法是采用数理统计的方法,来研究随机误差的特征,以判断它对测量结果的影响。 粗大误差或者坏值的判断方法:剔除方法有两种:1)格拉布斯准则。设对某物理 量进行N 次重复测量,得测量列x1,x2,xn ,算术平均值11n i i x x n - =测量值与平均值之差称为残余误差或残差,用Vi 表示,即V i i x x - =-
3、 测量列的标准差 = 若某测量值xi 的残差绝对值(,)V n 时,则判为坏值。 (n 为测量次数,为置信度)。2)3准则。确定其最大可能误差,并验证各测量值的误差是否超过最大可能误差。一般为简化计算,提出以+-3 为最大可能误差,也称为3准则。 3.误差传递公式及其应用(任意选取两个方面) 这就是误差传递函数,或称方差传递公式。时,可写成方差合成公 式其中 称为方差传递系数。误 差传递公式可用于确定最佳实验条件;确定测量的限差以及仪表的选配。确定最佳实验条件 根据误差传递关系,设计实验 在电工学实验中,利用下列函数式测定金属的导电率 L 试件金属导线的长度, d 试件金属导线的截面直径; R
4、 试件金属导线的电阻。 写成相对误差形式 从所得的结果可以看出,若欲提高导电率的测量精度,使减小,首先, 选择金属导线,使L d R各值越大越好。在各直接测量精度未定的情况下,应尽可能提高导线直径的测量精度,由上式的系数可以表明,d的相对精度对误差的影响最大。 确定测量的限差: 设被测量的真值为 a ,第一件仪器测量值为L1,标准差为。第二件仪器测 量值为L2,标准差为 。则各个测量值应满足 R d L 4 2 = 令测量值之差为 ,即 , 根据方差合成公式可知 写成误差限的形式,则 两个测量值之差最大不应超过 ,不超过差值合成方差的3倍。因此, 就是限差。 第六章 1、单因素析因实验步骤:
5、1.由观测值it x 计算各种方差:2A S , (2) S ,并按照公式22E A S S F =算出观测值的F 值。2.事先给定显著水平,从F 分布表上查出当自由度为(e a f n f n =21,)时的临界值),(e a f f F 。如果F F ,则认为因素A 对试验结果变差的影响在下是显著的,反之,F F ,则不显著。 2、方差分析有哪三种因素模型及各自特点? 固定效应模型、随机效应模型、混合模型;固定效应模型的特点:当因素固定在某一水平时,因素的水平完全可以控制,如温度、压力等,这时候因素对试验结果带来的影响是固定的。随机效应模型的特点:当因素水平确定后,人们难以控制,如原料的不
6、均匀性、炉内温度等,它的效应值不是一个固定数,是随机变量。混合模型的特点:混合模型是指一种因素的效应是随机的而另一种因素的效应则是固定的。 3、析因实验中何时需要多重比较?多重比较的T 法的检验步骤? 原因:正交试验:几个显著因素中,每个因素取哪个水平,组合起来能得到最好 的结果,最佳的工艺条件或配方。如果在生产上难以实现,或成本太高。如何换成与最佳水平差异不显著的其它水平。步骤:T 法,以单因素试验为例。设m 为要比较的水平个数,r为同一水平下试验的重复次数(设各水平下,重复测定次数r 相等),为试验误差的方差,fe为其自由度。采用“判别”统计量dT。 1.查,是显著水平,m是要比较的水平个
7、数,fe是自由度 2.令分别表示每一水平所产生观测结果之和的平均值。将任两水平的平均观测值之差的绝对值,记d ij,即。 3.T法的判断原则是:如果,则表示i, j 两个水平之间结果有显著差异,否则,对结果无显著差异。 第七章 1、三种基本插值方法及各自特点: 图解法、线性插值法、拉格朗日法。图解法特点是简便易行,不必求出曲线的函数表达式,但它要求原函数在插值区间必须连续,否则,会带来比较大的误差。线性插值法特点是把插值区间的函数关系,近似当作直线来处理。当原函数关系偏离直线较远或者插值区间较宽时,线性插值会引起很大的误差。拉格朗日插值法的优点是形式对称,它与插值点的编排次序无关,便于编制计算
8、机程序。缺点是计算工作量大,在遇到表中给出的已知点数据较多时,应作分段插值,即在所给的n个点中,选取几个与插值点最近的点作插值点就可以了。 2.如何正确绘制实验结果曲线? (1)坐标的选择,当曲线绘制时,尚未选定采用哪种坐标之前,一般都是用直角坐标绘制的。当在下列三种情况下,采用单对数坐标纸绘图,一、变量之一在所研究的范围内,有若干个数量级的变化时;二、当自变量在起始段的少许变化,引起因变量有剧烈的变化时;三、当需要将非线性函数关系,变换成直线函数关系时。使用双对数坐标纸作图的适用条件,与单对数纸基本相同,唯一不同的是,当自变量x和因变量y都有几个数量级的变化时,才选用双对数坐标。极坐标适用于
9、表示实验中有周期性重复变化的变量,亦可用于缩短原需长带形表达的曲 线。(2)比例尺的选择,两个坐标比例尺应遵守的比例法则:两轴比例尺的选择应保证“双双误差”(y x ?22)面积成正方形。单个坐标轴比例尺的选择应按下列原则:一、比例尺的大小,应保证所描出的实验误差“点”的面积,通常在242mm 之内(或各观测值的精密度在图上不应超过两个最小分度),且应使所有测试数据易于在图面上绘出确切的坐标点;二、自变量置于x 轴上,因变量置于y 轴上,沿轴标示的变量应包括所研究区间的全部变化值;三、应使所绘曲线,占满坐标纸面,如是直线关系,应使其尽量接近一根斜率为1的直线。(3)通过数据“点”描绘曲线,在标
10、绘数据点时,可使用各种符号,符号的大小应与观测值的准确度相当。为数据点配曲线时,要求所配曲线与各数据点最接近,并不希望曲线都听过数据点,希望在曲线上下的数据点数大致相等。曲线应光滑,不要有突然折曲和不连续的地方。绘制曲线除用曲线尺外,也可用宽约1mm 的细窄弹性带或钢丝。当实验点(i i y x ,)的间隔很大时,可用拉格朗日插值法来补充某些中间点的数值。(4)用最小二乘法对所配曲线做数量上的评定,当全部偏差平方和,= -n i i i y y 12)(为最小时,则这条 曲线就是最佳配线方案。 第八章 1、根据实验数据,建立数学模型的步骤 1.将实验数据标绘成曲线,根据此曲线形状,对照典型曲线
11、,初选函数形式,将所选出的函数)(x y =,通过变量代换将其转换成线性函数Y=A+BX 。 2.将已 知的),(i i y x 值,代入变量转换公式,求出成对的新变量值)(i Y X ,i ,然后汇在直 角坐标(X ,Y )上,如果这些坐标点接近一条直线,则表明所初选的模型公式)(x y =合适。 2、如何用差分法确定一元n 次多项式模型方次数? 选取一系列成等差数据的自变量,即h x x i i =-+1(为级距或步长),则kh k x k +=0,所以就可以以h 为级距列出因变量i y 来。计算一阶差分i i i y y y -=?+1,二阶差分i i i y y y ?-?=?+12
12、;三阶差分i i i y y y 2123?-?=?+等等。然后作出差分表,当第n 阶差分列内所有的数值接近相等时,就可以停止差分计 算了,此时,此模型就可以用n 次多项式表示。即n n x a x a x a a x ?+=2210)( 3、如何用差分计算(牛顿内插公式)确定次多项式模型系数? (确定n 次多项式系数0a ,1a n a ),利用牛顿内插公式: ).(!.)(2)(y 110010202200-?+-?+-?+=n n n x x x x x x h n y x x x x h y x x h y y )(与公式n n x a x a x a a ?+=2210y 联立后,利
13、用x 的同次幂系数相等,计算0a ,1a n a ,其中,在代入初值0x ,0y 时,可以用),(i i y x 中任何一对,或者采用几对不同的),(i i y x 作初值,分别求出0a ,1a n a 后,取其相应的平均值。利用牛顿内插公式 ).(!.)(2)(y 110010202200-?+-?+-?+=n n n x x x x x x h n y x x x x h y x x h y y )( 与公式n n x a x a x a a ?+=2210y 联立后,利用x 的同次幂系数相等,计算0a ,1a n a ,其中,在代入初值0x ,0y 时,可以用),(i i y x 中任何
14、一对,或者采用几对不同的),(i i y x 作初值,分别求出0a ,1a n a 后,取其相应的平均值。 4、求数学模型公式系数的方法有哪些? 1.用图解法求公式系数。首先利用直线化方法得出线性方程 Y=A+BX ,其中,系数A 可由直线与Y 轴的交点的纵坐标定出(以X=0,Y=0为坐标原点时),系数B 有两种确定方法:由直线与0-X 轴的正切tg 来确定从直线上选取距离较远的两点,然后代入方程求解得出。 2.用平均值法求公式系数。假设试验数据有n 对,将这n 对),(i i y x 分别代入线性方程Y=A+BX ,就会得到n 个条件方程,然后将这n 个条件方程等分为两大组,每一大组对应项相
15、加,并将最终得到的两个方程联立求解,即可求得平均意义下的系数A,B; 3.用最小二乘法求公式系数。对于一元m 次多项式,利用下列正规方程求解系数:01100.s V a s a s a m m =+; 111201.V a s a s a s m m =+;m m m m m V a s a s a s =+2110.;其中,=n i p i p x s 1 (p=0,1,22m )=n i q i i q x y V 1(q=0,1,2m)(4)用回归分析法求模型系数 适用于多元线性或非线性函数,对于一元线性函数,y=a+bx,按照下式求a,b: 21?(,)()n i i i E a b
16、y y =-21() n i i i y a bx =-1 2()0n i i i i E y a bx x b =?=-=?12()0n i i i E y a bx a =?=-=?E a ?111()0n n n i i i i i i i y a bx y na b x =-=-=n n i i i=1i=1 y a =n b x y bx -=-E b ?n i=1 n 2i=1()()b=()i i i x x y y x x -i x ?i i y a bx =+-=x b y a b=2)() )(-x x y y x x 第九章 1、用最小二乘法确定回归系数的原理? 对于每一
17、个变量 (i=1、 2、3、),由回归方程可以确定一回归值 设回归值?i y 与实际测定值i y 之差?()i i i i y y y a bx -=-,表示了i y 与回归直线 ?y =a +bx 的偏离程度,因而对于所有的自变量i x 来说,如果?i i y y 与的偏离愈小, 便可认为回归直线与所有实验点拟合得愈好。为了更准确地表示全部实测值i y 与 回归直线的偏离程度,常用实测值与回归值的偏差平方和表示,并记为E(a ,b), 于是得到 要使E 最小,根据微积分学的极值原理,只要将上式分别对a 、b 求偏微分,并令其等于零即可。由于平方运算又称二乘运算,因此,求回归直线的方法又称为最
18、小二乘法。要使E (a ,b )为最小值,a 、b 可由下式求出。 从 得 同样由 得到 ,式中x ,y 分别为x 和y 的平均值,a 为直线截距,b 为直线斜率,a 、b 确定,一元线性回归方程及回归直线就可确定 用回归分析和用牛顿插值法确定模型系数有何异同? 用最小二乘法找出的近似函数y=f(x),与牛顿插值函数不同,它并不求曲线y=f(x)恰好通过各试验点(x i ,y i ),而只需使求出的曲线能够反映给定数据的一般 趋势就行了。 2、如何用相关分析检验一元线性回归方程是否显著,分析方差检验与相关系数检验的一致性。 相关系数 是衡量两个变量(或多个变量)之间线性关联程度的一个指标。 如
19、 x 和 y 是两个随机变量,相关系数为: 当 =0 时, q 最大, x 和y 线性无关;当|= 1 时, q = 0 ,所有观测点都落在回归直线上,x 和y 完全线性相关。|越靠近于 1 时,则 q 较小,2y x 22xy L L L )()()(2xy y y x x y y x x =-= 表明x 与y 间线性相关密切。然后进行相关系数的显著性检验:1根据实测数据求p 值2给定显著性水平,在相关系数检验表上,按自由度n-2查出相应的临界值p a 这里n 是对变量x 和y 成对观察的次数,2是变量数目。3将p xy 与p a 进行比较。如|p xy |p a 则认为在(1-a)%置信度
20、下,变量x 与y 之间线性相关显著,此 时所建立的回归方程才有应用价值。反之,当|p xy | ,|2|越大,则 Q 回越小,回归方程的效果越好,反之亦然。两种检验结果是一致的。 在实际应用中,不需要了解相关系数时,对回归方程进行方差分析的 F 检验即可。 3、从因素的取舍以及取舍顺序上分析,常用回归分析分有哪几类及各自特点? 强行进入法;前进法;后退法;前进-后退法。特点:它们的共同特点:每一步只引入或剔除一个自变量。1预先选定的自变量全部进入回归模型2自变量从无到有、从少到多3先将全部自变量放入方程,然后逐步剔除。 4、什么是回归线的置信带、回归系数的置信区间?置信带: 在(1-)置信水平
21、下,由确定的两条弧形曲线所形成的包含真实的回归直线的区带。置信区间:讨论了根据实验数据确定回归系数的最小二乘法,不是反映变量关系的真实系数。在许多情况下希望估计回归系数 a 、 b 、 的真实值(范围),确定这些参数的置信区间。a 系数的置信区间 为 第十章 1、什么情况下需要正交试验?正交试验的原理?情况:在科学研究,产品设计与开发和工艺条件的优选过程中,当为了揭示多种因素对实验或计算结果的影响,一般都需要进行大量的多因素组合条件的实验时,需要进行正交试验。原理:2y x 22xy L L L )()()(2xy y y x x y y x x =-= 1.正交实验设计,是利用规格化的正交表
22、,恰当地设计出试验方案,有效地分析试验结果,提出最优配方和工艺条件,并进而设计出可能更优秀的试验方案的一种科学方法。 2.其中,正交表是利用“均衡搭配”和“整齐可比”这两条基本原理,从大量的全面试验方案中,为挑选出少量具有代表性的试验点,所制成的排列整齐的规格化表格。其特点为:1)每个纵列中“1”、“2、“3”、字码出现的次数相同。2)任意两纵列的横行所构成的有序数字对中,每种数字对出现的次数相同。上述两个特点是“均衡搭配”和“整齐可比”的体现。 3.正交性原理是设计正交表的科学依据,主要表现在上述的“均衡搭配”和“整齐可比”两个方面。a、“均衡搭配”是指每一列(一个因素)各水平出现的次数相等
23、。b、“整齐可比”是指对每一个因素(每一列),在每一个水平下,其余每个因素的各水平出现的次数相同。 2、正交试验常规分析方法如何对正交试验结果进行分析?常规分析法通过对试验结果进行分析,可确定诸因素对结果影响的主次顺序;可确定各因素的可能最优水平,从而可以设计出可能更优的试验方案;还可用空列极差估计试验误差。包括以下三项:1.“看一看”。即通过对试验结果大小进行直接观察和比较,来初步确定较好的试验条件。2.“算一算”。即通过简单的计算,粗略估计各因素对结果的影响的主次顺序,以及各因素的优秀水平。A.计算每一因素同一水平导致结果之和。B.计算每个因素各水平导致结果之和的极差。3.画水平影响趋势图
24、。它有助于发现正交表中所未列入而可能更优的水平值,为下一轮正交试验确定水平值提供依据。作法是:以因素的水平值为横坐标,以相应因素的同水平导致结果之和为纵坐标,画出每一个因素各水平对结果影响的趋势图。综上所述,通过以上三项便可以得出三个可能的最优方案,然后通过实际经验和技术、经济的可能性来判断出最终的方案。 3、安排水平数目不等的正交试验有哪些方法,各是如何使用的?一.利用规格化的混合水平正交表,步骤:1确定试验目的及考核指标2制定因素水平表3选用正交表表4填写试验计划表5试验结果的分析:1看一看2算一算:1)求和并找出最佳水平和组合2)求极差,定因素影响顺序3画水平影响趋势图。2采用拟水平法,
25、当因素和水平个数选定后,选用正交表时,个别考察因素的水平数少 于对口表里的限定数目,可利用表中空下来的水平位置,重复考察此因素的某一重要水平。 4、何谓因素的交互作用?考虑交互作用时,试验的安排、试验结果的分析与不考虑交互作用有何异同?因素的交互作用是指除了因素“孤立的”影响试验结果之外,还存在因素间不同水平互相搭配,联合在一起共同对试验结果的影响。如,因素A和因素B的交互作用可记为AB。不同:考虑交互作用后,1表头设计。表头设计是把交互作用项看成是一种特殊的影响因素,在所选出的正交表中独占一列。当考察的因素较多交互作用也较多时,这些交互作用在正交表中的位置,必须利用交互作用表来确定。2试验结果的分析增加了两项: 1)求交互项同一水平所导致结果之和时,应照顾到各单因素所对应水平的搭配情况; 2)对结果影响不大的交互作用项可以合并。 5、什么事误差规并? 6、结合本课程内容,从试验设计到获得数学模型总体上包括哪些步骤?