《常用统计技术.ppt》由会员分享,可在线阅读,更多相关《常用统计技术.ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、常用统计技术现在学习的是第1页,共52页一、方差分析一、方差分析几个概念几个概念因子:在试验中改变状态的因素称为因子,常用大写英文因子:在试验中改变状态的因素称为因子,常用大写英文字母字母A A、B B、C C等表示。等表示。水平:因子在试验中所处的状态称为因子的水平。用代水平:因子在试验中所处的状态称为因子的水平。用代表因子的字母加下标表示,记为表因子的字母加下标表示,记为A A1 1,A A2 2,。现在学习的是第2页,共52页方差分析类型:方差分析类型:单因子方差分析单因子方差分析多因子方差分析多因子方差分析有交互作用的多因子方差分析有交互作用的多因子方差分析现在学习的是第3页,共52页
2、单因子方差分析单因子方差分析假设检验:假设检验:H0H0:1 1=2 2=r rH1H1:1 1、2 2、r r不全相等不全相等(至少有两个不相等)(至少有两个不相等)现在学习的是第4页,共52页方差分析作的三个基本假定方差分析作的三个基本假定在水平在水平A Ai i下,指标服从正态分布下,指标服从正态分布N(,N(,2 2);在不同水平下,各方差相等;在不同水平下,各方差相等;各数据各数据y yijij相互独立。相互独立。现在学习的是第5页,共52页分析步骤分析步骤列出单因子试验数据表,列出单因子试验数据表,y yijij表示在第表示在第i i个水平,第个水平,第j j次试验指标值次试验指标
3、值在表中计算因子在表中计算因子A A的每一水平下数据的和的每一水平下数据的和T T1 1、T T2 2、TTR R及总和及总和T T计算各类数据的平方和计算各类数据的平方和现在学习的是第6页,共52页依次计算依次计算S ST T、S SA A、S Se e现在学习的是第7页,共52页依次计算依次计算f fT T、f fA A、f fe ef fT T=n-1=rm-1=n-1=rm-1f fA A=r-a=r-af fe e=n-r=f=n-r=fT T-f-fA AMSMSA A=S=SA A/f/fA AMSMSe e=S=Se e/f/fe e填写方差分析表填写方差分析表现在学习的是第8
4、页,共52页F F检验:检验:F F比比 =MS=MSA A/MS/MSe e当当F F比比 F F1-1-(f(fA A,f,fe e),认为因子认为因子A A是显著的是显著的当当F F比比 F F=31.21 F0.95(2,9)0.95(2,9)=4.26=4.26因子因子A A是显著的,表明不同工厂的零件是显著的,表明不同工厂的零件强度有显著差异强度有显著差异b b、当因子、当因子A A是显著时,可找出最佳水平是显著时,可找出最佳水平c c、可估计误差方差及标准差、可估计误差方差及标准差现在学习的是第10页,共52页例例2.1.22.1.2,与,与2.1.12.1.1相似相似如果没有给
5、出原始数据如果没有给出原始数据y yijij,仅给出各水平下的试验次数、,仅给出各水平下的试验次数、数据的均值与标准差,那么可将前面的公式稍作变化后数据的均值与标准差,那么可将前面的公式稍作变化后作方差分析作方差分析现在学习的是第11页,共52页对对2.1.22.1.2的数据进行分析:的数据进行分析:现在学习的是第12页,共52页现在学习的是第13页,共52页重复数不等情况下的单因子方差分析重复数不等情况下的单因子方差分析对对2.1.32.1.3的数据进行分析的数据进行分析现在学习的是第14页,共52页二回归分析二回归分析散布图:为研究两个变量间存在什么关系,把每一对(散布图:为研究两个变量间
6、存在什么关系,把每一对(x xi i,y yi i)()(i=1i=1、2 2、n n)看成直角坐标系中的一个点,)看成直角坐标系中的一个点,在图中标出在图中标出n n个点,称此图为散布图个点,称此图为散布图例例2.2.12.2.1,表,表2.2.12.2.1,图,图2.2.12.2.1现在学习的是第15页,共52页相关系数:用一个统计量来表示两个变量间关系的密相关系数:用一个统计量来表示两个变量间关系的密切程度,这个量成为相关系数切程度,这个量成为相关系数r r不同不同r r值的示意图:图值的示意图:图2.2.22.2.2现在学习的是第16页,共52页性质:性质:|r|1|r|1r=1r=1
7、时,表示时,表示n n个点在一条直线上,这时两个变量个点在一条直线上,这时两个变量间完全线性相关。间完全线性相关。r0r0,两个变量间具有线性正相关,两个变量间具有线性正相关r0rr|r|r1-/2(n-2)1-/2(n-2),可认为两个变量间,可认为两个变量间存在一定的线性相关关系存在一定的线性相关关系r r1-/2(n-2)1-/2(n-2)的临界值可从表的临界值可从表2.2.22.2.2中查到中查到现在学习的是第18页,共52页例例2.2.12.2.1计算相关系数计算相关系数r r,并判断其线性相关关系,并判断其线性相关关系现在学习的是第19页,共52页一元线性回归方程一元线性回归方程当
8、两个变量间存在线性相关关系时,常希望建立当两个变量间存在线性相关关系时,常希望建立两者间的定量关系表达式,这便是两个变量间的两者间的定量关系表达式,这便是两个变量间的一元线性回归方程一元线性回归方程现在学习的是第20页,共52页一元线性回归方程的求法一元线性回归方程的求法例例2.2.12.2.1求回归方程求回归方程由回归方程画出的回归直线一定通过(由回归方程画出的回归直线一定通过(0 0,a a)和)和()两点。()两点。现在学习的是第21页,共52页回归方程的显著性检验回归方程的显著性检验检验两个变量间是否存在线性相关关系的问题便是对检验两个变量间是否存在线性相关关系的问题便是对回归方程的显
9、著性检验问题回归方程的显著性检验问题现在学习的是第22页,共52页相关系数检验法:当相关系数检验法:当|r|r|r|r1-/2(n-2)1-/2(n-2)时,便认为两个时,便认为两个变量间存在线性相关关系,所求得的回归方程是有变量间存在线性相关关系,所求得的回归方程是有意义的意义的方差分析检验法:是单因子方差分析方差分析检验法:是单因子方差分析 现在学习的是第23页,共52页例例2.2.12.2.1的单因子方差分析的单因子方差分析利用回归方程进行预测:给定了自变量利用回归方程进行预测:给定了自变量x x后,对因变量后,对因变量y y做出推断做出推断现在学习的是第24页,共52页例例2.2.12
10、.2.1中指定中指定x x0 0=0.16=0.16,预测,预测y y0 0的区间可化为一元线的区间可化为一元线性回归的曲线回归性回归的曲线回归确定曲线回归方程形式,方法有两种:确定曲线回归方程形式,方法有两种:一是根据专业知识一是根据专业知识二是根据数据所画的散布图,将它与一些标准的函二是根据数据所画的散布图,将它与一些标准的函数图像进行比较后加以选择数图像进行比较后加以选择现在学习的是第25页,共52页例例2.2.22.2.2散布图散布图2.2.52.2.5常见的函数图像常见的函数图像图图2.2.42.2.4现在学习的是第26页,共52页曲线回归方程中参数的估计,我们采用线性化的方法,曲线
11、回归方程中参数的估计,我们采用线性化的方法,即通过变化将它化为一元线性回归方程的形式,用线即通过变化将它化为一元线性回归方程的形式,用线性回归方法来获得参数的估计性回归方法来获得参数的估计例例2.2.22.2.2现在学习的是第27页,共52页曲线回归方程的比较,比较准则两个:曲线回归方程的比较,比较准则两个:一是要求相关系数一是要求相关系数R R大大二是要求剩余标准差二是要求剩余标准差S S小小现在学习的是第28页,共52页三试验设计三试验设计试验设计的基本概念与正交性试验设计的基本概念与正交性试验设计试验设计全面搭配试验三个因子,每个因子三个水全面搭配试验三个因子,每个因子三个水平平现在学习
12、的是第29页,共52页优点:信息量大,可选最佳条件优点:信息量大,可选最佳条件缺点:试验次数太多,估计不出试验误差缺点:试验次数太多,估计不出试验误差现在学习的是第30页,共52页单因子条件试验法(因子轮换法)单因子条件试验法(因子轮换法)取取A2B3C2A2B3C2为最佳条件为最佳条件优点:试验次数少优点:试验次数少缺点:各因子水平间搭配不全面,信息量不够;试验误差未缺点:各因子水平间搭配不全面,信息量不够;试验误差未知,当试验误差大时,有时会选错最佳条件知,当试验误差大时,有时会选错最佳条件 现在学习的是第31页,共52页正交试验法正交试验法用正交表安排试验,并利用正交表的特点进行数用正交
13、表安排试验,并利用正交表的特点进行数据分析,找出最好或满意的试验条件。用单因子据分析,找出最好或满意的试验条件。用单因子条件试验法的相同试验次数,各因子水平间全面条件试验法的相同试验次数,各因子水平间全面搭配,信息量丰富,能估计出试验误差搭配,信息量丰富,能估计出试验误差现在学习的是第32页,共52页正交表正交表a a、常用正交表、常用正交表L Ln n(q qp p)“L L”表示正交表表示正交表“n n”是表的行数,在试验中表示试验的条件数是表的行数,在试验中表示试验的条件数“p p”是列数,在试验中表示可以安排因子的最多个数是列数,在试验中表示可以安排因子的最多个数“q q”是表的主体只
14、有三个不同数字,在试验中表示每一因是表的主体只有三个不同数字,在试验中表示每一因子可以取的水平数子可以取的水平数现在学习的是第33页,共52页常用的正交表有两大类常用的正交表有两大类(1)(1)一类正交表的行数一类正交表的行数n n,列数,列数p p,水平数,水平数q q间有如下关间有如下关系:系:n=qn=qk k,k=2,3,4,p=(n-1)/(q-1),k=2,3,4,p=(n-1)/(q-1)如:如:L L4 4(2(23 3),L L8 8(2(27 7),L L1616(2(21515),L L3232(2(23131)等,可以等,可以考察因子间的交互作用。考察因子间的交互作用。
15、现在学习的是第34页,共52页(2)(2)另一类正交表的行数,列数,水平数之间不满足另一类正交表的行数,列数,水平数之间不满足上述的两个关系上述的两个关系如:如:L L1212(2(21111),L L1818(3(37 7),L L2020(2(21919),L L3636(3(31313)等等这类正交表不能用来考察因子间的交互作用这类正交表不能用来考察因子间的交互作用现在学习的是第35页,共52页正交表具有正交性,这是指它有如下两个特点:正交表具有正交性,这是指它有如下两个特点:(1)(1)每列中不同的数字重复次数相同。每列中不同的数字重复次数相同。在表在表L L9 9(3(34 4)中,
16、每列有中,每列有3 3个不同数字:个不同数字:1,2,31,2,3,每一个,每一个出现出现3 3次。次。现在学习的是第36页,共52页(2)(2)将任意两列的同行数字看成一个数对,那么一切可将任意两列的同行数字看成一个数对,那么一切可能数对重复次数相同。能数对重复次数相同。在表在表L L9 9(3(34 4)中,任意两列有中,任意两列有9 9种可能的数对:种可能的数对:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)(3,1),(3,2),(3,3)每一对出现一次。
17、每一对出现一次。现在学习的是第37页,共52页无交互作用的正交设计与数据分析无交互作用的正交设计与数据分析试验设计,以试验设计,以2.3.12.3.1为例为例(1)(1)明确试验目的明确试验目的 (2)(2)明确试验指标明确试验指标(3)(3)确定因子与水平确定因子与水平(4)(4)选用合适的正交表选用合适的正交表,进行表头设计进行表头设计,列出试验计划列出试验计划现在学习的是第38页,共52页进行试验和记录试验结果进行试验和记录试验结果试验的次序最好要随机化试验的次序最好要随机化试验结果记录在对应的试验条件后面试验结果记录在对应的试验条件后面现在学习的是第39页,共52页数据分析数据分析数据
18、的直观分析数据的直观分析寻找最好的试验条件寻找最好的试验条件直观分析计算表,见表直观分析计算表,见表2.3.12.3.1各因子对指标影响程度大小的分析用极差来判断影各因子对指标影响程度大小的分析用极差来判断影响大小响大小B B因子影响最大,其次是因子影响最大,其次是A A因子,因子,C C因子影响最小因子影响最小现在学习的是第40页,共52页各因子不同水平对指标的影响图各因子不同水平对指标的影响图CBA220220205205190190175175160160900 900 1100 1100 1300 1300 10 10 11 11 12 12 70 70 80 80 90 90 R R
19、A AR RB BR RC C现在学习的是第41页,共52页数据的方差分析(多因子方差分析)数据的方差分析(多因子方差分析)数据的方差分析计算见表数据的方差分析计算见表2.3.52.3.5S SA A=S=S1 1S SB B=S=S2 2S SC C=S=S3 3S Se e=S=S4 4S ST T=S=S1 1+S+S2 2+S+S3 3+S+S4 4现在学习的是第42页,共52页对满足对满足2.3.12.3.1式要求的一类正交表则有:式要求的一类正交表则有:S ST T=S=S1 1+S+S2 2+S+Sp p最后的方差分析表见表最后的方差分析表见表2.3.62.3.6,由于,由于F
20、FA AFF0.90(2,2)0.90(2,2),F FB BFF0.95(2,2)0.95(2,2)因子因子A A影响显著,因子影响显著,因子B B影响高度显著,因子影响高度显著,因子C C 影响不影响不显著显著现在学习的是第43页,共52页F F比比FFF比比FF0.900.90影响显著影响显著F F0.990.99F F比比FF0.950.95影响高度显著影响高度显著F F比比FF0.990.99显著性特大显著性特大现在学习的是第44页,共52页最佳条件的选择最佳条件的选择对显著因子应该取最好的水平;对显著因子应该取最好的水平;对不显著因子的水平可以任意选取,在实际中通对不显著因子的水平
21、可以任意选取,在实际中通常从降低成本、操作方便等角度加以选择。常从降低成本、操作方便等角度加以选择。上面的例子中对因子上面的例子中对因子A A与与B B应该选择应该选择A A2 2B B2 2,因子,因子C C可以可以任选,譬如为节约材料可选择任选,譬如为节约材料可选择C C1 1。现在学习的是第45页,共52页因子的贡献率因子的贡献率当试验指标不服从正态分布时当试验指标不服从正态分布时,进行方差分析的依进行方差分析的依据就不够充足据就不够充足,此时可通过比较各因子的此时可通过比较各因子的“贡献率贡献率”来衡量因子作用的大小。由于来衡量因子作用的大小。由于S S因因中除因子的效应外,中除因子的
22、效应外,还包含误差,从而称还包含误差,从而称S S因因-f-f因因MSMSe e为因子的纯离差平方为因子的纯离差平方和,将因子的纯离差平方和与和,将因子的纯离差平方和与S ST T的比称为因子的贡的比称为因子的贡献率。献率。现在学习的是第46页,共52页验证试验验证试验验证的最佳条件不一定在试验中出现,为此通常需验证的最佳条件不一定在试验中出现,为此通常需要进行验证试验。即使选择的最佳条件在试验中出要进行验证试验。即使选择的最佳条件在试验中出现,也需要通过验证看其是否稳定现,也需要通过验证看其是否稳定现在学习的是第47页,共52页有交互作用的正交设计与数据分析有交互作用的正交设计与数据分析试验
23、设计试验设计明确试验目的明确试验目的 明确试验指标明确试验指标确定试验中所考虑的因子与水平,并确定可能存在并要考确定试验中所考虑的因子与水平,并确定可能存在并要考察的交互作用察的交互作用选用合适的正交表,进行表头设计选用合适的正交表,进行表头设计进行试验,并记录试验结果进行试验,并记录试验结果现在学习的是第48页,共52页数据分析数据分析多因子有交互作用的方差分析多因子有交互作用的方差分析计算表见计算表见2.3.112.3.11,方差分析表见,方差分析表见2.3.122.3.12现在学习的是第49页,共52页最佳条件的选择最佳条件的选择对显著因子可通过比较两个水平下的数据均值得到对显著因子可通
24、过比较两个水平下的数据均值得到最佳水平,因子最佳水平,因子C C取取C2C2为好为好对显著的交互作用,先要计算两个因子不同搭配对显著的交互作用,先要计算两个因子不同搭配下的数据均值,再通过比较得出哪种水平组合较下的数据均值,再通过比较得出哪种水平组合较好好不显著因子,其水平可任取不显著因子,其水平可任取现在学习的是第50页,共52页避免混杂现象避免混杂现象表头设计的一个原则表头设计的一个原则在进行表头设计时,若一列上出现两个因子,或两个在进行表头设计时,若一列上出现两个因子,或两个交互作用,或一个因子与一个交互作用时,称为混杂交互作用,或一个因子与一个交互作用时,称为混杂现象,这是不允许的现象,这是不允许的在用正交表安排试验时,因子应与所在列的自由度在用正交表安排试验时,因子应与所在列的自由度相同,而交互作用所占列的自由度之和应与交互作相同,而交互作用所占列的自由度之和应与交互作用的自由度相同用的自由度相同现在学习的是第51页,共52页根据表头设计避免混杂的原则选择正交表时必须满根据表头设计避免混杂的原则选择正交表时必须满足下面一个条件:足下面一个条件:“所考察的因子与交互作用自所考察的因子与交互作用自由度之和由度之和n n1”1”,这是一个必要条件,不是充分,这是一个必要条件,不是充分条件条件例例2.3.32.3.3现在学习的是第52页,共52页