方差分析简介(共10页).doc

上传人:飞****2 文档编号:13414695 上传时间:2022-04-29 格式:DOC 页数:10 大小:427KB
返回 下载 相关 举报
方差分析简介(共10页).doc_第1页
第1页 / 共10页
方差分析简介(共10页).doc_第2页
第2页 / 共10页
点击查看更多>>
资源描述

《方差分析简介(共10页).doc》由会员分享,可在线阅读,更多相关《方差分析简介(共10页).doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精选优质文档-倾情为你奉上方差分析简介1. 引言方差分析(analysis of variance,简称ANOVA)是一种假设检验方法,即基本思想可概述为:把全部数据的总方差分解成几部分,每一部分表示某一影响因素或各影响因素之间的交互作用所产生的效应,将各部分方差与随机误差的方差相比较,依据F分布作出统计推断,从而确定各因素或交互作用的效应是否显著。因为分析是通过计算方差的估计值进行的,所以称为方差分析。方差分析的主要目标是检验均值间的差别是否在统计意义上显著。如果只比较两个均值,事实上方差分析的结果和t检验完全相同。只所以很多情况下采用方差分析,是因为它具有如下两个优点:(1)方差分析可以在

2、一次分析中同时考察多个因素的显著性,比t检验所需的观测值少;(2)方差分析可以考察多个因素的交互作用。方差分析的缺点是条件有些苛刻,需要满足如下条件:(1)各样本是相互独立的;(2)各样本数据来自正态总体(正态性:normality);(3)各处理组总体方差相等(方差齐性:homogeneity of variance)。因此在作方差分析之前,要作正态性检验和方差齐性检验,如不满足上述要求,可考虑作变量变换。常用的变量变换方法有平方根变换,平方根反正弦变换、对数变换及倒数变换等。方差分析在医药、制造业、农业等领域有重要应用,多用于试验优化和效果分析中。2. 单因素方差分析2.1 基本概念(1)

3、 试验指标:在一项试验中,用来衡量试验效果的特征量称为试验指标,有时简称指标,也称试验结果,通常用y表示。它类似于数学中的因变量或目标函数。试验指标用数量表示称为定量指标,如速度、温度、压力、重量、尺寸、寿命、硬度、强度、产量和成本等。不能直接用数量表示的指标称为定性指标。如颜色,人的性别等。定性指标也可以转化为定量指标,方法是用不同的数表示不同的指标值。(2) 试验因素:试验中,凡对试验指标可能产生影响的原因都称为因素(factor),也称因子或元,类似于数学中的自变量。需要在试验中考察研究的因素,称为试验因素,有时也称为因素,通常用大写字母A、B、C、表示。在试验中,有些因素能严格控制,称

4、为可控因素;有些因素难以控制,称为不可控因素。试验因素是试验中的已知条件,能严格控制,所以是可控因素。通常把未被选作试验因素的可控因素和不可控因素都称为条件因素,统称为试验条件。(3) 因素水平:因素在试验中所处的各种状态或所取的不同值,称为该因素的水平(level),也简称为水平或位级,通常用下标1、2、3、表示。若一个因素取K种状态或K个值,就称该因素为K水平因素。因素的水平,有的可以取得具体值,如6Kg、10cm;有的只能取大致范围或某个模糊概念,如软、硬、大、小、好、较好等;但也有无法用数值表征的,如履带的不同形式,轮胎花纹的不同种类,机器的不同操作方式,大豆的不同品种等。(4) 处理

5、组:所有试验因素的水平组合所形成的试验点称为处理组(treatment group),也称组合处理。三因素试验中,A1B2C3是一个组合处理,它表示由A因素1水平、B因素2水平和C因素3水平组合而形成的一个试验点。2.2 主要步骤假设我们在实验中只考虑因素A,该因素有p个水平,每个水平做r次重复试验,设第i个水平的第j次重复试验的数据为,如表1所示。表1 试验数据12jr根据这些数据,可以计算全体数据的均值和和各水平对应数据的均值:,i=1, 2, , p进一步,可以计算全体数据的偏差平方和、因素A对应的偏差平方和,以及误差的偏差平方和:下一步,需要计算这三个偏差平方和所对应的自由度。之所以要

6、计算自由度,是因为如果用偏差平方和除以对应的数据项数,得到的统计量并不是方差的无偏估计。而偏差平方和与对应的自由度的商才是方差的无偏估计。设有n个数据x1, x2, , xn,它们的平方和的自由度取决于xi之间有多少个线性约束关系。 设X=(x1, x2, , xn)T,若存在秩为m的矩阵A,满足则S的自由度是n-m。下面来求ST的自由度。令,则xi之间存在一个线性约束即m=1,A=(1, 1, , 1),故。同理可得,。可以证明(证明本文从略),对于偏差平方和与其对应的自由度,如下关系成立:,这就是Fisher偏差平方和加性原理,它是全部方差分析的基础。在得到偏差平方和及其对应的自由度后,就

7、可以得到因素A和误差e对应的平均偏差平方和,平均偏差平方和是反映数据波动大小的一个测度,比较和的大小可以看出因素A的不同水平带来的试验指标的波动是否与随机误差相同,所以,可以由此判断因素A对试验指标是否有显著影响。判断和是否相同的方法采用F检验(基于F分布的假设检验),令则可认为F服从自由度为和的F分布。用求出的F值查F分布表可得到对应的P值,一般取置信水平0.05,即当P值小于0.05时拒绝原假设,认为因素A对试验指标的影响显著,否则维持原假设,认为影响不显著。2.3 数学模型设因素A取了p个水平,每个水平重复了r次试验,在水平Ai下的第i次实验结果yij可以分解为其中,表示在水平Ai下的理

8、论指标值,是试验误差。我们把试验误差认为是相互独立的随机变量,且服从正态分布,这是方差的基本假设之一。为了看出因素各水平的影响大小,将再进行分解,令,i=1, 2, , p则,i=1, 2, , p; j=1, 2, , r显然ai之间有关系ai表示水平Ai对试验结果产生的影响,它称作水平Ai的效应。方差分析的数学模型就是建立在这么几条假定的基础上的:(1),i=1, 2, , p; j=1, 2, , r(2)(3)相互独立且都服从分布由这三条建立的模型叫做线性模型。建立模型以后,统计分析需要解决下列问题:1. 参数估计。即通过试验估计和ai,它们的估计量用和表示。可以证明(本文从略),和是

9、和ai的无偏估计。2. 假设检验。如果因素A对指标有影响,效应ai不全为0,如果因素A对指标没有影响,则效应ai全为0。因此,要检验因素A对指标影响是否显著就是检验假设这需要选择一个合适的统计量。令,则故 如果原假设H0成立,则,有因为相互独立且都服从分布,由统计理论推知服从自由度为的分布,服从自由度为的分布,而且两者独立,从而服从自由度为,的F分布。所以可以采用F统计量作为假设检验的统计量(这种假设检验称为F检验),通过查F分布表确定拒绝域或P值,从而作出推断结论。3. 多因素方差分析所谓多因素方差分析,就是同时检验多个因素影响是否显著的方差分析方法。多因素方差分析。方差分析的一大优势就是可

10、以同时考虑多个试验因素对试验指标的影响,这样,既节省了试验次数,试验误差也比进行多次单因素方差分析要小。在多因素方差分析中,有一个很重要的问题,就是试验设计(DOE: Design of Experiment)。其主要目的是通过设计每次试验中因素水平的搭配,用尽可能少的试验次数和试验数据满足方差分析的要求,获得较好的分析结果。最常用的试验设计有析因设计和正交设计。前者是对所有因素的所有水平组合都进行试验,因此又称交叉分组设计;后者是按照某种正交表设计试验,以较少的试验次数即可接近析因设计的效果。因此,析因设计一般用于两个因素且水平数较少的情况,而因素和水平较多时则多采用正交设计。除正交设计外,

11、还有其它许多实验设计方法,如系统分组设计(嵌套设计)、正交拉丁方设计、裂区设计等,它们一般用在并非任意组合都可以实现或找不到合适的正交表的情况。实验设计确定的一个水平组合,如A1B2A3,称作一个处理组。如果在一个处理组内做多次重复试验得到多个试验数据,则称为有重复试验的设计,否则称无重复试验的设计。在方差分析中,一般要求各处理组内的重复试验数相等。对于不相等的情况,方差分析也可以计算,但公式略有差别,而且可靠性差,所以一般采用其它方法如通用线性模型(GLM: General Linear Model)来计算。在多因素方差分析中,还有一个重要的概念,这就是因素间的交互作用(interactio

12、n),它是指几个因素的某些水平互相增强或互相削弱的现象。表2中,当A从A1变化到A2时,指标都增加,与B取B1或B2无关;同样,B从B1变到B2时,指标都增加,与A的水平无关,此时,我们说A和B之间没有交互作用。而在表3中,因素A对指标的影响与B的水平有关,此时我们说A和B之间存在交互作用,记作AB。表2 无交互作用的试验数据A1A2B125A2710表3 有交互作用的试验数据A1A2B125A2733.1 析因设计的方差分析由于析因设计主要用于因素和水平数较少的情形,所以本文以双因素试验为例,介绍析因设计的方差分析的主要步骤。设考虑两个试验因素A和B,A有p个水平,B有q个水平,每个处理组内

13、做r次重复试验,在AiBj条件下的第k次实验的数据记作yijk;在AiBj条件下做的全部试验数据之和记作Yij,显然令表示在条件下试验数据之和,表示在条件下试验数据之和,即它们的平均值记为和整个试验的总平均则总偏差平方和,因素A和B的偏差平方和,误差的偏差平方和,交互作用的偏差平方和分别计算如下,它们的自由度分别为需要注意的是:如果各处理组中没有重复试验,即r=1,那么按上式计算出的=0,这将导致后续步骤无法开展。因此,在无重复试验的情形,应该用下式计算和此时,将无法计算。因此,无重复试验的设计无法考察交互作用。然后,计算平均偏差平方和和F值把这些F值查F表求得拒绝域或P值,即可做出统计推断。

14、类似于2.3节,也可以得到双因素方差分析的数学模型:其中,分别为因素A,B的主效应以及A与B的交互效应,满足,为实验的随机误差,它们相互独立且都服从正态分布。由这一模型,可以与2.3节类似地得出各参数的估计,以及采用F检验的原因。3.2 正交设计的方差分析是利用一系列规格化的正交表来科学地安排多因素试验的一种十分有效的设计方法。其原理是从各因素各水平的全搭配中选择一部分必不可少的搭配进行试验,从而大大减少试验次数,又基本不降低研究效率。正交表是已经制作好的规格化的表,可分为同水平的和混合水平的大类。等水平表一般记作形如,其中a表示正交表的行数,即试验的次数;b表示因素的水平数,即每个因素有b个

15、水平;c表示正交表的列数即因素数。所以,正交表用于c个因素,每个因素b个水平的情形,按该表设计共需做a次试验。表4所示为等水平表。表5所示为一个混合正交表,这表示可以安排4个因素,其中一个因素有2水平,另外3个因素有3水平,共需9次试验。表4 正交表试验号 列号1231111212232124221列名ABAB表5 正交表试验号 列号1234111112122231333411235123161312721328221392321之所以选用正交表,是因为它具有如下性质:在任何一列中各水平都出现且出现的次数相等,在任意两列之间各种不同水平的所有可能组合都出现,且出现的次数相等。这就使得部分试验中

16、所有因素的所有水平信息即两两因素间的所有组合信息无一遗漏,且任一因素各水平的试验条件相同,从而能最大限度的反映该因素不同水平对试验指标的影响。在3.1节中讨论了双因素情况下的交互作用,事实上,当有多个因素时,还存在多个因素的交互作用,称为高级交互作用,记作ABC。在正交试验设计中,交互作用一律当作因素看待,这是处理交互作用问题的一条总的原则。在正交表中,一般都为交互作用安排了相应的列,如表4中的的第3列即用于安排交互作用AB,这意味着使用这一正交表时,如果要考察交互作用,则只能考虑两个因素,因为第3列已经被占用了。但和因素不同的是,用于考虑交互作用的列并不影响试验方案及其实施,也就是说不必在试

17、验中刻意安排交互作用,只需计算时按第3列计算即可,而且一个交互作用不一定只占1列,也可能占有多列。因为正交设计中把交互作用看作因素安排到正交表的列中,因此使得方差分析的计算过程更加简单了。设选用正交表进行正交试验,即有c列,每列b个水平,共a个处理组,设每个处理组有r个数据,第i个处理组的第t个数据记为,则全体的均值和第j列第k个水平的均值为,其中,表示第j列中第k个水平出现的次数,表示第i个处理组中第j列的水平是k。由此,总偏差平方和,各列的偏差平方和为 ,其对应的自由度分别为,注意,第j列的偏差平方和可能是因素的偏差平方和,可能是交互作用的偏差平方和,也可能是空列的偏差平方和。如果正交表中

18、留有空列,则令,其中表示空列。在无重复实验的情况下,可把看作是误差的偏差平方和,即,。在有重复实验的情况下,令,即表示各处理组内随机误差的偏差平方和的总和。则在有重复实验时,总体试验误差的偏差平方和,可见,当正交表无空列时,即直接计算各处理组内误差的偏差平方和,将其总和作为总体试验误差的偏差平方和。另外,也可以看出,若正交表无空列,且无重复试验,则方差分析无法开展,因此试验设计时必须保证两者有其一。在计算出偏差平方和与自由度后,即可由各因素和交互作用的平均偏差平方和与误差的平均偏差平方和的比值计算F统计量,从而进行F检验。4. 总结本文主要介绍了方差分析的特点、原理、计算步骤和数学模型。方差分析的主要目的是检验均值间的差别在统计意义上是否显著。这是通过对方差进行分析而完成的,其方法是把总体方差分析成随机误差导致的方差(处理组内的方差)和均值的差别导致的方差,然后用F检验比较这两类方差,以决定是否拒绝 “均值相等”的原假设。和方差分析相关的另一个重要问题是试验设计,本文主要介绍了析因设计和正交设计。前者主要用于因素和水平较少的情况,而后者是效率更高的方法,能够在因素和水平较多时达到较好的分析效果。专心-专注-专业

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁