第八章方差分析教案.doc

上传人:创****公 文档编号:48730484 上传时间:2022-10-06 格式:DOC 页数:14 大小:291KB
返回 下载 相关 举报
第八章方差分析教案.doc_第1页
第1页 / 共14页
第八章方差分析教案.doc_第2页
第2页 / 共14页
点击查看更多>>
资源描述

《第八章方差分析教案.doc》由会员分享,可在线阅读,更多相关《第八章方差分析教案.doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第八章 方差分析教学目的使学生掌握单因子及二因子(包括无交互作用有交互作用的情形)方差分析的推断法,并能将其应用于教育与心理学等领域。一、方差分析的基本原理在工农业生产及科学研究中,影响产品质量与产量(或研究结果)的因素一般较多,例如影响农作物产量的因素就有种子品种,肥料、雨水等。影响儿童识记效果的因素有教学材料、教学法等。为了找出影响结果(效果)最显著的因素,并指出它们在什么状态下对结果最有利,就要先做些试验,然后对测试的数据进行统计推断,方差分析就是对实测数据进行统计推断的一种方法。方差分析中,常称上述的因素为因子,用A、B、C等表示因素在试验中所处的不同情况或状态称为水平,例如因子A的r

2、个不同水平表为A1,A2,Ar。下面以一简例说明方差分析的原理。例8.1 从小学入学新生中随机抽取20名学生作数学试验,将儿童均分为四组,分别用四种汉字识字教学法进行教学,一段时间后对他们进行统一测验,成绩如下:教 法A1A2A3A4学生成绩yij7482707680888085838480737076827674807382希望通过试验数据推断:不同教学法的教学效果是否有显著差异?在上例中,只考虑了教学法这一个因子(记为A)对教学效果的影响,四种不同的教学法就是该因子的四个不同水平(分别记为A1,A2,A3,A4)。从表中数据看出,即使同一教学法下,由于随机因素(学生个体差异,随机误差等)的

3、影响,学生成绩也不同因而有:(1)学生测试成绩是随机变量;(2)应把同一教学法(同一水平)得到的测验成绩看作同一母体抽得的子样,不同教学法下的测试成绩视为不同母体下抽得的子样,故表中数据应看成从四个母体y1,y2,y3,y4中分别抽了容量为5的子样的观测值判断教学法对测试成绩是否有显著影响的的问题,就是要辨别测试成绩之间的差异主要是由随机误差造成的,还是由不同教学法造成的,这一问题可归结为四个母体是否有相同分布的讨论。由于在实际中有充分的理由认为测试成绩服从正态分布,且在安排试验时,除所关心的因子(这儿是教学法)外,其它试验条件总是尽可能做到一致,这就使我们可以认为每个母体的方差相同,即例8.

4、1中 yiN(i,2) i=1,2,3,4,因此,推断几个母体是否具有相同分布的问题就简化为:检验几个具有相同方差的正态母体是否均值相等的问题,即只需检验H0:1=2=3=4 (8.1)象这类检验若干同方差的正态母体均值是否相等的一种统计分析方法称为方差分析。在实际问题中,影响母体均值的因素可能不止一个,按试验中因子的个数,称为单因子方差分析、二因子方差分析、多因子方差分析等。我们先介绍单因子方差分析,再讨论二因子方差分析,至于多因子方差分析与二因子的类似。二、单因子方差分析:单因子方差分析模型如下: yij=i+ij i=1,2,r; j=1,2,t (8.2) ijN(0,2)这里yi看成

5、第i个水平下的试验结果,yiN(i, 2),在Ai水平下做了t次试验,获得t个数据yij (i=1,t)需检验假设:H0:1=2=r (8.3)现把参数形式改变一下:记 我们称为一般平均,i为因子A的第i个水平的效应,r个效应满足关系式: 于是单因子方差分析模型(8.2)可改写成 (8.4)所要检验的假设(8.3)可改写为H0:1=2=r=0 (8.5)需指出的是在模型(8.4)或(8.2)中,观察到的是yij,而ij是观察不到的,通常称ij为随机误差或随机干扰。下面就来讨论(8.5)的检验我们首先分析引起yij波动的原因,有如下两个 H0为真,波动由随机误差引起引起yij的波动H0不真导致今

6、后我们的yij视情况不同可以表示随机变量,也可以表示观测数据,下面就从分解平方和入手,找出反映上述两个原因的量来,为此先引入 (8.6) (8.7)称是从第i个母体抽得的子样的平均,常称为组平均值,而 称为样本总平均值,我们称 (8.8)为总偏差平方和。由于有 ,i=1,r所以故总偏差平方和有如下分解式 (8.9)其中 (8.10)称为误差的偏差平方和,它反映了观察yij时,抽样误差的大小程度 (8.11)称为因子A的偏差平方和,在(8.5)所示H0为真时,它反映误差的波动,在H0不真时,它反映因子A的不同水平效应间的偏差。下面我们分别计算它们的数学期望 (8.12)所以 (8.13)由(8.

7、12)知,为2 的无偏估计,而当(8.5)为真时,也是2的无偏估计故统计量 (8.14)在假设(8.5)为真时接近1,而(8.5)不真时有偏大的趋势,我们取F作(8.5)的检验统计量,下面就来推导其分布,先看一个重要的定理。定理8.1(柯赫伦定理)设x1,x2,xn为n个独立同服从N(0.1)分布的随机变量,又设Q=Q1+Q2+QK=为变量,其中Qi(i=1,k)是秩为fi的关于x1,xn的非负二次型,则Qi(i=1k)相互独立,且分别服从自由度为fi的分布的充要条件是证:(见教材P378P379)有了上面的定理,我们便可推出(8.14)所示的F-统计量的分布。事实上,当(8.5)所示 H。为

8、真时有1=2=r=0由(8.4)式知一切yijN(,2)且相互独立,即所有yij (i=1r j=1t)可以看作取自正态N(,2)母体的容量为n=rt的子样,而yij -N(0,2)由 上式左边是n个N(0.1)变量的平方和,右边显然是yij的三个非负二次型,Q3的秩显然为1。因 含有r个线性关系故Se从而Q1的秩为n-r因 包含一个线性关系所以SA从而Q2的秩为(r-1)。由于Q1,Q2,Q3三个非负二次型的秩满足(n-r)+(r-1)+1=n由柯赫伦定理知:且它们相互独立,从而有(8.14)所示的F统计量H0 (8.15)以(8.15)作为(8.5) H0:1=2=r=0的检验统计量,对任

9、给的水平(0,1)由P(FF1-)= 查F(r-1),(n-)分布表,定出临界值,然后视F统计量的观察值是否大于F1-作出拒绝或接受H。的判断。在具体计算时,Se,SA的计算可简化如下: (8.16)并将上述结果列成一张如教材P380所示的方差分析表例8.1(续)由前述表中数据,r=4,t=5 n=20将计算列表如下:教 法A1 A2 A3 A4Yij 74 88 80 7682 80 73 74 70 85 70 80 76 83 76 78 80 84 82 82Yi382 420 381 390 Yi2145924 176400 145161 152100 , ST=124179-123

10、716.45=462.55SA=619585-123716.45=200.55Se=ST-SA=262从而取检验水平=0.05 查F(3.16)分布表得=3.24 故拒绝H0:1=2=3=4认为在=0.05下,不同教学法对识字效果影响显著。若在因子的每一水平下所进行的试验次数不等,设在第i个水平下重复了ti次,i=1r,上面的结论仍然成立,只是在具体计算时,公式(8.15)可修改为: (8.17)三、二因子方差分析上面我们讨论了单因子试验中的方差分析,但在实际问题中,更多出现的却是多因素试验,往往需要同时研究几种因素对试验结果的影响,比如农业生产中需要同时研究肥料和种子品种对农作物产量的影响。

11、这样的问题就存在两个因子:一个因子是肥料的种类,一个因子是种子的品种。它们两者同时影响着农作物的产量。我们希望通过试验选取使产量达到最高的肥料种类和种子品种。由于有两个因子的影响,就产生一个新问题:不同种类的肥料和不同品种的种子对产量的联合影响不一定是它们分别对产量影响的迭加,也就是说肥料类型和种子品种要搭配得当才能得到最高产量,这类各因子的不同水平的搭配所产生的影响在统计学中称为交互作用。各因子间是否存在交互作用是多因子方差分析中产生的新问题。由于多因子问题复杂,而解决的基本方法又类似,为简单起见,我们仅介绍二因子的方差分析,分两种情况讨论。1、无交互作用的二因子方差分析设在某试验中同时考虑

12、A与B两因子的作用,因子A取r个不同的水平A1,A2,Ar,因子B取S个不同的水平B1,B2,Bs,由于我们在这里只考虑A、B两因子无交互作用的情形,因此对每种不同水平的组合(Ai,Bj)均进行一次独立试验,共得rs个试验结果yij可列成下表形式。B因子B1 B2 BSyi.A因子A1A2.Ary11 y12 y1sy21 y22 y2syr1 yr2 yrsy1.y2.yr.y.jy.1 y.2 y.s这里仍假定yij是独立地取自分布为N(ij,2)的正态母体的子样。为研究问题方便,仍如单因子方差分析一样把参数改变一下,令 显然有在A、B无交互作用的假设下,应有ij=+i+j综上,得如下(无

13、交互作用)的方差分析模型 (8.18)要判断因子A(或B)不同水平的影响是否有显著差异,只须检验下面的假设H01(或H02)H01:1=2=r=0H02:1=2=s=0 (8.19)为检验H01和H02,我们仍如单因子时一样,采用分解平方和的方法,为此先引进如下记号:由(8.18)可知有 (8.20)分解总偏差平方和其中称为误差偏差平方和,它反映了误差的波动 称为因子A的偏差平方和 称为因子B的偏差平方和可计算得 因此在H01和H02为真时,分别是2的无偏估计,为此构造统计量H01真 H02真时 (与单因子时一样,利用柯赫伦定理可以证明FA、FB具有上述F分布),分别作H01和H02的检验统计

14、量,在H01、H02不真时,FA、FB分别有偏大的趋势。对给定的水平,可查分布表分别得()分位点,当值时拒绝H01,当值时拒绝H02。具体计算时,可将分析过程列成如书P387所示的方差分析表例8.2 题略(见书P387)解:用方差分析解决这里的问题检验:H01:因子A对化验结果无显著影响 H02:因子B对化验结果无显著影响这里r=4,s=3,记n=rs=12, 具体计算见下表ABA1 A2 A3 A4y.jy2.jB1B2B33.5 2.6 2.0 1.42.3 2.0 1.5 0.82.0 1.9 1.2 0.39.56.65.490.2543.5629.16yi. 7.8 6.5 4.7

15、2.5 60.84 30.25 22.09 6.25又 由上述计算可得从而 对=0.05,因 查表得 查表得因故拒绝H01,H02认为因子A、B对化验结果都有显著影响2、具有交互效应的二因子方差分析在这种情形下,用前面的记号,因为两因子A与B存在交互效应会有ij+i+j记ij=ij-i-j称它为因子A的第i个水平和因子B的第j个水平的交互效应,其满足关系式:关系式:为了研究交互效应,需对两因子各个水平的组合进行若干次重复的观察,其结果如下表所示因子B因子AB1B2BSA1A2.Ary111,y11ty211,y21t.yr11,yr1ty121,y12ty221,y22t.yr21,yr2ty

16、1s1,y1sty2s1,y2styrs1,yrst这里视(yij1,yijt) i=1r, j=1s, 为取自N(ij,2)母体的简单随机子样,又由各母体间相互独立的假设,故所有yijk相互独立。综上,得有交互作用的二因子方差分析模型为: (8.21)对此模型,除需检验因子A、B对试验结果有无显著影响,即检验H01:1=r=0H02:1=s=0 (8.22)还需检验A、B的交互作用是否对试验结果有显著影响,即H03:ij=0 对一切i=1r, j=1s (8.23)为此,需找出以上这些显著性检验的检验统计量,与前一段的讨论类似,我们需分解平方和,先引入一些记号(见书P387)由(8.21)可

17、知 (8.24)将总偏差平方和作如下分解其中 称为误差偏差平方和(反映了随机误差对试验结果的影响)为因子A引起的偏差平方和(除含有误差波动外,反映因子A对试验结果的影响)称为因子B的偏差平方和 为因子A与B的交互作用的偏差平方和,反映了因子A与B的交互作用对试验结果的影响。我们可以计算出E(Se)=rs(t-1)2, E(SA)=(r-1)2+E(SB)=(s-1)2+ E(SAB)=(r-1)(s-1)2+据此可构造H01,H02,H03的检验统计量分别为FA=FB=FAB=显然,当H01,H02,H03分别不成立时,FA,FB,FAB分别有偏大的趋势由柯赫伦定理可以证明对于给定的显著性水平当观察值时,拒绝H01,否则接受H01当观察值时,拒绝H02,否则接受H02当观察值时,拒绝H03,否则接受H03具体计算过程也可以列成如书P391所示的方差分析表例8.3(见书P391)14

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁