《第七章 方差分析 (2)PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第七章 方差分析 (2)PPT讲稿.ppt(73页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章 方差分析方差分析第1页,共73页,编辑于2022年,星期一第八章第八章 方差分析方差分析第一节第一节 方差分析的基本问题方差分析的基本问题 第二节第二节 单因素方差分析单因素方差分析第三节第三节 双因素方差分析双因素方差分析第2页,共73页,编辑于2022年,星期一学习目标学习目标1.1.解释方差分析的概念解释方差分析的概念2.2.解释方差分析的基本思想和原理解释方差分析的基本思想和原理2.2.掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用3.3.掌握双因素方差分析的方法及应用掌握双因素方差分析的方法及应用第3页,共73页,编辑于2022年,星期一第一节第一节 方差
2、分析的基本问题方差分析的基本问题一一.方差分析的内容方差分析的内容二二.方差分析的原理方差分析的原理三三.F F 分布分布第4页,共73页,编辑于2022年,星期一什么是方差分析?什么是方差分析?第5页,共73页,编辑于2022年,星期一什么是方差分析什么是方差分析?(概念要点概念要点)1.检验多个总体均值是否相等通过对各观察数据误差来源的分析来判断多个总体均值是否相等2.变量一个定类尺度的自变量2个或多个(k 个)处理水平或分类一个定距或比例尺度的因变量3.用于分析完全随机化试验设计第6页,共73页,编辑于2022年,星期一什么是方差分析什么是方差分析?(一个例子)(一个例子)表8-1 该饮
3、料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例【例【例【例8.18.18.18.1】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色橘黄色、粉色粉色、绿色绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上能影响销售
4、量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见表收集了前一时期该饮料的销售情况,见表8-18-1。试分析饮料的颜色是否对销售量产生。试分析饮料的颜色是否对销售量产生影响。影响。第7页,共73页,编辑于2022年,星期一什么是方差分析什么是方差分析?(例子的进一步分析)(例子的进一步分析)1.检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同2.设 1 1为无色饮料的平均销售量,2 2粉色饮料的平均销售量,3 3为橘黄色饮料的平均销售量,4 4为绿色饮料的平均销售量,也就是检验下面的假设H H0 0:1 1 2 2 3
5、 3 4 4 H H1 1:1 1,2 2,3 3,4 4 不全相等不全相等3.检验上述假设所采用的方法就是方差分析第8页,共73页,编辑于2022年,星期一方差分析的基本思想和原理方差分析的基本思想和原理第9页,共73页,编辑于2022年,星期一方差分析的基本思想和原理方差分析的基本思想和原理(几个基本概念)(几个基本概念)1.因素或因子所要检验的对象称为因子要分析饮料的颜色对销售量是否有影响,颜颜色色是要检验的因素或因子2.水平因素的具体表现称为水平A1、A2、A3、A4四种颜色就是因素的水平3.观察值在每个因素水平下得到的样本值每种颜色饮料的销售量就是观察值第10页,共73页,编辑于20
6、22年,星期一方差分析的基本思想和原理方差分析的基本思想和原理(几个基本概念)(几个基本概念)1.试验这里只涉及一个因素,因此称为单因素四水平的试验2.总体因素的每一个水平可以看作是一个总体比如A1、A2、A3、A4四种颜色可以看作是四个总体3.样本数据上面的数据可以看作是从这四个总体中抽取的样本数据第11页,共73页,编辑于2022年,星期一1.比较两类方差,以检验均值是否相等2.比较的基础是方差比3.如果系统(处理)误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的4.误差是由各部分的误差占总误差的比例来测度的方差分析的基本思想和原理方差分析的基本思想和原理第12页,共73
7、页,编辑于2022年,星期一方差分析的基本思想和原理方差分析的基本思想和原理(两类误差)(两类误差)1.1.随机误差随机误差在因素的同一水平(同一个总体)下,样本的各观察值之间的差异比如,同一种颜色的饮料在不同超市上的销售量是不同的不同超市销售量的差异可以看成是随机因素的影响,或者说是由于抽样的随机性所造成的,称为随机误差随机误差 2.2.系统误差系统误差在因素的不同水平(不同总体)下,各观察值之间的差异比如,同一家超市,不同颜色饮料的销售量也是不同的这种差异可能是由于抽样的随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差系统误差第13页,共73
8、页,编辑于2022年,星期一方差分析的基本思想和原理方差分析的基本思想和原理(两类方差)(两类方差)1.1.组内方差组内方差因素的同一水平(同一个总体)下样本数据的方差比如,无色饮料A1在5家超市销售数量的方差组内方差只包含随机误差随机误差2.2.组间方差组间方差因素的不同水平(不同总体)下各样本之间的方差比如,A1、A2、A3、A4四种颜色饮料销售量之间的方差组间方差既包括随机误差随机误差,也包括系统误差系统误差第14页,共73页,编辑于2022年,星期一方差分析的基本思想和原理方差分析的基本思想和原理(方差的比较)(方差的比较)1.如果不同颜色(水平)对销售量(结果)没有影响,那么在组间方
9、差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近12.如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于13.当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异第15页,共73页,编辑于2022年,星期一方差分析中的基本假定方差分析中的基本假定第16页,共73页,编辑于2022年,星期一方差分析中的基本假定方差分析中的基本假定1.每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本比如,每种颜色饮料的销售量
10、必需服从正态分布2.各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取的比如,四种颜色饮料的销售量的方差都相同3.观察值是独立的比如,每个超市的销售量都与其他超市的销售量独立第17页,共73页,编辑于2022年,星期一方差分析中的基本假定方差分析中的基本假定1.在上述假定条件下,判断颜色对销售量是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等的问题 2.如果四个总体的均值相等,可以期望四个样本的均值也会很接近四个样本的均值越接近,我们推断四个总体均值相等的证据也就越充分样本均值越不同,我们推断总体均值不同的证据就越充分 第18页,共73页,编辑于2022
11、年,星期一方差分析中基本假定方差分析中基本假定 如果原假设成立,即H0:1=2=3=4四种颜色饮料销售的均值都相等没有系统误差 这意味着每个样本都来自均值为、差为2的同一正态总体 X X X XX Xf(X)f(X)f(X)f(X)f(X)f(X)1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 第19页,共73页,编辑于2022年,星期一方差分析中基本假定方差分析中基本假定如果备择假设成立,即H1:i(i=1,2,3,4)不全相等至少有一个总体的均值是不同的有系统误差 这意味着四个样本分别来自均值不同的四个正态总体 X X X XX Xf(X)f(X)f(X)f(X)f(X)f
12、(X)3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 第20页,共73页,编辑于2022年,星期一第二节第二节 单因素方差分析单因素方差分析一一.单因素方差分析的步骤单因素方差分析的步骤二二.方差分析中的多重比较方差分析中的多重比较三三.单因素方差分析中的其他问题单因素方差分析中的其他问题第21页,共73页,编辑于2022年,星期一单因素方差分析的数据结构单因素方差分析的数据结构 观察值(j)因素(A)i 水平A1 水平A2 i 水平Ak12:j:n x11 x21 xk1 x12 x22 xk2 :x1j x2j xij xkj x1nx2n xkn第22页,共73页,编辑于
13、2022年,星期一单因素方差分析的步骤单因素方差分析的步骤提出假设提出假设构造检验统计量构造检验统计量统计推断统计推断第23页,共73页,编辑于2022年,星期一提出假设提出假设1.一般提法H0:1=2=k (因素有k个水平)H1:1,2,k不全相等2.对前面的例子H0:1=2=3=4颜色对销售量没有影响H0:1,2,3,4不全相等颜色对销售量有影响第24页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量1.为检验H0是否成立,需确定检验的统计量 2.构造统计量需要计算水平的均值全部观察值的总均值离差平方和均方(MS)第25页,共73页,编辑于2022年,星期一构造检验的统
14、计量构造检验的统计量(计算水平的均值计算水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数2.计算公式为 式中:式中:n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xij ij 为第为第 i i 个总体的第个总体的第 j j 个观察值个观察值 第26页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算全部观察值的总均值计算全部观察值的总均值)1.全部观察值的总和除以观察值的总个数2.计算公式为 第27页,共73页,编辑于2022年,星期一构造检验的统计量构造检
15、验的统计量(前例计算结果前例计算结果)表8-2 四种颜色饮料的销售量及均值超市(j)水平A(i)无色(A1)粉色(A2)橘黄色(A3)绿色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合计136.6147.8132.2157.3573.9水平均值观察值个数x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5总均值=28.695第28页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算总离差平方和计
16、算总离差平方和 SSTSST1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况3.其计算公式为 前例的计算结果:前例的计算结果:SST SST=(26.5-28.695)=(26.5-28.695)2 2+(28.7-28.695)+(28.7-28.695)2 2+(32.8-28.695)(32.8-28.695)2 2 =115.9295 =115.9295第29页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算误差项平方和计算误差项平方和 SSESSE)1.每个水平或组的各样本数据与其组平均值的离差平方和2.反映每个样本各观察值的离散状况,又
17、称组内离差平方和3.该平方和反映的是随机误差的大小4.计算公式为 前例的计算结果:前例的计算结果:SSE SSE=39.084=39.084第30页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算处理水平项平方和计算处理水平项平方和 SSASSA)1.各组平均值 与总平均值 的离差平方和2.反映各总体的样本均值之间的差异程度,又称组间平方和3.该平方和既包括随机误差,也包括系统误差4.计算公式为 前例的计算结果:前例的计算结果:SSA SSA=76.8455=76.8455第31页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(三个平方和的关系三
18、个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系SST SST=SSE SSE+SSASSA第32页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(三个平方和的作用三个平方和的作用)1.SSTSST反映了全部数据总的误差程度;SSESSE反映了随机误差的大小;SSASSA反映了随机误差和系统误差的大小2.如果原假设成立,即H0:1=2=k为真,则表明没有系统误差,组间平方和SSA除以自由度后的均均方方与组内平方和SSE和除以自由度后的均均方方差异就不会太大;如果组组间间均均方方显著地大于组组内内均均方方,说明各水平(
19、总体)之间的差异不仅有随机误差,还有系统误差3.判断因素的水平是否对其观察值有影响,实际上就是比较组间方差组间方差与组内方差组内方差之间差异的大小4.为检验这种差异,需要构造一个用于检验的统计量第33页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算均方计算均方 MSMS)1.各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影响,需要将其平均,这就是均方,也称为方差2.计算方法是用离差平方和除以相应的自由度3.三个平方和的自由度分别是SST SST 的自由度为n-1,其中n为全部观察值的个数SSASSA的自由度为k-1,其中k为因素水平(总体
20、)的个数SSE SSE 的自由度为第34页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算均方计算均方 MSMS)1.SSA的均方也称组组间间方方差差,记为MSA,计算公式为2.SSE的的均均方方也也称称组组内内方方差差,记为MSEMSE,计算公式为第35页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算检验的统计量计算检验的统计量 F F)1.将MSA和MSE进行对比,即得到所需要的检验统计量F2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即 第36页,共73页,编辑于2022年,星期一构造检验的统
21、计量构造检验的统计量(F F分布与拒绝域分布与拒绝域)如果均值相等,如果均值相等,如果均值相等,F FF=MSAMSAMSA/MSEMSEMSE1 1 1 F F 分布分布F F(k k-1,-1,nknk-k k)0 0 0 0拒绝拒绝拒绝拒绝H H H H0 0 0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F F F第37页,共73页,编辑于2022年,星期一统计推断统计推断 将统计量的值F与给定的显著性水平的临界值F进行比较,作出接受或拒绝原假设H0的决策根据给定的显著性水平,在F分布表中查找与第一自由度df1k-1、第二自由度df2=nk-k 相应的临界值 F
22、 若F F F F ,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响若F FF F ,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响 第38页,共73页,编辑于2022年,星期一单因素方差分析表单因素方差分析表(基本结构基本结构)方差来源平方和SS自由度df均方MSF 值组间(因素影响)组内(误差)总和SSASSESSTk-1nk-knk-1MSAMSEMSAMSEMSEMSEMSE第39页,共73页,编辑于2022年,星期一单因素方差分析单因素方差分析(统计软件的输出结果)(统计软件的输出结果)第40页,共73页,编辑于2022年,星期一
23、单因素方差分析单因素方差分析(一个例子)(一个例子)【例例例例】为为了了对对几几个个行行业业的的服服务务质质量量进进行行评评价价,消消费费者者协协会会在在零零售售业业、旅旅游游业业、航航空空公公司司、家家电电制制造造业业分分别别抽抽取取了了不不同同的的样样本本,其其中中零零售售业业抽抽取取7 7家家,旅旅游游业业抽抽取取了了6 6家家,航航空空公公司司抽抽取取5 5家家、家家电电制制造造业业抽抽取取了了5 5家家,然然后后记记录录了了一一年年中中消消费费者者对对总总共共2323家家服服务务企企业业投投诉诉的的次次数数,结结果果如如表表9.79.7。试试分分析析这这四四个个行行业业的的服服务务质
24、质量量是否有显著差异?是否有显著差异?(0.050.05)第41页,共73页,编辑于2022年,星期一单因素方差分析单因素方差分析(一个例子)(一个例子)消费者对四个行业的投诉次数 观察值(j)行业(A)零售业旅游业航空公司家电制造业123456757554645545347 624960545655 5149485547 7068636960 第42页,共73页,编辑于2022年,星期一单因素方差分析单因素方差分析(计算结果)(计算结果)解:设四个行业被投诉次数的均值分别为,1、2、3、4,则需要检验如下假设 H0:1=2=3=4 (四个行业的服务质量无显著差异)H1:1,2,3,4不全相等
25、 (有显著差异)Excel输出的结果如下 结论:拒绝结论:拒绝H H0 0。四个行业的服务质量有显著差异四个行业的服务质量有显著差异第43页,共73页,编辑于2022年,星期一方差分析中的多重比较方差分析中的多重比较第44页,共73页,编辑于2022年,星期一方差分析中的多重比较方差分析中的多重比较(作用)(作用)1.多重比较是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异2.多重比较方法有多种,这里介绍Fisher提出的最最小小显显著著差差异异方法,简写为LSDLSD,该方法可用于判断到底哪些均值之间有差异3.LSD方法是对检验两个总体均值是否相等的t检验方法的总体方差估计
26、加以修正(用MSE来代替)而得到的 第45页,共73页,编辑于2022年,星期一方差分析中的多重比较方差分析中的多重比较(步骤)(步骤)1.提出假设H0:i=j(第i个总体的均值等于第j个总体的均值)H1:i j(第i个总体的均值不等于第j个总体的均值)2.检验的统计量为 3.3.若若|t t|t t ,拒,拒,拒,拒绝绝绝绝H H0 0 0 0;若若若若|t t|t t t t ,不能拒,不能拒,不能拒,不能拒绝绝绝绝H H0 0第46页,共73页,编辑于2022年,星期一方差分析中的多重比较方差分析中的多重比较1.通过判断样本均值之差的大小来检验 H02.检验的统计量为:x xi i x
27、xj j3.检验的步骤为 提出假设H0:i=j(第i个总体的均值等于第j个总体的均值)H1:i j(第i个总体的均值不等于第j个总体的均值)计算LSD 若若若若|x x x xi i i i-x x x xj j j j|LSDLSDLSDLSD,拒,拒,拒,拒绝绝绝绝H H H H0 0 0 0,若若若若|x x x xi i i i-x x x xj j j j|2.096|=|27.3-29.5|=2.22.096|=|27.3-29.5|=2.22.096|=|27.3-29.5|=2.22.096 颜颜颜颜色色色色1 1 1 1与与与与颜颜颜颜色色色色2 2 2 2的的的的销销销销售
28、量售量售量售量有有有有显显显显著差异著差异著差异著差异|x x x x1 1 1 1-x x x x3 3 3 3|=|27.3-26.4|=0.92.096|=|27.3-26.4|=0.92.096|=|27.3-26.4|=0.92.096|=|27.3-26.4|=0.92.096|=|27.3-31.4|=4.12.096|=|27.3-31.4|=4.12.096|=|27.3-31.4|=4.12.096 颜颜颜颜色色色色1 1 1 1与与与与颜颜颜颜色色色色4 4 4 4的的的的销销销销售量售量售量售量有有有有显显显显著差异著差异著差异著差异|x x x x2 2 2 2-x
29、x x x3 3 3 3|=|29.5-26.4|=3.12.096|=|29.5-26.4|=3.12.096|=|29.5-26.4|=3.12.096|=|29.5-26.4|=3.12.096 颜颜颜颜色色色色2 2 2 2与与与与颜颜颜颜色色色色3 3 3 3的的的的销销销销售量售量售量售量有有有有显显显显著差异著差异著差异著差异|x x x x2 2 2 2-x x x x4 4 4 4|=|29.5-31.4|=1.92.096|=|29.5-31.4|=1.92.096|=|29.5-31.4|=1.92.096|=|29.5-31.4|=1.92.096|=|26.4-31.
30、4|=52.096|=|26.4-31.4|=52.096|=|26.4-31.4|=52.096 颜颜颜颜色色色色3 3 3 3与与与与颜颜颜颜色色色色4 4 4 4的的的的销销销销售量售量售量售量有有有有显显显显著差异著差异著差异著差异第49页,共73页,编辑于2022年,星期一DuncanDuncan(19551955)提提出出了了DuncanDuncan多多范范围围检检验验(Duncan Duncan multiple testmultiple test)。检验方法如下:)。检验方法如下:首先,将需要比较的首先,将需要比较的a a个平均数依次排列好,使个平均数依次排列好,使之之 并将每
31、一对并将每一对 x x 之间的差(范围)列成下表之间的差(范围)列成下表 a a 1 3 2 1 x1 xa x1 xa1 x1 x3 x1 x2 2 x2 xa x2 xa1 x2 x3 a 2 xa2 xa xa2 xa1 a 1 xa1 xa注:表中的注:表中的 x x 均为均为 x x LSRLSR法法第50页,共73页,编辑于2022年,星期一 Duncan Duncan检验与检验与LSDLSD的一个明显不同是的一个明显不同是DuncanDuncan检验中,不同对平均数的差有不同的临界值检验中,不同对平均数的差有不同的临界值R Rk k 。其中其中第51页,共73页,编辑于2022年
32、,星期一第三节 双因素方差分析一一.双因素方差分析的基本问题双因素方差分析的基本问题二二.双因素方差分析的数据结构双因素方差分析的数据结构三三.双因素方差分析的步骤双因素方差分析的步骤四四.一个应用实例一个应用实例第52页,共73页,编辑于2022年,星期一双因素方差分析的基本问题第53页,共73页,编辑于2022年,星期一双因素方差分析双因素方差分析(概念要点)(概念要点)1.分析两个因素(因素A和因素B)对试验结果的影响 2.分别对两个因素进行检验,分析是一个因素在起作用,还是两个因素都起作用,还是两个因素都不起作用3.如果A和B对试验结果的影响是相互独立的,分别判断因素A和因素B对试验指
33、标的影响,这时的双因素方差分析称为无交互作用的双因素方差分析4.如果除了A和B对试验结果的单独影响外,因素A和因素B的搭配还会对销售量产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析 5.对于无交互作用的双因素方差分析,其结果与对每个因素分别进行单因素方差分析的结果相同第54页,共73页,编辑于2022年,星期一双因素方差分析的基本假定双因素方差分析的基本假定1.每个总体都服从正态分布对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本2.各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取的3.观察值是独立的第55页,共73页,编辑于2022年,
34、星期一双因素方差分析的数据结构双因素方差分析的数据结构 因素A(i)因素(B)j 平均值 B1 B2 BrA1A2:Ak x11 x12 x1k x21 x22 x2k :xr1 xr2 xrk :平均值 第56页,共73页,编辑于2022年,星期一双因素方差分析的数据结构双因素方差分析的数据结构 是因素是因素A A的第的第i i个水平下各观察值的平均值个水平下各观察值的平均值 是因素是因素B B的第的第j j个水平下的各观察值的均值个水平下的各观察值的均值 是全部是全部 kr kr 个样本数据的总平均值个样本数据的总平均值第57页,共73页,编辑于2022年,星期一双因素方差分析的步骤第58
35、页,共73页,编辑于2022年,星期一提出假设提出假设1.对因素A提出的假设为H0:1=2=i=k (i为第i个水平的均值)H1:i (i=1,2,k)不全相等2.对因素B提出的假设为H0:1=2=j=r (j为第j个水平的均值)H1:j(j=1,2,r)不全相等第59页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量1.为检验H0是否成立,需确定检验的统计量 2.构造统计量需要计算总离差平方和处理水平项平方和误差项平方和均方 第60页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算总离差平方和计算总离差平方和 SSTSST)1.全部观察值 与总平
36、均值 的离差平方和2.反映全部观察值的离散状况3.计算公式为第61页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算计算SSASSA、SSBSSB和和SSESSE)1.因素A的离差平方和SSASSA2.因素B B的离差平方和SSBSSB3.误差项平方和SSESSE第62页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(各平方和的关系各平方和的关系)总离差平方和(SST)、水平项离差平方和(SSA和SSB)、误差项离差平方和(SSE)之间的关系SST SST=SSASSA+SSBSSB+SSESSE 第63页,共73页,编辑于2022年,星期一构造
37、检验的统计量构造检验的统计量(计算均方计算均方 MSMS)1.各离差平方和的大小与观察值的多少有关,为消除观察值多少对离差平方和大小的影响,需要将其平均,这就是均方,也称为方差2.计算方法是用离差平方和除以相应的自由度3.三个平方和的自由度分别是总离差平方和SST的自由度为 kr-1因素A的离差平方和SSA的自由度为 k-1因素B的离差平方和SSB的自由度为 r-1随机误差平方和SSE的自由度为(k-1)(r-1)第64页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算均方计算均方 MSMS)1.因素A的均方,记为MSA,计算公式为2.因素因素B B的均方,记为的均方
38、,记为MSBMSB ,计算公式为,计算公式为3.随机误差项的均方,记为随机误差项的均方,记为MSEMSE ,计算公式为,计算公式为第65页,共73页,编辑于2022年,星期一构造检验的统计量构造检验的统计量(计算检验的统计量计算检验的统计量 F F)1.为检验因素A的影响是否显著,采用下面的统计量 2.为为检检验验因因素素B B的影响是否显著,采用下面的统计量 第66页,共73页,编辑于2022年,星期一统计推断统计推断 将统计量的值F与给定的显著性水平的临界值F进行比较,作出接受或拒绝原假设H0的决策根据给定的显著性水平在F分布表中查找相应的临界值 F 若FA F,则拒绝原假设H0,表明均值
39、之间的差异是显著的,即所检验的因素(A)对观察值有显著影响若FB F,则拒绝原假设H0,表明均值之间有显著差异,即所检验的因素(B)对观察值有显著影响 第67页,共73页,编辑于2022年,星期一双因素方差分析表双因素方差分析表(基本结构基本结构)方差来源平方和SS自由度df均方MSF值 因素A 因素B误差总和SSASSBSSESSTk-1r-1(k-1)(r-1)kr-1MSAMSBMSEFAFB第68页,共73页,编辑于2022年,星期一双因素方差分析双因素方差分析 不同品牌的彩电在各地区的销售量数据 品牌(因素A)销售地区(因素B)B1B2B3B4B5A1A2A3A43653453582
40、88 350368323280 343363353298 340330343260 323333308298【例例例例】有有四四个个品品牌牌的的彩彩电电在在五五个个地地区区销销售售,为为分分析析彩彩电电的的品品牌牌(因因素素A A)和和销销售售地地区区(因因素素B B)对对销销售售量量是是否否有有影影响响,对对每每个个品品牌牌在在各各地地区区的的销销售售量量取取得得以以下下数数据据,见见下下表表。试试分分析析品品牌牌和和销销售售地地区区对对彩彩电的销售量是否有显著影响?电的销售量是否有显著影响?第69页,共73页,编辑于2022年,星期一双因素方差分析双因素方差分析(提出假设)(提出假设)1.
41、对因素A提出的假设为H0:1=2=3=4 (品牌对销售量没有影响)H1:i (i=1,2,4)不全相等 (品牌对销售量有影响)2.对因素B提出的假设为H0:1=2=3=4=5 (地区对销售量没有影响)H1:j(j=1,2,5)不全相等 (地区对销售量有影响)第70页,共73页,编辑于2022年,星期一双因素方差分析双因素方差分析(Excel Excel 输出的结果)输出的结果)结论:结论:结论:结论:F FA A18.1077718.10777F F 3.49033.4903,拒绝原假设,拒绝原假设H H0 0,说明彩电的品,说明彩电的品牌对销售量有显著影响牌对销售量有显著影响 F FB B2.100846 2.100846 F F 3.25923.2592,接受原假设,接受原假设H H0 0,说明销售地区,说明销售地区对彩电的销售量没有显著影响对彩电的销售量没有显著影响第71页,共73页,编辑于2022年,星期一本章小结本章小结1.1.方差分析方差分析(ANOVA)(ANOVA)的概念的概念2.2.方差分析的思想和原理方差分析的思想和原理3.3.方差分析中的基本假设方差分析中的基本假设4.4.用用ExcelExcel进行方差分析进行方差分析第72页,共73页,编辑于2022年,星期一结结 束束第73页,共73页,编辑于2022年,星期一