《第10章_方差分析与试验设计精选文档.ppt》由会员分享,可在线阅读,更多相关《第10章_方差分析与试验设计精选文档.ppt(101页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第1010章章_ _方差分析与方差分析与试验设计试验设计本讲稿第一页,共一百零一页10.1 方差分析的引论方差分析的引论 10.2 单因素方差分析单因素方差分析10.3 方差分析中的多重比较方差分析中的多重比较10.4 双因素方差分析双因素方差分析10.5 试验设计初步试验设计初步第第 10 章章 方差分析与试验设计方差分析与试验设计本讲稿第二页,共一百零一页学习目标学习目标1.解释方差分析的概念解释方差分析的概念2.解释方差分析的基本思想和原理解释方差分析的基本思想和原理3.掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用4.理解多重比较的意义理解多重比较的意义5.掌握双因素方
2、差分析的方法及应用掌握双因素方差分析的方法及应用6.掌握试验设计的基本原理和方法掌握试验设计的基本原理和方法本讲稿第三页,共一百零一页10.1 方差分析引论方差分析引论一一.方差分析及其有关术语方差分析及其有关术语二二.方差分析的基本思想和原理方差分析的基本思想和原理三三.方差分析的基本假定方差分析的基本假定四四.问题的一般提法问题的一般提法本讲稿第四页,共一百零一页方差分析及其有关术语方差分析及其有关术语本讲稿第五页,共一百零一页什么是方差分析什么是方差分析(ANOVA)?(analysis of variance)1.检验多个总体均值是否相等通过分析察数据的误差判断各总体均值是否相等通过分
3、析察数据的误差判断各总体均值是否相等2.研究分类型自变量对数值型因变量的影响 n n一个或多个分类尺度的自变量一个或多个分类尺度的自变量l l2 2个或多个个或多个 (k k 个个)处理水平或分类处理水平或分类n n一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量3.有单因素方差分析和双因素方差分析n n单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量n n双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量本讲稿第六页,共一百零一页什么是方差分析什么是方差分析?(例题分析例题分析)消费者对四个行业的投诉次数消费者对四个行业的投诉次数 行业观测值
4、零售业旅游业航空公司家电制造业12345675766494034534468392945565131492134404451657758【例例例例】为了对几个行业的服务质量进行评价,消费者协会在四个为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共行业分别抽取了不同的企业作为样本。最近一年中消费者对总共2323家企业投诉的次数如下表家企业投诉的次数如下表本讲稿第七页,共一百零一页什么是方差分析什么是方差分析?(例题分析例题分析)1.分析四个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否有显著影响2.作出这种判断最
5、终被归结为检验这四个行业被投诉次数的均值是否相等3.如果它们的均值相等,就意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;如果均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异本讲稿第八页,共一百零一页方差分析中的有关术语方差分析中的有关术语1.因素或因子(factor)所要检验的对象所要检验的对象要要分分析析行行业业对对投投诉诉次次数数是是否否有有影影响响,行行行行业业业业是是要要检检验验的因素或因子的因素或因子2.水平或处理(treatment)因子的不同表现因子的不同表现零零售售业业、旅旅游游业业、航航空空公公司司、家家电电制制造造业
6、业就就是是因因子子的水平的水平3.观察值在每个因素水平下得到的样本值在每个因素水平下得到的样本值每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值本讲稿第九页,共一百零一页方差分析中的有关术语方差分析中的有关术语1.试验这这里里只只涉涉及及一一个个因因素素,因因此此称称为为单单因因素素四四水水平平的的试试验验2.总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体比比如如零零售售业业、旅旅游游业业、航航空空公公司司、家家电电制制造造业业可可以以看看作作是四个总体是四个总体3.样本数据被投诉次数可以看作是从这四个总体中抽取的样本数据被投诉次数可以看作是从这四个总体中
7、抽取的样本数据本讲稿第十页,共一百零一页方差分析的基本思想和原理方差分析的基本思想和原理本讲稿第十一页,共一百零一页方差分析的基本思想和原理方差分析的基本思想和原理(图形分析图形分析)零售业 旅游业 航空公司 家电制造本讲稿第十二页,共一百零一页1.从散点图上可以看出n n不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的n n即即使是在同一个行业,不同企业被投诉的次数也明显不同使是在同一个行业,不同企业被投诉的次数也明显不同l l家电制造也被投诉的次数较高,航空公司被投诉的次数较低家电制造也被投诉的次数较高,航空公司被投诉的次数较低2.行行业与被投诉次数之间有一定的关系业与
8、被投诉次数之间有一定的关系n n如如果果行行业业与与被被投投诉诉次次数数之之间间没没有有关关系系,那那么么它它们们被被投投诉诉的的次次数数应该差不多相同,在散点图上所呈现的模式也就应该很接近应该差不多相同,在散点图上所呈现的模式也就应该很接近方差分析的基本思想和原理方差分析的基本思想和原理(图形分析图形分析)本讲稿第十三页,共一百零一页1.仅从散点图上观察还不能提供充分的证据证明不同行业被投诉的次数之间有显著差异n n这种差异也可能是由于抽样的随机性所造成的这种差异也可能是由于抽样的随机性所造成的2.需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析n n所所以以叫叫方方差差分分析析
9、,因因为为虽虽然然我我们们感感兴兴趣趣的的是是均均值值,但但在在判判断均值之间是否有差异时则需要借助于方差断均值之间是否有差异时则需要借助于方差n n这这个个名名字字也也表表示示:它它是是通通过过对对数数据据误误差差来来源源的的分分析析判判断断不不同同总总体体的的均均值值是是否否相相等等。因因此此,进进行行方方差差分分析析时时,需要考察数据误差的来源。需要考察数据误差的来源。方差分析的基本思想和原理方差分析的基本思想和原理本讲稿第十四页,共一百零一页1.比较两类误差,以检验均值是否相等2.比较的基础是方差比3.如果系统(处理)误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的4
10、.误差是由各部分的误差占总误差的比例来测度的方差分析的基本思想和原理方差分析的基本思想和原理本讲稿第十五页,共一百零一页方差分析的基本思想和原理方差分析的基本思想和原理(两类误差两类误差)1.随机误差随机误差因素的同一水平因素的同一水平(总体总体)下,样本各观察值之间的差异下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数是不同的比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,称为这种差异可以看成是随机因素的影响,称为随机误差随机误差随机误差随机误差 2.系统误差系统误差因素的不同水平因素的不同水平(不同总体不同总体)下,各观察值之间的差异下,各观察值之间
11、的差异比如,不同行业之间的被投诉次数之间的差异比如,不同行业之间的被投诉次数之间的差异这这种种差差异异可可能能是是由由于于抽抽样样的的随随机机性性所所造造成成的的,也也可可能能是是由由于于行行业业本本身身所所造造成成的的,后后者者所所形形成成的的误误差差是是由由系系统性因素造成的,称为统性因素造成的,称为系统误差系统误差系统误差系统误差本讲稿第十六页,共一百零一页方差分析的基本思想和原理方差分析的基本思想和原理(两类方差两类方差)1.数据的误差用平方和(sum of squares)表示,称为方差2.组内方差(within groups)因素的同一水平因素的同一水平(同一个总体同一个总体)下样
12、本数据的方差下样本数据的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差组内方差只包含组内方差只包含随机误差随机误差随机误差随机误差3.组间方差(between groups)因素的不同水平因素的不同水平(不同总体不同总体)下各样本之间的方差下各样本之间的方差比如,四个行业被投诉次数之间的方差比如,四个行业被投诉次数之间的方差组间方差既包括组间方差既包括随机误差随机误差随机误差随机误差,也包括,也包括系统误差系统误差系统误差系统误差本讲稿第十七页,共一百零一页方差分析的基本思想和原理方差分析的基本思想和原理(方差的比较方差的比较)1.1.若若不不同同不不同同行行业业对对投投诉诉次次
13、数数没没有有影影响响,则则组组间间误误差差中中只只包包含含随随机机误误差差,没没有有系系统统误误差差。这这时时,组组间间误误差差与与组组内内误误差差经经过过平平均均后后的的数数值值就应该很接近,它们的比值就会接近就应该很接近,它们的比值就会接近1 12.2.若若不不同同行行业业对对投投诉诉次次数数有有影影响响,在在组组间间误误差差中中除除了了包包含含随随机机误误差差外外,还还会会包包含含有有系系统统误误差差,这这时时组组间间误误差差平平均均后后的的数数值值就就会会大大于于组组内内误误差平均后的数值,它们之间的比值就会大于差平均后的数值,它们之间的比值就会大于1 13.当当这这个个比比值值大大到
14、到某某种种程程度度时时,就就可可以以说说不不同同水水平平之之间间存存在在着着显著差异,也就是自变量对因变量有影响显著差异,也就是自变量对因变量有影响 判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,实实际际上上也也就就是是检检验验被被投投诉诉次次数数的的差差异异主主要要是是由由于于什什么么原原因因所所引引起起的的。如如果果这这种种差差异异主主要要是是系系统统误误差差,说明不同行业对投诉次数有显著影响说明不同行业对投诉次数有显著影响本讲稿第十八页,共一百零一页方差分析的基本假定方差分析的基本假定本讲稿第十九页,共一百零一页方差分析的基本假定方差分析的基本假定1.每个总体都应服从
15、正态分布对对于于因因素素的的每每一一个个水水平平,其其观观察察值值是是来来自自服服从从正正态态分分布总体的简单随机样本布总体的简单随机样本比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布2.各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等3.观察值是独立的比比如如,每每个个行行业业被被投投诉诉的的次次数数与与其其他他行行业业被被投投诉诉的的次次数独立数独立本讲稿第二十页,共一百零一页方差分析中的基本假定方差分析中的基本假定1.在上
16、述假定条件下,判断行业对投诉次数是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等2.如果四个总体的均值相等,可以期望四个样本的均值也会很接近四四个个样样本本的的均均值值越越接接近近,推推断断四四个个总总体体均均值值相相等等的的证据也就越充分证据也就越充分样本均值越不同,推断总体均值不同的证据就越充分样本均值越不同,推断总体均值不同的证据就越充分 本讲稿第二十一页,共一百零一页方差分析中基本假定方差分析中基本假定 如果原假设成立,即H0:1=2=3=4n n四个行业被投诉次数的均值都相等四个行业被投诉次数的均值都相等n n意味着意味着每个样本都来自均值为每个样本都来自均值为
17、、差为、差为 2 2的同一正的同一正态总体态总体 X X Xf(X)f(X)f(X)1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 本讲稿第二十二页,共一百零一页方差分析中基本假定方差分析中基本假定若备择假设成立,即H1:i(i=1,2,3,4)不全相等n n至少有一个总体的均值是不同的至少有一个总体的均值是不同的n n四个样本分别来自均值不同的四个正态总体四个样本分别来自均值不同的四个正态总体 X X Xf(X)f(X)f(X)3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 本讲稿第二十三页,共一百零一页问题的一般提法问题的一般提法本讲稿第二十四页,共一百零一
18、页问题的一般提法问题的一般提法1.1.设设因因素素有有k k个个水水平平,每每个个水水平平的的均均值值分分别别用用 1 1、2 2、k k 表表示示2.2.要要检检验验k k个个水水平平(总总体体)的的均均值值是是否否相相等等,需需要要提提出出如如下下假假设:设:H H0 0:1 1 2 2 k k H H1 1:1 1,2 2,,k k 不全相等不全相等不全相等不全相等3.3.设设 1 1为为零零售售业业被被投投诉诉次次数数的的均均值值,2 2为为旅旅游游业业被被投投诉诉次次数数的的均均值值,3 3为为航航空空公公司司被被投投诉诉次次数数的的均均值值,4 4为为家家电电制制造业造业被投诉次数
19、的均值被投诉次数的均值,提出的假设为提出的假设为 H H0 0:1 1 2 2 3 3 4 4 H H1 1:1 1,2 2,3 3,4 4 不全相等不全相等不全相等不全相等本讲稿第二十五页,共一百零一页10.2 单因素方差分析单因素方差分析一一.数据结构数据结构二二.分析步骤分析步骤三三.关系强度的测量关系强度的测量四四.用用Excel进行方差分析进行方差分析本讲稿第二十六页,共一百零一页单因素方差分析的数据结构单因素方差分析的数据结构(one-way analysis of variance)观察值观察值 (j j)因素因素(A A)i i 水平水平A A1 1 水平水平A A2 2 水平
20、水平A Ak k12:n x11 x21 xk1 x12 x22 xk2 :x1nx2n xkn本讲稿第二十七页,共一百零一页分析步骤分析步骤提出假设提出假设构造检验统计量构造检验统计量统计决策统计决策本讲稿第二十八页,共一百零一页提出假设提出假设1.一般提法H0 0:1 1=2=k k 自变量对因变量没有显著影响自变量对因变量没有显著影响 H H1 1:1,2 ,k不全相等不全相等自变量对因变量有显著影响自变量对因变量有显著影响 2.注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 本讲稿第二十九页,共一百零一页构造检验的统计量构造检验的统计量构造统计量需要计
21、算水平的均值全部观察值的总均值误差平方和均方(MS)本讲稿第三十页,共一百零一页构造检验的统计量构造检验的统计量(计算水平的均值计算水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数2.计算公式为 式中:式中:n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xij ij 为第为第 i i 个总体的第个总体的第 j j 个观察值个观察值 本讲稿第三十一页,共一百零一页构造检验的统计量构造检验的统计量(计算全部观察值的总均值计算全部观察值的总均值)1.全部观察值的总和除以观察值的总个数2.
22、计算公式为 本讲稿第三十二页,共一百零一页构造检验的统计量构造检验的统计量(例题分析例题分析)本讲稿第三十三页,共一百零一页构造检验的统计量构造检验的统计量(计算总误差平方和计算总误差平方和 SST)1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况3.其计算公式为 前例的计算结果:前例的计算结果:SST SST=(57-47.869565)=(57-47.869565)2 2+(58-47.869565)(58-47.869565)2 2 =115.9295 =115.9295本讲稿第三十四页,共一百零一页构造检验的统计量构造检验的统计量(计算水平项平方和计算水平项平方和
23、SSA)1.各组平均值 与总平均值 的离差平方和2.反映各总体的样本均值之间的差异程度,又称组间平方和3.该平方和既包括随机误差,也包括系统误差4.计算公式为 前例的计算结果:前例的计算结果:SSA=1456.608696=1456.608696本讲稿第三十五页,共一百零一页构造检验的统计量构造检验的统计量(计算误差项平方和计算误差项平方和 SSE)1.每个水平或组的各样本数据与其组平均值的离差平方和2.反映每个样本各观察值的离散状况,又称组内平方和3.该平方和反映的是随机误差的大小4.计算公式为 前例的计算结果:前例的计算结果:SSE SSE=2708=2708本讲稿第三十六页,共一百零一页
24、构造检验的统计量构造检验的统计量(三个平方和的关系三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系SST=SSA+SSE 前例的计算结果:前例的计算结果:4164.608696=1456.608696+2708 4164.608696=1456.608696+2708 本讲稿第三十七页,共一百零一页构造检验的统计量构造检验的统计量(三个平方和的作用三个平方和的作用)1.SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小2.如果原假设成立,则表明没有系统误差,组间平方和SSA除以自由度后的均均方方
25、与组内平方和SSE和除以自由度后的均均方方差异就不会太大;如果组组间间均均方方显著地大于组组内内均均方方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差3.判断因素的水平是否对其观察值有影响,实际上就是比较组间方差组间方差与组内方差组内方差之间差异的大小本讲稿第三十八页,共一百零一页构造检验的统计量构造检验的统计量(计算均方计算均方MS)1.各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方均方,也称为方差2.计算方法是用误差平方和除以相应的自由度3.三个平方和对应的自由度分别是SST SST 的的自由度为自由度为n n-1-1,其
26、中,其中n n为全部观察值的个数为全部观察值的个数SSASSA的的自由度为自由度为k k-1-1,其中,其中k k为因素为因素水平水平(总体总体)的的个数个数SSE SSE 的的自由度为自由度为n n-k k本讲稿第三十九页,共一百零一页构造检验的统计量构造检验的统计量(计算均方计算均方 MS)1.组组间间方方差差:SSA的均方,记为MSA,计算公式为2.组内方差组内方差:SSE的均方,记为MSE,计算公式为本讲稿第四十页,共一百零一页构造检验的统计量构造检验的统计量(计算检验统计量计算检验统计量 F)1.将MSA和MSE进行对比,即得到所需要的检验统计量F2.当H0为真时,二者的比值服从分子
27、自由度为k-1、分母自由度为 n-k 的 F 分布,即 本讲稿第四十一页,共一百零一页构造检验的统计量构造检验的统计量(F分布与拒绝域分布与拒绝域)如果均值相等,如果均值相等,如果均值相等,F F F=MSAMSAMSA/MSEMSEMSE1 1 1 F 分布分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不拒绝不拒绝不拒绝不拒绝H H H H0 0 0 0F F本讲稿第四十二页,共一百零一页统计决策统计决策 将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策根根据据给给定定的的显显著著性性水水平平,在在F F分分布布表表中中查查找找与与第第一一自自由度由度df
28、df1 1k k-1-1、第二自由度、第二自由度dfdf2 2=n n-k k 相应的临界值相应的临界值 F F 若若F F F F ,则则拒拒绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是显著的,所检验的因素对观察值有显著影响是显著的,所检验的因素对观察值有显著影响若若FFF F F ,则则拒拒拒拒绝绝绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是是显著的,即所检验的行因素对观察值有显著影响显著的,即所检验的行因素对观察值有显著影响若若F FC C F F ,则则拒拒拒拒绝绝绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间有有显显著差异
29、,即所检验的列因素对观察值有显著影响著差异,即所检验的列因素对观察值有显著影响 本讲稿第七十二页,共一百零一页双因素方差分析表双因素方差分析表(基本结构基本结构)本讲稿第七十三页,共一百零一页双因素方差分析双因素方差分析(例题分析例题分析)提出假设n n对品牌因素提出的假设为对品牌因素提出的假设为lH H0 0:1 1=2 2=3 3=4 4 (品牌对销售量没有影响品牌对销售量没有影响)lH H1 1:i i (i i=1,2,4)=1,2,4)不全相等不全相等 (品牌对销售量有影响品牌对销售量有影响)n n对地区因素提出的假设为对地区因素提出的假设为H H0 0:1 1=2 2=3 3=4
30、4=5 5 (地区地区对销售量没有影响对销售量没有影响)H H1 1:j j (j j=1,2,5)=1,2,5)不全相等不全相等 (地区对销售量有影响地区对销售量有影响)用用Excel进行无重复双因素分析进行无重复双因素分析本讲稿第七十四页,共一百零一页双因素方差分析双因素方差分析(例题分析例题分析)结论:结论:结论:结论:F FR R18.1077718.10777F F 3.49033.4903,拒绝原假设,拒绝原假设H H0 0,说明彩电的品牌,说明彩电的品牌对销售量有显著影响对销售量有显著影响 F FC C2.100846 2.100846 F F 3.25923.2592,不拒绝原
31、假设,不拒绝原假设H H0 0,不能认为销,不能认为销售地区对彩电的销售量有显著影响售地区对彩电的销售量有显著影响本讲稿第七十五页,共一百零一页双因素方差分析双因素方差分析(关系强度的测量关系强度的测量)1.1.行行平平方方和和(行行SSSS)度度量量了了品品牌牌这这个个自自变变量量对对因因变变量量(销销售售量量)的的影影响效应响效应2.2.列列平平方方和和(列列SSSS)度度量量了了地地区区这这个个自自变变量量对对因因变变量量(销销售售量量)的的影响效应影响效应3.3.这两个平方和加在一起则度量了两个自变量对因变量的联合效应这两个平方和加在一起则度量了两个自变量对因变量的联合效应4.4.联合
32、效应与总平方和的比值定义为联合效应与总平方和的比值定义为R R2 25.5.其其平平方方根根R R反反映映了了这这两两个个自自变变量量合合起起来来与与因因变变量量之之间间的的关关系系强度强度 本讲稿第七十六页,共一百零一页双因素方差分析双因素方差分析(关系强度的测量关系强度的测量)例题分析n n品牌因素和地区因素合起来总共解释了销售量差异的83.94%n n其他因素(残残 差差 变变 量量)只解释了销售量差异的16.06%n nR=0.9162,表表明明品品牌牌和和地地区区两两个个因因素素合合起起来来与与销销售售量之间有较强的关系量之间有较强的关系 本讲稿第七十七页,共一百零一页有交互作用的双
33、因素方差分析有交互作用的双因素方差分析(可重复双因素分析可重复双因素分析)本讲稿第七十八页,共一百零一页可重复双因素分析可重复双因素分析(例题例题)【例例例例】城城市市道道路路交交通通管管理理部部门门为为研研究究不不同同的的路路段段和和不不同同的的时时间间段段对对行行车车时时间间的的影影响响,让让一一名名交交通通警警察察分分别别在在两两个个路路段段和和高高峰峰期期与与非非高高峰峰期期亲亲自自驾驾车车进进行行试试验验,通通过过试试验验取取得得共共获获得得2020个个行行车车时时间间(分分钟钟)的的数数据据,如如下下表表。试试分分析析路路段段、时时段段以以及及路路段段和和时时段段的的交交互作用对行
34、车时间的影响互作用对行车时间的影响 本讲稿第七十九页,共一百零一页交互作用的图示交互作用的图示路段与时段对行车时间的影响交互作用交互作用交互作用交互作用无交互作用无交互作用无交互作用无交互作用行车时间行车时间路段路段1 1路段路段2 2高峰期高峰期非高峰期非高峰期行车时间行车时间路段路段1 1路段路段2 2高峰期高峰期非高峰期非高峰期本讲稿第八十页,共一百零一页可重复双因素分析可重复双因素分析(方差分析表的结构方差分析表的结构)本讲稿第八十一页,共一百零一页可重复双因素分析可重复双因素分析(平方和的计算平方和的计算)设:为对应于行因素的第i个水平和列因素的第j个 水平的第l行的观察值 为行因素
35、的第i个水平的样本均值 为列因素的第j个水平的样本均值 对应于行因素的第i个水平和列因素的第j个水 平组合的样本均值 为全部n个观察值的总均值 本讲稿第八十二页,共一百零一页可重复双因素分析可重复双因素分析(平方和的计算平方和的计算)1.1.总平方和:总平方和:2.2.行变量平方和:行变量平方和:3.3.列变量平方和:列变量平方和:4.4.交互作用平方和:交互作用平方和:5.5.误差项平方和:误差项平方和:本讲稿第八十三页,共一百零一页可重复双因素分析可重复双因素分析(Excel计算计算)第第第第1 1步:步:步:步:选择选择“工具工具”下拉菜单,并选择下拉菜单,并选择“数据分析数据分析”选项
36、选项第第第第2 2步:步:步:步:在分析工具中选择在分析工具中选择“素方差分析:可重复双因素分素方差分析:可重复双因素分 析析”,然后选择,然后选择“确定确定”第第第第3 3步:步:步:步:当对话框出现时当对话框出现时 在在“输入区域输入区域”方框内键入方框内键入A1A1:C11C11 在方框内键入在方框内键入0.050.05(可根据需要确定可根据需要确定)在在“每一样本的行数每一样本的行数”方框内键入方框内键入5 5 在在“输出选项输出选项”中选择输出区域中选择输出区域用用Excel进行可重复双因素分析进行可重复双因素分析本讲稿第八十四页,共一百零一页10.5 试验设计初步试验设计初步一一.
37、完全随机化设计完全随机化设计二二.随机化区组设计随机化区组设计三三.因子设计因子设计本讲稿第八十五页,共一百零一页试验设计与方差分析试验设计与方差分析完全随机化完全随机化设计设计因子因子设计设计试验设计试验设计随机化随机化区组设计区组设计可重复双因素可重复双因素方差分析方差分析单因素单因素方差分析方差分析无重复双因素无重复双因素方差分析方差分析本讲稿第八十六页,共一百零一页完全随机化设计完全随机化设计本讲稿第八十七页,共一百零一页完全随机化设计完全随机化设计(completely randomized design)1.“处理”被随机地指派给试验单元的一种设计n n“处理处理”是指可控制的因素
38、的各个水平是指可控制的因素的各个水平n n“试试验验单单元元(experiment experiment unitunit)”是是接接受受“处处理理”的的对对象象或或实体实体2.在试验性研究中,感兴趣的变量是明确规定的,因此,研究中的一个或多个因素可以被控制,使得数据可以按照因素如何影响变量来获取3.对完全随机化设计的数据采用单因素方差分析单因素方差分析本讲稿第八十八页,共一百零一页完全随机化设计完全随机化设计(例例题题分析分析)【例例】一家种业开发股份公司研究出三个新的小麦品种:品种1、品种2、品种3。为研究不同品种对产量的影响,需要选择一些地块,在每个地块种上不同的品种,然后获得产量数据进
39、行分析。这一过程就是试验设计的过程 n n这这里里的的“小小麦麦品品种种”就就是是试试验验因因子子或或因因素素,品品种种1 1、品种品种2 2、品种、品种3 3就是因子的三个不同水平,称为就是因子的三个不同水平,称为处理处理处理处理n n假假定定选选取取3 3个个面面积积相相同同的的地地块块,这这里里的的“地地块块”就就是是接受处理的对象或实体,称为接受处理的对象或实体,称为试验单元试验单元试验单元试验单元n n将将每每个个品品种种随随机机地地指指派派给给其其中中的的一一个个地地块块,这这一一过过程程就是随机化设计过程就是随机化设计过程本讲稿第八十九页,共一百零一页完全随机化设计完全随机化设计
40、(例例题题分析分析)试验数据:试验数据:本讲稿第九十页,共一百零一页完全随机化设计完全随机化设计(例例题题分析分析)方差分析:方差分析:本讲稿第九十一页,共一百零一页随机化区组设计随机化区组设计本讲稿第九十二页,共一百零一页随机化区组设计随机化区组设计(randomized block design)1.先按一定规则将试验单元划分为若干同质组,称为“区组(Block)”2.再将各种处理随机地指派给各个区组n n比比如如在在上上面面的的例例子子中中,首首先先根根据据土土壤壤的的好好坏坏分分成成几几个个区区组组,假假定定分分成成四四个个区区组组:区区组组1 1、区区组组2 2、区区组组3 3、区组
41、区组4 4,每个区组中有三个地块,每个区组中有三个地块n n在在每每个个区区组组内内的的三三个个地地块块以以抽抽签签方方式式决决定定所所种种的的小小麦麦品种品种3.分组后再将每个品种(处理)随机地指派给每一个区组的设计就是随机化区组设计4.试验数据采用无重复双因素方差分析无重复双因素方差分析本讲稿第九十三页,共一百零一页随机化区组设计随机化区组设计(例例题题分析分析)试验数据:试验数据:本讲稿第九十四页,共一百零一页随机化区组设计随机化区组设计(例例题题分析分析)方差分析:方差分析:本讲稿第九十五页,共一百零一页因子设计因子设计本讲稿第九十六页,共一百零一页因子设计因子设计(factorial
42、 design)1.1.感兴趣的因素有两个感兴趣的因素有两个n n如:小麦品种和施肥方式如:小麦品种和施肥方式l l假假定定有有甲甲、乙乙两两种种施施肥肥方方式式,这这样样三三个个小小麦麦品品种种和和两两种种施施肥肥方方式式的的搭搭配配共共有有3 3 2=62=6种种。如如果果我我们们选选择择3030个个地地块块进进行行实实验验,每每一一种种搭搭配配可可以以做做5 5次次试试验验,也也就就是是每每个个品品种种(处处理理)的的样样本本容容量为量为5 5,即相当于每个品种,即相当于每个品种(处理处理)重复做了重复做了5 5次试验次试验2.考考虑虑两两个个因因素素(可可推推广广到到多多个个因因素素)
43、的的搭搭配配试试验验设设计计称称为为因因子子设计设计3.3.该设计主要用于分析两个因素及其交互作用对试验结果的影响该设计主要用于分析两个因素及其交互作用对试验结果的影响4.试验数据采用试验数据采用可重复双因素方差分析可重复双因素方差分析可重复双因素方差分析可重复双因素方差分析本讲稿第九十七页,共一百零一页因子设计因子设计(例例题题分析分析)试验数据:试验数据:本讲稿第九十八页,共一百零一页因子设计因子设计(例例题题分析分析)方差分析:方差分析:本讲稿第九十九页,共一百零一页本章小结本章小结1.方差分析方差分析(ANOVA)的概念的概念2.方差分析的思想和原理方差分析的思想和原理3.素方差分析中的基本假设素方差分析中的基本假设4.单因素方差分析单因素方差分析5.双因素方差分析双因素方差分析6.试验设计试验设计本讲稿第一百页,共一百零一页结结 束束本讲稿第一百零一页,共一百零一页