《【南农大--统计学原版课件】(10)第10章 方差分析.ppt》由会员分享,可在线阅读,更多相关《【南农大--统计学原版课件】(10)第10章 方差分析.ppt(82页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、10-1作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)第第10章章 方差分析方差分析作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学10-2作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)10.1 方差分析引论方差分析引论 10.2 单因素方差分析单因素方差分析10.3 双因素方差分析双因素方差分析第第10章章 方差分析方差分析10-3作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)学习目标学习目标1.解释方差分析的概念解释方差分析的概念2.解释方差分析的基本思想和原理
2、解释方差分析的基本思想和原理3.掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用4.理解多重比较的意义理解多重比较的意义5.掌握双因素方差分析的方法及应用掌握双因素方差分析的方法及应用10-4作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)10.1 方差分析引论方差分析引论10.1.1 方差分析及其有关术语方差分析及其有关术语10.1.2 方差分析的基本思想和原理方差分析的基本思想和原理10.1.3 方差分析的基本假定方差分析的基本假定10.1.4 问题的一般提法问题的一般提法10-5作者:贾俊平,中国人民大学统计学院统计学统计学STATISTIC
3、S(第五版第五版)方差分析及其有关术语方差分析及其有关术语10-6作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)什么是方差分析什么是方差分析(ANOVA)?(analysis of variance)1.检验多个总体均值是否相等通过分析数据的误差判断各总体均值是否相等通过分析数据的误差判断各总体均值是否相等2.研究分类型自变量对数值型因变量的影响 n n一个或多个分类型自变量一个或多个分类型自变量l l两个或多个两个或多个 (k k 个个)处理水平或分类处理水平或分类n n一个数值型因变量一个数值型因变量3.有单因素方差分析和双因素方差分析n n单因素方差分
4、析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量n n双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量10-7作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)什么是方差分析什么是方差分析?(例题分析例题分析)消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数 行业行业观测值观测值零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758【例例例例 】为了对几个行业的
5、服务质量进行评价,消费者协会为了对几个行业的服务质量进行评价,消费者协会在在4 4个行业分别抽取了不同的企业作为样本。最近一年中消个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共费者对总共2323家企业投诉的次数如下表家企业投诉的次数如下表10-8作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)什么是方差分析什么是方差分析?(例题分析例题分析)1.分析4个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否有显著影响2.作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等3.若它们的均值相等,则意味着“行业”对投诉次数是
6、没有影响的,即它们之间的服务质量没有显著差异;若均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异10-9作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析中的有关术语方差分析中的有关术语1.因素或因子(factor)所要检验的对象所要检验的对象l l分析行业对投诉次数的影响,分析行业对投诉次数的影响,行业行业行业行业是要检验的因子是要检验的因子2.水平或处理(treatment)因子的不同表现因子的不同表现l l零售业、旅游业、航空公司、家电制造业零售业、旅游业、航空公司、家电制造业3.观察值在每个因素水平下得到的样本数据
7、在每个因素水平下得到的样本数据l l每个行业被投诉的次数每个行业被投诉的次数10-10作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析中的有关术语方差分析中的有关术语1.试验这这里里只只涉涉及及一一个个因因素素,因因此此称称为为单单因因素素4 4水水平平的的试验试验2.总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体l l零售业、旅游业、航空公司、家电制造业是零售业、旅游业、航空公司、家电制造业是4 4个总体个总体3.样本数据被被投投诉诉次次数数可可以以看看作作是是从从这这4 4个个总总体体中中抽抽取取的的样样本数据本数据10-
8、11作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析的基本思想和原理方差分析的基本思想和原理10-12作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析的基本思想和原理方差分析的基本思想和原理(图形分析图形分析散点图散点图)零售业 旅游业 航空公司 家电制造10-13作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.从散点图上可以看出n n不同行业被投诉的次数有明显差异不同行业被投诉的次数有明显差异n n同一个行业,不同企业被投诉的次数也明显不同同一个行业,不同企业被投诉的次数
9、也明显不同l l家家电电制制造造被被投投诉诉的的次次数数较较高高,航航空空公公司司被被投投诉诉的的次次数数较较低低2.行业与被投诉次数之间有一定的关系n n如如果果行行业业与与被被投投诉诉次次数数之之间间没没有有关关系系,那那么么它它们们被被投投诉诉的的次次数数应应该该差差不不多多相相同同,在在散散点点图图上上所所呈呈现现的的模式也就应该很接近模式也就应该很接近方差分析的基本思想和原理方差分析的基本思想和原理(图形分析图形分析)10-14作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.散散点点图图观观察察不不能能提提供供充充分分的的证证据据证证明明不不同同
10、行行业业被被投诉的次数之间有显著差异投诉的次数之间有显著差异n n这种差异可能是由于抽样的随机性所造成的这种差异可能是由于抽样的随机性所造成的2.需需要要有有更更准准确确的的方方法法来来检检验验这这种种差差异异是是否否显显著著,也就是进行方差分析也就是进行方差分析n n所所以以叫叫方方差差分分析析,因因为为虽虽然然我我们们感感兴兴趣趣的的是是均均值值,但在判断均值之间是否有差异时则需要借助于方差但在判断均值之间是否有差异时则需要借助于方差n n这这个个名名字字也也表表示示:它它是是通通过过对对数数据据误误差差来来源源的的分分析析判判断断不不同同总总体体的的均均值值是是否否相相等等。因因此此,进
11、进行行方方差差分分析时,需要考察数据误差的来源析时,需要考察数据误差的来源方差分析的基本思想和原理方差分析的基本思想和原理10-15作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析的基本思想和原理方差分析的基本思想和原理(两类误差两类误差)1.随机误差随机误差随机误差随机误差因素的同一水平因素的同一水平(总体总体)下,样本各观察值之间的差异下,样本各观察值之间的差异l l比如,同一行业下不同企业被投诉次数之间的差异比如,同一行业下不同企业被投诉次数之间的差异这种差异可以看成是随机因素的影响,称为这种差异可以看成是随机因素的影响,称为随机误差随机误差随机
12、误差随机误差 2.系统误差系统误差系统误差系统误差因素的不同水平因素的不同水平(不同总体不同总体)之间观察值的差异之间观察值的差异l l比如,不同行业之间的被投诉次数之间的差异比如,不同行业之间的被投诉次数之间的差异这这种种差差异异可可能能是是由由于于抽抽样样的的随随机机性性所所造造成成的的,也也可可能能是是由由于于行行业业本本身身所所造造成成的的,后后者者所所形形成成的的误误差差是是由由系系统性因素造成的,称为统性因素造成的,称为系统误差系统误差系统误差系统误差10-16作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析的基本思想和原理方差分析的基本思
13、想和原理(误差平方和误差平方和SS)1.数据的误差用平方和(sum of squares)表示2.组内平方和(within groups)因素的同一水平下数据误差的平方和因素的同一水平下数据误差的平方和l l比如,零售业被投诉次数的误差平方和比如,零售业被投诉次数的误差平方和只包含只包含随机误差随机误差随机误差随机误差3.组间平方和(between groups)因素的不同水平之间数据误差的平方和因素的不同水平之间数据误差的平方和l l比如,比如,4 4个行业被投诉次数之间的误差平方和个行业被投诉次数之间的误差平方和既包括既包括随机误差随机误差随机误差随机误差,也包括,也包括系统误差系统误差系
14、统误差系统误差10-17作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析的基本思想和原理方差分析的基本思想和原理(均方均方MS)1.平方和除以相应的自由度平方和除以相应的自由度2.若若原原假假设设成成立立,组组间间均均方方与与组组内内均均方方的的数数值值就就应应该很接近,它们的比值就会接近该很接近,它们的比值就会接近1 13.若若原原假假设设不不成成立立,组组间间均均方方会会大大于于组组内内均均方方,它它们之间的比值就会大于们之间的比值就会大于1 14.当当这这个个比比值值大大到到某某种种程程度度时时,就就可可以以说说不不同同水水平平之间存在着显著差异
15、,即自变量对因变量有影响之间存在着显著差异,即自变量对因变量有影响判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,也也就就是是检检验验被被投投诉诉次次数数的的差差异异主主要要是是由由于于什什么么原原因因所所引引起起的的。如如果果这这种种差差异异主主要要是是系系统统误误差差,说说明明不不同同行行业业对对投投诉诉次次数数有显著影响有显著影响10-18作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析的基本假定方差分析的基本假定10-19作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析的基本假定方差分
16、析的基本假定1.每个总体都应服从正态分布对对于于因因素素的的每每一一个个水水平平,其其观观察察值值是是来来自自服服从从正正态分布总体的简单随机样本态分布总体的简单随机样本比如,每个行业被投诉的次数必须服从正态分布比如,每个行业被投诉的次数必须服从正态分布2.各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的比如,比如,4 4个行业被投诉次数的方差都相等个行业被投诉次数的方差都相等3.观察值是独立的比比如如,每每个个行行业业被被投投诉诉的的次次数数与与其其他他行行业业被被投投诉诉的次数独立的次数独立10-20作者:贾俊平,中国人民大学统计学
17、院统计学统计学STATISTICS(第五版第五版)方差分析中的基本假定方差分析中的基本假定1.在上述假定条件下,判断行业对投诉次数是否有显著影响,实际上也就是检验具有同方差的4个正态总体的均值是否相等2.如果4个总体的均值相等,可以期望4个样本的均值也会很接近4 4个个样样本本的的均均值值越越接接近近,推推断断4 4个个总总体体均均值值相相等等的的证据也就越充分证据也就越充分样样本本均均值值越越不不同同,推推断断总总体体均均值值不不同同的的证证据据就就越越充分充分 10-21作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析中基本假定方差分析中基本假定
18、如果原假设成立,即如果原假设成立,即H H0 0:1 1=2 2=3 3=4 4n n4 4个行业被投诉次数的均值都相等个行业被投诉次数的均值都相等n n意味着意味着每个样本都来自均值为每个样本都来自均值为、方差为、方差为 2 2的同一的同一正态总体正态总体 X X Xf(X)f(X)f(X)1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 10-22作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)方差分析中基本假定方差分析中基本假定若备择假设成立,即若备择假设成立,即H H1 1:i i(i i=1,2,3,4=1,2,3,4)不全相等不全相等
19、n n至少有一个总体的均值是不同的至少有一个总体的均值是不同的n n4 4个样本分别来自均值不同的个样本分别来自均值不同的4 4个正态总体个正态总体 X X Xf(X)f(X)f(X)3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 10-23作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)问题的一般提法问题的一般提法10-24作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)问题的一般提法问题的一般提法1.1.设设因因素素有有k k个个水水平平,每每个个水水平平的的均均值值分分别别用用 1 1,2 2,k k 表
20、示表示2.2.要要检检验验k k个个水水平平(总总体体)的的均均值值是是否否相相等等,需需要要提提出出如如下假设:下假设:H H0 0:1 1 2 2 k k H H1 1:1 1,2 2,,k k 不全相等不全相等不全相等不全相等3.3.设设 1 1为为零零售售业业被被投投诉诉次次数数的的均均值值,2 2为为旅旅游游业业被被投投诉诉次次数数的的均均值值,3 3为为航航空空公公司司被被投投诉诉次次数数的的均均值值,4 4为为家电制造业家电制造业被投诉次数的均值被投诉次数的均值,提出的假设为提出的假设为 H H0 0:1 1 2 2 3 3 4 4 H H1 1:1 1,2 2,3 3,4 4
21、不全相等不全相等不全相等不全相等10-25作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)10.2 单因素方差分析单因素方差分析10.2.1 数据结构数据结构10.2.2 分析步骤分析步骤10.2.3 关系强度的测量关系强度的测量10.2.4 方差分析中的多重比较方差分析中的多重比较10-26作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)单因素方差分析的数据结构单因素方差分析的数据结构(one-way analysis of variance)观察值观察值观察值观察值 (j j)因素因素因素因素(A A)i i 水平水平水平
22、水平A A1 1 水平水平水平水平A A2 2 水平水平水平水平A Ak k12:n x11 x21 xk1 x12 x22 xk2 :x1n x2n xkn10-27作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)分析步骤分析步骤提出假设提出假设构造检验统计量构造检验统计量统计决策统计决策10-28作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)提出假设提出假设1.一般提法H H0 0 :1 1=2 2=k k 自变量对因变量没有显著影响自变量对因变量没有显著影响 H H1 1:1 1 ,2 2 ,k k不不全相等全相等自变
23、量对因变量有显著影响自变量对因变量有显著影响 2.注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 10-29作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量构造统计量需要计算水平的均值全部观察值的总均值误差平方和均方(MS)10-30作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(计算水平的均值计算水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数2.
24、计算公式为 式中:式中:n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xij ij 为为第第 i i 个总体的第个总体的第 j j 个观察值个观察值 10-31作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(计算全部观察值的总均值计算全部观察值的总均值)1.全部观察值的总和除以观察值的总个数2.计算公式为 10-32作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(例题分析例题分析)10-33作者:贾俊平,中国人民大学统计学院统
25、计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(计算总误差平方和计算总误差平方和 SST)1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况3.其计算公式为 前例的计算结果前例的计算结果 SST SST=(57-47.869565)=(57-47.869565)2 2+(58-47.869565)(58-47.869565)2 2 =115.9295 =115.929510-34作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(计算组间平方和计算组间平方和 SSA)1.各各组组平
26、平均均值值 与与总总平平均均值值 的的离离差平方和差平方和2.反映各总体的样本均值之间的差异程度反映各总体的样本均值之间的差异程度3.该平方和既包括随机误差,也包括系统误差该平方和既包括随机误差,也包括系统误差4.计算公式为计算公式为 前例的计算结果前例的计算结果 SSA SSA=1456.608696=1456.60869610-35作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(计算组内平方和计算组内平方和 SSE)1.每每个个水水平平或或组组的的各各样样本本数数据据与与其其组组平平均均值值的的离离差差平方和平方和2.反映
27、每个样本各观察值的离散状况反映每个样本各观察值的离散状况3.该平方和反映的是随机误差的大小该平方和反映的是随机误差的大小4.计算公式为计算公式为 前例的计算结果前例的计算结果 SSE SSE=2708=270810-36作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(三个平方和的关系三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系SST=SSA+SSE 前例的计算结果前例的计算结果 4164.608696=1456.608696+2708 4164.608696=145
28、6.608696+2708 10-37作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(计算均方计算均方MS)1.各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方均方,也称为方差2.由误差平方和除以相应的自由度求得3.三个平方和对应的自由度分别是SST SST 的的自由度为自由度为n n-1-1,其中其中n n为全部观察值的个数为全部观察值的个数SSASSA的的自自由由度度为为k k-1-1,其其中中k k为为因因素素水水平平(总总体体)的的个数个数SSE SSE 的的自由度
29、为自由度为n n-k k10-38作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(计算均方计算均方 MS)1.组组间间方方差差:SSA的均方,记为MSA,计算公式为2.组组内内方方差差:SSE的均方,记为MSE,计算公式为10-39作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(计算检验统计量计算检验统计量 F)1.将MSA和MSE进行对比,即得到所需要的检验统计量F2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即 1
30、0-40作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)构造检验的统计量构造检验的统计量(F分布与拒绝域分布与拒绝域)如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,F F F=MSAMSAMSA/MSEMSEMSE1 1 1 F 分布分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F10-41作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)统计决策统计决策 将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假
31、设H0的决策根根据据给给定定的的显显著著性性水水平平,在在F F分分布布表表中中查查找找与与第第一一自自由由度度dfdf1 1k k-1-1、第第二二自自由由度度dfdf2 2=n n-k k 相相应应的的临界值临界值 F F 若若F F F F ,则则拒拒绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是是显显著著的的,所所检检验验的的因因素素对对观观察察值值有有显显著著影响影响若若FFF F F ,拒拒拒拒绝绝绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是是显显著著的的,即即所所检检验验的的行行因因素素对对观观察察值值有有显显著著影响影响若若F
32、FC C F F ,拒拒拒拒绝绝绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间有有显显著差异,即所检验的列因素对观察值有显著影响著差异,即所检验的列因素对观察值有显著影响 10-70作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)双因素方差分析表双因素方差分析表(基本结构基本结构)误差来源误差来源平方和平方和(SS)自由度自由度(df)均方均方(MS)F值值P值值F临界值临界值行因素行因素SSRSSRk-k-1 1MSRMSRMSRMSRMSEMSE列因素列因素SSCSSCr-1r-1MSCMSCMSCMSCMSEMSE误差误差SSESSE(k-k-
33、1)(1)(r r-1)1)MSEMSE总和总和SSTSSTkr-kr-1 110-71作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)双因素方差分析双因素方差分析(例题分析例题分析)提出假设提出假设n n对品牌因素提出的假设为对品牌因素提出的假设为H H0 0:1 1=2 2=3 3=4 4 (品品牌牌对对销销售售量量无无显显著著影影响响)H H1 1:i i (i i=1,2,4)=1,2,4)不全相等不全相等 (有显著影响有显著影响)n n对地区因素提出的假设为对地区因素提出的假设为H H0 0:1 1=2 2=3 3=4 4=5 5 (地地区区对对销销
34、售售量量无无显显著著影影响响)H H1 1:j j (j j=1,2,5)=1,2,5)不全相等不全相等 (有显著影响有显著影响)10-72作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)双因素方差分析双因素方差分析(例题分析例题分析)结论:结论:结论:结论:F FR R18.1077718.10777F F 3.49033.4903,拒绝原假设拒绝原假设H H0 0,说明彩说明彩电的品牌对销售量有显著影响电的品牌对销售量有显著影响 F FC C2.1008462.100846 F F 3.25923.2592,不拒绝原假设不拒绝原假设H H0 0,无证无证据
35、表明销售地区对彩电的销售量有显著影响据表明销售地区对彩电的销售量有显著影响10-73作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)双因素方差分析双因素方差分析(关系强度的测量关系强度的测量)1.1.行行平平方方和和(SSRSSR)度度量量了了品品牌牌这这个个自自变变量量对对因因变变量量(销销售售量量)的影响效应的影响效应2.2.列列平平方方和和(SSCSSC)度度量量了了地地区区这这个个自自变变量量对对因因变变量量(销销售售量量)的影响效应的影响效应3.3.这这两两个个平平方方和和加加在在一一起起则则度度量量了了两两个个自自变变量量对对因因变变量量的的联联合
36、效应合效应4.4.联合效应与总平方和的比值定义为联合效应与总平方和的比值定义为R R2 25.5.其其平平方方根根R R反反映映了了这这两两个个自自变变量量合合起起来来与与因因变变量量之之间间的的关关系强度系强度 10-74作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)双因素方差分析双因素方差分析(关系强度的测量关系强度的测量)例题分析n n品品牌牌因因素素和和地地区区因因素素合合起起来来总总共共解解释释了了销销售售量差异的量差异的83.94%83.94%n n其其他他因因素素(残残差差变变量量)只只解解释释了了销销售售量量差差异异的的16.06%16.06
37、%n nR R=0.9162=0.9162,表表明明品品牌牌和和地地区区两两个个因因素素合合起起来来与销售量之间有较强的关系与销售量之间有较强的关系 10-75作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)有交互作用的双因素方差分析有交互作用的双因素方差分析(可重复双因素分析可重复双因素分析)10-76作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)可重复双因素分析可重复双因素分析(例题例题)【例例例例】城城市市道道路路交交通通管管理理部部门门为为研研究究不不同同的的路路段段和和不不同同的的时时间间段段对对行行车车时时间间的
38、的影影响响,让让一一名名交交通通警警察察分分别别在在两两个个路路段段和和高高峰峰期期与与非非高高峰峰期期亲亲自自驾驾车车进进行行试试验验,通通过过试试验验共共获获得得2020个个行行车车时时间间(单单位位:min)min)的的数数据据,如如下下表表。试试分分析析路路段段、时段以及路段和时段的交互作用对行车时间的影响时段以及路段和时段的交互作用对行车时间的影响 10-77作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)可重复双因素方差分析表可重复双因素方差分析表(基本结构基本结构)误差来源误差来源平方和平方和(SS)自由度自由度(df)均方均方(MS)F值值P值
39、值F临界值临界值行因素行因素SSRSSRk-k-1 1MSRMSRF FR R列因素列因素SSCSSCr-r-1 1MSCMSCF FC C交互作用交互作用SSRCSSRC(k-k-1)(1)(r r-1)1)MSRCMSRCF FRCRC误差误差SSESSEKrKr(mm-1)-1)MSEMSE总和总和SSTSSTn-n-1 1m为样本的行数为样本的行数10-78作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)可重复双因素分析可重复双因素分析(平方和的计算平方和的计算)设:设:为对应于行因素的第为对应于行因素的第i i个水平和列因素的第个水平和列因素的第j
40、j个个 水平的第水平的第l l行的观察值行的观察值 为行因素的第为行因素的第i i个水平的样本均值个水平的样本均值 为列因素的第为列因素的第j j个水平的样本均值个水平的样本均值 对应于行因素的第对应于行因素的第i i个水平和列因素的第个水平和列因素的第j j个水个水 平组合的样本均值平组合的样本均值 为全部为全部n n个观察值的总均值个观察值的总均值 10-79作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)可重复双因素分析可重复双因素分析(平方和的计算平方和的计算)1.1.总平方和总平方和:2.2.行变量平方和行变量平方和:3.3.列变量平方和列变量平方和
41、:4.4.交互作用平方和:交互作用平方和:5.5.误差项平方和误差项平方和:SST=SSR+SSC+SSRC+SSESST=SSR+SSC+SSRC+SSE10-80作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)可重复双因素分析可重复双因素分析(Excel检验步骤检验步骤)第第第第1 1步:步:步:步:选择选择“工具工具工具工具”下拉菜单,并选择下拉菜单,并选择【数据分析数据分析数据分析数据分析】选项选项第第第第2 2步步步步:在在分分析析工工具具中中选选择择【方方方方差差差差分分分分析析析析:可可可可重重重重复复复复双双双双因因因因素素素素分分分分析析析析
42、】,然后选择然后选择【确定确定】第第第第3 3步:步:步:步:当对话框出现时当对话框出现时 在在【输入区域输入区域】方框内键入数据区域方框内键入数据区域(A1A1:C11)C11)在在【】方框内键入方框内键入0.050.05(可根据需要确定可根据需要确定)在在【每一样本的行数每一样本的行数每一样本的行数每一样本的行数】方框内键入重复试验次数方框内键入重复试验次数(5)5)在在【输出区域输出区域】中选择输出区域中选择输出区域 选择选择【确定确定】10-81作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)本章小结本章小结1.方差分析方差分析(ANOVA)的概念的概念2.方差分析的思想和原理方差分析的思想和原理3.方差分析中的基本假设方差分析中的基本假设4.单因素方差分析单因素方差分析5.双因素方差分析双因素方差分析结结 束束