《第十章方差分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《第十章方差分析精选PPT.ppt(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十章方差分析第1页,此课件共76页哦方差分析及其有关术语第2页,此课件共76页哦什么是方差分析(ANOVA)?(analysis of variance)1.1.检验多个总体均值是否相等检验多个总体均值是否相等检验多个总体均值是否相等检验多个总体均值是否相等通过分析数据的误差判断各总体均值是否相等通过分析数据的误差判断各总体均值是否相等通过分析数据的误差判断各总体均值是否相等通过分析数据的误差判断各总体均值是否相等2.2.研究分类型自变量对数值型因变量的影响研究分类型自变量对数值型因变量的影响研究分类型自变量对数值型因变量的影响研究分类型自变量对数值型因变量的影响 uu一个或多个分类尺度的自
2、变量一个或多个分类尺度的自变量一个或多个分类尺度的自变量一个或多个分类尺度的自变量t t两个或多个两个或多个(k 个个)处理水平或分类处理水平或分类uu一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量3.3.有单因素方差分析和双因素方差分析有单因素方差分析和双因素方差分析有单因素方差分析和双因素方差分析有单因素方差分析和双因素方差分析uu单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量uu双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及
3、两个分类的自变量双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量第3页,此课件共76页哦什么是方差分析?消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数 行业行业观测值观测值零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758【例例例例 】为了对几个行业的服务质量进行评价,消费者协会在四个行业为了对几个行业的服务质量进行评价,消费者协会在四个行业为了对几个行业的服务质量进行评价,消费者协会在四个行业为了
4、对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共分别抽取了不同的企业作为样本。最近一年中消费者对总共分别抽取了不同的企业作为样本。最近一年中消费者对总共分别抽取了不同的企业作为样本。最近一年中消费者对总共2323家企业家企业家企业家企业投投投投诉的次数诉的次数诉的次数诉的次数如下表如下表如下表如下表第4页,此课件共76页哦什么是方差分析?1.1.分分分分析析析析四四四四个个个个行行行行业业业业之之之之间间间间的的的的服服服服务务务务质质质质量量量量是是是是否否否否有有有有显显显显著著著著差差差差异异异异,也也也也就就就就是是是是要要要要判判
5、判判断断断断“行行业业”对对“投投诉诉次次数数”是是否否有有显显著著影影响响2.2.作作出出这这种种判判断断最最终终被被归归结结为为检检验验这这四四个个行行业业被被投投诉诉次数的次数的均值是否相等均值是否相等3.3.若若若若它它它它们们们们的的的的均均均均值值值值相相相相等等等等,则则意意味味着着“行行业业”对对投投诉诉次次数数是是没没有有影影响响的的,即即它它们们之之间间的的服服务务质质量量没没有有显显著著差差异异;若若均均均均值值值值不不不不全全全全相相相相等等等等,则则则则意意意意味味味味着着着着“行行业业”对对投投诉诉次次数数是是有有影影响响的的,它它们们之之间间的的服服务务质质量量有
6、显著差异有显著差异第5页,此课件共76页哦方差分析中的有关术语1.1.因素或因子因素或因子因素或因子因素或因子(factor)(factor)所要检验的对象所要检验的对象所要检验的对象所要检验的对象 要要要要分分分分析析析析行行行行业业业业对对对对投投投投诉诉诉诉次次次次数数数数是是是是否否否否有有有有影影影影响响响响,行行行行业业业业是是是是要要要要检检检检验验验验的的的的因因因因素素素素或或或或因因因因子子子子2.水平或处理水平或处理水平或处理水平或处理(treatment)treatment)因子的不同表现因子的不同表现因子的不同表现因子的不同表现零零零零售售售售业业业业、旅旅旅旅游游游
7、游业业业业、航航航航空空空空公公公公司司司司、家家家家电电电电制制制制造造造造业业业业就就就就是是是是因因因因子子子子的的的的水平水平水平水平3.观察值观察值观察值观察值在每个因素水平下得到的样本数据在每个因素水平下得到的样本数据在每个因素水平下得到的样本数据在每个因素水平下得到的样本数据 每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值第6页,此课件共76页哦方差分析中的有关术语1.1.试验试验试验试验这这这这里里里里只只只只涉涉涉涉及及及及一一一一个个个个因因因因素素素素,因因因因此此此此称称称称为为为为单单单单因因因
8、因素素素素四四四四水水水水平平平平的的的的试试试试验验验验2.2.总体总体总体总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体比比比比如如如如零零零零售售售售业业业业、旅旅旅旅游游游游业业业业、航航航航空空空空公公公公司司司司、家家家家电电电电制制制制造造造造业业业业可可可可以以以以看看看看作是四个总体作是四个总体作是四个总体作是四个总体3.样本数据样本数据样本数据样本数据被被被被投投投投诉诉诉诉次次次次数数数数可可可可以以以以看看看看作作作作是是是是从从从从这这这这四四四四个个个个总总总总体体体体中中
9、中中抽抽抽抽取取取取的的的的样样样样本本本本数数数数据据据据第7页,此课件共76页哦方差分析的基本思想和原理第8页,此课件共76页哦方差分析的基本思想和原理 零售业 旅游业 航空公司 家电制造第9页,此课件共76页哦1.1.从散点图上可以看出从散点图上可以看出从散点图上可以看出从散点图上可以看出uu不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的uu同一个行业,不同企业被投诉的次数也明显不同同一个行业,不同企业被投诉的次数也明显不同同一个行业,不同企业被投诉的次数也明显不同同一个行业,不同企业被投诉的次数也
10、明显不同t t家家家家电电电电制制制制造造造造被被被被投投投投诉诉诉诉的的的的次次次次数数数数较较较较高高高高,航航航航空空空空公公公公司司司司被被被被投投投投诉诉诉诉的次数较低的次数较低的次数较低的次数较低2.2.行业与被投诉次数之间有一定的关系行业与被投诉次数之间有一定的关系uu如如如如果果果果行行行行业业业业与与与与被被被被投投投投诉诉诉诉次次次次数数数数之之之之间间间间没没没没有有有有关关关关系系系系,那那那那么么么么它它它它们们们们被被被被投投投投诉诉诉诉的的的的次次次次数数数数应应应应该该该该差差差差不不不不多多多多相相相相同同同同,在在在在散散散散点点点点图图图图上上上上所所所所
11、呈呈呈呈现的模式也就应该很接近现的模式也就应该很接近现的模式也就应该很接近现的模式也就应该很接近方差分析的基本思想和原理方差分析的基本思想和原理第10页,此课件共76页哦1.1.仅仅仅仅从从从从散散散散点点点点图图图图上上上上观观观观察察察察还还还还不不不不能能能能提提提提供供供供充充充充分分分分的的的的证证证证据据据据证证证证明明明明不不不不同同同同行行行行业业业业被被被被投投投投诉的次数之间有显著差异诉的次数之间有显著差异诉的次数之间有显著差异诉的次数之间有显著差异uu这种差异也可能是由于这种差异也可能是由于这种差异也可能是由于这种差异也可能是由于抽样的随机性抽样的随机性抽样的随机性抽样的
12、随机性所造成的所造成的所造成的所造成的2.2.需需需需要要要要有有有有更更更更准准准准确确确确的的的的方方方方法法法法来来来来检检检检验验验验这这这这种种种种差差差差异异异异是是是是否否否否显显显显著著著著,也也也也就就就就是是是是进进进进行行行行方方方方差差差差分析分析分析分析uu所所所所以以以以叫叫叫叫方方方方差差差差分分分分析析析析,因因因因为为为为虽虽虽虽然然然然我我我我们们们们感感感感兴兴兴兴趣趣趣趣的的的的是是是是均均均均值值值值,但但但但在在在在判判判判断断断断均均均均值之间是否有差异时则需要借助于方差值之间是否有差异时则需要借助于方差值之间是否有差异时则需要借助于方差值之间是否
13、有差异时则需要借助于方差uu这这这这个个个个名名名名字字字字也也也也表表表表示示示示:它它它它是是是是通通通通过过过过对对对对数数数数据据据据误误误误差差差差来来来来源源源源的的的的分分分分析析析析判判判判断断断断不不不不同同同同总总总总体体体体的的的的均均均均值值值值是是是是否否否否相相相相等等等等。因因因因此此此此,进进进进行行行行方方方方差差差差分分分分析析析析时时时时,需需需需要要要要考考考考察察察察数数数数据据据据误误误误差的来源差的来源差的来源差的来源方差分析的基本思想和原理第11页,此课件共76页哦n n1.比较两类误差,以检验均值是否相等比较两类误差,以检验均值是否相等n n2
14、.比较的基础是比较的基础是方差比方差比n n3.如果如果系统系统(处理处理)误差误差明显地不同于随机误明显地不同于随机误差,则均值就是不相等的;反之,均值就是差,则均值就是不相等的;反之,均值就是相等的相等的n n4.误差是由各部分的误差占总误差的比例误差是由各部分的误差占总误差的比例来测度的来测度的方差分析的基本思想和原理第12页,此课件共76页哦方差分析的基本思想和原理(两类误差)1.随机误差随机误差随机误差随机误差因素的因素的同一水平同一水平(总体总体)下,样本各观察值之间的差异下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数是不同的比如,同一行业下不同企业被投诉次数是不同的
15、这种差异可以看成是随机因素的影响,称为这种差异可以看成是随机因素的影响,称为随机误差随机误差随机误差随机误差 2.2.系统误差系统误差系统误差系统误差 因素的因素的不同水平不同水平(不同总体不同总体)下,各观察值之间的差异下,各观察值之间的差异 比如,不同行业之间的被投诉次数之间的差异比如,不同行业之间的被投诉次数之间的差异这这种种差差异异可可能能是是由由于于抽抽样样的的随随机机性性所所造造成成的的,也也可可能能是是由由于于行行业业本本身身所所造造成成的的,后后者者所所形形成成的的误误差差是是由由系系统统性性因因素素造造成成的,称为的,称为系统误差系统误差系统误差系统误差第13页,此课件共76
16、页哦方差分析的基本思想和原理1.1.数据的误差用平方和数据的误差用平方和数据的误差用平方和数据的误差用平方和(sum of squaressum of squares)表示,称为方差表示,称为方差表示,称为方差表示,称为方差2.2.组内方差组内方差组内方差组内方差(within groupswithin groups)因素的同一水平因素的同一水平因素的同一水平因素的同一水平(同一个总体同一个总体同一个总体同一个总体)下样本数据的方差下样本数据的方差下样本数据的方差下样本数据的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差组内
17、方差只包含组内方差只包含组内方差只包含组内方差只包含随机误差随机误差随机误差随机误差3.3.组间方差组间方差组间方差组间方差(between groupsbetween groups)因素的不同水平因素的不同水平因素的不同水平因素的不同水平(不同总体不同总体不同总体不同总体)下各样本之间的方差下各样本之间的方差下各样本之间的方差下各样本之间的方差比如,四个行业被投诉次数之间的方差比如,四个行业被投诉次数之间的方差比如,四个行业被投诉次数之间的方差比如,四个行业被投诉次数之间的方差 组间方差既包括组间方差既包括组间方差既包括组间方差既包括随机误差随机误差随机误差随机误差,也包括,也包括,也包括,
18、也包括系统误差系统误差系统误差系统误差第14页,此课件共76页哦方差分析的基本思想和原理(方差的比较)1.若若若若不不不不同同同同行行行行业业业业对对对对投投投投诉诉诉诉次次次次数数数数没没没没有有有有影影影影响响响响,则则则则组组组组间间间间误误误误差差差差中中中中只只只只包包包包含含含含随随随随机机机机误误误误差差差差,没没没没有有有有系系系系统统统统误误误误差差差差。这这这这时时时时,组组组组间间间间误误误误差差差差与与与与组组组组内内内内误误误误差差差差经经经经过过过过平平平平均均均均后的数值就应该很接近,它们的比值就会接近后的数值就应该很接近,它们的比值就会接近后的数值就应该很接近,
19、它们的比值就会接近后的数值就应该很接近,它们的比值就会接近1 12.2.若若若若不不不不同同同同行行行行业业业业对对对对投投投投诉诉诉诉次次次次数数数数有有有有影影影影响响响响,在在在在组组组组间间间间误误误误差差差差中中中中除除除除了了了了包包包包含含含含随随随随机机机机误误误误差差差差外外外外,还还还还会会会会包包包包含含含含有有有有系系系系统统统统误误误误差差差差,这这这这时时时时组组组组间间间间误误误误差差差差平平平平均均均均后后后后的的的的数数数数值值值值就就就就会会会会大大大大于于于于组组组组内内内内误误误误差平均后的数值,它们之间的比值就会大于差平均后的数值,它们之间的比值就会大
20、于差平均后的数值,它们之间的比值就会大于差平均后的数值,它们之间的比值就会大于1 13.3.当当当当这这这这个个个个比比比比值值值值大大大大到到到到某某某某种种种种程程程程度度度度时时时时,就就就就可可可可以以以以说说说说不不不不同同同同水水水水平平平平之之之之间间间间存存存存在在在在着着着着显显显显著著著著差异,也就是自变量对因变量有影响差异,也就是自变量对因变量有影响差异,也就是自变量对因变量有影响差异,也就是自变量对因变量有影响 判判判判断断断断行行行行业业业业对对对对投投投投诉诉诉诉次次次次数数数数是是是是否否否否有有有有显显显显著著著著影影影影响响响响,实实实实际际际际上上上上也也也
21、也就就就就是是是是检检检检验验验验被被被被投投投投诉诉诉诉次次次次数数数数的的的的差差差差异异异异主主主主要要要要是是是是由由由由于于于于什什什什么么么么原原原原因因因因所所所所引引引引起起起起的的的的。如如如如果果果果这这这这种种种种差差差差异主要是系统误差,说明不同行业对投诉次数有显著影响异主要是系统误差,说明不同行业对投诉次数有显著影响异主要是系统误差,说明不同行业对投诉次数有显著影响异主要是系统误差,说明不同行业对投诉次数有显著影响第15页,此课件共76页哦方差分析的基本假定第16页,此课件共76页哦方差分析的基本假定1.1.每个总体都应服从正态分布每个总体都应服从正态分布每个总体都应
22、服从正态分布每个总体都应服从正态分布对对对对于于于于因因因因素素素素的的的的每每每每一一一一个个个个水水水水平平平平,其其其其观观观观察察察察值值值值是是是是来来来来自自自自服服服服从从从从正正正正态态态态分布总体的简单随机样本分布总体的简单随机样本分布总体的简单随机样本分布总体的简单随机样本比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布2.2.各个总体的方差必须相同各个总体的方差必须相同各个总体的方差必须相同各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的
23、各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等3.3.观察值是独立的观察值是独立的观察值是独立的观察值是独立的比比比比如如如如,每每每每个个个个行行行行业业业业被被被被投投投投诉诉诉诉的的的的次次次次数数数数与与与与其其其其他他他他行行行行业业业业被被被被投投投投诉诉诉诉的的的的次次次次数独立数独立数独立数独立第17页,此课件共76页哦方差分析中的基本假定1.1.在在上上述
24、述假假定定条条件件下下,判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,实实际际上上也也就就是是检检验验具具有有同方差的四个正态总体的均值是否相等2.2.如果四个总体的均值相等,可以期望四个样本的均值也会很接近四个样本的均值越接近,推断四个总体均值相等的证据也就越充分样样本本均均值值越越不不同同,推推断断总总体体均均值值不不同同的的证证据据就就越越充分充分 第18页,此课件共76页哦方差分析中基本假定n n 如果原假设成立,即H0:1=2=3=4uu四个行业被投诉次数的均值都相等uu意味着每个样本都来自均值为、方差为 2的同一正态总体 X XXf(X)f(X)f(X)1 1
25、1 1 2 2 2 2 3 3 3 3 4 4 4 4 第19页,此课件共76页哦方差分析中基本假定n n若备择假设成立,即H1:i(i=1,2,3,4)不全相等uu至少有一个总体的均值是不同的uu四个样本分别来自均值不同的四个正态总体 X X Xf(X)f(X)f(X)3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 第20页,此课件共76页哦问题的一般提法第21页,此课件共76页哦问题的一般提法1.1.设因素有设因素有k k个水平,每个水平的均值分别用个水平,每个水平的均值分别用 1 1,2 2,k k 表示表示2.2.要检验要检验k k个水平个水平(总体总体)的均值是否相等
26、,需要提出如下假设:的均值是否相等,需要提出如下假设:HH0 0:1 1 2 2 k k HH1 1:1 1,2 2,,k k 不全相等不全相等不全相等不全相等3.3.设设 1 1为为零零售售业业被被投投诉诉次次数数的的均均值值,2 2为为旅旅游游业业被被投投诉诉次次数数的的均均值值,3 3为为航航空空公公司司被被投投诉诉次次数数的的均均值值,4 4为为家家电电制制造业造业被投诉次数的均值被投诉次数的均值,提出的假设为提出的假设为HH0 0:1 1 2 2 3 3 4 4 HH1 1:1 1,2 2,3 3,4 4 不全相等不全相等不全相等不全相等第22页,此课件共76页哦方差分析的原理方差分
27、析的原理n n变异的可加性原理变异的可加性原理n n把实验数据的总变异分解为不同来源把实验数据的总变异分解为不同来源的变异的变异,并根据不同来源的变异在总变并根据不同来源的变异在总变异中所占的比重对造成数据变异的原异中所占的比重对造成数据变异的原因作出解释因作出解释.n n变异的统计量是实验数据与平均数的变异的统计量是实验数据与平均数的离差平方和离差平方和(SS)第23页,此课件共76页哦试验设计与方差分析完全随机化完全随机化设计设计因子因子设计设计试验设计试验设计随机化随机化区组设计区组设计可重复双因素可重复双因素方差分析方差分析单因素单因素方差分析方差分析无重复双因素无重复双因素方差分析方
28、差分析第24页,此课件共76页哦完全随机化设计n n【例例例例】一一家家种种业业开开发发股股份份公公司司研研究究出出3 3个个新新的的小小麦麦品品种种:品品种种1 1、品品种种2 2、品品种种3 3。为为研研究究不不同同品品种种对对产产量量的的影影响响,需需要要选选择择一一些些地地块块,在在每每个个地地块块种种上上不不同同品品种种的的小小麦麦,然然后后获获得得产产量量数数据据进进行分析。这一过程就是试验设计的过程行分析。这一过程就是试验设计的过程 uu这这里里的的“小小麦麦品品种种”就就是是试试验验因因子子或或因因素素,品品种种1 1、品品种种2 2、品种品种3 3就是因子的就是因子的3 3个
29、不同水平,称为个不同水平,称为处理处理处理处理uu假假定定选选取取3 3个个面面积积相相同同的的地地块块,这这里里的的“地地块块”就就是是接接受处理的对象或实体,称为受处理的对象或实体,称为试验单元试验单元试验单元试验单元uu将将每每个个品品种种随随机机地地指指派派给给其其中中的的一一个个地地块块,这这一一过过程程就就是随机化设计过程是随机化设计过程第25页,此课件共76页哦完全随机化设计(completely randomized design)1.1.“处理处理”被随机地指派给试验单元的一种设计uu“处理”是指可控制的因素的各个水平uu“试试验验单单元元(experiment experi
30、ment unitunit)”是接受“处理”的的对对象或实体象或实体2.2.在在试试验验性性研研究究中中,感感兴兴趣趣的的变变量量是是明明确确规规定定的的,因因此此,研研究究中中的的一一个个或或多多个个因因素素可可以以被被控控制制,使使得得数数据据可可以以按按照因素如何影响变量来获取照因素如何影响变量来获取3.3.对完全随机化设计的数据采用单因素方差分析单因素方差分析第26页,此课件共76页哦n n基本方法基本方法基本方法基本方法:把被试随机分配给自变量的各个水平把被试随机分配给自变量的各个水平把被试随机分配给自变量的各个水平把被试随机分配给自变量的各个水平,每个被每个被每个被每个被试只接受一
31、个水平的处理试只接受一个水平的处理试只接受一个水平的处理试只接受一个水平的处理.n n 只有一个实验因素只有一个实验因素只有一个实验因素只有一个实验因素(自变量自变量自变量自变量),),处于处于处于处于 的水平的水平的水平的水平.n n控制误差变异的方法控制误差变异的方法控制误差变异的方法控制误差变异的方法:随机化分配随机化分配随机化分配随机化分配(被实随机化分配被实随机化分配被实随机化分配被实随机化分配,被试间的被试间的被试间的被试间的变异也是随机分配变异也是随机分配变异也是随机分配变异也是随机分配,在统计上无差异在统计上无差异在统计上无差异在统计上无差异)n n设计模型设计模型设计模型设计
32、模型:n n表示表示表示表示:被试在某个处理水平上的分数被试在某个处理水平上的分数被试在某个处理水平上的分数被试在某个处理水平上的分数,等于总体平均数等于总体平均数等于总体平均数等于总体平均数(真真真真值值值值),),该水平上的处理效应和误差效应之和该水平上的处理效应和误差效应之和该水平上的处理效应和误差效应之和该水平上的处理效应和误差效应之和.n n其中其中其中其中:误差值是个正态分布的随机变量误差值是个正态分布的随机变量误差值是个正态分布的随机变量误差值是个正态分布的随机变量第27页,此课件共76页哦单因素方差分析的数据结构(one-way analysis of variance)观察值
33、观察值观察值观察值 (j j)因素因素因素因素(A A)i i 水平水平水平水平A A1 1 水平水平水平水平A A2 2 水平水平水平水平A Ak k12:n x11 x21 xk1 x12 x22 xk2 :x1n x2n xkn第28页,此课件共76页哦 分析步骤分析步骤提出假设提出假设构造检验统计量构造检验统计量计算统计量计算统计量(平方和平方和,自由度自由度,均方均方,F比值比值)作决策作决策列方差分析表列方差分析表第29页,此课件共76页哦提出假设1.1.一般提法H0:1=2=k 自变量对因变量没有显著影响 H1:1,2,k不全相等(或至少有一对不相等)自变量对因变量有显著影响 2
34、.2.注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 第30页,此课件共76页哦构造检验的统计量n n构造统计量需要计算n各水平的均值()n全部观察值的总均值()n误差平方和(SS)n均方(MS)第31页,此课件共76页哦构造检验的统计量(计算水平的均值)1.假定从第i个总体中抽取一个容量为n ni i的简单随机样本,第i个个总总体体的的样样本本均均值值为为该该样样本本的的全全部部观观察值总和除以观察值的个数察值总和除以观察值的个数2.计算公式为计算公式为 式中:式中:n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xij ij
35、 为第为第 i i 个总体的第个总体的第 j j 个观察值个观察值 第32页,此课件共76页哦构造检验的统计量(计算全部观察值的总均值)1.全部观察值的总和除以观察值的总个数2.计算公式为 第33页,此课件共76页哦构造检验的统计量第34页,此课件共76页哦构造检验的统计量(计算总误差平方和 SST)1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况3.其计算公式为 前例的计算结果:前例的计算结果:SST SST=(57-47.869565)=(57-47.869565)2 2+(58-47.869565)(58-47.869565)2 2 =115.9295 =115.92
36、95第35页,此课件共76页哦构造检验的统计量(计算水平项平方和 SSB)1.各组平均值 与总平均值 的离差平方和2.反映各总体的样本均值之间的差异程度,又称组间平方和3.该平方和既包括随机误差,也包括系统误差4.计算公式为 前例的计算结果:SSB=1456.608696=1456.608696第36页,此课件共76页哦构造检验的统计量(计算误差项平方和 SSw)1.每个水平或组的各样本数据与其组平均值的离差平方和2.反映每个样本各观察值的离散状况,又称组内平方和3.该平方和反映的是随机误差的大小4.计算公式为 前例的计算结果:前例的计算结果:SSWSSW=2708=2708第37页,此课件共
37、76页哦构造检验的统计量(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSW)、水平项离差平方和(SSB)之间的关系SST=SSB+SSW 前例的计算结果:前例的计算结果:4164.608696=1456.608696+2708 4164.608696=1456.608696+2708 第38页,此课件共76页哦构造检验的统计量(三个平方和的作用)1.1.SSTSST反反映映全全部部数数据据总总的的误误差差程程度度;SSWSSW反反映映随随机机误误差差的的大大小小;SSBSSB反反映随机误差和系统误差的大小映随机误差和系统误差的大小2.2.如如果果原原假假设设成成立立,则则表表
38、明明没没有有系系统统误误差差,组组间间平平方方和和SSASSA除除以以自自由由度度后后的的均均均均方方方方与与组组内内平平方方和和SSESSE和和除除以以自自由由度度后后的的均均均均方方方方差差异异就就不不会会太太大大;如如果果组组组组间间间间均均均均方方方方显显著著地地大大于于组组组组内内内内均均均均方方方方,说说明明各各水水平平(总总体体)之之间间的的差异不仅有随机误差,还有系统误差差异不仅有随机误差,还有系统误差3.判判断断因因素素的的水水平平是是否否对对其其观观察察值值有有影影响响,实实际际上上就就是是比比较较组组组组间间间间方差方差方差方差与与组内方差组内方差组内方差组内方差之间差异
39、的大小之间差异的大小 SSt SSt:总体平方和:总体平方和 SSBSSB:组间平方和(处理平方和):组间平方和(处理平方和)SSWSSW:组内平方和:组内平方和第39页,此课件共76页哦构造检验的统计量(计算均方MS)1.各各误误差差平平方方和和的的大大小小与与观观察察值值的的多多少少有有关关,为为消消除除观观察察值值多多少少对对误误差差平平方方和和大大小小的的影影响响,需需要要将将其其平平均均,这这就就是是均方均方均方均方,也称为方差,也称为方差2.计算方法是用误差平方和除以相应的自由度计算方法是用误差平方和除以相应的自由度3.三个平方和对应的自由度分别是三个平方和对应的自由度分别是SST
40、 SST 的自由度为的自由度为n n-1-1,其中,其中n n为全部观察值的个数为全部观察值的个数SSBSSB的自由度为的自由度为k k-1-1,其中,其中k k为因素水平为因素水平(总体总体)的个数的个数SSW SSW 的自由度为的自由度为n n-k k第40页,此课件共76页哦构造检验的统计量(计算均方 MS)1.组间方差组间方差:SSB的均方,记为的均方,记为MSB,计算公式为,计算公式为2.组组组组内内内内方方方方差差差差:SSW的均方,记为MSW,计计算算公公式式为为第41页,此课件共76页哦构造检验的统计量(计算检验统计量 F)1.将MSB和和MSWMSW进行对比,即得到所需要的检
41、验统计量F2.当当H0为真时,二者的比值服从分子自由度为k k-1、分母自由度为 n n-k k 的 F 分布,即 第42页,此课件共76页哦构造检验的统计量(F分布与拒绝域)如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,F FF=MSAMSAMSA/MSEMSEMSE1 1 1 F 分布分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F第43页,此课件共76页哦统计决策 将将统统计计量量的的值值F F与与给给定定的的显显著著性性水水平平 的的临临界界值值F F 进进行行比较,作出对原
42、假设比较,作出对原假设H H0 0的决策的决策根根据据给给定定的的显显著著性性水水平平,在在F F分分布布表表中中查查找找与与第第一一自自由由度度dfdf1 1k k-1-1、第第二二自自由由度度dfdf2 2=N N-k k 相相应应的的临临界界值值 F F 若若F F F F ,则则拒拒绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是显著的,所检验的因素对观察值有显著影响是显著的,所检验的因素对观察值有显著影响若若FFFF.01(3,28)=4.57 (6)列方差分析表(略)第52页,此课件共76页哦n n(7)结论:存在显著性差异,拒绝原假设。结合均值,被试做生字密
43、度小的文章的阅读理解能力高于生字密度大的文章。第53页,此课件共76页哦随机化区组设计第54页,此课件共76页哦完全随机化设计n n【例例例例】一一家家种种业业开开发发股股份份公公司司研研究究出出3 3个个新新的的小小麦麦品品种种:品品种种1 1、品品种种2 2、品品种种3 3。为为研研究究不不同同品品种种对对产产量量的的影影响响,需需要要选选择择一一些些地地块块,在在每每个个地地块块种种上上不不同同品品种种的的小小麦麦,然然后后获获得得产产量量数数据进行分析。这一过程就是试验设计的过程据进行分析。这一过程就是试验设计的过程 uu这这里里的的“小小麦麦品品种种”就就是是试试验验因因子子或或因因
44、素素,品品种种1 1、品品种种2 2、品种品种3 3就是因子的就是因子的3 3个不同水平,称为个不同水平,称为处理处理处理处理uu假假定定选选取取3 3个个面面积积相相同同的的地地块块,这这里里的的“地地块块”就就是是接接受受处处理理的对象或实体,称为的对象或实体,称为试验单元试验单元试验单元试验单元uu将将每每个个品品种种随随机机地地指指派派给给其其中中的的一一个个地地块块,这这一一过过程程就就是随机化设计过程是随机化设计过程第55页,此课件共76页哦随机化区组设计(randomized block design)1.1.先按一定规则将试验单元划分为若干同质组,称为先按一定规则将试验单元划分
45、为若干同质组,称为先按一定规则将试验单元划分为若干同质组,称为先按一定规则将试验单元划分为若干同质组,称为“区组区组区组区组”2.2.再将各种处理随机地指派给各个区组再将各种处理随机地指派给各个区组再将各种处理随机地指派给各个区组再将各种处理随机地指派给各个区组uu比比比比如如如如在在在在上上上上面面面面的的的的例例例例子子子子中中中中,首首首首先先先先根根根根据据据据土土土土壤壤壤壤的的的的好好好好坏坏坏坏分分分分成成成成几几几几个个个个区区区区组组组组,假假假假定定定定分分分分成成成成4 4个个个个区区区区组组组组:区区区区组组组组1 1、区区区区组组组组2 2、区区区区组组组组3 3、区
46、区区区组组组组4 4,每每每每个个个个区区区区组组组组中有三个地块中有三个地块中有三个地块中有三个地块uu在在在在每每每每个个个个区区区区组组组组内内内内的的的的3 3个个个个地地地地块块块块以以以以抽抽抽抽签签签签的的的的方方方方式式式式决决决决定定定定所所所所种种种种的的的的小小小小麦麦麦麦品品品品种种种种3.3.分分分分组组组组后后后后再再再再将将将将每每每每个个个个品品品品种种种种(处处处处理理理理)随随随随机机机机地地地地指指指指派派派派给给给给每每每每一一一一个个个个区区区区组组组组的的的的设设设设计计计计就就就就是是是是随机化区组设计随机化区组设计随机化区组设计随机化区组设计第5
47、6页,此课件共76页哦随机化区组设计n n试验数据:试验数据:无重复双因素方差分析无重复双因素方差分析第57页,此课件共76页哦实例实例:完全随机实验设计完全随机实验设计n n探讨文章的生字密度对学探讨文章的生字密度对学探讨文章的生字密度对学探讨文章的生字密度对学生阅读理解的影响生阅读理解的影响生阅读理解的影响生阅读理解的影响n n自变量自变量自变量自变量-生字密度生字密度生字密度生字密度 n n K=4 5:1(aK=4 5:1(a1 1);10:1(a);10:1(a2 2);15:1);15:1(a(a3 3);20:1(a);20:1(a4 4)n n因变量因变量因变量因变量-被试阅读
48、理解测验被试阅读理解测验被试阅读理解测验被试阅读理解测验分数分数分数分数n nN=32N=32人人人人=4=4组组组组*8(8(各水平被各水平被各水平被各水平被试数量可以不等试数量可以不等试数量可以不等试数量可以不等)a1a2 a3a4S1S2 S3S4.S32第58页,此课件共76页哦随机区组实验设计随机区组实验设计n n对对对对3232个学生做个学生做个学生做个学生做智力测智力测智力测智力测试试试试,分成分成分成分成8 8个区组个区组个区组个区组(4(4被试被试被试被试/组组组组 ,同质同质同质同质),),后随机分配后随机分配后随机分配后随机分配每个区组内的每个区组内的每个区组内的每个区组
49、内的4 4个同质个同质个同质个同质被试分别阅读一种生字被试分别阅读一种生字被试分别阅读一种生字被试分别阅读一种生字密度的文章密度的文章密度的文章密度的文章.a1a2a3a4区组区组区组区组1 1S1S2S3S4区组区组区组区组2 2S5S6S7S8.区组区组区组区组8 8.S32把学生的智把学生的智力作为一个力作为一个无关变量无关变量a=8 k=4第59页,此课件共76页哦n n基本方法基本方法基本方法基本方法:将实验对象按一定的标准划分为将实验对象按一定的标准划分为将实验对象按一定的标准划分为将实验对象按一定的标准划分为a a个区组个区组个区组个区组,保证区组同质性保证区组同质性保证区组同质
50、性保证区组同质性(是区组内的实验对象的个别对象尽是区组内的实验对象的个别对象尽是区组内的实验对象的个别对象尽是区组内的实验对象的个别对象尽可能小可能小可能小可能小),),每个区组接受每个区组接受每个区组接受每个区组接受P P个处理个处理个处理个处理,区组内被试和处区组内被试和处区组内被试和处区组内被试和处理的分配是随机的理的分配是随机的理的分配是随机的理的分配是随机的.n n目的:目的:目的:目的:MSAMSA中不但存在抽样误差,还存在人与人中不但存在抽样误差,还存在人与人中不但存在抽样误差,还存在人与人中不但存在抽样误差,还存在人与人之间的差异,即同一组中不同被试的差异;这样之间的差异,即同