《第十章方差分析精选文档.ppt》由会员分享,可在线阅读,更多相关《第十章方差分析精选文档.ppt(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十章方差分析本讲稿第一页,共七十六页方差分析及其有关术语本讲稿第二页,共七十六页什么是方差分析(ANOVA)?(analysis of variance)1.1.检验多个总体均值是否相等检验多个总体均值是否相等检验多个总体均值是否相等检验多个总体均值是否相等通过分析数据的误差判断各总体均值是否相等通过分析数据的误差判断各总体均值是否相等通过分析数据的误差判断各总体均值是否相等通过分析数据的误差判断各总体均值是否相等2.2.研究分类型自变量对数值型因变量的影响研究分类型自变量对数值型因变量的影响研究分类型自变量对数值型因变量的影响研究分类型自变量对数值型因变量的影响 uu一个或多个分类尺度的自
2、变量一个或多个分类尺度的自变量一个或多个分类尺度的自变量一个或多个分类尺度的自变量t t两个或多个两个或多个(k 个个)处理水平或分类处理水平或分类uu一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量3.3.有单因素方差分析和双因素方差分析有单因素方差分析和双因素方差分析有单因素方差分析和双因素方差分析有单因素方差分析和双因素方差分析uu单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量uu双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及
3、两个分类的自变量双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量本讲稿第三页,共七十六页什么是方差分析?消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数 行业行业观测值观测值零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758【例例例例 】为了对几个行业的服务质量进行评价,消费者协会在四为了对几个行业的服务质量进行评价,消费者协会在四为了对几个行业的服务质量进行评价,消费者协会在四为了对几个行业的服务质
4、量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对个行业分别抽取了不同的企业作为样本。最近一年中消费者对个行业分别抽取了不同的企业作为样本。最近一年中消费者对个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共总共总共总共2323家企业家企业家企业家企业投诉的次数投诉的次数投诉的次数投诉的次数如下表如下表如下表如下表本讲稿第四页,共七十六页什么是方差分析?1.1.分分析析四四个个行行业业之之间间的的服服务务质质量量是是否否有有显显著著差差异异,也也就就是是要要判判断断“行行业业”对对“投投投投诉诉诉诉次次次次数数数数”是是否否有有显显著影响著影响2.2.作作
5、出出这这种种判判断断最最终终被被归归结结为为检检验验这这四四个个行行业业被被投投诉诉次数的次数的均值是否相等均值是否相等3.3.若若它它们们的的均均值值相相等等,则则意意味味着着“行行业业”对对投投诉诉次次数数是是没没有有影影响响的的,即即它它们们之之间间的的服服务务质质量量没没有有显显著著差差异异;若若均均值值不不全全相相等等,则则意意味味着着“行行业业”对对投投诉诉次次数数是是有有影影响响的的,它它们们之之间间的的服服务务质量有显著差异质量有显著差异本讲稿第五页,共七十六页方差分析中的有关术语1.1.因素或因子因素或因子因素或因子因素或因子(factor)(factor)所要检验的对象所要
6、检验的对象所要检验的对象所要检验的对象 要要要要分分分分析析析析行行行行业业业业对对对对投投投投诉诉诉诉次次次次数数数数是是是是否否否否有有有有影影影影响响响响,行行行行业业业业是是是是要要要要检检检检验验验验的的的的因因因因素素素素或或或或因子因子因子因子2.2.水平或处理水平或处理水平或处理水平或处理(treatment)treatment)因子的不同表现因子的不同表现因子的不同表现因子的不同表现零零零零售售售售业业业业、旅旅旅旅游游游游业业业业、航航航航空空空空公公公公司司司司、家家家家电电电电制制制制造造造造业业业业就就就就是是是是因因因因子子子子的的的的水水水水平平平平3.3.观察值
7、观察值观察值观察值 在每个因素水平下得到的样本数据在每个因素水平下得到的样本数据在每个因素水平下得到的样本数据在每个因素水平下得到的样本数据 每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值本讲稿第六页,共七十六页方差分析中的有关术语1.1.试验试验试验试验这里只涉及一个因素,因此称为单因素四水平的试验这里只涉及一个因素,因此称为单因素四水平的试验这里只涉及一个因素,因此称为单因素四水平的试验这里只涉及一个因素,因此称为单因素四水平的试验2.2.总体总体总体总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一
8、个总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体比比比比如如如如零零零零售售售售业业业业、旅旅旅旅游游游游业业业业、航航航航空空空空公公公公司司司司、家家家家电电电电制制制制造造造造业业业业可可可可以以以以看看看看作是四个总体作是四个总体作是四个总体作是四个总体3.样本数据样本数据样本数据样本数据被被被被投投投投诉诉诉诉次次次次数数数数可可可可以以以以看看看看作作作作是是是是从从从从这这这这四四四四个个个个总总总总体体体体中中中中抽抽抽抽取取取取的的的的样样样样本本本本数数数数据据据据本讲稿第七页,共七十六页方差分析的基本思想和原理本讲稿第八页,共七十六页方差分析的基
9、本思想和原理 零售业 旅游业 航空公司 家电制造本讲稿第九页,共七十六页1.1.从散点图上可以看出从散点图上可以看出从散点图上可以看出从散点图上可以看出uu不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的uu同同一一个个行行业业,不不同同企企业业被被投投诉诉的的次次数数也也明明显显不不同同t t家家家家电电电电制制制制造造造造被被被被投投投投诉诉诉诉的的的的次次次次数数数数较较较较高高高高,航航航航空空空空公公公公司司司司被被被被投投投投诉诉诉诉的次数较低的次数较低的次数较低的次数较低2.2.行业与被投诉次
10、数之间有一定的关系行业与被投诉次数之间有一定的关系uu如如果果行行业业与与被被投投诉诉次次数数之之间间没没有有关关系系,那那么么它它们们被被投投诉诉的的次次数数应应该该差差不不多多相相同同,在在散散点点图图上上所呈现的模式也就应该很接近所呈现的模式也就应该很接近方差分析的基本思想和原理方差分析的基本思想和原理本讲稿第十页,共七十六页1.1.仅仅仅仅从从从从散散散散点点点点图图图图上上上上观观观观察察察察还还还还不不不不能能能能提提提提供供供供充充充充分分分分的的的的证证证证据据据据证证证证明明明明不不不不同同同同行行行行业业业业被被被被投投投投诉诉诉诉的的的的次数之间有显著差异次数之间有显著差
11、异次数之间有显著差异次数之间有显著差异uu这种差异也可能是由于这种差异也可能是由于这种差异也可能是由于这种差异也可能是由于抽样的随机性抽样的随机性抽样的随机性抽样的随机性所造成的所造成的所造成的所造成的2.2.需需需需要要要要有有有有更更更更准准准准确确确确的的的的方方方方法法法法来来来来检检检检验验验验这这这这种种种种差差差差异异异异是是是是否否否否显显显显著著著著,也也也也就就就就是是是是进进进进行行行行方方方方差差差差分分分分析析析析uu所所所所以以以以叫叫叫叫方方方方差差差差分分分分析析析析,因因因因为为为为虽虽虽虽然然然然我我我我们们们们感感感感兴兴兴兴趣趣趣趣的的的的是是是是均均均
12、均值值值值,但但但但在在在在判断均值之间是否有差异时则需要借助于方差判断均值之间是否有差异时则需要借助于方差判断均值之间是否有差异时则需要借助于方差判断均值之间是否有差异时则需要借助于方差uu这这这这个个个个名名名名字字字字也也也也表表表表示示示示:它它它它是是是是通通通通过过过过对对对对数数数数据据据据误误误误差差差差来来来来源源源源的的的的分分分分析析析析判判判判断断断断不不不不同同同同总总总总体体体体的的的的均均均均值值值值是是是是否否否否相相相相等等等等。因因因因此此此此,进进进进行行行行方方方方差差差差分分分分析析析析时时时时,需需需需要要要要考考考考察察察察数数数数据据据据误误误误
13、差的来源差的来源差的来源差的来源方差分析的基本思想和原理本讲稿第十一页,共七十六页n n1.比较两类误差,以检验均值是否相等比较两类误差,以检验均值是否相等n n2.比较的基础是比较的基础是方差比方差比n n3.如果如果系统系统(处理处理)误差误差明显地不同于随机误明显地不同于随机误差,则均值就是不相等的;反之,均值就是差,则均值就是不相等的;反之,均值就是相等的相等的n n4.误差是由各部分的误差占总误差的比例误差是由各部分的误差占总误差的比例来测度的来测度的方差分析的基本思想和原理本讲稿第十二页,共七十六页方差分析的基本思想和原理(两类误差)1.1.随机误差随机误差随机误差随机误差因素的因
14、素的同一水平同一水平(总体总体)下,样本各观察值之间的差异下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数是不同的比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,称为这种差异可以看成是随机因素的影响,称为随机误差随机误差随机误差随机误差 2.系统误差系统误差系统误差系统误差 因素的因素的不同水平不同水平(不同总体不同总体)下,各观察值之间的差异下,各观察值之间的差异 比如,不同行业之间的被投诉次数之间的差异比如,不同行业之间的被投诉次数之间的差异 这这种种差差异异可可能能是是由由于于抽抽样样的的随随机机性性所所造造成成的的,也也可可能能是是由由于于行行业
15、业本本身身所所造造成成的的,后后者者所所形形成成的的误误差差是是由由系系统统性性因因素素造成的,称为造成的,称为系统误差系统误差系统误差系统误差本讲稿第十三页,共七十六页方差分析的基本思想和原理1.1.数据的误差用平方和数据的误差用平方和数据的误差用平方和数据的误差用平方和(sum of squaressum of squares)表示,称为方差表示,称为方差表示,称为方差表示,称为方差2.2.组内方差组内方差组内方差组内方差(within groupswithin groups)因素的同一水平因素的同一水平因素的同一水平因素的同一水平(同一个总体同一个总体同一个总体同一个总体)下样本数据的方
16、差下样本数据的方差下样本数据的方差下样本数据的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差组内方差只包含组内方差只包含组内方差只包含组内方差只包含随机误差随机误差随机误差随机误差3.3.组间方差组间方差组间方差组间方差(between groupsbetween groups)因素的不同水平因素的不同水平因素的不同水平因素的不同水平(不同总体不同总体不同总体不同总体)下各样本之间的方差下各样本之间的方差下各样本之间的方差下各样本之间的方差比如,四个行业被投诉次数之间的方差比如,四个行业被投诉次数之间的方差比如,四个行业被投
17、诉次数之间的方差比如,四个行业被投诉次数之间的方差 组间方差既包括组间方差既包括组间方差既包括组间方差既包括随机误差随机误差随机误差随机误差,也包括,也包括,也包括,也包括系统误差系统误差系统误差系统误差本讲稿第十四页,共七十六页方差分析的基本思想和原理(方差的比较)1.若若若若不不不不同同同同行行行行业业业业对对对对投投投投诉诉诉诉次次次次数数数数没没没没有有有有影影影影响响响响,则则则则组组组组间间间间误误误误差差差差中中中中只只只只包包包包含含含含随随随随机机机机误误误误差差差差,没没没没有有有有系系系系统统统统误误误误差差差差。这这这这时时时时,组组组组间间间间误误误误差差差差与与与与
18、组组组组内内内内误误误误差差差差经经经经过过过过平平平平均均均均后的数值就应该很接近,它们的比值就会接近后的数值就应该很接近,它们的比值就会接近后的数值就应该很接近,它们的比值就会接近后的数值就应该很接近,它们的比值就会接近1 12.若若若若不不不不同同同同行行行行业业业业对对对对投投投投诉诉诉诉次次次次数数数数有有有有影影影影响响响响,在在在在组组组组间间间间误误误误差差差差中中中中除除除除了了了了包包包包含含含含随随随随机机机机误误误误差差差差外外外外,还还还还会会会会包包包包含含含含有有有有系系系系统统统统误误误误差差差差,这这这这时时时时组组组组间间间间误误误误差差差差平平平平均均均均
19、后后后后的的的的数数数数值值值值就就就就会会会会大于组内误差平均后的数值,它们之间的比值就会大于大于组内误差平均后的数值,它们之间的比值就会大于大于组内误差平均后的数值,它们之间的比值就会大于大于组内误差平均后的数值,它们之间的比值就会大于1 13.3.当当当当这这这这个个个个比比比比值值值值大大大大到到到到某某某某种种种种程程程程度度度度时时时时,就就就就可可可可以以以以说说说说不不不不同同同同水水水水平平平平之之之之间间间间存存存存在在在在着着着着显显显显著著著著差差差差异,也就是自变量对因变量有影响异,也就是自变量对因变量有影响异,也就是自变量对因变量有影响异,也就是自变量对因变量有影响
20、判判判判断断断断行行行行业业业业对对对对投投投投诉诉诉诉次次次次数数数数是是是是否否否否有有有有显显显显著著著著影影影影响响响响,实实实实际际际际上上上上也也也也就就就就是是是是检检检检验验验验被被被被投投投投诉诉诉诉次次次次数数数数的的的的差差差差异异异异主主主主要要要要是是是是由由由由于于于于什什什什么么么么原原原原因因因因所所所所引引引引起起起起的的的的。如如如如果果果果这这这这种种种种差差差差异异异异主主主主要要要要是是是是系系系系统统统统误误误误差差差差,说说说说明明明明不不不不同同同同行行行行业业业业对对对对投投投投诉诉诉诉次次次次数数数数有显著影响有显著影响有显著影响有显著影响本
21、讲稿第十五页,共七十六页方差分析的基本假定本讲稿第十六页,共七十六页方差分析的基本假定1.1.每个总体都应服从正态分布每个总体都应服从正态分布每个总体都应服从正态分布每个总体都应服从正态分布对对对对于于于于因因因因素素素素的的的的每每每每一一一一个个个个水水水水平平平平,其其其其观观观观察察察察值值值值是是是是来来来来自自自自服服服服从从从从正正正正态态态态分布总体的简单随机样本分布总体的简单随机样本分布总体的简单随机样本分布总体的简单随机样本比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数
22、必需服从正态分布2.2.各个总体的方差必须相同各个总体的方差必须相同各个总体的方差必须相同各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等3.3.观察值是独立的观察值是独立的观察值是独立的观察值是独立的比比比比如如如如,每每每每个个个个行行行行业业业业被被被被投投投投诉诉诉诉的的的的次次次次数数数数与与与与其其其
23、其他他他他行行行行业业业业被被被被投投投投诉诉诉诉的的的的次数独立次数独立次数独立次数独立本讲稿第十七页,共七十六页方差分析中的基本假定1.1.在上述假定条件下,判断行业对投诉次数是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等2.2.如果四个总体的均值相等,可以期望四个样本的均值也会很接近四个样本的均值越接近,推断四个总体均值相等的证据也就越充分样样本本均均值值越越不不同同,推推断断总总体体均均值值不不同同的的证证据据就就越越充分充分 本讲稿第十八页,共七十六页方差分析中基本假定n n 如果原假设成立,即H0:1=2=3=4uu四个行业被投诉次数的均值都相等uu意味着每
24、个样本都来自均值为、方差为 2的同一正态总体 X X Xf(X)f(X)f(X)1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 本讲稿第十九页,共七十六页方差分析中基本假定n n若备择假设成立,即H1:i(i=1,2,3,4)不全相等uu至少有一个总体的均值是不同的uu四个样本分别来自均值不同的四个正态总体 X X Xf(X)f(X)f(X)3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 本讲稿第二十页,共七十六页问题的一般提法本讲稿第二十一页,共七十六页问题的一般提法1.1.设设因因素素有有k k个个水水平平,每每个个水水平平的的均均值值分分别别用用 1 1,
25、2 2,k k 表示表示2.2.要要检检验验k k个个水水平平(总总体体)的的均均值值是是否否相相等等,需需要要提提出出如如下下假假设:设:HH0 0:1 1 2 2 k k HH1 1:1 1,2 2,,k k 不全相等不全相等不全相等不全相等3.3.设设 1 1为为零零售售业业被被投投诉诉次次数数的的均均值值,2 2为为旅旅游游业业被被投投诉诉次次数数的的均均值值,3 3为为航航空空公公司司被被投投诉诉次次数数的的均均值值,4 4为为家家电电制制造业造业被投诉次数的均值被投诉次数的均值,提出的假设为提出的假设为HH0 0:1 1 2 2 3 3 4 4 HH1 1:1 1,2 2,3 3,
26、4 4 不全相等不全相等不全相等不全相等本讲稿第二十二页,共七十六页方差分析的原理方差分析的原理n n变异的可加性原理变异的可加性原理n n把实验数据的总变异分解为不同来源把实验数据的总变异分解为不同来源的变异的变异,并根据不同来源的变异在总变并根据不同来源的变异在总变异中所占的比重对造成数据变异的原异中所占的比重对造成数据变异的原因作出解释因作出解释.n n变异的统计量是实验数据与平均数的变异的统计量是实验数据与平均数的离差平方和离差平方和(SS)本讲稿第二十三页,共七十六页试验设计与方差分析完全随机化完全随机化设计设计因子因子设计设计试验设计试验设计随机化随机化区组设计区组设计可重复双因素
27、可重复双因素方差分析方差分析单因素单因素方差分析方差分析无重复双因素无重复双因素方差分析方差分析本讲稿第二十四页,共七十六页完全随机化设计n n【例例例例】一一家家种种业业开开发发股股份份公公司司研研究究出出3 3个个新新的的小小麦麦品品种种:品品种种1 1、品品种种2 2、品品种种3 3。为为研研究究不不同同品品种种对对产产量量的的影影响响,需需要要选选择择一一些些地地块块,在在每每个个地地块块种种上上不不同同品品种种的的小小麦麦,然然后后获获得得产产量量数数据据进进行行分分析。这一过程就是试验设计的过程析。这一过程就是试验设计的过程 uu这这里里的的“小小麦麦品品种种”就就是是试试验验因因
28、子子或或因因素素,品品种种1 1、品品种种2 2、品品种种3 3就是因子的就是因子的3 3个不同水平,称为个不同水平,称为处理处理处理处理uu假假定定选选取取3 3个个面面积积相相同同的的地地块块,这这里里的的“地地块块”就就是是接接受受处理的对象或实体,称为处理的对象或实体,称为试验单元试验单元试验单元试验单元uu将将每每个个品品种种随随机机地地指指派派给给其其中中的的一一个个地地块块,这这一一过过程程就就是随机化设计过程是随机化设计过程本讲稿第二十五页,共七十六页完全随机化设计(completely randomized design)1.1.“处理”被随机地指派给试验单元的一种设计uu“
29、处理”是指可控制的因素的各个水平是指可控制的因素的各个水平uu“试验单元(experiment unit)”是接受“处理”的对象或实体2.2.在试验性研究中,感兴趣的变量是明确规定的,因此,研究中的一个或多个因素可以被控制,使得数据可以按照因素如何影响变量来获取3.3.对完全随机化设计的数据采用对完全随机化设计的数据采用单因素方差分析单因素方差分析本讲稿第二十六页,共七十六页n n基本方法基本方法基本方法基本方法:把被试随机分配给自变量的各个水平把被试随机分配给自变量的各个水平把被试随机分配给自变量的各个水平把被试随机分配给自变量的各个水平,每个被试每个被试每个被试每个被试只接受一个水平的处理
30、只接受一个水平的处理只接受一个水平的处理只接受一个水平的处理.n n 只有一个实验因素只有一个实验因素只有一个实验因素只有一个实验因素(自变量自变量自变量自变量),),处于处于处于处于 的水平的水平的水平的水平.n n控制误差变异的方法控制误差变异的方法控制误差变异的方法控制误差变异的方法:随机化分配随机化分配随机化分配随机化分配(被实随机化分配被实随机化分配被实随机化分配被实随机化分配,被试被试被试被试间的变异也是随机分配间的变异也是随机分配间的变异也是随机分配间的变异也是随机分配,在统计上无差异在统计上无差异在统计上无差异在统计上无差异)n n设计模型设计模型设计模型设计模型:n n表示表
31、示表示表示:被试在某个处理水平上的分数被试在某个处理水平上的分数被试在某个处理水平上的分数被试在某个处理水平上的分数,等于总体平均数等于总体平均数等于总体平均数等于总体平均数(真真真真值值值值),),该水平上的处理效应和误差效应之和该水平上的处理效应和误差效应之和该水平上的处理效应和误差效应之和该水平上的处理效应和误差效应之和.n n其中其中其中其中:误差值是个正态分布的随机变量误差值是个正态分布的随机变量误差值是个正态分布的随机变量误差值是个正态分布的随机变量本讲稿第二十七页,共七十六页单因素方差分析的数据结构(one-way analysis of variance)观察值观察值观察值观察
32、值 (j j)因素因素因素因素(A A)i i 水平水平水平水平A A1 1 水平水平水平水平A A2 2 水平水平水平水平A Ak k12:n x11 x21 xk1 x12 x22 xk2 :x1n x2n xkn本讲稿第二十八页,共七十六页 分析步骤分析步骤提出假设提出假设构造检验统计量构造检验统计量计算统计量计算统计量(平方和平方和,自由度自由度,均方均方,F比值比值)作决策作决策列方差分析表列方差分析表本讲稿第二十九页,共七十六页提出假设1.1.一般提法H0:1=2=k 自变量对因变量没有显著影响 H1:1,2,k不全相等(或至少有一对不相等)自变量对因变量有显著影响 2.2.注意:
33、拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 本讲稿第三十页,共七十六页构造检验的统计量n n构造统计量需要计算n各水平的均值()n全部观察值的总均值()n误差平方和(SS)n均方(MS)本讲稿第三十一页,共七十六页构造检验的统计量(计算水平的均值)1.假定从第i i个总体中抽取一个容量为n ni的简单随机样本,第i个个总总体体的的样样本本均均值值为为该该样样本本的的全全部部观观察察值总和除以观察值的个数值总和除以观察值的个数2.计算公式为 式中:式中:n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xij ij 为第为第 i i
34、个总体的第个总体的第 j j 个观察值个观察值 本讲稿第三十二页,共七十六页构造检验的统计量(计算全部观察值的总均值)1.全部观察值的总和除以观察值的总个数2.计算公式为 本讲稿第三十三页,共七十六页构造检验的统计量本讲稿第三十四页,共七十六页构造检验的统计量(计算总误差平方和 SST)1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况反映全部观察值的离散状况3.其计算公式为 前例的计算结果:前例的计算结果:SST SST=(57-47.869565)=(57-47.869565)2 2+(58-47.869565)(58-47.869565)2 2 =115.9295 =1
35、15.9295本讲稿第三十五页,共七十六页构造检验的统计量(计算水平项平方和 SSB)1.各组平均值 与总平均值 的离差平方和2.反映各总体的样本均值之间的差异程度,又称组间平方和3.该平方和既包括随机误差,也包括系统误差4.计算公式为 前例的计算结果:前例的计算结果:SSB SSB=1456.608696=1456.608696本讲稿第三十六页,共七十六页构造检验的统计量(计算误差项平方和 SSw)1.每个水平或组的各样本数据与其组平均值的离差平方和2.反映每个样本各观察值的离散状况,又称组内平方和3.该平方和反映的是随机误差的大小4.计算公式为 前例的计算结果:SSWSSW=2708=27
36、08本讲稿第三十七页,共七十六页构造检验的统计量(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSW)、水平项离差平方和(SSB)之间的关系SST=SSB+SSW 前例的计算结果:前例的计算结果:4164.608696=1456.608696+2708 4164.608696=1456.608696+2708 本讲稿第三十八页,共七十六页构造检验的统计量(三个平方和的作用)1.SSTSST反反映映全全部部数数据据总总的的误误差差程程度度;SSWSSW反反映映随随机机误误差差的的大大小小;SSBSSB反反映随机误差和系统误差的大小映随机误差和系统误差的大小2.2.如如果果原原假假
37、设设成成立立,则则表表明明没没有有系系统统误误差差,组组间间平平方方和和SSASSA除除以以自自由由度度后后的的均均均均方方方方与与组组内内平平方方和和SSESSE和和除除以以自自由由度度后后的的均均均均方方方方差差异异就就不不会会太太大大;如如果果组组组组间间间间均均均均方方方方显显著著地地大大于于组组组组内内内内均均均均方方方方,说说明明各各水水平平(总总体体)之之间间的差异不仅有随机误差,还有系统误差的差异不仅有随机误差,还有系统误差3.3.判判断断因因素素的的水水平平是是否否对对其其观观察察值值有有影影响响,实实际际上上就就是是比比较较组组组组间间间间方方方方差差差差与与组内方差组内方
38、差组内方差组内方差之间差异的大小之间差异的大小 SSt SSt:总体平方和:总体平方和 SSBSSB:组间平方和(处理平方和):组间平方和(处理平方和)SSWSSW:组内平方和:组内平方和本讲稿第三十九页,共七十六页构造检验的统计量(计算均方MS)1.各各误误差差平平方方和和的的大大小小与与观观察察值值的的多多少少有有关关,为为消消除除观观察察值值多多少少对对误误差差平平方方和和大大小小的的影影响响,需需要要将将其其平平均均,这这就就是是均均均均方方方方,也也称称为方差为方差2.计算方法是用误差平方和除以相应的自由度计算方法是用误差平方和除以相应的自由度3.三个平方和对应的自由度分别是三个平方
39、和对应的自由度分别是SST SST 的自由度为的自由度为n n-1-1,其中,其中n n为全部观察值的个数为全部观察值的个数SSBSSB的自由度为的自由度为k k-1-1,其中,其中k k为因素水平为因素水平(总体总体)的个数的个数SSW SSW 的自由度为的自由度为n n-k k本讲稿第四十页,共七十六页构造检验的统计量(计算均方 MS)1.组间方差组间方差组间方差组间方差:SSB的均方,记为MSB,计算公式为2.组组内内方方差差:SSW的均方,记为MSW,计算公式为本讲稿第四十一页,共七十六页构造检验的统计量(计算检验统计量 F)1.将MSB和MSW进行对比,即得到所需要的检验统计量F2.
40、当当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F F 分布,即 本讲稿第四十二页,共七十六页构造检验的统计量(F分布与拒绝域)如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,F F F=MSAMSAMSA/MSEMSEMSE1 1 1 F 分布分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F本讲稿第四十三页,共七十六页统计决策 将将统统计计量量的的值值F F与与给给定定的的显显著著性性水水平平 的的临临界界值值F F 进进行行比较,作出对原假设比较,作出对
41、原假设H H0 0的决策的决策根根据据给给定定的的显显著著性性水水平平,在在F F分分布布表表中中查查找找与与第第一一自自由由度度dfdf1 1k k-1-1、第第二二自自由由度度dfdf2 2=N N-k k 相相应应的的临临界界值值 F F 若若F F F F ,则则拒拒绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是是显著的,所检验的因素对观察值有显著影响显著的,所检验的因素对观察值有显著影响若若FFFF.01(3,28)=4.57 (6)列方差分析表(略)本讲稿第五十二页,共七十六页n n(7)结论:存在显著性差异,拒绝原假设。结合均值,被试做生字密度小的文章的阅
42、读理解能力高于生字密度大的文章。本讲稿第五十三页,共七十六页随机化区组设计本讲稿第五十四页,共七十六页完全随机化设计n n【例例例例】一一家家种种业业开开发发股股份份公公司司研研究究出出3 3个个新新的的小小麦麦品品种种:品品种种1 1、品品种种2 2、品品种种3 3。为为研研究究不不同同品品种种对对产产量量的的影影响响,需需要要选选择择一一些些地地块块,在在每每个个地地块块种种上上不不同同品品种种的的小小麦麦,然然后后获获得得产产量量数数据进行分析。这一过程就是试验设计的过程据进行分析。这一过程就是试验设计的过程 uu这这里里的的“小小麦麦品品种种”就就是是试试验验因因子子或或因因素素,品品
43、种种1 1、品品种种2 2、品种品种3 3就是因子的就是因子的3 3个不同水平,称为个不同水平,称为处理处理处理处理uu假假定定选选取取3 3个个面面积积相相同同的的地地块块,这这里里的的“地地块块”就就是是接接受受处处理的对象或实体,称为理的对象或实体,称为试验单元试验单元试验单元试验单元uu将将每每个个品品种种随随机机地地指指派派给给其其中中的的一一个个地地块块,这这一一过过程程就就是随机化设计过程是随机化设计过程本讲稿第五十五页,共七十六页随机化区组设计(randomized block design)1.1.先按一定规则将试验单元划分为若干同质组,称为先按一定规则将试验单元划分为若干同
44、质组,称为先按一定规则将试验单元划分为若干同质组,称为先按一定规则将试验单元划分为若干同质组,称为“区组区组区组区组”2.2.再将各种处理随机地指派给各个区组再将各种处理随机地指派给各个区组再将各种处理随机地指派给各个区组再将各种处理随机地指派给各个区组uu比比比比如如如如在在在在上上上上面面面面的的的的例例例例子子子子中中中中,首首首首先先先先根根根根据据据据土土土土壤壤壤壤的的的的好好好好坏坏坏坏分分分分成成成成几几几几个个个个区区区区组组组组,假假假假定定定定分分分分成成成成4 4个个个个区区区区组组组组:区区区区组组组组1 1、区区区区组组组组2 2、区区区区组组组组3 3、区区区区组
45、组组组4 4,每每每每个个个个区区区区组中有三个地块组中有三个地块组中有三个地块组中有三个地块uu在每个区组内的在每个区组内的在每个区组内的在每个区组内的3 3个地块以抽签的方式决定所种的小麦品种个地块以抽签的方式决定所种的小麦品种个地块以抽签的方式决定所种的小麦品种个地块以抽签的方式决定所种的小麦品种3.3.分分分分组组组组后后后后再再再再将将将将每每每每个个个个品品品品种种种种(处处处处理理理理)随随随随机机机机地地地地指指指指派派派派给给给给每每每每一一一一个个个个区区区区组组组组的的的的设设设设计计计计就就就就是随机化区组设计是随机化区组设计是随机化区组设计是随机化区组设计本讲稿第五十
46、六页,共七十六页随机化区组设计n n试验数据:试验数据:无重复双因素方差分析无重复双因素方差分析本讲稿第五十七页,共七十六页实例实例:完全随机实验设计完全随机实验设计n n探讨文章的生字密度对学生探讨文章的生字密度对学生探讨文章的生字密度对学生探讨文章的生字密度对学生阅读理解的影响阅读理解的影响阅读理解的影响阅读理解的影响n n自变量自变量自变量自变量-生字密度生字密度生字密度生字密度 n n K=4 5:1(aK=4 5:1(a1 1);10:1(a);10:1(a2 2);15:1);15:1(a(a3 3);20:1(a);20:1(a4 4)n n因变量因变量因变量因变量-被试阅读理解
47、测被试阅读理解测被试阅读理解测被试阅读理解测验分数验分数验分数验分数n nN=32N=32人人人人=4=4组组组组*8(8(各水平被试各水平被试各水平被试各水平被试数量可以不等数量可以不等数量可以不等数量可以不等)a1a2 a3a4S1S2 S3S4.S32本讲稿第五十八页,共七十六页随机区组实验设计随机区组实验设计n n对对对对3232个学生做个学生做个学生做个学生做智力测智力测智力测智力测试试试试,分成分成分成分成8 8个区组个区组个区组个区组(4(4被试被试被试被试/组组组组 ,同质同质同质同质),),后随机分配后随机分配后随机分配后随机分配每个区组内的每个区组内的每个区组内的每个区组内
48、的4 4个同质个同质个同质个同质被试分别阅读一种生字被试分别阅读一种生字被试分别阅读一种生字被试分别阅读一种生字密度的文章密度的文章密度的文章密度的文章.a1a2a3a4区组区组区组区组1 1S1S2S3S4区组区组区组区组2 2S5S6S7S8.区组区组区组区组8 8.S32把学生的智力作把学生的智力作为一个无关变量为一个无关变量a=8 k=4本讲稿第五十九页,共七十六页n n基本方法基本方法基本方法基本方法:将实验对象按一定的标准划分为将实验对象按一定的标准划分为将实验对象按一定的标准划分为将实验对象按一定的标准划分为a a个区个区个区个区组组组组,保证区组同质性保证区组同质性保证区组同质
49、性保证区组同质性(是区组内的实验对象的个别是区组内的实验对象的个别是区组内的实验对象的个别是区组内的实验对象的个别对象尽可能小对象尽可能小对象尽可能小对象尽可能小),),每个区组接受每个区组接受每个区组接受每个区组接受P P个处理个处理个处理个处理,区组内被试区组内被试区组内被试区组内被试和处理的分配是随机的和处理的分配是随机的和处理的分配是随机的和处理的分配是随机的.n n目的:目的:目的:目的:MSAMSA中不但存在抽样误差,还存在人与中不但存在抽样误差,还存在人与中不但存在抽样误差,还存在人与中不但存在抽样误差,还存在人与人之间的差异,即同一组中不同被试的差异;人之间的差异,即同一组中不
50、同被试的差异;人之间的差异,即同一组中不同被试的差异;人之间的差异,即同一组中不同被试的差异;这样使这样使这样使这样使F F统计量更精确。统计量更精确。统计量更精确。统计量更精确。n n实质实质实质实质:使用区组方法减小误差变异使用区组方法减小误差变异使用区组方法减小误差变异使用区组方法减小误差变异,即分离出有无即分离出有无即分离出有无即分离出有无关变量引起的变异关变量引起的变异关变量引起的变异关变量引起的变异.本讲稿第六十页,共七十六页随机区组实验设计的方差分析随机区组实验设计的方差分析SSTSSBSSWSSTSSBSSRSSE完全随机化实验设计的总离差完全随机化实验设计的总离差平方和的划分