《单因素方差分析$非参数检验用优秀PPT.ppt》由会员分享,可在线阅读,更多相关《单因素方差分析$非参数检验用优秀PPT.ppt(73页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 方差分析入门方差分析入门 单因素方差分析单因素方差分析 均数两两比较的方法均数两两比较的方法 小结小结v 内容提要内容提要前前面面提提到到的的有有关关统统计计推推断断的的方方法法,如如单单样样本本、两两样样本本t检检验验等等,其其所所涉涉及及的的对对象象千千变变万万化化,但但归归根根结结底底都都可可以以视视为为两两组组间间的的比比较较,假假如如是是有有一一组组的的总总体体均均数数已已知知,则则为为单单样样本本t检检验验,假假如如两两组组都都只只有有样样本本信信息息,则则为为两两样样本本t检检验验。但但是是假如遇到以下情形,该如何处理?假如遇到以下情形,该如何处理?方差分析入门方差分析入门案案
2、例例 对对于于高高校校新新生生的的入入学学成成果果,可可以以通通过过t t检检验验来来考考察察男男女女学学生生间间的的入入学学成成果果是是否否有有差差异异?但但要要是是想想知知道道来来自自于于江江苏苏、浙浙江江、上上海海、安安徽徽等等省省份份的的学学生生,其其入入学学成成果果是是否有差异,那么是否可以用否有差异,那么是否可以用6 6次次t t 检验来达成目的?检验来达成目的?方差分析入门方差分析入门在在以以上上例例子子中中,涉涉及及的的问问题题其其实实就就是是在在单单一一处处理理因因素素之之下下,多多个个不不同同水水平平(多多组组)之之间间的的连连续续性性视视察察值值的的比比较较,目目的的是是
3、通通过过对对多多个个样样本本的的探探讨讨,来来推推断断这这些些样样本本是是否否来来自自于于同同一个总体。一个总体。那那么么能能否否运运用用两两两两t 检检验验,例例如如做做三三组组比比较较,则则分分别别进进行行三三次次t检检验验来来解解决决此此问问题题呢呢?这这样样做做在在统统计计上上是是不不妥妥的的。因为统计学的结论都是概率性的,存在犯错误的可能。因为统计学的结论都是概率性的,存在犯错误的可能。方差分析入门方差分析入门 分分析析:用用6次次t 检检验验来来考考察察4个个省省份份的的高高校校生生新新生生入入学学成成果果是是否否相相同同,对对于于某某一一次次比比较较,其其犯犯I类类错错误误的的概
4、概率率为为,那那么么连连续续进进行行6次次比比较较,其其犯犯I类类错错误误的的概概率率是是多多少少呢呢?不不是是 6,而而是是1-(1-)6。也也就就是是说说,假假如如检检验验水水准准取取0.05,那那么么连连续续进进行行6次次t 检检验验,犯犯I类类错错误误的的概概率率将将上上升升为为0.2649!这这是一个令人震惊的数字!是一个令人震惊的数字!结结论论:多多个个均均数数比比较较不不宜宜接接受受t 检检验验作作两两两两比比较较;而而应应当当接接受方差分析!受方差分析!方差分析入门方差分析入门v R.A.Fisher 提出的方差分析的理论基础:v 将总变异分解为由探讨因素所造成的部分和由抽样误
5、差所造成的部分,通过比较来自于不同部分的变异,借助F分布作出统计推断。后人又将线性模型的思想引入方差分析,为这一方法供应了近乎无穷的发展空间。方差分析入门方差分析入门总变异总变异 随机变异随机变异 处理因素导致的变异处理因素导致的变异总变异总变异 组内变异组内变异 组间变异组间变异SS总总 SS组内组内 SS组间组间这这样样,我我们们就就可可以以接接受受确确定定的的方方法法来来比比较较组组内内变变异异和和组组间间变变异异的的大大小小,假假如如后后者者远远远远大大于于前前者者,则则说说明明处处理理因因素素的的确确存存在在,假假如如两两者者相相差差无无几几,则则说说明明该该影影响响不不存存在在,以
6、以上上即即方方差差分析的基本思想。分析的基本思想。方差分析入门方差分析入门方差分析的原假设和备择假设为:方差分析的原假设和备择假设为:H0:1 2=kH1:k个总体均数不同或者不全相同个总体均数不同或者不全相同方差分析入门方差分析入门 独立性(独立性(independence)视察对象是所探讨因素的各个水平下的独立随机抽样视察对象是所探讨因素的各个水平下的独立随机抽样 正态性(正态性(normality)每个水平下的应变量应当听从正态分布每个水平下的应变量应当听从正态分布 方差齐性(方差齐性(homoscedascity)各水平下的总体具有相同的方差。但事实上,只要最大各水平下的总体具有相同的
7、方差。但事实上,只要最大/最最小小 方差小于方差小于3,分析结果都是稳定的,分析结果都是稳定的应用条件应用条件有有时时原原始始资资料料不不满满足足方方差差分分析析的的要要求求,除除了了求求助助于于非非参参数数检检验验方方法法外外,也也可可以以考考虑虑变变量量变变换换。常常用用的的变变量量变变换换方方法法有:有:对数转换:用于听从对数正态分布的资料等;对数转换:用于听从对数正态分布的资料等;平方根转换:可用于听从平方根转换:可用于听从Possion分布的资料等;分布的资料等;平方根反正弦转换:可用于原始资料为率,且取值广泛的资料;平方根反正弦转换:可用于原始资料为率,且取值广泛的资料;其它:平方
8、变换、倒数变换等。其它:平方变换、倒数变换等。应用条件应用条件 例例1 为为了了探探讨讨烫烫伤伤后后不不同同时时间间切切痂痂对对大大鼠鼠肝肝脏脏三三磷磷酸酸腺腺苷苷(ATP)的的影影响响,将将30只只雄雄性性大大鼠鼠随随机机等等分分成成三三组组,每每组组10只只:A组组为为烫烫伤伤比比照照组组、B组组为为烫烫伤伤后后24小小时时切切 痂痂组组,C组组为为烫烫伤伤后后96小小时时切切 痂痂组组。全全部部大大鼠鼠在在烫烫伤伤168小小时时候候处处死死并并测测量量其其肝肝脏脏ATP含含量量,数数据据见见数数据据文文件件F1.sav,试试检检验验3组大鼠肝脏组大鼠肝脏ATP总体均数是否不同?总体均数是
9、否不同?单因素方差分析单因素方差分析分析:分析:对于单因素方差分析,其资料在对于单因素方差分析,其资料在SPSS中的数据结构应中的数据结构应当由两列数据构成,其中一列是视察指标的变量值,另当由两列数据构成,其中一列是视察指标的变量值,另一列是用以表示分组变量。事实上,几乎全部的统计分一列是用以表示分组变量。事实上,几乎全部的统计分析软件,包括析软件,包括SAS,STATA等,都要求方差分析接受这等,都要求方差分析接受这种数据输入形式,这一点也示意了方差分析与线性模型种数据输入形式,这一点也示意了方差分析与线性模型间千丝万缕的联系。间千丝万缕的联系。单因素方差分析单因素方差分析 预分析(重要):
10、检验其应用条件预分析(重要):检验其应用条件单因素方差分析单因素方差分析选择选择data 中的中的split file,出现如下对话框:,出现如下对话框:单因素方差分析单因素方差分析正态性检验 A 单击AnalyzeNonparametric 1-Sample K-S单因素方差分析单因素方差分析单因素方差分析单因素方差分析v 这这里里仅仅取取其其中中一一组组结结果果,表表明明该该资资料料符符合合分组正态性的条件。分组正态性的条件。运用Explore菜单带检验的正态图AnalyzeDescriptive StatisticsExplore将分析的变量导入Dependent List变量列表中将分
11、组变量导入Factor List框中单击Plot按钮选中Normality plots with test,并取消其他勾选continueOK单因素方差分析单因素方差分析留留意意分分组组检检验验正正态态性性后后,要要先先回回到到data菜菜单单下下的的split file,如下操作取消拆分后才能进行后续的方差分析:,如下操作取消拆分后才能进行后续的方差分析:单因素方差分析单因素方差分析单因素方差分析单因素方差分析选入分组变量选入分组变量选入因变量选入因变量给给出出各各组组间间样样本本均数的折线图均数的折线图指指定定进进行行方方差差齐性检验齐性检验单因素方差分析单因素方差分析结果分析结果分析单因
12、素方差分析单因素方差分析(1)方差齐性检验方差齐性检验v Levene方方法法检检验验统统计计量量为为1.333,其其P值值为为0.281,可认为样本所来自的总体满足方差齐性的要求。可认为样本所来自的总体满足方差齐性的要求。单因素方差分析单因素方差分析结果分析结果分析(2)方差分析表方差分析表v 第第1列列为为变变异异来来源源,第第2、3、4列列分分别别为为离离均均差差平平方方和和、自自由由度度、均均方方,检检验验统统计计量量F值值为为15.767,P=3个个独独立立随随机机连连续续分分布布样样本本的的比比较较,而而正正态态性性假假设设及及等等方方差差假假设设存存在在问问题题时时,它它可以进行
13、总体是否相同的检验。可以进行总体是否相同的检验。(不依靠总体分布)(不依靠总体分布)Median:中中位位数数检检验验,检检验验多多个个样样本本是是否否来来自自具具有有相相同中位数总体,在三种方法中检验效能最低,同中位数总体,在三种方法中检验效能最低,Jonckheere-Terpstra:对对连连续续性性资资料料或或有有序序分分类类资资料料都都适适用用,并并当当分分组组变变量量为为有有序序分分类类资资料料时时(即即双双向向有有序序资资料),此法的检验效能要高于料),此法的检验效能要高于Kruskal-Wallis法。法。多个独立样本的非参数检验多个独立样本的非参数检验v 母母亲亲每每日日吸吸
14、烟烟多多于于20支支组组共共4名名新新生生儿儿,体体重重平平均均秩秩次次3.75;每每日日吸吸烟烟少少于于20支支组组共共3名名新新生生儿儿,体体重重平平均均秩秩次次5.00;过过去去吸吸烟烟现现已已戒戒烟烟组组共共4名名新新生生儿儿,体体重重平平均均秩秩次次9.38;从不吸烟组共;从不吸烟组共3名新生儿,平均秩次名新生儿,平均秩次12.50。分析结果分析结果多个独立样本的非参数检验多个独立样本的非参数检验(1)秩次表秩次表v Kruskal-Wallis H统统计计量量的的近近似似显显著著概概率率为为0.023,按按0.05的的水水准准拒拒绝绝原原假假设设,可可认认为为四四个个组组中中至至少少有有两两组组诞诞生生体体重重的总体分布不同。的总体分布不同。分析结果分析结果(2)检验统计量检验统计量多个独立样本的非参数检验多个独立样本的非参数检验多组有序变量资料的秩和检验多组有序变量资料的秩和检验例例9-6(P180)比较甲乙丙三种方法的治疗效果(无效、好转、比较甲乙丙三种方法的治疗效果(无效、好转、显效、痊愈)显效、痊愈)