《卡方检验和方差分析.ppt》由会员分享,可在线阅读,更多相关《卡方检验和方差分析.ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七讲 卡方检验和方差分析一、卡方检验1.拟合优度检验1)指定分布率的拟合优度检验2)理论概率分布的拟合优度检验2.独立性检验1)列联表2)独立性检验?0.05?已知自由度=10,右尾面积,求卡方变量值,用EXCEL函数CHIINV(右尾面积,自由度)本例有18?已知自由度=10,卡方变量值=18,求右尾面积,用EXCEL函数CHIDIST(变量值,自由度)本例有如果拟定假设为真,则各类农户的期望频数如下:自由度=分类数-1D3:D5=B3:B5*$B$6EXCEL的chitest函数计算卡方统计量后直接报告P值。由于P值非常小,有足够的信心拒绝拟定假设。C5:c8=binomdist(b5:
2、b8,$b$2,$b$4,false)D5:d8=c5:c8*$b$9)你将得你将得出什么出什么结论?结论?H0:行车意外独立于手机使用情况。H1:行车意外与于手机使用情况有关。B11=B6*$E$4/$E$6,拖动到C11,D11。B12=B6*$E$5/$E$6,拖动到C12,D12。对话框对话框内填入内填入什么?什么?这是什么数值?本检验自由度是多少?本检验的结论是什么?第七讲 卡方检验和方差分析 二、方差分析1.方差分析的基本思想和原理1)处置的概念2)平方和与均方和3)F分布曲线4)方差分析中的基本假设2.单因素方差分析的程序3.单因素方差分析方法的应用 从样本数据看,三家公司得分从
3、样本数据看,三家公司得分是有差别的。那么,只是否能是有差别的。那么,只是否能说明总体上得分不一致呢?说明总体上得分不一致呢?或者说,样本数据反映的是随或者说,样本数据反映的是随机误差还是本质上的不同呢?机误差还是本质上的不同呢?也可以问:三组数据是来自一也可以问:三组数据是来自一个总体,还是来自平均数不等个总体,还是来自平均数不等的三个总体呢?的三个总体呢?处置间差异处置间差异处置1X11X21X21X21X21处置内差异X12X22X32X42X52处置内差异X13X23X33X43X53处置内差异如果处置间差异显著地大于处置内差异,则认为各样本所来自的总体并非具有相等的平均数处置2处置3差
4、异的表述绝对差异的表述:(离差)平方和相对差异的表述:均方和=(离差)平方和除以自由度处置(列)间平方和 SSC=处置(列)内平方和总平方和 SS总自由度:n-1处置(列)间自由度:1=k-1处置(列)内自由度:2=(n-1)-(k-1)=n-k处置(列)间均方和:MSC=处置(列)内均方和:方差分析的逻辑零假设:各样本(处置结果)来自平均数相等的总体。若要推翻以上假设,则处置间差异必须显著地大于处置内差异。两者对比采用列间均方和与列内均方和的比值形式表示。即:若要推翻以上假设,则此比值必须“显著地大”。此比值服从以1和2为自由度的F分布。所谓“比值显著地大”,就是超过指定显著系数所对应的F分
5、布临界值。FF1,2临界值比值显著地大比值与1无显著差异F分布两个独立的t分布被各自的自由度去除,所得之商的比率服从F分布.它是一种非对称分布,图形的形状取决于分子和分母的自由度.F分布的图形FPF(10,4)F(10,10)F(10,50)一向方差分析的方差分析表变异源 自由度 平方和 均方和 F值 P-值处 置 k-1 SSCMSC=SSC/(k-1)误 差 n-kSSEMSE=SSE/(n-k)总 n-1SSTMSC/MSE当检验统计量(MSC/MSE)超过对应于显著系数的F值时,拒绝“所有总体平均数都相等”的假设。或:一个较小的P-值使得决策者更有信心拒绝“所有总体平均数都相等”的假设
6、。F3:F22=(B3:B22-$B$23)2F3:F22=(B3:B22-$B$23)2G3:G22=(C3:C22-$C$23)2G3:G22=(C3:C22-$C$23)2H2:H22=(D3:D22-$D$23)2H2:H22=(D3:D22-$D$23)2方差分析表(ANOVA)航空公司满意分一例EXCEL输出你的你的结论结论如何如何?方差分析的前提条件和程序假定前提:假定前提:(1)各总体都服各总体都服从正态分布;从正态分布;(2)各总体方差各总体方差相等;相等;(3)样本间相互样本间相互独立。独立。程序:(1)提出假设;(2)根据指定的显著水平和观察值总数目、处置数目确定拒绝的最
7、小F 值;(3)求出SSC和SSE,计算样本F 值;(4)比较检验统计量,得出结论。假定前提:(1)各总体都服从正态分布;(2)各总体方差相等;(3)样本间相互独立。程序:(1)提出假设;(2)根据指定的显著水平和观察值总数目、处置数目确定拒绝的最小F 值;(3)求出SSC和SSE,计算样本F 值;(4)比较检验统计量,得出结论。包装方式促销的数据和方差分析表一电台想了解在加利福尼亚州的三个不同城市观众的收视习惯方面是否存在差异。调研者随机从三个城市分别抽出5人组成随机样本,要求每组人员报出其上周收看电视所花的时间(小时),数据见表内。取显著系数0.05,试问他能否得出三个城市在收看电视上所花的时间方面存在差异吗?圣地亚哥洛杉矶旧金山252823313318183521232917273615样本成双比均值,独立配对法不一。配对小样先算差,显著与否看t值。样本独立路有歧:西格码已知直求z;西格码未知s代,合并估计再求t。处置是否有效果,方差分析列表格。组间组内均方比,F分布右尾拖。P值偏大均值等,P值偏小拒假设。卡方分布用处多,非负分布右尾拖。交叉列表判独立,观察期望审拟合。