《spss平均数差异t检验.pptx》由会员分享,可在线阅读,更多相关《spss平均数差异t检验.pptx(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第九章 类别变项分析:卡方考验1课程目标了解类别资料的特性了解残差分析的原理 了解卡方考验的原理了解各种类别变项关联系数了解各种顺序变项关联系数熟习类别变项的各种SPSS统计应用第1页/共21页第九章 类别变项分析:卡方考验2类别资料的分析 类别资料的产生原发性类别资料:当被测定的变项的本质是名义性的属性,例如性别资料操弄性类别资料:以人为操作的手段所获致的分类性资料,例如实验操弄的分类结果虚拟化类别资料:由其他类型的资料型态转换成类别形式的资料,例如由连续变项转换来的类别变项类别资料的基本型态次数与百分比类别资料的呈现 次数分配表与列联表类别资料的分析卡方检定与其他关联性分析法第一节第2页/
2、共21页第九章 类别变项分析:卡方考验3类别变项的考验类型适合度考验 某一个变项是否与某个理论分配或母群分配相符合 考验的内容仅涉及一个变项,是一种单因子考验 独立性考验 同时检测两个类别变项X与Y之间的关系时,其目的在于检测从样本得到的两个变项的观察值,是否具有特殊的关联。若检定不同人口母群体,在某一个变项的反应是否具有显著差异。称为同质性考验。多重列联表分析 探讨三个或以上类别变项之间是否具有关联(非独立)或无关(独立)第一节第3页/共21页第九章 类别变项分析:卡方考验4列联表列联表为两个单一类别变项的次数分配表的整合呈现直行(column)变项以X表示,横列(row)以Y表示如果X变项
3、具有k个水平,Y变项具有l个水平,称为kl列联表边际分配marginal distribution列联表的侧缘数据(右侧及下方的次数分配),反应两个变项的次数分配状况,也就是两个独立的次数分配表细格次数边际次数所包夹的区域称为细格cells,反应两个变项的互动关系两个类别变项是否具有关联性,就是在检查各细格当中次数的变化情形 第一节第4页/共21页第九章 类别变项分析:卡方考验5残差分析(residual analysis)残差分析各细格期望次数与观察次数的差值的分析期望值(以 表示)是各细格所相对应的两个边际人数百分比(Pi.与)的乘积乘以总人数在特定边际次数的条件下,两个变项无关联时,细格
4、次数在随机情况下的最可能值,或称为最大概似(maximum likelihood)期望值 第二节第5页/共21页第九章 类别变项分析:卡方考验6残差(residual)残差残差各细格实际观察人数减去期望人数,又称为(delta)值 残差越大,各细格分布越不如期望般的出现,两个变项有某种关联,残差越小,表示各细格分布越接近期望,两变项无关联 正残差值表该细格的观察次数高于两个变项无关时的期望值负残差值表该细格的观察次数低于两个变项无关时的期望值 第二节第6页/共21页第九章 类别变项分析:卡方考验7标准化残差(standardized residual)标准化残差残差为未标准化统计量数。将残差除
5、以标准误,得到标准化残差 将标准化残差平方后加总,即得Pearson 2,也就是我们常用的卡方值 分布呈标准化常态分配N(0,1),可利用常态化Z分配进行统计决策调整后标准化残差(adjusted standardized residual)标准化残差会随着边际期望值的大小变动而产生波动若将标准化残差以各边际比率进行调整,得到调整后标准化残差,可以排除各边际次数不相等所造成的比较问题 第二节第7页/共21页第九章 类别变项分析:卡方考验8卡方考验 卡方考验将样本统计量转换成卡方值,配合卡方分配所进行的统考验原理是以细格次数来进行交叉比较,俗称交叉分析2值的大小,代表统计量与理论值的差异程度,一
6、旦2值大于显著水平的临界值,即表具有统计意义残差分析是卡方考验显著后的事后考验程序卡方考验显著之后,再以残差分析来检验各细格的状况第二节第8页/共21页第九章 类别变项分析:卡方考验9卡方分配令X为一常态化随机变量,以N(,2)表示从此一随机变量中任意抽取一个样本,将X值转换成标准分数(Z分数),再将Z分数取平方,此时,Z2被定义自由度为1的卡方随机变量卡方变量由于是Z分数的平方,因此呈现正偏态分配,而非对称分配。卡方变量介于0到1的机率,等于Z分数介于1时的机率(68.26%)。第二节第9页/共21页第九章 类别变项分析:卡方考验10小样本的卡方检验小样本问题当样本很小时,以上述卡方公式所导
7、出的数值仅是一个卡方近似值,而非真正卡方分配下的数值。小样本应使用校正值,例如耶兹校正(Yates correction for continuity)或费雪正确机率考验(Fishers exact probability test)前后测资料,应使用麦内玛考验(McNemar test)第二节第10页/共21页第九章 类别变项分析:卡方考验11关联系数 Phi()系数反应两个二分类别变项(例如类别为男女、是否的类别变项)的关联性系数系数与卡方值之间具有可转换的数学关系 系数系修正了样本数对于卡方值的影响,开根号之后,系数即等同于Pearsons r,数值介于-1至1 第三节第11页/共21页
8、第九章 类别变项分析:卡方考验12关联系数列联系数(列联系数(coefficient of contigency)当两个类别变项有任何一个超过两个水平,卡方值可能会大于样本数,造成系数大于1的情况列联系数可以加以修正Cramers V系数(系数(Cramers V coefficient)列联系数公式所求出的系数虽然数值不会大于1,但是亦难接近1,尤其是当样本数越大时,列联系数会减小,可用Cramer的V系数来修正此一问题第三节第12页/共21页第九章 类别变项分析:卡方考验13削减误差导出系数 削减误差比(proportioned reduction in error;PRE)指以某一个类别
9、变项去预测另一个类别变项时,能够减少的误差所占的比例 E1表示以未知X时预测Y时所产生的误差,即期望误差(预测不准的细格期望值)E2表示以已知X时预测Y时所产生的误差(预测不准的细格次数)削减误差比的应用PRE指数是一个介于0与1的一个统计量PRE值越大,可削减的误差比例越大,两个变项的关联性越强PRE比例越小,两个变项的关联性越低强调两个变项间的非对称关系的检验适用于当两个类别变项有明确的独变项与依变项区别之时 第三节第13页/共21页第九章 类别变项分析:卡方考验14Lambda()系数Goodman与Kruskal(1954)所提出一种以削减误差比来计算两类别变项关联性的关联系数利用类别
10、变项中的众数组(mode)来作为削减误差计算的基准对称(symmetrical):指X与Y两个变项的关系是对等的,无法区别何者为依变项,何者为独变项非对称(asymmetrical):指X与Y两个变项可指定独变项与依变项第三节第14页/共21页第九章 类别变项分析:卡方考验15Tau(y)系数 Goodman与Kruskal所创以PRE为基础的关联系数 原理与非对称形式类似,系比较直行边际比例和横列边际比例进行预测的误差机率,但Tau系数的计算考虑了所有的次数,因此敏感度较Lambda系数为高 小写f表示细格次数,大写F为边际次数 第三节第15页/共21页第九章 类别变项分析:卡方考验16顺序
11、变项的关联分析:Gamma系数 Goodman&Kruskalt提出将依顺序排列的资料,进行各细格的配对比较遇到同样等第的资料则不予计算。非同分的资料(untied pairs)同序配对(concordant pairs):指两个变项上的等第变动呈现相同的方向,以Ns表示异序配对(disconcordant pairs):指某配对观察值在X与Y变项的等第变动呈现相反的方向,以Nd表示Gamma系数的计算不涉及边际次数的计算,因此又称为免边际(margin-free)的系数当样本数越大时(大于50),Gamma系数的抽样分配呈现常态化,可以配合统计考验来检验Gamma系数的统计意义 当同分状况比
12、重太高时,Gamma系数无法反应这些细格的资料而导致敏感度降低,宜采用其他系数(如Tau-b系数)第四节第16页/共21页第九章 类别变项分析:卡方考验17Tau-b与Tau-c系数 Kendall所提出,原理类似于Gamma系数的一种对称性关联系数Tau-b系数将独变项上同分但依变项不同分的顺序配对,以及独变项上不同分但依变项同分的顺序配对纳入考量(但不处理两者同时同分的配对观察值),使得关联系数的计算更能反应细格内数据的变化 当列联表呈现正方形时(两个变项的组数或数值数目相等),b系数的数值会介于正负1之间。当数值越接近0,表示两变项的关联性越低。列联表不是呈现正方形时(两个变项的组数或数
13、值数目不相等),宜使用c系数 m表示组别数(等第数目)较少的变项的组别数(等第数目)第四节第17页/共21页第九章 类别变项分析:卡方考验18Somerss dyx类似于Gamma系数的一种基于PRE概念的顺序变项非对称性量数可用于描述某一个变项对于另一个变项的预测或解释情形 dyx量数在分母增加了一项对于被预测变项(依变项)的等第相同的细格次数,扩大了被预测变项的数据的反应能力 第四节第18页/共21页第九章 类别变项分析:卡方考验19Kappa量数 Cohen(1960)提出适用于具有相等顺序数值的两个顺序变项关联性分析(也就是行与列的数值数目相同),交叉表呈现正方形 Kappa系数所反应的是两个顺序变项的等级是否相同,也就是当第一个顺序变项为1时,在另一个变项的顺序是否也为1如果相同等级的情形越多,Kappa系数越高。又称为同意量数(measures of agreement)对角线上的次数才被视为正确判断,因此在顺序变项关联性分析的各系数当中,Kappa可以说是最严格的一个量数,数值通常最低 第四节第19页/共21页第九章 类别变项分析:卡方考验20Time for restChapter 9 is done here.See you later!第20页/共21页第九章 类别变项分析:卡方考验21感谢您的观看!第21页/共21页