《9定性资料的统计分析3.pptx》由会员分享,可在线阅读,更多相关《9定性资料的统计分析3.pptx(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、主要内容二项分布简介总体率的可信区间估计Poisson分布简介总体事件数的可信区间估计样本率与总体率的比较两样本率比较的u检验四格表资料的2检验 行列表资料的2检验确切概率法两事件数的比较卡方检验应用的注意事项 第1页/共32页第九节 确切概率法第2页/共32页一、四格表的确切概率法 对于普通四格表资料,当n40或出现至少有一个T1时,因2检验近似程度较差,易导致分析的偏性,2检验不再适用,应当用四格表的确切概率法。四格表的确切概率法本身不属于2检验范畴,只是作为四格表2检验应用上的补充。第3页/共32页四格表确切概率的基本思想 在四格表的周边合计不变的条件下,用下面的计算公式直接计算四格表内
2、四个数据的各种组合的概率。双侧检验:分别计算各种组合中两侧所有A-T值大于等于现有样本A-T值的四格表的Pi值,相加后即得双侧检验的P值。单侧检验:按研究目的只需计算一侧所有A-T值大于等于现有样本A-T值的四格表的Pi值,相加后即为单侧检验的P值。第4页/共32页例、某医院观察了29例脑瘤患者,资料如下表。试分析大脑两半球恶性肿瘤所占比例有无差异。每个格子的A-T均相等,本例等于1.9655 第5页/共32页本例中,列出周边合计(16,13,20,9)不变的情况下 a、b、c、d的各种组合,共10种。按a的数值从小到大排列:本例A-T等于1.9655。第6页/共32页第7页/共32页二、配对
3、四格表的确切概率法 在配对四格表资料中,当b+c20时,因配对四格表2检验近似程度较差,易导致分析的偏性。此时,同样需要用确切概率法来计算。方法与四格表确切概率法有区别,利用二项分布原理。第8页/共32页例、用两种检验方法对某食品作沙门氏菌检验,结果如下表,试用配对四格表的确切概率法比较两种方法的阳性结果是否有差别。第9页/共32页分析思路则在B+C=31不变的前提下,b和c的所有可能取值为(0,31),(1,30),(2,29),(3,28),(28,3),(29,2),(30,1),(31,0),共32种组合。此时,b和c均服从n=31,0.5的二项分布(对称分布)。“获得现有资料及差别更
4、大的资料”包括:(26,5),(27,4),(28,3),(29,2),(30,1),(31,0),及(0,31),(1,30),(2,29),(3,28),(4,27),(5,26)共12种组合。按二项分布原理即可求出这12种组合的概率。第10页/共32页设Xb实际运算中,先计算P(0)第11页/共32页第12页/共32页第十节 两事件数的比较第13页/共32页一般认为单位时间、空间或人群间某独立事件的发生服从Poisson分布。两事件数比较的目的:推断两个样本各自所代表的总体计数有无差别。当样本事件数大于50,Poisson分布近似正态分布。两事件数的比较可利用正态近似原理,采用u检验。第
5、14页/共32页检验统计量u值的计算公式 1、两样本观察单位相同的无重复试验,计算u值的公式:2、两样本观察单位相同的有重复试验,且两样本重复观察次数相等时,利用Poisson分布的可加性原理,将各小单位发生数X相加成相同的大单位X后再计算u值:第15页/共32页3、样本观察单位不同,或在有重复试验中,重复次数不同时,应先将观察单位化成相同的小单位,先求出以小单位为观察单位的平均计数后再计算u值:n1、n2分别为两样本的观察单位数。当n1n2时,该公式与式2完全等价。第16页/共32页例1、分别用甲、乙两种培养基对同一水样作细菌培养,每份水样均取1ml,各培养8次,得细菌个数如下:甲培养基分别
6、为7,5,6,7,4,5,3,6;乙培养基分别为9,8,8,10,7,7,7,9。试比较两种培养基的效果有无差别?第17页/共32页根据题意,本例为观察单位相同(均为1ml水样)的有重复试验,且重复次数相同(n1=n2=8)。故以式2求u值。第18页/共32页例2、某车间在改革生产工艺前,测取三次粉尘浓度,每升空气中分别有38、39、36颗粉尘;改革生产工艺后,测取两次,分别有25、18颗粉尘。问工艺改革前后粉尘颗粒有无差别?第19页/共32页依题意,本例为观察单位相同(均为1 1升空气)的有重复试验,但重复次数不同。以式3 3求u u值。第20页/共32页第十一节 卡方检验应用的注意事项第2
7、1页/共32页一、绝对数的问题 计算2值时,必须用绝对数,而不能用相对数,因为2值的大小与频数大小有关。第22页/共32页二、两个率的比较时,不同2检验公式的适用条件:1、当n40,且T5时,用基本公式计算2值;2、当n40,且1T5时,则用2检验的连续性校正公式;3、当n40,或有T1时,不能用2检验,应当用四格表的确切概率法。4、当2检验所得P值接近检验水准 时,最好使用四格表确切概率法。第23页/共32页三、u检验与 2检验的关系两样本率比较时,如为双侧检验,则u检验和四格表2检验是等价的;校正u检验和校正四格表2检验也是等价的。若为单侧检验,则应该用u检验。第24页/共32页四、配对
8、2检验公式的应用条件 1、当b+c40时,用配对2检验的基本公式计算2值;2、当20 b+c40时,用连续性校正公式来计算2值。3、而当b+c20 时,用配对四格表确切概率法计算。第25页/共32页 五、多个率或构成比比较时,2检验的适用条件:此时行列表中不宜有1/5以上格子的理论频数小于5,或不宜有一个理论频数小于1。否则用似然比检验或确切概率法。第26页/共32页长期来,对理论频数太小有三种处理办法:1、最好增加样本例数以增大理论频数;2、删去上述理论频数太小的行或列;3、将太小理论频数所在行或列的实际频数与性质相近的邻行或邻列的频数合并,使重新计算的理论频数增大。一般认为,后两种方法可能
9、会损失信息,也会损害样本的随机性,故不作为常规方法。第27页/共32页 六、多重比较的问题当多个样本率比较的假设检验结论为拒绝检验假设,只能认为各总体率之间总的说来有差别,而不能说明它们彼此间都有差别,或某两者间有差别。若要进一步明确差别的所在,可进行多重比较。第28页/共32页 七、资料独立性的问题率或构成比的2检验,都假设各比较组间是独立的,组与组之间是无序的。如果组间是有序的。例如,比较三种病情(轻、中、重)的病人之治愈率,2检验只能得出三组间有无差别(大小的比较),却得不到如病情越严重治愈率越低这样的相关性的结论。此时,将其中的任何两列不同治愈率的数值进行调换,2值不会发生变化。这类资料的分析可以用秩和检验、Spearman相关分析等方法来进行。第29页/共32页双向有序分类资料(列联表)不同期次矽肺患者的肺门密度级别分布矽肺期次肺门密度合计+I43188 14245II 1 96 72169III 6 17 55 78合计50301141492第30页/共32页Thanks!第31页/共32页谢谢大家观赏!第32页/共32页