《研究生统计学讲义RC表资料分析.pptx》由会员分享,可在线阅读,更多相关《研究生统计学讲义RC表资料分析.pptx(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1研究生统计学讲义研究生统计学讲义RC表资料分析表资料分析 2分布曲线偏向左边,随自由度分布曲线偏向左边,随自由度df的不同而不同,自由度越小越偏,自由度相当大时,的不同而不同,自由度越小越偏,自由度相当大时,2分布曲线接近正态分布曲线分布曲线接近正态分布曲线。第1页/共55页用用 2(df)表示自由度为表示自由度为df时时水准的水准的 2界值,界值,P(2 2(df)=表示自由度为表示自由度为df时,时,2值大于界值值大于界值 2(df)的概率为的概率为。本书附表列出了按。本书附表列出了按P(2 2(df)=编制的单侧编制的单侧 2界值表。界值表。例如,直接查附表,得单侧例如,直接查附
2、表,得单侧 2界值界值 20.05(5)=11.07,它表示自由度,它表示自由度df=5时,时,2值大于值大于11.07的概率为的概率为0.05,即,即P(211.07)=0.05.显然,显然,P(2,则没有理由拒绝,则没有理由拒绝H0。2与与P值的对应关系值的对应关系(即分布的规即分布的规律律)可查附表可查附表6,2界值表。界值表。第7页/共55页表表8-3四格表四格表 2检验统计量的计算公式检验统计量的计算公式基本公式基本公式 专有公式专有公式 校正公式校正公式专有公式的校正专有公式的校正 n40,T5n40且且1T 20.05(1),P0.05,按,按=0.05水准拒绝水准拒绝H0,认为
3、两药治愈率不同。,认为两药治愈率不同。二、二、一般四格表的一般四格表的 2检验检验第9页/共55页例例8.2某中医院将某中医院将71例血栓闭塞性脉管炎例血栓闭塞性脉管炎期期23级患者随机分成甲、乙两组,甲组用活血温经汤,乙组用通塞脉级患者随机分成甲、乙两组,甲组用活血温经汤,乙组用通塞脉1号治疗,结果如表号治疗,结果如表10-4。问两药的疗效有无差别?。问两药的疗效有无差别?表表8-4两组疗效比较两组疗效比较组组别别有效人数有效人数无效人数无效人数合计合计通塞脉通塞脉1号号26733活血温经汤活血温经汤36238合合计计62971第10页/共55页H0:即两组疗效相同;:即两组疗效相同;H1:
4、即两疗效不同。:即两疗效不同。=0.05如无统计软件,先计算理论数,本四格表最小理论数如无统计软件,先计算理论数,本四格表最小理论数(行合计、列合计均为最小值所在位置上的理论数行合计、列合计均为最小值所在位置上的理论数)T12=933/71=4.18,因有理论数,因有理论数1T40,用式,用式(10.8)计算校正计算校正 2值:值:本例若不用校正本例若不用校正 2,则,则 2=4.06,查,查 2界值表,得界值表,得P40,有理论频数,有理论频数1T0.05,表明去除中心混杂作用后,疗效与分组无关。一致性检验给出了,表明去除中心混杂作用后,疗效与分组无关。一致性检验给出了4种,概率种,概率P0
5、.8460.05,表明不同中心间的,表明不同中心间的OR值相同值相同第21页/共55页上表表示:调整中心混杂作用后的综合上表表示:调整中心混杂作用后的综合OR值、自然对数值及置信区间,表明去除中心混杂作用后,正常的危险度大约为异常的值、自然对数值及置信区间,表明去除中心混杂作用后,正常的危险度大约为异常的1.714 倍倍第22页/共55页第二节第二节 四格表确切概率法四格表确切概率法 四格表确切概率法四格表确切概率法(exactprobabilitiesfor22table)又称又称Fisher确切概率法确切概率法(Fishersexacttest)。系英国统计学家。系英国统计学家Fisher
6、利用超几何分布于利用超几何分布于1934 年提出。四格表资料:当年提出。四格表资料:当总样本含量总样本含量n40时;时;用其它假设检验方法所得概率接近检验水准时;用其它假设检验方法所得概率接近检验水准时;四格表中有实际频数为四格表中有实际频数为0或有理论数或有理论数T0.10。如使用如使用SPSS11.5 统计软件:建立数据文件统计软件:建立数据文件L10.10.sav 以后,操作过程和界面都同例以后,操作过程和界面都同例10.2。按。按0.05水准不拒绝水准不拒绝H0,可认为三组病人中医各型的构成比相同。,可认为三组病人中医各型的构成比相同。第29页/共55页注意事项:注意事项:1 2检验要
7、求理论数检验要求理论数T不太小,否则将导致分析的偏性。一般认为不太小,否则将导致分析的偏性。一般认为RC表中不宜有表中不宜有20%以上格子的以上格子的T5,不能有,不能有T1。理论数太小时的处理办法:。理论数太小时的处理办法:最好增加样本例数以增大理论数。最好增加样本例数以增大理论数。删去理论数太小的行和列。删去理论数太小的行和列。将太小理论数所在行或列的实际数与性质相近的邻行邻列合并,使重新计算的理论数增大。须知,后两法可能会损失信息,也会损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作为常规方法。将太小理论数所在行或列的实际数与性质相近的邻行邻列合并,使重新计算的理论数增大。须
8、知,后两法可能会损失信息,也会损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作为常规方法。不满足不满足 2检验条件的检验条件的RC表资料,最好计算表资料,最好计算RC表的确切概率。表的确切概率。第30页/共55页2RC表的确切概率法计算概率的步骤:表的确切概率法计算概率的步骤:(1)确定一个统计量,例如)确定一个统计量,例如 2值,计算原表的值,计算原表的 2值记为值记为 02;(2)列出边际和固定的全部可能的)列出边际和固定的全部可能的RC表,对于每一个表计算该统计量(比如表,对于每一个表计算该统计量(比如 2值)及其值)及其P值。值。(3)凡统计量(比如)凡统计量(比如 2值)
9、大于原始表的统计量值(即值)大于原始表的统计量值(即 2 02)的那些)的那些RC表的表的P值之和,即为确切概率值之和,即为确切概率P值。值。用用SPSS11.5,在数据编辑窗建立配伍格式数据文件以后在数据编辑窗建立配伍格式数据文件以后,AnalyzeDsecriptivestatisticCrosstabs,选择选择“行变量行变量”进入进入Rows,选择选择“列变量列变量”进入进入Columns。Statistics,选选Chi-squareContinueExact:MonteCarlo:Continue;OK。即输出确切概率。即输出确切概率P值。值。第31页/共55页3 2检验拒绝检验拒
10、绝H0时时,只能说明有差异只能说明有差异,不能说明优劣。不能说明优劣。例例8.6用某种药物的三种剂量各治疗用某种药物的三种剂量各治疗100例病人,治愈情况如表例病人,治愈情况如表8-9.2=8.33,df=2,P0.05为合格为合格.例:例:性别性别,病情病情,的轻、中、重可比性分析,的轻、中、重可比性分析1.两组性别的可比性分析两组性别的可比性分析分组分组 男男 女女 合计合计受试组受试组 60(a)70(b)130(a+b)对照组对照组 50(c)58(d)108(c+d)合计合计 110(a+c)128(b+d)238(n)第51页/共55页=0.0000查卡方界值表查卡方界值表,因为,
11、因为所以所以P0.05。结论:两组性别比例的差别无统计学意义,可比性合格。结论:两组性别比例的差别无统计学意义,可比性合格。第52页/共55页2.两组多列资料的可比性分析两组多列资料的可比性分析-病型的可比性分析病型的可比性分析分组分组证证型型受试组受试组10059491985312对照组对照组5929161986209合计合计159886538171521命门火痕命门火痕心脾受损心脾受损肝郁不舒惊恐伤肾湿热下注肝郁不舒惊恐伤肾湿热下注合计合计解:因为行列都是无序变量,所以采用卡方检验。解:因为行列都是无序变量,所以采用卡方检验。第53页/共55页结论:两组阳痿病人中医证型比例差别有统计学意义,两组中医证型不均衡,可比性不合格。结论:两组阳痿病人中医证型比例差别有统计学意义,两组中医证型不均衡,可比性不合格。第54页/共55页