《RC表资料的分析.pptx》由会员分享,可在线阅读,更多相关《RC表资料的分析.pptx(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节一般四格表2检验一、2检验的基本思想 2检验基本思想是衡量实际频数(actual frequency)和理论频数(theoretical frequency)之间的偏离度 第1页/共66页第r行第c列位置上理论数的计算公式Trcnrnc/n 【例8.1】某中医院收治376例胃脘痛患者,随机分成两组,用中药胃金丹和西药治疗,探讨两种药物疗效有无差别 组组别别有有效效无无效效合合计计有效率有效率胃金丹胃金丹A11a271A12b5276(ab)98.19%西药组西药组A21c74A22d26100(cd)74.00%合合计计345(ac)31(bd)376(n)91.76%第2页/共66页H
2、0:两种药物的疗效相同,有效率345/37691.76%胃金丹组有效理论数T11276345/376253.24西药组有效理论数T21100345/37691.76合计无效率31/3768.24%,T1222.76,T228.24 反映实际数和理论数吻合的程度2值应较小 df(行数1)(列数1)(R1)(C1)第3页/共66页df(21)(21)1 二、一般四格表的2检验行属性行属性列属性列属性合合计计甲甲乙乙IababIIcdcd合合计计acbdnabcd第4页/共66页解 H0:两组疗效相同;H1:两疗效不相同 公式名称公式名称公式公式适适用用条条件件自由度自由度编号编号一般基本卡方一般基
3、本卡方n40且且T5df19-5一般专有卡方一般专有卡方n40且且T5df19-6校正基本卡方校正基本卡方n40且且1T5df19-7校正专有卡方校正专有卡方n40且且1T5df19-8n40,每个格子都有T5,用一般卡方检验 第5页/共66页按自由度df1查2界值表,20.01(1)6.63,因2 20.01(1),P0.01,按0.01水准拒绝H0,认为两药治愈率不同 第6页/共66页【SPSS操作】以组别、疗效及例数为变量名,建立数据文件L8-1.savAnalyze Descriptive Statistics Crosstable,选组别到Rows框,疗效到Column框;Stati
4、stics 选 Chi-Square、Contingency coefficient Continue。第7页/共66页data L27_20;do r=1 to 2;do c=1 to 2;input f;output;end;end;cards;271 5 74 26;proc freq;weight f;tables r*c/chisq expected norow nocol nopct;run;第8页/共66页第9页/共66页【例8.2】甲组用活血温经汤,乙组用通塞脉1号治疗,问两药的疗效有无差别 组别组别有效人数有效人数无效人数无效人数合计合计通塞脉通塞脉1号号26733活血温经汤
5、活血温经汤36238合计合计62971解 H0:两组疗效相同;H1:两组疗效不同 n40,最小理论数T12 933/714.18因有理论数1T5,用校正卡方 第10页/共66页查2界值表,得P0.05,不拒绝H0,两种疗法效果无统计学差异,不能认为两法疗效不同 2四格表2检验的注意事项 自由度为1的四格表,在总样本例数n40,有理论频数1T5时,用不校正的2值查2界值表,所得概率偏低,误差较大,必须校正 第11页/共66页 用专有公式计算2值,要先计算最小理论数。自由度df1时,u20.05/220.05(1)(即1.962 3.84),u20.01/220.01(1)(即2.57582 6.
6、63),故n较大时的两样本率比较,既可用u检验,又可用2检验 分类资料在划分阳性、阴性时信息量损失太大,而且划分界限不同,得出的统计结论也可能不同。在资料的划分归类时,必须结合专业知识,具备充分的理由才能确定某一划分界限。如果有明确的专业规定,例如:舒张压在90mmHg以上列为高血压,SGPT大于40单位列为异常,也可将定量资料转为分类资料进行处理 第12页/共66页当总样本含量n40时;或者 用其它假设检验方法所得概率接近检验水准时;或者 四格表中有实际频数为0或有理论数T1时,都无法用2检验,常用以超几何分布为前提的确切概率法(exact test)8.2 四格表确切概率法【例8.3】研究
7、某药改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对照,将37个病例随机分到2组,试分析该药的疗效。第13页/共66页组别组别改善改善无效无效合计合计改善率(改善率(%)用用药药组组1552075.0安慰剂组安慰剂组3141717.6合合计计18193748.6H0:某药无效,H1:某药有效。样本含量n=37 40,宜采用四格表确切概率法。双侧确切概率P=0.001,单侧确切概率P=0.001,故拒绝H0,认为该药能够改善周围血管闭塞性病变患者的皮肤微循环状况。第14页/共66页【SPSS操作】四格表数据合为一列输入为变量x的值,变量m、n以值1、2分别代表数据所在的行或列。选择Dat
8、aWeight Cases命令,把x选入Frequency Variable框进行加权。选择AnalyzeDescriptive Statistics Crosstable命令,选m进入Rowss框,n进入Columns 框,击Statistics按钮,指定Chi-squarer,击ContinueOK按钮,得到 第15页/共66页由n3840,宜用Fishers Exact Test。双侧确切概率P0.003,单侧确切概率P0.001,故拒绝H0,认为该药能够改善周围血管闭塞性病变患者的皮肤微循环状况 第16页/共66页8.3 分层四格表分析【例8.4】3试验中心各等比例完成50例,4周3天
9、血常规异常者清单。试分析两组药物及中心效应 疗效疗效中心中心1中心中心2中心中心3正常正常异常异常正常正常异常异常正常正常异常异常A组组41940103911B组组351534163614第17页/共66页【DPS操作】分层四格表,输入数据以行属性表示分层(中心、疗效)、列属性表示不分层(分组)41359154034101639361114第18页/共66页选定数据块,选择分类数据统计菜单“分层四格表”命令,可得 组号组号OROR值值95%置信区间置信区间M-H卡方卡方P-值值Vi11.95240.76414.98871.95390.16224.606121.88240.75704.68051
10、.85240.17354.858631.37880.55323.43660.47520.49064.7348合并合并 1.71361.00822.91243.96140.0466加权卡方M-H4.0014 P0.0455 校正卡方3.4508 P0.0632Mantel&Fleiss 样本含量检验参数37.5000 比数比一致性检验 当OR1.7136时卡方=0.3339 df=2 P=0.8462比数比趋势检验 取间隔为1递增卡方0.2695 df1 P0.6036第19页/共66页由校正卡方3.4508,概率P0.06320.05,表明去除中心混杂作用后,疗效与分组无关。在一致性检验中,概
11、率P0.84620.05,表明不同层间的OR值相同,去除中心混杂作用后,正常的危险度大约为异常的1.7136倍 SPSS统计软件 以中心、组别、疗效、例数为变量名,建立数据文件L8.4.sav,对例数加权,AnalyzeDescriptive Statistics Crosstable,选疗效进入Rows框,组别进入Columns框,中心进入Layer(分层变量)框 Statistics,选 Risk(危险度),Cochrans and Mantel-Haenszel statistics(分层变量的独立性及同质性检验)第20页/共66页双向无序RC表,即行列皆无序的表。RC表资料,在没有小于
12、5的理论频数且总例数很大时,用2检验法,可以推断样本率或构成比间的差异,也可推断行与列的属性间有无关系 8.4 RC表的统计分析 8.4.1 双向无序RC表 第21页/共66页【例8.5】某医院将用三种治疗方法治疗199例消化性溃疡住院病人,资料如表9-10。为避免中医不同证型对疗效比较的影响,试分析三种疗法治疗的病人按中医分型构成比有无差别 生胃宁素715293788中药组412161951表9-10 三组消化性溃疡住院病人四种证型的构成组别肝胃不和胃阴不和脾胃虚寒寒热夹杂合计西药组35153760合计14326093199第22页/共66页解 H0:三组的中医分型构成比相同;H1:三组的中
13、医分型构成比不同 df(31)(41)6,查2界值表,20.05(6)12.59,P0.05。不能认为三种疗法治疗的病人按中医分型构成比有差别 RC表的分析,要注意以下几点 第23页/共66页1.2检验要求理论数T不太小一般认为RC表中不宜有20%以上格子的T5,不能有T1。理论数太小时的处理办法:最好增加样本例数以增大理论数。删去理论数太小的行和列。将太小理论数所在行或列的实际数与性质相近的邻行邻列合并,使重新计算的理论数增大。须知,后两法可能会损失信息,也会损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作为常规方法。不满足2检验条件的RC表资料,最好计算确切概率 第24页/共6
14、6页2.RC表的确切概率法步骤确定一个统计量,例如2值列出行合计与列合计固定的全部可能的RC表,对于每一个表计算统计量和P值;凡统计量大于原始表的统计量值的那些RC表的P值之和,即为确切概率P值,一般用统计软件完成SPSS,AnalyzeDsecriptive statisticCrosstabs,击Statistics按钮,指定Chi-square及Exact:Monte Carlo(确切概率:蒙特卡洛法)第25页/共66页3.2检验拒绝H0,只能说明有差异,不能说明优劣【例8.6】用某种药物的三种剂量各治疗100例病人疗效药物剂量(毫克/公斤体重)102030治愈506070未愈50403
15、0合计100100100第26页/共66页把第1,2列对换,计算结果完全一样,这时虽可得出治愈与药物剂量有关的结论,但不能推论治愈率随药物剂量增加而升高 疗效疗效药物剂量药物剂量(毫克毫克/公斤体重公斤体重)102030治愈治愈605070未愈未愈405030合计合计100100100第27页/共66页4.实验分组变量无序,指标变量有序时,宜用秩和或检验Ridit分析。但当实验分组变量有序,指标分组变量无序时,仍可用双向无序RC表分析方法 5.多个样本率或构成比的2检验拒绝H0时,只能认为各总体率或构成比之间总的来说有差别,不能说明它们彼此间都有差别,可进一步用2分割法作多个样本率间的“两两比
16、较”。8.4.3 双向有序但属性不同RC表 第28页/共66页在卡方检验有统计学意义时,Pearson列联系数R可以计算为R在01间,近于1说明关系愈密切,近于0没有关系【例8.7】老年环混浊度与眼底动脉硬化级别关联 眼底动脉眼底动脉硬化级别硬化级别老老年年环环混混浊浊程程度度合计合计正常正常7(3.25)830(1.67)3(2.75)21I级级16372131087IIA级级1230278885IIB级级420128(4.44)1256III级级0(0.46)0(1.13)2(0.77)1(0.24)0(0.39)3合计合计3995642033252第29页/共66页解 可用单向有序2检验
17、,H0:老年环混浊度与眼底动脉硬化级别无关 理论数小于5的格子有9个,超过总数的20%,将IIB级和III级合并求2值 df(41)(51)12,20.05(12)21.03,P0.05,按0.05水准拒绝H0,可认为老年环混浊度与眼底动脉硬化级别有关联 第30页/共66页【DPS操作】IIB级和III级合并后,是双向有序且属性不同的45表。选定数据块,选择分类数据统计菜单“列联表Spearman相关”命令 Spearman 相关系数0.2219df250P0.0004选择分类数据统计菜单“线性趋势分析”命令 拟合优度卡方22.6545 df12 P0.0308 第31页/共66页选择分类数据
18、统计菜单“列联表对应分析”命令 No.相关系数相关系数 特征值特征值卡方值卡方值自由度自由度显著水平显著水平 卡方卡方%10.26070.068017.124660.008875.590320.13400.01804.525340.339619.975230.06310.00401.004620.60514.4345合计合计-0.089922.65458.5 方表统计分析 8.5.1 McNemar检验 第32页/共66页双向有序且属性相同的RC表有RC,称为方表(square table)。在诊断检验中,对水平数3的配伍设计问题,进行一致性(agreement)或吻合性检验,通常使用McNe
19、mar检验和Kappa检验 甲评估甲评估的类别的类别乙评估的类别乙评估的类别合计合计12k1x11x12x1cm12x21x22x2cm2kxc1xc2xccmc合计合计n1n2ncn第33页/共66页McNemar检验用来检验配对方表中关于对角线两侧的计数值是否对称,如果不对称,则表示两个评估结果不一致的部分在一个方向的改变较另一个大。其检验假设为:H0:xijxji,对于所有的ij,方表中关于对角线两侧的计数值对称,即两者吻合 dfk(k1)/2【例8.8】某医院神经科对近三年收治的96例内囊出血病人的发生部位进行分析,发生于左侧者55例,右侧者4l例,试问内囊出血是否好发在左侧?第34页
20、/共66页H0:左发生率右发生率,H 1:左发生率右发生率。8.5.2 Kappa检验 2(a-b)2(a+b)(55-41)2(55+41)=2.042 P0.1,可认为内囊出血左右两侧发生率无差别。医药工作检查同一患者、同一X片、同一病理切片可能判断不一致。Kappa检验称一致性检验,Kappa值简记为K 第35页/共66页PA为实际观察到的一致率;Pe为期望一致率,称期望率,即两次检查结果由于偶然机会所造成一致率 第36页/共66页估计其抽样误差大小的统计量为Kappa值的标准误,用符号sK表示 Kappa值在1至1之间,K值愈接近1,表明一致程度愈好。K1说明两次判断的结果完全一致,K
21、1说明完全不一致,K0说明两次检查结果很不一致。K0.75可说明已经达到相当满意的一致程度,K0.4可说明一致程度不够理想 第37页/共66页Landis和Koch对四格表提出K判断表 Kappa值值一致性程度一致性程度0弱弱0.000.20轻轻0.210.40尚好尚好0.410.60中度中度0.610.80高度高度0.811.00极强极强【例8.9】对100例肠结核患者同时作临床诊断和X线诊断,推断两种方法诊断结果是否吻合;推断两种方法诊断结果是否一致;推断两种方法诊断结果间有无相关关系。样本K值是否来自为零总体,H0:K=0 第38页/共66页【DPS操作】双向有序且属性相同33方表,按表
22、输入数据,选分类数据统计菜单“McNemar检验及Kappa检验”命令 X线诊断线诊断临床诊断临床诊断合计合计检检出出可疑可疑未未检检出出检检出出22121347可疑可疑461323未未检检出出651930合计合计322345100第39页/共66页McNemar检验检验卡方卡方=10.13450df=3p=0.017457Po=0.4700Pe=0.3383Kappa值值=0.1990标准误标准误=0.0690U=2.8853p=0.002095%的置信区间的置信区间0.06380.334299%的置信区间的置信区间0.02130.3767Fleiss等的近似标准误等的近似标准误0.0742
23、895%的置信区间的置信区间0.05340.344699%的置信区间的置信区间0.00770.3904第40页/共66页McNemar检验H0:临床诊断和X线诊断结果吻合;卡方=10.13450、P0.01750.05,可以认为两法诊断结果不吻合Kappa检验H0:临床诊断和X线诊断的结果不具有一致性;Kappa值=0.1990,U=2.8853、P 0.0020,可认为两种方法诊断结果轻度一致。【例8.10】用168个血吸虫病肝纤维化病例进行回代检验,结果专家诊断为气虚血瘀的78例,判别模型诊断为气虚血瘀的82例,判别模型和专家诊断同诊断为气虚血瘀的72例。第41页/共66页专家诊断专家诊断
24、判别模型诊断判别模型诊断合计合计气虚血瘀气虚血瘀非气虚血瘀非气虚血瘀气虚血瘀气虚血瘀72678非气虚血瘀非气虚血瘀108090合合计计8286168McNemar检验检验卡方卡方=0.5625df=1p=0.4533Po=0.9048Pe=0.5009Kappa值值=0.8092标准误标准误=0.0771U=10.5004p=0.0000第42页/共66页McNemar检验H0:两种诊断结果吻合;卡方=0.5625、P0.4533,可以认为两诊断结果吻合。Kappa检验H0:两种诊断结果不一致;Kappa值=0.8092,U=10.5004、P 0.0000,可认为两种方法诊断结果一致。【例8
25、.11】复方鱼腥草片合剂治疗老年性慢性支气管炎100例,第一疗程有效率为60%;第二疗程有效率为75。本例为两疗程疗效比较,为配对资料,这100例可有四种情况:两疗程均有效50例;第一疗程有效但第二疗程无效25例;第一疗程无效而第二疗程有效10例;第一、二疗程均无效15例。第43页/共66页第一疗程第一疗程第二疗程第二疗程合计合计有效有效无效无效有效有效501060无效无效35540合计合计8515100McNemar检验检验卡方卡方=12.80000df=1p=0.000347Po=0.5500Pe=0.5700Kappa值值=-0.0465标准误标准误=0.0814U=-0.5717p=0
26、.7162第44页/共66页McNemar检验H0:两个疗程的疗效与一个疗程的疗效相同;卡方=12.8000、P0.0003,可以认为两个疗程的疗效高于一个疗程。Kappa检验H0:两个疗程的疗效与一个疗程的疗效不一致;Kappa值=-0.0465,U=-0.5717 、P 0.7162,可以认为两个疗程的疗效与一个疗程不一致。第45页/共66页两两比较的方法有2分割法、改变检验水准 8.6 两两比较 8.6.1 2分割法 1k表的2分割 2分割法是利用2值的可加性原理,把原RC表分割为若干个分割表,这些分割表的自由度之和等于原RC表的自由度,其2值之和十分接近原来RC表的2值。第46页/共6
27、6页【例8.12】观察某省三个地区的花生污染黄曲霉毒素的情况,试比较三个地区污染率的差别情况:地区地区检验的样品数检验的样品数合计合计污染率污染率(%)未污染未污染污染污染甲甲6232979.3乙乙30144431.8丙丙831127.6合计合计44408447.6H0:三个地区花生黄曲霉毒素污染率相同;第47页/共66页2 17.907;自由度df=2,P0.000。拒绝H0,接受H1,认为三个地区花生的黄曲霉毒素污染率不同,有地区性差异。地区地区未污未污染数染数污染污染数数合计合计污染率污染率(%)2双侧近似双侧近似P值值乙乙30144431.80.0050.942比较比较1丙丙83112
28、7.3(df1)合计合计381755甲甲6232979.317.8340.000比较比较2乙乙+丙丙38175530.9(df1)合计合计444084第48页/共66页进一步作两两比较:由表可见,乙、丙两地区污染率的差异最小,将其分割出来,作2检验。见表中的“比较1”,2=0.005,双侧近似P值0.942;所以可把乙、丙两样本合并后,再和甲地区比较,见中的“比较2”,2=17.834,双侧近似P值0.000。可认为甲地区与乙丙地区的花生污染率差异有统计学意义,甲地区较高。分割计算表中,两分割比较的自由度之和为1+1=2,它等于原表的自由度;两分割比较的2值之和为17.839,与原表计算出的2
29、值17.907相近。这说明所采用的分割是正确的。若分割的自由度之和、2值之和,与原表不相符,则说明分割有误。第49页/共66页2RC表的2分割【例8.13】为研究血型与胃溃疡、胃癌的关系,AB型因例数过少而略去。推断血型与胃部疾病的构成有无差别。血型血型胃溃疡胃溃疡胃癌胃癌对照对照合计合计O98338328924258A67941626253720B13484570788合计合计179688360878766第50页/共66页H0:不同血型的胃部疾病构成无差别;2=87669832/(17964258)+3832/(8834258)+5702/(6087788)-1=40.543 自由度df=
30、4,P0.05。可以认为胃癌组与对照组构成差异无统计学意义。故可将这两组合并后与胃溃疡组比。血型血型胃癌胃癌对照对照合计合计O38328924258A41626253720B84570788合计合计88360878766第52页/共66页()检验胃溃疡组与胃癌+对照组A、B型构成差别2=0.685,自由度df=1,P=0.40800.05。可以认为A型与B型构成差异无统计学意义。故可以合并A型与B型构成。血型血型胃溃疡胃溃疡胃癌胃癌+对照对照合计合计A67930413720B134654788合计合计81336954508第53页/共66页()检验胃溃疡组与胃癌+对照组O,A+B型构成的差别:
31、2=34.298,以df=1,P=0.0000.01,可以认为胃溃疡组O型明显高于胃癌+对照组。血型血型胃溃疡胃溃疡胃癌胃癌+对照对照合计合计O98332754258A+B81336954508合计合计179669708766第54页/共66页8.6.2 改变检验水准法 1多个实验组与同一对照组比较 2检验拒绝H0时,用四格表进行两两比较不能再用原来的检验水准0.05作为是否拒绝H0的标准。需要重新规定检验水准 第55页/共66页【例8.14】筛选治疗精神抑郁症的药物,均与同一安慰剂作对照,问各种药物的效果 效果效果安慰剂安慰剂药物药物1药物药物2药物药物3药物药物4药物药物5合计合计改善改善
32、8122115141989不变或恶化不变或恶化2218915161191合计合计303030303030180解 26双向无序表,计算得到214.78,df3,P0.05。认为不同药物治疗抑郁症的效果有不同 各种药物分别和安慰剂比较(H0:药物与安慰剂效果同),此时应改变检验水准为第56页/共66页药物1与安慰剂:21.20,df1,P0.005,0.05,认为药物1治疗抑郁症无效 比较比较改善改善无效无效合计合计安慰剂安慰剂82230药物药物1121830合合计计204060类似,药物2与安慰剂比较:211.28,P0.005药物3与安慰剂比较:23.45,P0.005药物4与安慰剂比较:2
33、2.58,P0.005药物5与安慰剂比较:28.15,P0.005第57页/共66页22k表多组间的两两比较 2k表多组间两两比较,需要对检验水准进行估计 六处理的两两比较进行6(61)/215次四格表的2检验,故检验水准0.05/150.0033 dfk1 8.7 同一样本多个构成比的比较 第58页/共66页k为构成比的个数;总样本含量n=n1+n2+nk“两两比较”的统计检验公式【例8.15】某医院对332例甲状腺患者进行手术针刺麻醉,试检验针麻效果的等级构成比是否相等 针麻效果针麻效果例数例数构成比构成比15346.0813239.76257.53226.63合计合计332100.00第
34、59页/共66页解 H0:总体等级构成比相等 df3,P0.01,按0.01水准拒绝H0,认为针麻效果的总体等级构成比之间有差别。需要进行6次四格表的2检验。故0.05时,两两比较的检验水准为0.05/60.0083,20.00836.9676 第60页/共66页比较组比较组(ninj)2ninj 2值值与与4412851.55与与1638417892.04与与1716117598.06与与1144915772.92与与1210015478.57与与9470.19在总的0.05水准上,级和级、级和级,构成比的差别无统计学意义;而级和级、级和级、级和级、级和级,构成比的差别有统计学意义 第61页
35、/共66页样本率与总体率的比较,容量的双侧检验估计式为 8.8 定性分析样本含量估计 8.8.1 样本率与总体率的比较 单侧检验时,只要将公式中的双侧界值u/2改为单侧界值u。第62页/共66页【例8.16】用旧药治疗慢性胃炎的近控率为30%,现试验新药疗效,要求新药的近控率必须达到50%才能推广使用,取0.05,0.1,估计每组所需观察病例数。故双侧检验时需56例,单侧检验时需45例。第63页/共66页8.8.2 两个独立样本率比较 单侧检验时,只要将公式中的双侧界值u/2改为单侧界值u。【例8.17】某医师用A、B两种药治疗慢性胃炎,预试验得到A药显效率为60%,B药显效率为85%,拟进一步正式试验,取0.05,0.1,估计每组所需观察病例数。第64页/共66页故双侧检验时,每组需68例,共需136例。单侧检验时,每组需55例,共需110例。第65页/共66页谢谢您的观看!第66页/共66页