《如何正确选择统计方法讲稿.ppt》由会员分享,可在线阅读,更多相关《如何正确选择统计方法讲稿.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于如何正确选择统计方法第一页,讲稿共三十二页哦资料类型资料类型设计方案设计方案实验分组实验分组检验条件检验条件第二页,讲稿共三十二页哦表表1 1 单变量资料差异比较的分析方法小结单变量资料差异比较的分析方法小结RC22RR22第三页,讲稿共三十二页哦1111种形式的列联表种形式的列联表2 22 2表表有序(配对)有序(配对)无序(成组)无序(成组)2 2C C表表有序有序无序无序R R2 2表表有序有序无序无序多维列联表多维列联表单向有序单向有序R RC C表表有序有序无序无序双向有序双向有序属性相同属性相同属性不同属性不同分组变量有序分组变量有序指标变量有序指标变量有序第四页,讲稿共三十二
2、页哦表表2 双变量双变量(多变量多变量)资料的关联性分析方法小结资料的关联性分析方法小结R C2第五页,讲稿共三十二页哦二、计量资料分析常见的统计问题二、计量资料分析常见的统计问题2.1 2.1 忽视忽视t t检验的前提条件检验的前提条件2.2 2.2 误用成组设计资料的误用成组设计资料的t t检验分析配对设计资料检验分析配对设计资料2.3 2.3 忽视方差分析的前提条件忽视方差分析的前提条件2.4 2.4 误用误用t t检验分析等级资料检验分析等级资料2.5 2.5 误用误用t t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计2.6 2.6 误用配对设计资料的误用配对设计资
3、料的t t检验处理单因素检验处理单因素k(k3)k(k3)水平设计的资料水平设计的资料第六页,讲稿共三十二页哦2.1 2.1 忽视忽视t t检验的前提条件检验的前提条件 文题:文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表表5 5。原文作者用。原文作者用t t检验分析此资料。检验分析此资料。请问:这样做正确吗请问:这样做正确吗?辨析:辨析:1.1.对表对表5 5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用要求,
4、故不能采用t t检验进行分析。检验进行分析。正确的做法:正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行采用变量变换使数据服从正态分布且方差齐,然后进行t t检验,否则,采用非检验,否则,采用非参数检验。参数检验。2.2.给出确切的统计量和给出确切的统计量和P P值。值。第七页,讲稿共三十二页哦2.2 2.2 误用成组设计资料的误用成组设计资料的t t检验分析配对设计资料检验分析配对设计资料第八页,讲稿共三十二页哦辩析:辩析:1.1.考虑到对数据进行变换是正确的。但是如果采用成组考虑到对数据进行变换是正确的。但是如果采用成组t t检验,还需要检验,还需要两总体方差齐性。两总体方差齐
5、性。但本研究是配对设计,如果采用成组但本研究是配对设计,如果采用成组t t检验,会降低检验效率。检验,会降低检验效率。应应该采用配对该采用配对t t检验进行分析。注意配对检验进行分析。注意配对t t检验的条件:要对每对数据的检验的条件:要对每对数据的差值(差值(d d)进行正态性检验。如果不满足,改用)进行正态性检验。如果不满足,改用WilcoxonWilcoxon符号秩检验符号秩检验。2.2.应给出确切的统计量和应给出确切的统计量和P P值。值。2.2 2.2 误用成组设计资料的误用成组设计资料的t t检验分析配对设计资料检验分析配对设计资料第九页,讲稿共三十二页哦2.3 忽视方差分析的前提
6、条件忽视方差分析的前提条件确切的统计量和确切的统计量和P P值值文题:文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。细胞进行实验。实验分实验分3 3组:组:空白对照组、模型组、姜黄素组,每组设空白对照组、模型组、姜黄素组,每组设6 6个样本。个样本。请问:请问:采用方差分析正确吗采用方差分析正确吗?均数均数标标准差?准差?第十页,讲稿共三十二页哦辨析:辨析:此实验分此实验分3
7、 3组,应为单因素三水平设计定量资料,应首先进行组,应为单因素三水平设计定量资料,应首先进行“独独立性立性”、“正态性正态性”和和“方差齐性方差齐性”检验,如果满足方差分析的检验,如果满足方差分析的3 3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果如果P0.05P0.05P0.05,组间差异无统计学意义,组间差异无统计学意义;:与治疗前比较,与治疗前比较,P0.05P0.05,组内差异有统计学意,组内差异有统计学意义;义;:与对照组(与对照组(G G2 2)比较,)比较,P0.05P0.05P0.05,组间差异
8、无统计学意义,不必在备注中表示。,组间差异无统计学意义,不必在备注中表示。应写出确切的统计量和应写出确切的统计量和P P值。值。2.4 2.4 误用误用t t检验分析等级资料检验分析等级资料第十四页,讲稿共三十二页哦2.5 误用误用t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计1文文题:题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成益气活血法预防老年患者髋部术后下肢深静脉血栓形成统计学处理统计学处理:采用采用SPSS10SPSS10.0 0统计软件,两组间计量资料比较用统计软件,两组间计量资料比较用t t检验。检验。辨析辨析:本研究本研究设计类型为设计类型为:两因素(
9、处理和时间)重复测量设计资料。:两因素(处理和时间)重复测量设计资料。在在资料满足资料满足“独立性独立性”、“正态性正态性”和和“方差齐性方差齐性”的前提条件下,及进行球对称检验,应选的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析用两因素设计的重复测量的方差分析,选用,选用t t检验分析该资料检验分析该资料是不妥的是不妥的。第十五页,讲稿共三十二页哦v 文题:文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T T淋巴细胞亚群的影响。淋巴细胞亚群的影响。v 设计:作者选取设计:作者选取6060例恶性肿瘤患者,随机分成例恶性肿瘤患
10、者,随机分成2 2组。组。试验组在伽玛刀放射治疗的同时试验组在伽玛刀放射治疗的同时给予复方苦参注射液给予复方苦参注射液20ml20ml加入生理盐水加入生理盐水500ml500ml,静脉滴注,静脉滴注,1 1次次d d,10d10d为为1 1个疗程;对照组个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表仅给予伽玛刀放射治疗。试验结果见表7 7。v 请问:统计分析方法选用请问:统计分析方法选用t t检验正确吗检验正确吗?2.5 误用误用t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计2确切的统计量和确切的统计量和P P值。值。第十六页,讲稿共三十二页哦辨析:辨析:1.1.统计分析
11、错误统计分析错误 本试验中,每位受试者在试验前、后两个不同的时间点上被重复本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用量有关的试验因素。原作者用t t检验进行两两比较,则割裂了整体设检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。计,不能准确地估计和控制误差,因而不能得到可靠的结论。
12、正确的做法:正确的做法:应将表应将表7 7的形式改成重复测量试验设计的标准形式,采用的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。与之对应的方差分析进行数据处理。2.5 误用误用t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计2第十七页,讲稿共三十二页哦原文题目:原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观察莪术,文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,水煎剂对未孕大鼠子宫肌电活动的影响,4040只大鼠被随机分成只大鼠被随机分成4 4组,对照组:按组,对照组:按10ml1
13、0mlkgkg鼠重灌服生理盐水,莪术组:按鼠重灌服生理盐水,莪术组:按10ml10mlkgkg鼠重分别灌服鼠重分别灌服2525 、5050 、100100莪术水煎液分成莪术水煎液分成3 3组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的定量资料的t t检验进行统计处理,资料见表检验进行统计处理,资料见表4 4。剂量剂量(g(gkg)kg)峰面积峰面积(mWms)(mWms)持续时间持续时间(s)(s)爆发波个数爆发波个数0 0142.65142.6534.6434.643.503.50
14、1.321.320.540.540.100.102.52.5337.74337.74250.91250.918.828.822.782.781.061.060.340.345.05.0449.50449.50154.45154.459.829.822.892.891.421.420.470.477.57.5651.08651.0898.2098.2013.0713.071.881.881.401.400.250.25表表 莪术水煎剂对大鼠子宫肌电活动的影响(均数莪术水煎剂对大鼠子宫肌电活动的影响(均数标准差)标准差)2.6 误用误用t检验处理单因素检验处理单因素k(k3)设计的资料设计的资料第
15、十八页,讲稿共三十二页哦辨析:辨析:v 没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。v 本资料有四个剂量,属于本资料有四个剂量,属于单因素四水平设计单因素四水平设计的定量资料,不可以用成组设计或配对设的定量资料,不可以用成组设计或配对设计的计的t t检验。检验。v 措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用分析,在得出有统计学意义的结论后,还可进一步采
16、用Dunnett tDunnett t检验或检验或LSDLSD检验。检验。v 如果在专业上有必要对如果在专业上有必要对3 3项指标同时进行考察,还应选用该设计的定量资料的三元方差分项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。析对资料进行处理。2.6 误用配对设计资料的误用配对设计资料的t检验检验处理单因素处理单因素k(k3)水平设计的资料水平设计的资料第十九页,讲稿共三十二页哦3.1 3.1 计算相对数时分母太小计算相对数时分母太小3.2 3.2 误用误用2 2 检验分析结果变量为有序变量的资料检验分析结果变量为有序变量的资料3.3 3.3 误用误用2 2检验回答
17、相关性问题检验回答相关性问题3.4 3.4 多值有序变量的高维列联表资料多值有序变量的高维列联表资料3.5 3.5 不满足连续性不满足连续性2 2检验条件时未做校正检验条件时未做校正3.6 3.6 十一种形式的列联表十一种形式的列联表3.7 3.7 误用误用2 2检验取代检验取代FisherFisher精确检验精确检验3.8 3.8 对对R RC C表直接分割进行两两比较表直接分割进行两两比较三、计数资料分析方法的常见问题三、计数资料分析方法的常见问题第二十页,讲稿共三十二页哦 文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据
18、见表4 4。请问:在表。请问:在表达资料方面有何不妥之处达资料方面有何不妥之处?3.1 计算相对数时分母太小计算相对数时分母太小辨析:辨析:计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。往往会造成错觉。在表在表4 4中,各组样本例数都小于中,各组样本例数都小于2020,样本例数偏小,不宜计算率,直接给出例数就可以。,样本例数偏小,不宜计算率,直接给出例数就可以。确切的统计量和确切的统计量和P P值。值。第二十一页,讲稿共三十二页哦3.2 3.2 误用误用2 2 检验分析结果
19、变量为有序变量的资料检验分析结果变量为有序变量的资料某医生用某医生用A A、B B两药治疗某病各两药治疗某病各240240例例,其疗效分为四个等级:痊愈、显效、好转、其疗效分为四个等级:痊愈、显效、好转、无效无效,见表见表4 4。经。经R RC C表表2 2检验检验,2 2=53.33,=53.33,P P 0.01,0.01,认为两组疗效之间的差异有统认为两组疗效之间的差异有统计学意义。计学意义。辨析:辨析:本资料属于单项有序的本资料属于单项有序的R RC C表,临床疗效有等级之分,对于等级资料可采用表,临床疗效有等级之分,对于等级资料可采用RiditRidit分析或秩分析或秩和检验。而不应
20、用和检验。而不应用R RC C的的2 2检验,检验,R RC C表表2 2 检验只能检验两组内部构成是否相同或频数检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表的分布是否相同,不能检验疗效有无差别。不难看出,若对表4 4资料任意两列数字进行对资料任意两列数字进行对换换,可以清楚地发现可以清楚地发现,2 2值仍为值仍为53.33,53.33,不会有改变。不会有改变。确切的统计量确切的统计量P P值。值。第二十二页,讲稿共三十二页哦3.3 3.3 误用误用2 2检验回答相关性问题检验回答相关性问题l 上述资料上述资料用用2 2检验得:检验得:2 2=1
21、63=163.0101,P P 0 0.005005,结论为:可认为,结论为:可认为冠状动脉冠状动脉硬化的程度硬化的程度与与年龄年龄有关,结合本资料可见有关,结合本资料可见冠状动脉硬化等级冠状动脉硬化等级有随有随年龄年龄增高增高而增加的趋势。而增加的趋势。l 问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?年龄年龄冠状动脉硬化等级冠状动脉硬化等级正常正常轻度轻度中度中度高度高度5043188142456019672169706175578合计计50301141492表表 不同年龄冠状动脉粥样硬化程度的分布不同年龄冠状动脉
22、粥样硬化程度的分布第二十三页,讲稿共三十二页哦辨析辨析1:本资料为本资料为“双向有序且属性不同的二维列联表资料双向有序且属性不同的二维列联表资料”,处理这种资料有,处理这种资料有3 3个目的,因个目的,因此,就对应着此,就对应着3 3套不同的统计分析方法。套不同的统计分析方法。分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。料,选用秩和检验。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析两者间是否存在线性变化趋势则应用线性趋势检验。分析两者
23、间是否存在线性变化趋势则应用线性趋势检验。作者欲考察作者欲考察“两个有序变量之间是否呈相关关系两个有序变量之间是否呈相关关系”,而,而2 2检验结果是检验结果是P0.05P0.05,说明,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。冠状动脉硬化患者在不同年龄组的人数分布是不同的。事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的2 2检验的检验的统计量数值是不会变化的,说明统计量数值是不会变化的,说明2 2检验用于处理有序变量形成的二维列联表资料是不合检验用于处理有序变量形成的二维列联表资料是不合适的。适的。
24、3.3 3.3 误用误用2 2检验回答相关性问题检验回答相关性问题第二十四页,讲稿共三十二页哦辨析辨析2 2:欲考察欲考察“两个有序变量之间是否呈相关关系两个有序变量之间是否呈相关关系”,应选用分析定性资料,应选用分析定性资料的相关分析方法,如:的相关分析方法,如:SpearmanSpearman秩相关分析,秩相关分析,KendallKendall秩相关分析或典秩相关分析或典型相关分析。型相关分析。本例采用本例采用SpearmanSpearman秩相关分析,得:秩相关分析,得:r rs s=0.53215=0.53215,P0.0001P0.050.05或或P P0.0.05 05、P P0.
25、010.01便称结果无显著差异,或结果非常显著。便称结果无显著差异,或结果非常显著。四、统计分析方法表述问题四、统计分析方法表述问题5 5假设检验结果正确的表达方法是:假设检验结果正确的表达方法是:应写出描述性统计量,如样本均数、率、相关系数、回归应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统计量系数、相对危险度、半数效量等,及其可信区间、检验统计量,如,如2 2、t t、u u、F F 值等值等)、P P值;然后根据值;然后根据P P值大小作出统计学推断,值大小作出统计学推断,并作出相应的医学专业结论。并作出相应的医学专业结论。第三十一页,讲稿共三十二页哦感谢大家观看感谢大家观看第三十二页,讲稿共三十二页哦