《医学统计方法常见错误.pptx》由会员分享,可在线阅读,更多相关《医学统计方法常见错误.pptx(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计分析思路统计分析思路先统计描述后统计学推断先单因素分析后多因素分析先计量资料后计数、等级资料第1页/共41页一、统计描述中的常见错一、统计描述中的常见错误:误:1.频数表分类变量与有序分类变量直接列表比较各类别频数分布的均匀性比较各组间分布形态的一致性数值变量 最小值、最大值、分组数、组距、频数表观察频数分布的对称性比较两组分布的一致性第2页/共41页2.统计量分类变量与有序分类变量构成比、率、比数值变量均数、标准差、最小值、最大值、中位数第3页/共41页 在资料的表达和描述中,常见的错误有:1.编制统计表时,分组标志(横标目)与观测指标(纵标目)位置颠倒、线条过多或过少、数字的小数点位数
2、不一致或单位重复出现在数字之后,最严重的问题是表中数据的含义未表达清楚,令人费解。2.绘制统计图时,坐标轴上的刻度值标得不符合数学原则、资料与所选用的统计图类型不匹配。3.选用统计指标来描述平均水平和离散趋势时,使用正态分布方法表达呈偏态分布的资料;运用相对数来描述计数资料时,比与率混淆。第4页/共41页 表1 两组褥疮愈合时间指数对比()资料描述有无问题?资料描述有无问题?第5页/共41页应用相对数应注意的问题应用相对数应注意的问题 1.计算相对数的分母一般不宜过小:观察单位足够多时,计算出的相对数比较稳定,一般要求观察单位数不小于 30。2.分析时不能以构成比代替率。3.在比较相对数时应注
3、意可比性。影响率与构成比变化的因素很多,除了研究因素外,其余的影响因素应尽可能相同或相近。4.两个样本率比较时应该进行假设检验。第6页/共41页率与比的区别率与比的区别率是指某种事物发生的频率或强度,是事物实际发生的例数与可能发生某事物总人口数之比。比(构成比):说明某一事物内部组成部分所占的比重。将构成比错误地当作率来使用,这是临床科研中最常见的错误之一。由于医院中资料的局限性,所得的数据一般只能计算构成比。由于构成比通常不能说明事物发生的强度,而且某一类别的构成比的大小受到其他类别数量变化的影响,因而其应用有较大的局限性。第7页/共41页 表2是某医院统计门诊沙眼病人年龄构成的数据。作者由
4、此得出了20岁组人口最易患沙眼的结论。表2 某医院门诊沙眼病人的年龄构成 第8页/共41页表3 两种方法治愈率的比较 需要标准化需要标准化第9页/共41页二、统计学推断常见错误二、统计学推断常见错误单因素分析(处理因素为分类变量)(1)结果变量为数值变量:注意应用条件 t检验或方差分析、秩和检验 (2)结果变量为有序分类变量:秩和检验 (3)结果变量为分类变量:卡方检验 第10页/共41页两个定性变量资料的统计分析两个定性变量资料的统计分析 RC表资料 2检验 单向有序RC表资料 秩和检验 双向有序且属性不同 等级相关分析 双相有序且属性相同 Kappa检验第11页/共41页 1.t检验应用时
5、常见的错误检验应用时常见的错误t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持。传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍。t检验方法简单,其结果便于解释。第12页/共41页由于有些人对该方法理解不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。可大致概括为以下两种情况:1)不考虑t检验的应用前提,对两组的比较一律用t检验;2)对多组的资料的比较,多次用t检验进行均值之间的两两比较。第13页/共41页 实例:
6、为确定老年人围手术期头孢唑啉钠的合理用法和用量,某研究小组对60岁以上与60岁以下者的头孢唑啉钠药物动力学特征分别进行了测量,并进行了比较,部分结果见表4。第14页/共41页 表4 两组患者头孢唑啉钠药物动力学参数比较忽视忽视t检验的前提条件。检验的前提条件。研究者依据研究者依据P值认为两组在值认为两组在,k10两项指标上差异无统计学意义。两项指标上差异无统计学意义。第15页/共41页实例 研究单味中药对小鼠细胞免疫机能的影响,把40只小鼠随机均分为4组,每组10只,雌雄各半,用药15d后测定E-玫瑰结形成率(%),结果如下,试比较各组总体均值之间的差别有无统计学意义?常见的错误做法是:重复运
7、用成组设计资料的常见的错误做法是:重复运用成组设计资料的t检验对检验对4个组的均值进行个组的均值进行6次次两两比较。两两比较。第16页/共41页而正确的做法是,先进行单因素4水平设计资料的方差分析,若4个总体均值之间的差别有统计学意义,再用q检验等方法进行多个均值之间的两两比较。第17页/共41页实例:研究大豆黄酮对sp2/0肿瘤细胞DNA合成影响,在大豆黄酮组中,加入3HTdRh,1h,2h,4h分别测Cpm值。每次试验均设空白对照,每个大豆黄酮剂量均设一式3份,结果取平均值。数据均以平均值标准差表示。表5 大豆黄酮sp2/0肿瘤细胞DNA合成影响的时间-效应关系 注:*P5,故可用一般2检
8、验。得:2=40.000 第26页/共41页原作者未作任何统计处理,只是从其痊愈率上看治疗组大于对照组(73%55%),从而得出“治疗组的痊愈率明显高于对照组”的结论来。表12 针灸偏历治疗网球肘116例与对照组比较第27页/共41页 表13 产次与新生儿低体重率 原作者采用一般的2检验方法,得2=6.99,P0.05,结论为“不同产次的低体重发生率差异有统计学意义,第二产低体重率最低体重率最低,大于等于第三产低体重率及相对危险度上升”。第28页/共41页差错分析 该资料的2值仅仅说明总体上不同的产次间低体重发生率至少有两组间的差别有统计学意义,并不意味每两组间的差异都有统计学意义,要比较任何
9、两种产次间的差别,应进行两两比较。解决方法 需降低每次检验的检验水平数值,若=0.05,可令=0.05/C,其中C等于比较的次数,本例C=3采用 2分割法(要求分表的自由度等于总表的自由度、分表的2值之和等于总表的2值)进一步分析。第29页/共41页3.四格表资料分析方法的选用标准。四格表资料分析方法的选用标准。当总样本含量n40,且理论频数T均大于5时,一般的2检验。当总样本含量n40,但有理论频数满足1T5时,连续性校正的2检验。当总样本含量n40或有理论频数小于1时,Fisher的精确检验。第30页/共41页 表14 不同分娩方式与重症肝炎孕妇的结局 误用一般误用一般2检验取代检验取代F
10、isher精确检验,精确检验,本例:本例:P。第31页/共41页1.区分统计区分统计“有统计学意义有统计学意义”与医学与医学/临床临床/生物学生物学“有实际意义有实际意义”。统计“有统计学意义”对应于统计结论,医学/临床/生物学“有实际意义”对应于专业结论。假设检验是为各专业服务的,统计的结论必须和专业结论有机的相结合,才能得出恰如其分、符合客观实际的最终结论。三、统计学结论注意事项:三、统计学结论注意事项:第32页/共41页2.误误解解了了“P0.01”与与“P0.05”的的真正含义。真正含义。解释“P0.01”与“P0.05”含义时常犯的错误有些人在解释具有统计学意义的统计结果时,常根据P
11、值是“0.05”还是“0.01”作出肯定程度不同的专业结论。例如,当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到“P0.001”,则认为甲药极显著地优于乙药;若得到“P0.01”,则认为甲药非常显著地优于乙药;若得到“P0.05”,则认为甲药显著地优于乙药。第33页/共41页差错分析 统计学上根据假设检验原理推算出来的P值,表示拒绝特定的零假设可能犯假阳性错误的概率的理论值,它的大小不反映对比的两者之间实际值差别的程度大小。第34页/共41页3.统计检验结果不完善的表达方式。统计检验结果不完善的表达方式。多种多样表达统计检验结果的方式:资料未经过任何统计处理,仅根据实际数据的大小,凭
12、经验作出某组与另一组之间的差别有统计学意义的结论;作了统计处理,但未交代选用的是何种统计分析方法,仅给出P值;作了统计处理,也交代了所选用的统计分析方法,并给出了P值,但未给出统计量的具体值。第35页/共41页释疑:所选用的统计分析方法;统计量的具体取值;假设检验的具体P值;有关总体参数的95%可信区间。第36页/共41页 4.关于多重线性回归的结果表达:关于多重线性回归的结果表达:常常采用一个表格将分析的结果进行总结归纳。常常采用一个表格将分析的结果进行总结归纳。表格中包括如下主要的统计量:表格中包括如下主要的统计量:偏回归系数的估计值偏回归系数的估计值、偏回归系数的标准误偏回归系数的标准误、标准偏回归系数标准偏回归系数、t值值、P值值,有时还包括,有时还包括偏回归系数的偏回归系数的95置信区间置信区间。方方差分析结果和确定系数差分析结果和确定系数一般可作为备注列在表的下方。一般可作为备注列在表的下方。第37页/共41页第38页/共41页 分析的目的 资料的类型 资料的分布 设计方案 样本含量大小 第39页/共41页谢谢!谢谢!第40页/共41页感谢您的观看!第41页/共41页