《论文撰写中常见的统计学问题.docx》由会员分享,可在线阅读,更多相关《论文撰写中常见的统计学问题.docx(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、论文撰写中常见的统计学问题 关键词:统计学问题 绝大多数的撰写,均需通过肯定数量临床病例(或资料)的视察,探讨事物间的相互关系,以探讨客观存在的新规律。如确定新诊断、新治疗等措施是否优于原沿用的方法,就需进行两种方法比较,这就涉及统计处理;统计设计又是整个课题探讨设计中一个重要的组成部分。明显,经正确统计处理的结果可信度高,论文的质量也高。据不完全统计,在难以发表的、已凝合着作者心血并花费较长时间与较大财力撰写的探讨论文中,约半数以上是由于统计错误致其结果与原文主要结论相违反。如一文采纳某新药引产,96例足月孕妇的产后出血与新生儿低Apgar评分率均为2.1%(各2例),明显低于应用原药引产的
2、19例,其产后出血与新生儿低Apgar评分发生率均为15.8%(各3例,2=7.164,P<0.001)。故认为采纳新药引产是一更平安的措施。原药引产组例数偏少暂且不谈,该资料比较应采纳精确法分析,结果是与原结果恰恰相反(P>0.05),这样上述的主要结论就欠牢靠而难以发表,否则论文可起误导作用。类似问题文稿中还常有出现。现就文稿中常见的统计问题及其相应的处理方法简述如下。一、常用的统计术语统计学中常用的概念有总体与样本、随机化与概率、计量与计数、等级资料及正态与偏态分布资料、标准差与标准误等。如某探讨采纳经会阴途径测定宫颈长度,以探讨不同宫颈长度与临产时间的关系。结果显示35例宫
3、颈长度为2534mm者与32例宫颈长为1524mm者临产时间的均值标准差(xs)各为57.658.1与47.349.1小时。该计量资料,经t检验显示t=0.780,P>0.05,并未提示不同宫颈长度的临产时间差异有显著意义;从标准差大于均值,显示各变量值离散程度大,呈偏态分布,故不能采纳xs这一算术均数法计算均数。经偏态转换成近似正态分布资料后结果是:35例与32例的临产时间各为34.54.1与26.74.1小时,(t=7.778,P<0.001),两组差异有极显著意义。可认为随着宫颈长度的缩短、临产时间也缩短。此外,当两组资料单位不同时,其S单位也不同;即使两组单位相同的变量值,
4、若其均数差异较大,也都应以变异系数替代s来比较两组值的离散度的大小。二、正常值范围及异样阈值的确定如何选择探讨对象,至少需多少例,正确统计处理和参考肯定数量的病例数据,是确定正常值范围及异样阈值的四个重要因素。1.探讨对象:应为“完全健康者”,可包括患有不影响待测指标疾病的患者。如“正常妊娠”的条件:孕前月经周期规则、单胎、妊娠过程顺当、无产科并发症及其它有关合并症,分娩孕周为3741周+6,新生儿诞生体重为25004000g和Apgar评分7分。2.视察数量:视察数量应尽可能多于100例;需分组者,各组人数也是如此(标原来源困难时酌情削减)。有些指标值如雌三醇(E3)、甲胎蛋白(AFP)、胎
5、盘泌乳素(HPL)等随孕周进展而改变,应按孕周分组;邻近孕周均数相近者,可合并几周计算。若为偏态分布,应以百分位数计算,则例数应120例。取各孕周对象时,应考虑到所取各孕周中的例数分布大致均衡。明显,文稿中往往以少量例数求得正常值是欠牢靠的。3.统计处理:应依据所得数据分布特征采纳不同的统计处理方法。属正态或近似正态分布的数据,可采纳xs法计算;这也适用于以肯定方法能将非正态分布转换成正态或近似正态分布的资料。对无法转换的偏态资料,应采纳百分位数计算法。详细计算(包括上下限初步制定)见文献。4.比照数量:相应视察的病例数(包括分组)应不少于30例,这对制定某指标有临床意义的异样阈值尤其重要,这
6、一点往往易被忽视。如在参考较多病例数据后,唾液游离E3的下限异样阈值应为第2.5百分位数,而非通常采纳的5百分位数。否则,将会导致该指标产前监护的假阳性率增加。三、t检验与校正t检验(t检验)这是文稿中极易混淆的一类计量资料统计问题。(一)检验的留意事项1.t检验的意义:t检验与全部统计分析相同,其结果提示现有差别不仅仅是抽样误差所致,且提示犯第一类错误的可能性大小,即t0.05与t0.01犯第一类错误的可能性各为5%与1%。2.统计意义与临床意义的关系:统计学有显著意义,而在临床上可能是无意义的,提示该探讨应接着深化,以明确该差异是否真有显著意义;相反,统计无显著意义,而临床上却是有意义的,
7、不能贸然轻易地下结论。应复查试验设计、方法、试剂及仪器性能、质控措施和试验数据等是否有问题,或尚需再进一步增加样本量进行复测等。3.t检验适用范围:t检验仅适用于正态或近似正态分布(包括偏态转换)和其方差是齐性资料的检验;t检验适用于可比性资料,即除了欲比较的因素外,其它全部可影响的因素应相像。4.t检验的结果推断:推断结果不应肯定化,P<或>0.05,分别表示可拒绝或接受原定的假设,但两者都有5%的可能性犯第一类错误;而P值越小,只能是更有理由拒绝原定的假设。5.单侧与双侧检验:应预先制定本探讨的结果是需行双侧还是单侧检验。对有把握确知某治疗措施或某指标是不会劣于现有的,才作单侧
8、检验;若不知何者为优,应行双侧检验。因为在同一t值的界限上,单侧检验的概率(P)仅为后者的一半,也就是说单侧检验较双侧检验更易得出差别有统计意义的结论,不行随意制定。一般讲,绝大多数探讨以采纳双侧检验为妥。(二)t检验与t检验的区分当两样本均数的方差非齐性时,应以t替代t检验。例如:甲组32例血清某指标值为53.949.6(mol/L);乙组6例的结果为26.67.2(mol/L),若不考虑两样本方差大小,t检验示t=1.331,P>0.05,提示两组血清该指标的平均含量差异无显著意义。但先作方差齐性检验,F=47.4,P<0.01,示这两样本方差差异有极显著意义。据此应采纳t检验,t=2.952>t0.012.875,P<0.01。明显,与上述结论恰恰相反。