《医学科研设计与统计学思维.ppt》由会员分享,可在线阅读,更多相关《医学科研设计与统计学思维.ppt(89页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医学科研设计与统计学思维医学科研设计与统计学思维浙江大学公共卫生学院沈 毅2013.11.5第一页,编辑于星期一:十二点 十分。没有设计的临床干预试验没有设计的临床干预试验 16851685年抢救英国国王查理二世(年抢救英国国王查理二世(Charles II Charles II,1630-16851630-1685):):“一一品品脱脱(0.568L0.568L)血血从从右右臂臂放放出出,半半品品脱脱血血从从左左肩肩放放出出,服服下下催催吐吐剂剂、两两付付汤汤药药和和一一种种由由1515成成份份的的灌灌肠肠剂剂。刮刮国国王王的的头头部部,直直到到起起一一个个大大泡泡。再再服服打打喷喷嚏嚏的的
2、药药粉粉和和更更多多的的催催吐吐剂剂。继继续续放放血血,加加服服止止痛痛剂剂。把把沥沥青青和和鸽鸽子子粪粪混混合合后后敷敷于于脚脚上上。服服一一种种含含有有1010种种成成份份的的草草药药。最最后后服服人人头头盖盖骨骨粉粉制制成成的的4040滴滴糖糖浆浆,外外敷敷牛牛黄黄。然后,国王陛下死了。然后,国王陛下死了。”第二页,编辑于星期一:十二点 十分。有设计的临床干预试验有设计的临床干预试验 1747年5月20日,英国的J.Lind医生将12名病情相同似的患者带到一艘船上。患者的主要症状是牙龈溃烂,皮肤有出血点,双膝无力。Lind将12名患者分为6组,分别给予下列主要干预:A组:每天饮1夸脱(1
3、.136L)苹果汁;B组:服25滴硫酸丹剂(elixir vitriol),每天3次;C组:服2匙醋,每天3次;D组:每天饮约半品脱海水,服缓和的泻药;E组:每天食2个桔子,一个柠檬;F组:每天服由大蒜、芥子等成份组成的干药。当当6 6月月1616日日船船返返回回英英国国PlymouthPlymouth港港时时,所所有有患患者者的的病病情情都都有有好好转转,其其中中E E组组恢恢复复的的最最快快、最最好好,其其中中一一人人到到第第6 6天天就就可可以以工工作作了了。B B组组也也有有一一人人比比登登船船时时健健康康。LindLind医医生生的的试试验验并并没没有有得得出出明明确确的的结结论论,
4、直直到到160160年年后后,通通过过动动物物实实验验才才真真正正从从科科学学意意义义上上解解释释了了E E组组疗疗效效最最好好的的真真正正原原因。因。第三页,编辑于星期一:十二点 十分。J.Lind医生的研究有二点符合统计学的设计:1、设立了对照(相互对照);2、质量控制(消除了一些混杂)。如果我们今天重复J.Lind的研究,在统计设计的上还需要做到以下几点:1、研究对象的定义与纳入标准和排除标准2、足够多的观察对象3、效应指标的选择4、结论是否能外推第四页,编辑于星期一:十二点 十分。“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”F.Yates,M.
5、J.R.Healy医学论文中的统计问题医学论文中的统计问题 统计知识的运用统计知识的运用 撰写论文:报告自己观察或实验的研究结果撰写论文:报告自己观察或实验的研究结果 阅读论文:吸收新知识,了解学术进展阅读论文:吸收新知识,了解学术进展 1996年,对申报科技成果的年,对申报科技成果的4586篇科研论文分析,篇科研论文分析,统计方法使用率为统计方法使用率为76%。医学论文中统计运用错误,除了影响论文的科学性,医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。还可能导致严重的伦理学问题。第五页,编辑于星期一:十二点 十分。统计学方法用于干预试验统计学方法用于干预试验 18
6、35年,法国医生年,法国医生P.C.A.Louis 对当时流行的对当时流行的“放血放血”疗法治疗疗法治疗肺炎的效果进行了比较,发现肺炎的效果进行了比较,发现“放血放血”的疗效不象预期的那么好,而且早的疗效不象预期的那么好,而且早期期“放血放血”和晚期和晚期“放血放血”组比较,患者的诊断、病情、病程、年龄等方组比较,患者的诊断、病情、病程、年龄等方面的差异很大,比较平均治愈时间意义不大。因为晚期面的差异很大,比较平均治愈时间意义不大。因为晚期“放血放血”组的平均组的平均治愈时间长,但该组患者病情重、病程长、年龄大。治愈时间长,但该组患者病情重、病程长、年龄大。Louis对医学研究的方法学作出了很
7、大贡献:对医学研究的方法学作出了很大贡献:(1)用数字的方法表示不同疾病患者的特征和预后;)用数字的方法表示不同疾病患者的特征和预后;(2)提出了临床疗效对比的前瞻性原则;)提出了临床疗效对比的前瞻性原则;(3)提出抽样误差和混杂()提出抽样误差和混杂(confounding)概念。其中前瞻性研)概念。其中前瞻性研究和减少混杂,分别成为当今临床试验和流行病学研究的基本研究方法;究和减少混杂,分别成为当今临床试验和流行病学研究的基本研究方法;(4)在)在J.Gavarret 的协助下,的协助下,Louis的数字方法发展为的数字方法发展为“概概率框架率框架”,Gavarret也于也于1840年在巴
8、黎出版了世界第一部医学年在巴黎出版了世界第一部医学统计学教科书。统计学教科书。第六页,编辑于星期一:十二点 十分。“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”F.Yates,M.J.R.Healy医学论文中的统计问题医学论文中的统计问题 统计知识的运用统计知识的运用 撰写论文:报告自己观察或实验的研究结果撰写论文:报告自己观察或实验的研究结果 阅读论文:吸收新知识,了解学术进展阅读论文:吸收新知识,了解学术进展 1996年,对申报科技成果的年,对申报科技成果的4586篇科研论文分析,篇科研论文分析,统计方法使用率为统计方法使用率为76%。医学论文中统计
9、运用错误,除了影响论文的科学性,还医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。可能导致严重的伦理学问题。第七页,编辑于星期一:十二点 十分。“调查结果反映了医学论文作者统计知识和统计水平的低下,也再次强调了生调查结果反映了医学论文作者统计知识和统计水平的低下,也再次强调了生物统计学者不是令人生畏的检查官。恰恰相反,生物统计学者是我们的可贵盟物统计学者不是令人生畏的检查官。恰恰相反,生物统计学者是我们的可贵盟友。生物统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大友。生物统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大厦中的一个支柱厦中的一个
10、支柱”-JAMA-JAMA的编辑部的编辑部60年年代代到到80年年代代,国国外外医医学学杂杂志志调调查查结结果果:有有统统计计错错误误的的论论文文20%72%。1984年年对对中中华华医医学学杂杂志志、中中华华内内科科杂杂志志、中中华华外外科科杂杂志志、中中华华妇妇产产科科杂杂志志、中中华华儿儿科科杂杂志志595篇篇论文的调查结果:论文的调查结果:相对数误用为相对数误用为11.2%抽样方法误用抽样方法误用15.9%统计图表误用统计图表误用11.7%1996年年对对4586篇篇论论文文统统计计(中中华华医医学学会会系系列列杂杂志志占占6.9%),数据分析方法误用达数据分析方法误用达55.7%。第
11、八页,编辑于星期一:十二点 十分。科学容不得半点虚假,造假者一旦被揭露就背上科学容不得半点虚假,造假者一旦被揭露就背上了永远洗脱不掉的耻辱了永远洗脱不掉的耻辱 。伪造统计数据违反科学道德伪造统计数据违反科学道德 据据1976年年New Science 杂志关于科研舞弊行为的调杂志关于科研舞弊行为的调查查74%的调查表反映有不正当修改数据的情况,其中,的调查表反映有不正当修改数据的情况,其中,17%拼凑实验结果,拼凑实验结果,7%凭空捏造数据,凭空捏造数据,2%故意曲解结果。故意曲解结果。就统计学本身来说,正确实验设计得出的统计结果,是就统计学本身来说,正确实验设计得出的统计结果,是用用P值作为
12、值作为“重现性重现性”的概率保证。的概率保证。P0.05,就是说实验,就是说实验结果显示的差别是机遇所致的可能性不足结果显示的差别是机遇所致的可能性不足5%,或者说,别,或者说,别人在同样的条件下重复同样的试验,得出相反结论的人在同样的条件下重复同样的试验,得出相反结论的可能性不足可能性不足5%。第九页,编辑于星期一:十二点 十分。1.采用统计学方法,发现不确定现象采用统计学方法,发现不确定现象背后隐藏的规律。背后隐藏的规律。变异变异(variation)是社会和生物医学中的普)是社会和生物医学中的普遍现象。遍现象。变异使得实验或观察的结果具有变异使得实验或观察的结果具有不确定性不确定性,如,
13、如每个人的身高、体重、血压等各有不同。每个人的身高、体重、血压等各有不同。一、为什么要学统计学?一、为什么要学统计学?第十页,编辑于星期一:十二点 十分。最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.57。第十一页,编辑于星期一:十二点 十分。2.用统计学思维方式考虑有关医学研究用统计学思维方式考虑有关医学研究中的问题中的问题 “阳性阳性”结果是否是虚假联系?结果是否是虚假联系?某感冒药治疗某感冒药治疗1周后,治愈率为周后,治愈率为90%,能否说该感冒药十分有效,能否说该感冒药十分有效?“阴性阴性”结果是否是样本含量不足?结果是否是样本含量不足?有人曾对发
14、表在有人曾对发表在Lancet,N Engl J Med,JAMA等著名医学等著名医学杂志上的杂志上的71篇阴性结果的论文作过分析,发现其中有篇阴性结果的论文作过分析,发现其中有62篇(篇(93%)可能是由于)可能是由于样本含量样本含量不足造成的假阴性。不足造成的假阴性。第十二页,编辑于星期一:十二点 十分。l如:当专业上有一定联系的两个变量之间的变化呈“S型”或“倒S型”曲线趋势时,若错误地用直线方程去描述,从统计学角度看效果也很好,但在专业上是解释不通的。再比如,某两个统计量(如均值、率等)之间的差别在统计学上有显著性意义,有时在专业上并无实用价值。如某种新的降压药,平均降低血压 2 mm
15、Hg,若样本含量较大,误差又较小,统计检验可能会得到“P0.05”的结果,但在临床上却认为此新药的疗效没有多大提高。l另外,在运用统计学中,稍有不慎都可能犯这样或那样的错误。因此,统计结论的可靠性仍需通过实践去检验。l所以,应当牢记:运用统计学时必须结合医学实际,才能真正发挥统计学应有的作用。组别N基线血压(mmHg)治疗后血压(mmHg)标准差(mmHg)P值统计学意义临床意义治疗组20016014460.05有无对照组2001601426第十三页,编辑于星期一:十二点 十分。l例:某医生用一种新的治疗某病的疗法(简称治疗组),用现在公认的疗法作为对照(简称对照组),经临床试验,对照组和治疗
16、组的疗效分别为P1=75%与P2=95。问:能认为这两个有效率之间的差别有显著性意义吗?答:这两个有效率之间的差别可能有统计学意义,也可能没有统计学意义。因为其结论不仅取决于二者之差的绝对值大小,更主要的是取决于随机误差的大小和样本大小,千万不可轻率地作出统计推断。现假定这两个有效率分别来自下列甲、乙、丙三批实验的结果,则具有下列3种不同的统计检验结果(表11)。第十四页,编辑于星期一:十二点 十分。表1、两个有效率的比较甲实验中,P1与P2之间的差别无统计学意义(校正2=1.765,P0.05)乙实验中,P1与P2之间的差别有统计学意义(26.275,0.01P0.05);丙实验中,P1与P
17、2之间的差别也有统计学意义(29.412,P0.01)。第十五页,编辑于星期一:十二点 十分。第十六页,编辑于星期一:十二点 十分。3.保证你的研究论文能通过统计学审查保证你的研究论文能通过统计学审查 据国外据国外6080年代对不同医学杂志发表论文的调年代对不同医学杂志发表论文的调查,有查,有统计错误的论文的百分比最高达统计错误的论文的百分比最高达72%,最低也有,最低也有20%。国内国内1984年对年对中华医学杂志中华医学杂志、中华内科杂中华内科杂志志、中华外科杂志中华外科杂志、中华妇产科杂志中华妇产科杂志、中华儿科杂志中华儿科杂志595篇论文的调查结果,相对数误用篇论文的调查结果,相对数误
18、用为为11.2%,抽样方法误用,抽样方法误用15.9%,统计图表误用,统计图表误用11.7%。某研究者。某研究者1996年对年对4586篇论文统计(中华医学篇论文统计(中华医学会系列杂志仅占会系列杂志仅占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。第十七页,编辑于星期一:十二点 十分。2023/3/3 JAMA,新新英英格格兰兰医医学学杂杂志志(NEJM)、英英国国医医学学杂杂志志、中中华华医医学学会会杂杂志志对对来来稿稿都都有统计学要求有统计学要求或统计学指导。或统计学指导。国国际际生生物物医医学学杂杂志志编编辑辑协协会会在在其其生生物物医医学学期期刊刊投投稿稿的的统统一
19、一要要求求中中也也包包含含了了统计学要求。统计学要求。Uniform Requirements for Manuscripts Submitted to Biomedical Journals http:/www.acponline.org第十八页,编辑于星期一:十二点 十分。中华医学杂志中华医学杂志对来稿中统计学处理的有关要求对来稿中统计学处理的有关要求1统计研究设计:应交代统计研究设计的名称和主要做法。如调查设计统计研究设计:应交代统计研究设计的名称和主要做法。如调查设计(分为前瞻性、回顾性或横断面调查分为前瞻性、回顾性或横断面调查研究研究);实验设计;实验设计(应交代具体的设计类型,如自
20、身配对设计、成组设计、交叉设计、析因设计、正交设计等应交代具体的设计类型,如自身配对设计、成组设计、交叉设计、析因设计、正交设计等);临床试;临床试验设计验设计(应交代属于第几期临床试验,采用了何种盲法措施等应交代属于第几期临床试验,采用了何种盲法措施等)。主要做法应围绕。主要做法应围绕4个基本原则个基本原则(随机、对随机、对照、重复、均衡照、重复、均衡)概要说明,尤其要交代如何控制重要非试验因素的干扰和影响。概要说明,尤其要交代如何控制重要非试验因素的干扰和影响。2资料的表达与描述:用资料的表达与描述:用x 和和s表达近似服从正态分布的定量资料,用表达近似服从正态分布的定量资料,用M(Q)表
21、达呈偏态分布的定量资料;表达呈偏态分布的定量资料;用统计表时,要合理安排纵横标目,并将数据的含义表达清楚;用统计图时,所用统计图的类型用统计表时,要合理安排纵横标目,并将数据的含义表达清楚;用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;用相对数时,分母不宜小于应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;用相对数时,分母不宜小于2O,要注意区分百分率与百分比。要注意区分百分率与百分比。3统计分析方法的选择:对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适统计分析方法的选择:对于定量资料,应根据所采用的设计类型、资料所具备
22、的条件和分析目的,选用合适的统计分析方法,不应盲目套用的统计分析方法,不应盲目套用t检验和单因素方差分析;对于定性资料,应根据所采用的设计类型、定性变量检验和单因素方差分析;对于定性资料,应根据所采用的设计类型、定性变量的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用2 检验。对于回归分析,检验。对于回归分析,应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复实验数据的回归分析资
23、料,不应简单化处理;对于多因素、多指标资料,要在一元分析的基础上,实验数据的回归分析资料,不应简单化处理;对于多因素、多指标资料,要在一元分析的基础上,尽可能运用多元统计分析方法,以便对因素之间的交互作用和多指标之间的内在联系进行全面、尽可能运用多元统计分析方法,以便对因素之间的交互作用和多指标之间的内在联系进行全面、合理的解释和评价。合理的解释和评价。4统计结果的解释和表达:当统计结果的解释和表达:当P005(或或P40岁”3个组,进而按“性别、年龄分组、献血与否”3个定性因素编制统计表,见表81。性别和年龄分组进行组合,共有6种情况。然后,用t检验比较每种情况下的献血者与对照者骨矿含量均值
24、之间的差别是否有显著性意义。第五十页,编辑于星期一:十二点 十分。表81 按性别和年龄分组后献血者 对照者骨矿含量的均值和标准差 第五十一页,编辑于星期一:十二点 十分。(2)差错的分析:年龄本是一个定量的观测指标,最好 直接利用,可提供更多的信息。原作 者将年龄分为3组,有人为因素的作用。因为分组方式不同,结果就可能不一 样。从合理编制统计表的角度看,表的标 目安排欠妥。因为受试对象的属性分 组(即献血者与对照者)是本研究中 的主要定性因素,未将它置于表的醒 目位置上。修改后的表见82。第五十二页,编辑于星期一:十二点 十分。表82 献血者与对照者的性别、年龄及骨矿含量的均值和标准差第五十三
25、页,编辑于星期一:十二点 十分。统计分析方法选用得很不合理。因为根据表中所列的项目看,骨矿含量的高低至少受到3个因素(即是否献血、性别、年龄)的影响。在由性别与年龄组合而形成的6个组中分别进行t检验,似乎消除了性别和年龄的影响,很合理,但无法考察因素之间的交互作用,况且,进行多次t检验,会明显增大犯假阳性错误的概率。从实验设计的角度看,也存在问题。鲜血者年龄大的人数较少,而对照者中年龄大的人数较多,受试对象在年龄组间的人数构成上均衡性较差。第五十四页,编辑于星期一:十二点 十分。(3)释疑:本资料若按上表形式选用统计分析方法,应选用三因素析因设计资料的方差分析(资料需满足正态性和方差齐性,否则
26、,应设法进行变量转换),以便考察因素之间的交互作用。若在专业上有理由认为三因素对骨矿含量的影响有主次之分,就应将其看作是三因素系统分组(或嵌套)设计,并运用相应的方差分析方法处理资料。若原始资料未丢失,最好按表83的格式整理资料。第五十五页,编辑于星期一:十二点 十分。对于像表83这样的原始资料,最适合运用计算机处理数据。若分析的目的是为了比较鲜血者(符号为“y”)与对照者(符号为“n”)骨矿含量均值之间的差别是否有显著性意义,同时希望排除性别(定性因素)和年龄(定量因素)的干扰和影响,就应当选用成组设计资料的多元协方差分析;若分析的目的是为了根据“献血与否”、“性别”、“年龄”的不同取值,去
27、预测骨矿含量,并进一步考察这3个变量在预测骨矿含量上是否有显著性意义,就需要选用多元线性回归分析;若通过前述方法分析后得知献血者与对照者的骨矿含量之间的差别具有显著性意义,其数量在专业上也是不可忽视的。此时,还可运用判别分析建立判别函数式,用以判别一个新的个体属于鲜血者还是对照者,其方法是将此新个体的性别、年龄和骨矿含量(假定它们都是具有显著性判别能力的指标)数据代入已求得的判别函数,根据其计算结果便可作出判别。第五十六页,编辑于星期一:十二点 十分。表83 献血者与对照者的性别、年龄和骨矿含量的测定结果第五十七页,编辑于星期一:十二点 十分。实例二实例二 忽视忽视t检验的前提条件检验的前提条
28、件(1)原先的设计、资料、统计分析方法、结果和结论:原作者将直肠癌根治术后会阴伤口感染的42例,按随机法分喷氧组(A组)21例,常规换药组(B 组)21例,经治疗后观察伤口愈合时间。结果见 表84。原作者采用t检验,结论是:A组伤口愈合时间平均9.48d,B组伤口愈合时间平均22.57d,A组与B组伤口愈合时间平均缩短13d,经统计学t检验p0.001,有显著性差异。第五十八页,编辑于星期一:十二点 十分。表84 A组与B组治疗结果第五十九页,编辑于星期一:十二点 十分。(2)对差错的分析:资料不符合作t检验所要求的两个前提条件,即“正态性及方差齐性”。(3)释疑:将原计量资料转化有序列联表资
29、料(表85)。因B组内有9例患者“伤口愈合时间”不够具体,无法按定量资料来作统计分析;又因为两组的例数都较少,故采用秩和检验较合适。得:HC15.9495,P0.0001,可以认为两组的伤口愈合时间之间的差别有非常显著性意义,具体地说,B组伤口愈合天数较长。第六十页,编辑于星期一:十二点 十分。表85 A组与B组伤口愈合情况比较第六十一页,编辑于星期一:十二点 十分。五、多变量分析与单变量分析、多变量分析与单变量分析 多变量分析是对多变量分析是对m个反应变量进行一次假设检验(个反应变量进行一次假设检验(Hotelling T2检检验或验或MANOVA),对组间差别作出推断。在大多数情况下,多变
30、),对组间差别作出推断。在大多数情况下,多变量假设检验结论与对量假设检验结论与对m个反应变量进行个反应变量进行m次单变量假设检验(次单变量假设检验(t检检验或验或ANOVA)的结论是一致的,即多变量假设检验拒绝)的结论是一致的,即多变量假设检验拒绝H0,m次单变量假设检验至少有一次拒绝次单变量假设检验至少有一次拒绝H0,SPSS、SAS等统计软件等统计软件也是先给出多变量假设检验结果,再给出单变量假设检验结果,作也是先给出多变量假设检验结果,再给出单变量假设检验结果,作为多变量分析的补充。为多变量分析的补充。第六十二页,编辑于星期一:十二点 十分。例例:某妇幼保健院将孕妇随机分两组,一组接受孕
31、期保健教某妇幼保健院将孕妇随机分两组,一组接受孕期保健教育,另一组作为对照。育,另一组作为对照。表表14-3是同一日出生的是同一日出生的13名顺产婴儿名顺产婴儿的体重和身长,问孕期保健教育对婴儿生长发育有无促进作用的体重和身长,问孕期保健教育对婴儿生长发育有无促进作用?表中用两个指标反映婴儿的生长发育状况,通过孕表中用两个指标反映婴儿的生长发育状况,通过孕期保健教育组和对照组婴儿样本均数比较,推论两组总期保健教育组和对照组婴儿样本均数比较,推论两组总体均数体均数1和和2是否相等,进而得出孕期保健教育对婴儿体是否相等,进而得出孕期保健教育对婴儿体格发育有无影响的结论。格发育有无影响的结论。第六十
32、三页,编辑于星期一:十二点 十分。体重:体重:t=2.35,p=0.038 身高:身高:t=1.99,p=0.071第六十四页,编辑于星期一:十二点 十分。理论上单变量假设检验不能代替多变量假设检验,主要理由:理论上单变量假设检验不能代替多变量假设检验,主要理由:m次单变量假设检验增加假阳性错误的概率,设每次单变量假设检次单变量假设检验增加假阳性错误的概率,设每次单变量假设检验的检验水准定为验的检验水准定为a,做完,做完m次检验次检验I类错误的概率增加为类错误的概率增加为am1-(1-a)m。单变量假设检验只说明某一变量在数轴分布上的组间差别,单变量假设检验只说明某一变量在数轴分布上的组间差别
33、,不能反映多个变量在平面或空间上的差别,两者的意义不同,不能反映多个变量在平面或空间上的差别,两者的意义不同,各自说明各自的问题,不能相互代替。如表各自说明各自的问题,不能相互代替。如表14-8的两组数据,的两组数据,分别对两组新生儿出生时的体重与身长做单变量分别对两组新生儿出生时的体重与身长做单变量t检验:体重检验:体重t=2.35,p=0.038,身长,身长t=1.99,p=0.071,结论不明确。但多,结论不明确。但多变量的变量的Hotelling T2检验:检验:T2=9.87,F=4.58,P=0.03,拒绝,拒绝H0:1=2,两组在平面分布上差别如图,两组在平面分布上差别如图14-
34、1所示。所示。第六十五页,编辑于星期一:十二点 十分。二组的平面分布二组的平面分布第六十六页,编辑于星期一:十二点 十分。二组的空间分布二组的空间分布第六十七页,编辑于星期一:十二点 十分。六、充分利用现有的监测或体检数据l信息量大(范围广、指标多)l时间跨度长l缺乏系统设计l无质量控制l缺省值多l不能满足特定的研究第六十八页,编辑于星期一:十二点 十分。体检数据实例:第六十九页,编辑于星期一:十二点 十分。高血压监测数据:第七十页,编辑于星期一:十二点 十分。(一)、分析的计划和步骤(一)、分析的计划和步骤 1、资料的整理原始数据往往是不能直接进行分析的,根据资料的类型和目的,将资料整理成所
35、需要的形式。整理过程包括:(1)、原始体检表格的整理、核对。(2)、资料数据库的建立和资料输入根据样本大小可选择合适的软件建立数据库,资料输入时最好设计能自我纠错的功能,资料输入需要恰当的编码。2、统计描述描述体检对象的一般特征,如计算不同年龄、性别、职业、疾病类型的构成比,计算疾病发病频率指标、患病频率指标、死亡频率指标等等。3、统计推断 统计推断主要是计算相关的指标,如比值比、患病率等,并进行 假设检验。假设检验的方法既有单因素分析方法,也有多因素分析 方法。如2检验、回归分析等。根据资料的类型,还可选择分层 分析。第七十一页,编辑于星期一:十二点 十分。(二)、(二)、充分利用丰富的监测
36、或体检资料充分利用丰富的监测或体检资料(1)一组体检资料的背景介绍:某体检中心收集了一批体检者的多项体检指标,其中是否有冠心病(G)、性别(X1)、年龄(X2)、是否有高血压(X3)、是否吸烟(X4)、胆固醇含量(X5)甘油三酯含量(X6)、低密度脂蛋白含量(X7)、高密度脂蛋白含量(X8)、脂蛋白含量(X9)、载脂蛋白A1含量(X10)、载脂蛋白B含量(X11)、基因型XbaI(X12)、基因型EcorI(X13)、用药情况(X14),资料的格式如表1所示。第七十二页,编辑于星期一:十二点 十分。表1 多项指标的体检结果第七十三页,编辑于星期一:十二点 十分。(2)如何充分利用丰富的体检资料
37、:有些人仅运用简单的统计分析方法处理多因素多指标的体检资料。例如,求一组定量指标的均值和标准差、用t检验分析某定性分组变量的某两个水平对定量观测结果的影响是否显著、用简单的直线相关和回归分析方法研究某两个定量指标之间的直线相关关系和直线回归关系等。这样一来,将会牺牲大量有用的信息,得到一些支离破碎,有时甚至是错误的结论。体检资料往往都是非常丰富的,它不仅包含有定性指标,也包含有定量指标。如何充分利用丰富的体检资料,发掘资料中所蕴藏的各种有用信息,尤其要注意揭示变量之间的内在联系,是一个值得重视的问题。第七十四页,编辑于星期一:十二点 十分。(3)根据研究目的合理选用统计分析方法:下面先给出研究
38、者希望达到的一系列目的,并逐一选择相应的统计分析方法。1.对冠心病人而言,直接分析某种基因型取不同水平时7项血脂指标的均值和均值向量之间的差别有无显著性意义?2.对冠心病人而言,同时分析“性别、吸烟史、高血压史、某种基因型”对7项血脂指标的均值和均值向量的影响有无显著性意义?第七十五页,编辑于星期一:十二点 十分。3.对冠心病人而言,在设法排除“年龄、性别、吸烟史、高血压史和用药情况”等因素影响的前提下,分析某种基因型取不同水平时7项血脂指标均值之间的差别有无显著性意义?4.对冠心病人而言,试对7项血脂指标间的内部从属性作客观评价。5.对冠心病人而言,试对7项血脂指标间的亲疏关系作客观评价。6
39、.对冠心病人而言,假定病情轻重可通过7项血脂指标来很好地反映出来,试根据7项血脂指标的数据,将它们划为3组,以便作出关于病情“轻、中、重”的评判,可有的放矢地采取不同方案对不同病情的患者进行治疗。第七十六页,编辑于星期一:十二点 十分。7.利用正常人与冠心病人的7项血脂指标数据,建立一种方法,用来对一个怀疑患有冠心病的就诊者进行辅助诊断。8.利用正常人与冠心病人的全部资料,建立一种方法,筛选出冠心病的危险因素,并且,当各危险因素在其取值范围内分别取某确定值时,预报某人患冠心病的概率有多大。第七十七页,编辑于星期一:十二点 十分。(4)分析:为回答上面的第1个问题,需要明白:基因型是一个定性的分
40、组变量,而7项血脂指标都是定量的观测指标。通常把定性的分组变量称为“试验因素或影响因素”,把定量的观测指标称为“反应变量”。此时,若每次只分析一个反应变量,就需选用t检验(当影响因素的个数只有一个且仅有2个水平时)或方差分析;若每次分析的反应变量的个数2时,就需选用多元方差分析(当影响因素的个数2或虽影响因素的个数为1,但其水平数3时)。第七十八页,编辑于星期一:十二点 十分。为回答上面的第2个问题,需要明白:“性别、吸烟史、高血压史、某种基因型”都是“影响因素”。因此,需要选用“四因素析因设计的方差分析或多元方差分析”方法。为回答上面的第3个问题,需要明白:所谓“设法排除年龄、性别、吸烟史、
41、高血压史和用药情况等因素影响”,就是要治安某种基因型取不同水平时,将前述诸影响因素的作用化成相等,以便正确地评价不同基因型对血脂指标取值的影响。在影响因素中,既有定性的,又有定量的(年龄),故应选用多元协方差分析。第七十九页,编辑于星期一:十二点 十分。为回答上面的第4个问题,需要明白:要研究一组冠心病人“7项血脂指标间的内部从属性”,显然,不涉及任何分组变量。此时,可选用的统计分析方法有主成分分析、因子分析。为回答上面的第5个问题,需要明白:所用的指标与问题4相同,只是目的不同,要研究指标之间的亲疏关系,就应选用变量聚类分析。为回答上面的第6个问题,需要明白:要根据7项血脂指标的数量大小对冠
42、心病人进行分类,这当然需要选用样品聚类分析。第八十页,编辑于星期一:十二点 十分。为回答上面的第7个问题,需要明白:欲实现对就诊者进行辅助诊断,就必须有能区分冠心病患者与正常人的判别函数,故应选用判别分析。为回答上面的第8个问题,需要明白:要想筛选冠心病的危险因素,又要进行预测预报,这就需要运用回归分析。由于现在的因变量Y是一个二值变量(即是否患冠心病,患病,令Y1,不患病,令Y=0),所以,对这样的因变量进行回归分析需选用logistic回归分析方法。第八十一页,编辑于星期一:十二点 十分。(三)、分析方法的选择原则(三)、分析方法的选择原则 进行监测或体检资料的分析时,选择恰当的统计分析分
43、析方法非常重要。如果分析方法选择不当,将会得到错误的结果。选择统计分析方法应当遵循以下原则:1、明确指标的类型不同的资料的类型,其分析方法均不相同。因此,在进行体检资料的分析时,应明确指标的类型。2、分析研究资料是否存在混杂偏倚混杂偏倚往往会对结果产生不良的影响,如果资料存在混杂偏倚,则应进行分层分析。3、分析方法由浅入深对监测或体检资料的分析,应首先选择简单的统计分析方法。如先进行描述性统计,然后选择恰当的显著性检验方法。先进行单因素分析,然后进行多因素分析等。第八十二页,编辑于星期一:十二点 十分。(四)、监测或体检资料的挖掘研究:1、描述性研究:监测或体检资料描述性研究包括体检人群的健康
44、现况分布、疾病的筛检、生态学比较等。2、分析性研究:分析性研究可利用监测或体检数据所蕴藏的信息再分析研究,以提高研究证据的强度主要包括病例对照研究和队列研究。病例对照研究资料的特点是回顾性资料、产生偏倚的可能性较大。队列研究资料属前瞻性,没有回忆性偏倚,但存在失访偏倚,与病例对照研究相比偏倚较少。队列研究可直接估计危险度指标等。第八十三页,编辑于星期一:十二点 十分。图图1 1 病例对照研究原理示意图病例对照研究原理示意图调查方向:收集回顾性资料调查方向:收集回顾性资料 比较比较 人数人数 暴露暴露 疾病疾病病例病例对照对照+acbdOR:(a/c)/(b/d)=ad/bc(反映暴露与疾病关联
45、大小与方向的指标)第八十四页,编辑于星期一:十二点 十分。脂肪肝对照组暴露因素ALT 甘油三酯高密度脂蛋白ALT 甘油三酯高密度脂蛋白正常正常异常异常结局脂肪肝的病例-对照研究(一果多因)第八十五页,编辑于星期一:十二点 十分。表2 脂肪肝Logistic回归分析的结果变量参数估计值Wald 2值POR值OR值的95%CILowerUpper常数项-0.92851.05290.3048/ALT0.029910.65570.00111.0301.0121.049甘油三酯0.59839.73470.00181.8191.2492.649高密度脂蛋白-1.40365.30360.02130.2460
46、.0740.811从表1看出,各参数估计值的Wald 2检验,均有0.05,都有统计显著性。且三者的OR值分别为1.030、1.819和0.246。第八十六页,编辑于星期一:十二点 十分。目标人群目标人群 未患某研究未患某研究 疾病疾病代表代表性样性样本本Yes NoYes No暴露组暴露组非暴露组非暴露组时间顺序时间顺序 是否暴露某个危险因子是否暴露某个危险因子结局(疾病)结局(疾病)图图2 队列研究的结构模式图队列研究的结构模式图第八十七页,编辑于星期一:十二点 十分。时间顺序时间顺序 过去过去 现在现在 将来将来 历史性队列双向性队列前瞻性队列回顾性收集已有的历史资料回顾性收集已有的历史资料回顾性收集已有的历史资料回顾性收集已有的历史资料继续前瞻性收集资料继续前瞻性收集资料前瞻性收集资料前瞻性收集资料图图图图3 3 队列研究类型示意图队列研究类型示意图队列研究类型示意图队列研究类型示意图第八十八页,编辑于星期一:十二点 十分。第八十九页,编辑于星期一:十二点 十分。