医学实验设计与统计分析.pptx

上传人:莉*** 文档编号:77753626 上传时间:2023-03-16 格式:PPTX 页数:106 大小:1.96MB
返回 下载 相关 举报
医学实验设计与统计分析.pptx_第1页
第1页 / 共106页
医学实验设计与统计分析.pptx_第2页
第2页 / 共106页
点击查看更多>>
资源描述

《医学实验设计与统计分析.pptx》由会员分享,可在线阅读,更多相关《医学实验设计与统计分析.pptx(106页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计工作的步骤设计搜集资料整理资料分析资料统计描述统计描述统计推断统计推断参数估计参数估计假设检验假设检验第1页/共106页 实验以后,叫来统计员不如让他做一个尸体剖检。他可能能说出实验失败的原因。To call in the statistician after the experiment is done may be no more than asking him to perform a postmortem examination:he may be able to say what the experiment died of.Fisher第2页/共106页调查研究调查研究实验研究

2、实验研究实验实验研究:研究:临床临床试验试验:社区干预试验:社区干预试验:实验设计实验设计调查设计调查设计动物、标本动物、标本人人社区人群社区人群一、实验设计的分类第3页/共106页二、实验设计的特点1.能人为设置处理因素2.可以随机化分组3.能有效地控制误差,节省人、财、物力,提高效率 第4页/共106页三、实验设计的基本要素降压药降压药高血压病人高血压病人血压值血压值处理因素处理因素受试对象受试对象实验效应实验效应第5页/共106页(一)处理因素处理因素:即研究因素,是研究者通过实验来科学地考察其作用大小的因素。非处理因素:影响实验结果,对正确评价处理因素的作用有一定干扰的因素。选择处理因

3、素时要注意:(一)抓实验中的主要因素 (二)分清处理因素和非处理因素 (三)处理因素必须标准化第6页/共106页(二)受试对象1.动物的选择 种类、品系、年龄、体重、窝别、营养其选择原则和方法根据研究目的而定。选用与人的功能、代谢、结构及疾病特点相似的实验动物。选用与遗传背景明确,具有已知菌丛和模型形状显著且稳定的实验动物。选用解剖、生理特点符合实验目的的实验动物。选用存在某些特殊反应的不同种系实验动物。选用人兽共患疾病的实验动物。2.人的选择:病例的来源 诊断标准 纳入标准 排除标准 遵循医德的要求第7页/共106页(三)实验效应(一)选择观察指标的基本原则:客观性 精确性 灵敏性 特异性

4、(二)指标的观察:对实验效应的观察应避免偏倚 应注意处理因素与效应的关系第8页/共106页四、实验设计的基本原则对照原则随机原则重复原则均衡原则第9页/共106页(一)对照的原则1.设立对照的意义 使实验组和对照组的非处理因素一致,从而使处理因素的效应得以显露。实验组:实验组:处理因素处理因素非处理因素非处理因素+处理效应处理效应+处理因素处理因素比较结果:比较结果:对照组:对照组:处理效应处理效应非处理因素非处理因素非处理因素非处理因素非处理效应非处理效应非处理效应非处理效应第10页/共106页2.常见的对照形式:空白对照:对照组不加任何处理因素 安慰剂对照:假干预对照 实验对照:施加基础实

5、验条件(非处理因素)标准对照:以现有的标准或正常值作对照 自身对照:实验在同一受试对象上进行 相互对照:几个实验组互相对照 历史对照:以过去的研究结果作对照第11页/共106页(二)随机的原则1.随机化的意义 随机化:每一个受试对象都有同等的机会被分配到任何一组。随机“随便”2.随机化的实施 1.随机数字表 2.随机排列表 3.抽签、计算器(机)第12页/共106页(三)重复的原则重复:就是实验要有足够的样本含量 样本含量太大,浪费人力、财力、物力,增加系统误差出现的可能性。样本含量不足,检验效能(Power,1)偏低,导致总体中本来具有的差异无法检验出来。第13页/共106页1.影响样本含量

6、大小的因素:1.第一类错误的概率(检验水准)。2.检验效能(把握度1)0.75。3.所比较的两个总体参数的差值:4.总体标准差:第14页/共106页2.常用的估计样本含量的方法(1)(1)样 本 均 数 和 总 体 均 数 的 比 较样 本 均 数 和 总 体 均 数 的 比 较(2)(2)配 对 设 计 和 交 叉 实 验 的 样 本 含 量 估 计:配 对 设 计 和 交 叉 实 验 的 样 本 含 量 估 计:注意:注意:可取单双侧可取单双侧 只取单侧只取单侧例例8.1 P1088.1 P108第15页/共106页(3)(3)两样本均数比较时的样本含量:两样本均数比较时的样本含量:(4)

7、(4)样本率与总体率比较时的样本含量:样本率与总体率比较时的样本含量:(5)(5)两样本率比较时的样本含量:两样本率比较时的样本含量:第16页/共106页(6)(6)配对计数资料配对计数资料(7)(7)多个样本均数比较多个样本均数比较(8)(8)多个样本率比较多个样本率比较(9)(9)估计总体均数估计总体均数(10)(10)估计总体率估计总体率(11)(11)直线相关分析的样本含量直线相关分析的样本含量第17页/共106页四、均衡的原则(一)均衡的意义 设法使各实验条件下的受试对象所受的非处理因素的干扰和影响基本相同。(二)均衡对照的实施 贯彻均衡的原则就是对照组除了缺少处理因素外,其他条件应

8、与实验组均衡一致。第18页/共106页五、实验设计完全随机设计配对(伍)设计交叉设计拉丁方设计析因设计正交实验设计均匀设计第19页/共106页(一)完全随机设计(Completely random design)又称成组设计和单因素设计 将实验对象按完全随机化的原则分配至两个或多个处理组去进行实验观察,仅涉及一个因素即处理因素(可以有2个或多个水平)。随机化实验对象实验组对照组图1 完全随机设计方案示意图甲实验组乙实验组丙实验组第20页/共106页表5-1 对照组和各实验组家兔血清ACE浓度比较(U/ml)第21页/共106页完全随机设计要求组间均衡可比。先按主要影响因素分层,而后在分层基础上

9、随机分配样本。尽量使每组间样本数相等或接近。完全随机设计各组样本含量可以不等,但在样本总量不变的条件下,n1=n2时检验效率较高。第22页/共106页(二)配对(伍)设计(Paired/Randomized block design)先将受试对象按配比条件配成对子或配伍组,以消除配伍因素的影响,再将各对或各配伍组中的个体按随机分配的原则给予不同的处理,又称随机区组设计。配比条件:常以主要的非处理因素作为配比条件。按配伍条件实验对象区组1图图2 随机区组设计的示意图随机区组设计的示意图随机分组g个水平区组2随机分组区组3随机分组区组n随机分组g个水平g个水平g个水平第23页/共106页表表4-9

10、 4-9 不同药物作用后小白鼠肉瘤重量(不同药物作用后小白鼠肉瘤重量(g g)区组A药B药C药10.820.650.511.9820.730.540.231.5030.430.340.281.0540.410.210.310.9350.680.430.241.353.072.171.576.810.6140.4340.3140.4542.02071.05870.54513.6245第24页/共106页 例题3:用中医辨证分为脾胃虚寒、中气下陷、胃火炽盛、肝郁乘脾与肝胃不和5个证型的20个病情相近胃溃疡患者,每种证型有4个患者。比较小柴胡汤(简记为A)、六君子汤(简记为B)、吴茱萸汤(简记为C)

11、、保和丸(简记为D)四种方剂(处理组数k=4)的疗效。1.根据以上资料,你如何设计?2.请简述该资料的分析思路。第25页/共106页(三)交叉设计(Cross-over design)将A、B两种处理先后施加于同一批受试对象,随机地使半数受试者先接受A后接受B,而另一半受试对象则正好相反,即先接受B再接受A,由于两种处理在全部实验过程中交叉进行,称为交叉设计。方法:将受试对象随机分为两组,一组第一阶段接受A处理、第二阶段接受B处理,另一组顺序刚好相反。编号编号编号编号阶段阶段阶段阶段1 1 1 1阶段阶段阶段阶段2 2 2 21 1 1 1A A A AB B B B2 2 2 2A A A

12、AB B B B3 3 3 3A A A AB B B B4 4 4 4A A A AB B B B5 5 5 5B B B BA A A A6 6 6 6B B B BA A A A7 7 7 7B B B BA A A A8 8 8 8B B B BA A A A第26页/共106页例9.7 某研究者在针刺麻醉研究中,欲通过12只大白鼠研究A、B两种参数电针刺激后痛域值上升情况,同时还考虑了个体差异与A、B顺序对痛域值的影响。根据此研究目的,用何种实验设计方法为宜,并作分组设计。第27页/共106页第28页/共106页第29页/共106页SPSS例题:为比较血液透析过程中,低分子肝素钙()

13、与速避凝()对凝血酶原时间(tt)的影响,选择例接受血液透析的病人为研究对象,采取二阶段交叉设计,试验数据见下表,试分析之。第阶段第阶段第阶段第阶段第阶段第阶段第阶段第阶段 11.0011.0011.5011.5019.5019.5016.2016.2019.9019.9015.7015.7012.3012.3012.0012.0022.3022.3014.6014.6015.6015.6018.3018.3017.6017.6020.0020.0022.2022.2018.8018.8013.6013.6031.8031.8022.5022.5017.9017.90 32.6032.6014

14、.1014.1036.7036.7023.1023.1013.8013.8013.3013.3017.9017.9015.0015.0013.5013.5044.8044.8019.9019.9023.3023.3059.9059.9016.2016.2013.8013.8011.3011.3021.9021.9019.7019.7012.3012.3027.4027.40SPSS演示:Anaylyze general linear model univariate(单变量方差分析)dependent variable(因变量):tt fixed factor(s)固定因子变量:stagedr

15、ug random factor(s)(随机变量):subjectModelunivariate:model specify model:custom(自定义模型)model:stagedrugsubject build term(s)(构造项目):main effects(主效应)附表 两种抗凝药物对tt(s)的影响第30页/共106页结果分析:组间效应检验drug,F=0.580,P=0.456,不能认为不同药物对血浆凝血酶原时间有影响;stage,F=1.470,P=0.241,不能认为不同阶段对血浆凝血酶原时间有影响;subject,F=3.108,P=0.010,认为不同病人的血浆凝

16、血酶原时间有显著差异。第31页/共106页(四)拉丁方设计(Latin square design)按拉丁字母组成的方阵来安排实验的三因素等水平设计。该设计同时考虑三个因素(一般是一个处理因素、两个配伍组因素)对实验结果的影响。是在随机区组设计的基础上,多安排了一个对实验结果有影响的非处理因素,增加了均衡性,减少了误差。行、列:代表控制因素的水平 方阵中的字母:代表处理因素的水平要求:三个因素 无交互作用 水平数相等 方差齐第32页/共106页设计步骤设计步骤:1.根据主要因素的水平数,确定基本型拉丁方,并使另外两个次要因素的水平数与之相等。2.将基本型拉丁方随机化,按随机化后的拉丁方安排实验

17、。3.规定行、列、字母所代表的因素和水平,通常字母表示主要处理因素。优点:优点:节约样本量 使观察单位更加区组化和均衡化,进一步减少抽样误差,提高效能。缺点:缺点:要求三因素无交互作用且水平数相等,实际工作中有一定的局限性。第33页/共106页 例9.9 9.9 某肿瘤研究所拟通过动物实验研究4 4种抗癌药物的抑癌作用,同时考虑4 4个不同剂量和不同瘤株对抗癌药物的作用。用何实验设计可达到此研究目的?(实验过程是用4 4种瘤株匀浆接种小白鼠,7d7d后分别用4 4种抗癌药物,各取4 4种不同剂量腹腔注射,每日1 1次,连续10d10d,停药1d1d,处死后解剖测瘤重)。第34页/共106页第3

18、5页/共106页 SPSS演示例题:5种防护服,有5个人在不同的5天中穿着测定其脉搏数(试验以脉搏作为人对高温反应的指标),试比较5种防护服在不同天气对人脉搏的影响是否不同?5套防护服编号为A、B、C、D、E,5名试验对象编号为甲、乙、丙、丁、戊,试验日期编号为1,2,3,4,5。试验结果见下表。试验试验日期日期(j)受试者(受试者(i)甲甲(1)乙乙(2)丁丁(3)丁丁(4)戊戊(5)1A129.8B116.2C114.8D104.0E100.62B144.4C119.2D113.2E132.8A115.23C143.0D118.0E115.8A123.0B103.84D133.4E110.

19、8A114.0B98.0C110.65E142.8A110.6B105.8C120.0D109.8SPSS演示:Anaylyze general linear model univariate(单变量方差分析)dependent variable(因变量):x fixed factor(s)固定因子变量:ijk Modelunivariate:model specify model:custom(自定义模型)model:ijk build term(s)(构造项目):main effects(主效应)Continueoptionsunivariate:options display mean

20、for:j compare main effectsContinueok第36页/共106页 结果分析:组间效应检验因素i,F=16.271,P=0.000,可认为受试者间效应显著,不同人在高温时的脉搏次数有显著意义;因素j,F=2.897,P=0.068,可认为不同试验日期间效应不显著,不同试验日期对脉搏的影响无显著意义;因素k,F=1.243,P=0.344,可认为不同防护服试验日期间效应不显著,不同防护服间对脉搏的影响无显著意义。组间效应检验单变量检验第37页/共106页(五)析因设计(Factorial experimental design)是一种将两个或多个因素的各水平交叉分组进行

21、实验的设计。它不仅可检验各因素内部不同水平间有无差异,还可检验2个或多个因素间是否存在交互作用(interaction)。若因素间存在交互作用,表示各因素间不是独立的,一个因素的水平发生变化,会影响其他因素的实验效应;反之,若因素间不存在交互作用,表示各因素间是独立的,任一因素的水平发生变化,不会影响其他因素的实验效应。第38页/共106页A A因素因素因素因素A A1 1A A2 2平均平均平均平均A A1 1-A-A2 2B B因素因素因素因素B B1 12.12.11.01.01.11.1B B2 21.21.20.80.80.40.4平均平均平均平均0.75B B2 2-B-B1 10

22、.90.90.20.20.55A的的主主效效应应A的的单单独独效效应应B的单独效应的单独效应B的主效应的主效应第39页/共106页 若将上表中的4 4个均数作线图,得两条几乎平行的直线,表示交互作用很小。反之,若得两条相互不平行的直线,则说明两因素可能存在交互作用。第40页/共106页单独效应(simple effect):指其它因素的水平固定时,同一因素不同水平间的差别。主效应(main effect):某一因素各水平间的平均差别。交互作用(interaction):当某一因素的各个单独效应随另一因素的不同水平变化而变化时,则称这两个因素间存在交互作用。第41页/共106页 析因设计时,分析

23、的因素数和水平数不宜过多,一般因素数不超过4,水平数不超过3 实验组数=各因素水平数的乘积。设计模型:22 222 32 223优点:是一高效的实验设计方法,不仅能分析各因素内部不同水平间有无差别,还可分析各因素间的交互作用。缺点:与正交实验设计相比,属于全面试验,因此,研究的因素个数和因素的水平数不宜过多。第42页/共106页原 则:若存在交互作用,需逐一分析各因素的单独效应,此时分析主效应无意义;若不存在交互作用,则两因素的作用相互独立,只需考虑各因素的主效应即可。第43页/共106页 例 某医生欲研究A A、B B两药是否有治疗缺铁性贫血的作用,以及两药间是否存在交互作用。用何试验设计达

24、到研究者的研究目的,并做出设计分组。第44页/共106页第45页/共106页第46页/共106页第47页/共106页例 SPSS演示Anaylyze general linear model univariate(单变量方差分析)dependent variable(因变量):x fixed factor(s)固定因子变量:a、bPlotsunivariate:profile plots(单变量方差分析:轮廓图)ahorizontal axis(水平轴);bseparate lines(分离线);addContinueoptionsunivariate:options factor(s)and

25、 factor(s)display means for:a、b、a*b descriptive statistics estimates of effect size(效应大小估计)observed power homogeneity test(齐性检验)Continueok第48页/共106页描述性统计量误差齐性检验组间效应检验第49页/共106页1.误差方差齐性检验,方差齐。2.组间效应检验:因素A,F=168.750,P=0.000,可认为甲药效应显著,使用A药与不使用A药有显著差异,使用A药的均数为1.650,大于不使用A药的均数(0.900);因素B,F=90.750,P=0.000

26、,可认为乙药效应显著,使用B药与不使用B药有显著差异,使用B药的均数为1.550,大于不使用B药的均数(1.000);因素A*B,F=36.750,P=0.000,可认为甲药与乙药交互作用效应显著。3.由“甲药状态(A)*乙药状态(B)”表明:甲乙同时使用的均数最大,其次单独使用甲药,再次是单独使用B药。4.2表明:2(A)(0.955)2(B)(0.821),可认为各因素对总变易的贡献,从大到小依次为A、B、A*B。5.两条直线不平行,提示因素A与因素B存在交互作用。Estimated Marginal Means(估计边缘均数)第50页/共106页(六)正交实验设计(Orthogonal

27、experimental design)1.概念:正交试验设计是利用一套规范化的正交表,使每次试验的各因素及其水平得到合理安排的高效多因素实验设计。常用于分析多个因素不同水平及个别因素间交互作用对某观察指标的影响,如寻找疗效好的药物配方、医疗仪器多个参数的优化组合、生物体的培养条件等寻求最优搭配方案的研究。第51页/共106页2.正交试验的优点(1)能在很多试验方案中挑选出代表性强的少数几个试验方案,并且通过这少数试验方案的试验结果的分析,推断出最优方案;(2)作进一步的分析,得到比试验结果本身给出的还要多的有关各因素的信息。第52页/共106页3.正交表的类型:(1)相同水平正交表:形式为

28、L Ln n(K(Km m),同一正交表中各列的水平数相同,故各列的自由度相同,自由度=k-1=k-1,既水平数-1-1。2 2水平正交表:L L4 4(2(23 3),L),L8 8(2(27 7),L),L3232(2(23131),L L6464(2(23131),L L1212(2(21111)3 3水平正交表:L L9 9(3(34 4),L),L2727(3(31313),L L8181(3(34040),L),L1818(3(37 7)4 4水平正交表:L L1616(4(45 5),L),L3232(4(48 8),L L6464(4(42121)5 5水平正交表:L L252

29、5(5(56 6),L),L3232(4(49 9),5 5水平以上:用正交拉丁方。这一类正交表不仅可以考察各因子对试验指标的影响,还可以考察因子之间的交互作用影响。第53页/共106页4.正交试验方案设计试验目的与要求试验指标选定因素、确定水平选择合适正交表表头设计确定各组的试验条件分析正交试验结果分析正交试验结果第54页/共106页表表表表9-21 9-21 影响雌螺产卵数的试验因素及其水平影响雌螺产卵数的试验因素及其水平影响雌螺产卵数的试验因素及其水平影响雌螺产卵数的试验因素及其水平水平水平水平水平试试试试 验验验验 因因因因 素素素素温度温度温度温度()含氧量含氧量含氧量含氧量()含水

30、量含水量含水量含水量()pHpH值值值值A AB BC CDD1 15 50.50.510106.06.02 225255.05.030308.08.0 例题:例题:第55页/共106页 列列 号号列号列号1A1A2B2B3 34C4C5 56 67 71 1(1)(1)3 32 25 54 47 76 62 2(2)(2)1 1(3)(3)6 67 74 45 53 37 76 65 54 44 4(4)(4)1 1(5)(5)2 23 35 53 3(6)(6)2 26 61 1表表9-20 L9-20 L8 8(2(27 7)交互作用表交互作用表 注意:主效应因素尽量不放交互列。如A、B

31、因素已放列1、列2,则C 因素就不放列3。如果A安排在列1,B安排在列2,那么AB安排位置就从表9-20中的(1)横着向右看,(2)竖着向上看,它们的交叉点是3,此3就是AB要安排在列3。同理,B安排在列2,C安排在列4,BC就安排在列6。AC安排在列5。第56页/共106页确定各组的试验条件:第57页/共106页5.分析正交试验结果进行试验,记录试验结果进行试验,记录试验结果试验结果极差分析试验结果极差分析计计算算K值值计计算算k值值计计算算极极差差R绘绘制制因因素素指指标标趋趋势势图图优水平优水平因素主次顺序因素主次顺序优组合优组合结结 论论试验结果方差分析试验结果方差分析列方差分析表,列

32、方差分析表,进行进行F 检验检验计算各列偏差平方和、计算各列偏差平方和、自由度自由度分析检验结果,分析检验结果,写出结论写出结论第58页/共106页 方法方法1 直观分析(极差分析)直观分析(极差分析)(1)计算极差,确定因素的主次顺序)计算极差,确定因素的主次顺序 第第j列的极差列的极差 或或 极差越大,说明这个因素的水平改变对试验结果的极差越大,说明这个因素的水平改变对试验结果的影响越大,极差最大的那个因素,就是最主要的因素。影响越大,极差最大的那个因素,就是最主要的因素。第59页/共106页(2)确定最优方案)确定最优方案 如果不考虑交互作用,则根据各因素在各水平下的如果不考虑交互作用,

33、则根据各因素在各水平下的总产量或平均产量的高低总产量或平均产量的高低确定最优方案;如果考虑交互确定最优方案;如果考虑交互作用,则作用,则取各种搭配下产量的平均数取各种搭配下产量的平均数,按优化标准确定,按优化标准确定最优方案。最优方案。第60页/共106页方法方法2 方差分析法方差分析法 基本思想与双因素方差分析方法一致:将总的离基本思想与双因素方差分析方法一致:将总的离差平方和差平方和SS分解成各因素及各交互作用的离差平方和,分解成各因素及各交互作用的离差平方和,构造构造F统计量,对各因素是否对试验指标具有显著影响,统计量,对各因素是否对试验指标具有显著影响,作作F检验。检验。第61页/共1

34、06页无重复的两水平正交实验及方差分析无重复的两水平正交实验及方差分析第62页/共106页注意:最优实验条件的确定注意:最优实验条件的确定注意:最优实验条件的确定注意:最优实验条件的确定n n对显著因子应该取最好的水平对显著因子应该取最好的水平对显著因子应该取最好的水平对显著因子应该取最好的水平n n对不显著因子的水平可以任意选取,在实际中通常从对不显著因子的水平可以任意选取,在实际中通常从对不显著因子的水平可以任意选取,在实际中通常从对不显著因子的水平可以任意选取,在实际中通常从降低成本、操作方便等角度加以选择。降低成本、操作方便等角度加以选择。降低成本、操作方便等角度加以选择。降低成本、操

35、作方便等角度加以选择。第63页/共106页重复测量数据的两水平正交实验及方差分析重复测量数据的两水平正交实验及方差分析第64页/共106页第65页/共106页 AnalyzeGeneral Linear ModelUnivariateModel:custom:选择分析的因素选择分析的因素continue ok(交叉设计、拉丁方设计、析因设计等的交叉设计、拉丁方设计、析因设计等的SPSSSPSS方方差分析步骤相同)差分析步骤相同)注意:最后的结论及最优配方的确定SPSS的应用的应用第66页/共106页六、数据分析思路(一)资料的整理 1.核查资料 2.资料的数量化 3.资料的分组(二)资料的描述

36、性统计分析 1.对资料一般特征的描述 2.对研究项目的描述性统计分析(三)资料的组间均衡性检验(四)资料的推断性统计分析 1.单因素分析 2.多因素分析(五)资料的重复性的评价(六)研究结果的解释第67页/共106页(一)数据的处理 数据处理:医学数据的统计处理涉及到医学专业知识、统计专业知识、处理数据的经验和技巧等,是一门很高超的艺术。关键环节:1.原始数据的采集 2.数据的录入和管理 3.数据处理中的几个基本问题 4.恰当选用统计方法 5.统计分析选择的基本思路第68页/共106页 1.1 原始数据的采集医学研究的原始数据常列成二维结构,即行和列结构的数据集形式。病人病人编号编号病案号病案

37、号性别性别年龄年龄生理生理评分评分肾毒性肾毒性黄疸黄疸昏迷昏迷肌酐肌酐胆固醇胆固醇肾功能肾功能1004757男男26261414无无有有无无520520-治愈治愈2007950女女31311313无无无无无无5235234.54.5治愈治愈3011093男男55551717无无无无无无2092093.33.3治愈治愈4017555男男25259 9无无无无无无130313034.14.1治愈治愈274279183女女88881515有有无无无无3313316.16.1丧失丧失标识变量分析变量反应变量:试验效应或观察结果大小的变量或指标。解释变量:指示变量分组变量分类变量协变量等第69页/共10

38、6页1.2 数据的录入和管理第70页/共106页第71页/共106页1.3 数据处理中的几个基本问题数据核查:EpiData软件 逻辑检查 数据核对离群数据的处理:统计软件一般都有判断离群数据的方法。箱式图统计方法前提条件的检验:应用参数检验往往要求数据满足某些前提条件:如:两个独立样本比较t检验或多个独立样本比较的方差分析,均要求方差齐性,以及正态性检验。在建立各种多重回归方程时,常需检验变量间的多重共线性和残差分布的正态性。第72页/共106页1.4 恰当选用统计方法计数资料计数资料二项分类多项分类双向有序双向无序双变量资料的分析计量资料计量资料单变量计量资料的分析样本均数与总体均数比较两

39、个相关样本均数的比较两个独立样本均数比较多个样本均数比较单因素方差分析两因素方差分析但不分析交互作用三因素方差分析但不分析交互作用多因素方差分析且分析交互作用重复测量资料1.简单相关分析2.线性回归分析3.曲线回归分析多变量资料的分析 有应变量的多元分析无应变量的多元分析单向无序多个样本率或构成比比较2检验(如显著求其列联系数)分组变量有序反应变量有序2检验,同双向无序秩和检验或R idit分析属性相同属性不同McNemar、Kappa检验秩相关分析、线性趋势检验第73页/共106页1.5 统计分析选择的基本思路 第一层面:看反应变量是单变量、双变量还是多变量;第二层面:看资料的类型(计量资料

40、、计数资料、等级资料)第三层面:看单因素还是多因素 第四层面:看单样本、两样本或多样本 第五层面:是配对或配伍设计 第六层面:看是否满足检验方法所需的前提条件。第74页/共106页(二)计量资料的统计分析2.1数值变量的统计描述指标定量资料集中趋势离散趋势算术均值()几何均值(G)中位数(M)众数(C)调和均数(H)全距(R),百分位数(P)四分位数间距(Q)方差(2),标准差(s)变异系数(CV)第75页/共106页2.1计量数据的统计描述1.1.在医学杂志中,正态或近似正态资料,常以 的形式表达,描述和比较数据的平均水平和离散程度。2.2.偏态分布或特定资料(生存时间、病程、潜伏期时间等)

41、用中位数和四分位间距描述。表达形式:(M M,Q Q)3.3.等比数据和正偏态数据可用几何均数和几何标准差描述。表达形式:GSGGSG第76页/共106页2.2单变量计量资料的分析1.样本均数与总体均数比较分析思路:反应变量为单变量计量资料单因素样本均数与总体均数比较的t检验非参数检验如果服从正态分布如果不服从正态分布第77页/共106页1.样本均数与总体均数比较 即 (代表未知)与已知 0 0(理论值、标准值或稳定值)比较。例:某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值1

42、40g/L?第78页/共106页2.两个相关样本均数的比较分析思路:反应变量为单变量计量资料单因素配对t检验配对符号秩和检验如果差值d服从正态分布如果差值d不服从正态分布配对设计第79页/共106页例:为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定其结果如表3-3第(1)(3)栏。问两法测定结果是否不同?第80页/共106页3.两个独立样本均数比较完全随机设计两样本均数比较成组设计的两样本均数比较分析思路:反应变量为单变量计量资料单因素两样本的t检验t检验或两样本秩和检验成组设计两样本秩和检验如果方差齐性,且两样本均服

43、从正态分布如果方差不齐,但两样本均服从正态分布如果方差不齐,且两样本不服从正态分布第81页/共106页例:为研究国产新药阿卡波糖胶囊降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后空腹血糖,算得空腹血糖下降值见表3-4,能否认为国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?第82页/共106页4.多个样本均数比较分析思路:两因素两因素方差分析但不分析交互作用随机区组设计单因素多个样本均数比较多因素单因素方差分析若方差齐性,且样本均服从正态分布若方差不齐,或样本不

44、服从正态分布Kruskal-Wallis秩和检验SNK法LSD法扩展t检验等三因素多因素重复测量资料三因素方差分析但不分析交互作用多因素方差分析且分析交互作用满足方差齐和正态分布?两因素方差分析Friedman秩和检验拉丁方设计二阶段交叉设计三因素方差分析广义线性模型的方差分析非参数方法析因设计正交设计嵌套设计裂区设计广义线性模型的方差分析第83页/共106页表5-1 对照组和各实验组家兔血清ACE浓度比较(U/ml)第84页/共106页(三)单变量计数资料的分析两个率总体与样本两样本配对非配对单样本u检验/二项分布的确切概率法配对 2检验(McNemar test)2检验/Fisher确切概

45、率法/两样本率的u检验RC表单向有序双向无序双向有序多个样本率/构成比关联度 2检验列联系数分析分组变量有序反应变量有序 2检验秩和检验配对/配伍设计非配对/配伍设计McNemar检验/k系数检验秩相关分析/线性趋势检验分层计数资料分层 2检验(Mantel-Haenszel test/Cochron-Mantel-Haenszel test)第85页/共106页3.1 双向无序资料的2检验(42.01)(37.99)(51.99)(47.01)第86页/共106页双向无序分类变量,采用行列表的2检验,计算Pearson 2值,推断两个分类变量之间有无关系(或关联);可进一步计算Pearson

46、列联系数C,分析关系的密切程度。3.2 双向无序资料的2检验第87页/共106页分组变量无序,指标变量有序,采用非参数检验的Wilcoxon秩和检验或 Kruskal and Wallis H检验;或行平均分差检验。3.3 单向有序资料的2检验第88页/共106页3.4 双向有序资料的2检验第89页/共106页若bc40,3.5 配对22列联表资料的2检验第90页/共106页(四)单变量等级资料的分析两组配对等级资料的比较Wilcoxon单样本秩和检验两组独立样本等级资料的比较Wilcoxon两样本秩和检验多组独立样本等级资料的比较Kruskal-Wallis秩和检验第91页/共106页1.建

47、立检验假设:H0:治疗前后白细胞总数差值的总体中位数为0,即Md=0 H1:Md0 0.052.计算检验统计量T值 求各对的差值 编秩 求秩和3.确定P值(T界值:540);4.做出推断结论4.1 两组配对等级资料的比较Wilcoxon单样本秩和检验第92页/共106页4.2 两组独立样本等级资料的比较秩和检验(Wilcoxon rank sum test)(一)成组设计两组计量资料的秩和检验例7.3 某医师为研究血清铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血清铁蛋白如表7-3,问肺炎患者与正常人血清铁蛋白含量有无差别?第93页/共106页4.3 两组等级资料的秩和检验 若

48、选行列表资料的卡方检验,只能推断两组肺炎样本疗效构成比的差别有无统计学意义,损失疗效的“等级”信息,应采用秩和检验,可推断两组等级强度的差别有无统计学意义,比较两组病情的疗效。第94页/共106页4.4 成组设计多样本比较的秩和检验(Kruskal-Wallis H test,H检验)第95页/共106页(五)双变量资料的分析简单相关分析两变量满足二元正态分布Pearson积矩相关分析两变量不满足二元正态分布Pearson秩相关分析线性回归分析两变量关系呈线性趋势简单线性回归分析曲线回归分析两变量关系呈曲线趋势指数曲线多项式曲线生长曲线Logistic曲线非线性回归分析第96页/共106页表3

49、 12只大白鼠的进食量与体重增加量序号序号序号序号进食量(进食量(进食量(进食量(g g g g)体重增加量(体重增加量(体重增加量(体重增加量(g g g g)1 1 1 1305.7305.7305.7305.723.623.623.623.62 2 2 2188.6188.6188.6188.614.714.714.714.73 3 3 3277.2277.2277.2277.219.219.219.219.24 4 4 4364.8364.8364.8364.827.727.727.727.75 5 5 5285.3285.3285.3285.318.918.918.918.96 6

50、6 6244.7244.7244.7244.716.116.116.116.17 7 7 7255.9255.9255.9255.917.217.217.217.28 8 8 8149.8149.8149.8149.812.912.912.912.99 9 9 9268.9268.9268.9268.918.318.318.318.310101010247.6247.6247.6247.617.717.717.717.711111111168.8168.8168.8168.813.713.713.713.712121212200.6200.6200.6200.615.615.615.615.6

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁