《医学统计学第四章.ppt》由会员分享,可在线阅读,更多相关《医学统计学第四章.ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章 研究设计基础公共卫生学院 白志茂 4.1 研究设计的意义医学研究的基本过程合理的研究方案所要求的基本过程大致可分为以下六个阶段 制定研究目的,建立专业假设 查阅文献资料 向 更 制定实验设施 高 的 实施实验设计 阶 段 统计分析实验结果 发表研究成果,评价以上假设-4.1.2 研究设计的意义 医学研究设计是根据特定的研究目的,对一项医学科学研究的全过程,包括资料的搜集、整理和分析等,作科学地、有效地和周密地计划和安排,从而保证研究工作顺利地进行。研究设计包括:1.专业设计:完成课题的专业思路、技术路线与方法的确定 保证研究课题的科学性、先进性和实用性2.统计设计:保证研究课题的经济性
2、和可重复性 统计设计意义:u 用较少的人力、物力、时间等,得到较为可靠的结果;u 能合理地控制实验误差并对其进行估计,保证了实验结果的可靠性和可重复性;u 能使多种实验因素包括在很少的实验之中,提高实验的效率.4.1.3 实验与调查医学科学研究通常按照在研究过程中对研究对象是否进行干预分为两大类:调查研究:不干预实验研究:干预调查 调查所观察的个体只受许多环境条件的影响,它们处于没有人为干预的自然状态 如:调查某地7岁男孩的平均身高 调查的目的:在于了解某一事物的实际状况 全面调查(普查)与抽样调查实验研究 实验研究:将一组随机抽取的实验对象随机分配到两种或多种处理组,观察比较处理因素的效应(
3、或结果)如:要研究某强化食品对7岁男孩身高的影响 在实际工作中,习惯上将以人为对象的实验,称为试验,如临床试验、现场试验等 42 实验研究的特点 研究者能人为设置处理因素 受试对象接受何种处理因素的水平是经随机分配而定的 实验研究能使比较组间具有较好的均衡性 实验研究设计能使多种实验因素包括在较少次数的实验中,更有效地控制误差,达到高效的目的 43 实验研究中的基本要素 实验研究的基本要素是处理因素、受试对象和实验效应 例如:“补阳还五汤对大白鼠血脑屏障影响的实验研究”课题中,补阳还五汤是处理因素,大白鼠是受试对象,血脑屏障变化是实验效应4.3.1 处理因素 处理因素:一般是指外加于受试对象,
4、在实验中需要观察并阐明其处理效应的因素 若一次实验中只研究一个因素对实验指标的影响,称为单因素试验 若一次实验中要研究两个或多个因素对实验指标的影响,称之为多因素试验实验设计时应注意:1)抓住实验中的主要因素 据研究目的确定几个主要的,带有关键性的因素 2)明确处理因素与非处理因素 非处理因素虽然不是研究因素,但由于其中有些会影响实验结果,产生混杂效应,所以非处理因素又称混杂因素(confounding)。例如:两种降压药治疗高血压病人的试验,非处理因素有年龄、性别等。3)处理因素应标准化 处理因素标准化就是保证处理因素在整个实验过程中始终如一,保持不变 例如:若实验因素是药物,则应当在科研全
5、过程使用同一批药物,以防批间差异干扰实验结果4.3.2 受试对象 受试对象:是指被处理因素作用的对象 实验研究按受试对象可分为动物实验和人体试验我国首批艾滋病疫苗人体实验志愿者1)动物选择 研究课题不同对动物的要求也往往不同2)病例选择 病例选择最基本的要求是正确诊断、正确分期以及对病情的正确判断。还要求病人知情同意,依从性好。4.3.3 实验效应(effect)实验效应:是指受试对象接受实验处理后所出现的实验结果,通常由人或动物相应的各项指标来反映 对观察指标的要求为:1)关联性:实验所选用的指标应与研究目的有本质的联系,这种联系即指标的关联性。如不能以心电图作为心脏收缩力的指标;若欲了解心
6、脏泵血功能,应该选择心排血量(L/min)或心脏指数(L/(min.m2))作为指标2)客观性 指标数据是由仪表指示的叫做客观指标;如心电图,血压,血细胞自动计数等。指标数据是由观察者或受试对象根据主观感受程度判定的称为主观指标。例如中医的望、闻、问、切是靠受试者的回答和观察者的感受加以判断3)灵敏性 指标的灵敏性是增强实验效应的一个重要方面 指标的灵敏性通常是由该指标能正确反映的最小数量级或水平来确定4)精确性 指标的精确性是指指标的准确度和精密度 混杂因素(简称混杂,confounding)常见的控制方法 1.将混杂因素作为一个实验条件来控制,即把它控制在不起作用的水平上或使各组处于同一水
7、平上 2.平衡法 混杂因素对试验组和对照组的影响是平等的3.转为实验因素 有时将明显的混杂因素就作为一个实验因素来对待 44 实验设计中的基本原则 实验设计应遵循的基本原则:对照原则、随机化原则和重复原则 这三个原则最早由英国统计学家R.A.Fisher 于1935年提出 441 对照(control)原则 有比较才有鉴别,对照是比较的基础,是基本原则中的首要原则吃黄金搭档一年,小孩长高了5CM,起效了?设立对照组是控制各种混杂因素的基本措施,只有设立对照才能将处理因素的效应充分现露出来 设计对照组的过程中应考虑以下几方面与处理组之间均衡 1)受试对象条件要一致 2)实验条件要一致 3)研究者
8、或操作者对各组的观察、操作要求应一致,最好是同一人员 4)实验的时间和顺序应一致 合理的对照还要求对照组与实验组的样本含量尽可能相等或接近,这样实验的效率最高 盲法:(1)单盲(single blind)法:受试对象不知道自己分到哪一组(2)双盲(double blind)法:在临床试验中为避免病人心理影响或医生评估处理效应的主观偏性,而采用“双盲法”,即受试对象和结果判定人员(实验执行者)都不知道研究对象属处理组还是对照组。(3)三盲(triple blind)法 受试对象、实验执行者和统计分析人员均不知道受试对象分在哪一组 对照的种类 1.按时间来分,对照可分为历史对照和同期对照 历史对照
9、:是以本人过去的研究或他人的研究结果作为对照 标准对照:是指以标准值或正常值作对照,而不专门设对 照组 2.按实验对象来分,可分为自身对照和实验对照 自身对照:是指对照和处理在同一对象身上进行 实验对照:是指对照组和处理组的对象在某种有关的实验条件下进行观察 3.按对照组接受的处理不同来分,又可分为空白对照和相互对照 空白对照:是指不施加任何处理的“空白”条件下观察的对照 相互对照:则指各实验组间互为对照,即对照组也施加了某种处理 442 随机化原则 什么是随机化?在抽样研究中是指总体中每个个体都有相等的机会被研究者抽取为样本;在实验研究中是指每种处理都有相等的机会分配给某个实验对象以及各比较
10、组的实验顺序要无人为因素的影响。随机化是保证非处理因素组间均衡一致的另一重要手段 实验设计中随机化所起的作用为:避免主观因素的参与;打破原来实验对象排列的系统性,以控制系统误差;对于实验中一些意想不到的因素起平衡作用;它是统计推断的基础 随机化的工具与随机化方法,常用的随机化工具有硬币、赌具(如骰子),随机数字表,随机排列表以及计算机(器)伪随机数发生函数等443 重复原则 重复的两层含义(1)是指各处理组及对照组的例数(或实验次数)要有一定的数量,即要求有一定的样本含量(2)实验结果的可靠性应经得起重复实验的考验 因为实验对象之间的变异总是存在的.是不是重复越多越好呢?确定样本含量在事先给出
11、一些参考值下,可通过公式计算或查表法确定 45 研究设计的常见类型451完全随机化设计 基本概念:将实验对象完全用随机的方法分配到各个处理组或对照组中,以进行实验观察;或分别从不同的总体中随机抽样进行对比观察的一种设计方法,称之为完全随机化实验设计 随机化分组的方法:较为常用的是查随机排列表【例4.1】设有小白鼠15只,试用随机排列表将它们分成3组。动物编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15随机数字 3 2 6 1 13 8 14 0 9 11 5 4 10 7 12归 组 A A B A C B C A B C B A C B C完全随机化设计的优缺点优
12、点:本设计方法简单、灵活、易理解,处理数以及重复数都不受限制,这样可以充分利用全部试验单元;统计分析也较简单;样本例数的估计较简单;如果某个实验对象发生意外,信息损失小于其它设计,对数据的处理影响不大 缺点:实验误差往往偏高,精确度较低。所以该设计一般只用于实验对象同质性较好的试验。452 配对设计 概念 将那些个体之间的差异较小的研究对象配成若干对子,每对中的两个对象用随机的办法分配给相应的处理组和对照组 配对设计保证了非处理因素对处理组和对照组的干扰尽可能相同或相近动物实验:常将同种属、同窝别、同性别等组成对子 临床试验中,常将性别相同,年龄、职业相近,病情、病型(期)等相同或相近的两个病
13、人配成对子2.随机化分组方法【例4.2】若有16只大白兔,已按性别相同,体重相近等要求配成8对,试将这8对兔子随机分至甲乙两组之中。表4.2 8对大白兔随机分入甲乙两组兔子编号 1.1 1.2 2.1 2.2 3.1 3.2 4.1 4.2 5.1 5.2 6.1 6.2 7.1 7.2 8.1 8.2 随机数字 1 2 0 3 7 4 5 6 归 组 甲 乙 乙 甲 乙 甲 甲 乙 甲 乙 乙 甲 甲 乙 乙 甲 3.优缺点 降低实验误差,提高实验的精确度外,它还可以扩展到空间、时间诸方面 配对条件不能过多、过严 配对设计常见的几种类型:(1)异体配对:将条件相同或相近的实验对象配成对子,然
14、后采用随机化方法将对子分配到各组(2)前后配对:同一对象实验前后(或治疗前后)进行比较(3)自身配对:同一样品采用不同的方法处理(4)左右配对:同一个体左右两侧的器官或组织,一侧施加处理因素,一侧给予对照物453 随机区组设计 本设计首先是在农业试验中提出来的,认为小麦的产量不仅受其品种(处理)的影响,还受田块(区组)的影响。因此,将每个田块再分成几个单元,每个单元所接受的处理(如不同品种的小麦)是随机的,这样的设计既可分析处理的作用,也可分析田块的影响,提高了试验效率。个小麦品种(、)比较试验的随机区组设计田间试验排列 概念:将相同或相近特征的实验对象按处理数的多少(比如是k个)归为一个区组
15、。至于同一区组内每个实验对象接受何种处理,则是随机的。可见,本设计是配对设计的一种扩展,当k为2时,本设计就是配对设计.2.设计方法:首先设置“区组”,将性质相同或相近的实验对象归为一个区组,每个区组的例数就是处理组数;再将区组随机化,即各区组内的实验对象用随机化的方法,决定它们被分到哪一个处理组中。【例43】现假设已按动物的基本特征设置好了6个区组,每个区组各有4个动物,如何进行随机化分组?表4.3 24头动物区组内随机化分配结果 动物编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 随机数字 1 4 3 2
16、1 2 4 3 2 1 4 3 3 2 4 1 3 2 1 4 3 2 1 4 处 理 A D C B A B D C B A D C C B D A C B A D C B A D3.优缺点:误差减低,均衡性好,可以提高效率,统计分析也较简易 不能分析交互作用;区组内的观察对象发生意外,整个区组只好放弃或者不得已而采取缺项估计 4.6 常见的抽样方法 抽样调查的四个优点:1.费用较少;2.速度较快;3.覆盖面较大;4.正确性较高 461 单纯随机抽样 若总体内每个单元被选为样本的概率相等的抽样称为单纯随机抽样 抽样方法:将总体内的全部观察单位编上号码,再用随机数字表、电子计算器随机数字键等随
17、机化工具选出进入样本的号码,已经入选的号码不能再次列入,直至达到预定的样本例数为止【例4.4】欲了解某乡村居民钩虫感染率情况,该村共有居民2000人,试用单纯随机抽样方法抽取样本例数100人作为样本。(1)编号:12000(2)查随机数字表:随意确定一起点和走向,譬如说第6行第一个数字开始,依横向抄录100组随机数字,每组为4个数字,凡后面出现与前面有相同的数字者弃去,它们是1622,7794,3949,8845。凡首位数字8者减8,6而8者减6,4而6者减4,2而4者减2,2者不变 2.优缺点:优点:是当总体内观察单位数与样本例数都不大时比较容易实施,均数(或率)及其标准误的计算也较简便。缺
18、点:在总体含量较大时,实际上难以采用;在总体内各单元的变异大而样本又小时,样本的代表性较差 3.适用范围:只适用于总体内个体间差异均匀的小型调查和实验室研究 462系统抽样(间隔抽样、机械抽样)1)抽样方法:首先必须确定总体的范围和样本例数,将总体内的观察单位依次编号;然后确定抽样比,即确定从每多少个单元(设为k个,k=总体中所有个体数/样本例数)中抽一个单元进入样本。至于究竟抽其中第几个,则必须用随机化的方法决定。具体做法是在1至k个数中,随机选出一个数,把它做为起点,以后依次用相等的间隔,机械地从每k个单元中抽一个观察单位,组成样本【例45】欲了解某小学学生肠道蛔虫感染情况,要求检查学生大
19、便蛔虫卵试验的阳性率,该样有学生1200人,试按系统抽样法抽取一例数为120人的样本。此例中总体例数为N=1200,样本例数n=120,抽样间隔k=N/n=10,先将该校所有学生依次编号为1到1200,再在110之间确定一个随机数,比如为6,于是,以学生编号为6,16,26,1196者组成样本。(2)优缺点 优点:易于理解,简便易行,容易得到一个按比例分配的样本。其抽样误差一般小于单纯随机抽样。缺点:当总体内观察单位按顺序有周期性或单调递增(或递减)趋势时,系统抽样将产生明显的偏性;目前,尚无可靠的统计方法来估计其抽样误差,在实际工作中,一般可按单纯随机抽样来处理。【例】若一个班50人,学号是
20、按照其入学成绩从高到低排列的。为研究入学平均成绩,从中抽取5人。若抽取的是学号为1,11,21,31,41的同学,显然其平均成绩会高于全班平均成绩;若抽取的是学号为9,19,29,39,49的同学,显然其平均成绩会低于全班平均成绩。(3)适用范围 事先对总体内的个体分布有所了解,并且该分布就是随机的,这样才能最恰当地应用系统抽样;在多阶段抽样(见其他统计专著)中,用于后阶段抽样;在分层抽样中,每层可独立使用系统抽样。463 分层抽样 抽样方法:在抽样过程中,将总体按某种特征划分为若干个组别、类型或区域等次级总体(统计中称之为“层”),先从每层内独立抽取一个随机样本,再合成为总体的一个样本,这种
21、方法称之为分层随机抽样 每层具体抽样方法可以不同【例】研究人群的人均消费。先将人群按收入高低分层,然后分别从各层中独立抽取。中等收入N2n1n2n3高收入N1低收入N33.各层中抽样数的确定(1)各层采用相同的抽样比 比例分配:ni=n(Ni/N)(2)各层采用不同的抽样比 最优分配一般原则:从内部变异小的层少抽些单元,而从变异大的层则多抽些;从调查费用少的多抽些,从费用多的少抽些;从包含有意义个体多的层内多抽些,反之则可少抽些。2.优点 由于分层后各层内的个体同质性增加,使得抽样误差小于其它方法;便于对各层进行独立分析,并可作相互比较;由于各层特点不同,可对各层采用不同的抽样方法 3.适用范
22、围:对总体内各层的个体情况有所了解,分层抽样适合于层内变异小而层间变异大时,效果较好464 整群抽样1.方法 该抽样是以个体自然集结的或人为划分的群体(例如家庭、街道、乡、村、工厂、学校等)作为抽样单元,总体中含有K个群,从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体则全部加以调查【例4.6】若调查某县血吸虫感染率,以该县的村为基本抽样单元(共300个村),从中抽取30个村,然后对已所抽取的30个村的居民全部进行调查。2.优缺点:(1)优点:易为群众接受,节省人力、物力、时间等(2)缺点:在样本例数给定时,统计学效能不如单纯随机抽样。如果群间的变异较大,调查少数几个群,则对总体的代表
23、性就较差 3.适用范围 整群抽样适用于群内变异大而群间变异小的总体 465 多阶段抽样1.方法 从总体中先抽取范围较大的单元,称为一级单元(例如县、区),再从每个抽中的一级单元中抽取范围较小的单元,称为二级单元(例如乡、街道),还可以从抽中二级单元中再抽取范围更小的三级单元(如村、居委会),甚至更小的单元。各级抽样可结合使用不同的抽样方法(单纯随机、系统、整群、分层等)2.优缺点及适用范围 大规模调查常采用多阶段抽样,并且可按行政区域逐级进行(客观实际中很容易实现)。Ronald A.Fisher(费歇尔,18901962),英国统计学家和遗传学家,现代统计学的奠基人 Fisher在1938年印度统计学大会演讲时说:“做完实验后才找统计学家,就好像要他作尸体解剖。他会说,这实验死于什么原因”。