统计设计原则和方法.ppt

上传人:豆**** 文档编号:60597064 上传时间:2022-11-17 格式:PPT 页数:102 大小:847KB
返回 下载 相关 举报
统计设计原则和方法.ppt_第1页
第1页 / 共102页
统计设计原则和方法.ppt_第2页
第2页 / 共102页
点击查看更多>>
资源描述

《统计设计原则和方法.ppt》由会员分享,可在线阅读,更多相关《统计设计原则和方法.ppt(102页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计设计原则和方法 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望现代医学科研中的信息大多数是以数据的形式现代医学科研中的信息大多数是以数据的形式加以体现,探索医学数据变化的特有规律,对加以体现,探索医学数据变化的特有规律,对数据进行整理和分析,得出研究结论是医学统数据进行整理和分析,得出研究结论是医学统计学的首要任务。计学的首要任务。医学科研数据的统计分析涉及医学专业知识、医学科研数据的统计分析涉及医学专业知识、统计专业知识、数据分析的经验和技巧等多个统计专业知

2、识、数据分析的经验和技巧等多个方面,既有分析的严谨和科学,又有选择的多方面,既有分析的严谨和科学,又有选择的多样和艺术。样和艺术。讲座主要内容讲座主要内容课题(试验)的统计课题(试验)的统计设计设计统计描述与表达统计描述与表达统计方法选择的基本思路统计方法选择的基本思路实际应用中最常用的统计方法实际应用中最常用的统计方法统计方法的正确应用统计方法的正确应用临床研究中样本含量的估算方法临床研究中样本含量的估算方法实验设计中常见的错误实验设计中常见的错误 任何一项医学(临床、基础、护理、预防)研究,任何一项医学(临床、基础、护理、预防)研究,在确定研究目的之后,首要问题:考虑怎样安排试验或者在确定

3、研究目的之后,首要问题:考虑怎样安排试验或者说需要一份良好的研究计划说需要一份良好的研究计划(称为研究设计称为研究设计),它是使研究,它是使研究结果满足科学性的重要保证。结果满足科学性的重要保证。数据分析数据分析设计数据采集数据采集报报告告三、医学研究的分类三、医学研究的分类教科文定义:基础研究、应用研究、发展研究教科文定义:基础研究、应用研究、发展研究研究目的:研究目的:验证性研究、探索性研究验证性研究、探索性研究研究对象:研究对象:正常人群正常人群 社区干预试验社区干预试验 病病 人人 临床试临床试验验 动物(试验材料)动物试验动物(试验材料)动物试验研究对象是否施加干预:研究对象是否施加

4、干预:实验性研究实验性研究 观察性研究观察性研究设计对比设计对比专业设计专业设计统计设计统计设计要求要求运用专业知识进行设计运用专业知识进行设计运用统计学知识进行设计运用统计学知识进行设计内容内容选选题题、调调查查(实实验验)、方方法法、材材料料确确定定设设计计方方案案、收收集集整整理理资资料料、确确定统计指标、分析和推断方法定统计指标、分析和推断方法方向方向探探讨讨实实验验、观观察察结结果果的的适适用用性性和和创造性创造性探探讨讨实实验验、观观察察结结果果的的可可重重复复性性、高效性高效性目的目的回回答答和和解解决决科科研研课课题题,验验证证假假说说,保证科研结果的先进性保证科研结果的先进性

5、减减少少和和控控制制误误差差。保保证证样样本本的的代代表表性性和和可可靠靠性性,保保证证实实验验结结果果的的精精确确性和可重复性性和可重复性 (一)(一)实验研究设计实验研究设计 实验设计的目的:控制和降低系统误差对实验结实验设计的目的:控制和降低系统误差对实验结果的影响,缩小实验随机误差以利于进行统计推断,果的影响,缩小实验随机误差以利于进行统计推断,更确切地回答研究者事先提出的假设。更确切地回答研究者事先提出的假设。一、实验研究设计的基本要素一、实验研究设计的基本要素 1、处理因素(、处理因素(study factor,treatment):):研究者根据研究目的欲施加或欲观察的能作用于研

6、究者根据研究目的欲施加或欲观察的能作用于 受试对象并引起直接或间接效应的因素受试对象并引起直接或间接效应的因素。如:培养基的放置时间、位置等称为如:培养基的放置时间、位置等称为“非处理因素非处理因素”,这些评价处理因素作用有一定干扰但研究者并不想通过实验这些评价处理因素作用有一定干扰但研究者并不想通过实验考察其作用大小的因素又称为考察其作用大小的因素又称为“混杂因素(混杂因素(confounding factor)”,临床药物研究中,如:病人的病情、病程等。,临床药物研究中,如:病人的病情、病程等。2、实验对象(、实验对象(subject):):实验中接受处理并作为实验观察的人、动物或其它实验

7、中接受处理并作为实验观察的人、动物或其它实验材料(即处理因素作用的客体)。实验材料(即处理因素作用的客体)。对入选的实验对象做到条件一致,以保证同质性。对入选的实验对象做到条件一致,以保证同质性。临床试验临床试验.doc 医学研究受试对象:人和动物,一般先做动物医学研究受试对象:人和动物,一般先做动物实验后再做人体观察,如新药疗效的观察一般是先实验后再做人体观察,如新药疗效的观察一般是先做动物实验,初步观察其疗效和副作用后,再进一做动物实验,初步观察其疗效和副作用后,再进一步在患者身上做临床试验,以确定其疗效和副作用。步在患者身上做临床试验,以确定其疗效和副作用。受试对象选择的合适与否,也是一

8、项实验是否受试对象选择的合适与否,也是一项实验是否成功的关键。受试对象的选择应对处理因素敏感、成功的关键。受试对象的选择应对处理因素敏感、反应必须稳定。反应必须稳定。3、实验效应(、实验效应(experimental effect):):处理因素作用于受试对象的客观反应(处理因素作用于受试对象的客观反应(response)和结)和结果(果(outcome)。)。一般是通过某些观察指标定量或定性地反映实验效应一般是通过某些观察指标定量或定性地反映实验效应。选择指标的依据:选择指标的依据:1、客观性:、客观性:客观指标实验室检查指标客观指标实验室检查指标 主观指标疼痛、头晕主观指标疼痛、头晕 2、

9、有效性:、有效性:灵敏度灵敏度(sensitivity)某处理因素存在时所选指标某处理因素存在时所选指标 能反应出一定的效应能反应出一定的效应 特异度特异度(specificity)某处理因素不存在时所选指标某处理因素不存在时所选指标 不显示处理效应不显示处理效应 灵敏度高的指标较好的显示处理效应,特异度高的指灵敏度高的指标较好的显示处理效应,特异度高的指标不易受非处理因素的干扰,减少假阳性率。标不易受非处理因素的干扰,减少假阳性率。3、准确性:、准确性:效度(效度(vaildity)又称准确度()又称准确度(accuracy)观察值与真值的接近程度,主要受系统误差影响。观察值与真值的接近程度

10、,主要受系统误差影响。信度(信度(reliability)又称精确度(又称精确度(precision)相同条件下对同一对象的某个指标进行重复观察相同条件下对同一对象的某个指标进行重复观察 时,观察值与其均数的接近程度,主要受随机因时,观察值与其均数的接近程度,主要受随机因 素的影响。素的影响。设计时尽量选择效度和信度均较高的指标作为观察设计时尽量选择效度和信度均较高的指标作为观察指标或测定方法。指标或测定方法。实验设计的任务实验设计的任务1、正确选择、正确选择处理因素处理因素2、合理安排、合理安排实验对象实验对象3、准确解释、准确解释实验效应实验效应实验研究的误差实验研究的误差实验研究中误差的

11、种类实验研究中误差的种类1、随机误差(、随机误差(random error)实测值与真值之差实测值与真值之差2、系统误差、系统误差(systematic error)又称为偏倚(又称为偏倚(bias)非实验因素干扰造成的实测值与真值之差非实验因素干扰造成的实测值与真值之差 包括选择偏倚、测量偏倚和混杂偏倚。包括选择偏倚、测量偏倚和混杂偏倚。误差随机误差系统误差二、实验研究设计的原则二、实验研究设计的原则 实验设计的目的就是控制和降低系统误差对实验结果的影实验设计的目的就是控制和降低系统误差对实验结果的影响,缩小随机误差、提高实验的效率,以利于进行统计推断,响,缩小随机误差、提高实验的效率,以利

12、于进行统计推断,研究者能从实验结果中获得无偏的处理统计量及实验误差的估研究者能从实验结果中获得无偏的处理统计量及实验误差的估计值,更确切地回答研究者事先提出的假说,从而得到正确地计值,更确切地回答研究者事先提出的假说,从而得到正确地分析和比较。分析和比较。在研究科研设计方案的时,首先要掌握设在研究科研设计方案的时,首先要掌握设计的原则:计的原则:对照原则对照原则 随机化原则随机化原则 重复原则重复原则 盲法原则盲法原则 1、对照(、对照(control)原则原则 正确的设立对照,才能平衡非处理因素对实验结果的正确的设立对照,才能平衡非处理因素对实验结果的影响,从而把处理因素的效应充分显露出来,

13、设立对照是控影响,从而把处理因素的效应充分显露出来,设立对照是控制各种混杂因素的基本措施。制各种混杂因素的基本措施。设立对照时应使对照组与实验组的非实验因素均衡一设立对照时应使对照组与实验组的非实验因素均衡一致,才能显示致,才能显示“对照对照”的作用。的作用。均衡性:均衡性:在设立对照时除给予处理单因素不同外,其在设立对照时除给予处理单因素不同外,其他对实验效应应有影响的因素(即非处理因素)尽量均衡一他对实验效应应有影响的因素(即非处理因素)尽量均衡一致。致。达到均衡可比必须做到:达到均衡可比必须做到:1、对等、对等 除研究因素外,对照组(实验对象)具备除研究因素外,对照组(实验对象)具备 与

14、实验组(实验对象)对等的一切因素。与实验组(实验对象)对等的一切因素。2、同步、同步 设立的对照组和试验组在整个研究过程中设立的对照组和试验组在整个研究过程中 始终处于同一空间和同一时间。始终处于同一空间和同一时间。3、专设、专设 任何一个对照组都是为相应的试验组专门任何一个对照组都是为相应的试验组专门 设立的。设立的。对照(对照(control)方式)方式1、空白对照、空白对照对照组不施加任何处理因素。对照组不施加任何处理因素。观察某种疫苗预防肾综合征出血热的效果,选观察某种疫苗预防肾综合征出血热的效果,选择人口数量和构成、发病水平、地理环境、主要宿择人口数量和构成、发病水平、地理环境、主要

15、宿主鼠类基本相似的两个疫区,一个作为试验区,在主鼠类基本相似的两个疫区,一个作为试验区,在人群中接种疫苗,另一个作为对照区,不施加任何人群中接种疫苗,另一个作为对照区,不施加任何干预措施,处理因素完全空白。干预措施,处理因素完全空白。2、实验对照实验对照 对照组不施加处理因素,但施加某种实验因素对照组不施加处理因素,但施加某种实验因素 观察赖氨酸对儿童发育的影响,实验组儿童课间加食观察赖氨酸对儿童发育的影响,实验组儿童课间加食含赖氨酸的面包,对照组儿童课间加食不含赖氨酸的面包。含赖氨酸的面包,对照组儿童课间加食不含赖氨酸的面包。处理因素处理因素是赖氨酸,是赖氨酸,非处理因素非处理因素的面包量两

16、组是相同的。的面包量两组是相同的。3、标准对照标准对照 不设立专门的对照组,而是用现有标准值或正常值做不设立专门的对照组,而是用现有标准值或正常值做对照。对照。在临床试验中常以某疗法为标准对照组,这种对照应注意在临床试验中常以某疗法为标准对照组,这种对照应注意标准组必须是代表当时水平的疗法,切不可用降低标准组的标准组必须是代表当时水平的疗法,切不可用降低标准组的方法使实验效应提高。方法使实验效应提高。4 4、自身对照自身对照 对照与实验在同一受试者身上进行,如用对照与实验在同一受试者身上进行,如用药前后作为对比。一般情况下还要求设立平行对照组。药前后作为对比。一般情况下还要求设立平行对照组。5

17、、相互对照、相互对照 这种对照不设立对照组,而是两个或几个这种对照不设立对照组,而是两个或几个 试验组相互对照。试验组相互对照。如:用莫雷西嗪治疗冠心病、高血压、心肌病如:用莫雷西嗪治疗冠心病、高血压、心肌病和失调症引起的室性早搏时,设立冠心病组、高血压和失调症引起的室性早搏时,设立冠心病组、高血压组、心肌病组和失调症组四个治疗组,相互比较它们组、心肌病组和失调症组四个治疗组,相互比较它们的疗效。的疗效。6 6、配对对照配对对照 把研究对象条件相同的两个配成一把研究对象条件相同的两个配成一对,分别给不同的处理因素,对比两者之间的不对,分别给不同的处理因素,对比两者之间的不同效应。配对对照常用于

18、动物实验,临床试验也同效应。配对对照常用于动物实验,临床试验也可采用,但严格地说,很难找到相同或十分相似可采用,但严格地说,很难找到相同或十分相似的对子。的对子。2、随机化(、随机化(randomization)原则:)原则:随随机机化化是是实实验验研研究究中中据据设设计计要要求求,每每一一个个受受试试对对象象都都有有同同等等的的机机会会被被分分配配到到任任何何一一个个组组中中去去,分分组组的的结结果果不不受受人为因素的干扰和影响。人为因素的干扰和影响。贯贯彻彻随随机机分分配配原原则则是是提提高高对对比比组组之之间间均均衡衡可可比比的的重重要要手手段段,是是控控制制选选择择性性偏偏倚倚唯唯一一

19、有有效效的的方方法法。也也是是资资料料分分析析、统计推断的理论基础。统计推断的理论基础。随机应体现在:随机应体现在:1、分组随机(、分组随机(random allocation)每个研究对象分配到不同处理组的机会相同,每个研究对象分配到不同处理组的机会相同,以保证均衡提高组间可比性。以保证均衡提高组间可比性。2、实验顺序的随机(、实验顺序的随机(random order)每个研究对象先后接受处理的机会相等,以平每个研究对象先后接受处理的机会相等,以平衡实验顺序对结果的可能影响衡实验顺序对结果的可能影响 随机数字表随机数字表 表内数字相互独立,全部数字无论从横表内数字相互独立,全部数字无论从横行

20、、纵行或斜向等各种顺序均呈随机状态。因此,使用时可行、纵行或斜向等各种顺序均呈随机状态。因此,使用时可从任何一个数字开始,按任意一个顺序录用。从任何一个数字开始,按任意一个顺序录用。随机样本:随机样本:如拟将如拟将12只大鼠随机分入甲、乙两组,每只大鼠随机分入甲、乙两组,每组组6只。应先把受试者按体重由小到大编号,然后从随机数只。应先把受试者按体重由小到大编号,然后从随机数字表任意一处查出字表任意一处查出12个随机数,遇到相同的随机数则去掉个随机数,遇到相同的随机数则去掉(如从(如从“随机数字表随机数字表“第第35行第行第1列向右查)。并将随机数列向右查)。并将随机数由小到大编秩(秩次由小到大

21、编秩(秩次R),令),令R为为16者分入甲组,者分入甲组,R 为为712者分入乙组。者分入乙组。动物编号动物编号 1 2 3 4 5 6 7 8 9 10 11 12随机数字随机数字 69 92 06 34 13 59 71 74 17 32 27 55秩次秩次R 9 12 1 6 2 8 10 11 3 5 4 7分组结果分组结果 乙乙 乙乙 甲甲 甲甲 甲甲 乙乙 乙乙 乙乙 甲甲 甲甲 甲甲 乙乙配对设计:配对设计:如将已配成如将已配成10对的对的20名受试者随机分配到甲、乙两处理名受试者随机分配到甲、乙两处理组。组。先将受试者编号,如第一对第一受试者编号为先将受试者编号,如第一对第一受

22、试者编号为1.1,第二受试者编,第二受试者编号为号为1.2,余仿此。再从随机排列表中随机指定某行,例如第,余仿此。再从随机排列表中随机指定某行,例如第6行,依次行,依次将将09之间的随机数字录于受试者编号下,舍去之间的随机数字录于受试者编号下,舍去1019之间的数字,之间的数字,并规定随机数字为奇数时取甲乙顺序,偶数时取乙甲顺序。并规定随机数字为奇数时取甲乙顺序,偶数时取乙甲顺序。受试者号受试者号 1.1 2.1 3.1 4.1 5.1 6.1 7.1 8.1 9.1 10.1 1.2 2.2 3.2 4.2 5.2 6.2 7.2 8.2 9.2 10.2随机数字随机数字 2 8 1 4 3

23、 0 9 6 7 5 处处 理理 乙乙 乙乙 甲甲 乙乙 甲甲 乙乙 甲甲 乙乙 甲甲 甲甲 甲甲 甲甲 乙乙 甲甲 乙乙 甲甲 乙乙 甲甲 乙乙 乙乙结结 果:果:1.2、2.2、3.1、4.2、5.1、6.2、7.1、8.2、9.1、10.1 号受试者被分配到甲组;号受试者被分配到甲组;1.1、2.1、3.2、4.1、5.2、6.1、7.2、8.1、9.2、10.2 号受试者被分配到乙组。号受试者被分配到乙组。随机号右布地奈德随机号右布地奈德.doc3、重复(、重复(replication)原则:)原则:可可靠靠的的实实验验结结果果,应应能能在在相相同同条条件件下下重重现现出出来来;可可靠

24、靠的的实实验验结结论论也也不不能能凭凭一一次次实实验验或或35 例例结结果果获获得得,所所谓谓重重复复,就就是是实实验验要要有有足足够够的的样样本本含含量量。重重复复是是消消除除非非处处理理因因素素影影响响的又一重要手段。的又一重要手段。重复:重复:1、结论的重复、结论的重复 确保实验的重现性,以提高实验的可靠性。确保实验的重现性,以提高实验的可靠性。2、样本量科学计算、样本量科学计算 使结果具有稳定性,使假设检验达到预期使结果具有稳定性,使假设检验达到预期 的功效。的功效。3、同一实验对象的重复观察、同一实验对象的重复观察 保证观察结果的精度保证观察结果的精度4、盲法原则、盲法原则 实实验验

25、设设计计时时常常把把盲盲法法也也作作为为一一条条附附加加原原则则,以以更更好好地地控制误差。控制误差。单单盲盲:受受试试者者不不知知道道分分组组情情况况,有有利利于于研研究究者者了了解解情情况况,但可能会产生由研究带来的偏倚。但可能会产生由研究带来的偏倚。双双盲盲:研研究究者者和和受受试试者者均均未未知知分分组组情情况况和和接接受受处处理理的的具具体体内容,可以控制来自研究者和受试者两方面主观上的干扰。内容,可以控制来自研究者和受试者两方面主观上的干扰。观察性研究设计观察性研究设计-调查性研究调查性研究调查研究的特点调查研究的特点研究研究/分析因素是客观存在的分析因素是客观存在的 l研究过程中

26、没有人为的施加干预措施,而是客研究过程中没有人为的施加干预措施,而是客观地观察记录某些现象的现状及其相关特征;观地观察记录某些现象的现状及其相关特征;不能采用随机分配的方法来平衡或消除非不能采用随机分配的方法来平衡或消除非研究因素对研究结果的影响。研究因素对研究结果的影响。调查设计的基本原则与内容调查设计的基本原则与内容明确调查目的并将其具体化到指标;明确调查目的并将其具体化到指标;确定调查对象和观察单位;确定调查对象和观察单位;确定并选择调查方法;确定并选择调查方法;确定样本含量;确定样本含量;确定资料的搜集方式;确定资料的搜集方式;确定调查项目和拟定调查表;确定调查项目和拟定调查表;制定调

27、查的组织计划;制定调查的组织计划;整理、分析计划的制定。整理、分析计划的制定。明确调查目的和指标明确调查目的和指标明确调查目的是调查研究各个环节中最核心的明确调查目的是调查研究各个环节中最核心的问题。问题。研究目的可分为两种:研究目的可分为两种:l了解样本信息来推断总体特征;了解样本信息来推断总体特征;l掌握和探索变量间的相互关系。掌握和探索变量间的相互关系。指标要精选,尽量用客观、灵敏、精确的定量指标要精选,尽量用客观、灵敏、精确的定量指标。指标。确定调查对象和观察单位确定调查对象和观察单位根据调查目的确定调查对象,即要确定调根据调查目的确定调查对象,即要确定调查总体及其同质范围。查总体及其

28、同质范围。明确的诊断标准、纳入标准和排除标准。明确的诊断标准、纳入标准和排除标准。观察单位可为人、物、群体、地区等。观察单位可为人、物、群体、地区等。例:欲了解某地区成年人过敏性鼻炎的发例:欲了解某地区成年人过敏性鼻炎的发病情况。病情况。欲了解某地区过敏性鼻炎的发病情况欲了解某地区过敏性鼻炎的发病情况诊断标准诊断标准l典型症状典型症状:流涕、鼻塞、鼻痒和喷嚏,可有眼流涕、鼻塞、鼻痒和喷嚏,可有眼部卡他症状;部卡他症状;l体征:典型的体征包括鼻粘膜苍白、水肿、水体征:典型的体征包括鼻粘膜苍白、水肿、水样或粘液样鼻涕,由于水肿的存在,可有程度样或粘液样鼻涕,由于水肿的存在,可有程度不等的通气不畅。

29、不等的通气不畅。l过敏性鼻炎的分型:根据其发病频度和持续时过敏性鼻炎的分型:根据其发病频度和持续时间可分为间断性和持续性两种;间可分为间断性和持续性两种;“间断性间断性”是指是指1 1周内少于周内少于4 4天有症状或少于天有症状或少于4 4周;周;“持续性持续性”指指1 1周内超过周内超过4 4天有症状并超过天有症状并超过4 4周。周。欲了解某地区过敏性鼻炎的发病情况欲了解某地区过敏性鼻炎的发病情况入选标准入选标准l年龄年龄18-65岁,男女不限;岁,男女不限;l符合过敏性鼻炎的诊断标准;符合过敏性鼻炎的诊断标准;l治疗前应有两项以上过敏性鼻炎的症状评分在治疗前应有两项以上过敏性鼻炎的症状评分

30、在2分以分以上,总分在上,总分在4分以上,对生活质量的影响在分以上,对生活质量的影响在3级以上级以上(含(含3级);级);l已经阅读受试者须知并书面签署知情同意书。已经阅读受试者须知并书面签署知情同意书。欲了解某地区过敏性鼻炎的发病情况欲了解某地区过敏性鼻炎的发病情况排除标准排除标准l妊娠及哺乳期妇女;妊娠及哺乳期妇女;l活动性肺结核患者;活动性肺结核患者;l严重的鼻中隔偏曲,鼻中隔溃疡,鼻息肉,鼻腔或鼻严重的鼻中隔偏曲,鼻中隔溃疡,鼻息肉,鼻腔或鼻窦的细菌性、真菌性、病毒性感染,鼻咽癌患者;窦的细菌性、真菌性、病毒性感染,鼻咽癌患者;l近期做过鼻内手术,伤口尚未完全愈合者;近期做过鼻内手术,

31、伤口尚未完全愈合者;l眼内压增高者,疱疹性角膜炎,真菌感染;眼内压增高者,疱疹性角膜炎,真菌感染;l正在罹患上和正在罹患上和/或下呼吸道感染者;或下呼吸道感染者;l因其它原因不能与研究者配合者;因其它原因不能与研究者配合者;l确定并选择调查方法确定并选择调查方法普查:普查:对总体中所有的观察单位进行调查对总体中所有的观察单位进行调查,一一般用于了解总体在某一特定般用于了解总体在某一特定“时点时点”上的情况,上的情况,如年中人口数、时点患病率。如年中人口数、时点患病率。典型调查:亦称案例调查。即对事物进行全面典型调查:亦称案例调查。即对事物进行全面了解的基础上,有目的选择典型的人和单位进了解的基

32、础上,有目的选择典型的人和单位进行调查。行调查。抽样调查:是医学研究中最常用的方法,是通抽样调查:是医学研究中最常用的方法,是通过随机抽样方法从总体中随机抽取一定数量具过随机抽样方法从总体中随机抽取一定数量具代表性的观察单位组成的样本进行调查,然后代表性的观察单位组成的样本进行调查,然后根据样本信息来推断总体特征。根据样本信息来推断总体特征。常用的抽样方法常用的抽样方法单纯随机抽样单纯随机抽样(simple random sampling)l将调查总体全部观察单位编号,再用抽签法或将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。随机数字表随机抽取部分观察单位组成

33、样本。l优点:操作简单,均数、率及相应的标准误优点:操作简单,均数、率及相应的标准误计算简单。计算简单。l缺点:总体较大时,难以一一编号。缺点:总体较大时,难以一一编号。常用的抽样方法常用的抽样方法系统抽样(系统抽样(systematicsampling)l又称机械抽样、等距抽样,即先将总体的观察单位按又称机械抽样、等距抽样,即先将总体的观察单位按某一顺序号分成某一顺序号分成n个部分,再从第一部分随机抽取第个部分,再从第一部分随机抽取第k号观察单位,依次用相等间距,从每一部分各抽取一号观察单位,依次用相等间距,从每一部分各抽取一个观察单位组成样本。个观察单位组成样本。l优点:易于理解、简便易行

34、。优点:易于理解、简便易行。l缺点:总体有周期或增减趋势时,易产生偏性。缺点:总体有周期或增减趋势时,易产生偏性。常用的抽样方法常用的抽样方法整群抽样整群抽样(clustersampling)l总体分群,再随机抽取几个群组成样本,群总体分群,再随机抽取几个群组成样本,群内全部调查。内全部调查。l优点:便于组织、节省经费。优点:便于组织、节省经费。l缺点:抽样误差大于单纯随机抽样。缺点:抽样误差大于单纯随机抽样。常用的抽样方法常用的抽样方法分层抽样(分层抽样(stratifiedsampling)l先按对观察指标影响较大的某种特征,将总体先按对观察指标影响较大的某种特征,将总体分为若干个类别,再

35、从每一层内随机抽取一定分为若干个类别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。有按比例数量的观察单位,合起来组成样本。有按比例分配和最优分配两种方案。分配和最优分配两种方案。l优点:样本代表性好,抽样误差减少。优点:样本代表性好,抽样误差减少。以上四种基本抽样方法都属以上四种基本抽样方法都属单阶段抽样单阶段抽样,实,实际应用中常根据实际情况将整个抽样过程分际应用中常根据实际情况将整个抽样过程分为若干阶段来进行,称为多阶段抽样。为若干阶段来进行,称为多阶段抽样。确定资料的搜集方式确定资料的搜集方式直接观察法:直接观察法:直接观察、检查、测量。直接观察、检查、测量。l该方式获得的资

36、料相对准确;该方式获得的资料相对准确;l所需人力、物力、财力较多。所需人力、物力、财力较多。采访法:采访法:调查者直接或间接与被调查者交谈调查者直接或间接与被调查者交谈。l面对面采访方式:便于交流、解释、可得到与设计要求面对面采访方式:便于交流、解释、可得到与设计要求相近的答题,应答率较高;相近的答题,应答率较高;l自填方式:保密性较好、如信访;自填方式:保密性较好、如信访;l开调查会:适用于项目较简单时。开调查会:适用于项目较简单时。确定调查项目和拟定调查表确定调查项目和拟定调查表问题的形式问题的形式l开放式问题:对问题答案不加限制,由调查对象对问题开放式问题:对问题答案不加限制,由调查对象

37、对问题自由回答。自由回答。l封闭式问题:根据问题可能的答案,提出两个或多个固封闭式问题:根据问题可能的答案,提出两个或多个固定答案供调查对象选择。定答案供调查对象选择。问题设计的一般原则问题设计的一般原则l尽量避免医学专业术语尽量避免医学专业术语l避免混淆、双重问题避免混淆、双重问题l避免诱导或强制避免诱导或强制l问题应适合全部调查对象并符合逻辑问题应适合全部调查对象并符合逻辑l涉及敏感问题应采用特殊调查技术进行调查。涉及敏感问题应采用特殊调查技术进行调查。制定调查的组织计划制定调查的组织计划包括组织领导、宣传动员、时间进度、分包括组织领导、宣传动员、时间进度、分工与联系、调查人员培训、经费预

38、算等。工与联系、调查人员培训、经费预算等。2:数据收集、整理、分析过程:数据收集、整理、分析过程数据的收集和录入数据的收集和录入数据的质量的控制数据的质量的控制统计分析方法的选择统计分析方法的选择统计学特点统计学特点基本构成元素及特征随机变量随机变量个体内与个体间个体内与个体间抽样误差抽样误差离散变量离散变量连续变量连续变量特征特征统计推断统计推断统计描述统计描述2、收集资料(、收集资料(collectionofdata)方式:方式:1、常规保存的工作记录、常规保存的工作记录2、统计工作报表、统计工作报表3、专题调查与实验研究资料、专题调查与实验研究资料3、整理资料(、整理资料(sorting

39、data)1.资料核查资料核查2.数据结构与特点数据结构与特点建数据库的格式建数据库的格式3.数据编码数据编码4.设计分组设计分组5.预分析预分析4、分析资料(、分析资料(analysisofdata)统计描述统计描述(descriptive statistics):用统计指标、统计表、统计图等方法,对资料的数量特征及分布规律进行测定和描述。统计推断统计推断(inferential statistics):如何抽样,以及如何在随机变量的样本值基础上推断概率分布和总体值。统计学中的基本概念统计学中的基本概念 1、总体、总体(population)总体:根据研究目的所确定的性质相同的所有个体的总体

40、:根据研究目的所确定的性质相同的所有个体的某种变量值的集合。某种变量值的集合。如:调查某地如:调查某地1999年正常成年男子的红细胞数,年正常成年男子的红细胞数,观察对象:该地观察对象:该地1999年正常成年男子。年正常成年男子。观察单位:统计研究中的最基本单位,观察单位:统计研究中的最基本单位,如:一个人、一个家庭、一个地区等。如:一个人、一个家庭、一个地区等。观察值(变量值):每个人测得的红细胞数。观察值(变量值):每个人测得的红细胞数。该地该地1999年正常成年男子的红细胞数就构成一个总体。年正常成年男子的红细胞数就构成一个总体。同质基础:同一地区、同一年份、同为正常成人、同为同质基础:

41、同一地区、同一年份、同为正常成人、同为男性男性 2、样本、样本(sample)从总体中随机抽取部分观察单位的实测值所组成的集合。从总体中随机抽取部分观察单位的实测值所组成的集合。(随机化原则:总体中每一个观察单位均有同等机会(随机化原则:总体中每一个观察单位均有同等机会被抽取)被抽取)个体(个体(observedunit)3、误差(、误差(error)(1)随机误差随机误差抽样误差(抽样误差(samplingerror)由于总体中的个体间往往由于总体中的个体间往往存在着变异,随机抽取样本测得的指标(统计量)与总体存在着变异,随机抽取样本测得的指标(统计量)与总体指标(参数)存在着的差异。指标(

42、参数)存在着的差异。随机测量误差随机测量误差(randommeasurementerror)某项指某项指标在同一条件下进行反复测量所产生的误差。标在同一条件下进行反复测量所产生的误差。(2)非随机误差)非随机误差系系统统误误差差:由由于于设设计计不不严严,测测量量仪仪器器不不准准确确,测测量量者者水平的偏差而造成的。水平的偏差而造成的。过失误差过失误差:人为造成的检查、记录、观察、录入数据人为造成的检查、记录、观察、录入数据错误等。错误等。4、参数(、参数(parameter)、统计量)、统计量(statistics)反映总体特征的指标称为参数反映总体特征的指标称为参数(或总体参数或总体参数)

43、反映样本特征的指标称为统计量反映样本特征的指标称为统计量(或参数估计值或参数估计值)。统计资料类型统计资料类型计量资料(计量资料(quantitative data)计数资料计数资料(qualitative data)等级资料等级资料(ranked data)又称为计量资料又称为计量资料:用专业仪器测量,具有计量单位的测量数据,表现为数值的大小,如身高(cm)、体重(kg)、血压(kPa)等。特点:每个观察单位的观察值间有量的区别定量资料定量资料(quantitativedata)定性资料(qualitativedata):又称为计数资料观察值是定性的,表现为互不相容的类别或属性(即将观察单位

44、按某种属性或类别分组,所得各组的观察单位数)。特点:每个观察单位的观察值间有质的区别无序分类(无序分类(unorderedcategories)又称为计数资料又称为计数资料二二项项分分类类检验结果可以是阳性或阴性、治疗结果可以是治愈或未愈、性别属性等,表现为两类间互相对立。多多项项分分类类某种观察结果为互不相容的多个类别,如血型、职业等。特点:表现为两类间互相对立有序分类(ordinalcategories)又称为等级资料特点:各类之间有程度的差别介于定量测量和定性观察之间的半定量观察结果 观察以某种药治疗某病患者的治疗结果,以每个患者为观察单位,结果分为治愈、显效、好转、无效四级。资料的转化

45、观观察察某某人人群群成成年年男男子子的的血血红红蛋蛋白白量量(g/L),属属数数值值变变量量;若若分分析析比比较较某某种种病病人人的的血血红红蛋蛋白白水水平平与与正正常常人人有无差别,须按计量资料进行处理。有无差别,须按计量资料进行处理。序号正常人组病人组123456789若若按按血血红红蛋蛋白白正正常常与与偏偏低低分分为为两两类类,可可按按二二项项分分类类资料处理;资料处理;正常人组病人组正常偏低合计若若按按贫贫血血的的诊诊断断标标准准将将血血红红蛋蛋白白含含量量分分为为五五个个等等级级:重重度度贫贫血血、中中度度贫贫血血、轻轻度度贫贫血血、正正常常、血血红红蛋白增高,可按等级资料处理。蛋白

46、增高,可按等级资料处理。正常人组病人组重度贫血中度贫血轻度贫血正常血红蛋白增高血红蛋白增高合计概率概率假假如如临临床床观观察察中中治治疗疗200病病人人的的样样本本,求求得得治治愈愈率率为为75%,这这只只是是一一个个频频率率。实实际际应应用用中中,当当概概率率不不易易求求得得时时,常常用用n时时的的频频率率作作为为概概率率的的估估计计值值。但但当当n较较少少时时,频频率的波动性是很大的,用于估计概率是不可靠的。率的波动性是很大的,用于估计概率是不可靠的。某某地地20岁岁男男子子100人人,其其身身高高均均数数为为166.06cm,标标准准差差为为 4.95cm;其其体体重重均均数数为为 53

47、.72kg,标标准准差差为为4.96kg.欲欲比比较较身身高高与与体体重重的的变变异异何何者者为为大大,由由于于度度量量单单位不同,不能比较其标准差而应比较其变异系数位不同,不能比较其标准差而应比较其变异系数身高身高体重体重可见该地可见该地20岁男子体重的变异大于身高的变异。岁男子体重的变异大于身高的变异。例题例题1 某地男孩出生体重(某地男孩出生体重(kg)和)和18岁男学生体重岁男学生体重(kg)如下:如下:试比较其变异程度试比较其变异程度年龄组年龄组人数人数均数均数标准差标准差变异系数()变异系数()出生组出生组1001003.300.443.300.4413.313.31818岁组岁组

48、10010056.105.5056.105.509.89.8例题例题2:统计方法选择的基本思路统计方法选择的基本思路统计方法的正确选择极为重要,是保证正确可靠统统计方法的正确选择极为重要,是保证正确可靠统计结论的基本保证。计结论的基本保证。变量分为单变量、双变量变量分为单变量、双变量数据类型分为计量资料、计数资料、等级资料。数据类型分为计量资料、计数资料、等级资料。一、单变量一、单变量1、计量资料的分析、计量资料的分析正态或转换后正态非正态单样本u检验(大样本)/单样本t检验(样本均数与总体均数比较的t检验)单样本u检验(大样本)/Wilcoxon符号秩检验(单样本与总体中位数比较)样本与总体

49、的比较两样本比较配对非配对差值正态或转换后正态差值非正态配对t检验/随机区组设计配对t检验(大样本)/单样本u检验(大样本)/Wilcoxon符号秩检验正态、方差齐(必要时可进行变量变换)方差不齐和/或非正态反应变量为生存时间且可进行变量变换两样本t检验/u检验(大样本)/单因素方差分析t检验(正态或大样本)/u检验(大样本)/Wilcoxon秩和检验Log-rank检验(生存分析)多样本比较完全随机设计随机区组设计重复测量设计多重比较正态、方差齐(必要时可进行变量变换)完全随机设计方差分析方差不齐和/或非正态正态、方差齐(必要时可进行变量变换)Kruskal-Wallis秩和检验Log-ra

50、nk检验(生存分析)正态、方差齐(必要时可进行变量变换)随机区组设计方差分析球对称、方差齐性单样本重复测量资料方差分析/成组重复测量资料方差分析(非球性对称时,要校正F界值)LSD-t检验/SNKq检验/Dunnettt检验(各试验组与对照组的比较)一、单变量一、单变量2、计数资料的分析、计数资料的分析两个率非配对配对总体与样本两样本单样本u检验/基于二项分布的确切概率法配对2 检验(McNemartest)2检验/Fisher确切概率法/两样本率的u检验R*C表双向无序单项有序双向有序多个样本率/构成比非配对/配伍设计配对/配伍设计反应变量有序分组变量有序关联度分层计数资料分层2 检验(Ma

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁