《流行病学与生物统计学教学大纲整理.doc》由会员分享,可在线阅读,更多相关《流行病学与生物统计学教学大纲整理.doc(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、十四章 医学统计学概述 掌握:1.医学统计学的部分基本概念:总体、样本、抽样误差、小概率事件、参数、统计量等。 总体:根据研究目的而确定的同质个体的全部 样本:按随机化原则从总体中抽取部分观察单位的某一变量值的集合 抽样误差:抽取的样本只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标,这种样本指标与总体指标的差异称为抽样误差。抽样误差越小,用样本推断总体的精确度越高。 小概率事件:统计学一般把P?0.05或P?0.01的事件称为小概率事件,表示某件事件发生的可能性很小,在实际的一次抽样中可认为不会发生。 参数:总体的统计指标数值。如:总体均数、总体标准差、 总体率。 统计量
2、:依据样本观察值所定出的量。如:样本均数、样本标准差 、 样本率。 2.变量的类型。 数值变量(计量资料):其变量值是定量的,表现为数值的大小,一般有度量衡单位。如身高、体重、浓度。 分类变量:其变量值是定性的,表现为互不相容的类别或属性。无序分类变量(计数资料):二项分类变量、多项分类变量;有序分类变量(等级资料)。 熟悉:医学统计学方法的基本步骤。 设计,收集资料,整理资料,分析资料 第二十章 统计分析结果的表达 掌握:1.统计表的基本结构和要求: (1)标题:高度概括表的中心内容,文字应确切、简明扼要。 (2)标目:文字简明,有单位的标目要注明单位。 (3)线条:力求简洁,常使用三线格形
3、式(除顶线、底线及隔开纵标目与数字的横线外,其它线条均省去),特别禁用斜线和竖线。 (4)数字:使用阿拉伯数字,同栏数值的位数及小数点位置上下对齐,小数位数一致。表内不留空格,如缺失可用“,”或“”来表示,若数值为“0”,则填写“0”。 (5)备注:不列入表内,用“*”标出,写在表外下面。 2.常用统计图(线图、半对数线图、直条图、直方图、圆图、百分条图、散点图)的基本结构和应用范围。 ?品质资料,间断性资料: 直条图:表示相互独立的各指标数值(纵轴从0开始,直条间隙与直条宽度相等或为其一半,直条按大小或自然顺序排列) 圆图:表示构成比(各构成百分比乘3.6?即可,按百分比大小顺序或自然顺序排
4、列,一般以时钟12点的位置为起点,顺时针方向排列。) 百分条图:表示构成比(按百分比大小顺序或自然顺序排列) ?连续性资料: 线图:表示发展和变化趋势(横轴表示连续性变量,纵轴应从0开始) 半对数线图:比较两种或两种以上事物随时间变动的速度(相对比),纵坐标的尺度为对数尺度 直方图:表示频数分布(注意频率分布直方图和频数分布直方图)(纵轴应从0开始) 散点图:用点的密集程度和趋势表示两种事物变化的相关性(横纵均不一定从0开始),对于横轴上的每一个值,纵轴上可以有与之对应的多个值。 箱式图:用于多组数据的直观比较分析。一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制。箱子越
5、长,数据变异度越大,箱子中心横线接近终点说明数据分布对称。 熟悉:1.统计表的种类。 1 简单表:主词仅有一个标志 复合表:主词有两个以上标志 2.制图通则。 (1)根据资料性质和分析目的,正确选用图形。 (2)要有确切的标题,说明资料内容。标题位于图的下方。 (3)有纵横坐标的图形,一般以第一象限为准则作图,两轴交点为起点。纵横轴尺度应等距,并须有标目、单位,纵横轴长度比例5:7。直条图、直方图的纵坐标必须从“0”开始。 (4)同一图内比较几种不同事物时,用不同的线条或颜色表示,并附图例说明。 第十五章 数值变量的统计分析 掌握:1.部分集中趋势(算术均数、几何均数)和离散趋势指标(方差、标
6、准差、变异系数)统计描述的计算方法和应用条件。 算术均数:算术均数简称均数。X表示变量X的样本均数,(希腊字母)表示总体均数。均数适用于对称分布资料,正态或近似正态分布资料。 直接法 加权法 式中f为各组的频数,x为各组的组中值。 几何均数:用G表示。适用于对数正态分布资料或等比资料,例如抗体的平均滴度和平均效价。 直接法 加权法 方差:适用于对称分布资料,尤其是正态分布资料。 标准差:适用于对称分布资料,尤其是正态分布资料。 2 样本标准差: 可改写为 上式n-1称为自由度()。 样本标准差计算也可用直接法或加权法。n较小时,选择直接法,n较大,选择加权法 加权法 变异系数:适用:(1)比较
7、度量单位不同的多组资料的变异度。(2)比较均数相差悬殊的多组资料变异度。 正态分布资料宜用均数与标准差(有时用方差)描述集中与离散情况,记为X?S。 偏态分布资料宜用几何均数、中位数及四分位数间距等描述。 比较几组资料的变异程度,若各组资料的单位不全相同,或均数相差悬殊时,用变异系数。 2.正态分布的特征。 (1)正态分布在横轴上方,均数处最高,以均数为中心,左右对称。 (2)正态分布的X取值范围理论上没有边界,X离越远,f(X)值越接近0,但不会等于0。 (3)正态分布曲线下的面积分布有一定的规律。 (4)正态分布完全由两个参数即均数与标准差决定,其中是位置参数,是变异参数。常用N(,2 )
8、来表示。 3.医学参考值范围的估计。 指特定的“正常”人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。 正态分布法(适用于正态分布或近似分布资料) 百分位数法(适用于偏态分布资料) 3 4.抽样误差标准误的意义、计算方法和应用。 抽样误差(标准误)的意义:这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差不可避免。 标准误的计算方法:反映均数抽样误差大小的指标是样本均数 X 的标准差,总体标准差往往未知,因此。 标准误的应用: (1)反映样本均数的可靠性:标准误反映抽样误差的大小。标准误大,表示抽样误差大,则样本均数估计总体均数
9、的可靠性差。反之,标准误小,抽样误差小,样本均数估计总体均数的可靠性好。 (2)估计总体均数的可信区间。 (3)用于均数的假设检验。 5.t分布的特征。 (1)单峰分布,以0为中心,左右对称; (2)t分布是一簇曲线,其形态变化与自由度的大小有关。自由度越小,样本标准差与总体标准差差别越大,t值越分散,曲线的峰部越矮,尾部越粗;越大,t分布越接近于标准正态分布。 6.总体均数的置信区间估计。 结合样本统计量和标准误可以确定一个具有一定可信度的包含总体参数的区间,该区间称为总体参数的1,可信区间 (1)未知,但样本例数n足够大(如n50),总体均数的1,双侧可信区间为 (2)未知且n较小,则用样
10、本平均数加减t或t与S的乘积计算。 0.05/2,v0.01/2,vx拔(3)已知,则用样本平均数加减1.96或2.58与的乘积计算。 7.常用t检验和u检验的计算。 ?样本均数与总体均数的比较用t检验(小样本),或u检验(大样本)。 ?配对资料可用配对t检验进行分析,先要求出各对数据的差值d及均数。若实验效应无作用,理论上差值d的总体均数ud为0,所以可将这类问题看成是样本均数与总体均数为0的比较。 ?完全随机设计的两样本均数比较t检验(小样本),u检验(大样本) 注意:t检验的应用条件:(1)标准差未知,样本例数n较小;(2)要求样本来自正态分布的总体;(3)作两样本均数比较时还要求两样本
11、的总体方差相等。 4 u检验的应用条件:标准差已知或标准差未知,但n1,n2均足够大(一般大于100);(2)、(3)同上。 两者均可能需要考虑检验标准误是否齐同: 若两样本总体方差不等 宜用几何均数表示其平均水平的资料,当推断两样本几何均数各自代表的总体几何均数有无差别时,应进行变量变换,将观察值x用lgx来代替后再进行t检验或u检验。 8.方差分析的基本思想。 可以将总的变异分解成若干部分,每一部分都与某种效应相对应;总的自由度也被分为相应的各个部分。将这些可能由某因素所致的变异与随机误差比较,了解该因素对结果有无影响。 5 9.假设检验的两类错误。 ?型错误是指拒绝了实际上成立的H0,也
12、即“弃真”。确定以 t为临界值时,犯?型错误的概率就是。?型错误是指接受了实际上不成立的H0,也即“取伪”。?型错误的概率用表示。样本量确定后,犯两类错误的概率不可能同时减少,愈小,愈大;反之,愈大,愈小。同时减少,唯一方法增加样本量。 熟悉:1.其他集中趋势(中位数)的统计描述的计算方法和应用条件。 中位数:适用于任何一种分布的计量数据,一般多用于描述偏态分布或数据一端无界资料的集中趋势。 ?直接法: n为奇数 n为偶数 ?频数表法: L为本组(中位数所在组)下限,i为本组组距,f为本组频数,fL为上一组的累计频数。本组位置可根据累计频数的数值来判断。当某一组的累计频数首先超过n/2时或累计
13、频率首先超过50%时,即定为本组。 其他离散趋势指标(极差、四分位数间距)的统计描述的计算方法和应用条件。 2.百分位数:适用于任何一种分布的计量数据,一般多用于描述偏态分布或数据一端无界资料的集中趋势。 极差(全距):用R表示,是一组观察值中最大值与最小值之差,反映个体差异的范围。全距大,说明变异度大;反之,说明变异度小。不能反映组内其它数据的变异度;易受个别数据的影响,稳定性较差,抽样误差较大,而且还受n大小的影响,平均起来,n越大,全距越大。 四分位数间距:四分位数间距是两个特定的百分位数之差,用Q表示:Q,QU,QL,P75,P25。适用于任何分布的计量资料,尤其适用于偏态分布的资料(
14、不宜用标准差表示离散度) 3.标准差和标准误的应用。 ?标准差的应用:用于对称分布,特别是正态分布资料,表示观察值分布的离散程度;结合均数描述正态分布的特征和估计医学参考值范围;结合样本含量计算标准误;用以计算变异系数。 ?标准误的应用:反映样本均数的可靠性;估计总体均数的可信区间;用于均数的假设检验。 4.参考值范围和置信区间的区别。 ?意义不同:参考值范围是指同质总体中包括一定数量(如95%或99%)个体值的估计范围。置信区间是按一定的可信度来估计总体参数所在范围。 ?计算方法不同:参考值范围用标准差计算。可信区间用标准误。 5.假设检验的基本步骤和注意事项。 ?基本步骤:(1)建立假设和
15、确定检验水准(2)选定检验方法和计算统计量(3)确定P值,作出6 推断结论 ?注意事项:(1)保证组间的可比性(2)根据研究目的、设计和资料类型选用恰当的检验方法(3)正确理解差别有无统计学意义和实际意义的区别(4)结论不能绝对化(5)u检验和t检验理论上要求样本来自正态分布总体 6.完全随机设计的方差分析: 了解:1.频数表的编制。 频数表的编制的基本步骤:(1)计算全距。(2)确定组距,根据全局的大小、观察值的个数,取整取偶。(3)划分组段。(4)列表划计,统计频数。(5)确定频率与累计频率。 2.制定医学参考值范围的基本原则。 (1)抽取样本含量足够大的“正常人”。一般认为样本含量应在1
16、00 例以上,并以取得一个比较稳定的样本分布为原则。(2)对抽取的正常人进行准确而统一的测定,控制测量误差。(3)判断是否需要分组制定参考值范围。(4)决定参考值范围的单侧或双侧界值。(5)选择适当的百分界值。(6)根据资料的分布类型选用恰当的方法(正态分布法,百分位数法)估计参考值范围。 3.随机区组设计的方差分析的计算。 7 第16章 分类变量的统计分析 掌握:1.常用相对数(率、构成比、比)。 对数:两个有关联事物数据之比。 相构成比:又称构成指标,说明某一事物内部各组成部分所占的比重或分布,常以百分数表示。 率:又称频率指标,说明某现象发生的频率或强度。K为比例基数,常用百分率(%)、
17、千分率、万分率等表示。 相对比:相对比型指标是指任何两个相关联的变量A和B之比,说明A 为B的若干倍或百分之几。两个指标可以是性质相同,也可以是性质不同。A和B可以是绝对数、相对数和平均数。 2.应用相对数的注意事项。 (1)构成比与率是意义不同的两个统计指标,分析时不能以构成比代替率 。 (2)计算相对数时,分母不宜过小,即应有足够例数。 (3)对观察单位数不等的几个率,不能直接相加求其平均率。 (4)资料的对比应注意可比性 (5)对比不同时期资料时,应注意客观条件是否有变化。 (6)对样本率(或构成比)的比较应遵循随机抽样,要做假设检验。 3.率的标准化法的基本思想。 即采用统一的标准对内
18、部构成不同的各组频率进行调整和对比,可在比较总率时消除混杂因素的影响,使资料在统一标准下具有可比性。 24.完全随机设计和配对设计四格表资料的检验的公式、校正公式及其应用条件和计算。 ?完全随机设计四个表: 基本公式:(n不小于40,所有T不小于5) 校正公式:(n不小于40,所有T小于5但不小于1) 8 ?配对设计四格表: 基本公式:(b+c,40) 校正公式:(b+c不大于40) 熟悉:1.率和构成比的区别。 构成比表示事物内部的各组部分的比重和分布,是结构相对数。率反映某事物或现象发生的强度和频率,多是强度相对数。构成比有两个特点:各组分部分构成比的总和为百分之一百,某部分的比重增大,其
19、他部分的比重则相应减小。 2.率的抽样误差。 由于个体差异与偶然性的影响,这种样本频率与样本频率之间、样本频率与总体概率之间的差异称为频率的抽样误差。表示率的抽样误差指标叫率的标准误。 率的标准误(SE) 当总体概率未知时,可用样本率近似地代替,得到率标准误的估计值(通常也称为标准误) 频率的标准误与样本含量n的平方根成反比,若增加样本含量n可以减少样本频率的抽样误差。 3.总体率的置信区间估计。 ?正态近似法:np和n(1-p)均?5时,可根据近似正态分布的原理估计可信区间。 ?查表法:当样本例数n较小,如n?50,特别是P很接近0或1时,按二项分布原理确定总体率的可信区间,可直接查表。 4
20、.直接法计算标准化率。 直接法使用标准人口数、实际率来计算标化率 5.确切概率法的应用条件。 有T,1或n,40。 6.行列表卡方检验的计算和注意事项。 (1)不能有1/5以上的格子的理论数小于5,或不能有任意一个格子的理论数小于1。(若出现这种情况,则通过在可能的情况下增加样本量、将理论频数太小的行或列与性质相近的行或列合并、删9 除理论数太小的行或列等方式解决) (2)结果有统计学意义不代表任意两组间的差别都具有统计学意义,只能说明“不全相同”。要继续做行列表分割的卡方检验。 (3)若两个属性均是等级分类的,不宜用卡方检验来比较结果的优劣和趋势关系。 了解:1.间接法计算标准化率。 确定一
21、个标准组,给定标准组的各类别率和总率,然后算几个组的标准人数,各组实际人数除以标准人数再乘标准组的总率,即为标准化率。 2.率的u检验 样本率与总体率的比较: 两样本率的比较:第17章 非参数检验 掌握:1.非参数检验的适用范围。 (1)总体分布为偏态或分布形式未知 (2)等级资料 (3)个别数据偏大或数据的某一端无确定的数值 (4)各总体方差不齐 2.非参数检验的优缺点。 优点:不受总体分布的限定,适用范围广 不足之处:符合作参数检验的资料(如两样本均数比较的t检验),如用非参数检验,检验效率低于参数检验。一般犯第二类错误的概率比参数检验大 熟悉:1.配对设计符号秩和检验。 ?编秩: (1)
22、按差值的绝对值由小到大编秩 (将秩次按差值的正负分两栏) 10 (2)差值为0,则弃去不计,同时样本例数相应减1; (3)遇差值的绝对值相等,符号相反应取平均秩次,符号相同顺次排列。 ?求秩和并确定统计量T:分别求正负秩次之和,正秩和用T,表示,负秩和的绝对值用T,表示,取T,和 T,中较小者为统计量T ?确定P值做出推论 (1)查表法:当n?25时,查T界值表。 (2)n25,计算u值。 (3)推论为差值总体中位数是否为0. 2.完全随机设计两样本秩和检验-Wilcoxon两样本比较法 将两组原始数据分别由小到大排队,并统一编秩,遇相同数据,同组中顺次编秩,不同组中取其平均秩次。当n1?n2
23、时,取较小n的秩和为T 。当n1=n2时,任取一组的秩和为T。推论为两组总体分布是否相同。 3.完全随机设计多个样本秩和检验- H检验(Kruskal-Wallis法) 的编秩方法和分析结果的解释 编秩:将各组数据混合,由小到大排列并统一编秩,如遇相同数据在不同组取其平均秩次。 分析结果:几组数据总体分布相同;几组数据总体分布不同或不全相同。 了解:完全随机设计多个样本秩和检验的原理和计算 计算H值:若组数k=3,每组n?5,可查H界值表,得出P值;若最小样本例数大于5,则H近似服从=k-1的2分布。(查卡方表) 原理:通过秩和的差别检验样本所分别代表的总体分布位置是否相同。 第18章 直线相
24、关与回归分析 掌握:1.直线相关和回归分析。 直线相关:直线相关又称简单相关,用于双变量正态分布资料。 直线回归:研究一个变量(因变量)随一些变量(自变量)线性变化的统计学方法。 2.相关系数和回归系数的意义、计算及假设检验。 ?相关系数:又称积差相关系数,以符号r表示。它是说明具有直线关系的两个变量间相关密切程度和相关方向的统计指标。r,0:正相关,r,0:负相关,r,0:零相关。|r|,l:完全相关。 计算公式: 假设检验: 11 回归系数:直线斜率,X每增加和减少一个单位,Y平均改变b个单位。b,0表示Y随X呈同向直线变化,b,0表示Y随X呈反向直线变化,b=0表示Y与X无线性回归关系。
25、 计算公式: 方差分析,t=t 假设检验:brt检验 12 Sb为样本回归系数的标准误,Sy.x为剩余标准差 3.直线相关与直线回归的区别和联系。 ?区别: 1)相关的两个变量都需服从正态分布;回归中Y必须服从正态分布,X不一定 (2)相关表示相互关系(双向),回归表示数量依存关系(单向) ?联系: (1)同一样本r与b的正负号是一致的 (2)同一样本r与b的假设检验是等价的 (3)相关回归可互相解释 熟悉:直线相关回归分析的注意事项。 ?直线相关分析注意事项: (1)直线相关表示两个变量之间的关系是双向的,当散点图出现直线趋势时,再作分析。 (2)相关系数的计算只适用于两个变量都服从正态分布
26、的资料。 (3)样本相关系数是总体相关系数的一个估计值,与总体相关系数之间存在着抽样误差,必须作假设检验。 (4)相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系。 (5)出现异常值时慎用相关。 ?直线回归分析注意事项: (1)作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种观象间的内在联系有所认识。 (2)作回归分析时,一般以“因”的变量为X,以“果”的变量为Y。若变量之间无因果关系,则以容易测定、较稳定或变异较小者为X。 (3)应变量是随机变量、自变量也是随机变量时,两者均应服从正态分布;自变量为给定的量时,与每个X取值相对应的变
27、量Y必须服从正态分布。 (4)回归方程只有经过检验拒绝了无效假设后才有意义。 (5)回归方程的适用范围有其限度,一般仅适用于自变量X的原数据范围内,而不能任意外推。 13 了解:直线相关回归分析的原理和用途。 上面掌握第一条不是已经讲了吗 第19章 病例随访资料分析 掌握:1.常见的随访资料分析方法的种类和应用条件。 非参数法:不考虑资料的分布类型,而是根据样本顺序统计量对生存率作出估计,常用乘积极限法 参数法:假定生存时间服从于特定的参数分布,然后根据已知分布的特点对影响生存的时间进行分析。通过估计参数的方法得到生存率的估计值,对于两组及以上的样本,可根据参数样本进行统计推断。 半参数法:主
28、要用于分析影响生存时间和生存率的因素,属多因素分析方法。 2.寿命表估计生存率。 去年的生存率乘上今年的生存概率。 熟悉:1.生存分析的常用术语。 终点事件:指研究者所关心的特定结局,又称死亡事件、失效事件。 起点事件:反映研究对象生存过程的起始特征的事件。 生存时间:指从某起点事件开始到被观测对象出现终点事件所经历的时间,用t表示。 删失:又称截尾,随访研究中,某些研究对象在观察期内由于某种原因未能观察到明确结局,无法得知其确切生存时间。三种情况:失访,退出,终止。 死亡概率:表示某单位时间段开始时存活的个体到该时间段结束时死亡的可能性,记为q 生存概率:记为p,是指在某段时间开始时存活的个
29、体至该时间结束时仍存活的可能性大小。 生存函数:又称为累积生存率,简称生存率,用S(tk)表示,是指病人经历tk个单位时间后仍存活的概率。 2.生存率曲线(survival curve)的绘制。 以时间为横轴,生存率为纵轴,将各个时点的生存率连接在一起的曲线图。 3.生存率比较的方法。 14 log-rank检验(对数秩检验、时序检验)。该检验属非参数检验,用于比较两组或多组生存曲线或生存时间是否相同。 了解:1.乘积极限估计法估计生存率。 又称Kaplan-Meier法,将存活时间从小到大排列,如遇非截尾值和截尾数值相同时,则将截尾值排在后面。 2.中位生存时间的计算。 可采用内插法计算,找
30、到与50%的生存率上下相邻的两个生存率以及对应的生存时间,利用线性比例关系求出中位生存时间。 3. log-rank检验的计算。 把两组资料混合后统一排序,计算期望死亡数,求各组的期望死亡人数之和,再计算卡方值(自由度为组数-1)。 第21章 流行病学概述 掌握:1.流行病学的定义;人群和暴露的定义。 流行病学:研究人群中疾病与健康状况的分布及其影响因素,并研究如何防治疾病及促进健康的策略和措施的科学。 人群:流行病学以特定的人群为研究对象,这个人群可能包括某种疾病的病人和正常人,也可能包括具有不同特征的病人,而不仅仅是临床单一病人。 暴露:在流行病学研究中,常常把研究感兴趣的因素(研究因素)
31、称为暴露。 2.流行病学的研究范围和用途。(1) 描述疾病与健康状况的分布(2) 探讨疾病的流行因素和病因(3) 揭示疾病的自然史(4)用于临床诊断、治疗与估计预后(5)用于疾病的预防与控制(6)用于卫生决策和评价 熟悉:流行病学的研究方法。 (1)观察性研究:描述性研究、分析性研究(病例对照、队列) (2)实验性研究 (3)理论性研究 了解:流行病学的发展 ?学科成形前期:指从人类有文明史以来直至18世纪这段非常漫长的历史时期,在这一时期,人们逐渐认识到,疾病的发生不是由神或上帝来决定的,而与人类生存环境有关。 ?学科形成期:18世纪末至20世纪30、40年代,历时近200余年。随着工业化和
32、城市化的发展,以传染病为主的疾病大面积流行,在传染病防治研究的过程中促使流行病学学科的形成。 ?学科发展期:20世纪40年代至今,也称之为现代流行病学时期。在这一时期,由于威胁人类健康的主要公共卫生问题从传染病转向慢性非传染性疾病,流行病学的研究内容也相应扩大到慢性非传染性疾病。 第22章 疾病分布 掌握:1.描述疾病分布的常用指标:发病率、罹患率、患病率、死亡率和病死率。 发病率:表示一定时期(一般为年)内,特定人群中某病新病例出现的频率。 罹患率:和发病率一样,也是人群新病例数的指数,与发病率最主要的区别是观察时间短而灵活。 患病率:又称现患率,指特定时间内,一定人群中患某病新旧病例数所占
33、的比例。 15 死亡率:指某人群在一定期间死于所有原因的人数在该人群中所占的比例。死亡率可反映一个人群总的死亡水平,是一个国家和地区卫生、经济和文化水平的综合反映。 病死率:表示一定时期内,患某病的全部病人中因该病而死亡的频率。它可表明疾病的严重程度,反映医疗水平和诊断能力。 2.描述疾病流行水平的指标:散发、暴发、流行和大流行。 散发:某病在一定地区发病率呈现历年一般水平。 暴发:短时间,小范围人群中突然出现许多相同病例的现象。 流行:某病在一定地区发病率明显超过历年散发水平。 大流行:疾病迅速蔓延,涉及地域广,短期内可跨越省界、国界、甚至洲界。 3.疾病的时间分布常用术语。 暴发或短期波动
34、:在一集体或固定人群中,短时间,即该病最长潜伏期内,某病的病例数突然增多称为暴发。 季节性:疾病每年在一定季节内呈现发病率升高的现象称季节性。 周期性: 疾病每隔一定周期后发生一次较大的流行现象,称为周期性。大多为呼吸道传染病。 长期变异:长期变异是疾病经过一个相当长的时期后,通常是几年或几十年内,其临床表现和发病率、死亡率的变化。 熟悉:1.潜在减寿年数。 指某人群死亡人口中期望寿命与实际死亡年龄之差的总和,即死亡所造成的人群寿命损失的大小,是反映人群疾病负担的指标。 2.研究疾病年龄分布的分析方法。 (1)横断面分析:主要分析不同年龄组的发病率,患病率和死亡率,适用于分析潜伏期短和病程短的
35、急性病和传染病的年龄分布。 (2)出生队列分析:是以同一年代出生的人群组为一个出生队列,对不同队列在不同的年龄阶段某病的发病率或死亡率所进行的分析。该方法在评价疾病的年龄分布长期变化趋势及提供病因线索方面具有很大意义,有助于探明年龄、所处的时代特点及暴露经历三者在疾病的频率变化中的作用。 3.疾病的时间分布。 疾病的频率在时间上的不断变动称时间分布,凭此可以了解疾病的特点和种类。 了解:1.疾病人群分布和地区分布。 年龄(免疫力、活动、相处的人群)、性别、职业、种族、婚姻状况等,均可影响疾病的发生。 疾病在不同国家、一个国家内不同地区、城乡的分布都可能有差异。疾病有地方性。 2.移民流行病学
36、。 是通过观察某种疾病在移民人群、移居国(地)人群及原居国(地)人群的疾病发病率或死亡率差别,以探索遗传和环境因素在该病病因中的作用,这是疾病在时间、空间和人群分布的综合描述。 第23章 现况研究 掌握:1.现况研究的概念和特点。 现况研究:是指在特定时间内,对特定范围内的人群,以个人为单位收集和描述人群的有关变量与疾病或健康状况分布特征的方法。 特点:(1)一般不设对照组(2)研究的是某特定时点或时期(3)在确定因果联系时受限制(4)对16 不会发生改变的暴露因素,可作因果推论(5)现况研究定期重复进行可获得发病率资料 2.现况研究中样本含量的估计方法。 率的抽样: 均数的抽样: 熟悉:1.
37、描述性研究的种类。 病例报告和个案调查,生态学研究和现况研究。 2.现况研究的目的。 (1)掌握目标群体中疾病或健康状况的分布; (2)提供疾病致病因素的线索; (3)确定高危人群; (4)对疾病监测、预防接种效果及其他资料质量进行评价。 3.现况研究的种类。 普查,抽样调查。 4.现况研究的抽样方法。 (1)单纯随机抽样:抽签法、随机数字表法。 (2)系统抽样:按一定顺序每隔若干单位抽取一个单位。 (3)分层抽样:先按某种特征把调查对象分为若干“层”,在各层中作随机抽样。 (4)整群抽样:将总体分成若干群组,抽取其中部分群组作为观察单位组成样本。若被抽到的群组中的全部个体均作为调查对象,称为
38、单纯整体抽样,若再在样本群内进行单纯随机抽样,称为二阶段抽样。 (5)多级抽样:在大型流行病学调查中,常把抽样过程分为不同阶段,每个阶段使用的抽样方法往往不同,上述四种结合使用。先从总体中抽取范围较大的单元,陈未一级抽样单位(如省、自治区、直辖市),再从每个抽得的一级单元中抽取范围较小的二级单元(县、乡、镇、街道),依次类推,17 最后抽取其中范围更小的单元(如村、居委会)作为调查单位。 5.抽样调查设计原则。 随机化、样本量适当。 6.现况研究的实施步骤。 (1)明确调查目的和类型(2)确定研究对象(3)确定样本含量和抽样方法(4)资料的收集(5)调查表与调查员 (6)资料的整理与分析(7)
39、现况调查中的偏倚及防止 7.常见偏倚及其控制。 ?选择偏倚:无应答偏倚、志愿者偏倚、存活者偏倚 控制:严格随机化的原则,广泛宣传,动员。 ?信息偏倚:回忆偏倚、报告偏倚、观察者偏倚、测量偏倚 控制:设计合理的调查表,培训调查员,对敏感问题采用随机应答技术获取资料,选用标准一致稳定的仪器和试剂,采用标准的操作程序。 ?混杂偏倚 了解:1.描述性研究的概念和主要用途。 描述性研究是描述疾病和健康状况在时间、地区和人群方面的分布特征,向公共卫生管理人员和流行病学研究者提供最基础的疾病数据,以找出某些因素与疾病或健康状况间的关系,提供病因线索。是流行病学研究的最基本步骤,也是流行病学研究工作的起点。
40、2.调查表与调查员。 设计合理的调查表,培训调查员以统一标准和认知。 3.现况研究的资料分析。 收集、整理、分析、结论。原始资料的检查与核对(确保完整性和准确性)、原始数据的整理和归类(按照一定的标准转化成计数资料)、计算各种指标、暴露于疾病关系的分析。 第24章 病例对照研究 掌握:1.病例对照研究的概念、特点和研究用途。 病例对照研究选择有特定疾病的人群组与无病的对照组,比较两组人群过去暴露于某因素的比例,分析暴露是否与疾病有关 特点:(1)属于观察性研究方法(2)设立对照(3)观察方向由“果”及“因”(4)证实病因因果关联的力度较弱 用途:病因不明的疾病和发病率较低甚至是罕见疾病的研究。
41、 2.病例对照研究的分类。 ?按匹配分类:群体匹配(成组匹配,频数匹配),个体匹配。 ?按研究目的分类:检验性病例对照研究,探索性病例对照研究。 3.病例对照研究对象的选择。 病例的选择、对照的选择,基本原则是病例样本能代表总体中该病的病例,对照能代表产生病例的人群。 4.成组病例对照研究资料分析。 (1)先卡方检验再求比值比(即病例组的暴露比值与对照组的暴露比值之比。OR估计暴露因素与疾病的关联强度。比值指某事物发生的概率与不发生的概率之比。) 18 (2) 计算比值比的可信区间 (3) 特异危险度百分比 AR, (4)人群特异危险度百分比 PAR, 5. 1:1配比病例对照研究资料分析。
42、(1)卡方检验。 (2) 计算OR。 (3) 计算OR的可信区间。 6.病例对照的优缺点。 ?优点:(1)所需样本小,适用于罕见疾病;(2)省时、省人力、省物力,费用低;(3)可较快得出结果;(4)一次可调查多个因素,既可检验明确危险因素的假设,又可探索尚不明确的众多因素,后者尤适用。 ?缺点:(1)可能发生回忆偏倚;(2)病例常不能代表全部病例,对照也常不能代表所属的人群,容易产生选择偏倚(3)混杂偏倚较难控制(4)由于不知道总人口的病例数和未病者人数,一般不能计算发病率或死亡率,故不能直接分析RR(5)不能作因果联系的结论。 19 了解:1.病例对照研究的设计和实施。 明确研究目的、选择研
43、究对象、估计样本含量、研究因素的选择和资料收集。 2.病例对照研究中的偏倚和控制。 ?选择偏倚:入院率偏倚、患病率与发病率偏倚、检出征候偏倚、无应答偏倚、易感性偏倚 控制方法:(1)正确的设计:随机抽样,尽量选择不同病情、不同特征的患者作为病例组(2)采用多种对照(3)掌握入选和排除标准(4)提高应答率 ?信息偏倚:回忆偏倚、报告偏倚、错误分类偏倚、暴露怀疑偏倚 控制方法:(1)采用 “盲法”收集资料(2)收集客观指标(3)广泛收集各种资料(4)保证研究人员的特学态度(5)资料校正方法 ?混杂偏倚:由于一个或多个潜在的混杂因素的影响,掩盖或夸大了研究因素与疾病之间的联系,使两者的真正联系被错误
44、的估计。 控制方法:限制、配比、随机、分层分析方法、标准化、多因素分析 第25章 队列研究 掌握:1.队列研究的概念、特点和基本原理。 概念和基本原理:将特定的人群中按其是否暴露于某因素或按不同暴露水平分成几个队列,追踪观察一定时间,比较两组或多组间的发病率或死亡率,以检验该暴露因素与某病联系的假设。 特点:(1)属于观察性研究方法(2)设立对照(3)观察方向由“果”至因(4)能确切证实暴露与疾病的因果关系 2.队列研究的类型和用途。 类型:前瞻性队列研究、历史性队列研究(根据研究开始时已掌握的历史暴露状况将研究对象分成暴露组和非暴露组,在研究开始时,就可以从历史资料中获得研究对象的结局资料,
45、因此不需要前瞻性观察,仍是从因到果的,省时省力出结果快)、双向性队列研究(在历史性队列研究之后,继续前瞻性观察一段时间,根据研究对象过去某时刻的暴露情况分组,部分结局可能已出现) 用途:检验病因假设、疾病自然史研究、评价自发行为的预防效果、新药的上市后监测。 3.人时的概念。 是将观察人数和观察时间结合作为分母的单位。观察人时数=观察人数x观察时间。 4.队列研究资料的分析。 ?率的计算及其显著性检验 2)发病密度:观察期间发病人数/观察人时数*K 显著性检验应用u检验或四格表卡方检验。 ?联系强度测量 (1)相对危险度:也叫危险比或率比。是暴露组发病(死亡)率与非暴露组发病(死亡)率的比值,
46、简称RR。 RR1说明暴露因素与疾病为正联系,暴露可能是危险因素;RR1说明暴露因素与疾病为负联系,暴20 露可能具有保护意义。 (2)归因危险度:简称AR,也称归因危险度,或称率差(rate difference, RD),是暴露组与非暴露组发病率的差值。AR表示完全由暴露因素所致的危险度。 RR说明个体在暴露情况下比非暴露情况下增加暴露因素所致疾病的危险程度的倍数,说明暴露与疾病的联系强度,具有病因学意义。 AR则是对于人群来说,如果消除暴露因素,可减少疾病发病数量,具有公共卫生学意义。 (3)归因危险度百分比ARP:又称病因分值,指暴露人群中归于暴露的发病或死亡占全部病因的百分比。 (4) 人群特异危险度百分比PARP (5)标准化死亡率比:以实际死亡人数与预期死亡人数之比,作为衡量发病的强度。 5.队列研究的优点及缺点。 优点:(1)适用于常见病(2)能计算发病率及RR、AR,能直接估计暴露与疾病的联系强度,结果真实可靠(3)由“因”至“果”观察,看到暴露与疾病的时间先后(4)信息偏倚较小(5)因素可分等级,便于计算剂量-反应关系(6)一次调查可观察多种结局,能了解疾病的自然史 缺点:(1)研究罕见病,需大量样本;不易收集完整可靠的资料(2)观察时间长,费用高(3)暴露人年计算工作量繁重(4)每次只能调查一个因素