《最新妇幼卫生信息的收集及过程ppt课件.ppt》由会员分享,可在线阅读,更多相关《最新妇幼卫生信息的收集及过程ppt课件.ppt(98页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、妇幼卫生信息的收集及管理妇幼卫生信息的收集及管理过程过程v信息收集是指通过各种方式获取所需要的信息。信息收集是指通过各种方式获取所需要的信息。v信息收集是信息得以利用的第一步,也是关键的一步。信息收集是信息得以利用的第一步,也是关键的一步。信息收集工作的好坏,直接关系到整个信息管理工作信息收集工作的好坏,直接关系到整个信息管理工作的质量。为了保证信息收集的质量,应坚持以下原则的质量。为了保证信息收集的质量,应坚持以下原则 v(1)准确性原则)准确性原则v(2)全面性原则)全面性原则v(3)时效性原则)时效性原则22普查的优缺点普查的优缺点 v优点:可以早期发现病人及时治疗,提供疾病分布的优点:
2、可以早期发现病人及时治疗,提供疾病分布的大致轮廓,亦可看到人口学、社会因素等变量分布的大致轮廓,亦可看到人口学、社会因素等变量分布的概况,为流行因素的分析提供线索。概况,为流行因素的分析提供线索。v缺点:花费大量的人力、物力,费用较高,资料较粗,缺点:花费大量的人力、物力,费用较高,资料较粗,存在非抽样误差,不适用于发病率低的疾病。一般不存在非抽样误差,不适用于发病率低的疾病。一般不能获得发病率。能获得发病率。93筛选筛选(screening)v是通过可以迅速使用的试验、检查或其他方法,从表是通过可以迅速使用的试验、检查或其他方法,从表面上无病的人群中查出某病的可疑患者。面上无病的人群中查出某
3、病的可疑患者。v作用:作用:早期发现病人,以利于及时治疗,延缓病情,早期发现病人,以利于及时治疗,延缓病情,如用于高危人群的筛选,如用于高危人群的筛选,10(1)筛选试验评价的方法)筛选试验评价的方法 v询问方法询问方法 v临床检查临床检查v实验室检查实验室检查v皮肤试验和抗体测定皮肤试验和抗体测定 11表表6-1 试验或检查的测试结果试验或检查的测试结果 12(2)评价指标)评价指标:v灵敏度灵敏度(真阳性率真阳性率)(Sensitivity)v特异度(真阴性率)特异度(真阴性率)(Specificity)v阳性预测值阳性预测值(Predictive Value Positive,PV+)v
4、阴性预测值阴性预测值(Predictive Value Negative,PV-)v假阳性率假阳性率 v假阴性率假阴性率 v诊断指数诊断指数 v诊断效率诊断效率 13SensitivityDefinition:Sensitivity is defined as the probability of testing positive if the disease is truly present.Formula:14SpecificityDefinition:Specificity is defined as the probability of testing negative if the
5、disease is truly absent.Formula:15Predictive Value PositiveDefinition:Predictive Value Positive(PV+)is defined as the probability that a person actually has the disease given that he or she tests positive.Formula:16Predictive Value NegativeDefinition:Predictive Value Negative(PV-)is defined as the p
6、robability that a person actually disease-free given that he or she tests negative.Formula:17Example:Cervical Cancer Screening The standard of care for cervical cancer/dysplasia detection is the Pap smear.We want to assess a new serum DNA detection test for the Humanpapilloma Virus.18Sensitivity=50/
7、55=0.909Specificity=410/445=0.921PV+=50/85=0.588PV-=410/415=0.988Pap+Pap-TotalDNA+50 35 85DNA-5 410 415Total 55 445 500阳性预测值的上升伴随着阴阳性预测值的上升伴随着阴性预测值的下降。试验的灵性预测值的下降。试验的灵敏度愈高,阴性预测值随之敏度愈高,阴性预测值随之上升,反之,特异度愈高,上升,反之,特异度愈高,阳性预测值愈高。阳性预测值愈高。19(二)抽样调查(二)抽样调查(sampling survey)v简单随机抽样(简单随机抽样(Simple random samplin
8、g)v系统抽样系统抽样(Systematic sampling)v分层抽样(分层抽样(Stratified sampling)v整群抽样(整群抽样(Cluster sampling)v多阶段抽样多阶段抽样(multistage random sampling)20(三三)家庭健康询问调查家庭健康询问调查(household health interview)v1956年美国国会通过了卫生调查法,年美国国会通过了卫生调查法,1957年起在全年起在全国范围内进行家庭询问调查。该调查方法是由美国国国范围内进行家庭询问调查。该调查方法是由美国国家卫生统计中心最早在全国范围内进行的一项连续性家卫生统计中
9、心最早在全国范围内进行的一项连续性抽样调查。抽样调查。v设计采用多阶段分层随机抽样法,调查结果可以对全设计采用多阶段分层随机抽样法,调查结果可以对全国情况作出估计,基本调查内容由两部分组成,即人国情况作出估计,基本调查内容由两部分组成,即人口和卫生状况以及居民健康状况。口和卫生状况以及居民健康状况。21分类分类v一次性横断面调查一次性横断面调查n疾病频率、严重程度及卫生服务利用资料疾病频率、严重程度及卫生服务利用资料v重复横断面调查重复横断面调查(repeated cross-sectional survey)n不同时间的患病率及卫生服务资料不同时间的患病率及卫生服务资料v连续性长期调查连续性
10、长期调查(continuing longitudinal survey)n全年患病率及卫生服务利用的动态资料,也可以积全年患病率及卫生服务利用的动态资料,也可以积累不同年份健康咨询资料,供历史动态研究之用。累不同年份健康咨询资料,供历史动态研究之用。22v我国我国20世纪世纪80年代初引起一次性横断面调查方法,年代初引起一次性横断面调查方法,v1992和和1997年开展了年开展了2次全国性卫生服务调查,研究次全国性卫生服务调查,研究方法属重复横断面调查方法属重复横断面调查v1996年在全国年在全国7个城市中进行行为危险因素连续性监个城市中进行行为危险因素连续性监测,研究方法属连续性横断面调查。
11、测,研究方法属连续性横断面调查。231.健康询问与健康调查健康询问与健康调查v测量人群患病率存在许多技术问题。测量人群患病率存在许多技术问题。v群众自我报告的患病率与由医务人员判断的患病率不群众自我报告的患病率与由医务人员判断的患病率不同同v从卫生服务观点及卫生计划角度,通过健康询问调查从卫生服务观点及卫生计划角度,通过健康询问调查掌握急慢性疾病患病率资料,能从不同角度提供有实掌握急慢性疾病患病率资料,能从不同角度提供有实际意义的资料。际意义的资料。242.抽样设计抽样设计v以家庭以单位,以个人为调查对象。以家庭以单位,以个人为调查对象。v也有以某地区内妇女、老人、儿童等特殊对象进行专也有以某
12、地区内妇女、老人、儿童等特殊对象进行专题调查的。题调查的。v设计方法及抽样原则取决于调查目的,要兼顾科学性设计方法及抽样原则取决于调查目的,要兼顾科学性和可行性。和可行性。253.3.调查内容调查内容v家庭人员的人口特征,如年龄、性别、职业、文化家庭人员的人口特征,如年龄、性别、职业、文化和经济收入等;和经济收入等;v两周内患病次数,因病伤丧失劳动能力次数、天数、两周内患病次数,因病伤丧失劳动能力次数、天数、正常活动受到限制、卧床、休工、休学次数及天数;正常活动受到限制、卧床、休工、休学次数及天数;v两周内就诊次数,包括牙科就诊;两周内就诊次数,包括牙科就诊;v慢性病正常活动受限制和长期丧失劳
13、动能力人数;慢性病正常活动受限制和长期丧失劳动能力人数;v一年中住院人数、次数、住院天数、住院机构种类一年中住院人数、次数、住院天数、住院机构种类及手术名称等;及手术名称等;v门诊及住院医疗费用。门诊及住院医疗费用。264.选择调查员选择调查员v要求与当地被调查对象有相似的社会背景及熟悉当地要求与当地被调查对象有相似的社会背景及熟悉当地的风俗习惯和语言等。的风俗习惯和语言等。v国外多选择用非专业人员,我国都选用专业调查人员。国外多选择用非专业人员,我国都选用专业调查人员。27(四)对横断面调查结果的正确认识(四)对横断面调查结果的正确认识 v因为观察的疾病和变量(或行为特征)是同时存在的,因为
14、观察的疾病和变量(或行为特征)是同时存在的,难以从时间顺序作因果联系的分析。难以从时间顺序作因果联系的分析。v如吸烟与慢性支气管炎的关系如吸烟与慢性支气管炎的关系 28二、典型调查二、典型调查(case survey)v典型调查亦称案例或个案调查典型调查亦称案例或个案调查,即在对事物作全面分即在对事物作全面分析的基础上,有目的地选定典型的人、典型的单位进析的基础上,有目的地选定典型的人、典型的单位进行调查。行调查。v典型调查的关键是选好点。典型调查的关键是选好点。v可与现况研究中的普查结合,分别从广度和深度说明可与现况研究中的普查结合,分别从广度和深度说明问题;问题;v由于没有遵循由于没有遵循
15、随机抽样随机抽样的原则,不能用于估计总体参的原则,不能用于估计总体参数,但可对总体特征作经验推论。数,但可对总体特征作经验推论。29第三节第三节 调查设计调查设计(survey design)v调查设计包括资料收集、整理和分析全过程的设计,调查设计包括资料收集、整理和分析全过程的设计,本节主要是讨论资料收集的调查设计或调查计划。本节主要是讨论资料收集的调查设计或调查计划。l调查设计是调查研究工作的先导和依据,是调查结果调查设计是调查研究工作的先导和依据,是调查结果准确可靠的保证。准确可靠的保证。30调查计划的内容调查计划的内容 v一、明确调查目的和指标一、明确调查目的和指标(objective
16、 and marker)v二、确定调查对象和观察单位二、确定调查对象和观察单位(object and unit)v三、调查方法三、调查方法(methods)v四、收集原始资料的方式四、收集原始资料的方式(ways)v五、确定调查项目和调查表五、确定调查项目和调查表(entry and questionnaire)v六、编码调查表六、编码调查表(coding)v七、制订调查的组织计划七、制订调查的组织计划(arrangement planning)31一、明确调查目的和指标一、明确调查目的和指标 n调查目的是选定调查指标的依据,而调查指标又是调查目的是选定调查指标的依据,而调查指标又是调查目的的
17、具体体现调查目的的具体体现 n在疾病调查中,应尽量选用灵敏度高,特异度高的在疾病调查中,应尽量选用灵敏度高,特异度高的检查方法作为诊断依据,提高指标的可靠性。检查方法作为诊断依据,提高指标的可靠性。n指标要精选,要重点突出,不要贪多求全,分散精指标要精选,要重点突出,不要贪多求全,分散精力力 32二、确定调查对象和观察单位二、确定调查对象和观察单位 v要根据调查目的和指标,确定调查对象,既划清调查要根据调查目的和指标,确定调查对象,既划清调查总体的同质范围,特别是作参数估计时更为重要。组总体的同质范围,特别是作参数估计时更为重要。组成总体或样本的观察单位可以是一个人、一个病例、成总体或样本的观
18、察单位可以是一个人、一个病例、一个集体单位,也可以是一个集体单位,也可以是“人次人次”或采样点等。或采样点等。33(一)利用现存资料(一)利用现存资料(一)利用现存资料(一)利用现存资料 using available informationusing available informationv 统计报表统计报表(statistic statement)v 经常性工作记录经常性工作记录(usual documents)v 以前做过的调查以前做过的调查(survey)(二)调查(二)调查(二)调查(二)调查 surveysurveyv面对面访谈面对面访谈 personal interviewv
19、信访信访 mail surveyv 电话访问电话访问 telephone surveyv计算机辅助调查计算机辅助调查 computer-assisted interview(三三三三)直直直直 接接接接 观观观观 察察察察 与与与与 测测测测 量量量量(direct direct observation observation and and measurement)measurement)四、收集资料的方式四、收集资料的方式34五、确定调查项目和调查表五、确定调查项目和调查表 v调查项目包括分析项目和备查项目调查项目包括分析项目和备查项目 v分析项目是直接用于整理计算调查指标所必需的内容。分
20、析项目是直接用于整理计算调查指标所必需的内容。v备查项目是为了保证分析项目填写的完整、正确、便备查项目是为了保证分析项目填写的完整、正确、便于核查、补填和修改而设置的,通常不直接用于分析。于核查、补填和修改而设置的,通常不直接用于分析。v答案选择有两种答案选择有两种:列出固定选择答案列出固定选择答案 自由选择答自由选择答案案35确定调查项目和拟定调查表确定调查项目和拟定调查表确定调查项目和拟定调查表确定调查项目和拟定调查表研究目的分析指标调查项目调查问卷36拟定调查表举例拟定调查表举例拟定调查表举例拟定调查表举例v研究目的:研究目的:n武汉市学龄前儿童视力障碍发生状况武汉市学龄前儿童视力障碍发
21、生状况v分析指标:分析指标:n学龄前儿童视力障碍发生率学龄前儿童视力障碍发生率n分性别视力障碍发生率分性别视力障碍发生率n各种视力障碍类型构成比各种视力障碍类型构成比37拟定调查表举例拟定调查表举例拟定调查表举例拟定调查表举例v调查项目调查项目n儿童视力障碍类型儿童视力障碍类型n儿童性别儿童性别38武汉市学前儿童视力状况调查表武汉市学前儿童视力状况调查表1.1.儿童编号:儿童编号:2.2.幼儿园名称:幼儿园名称:3.3.儿童姓名:儿童姓名:4.4.儿童性别:(儿童性别:(1)男)男 (2)女)女 5.5.儿童出生日期:儿童出生日期:年年 月月 日日6.6.儿童年龄:儿童年龄:岁岁 7.7.家长
22、姓名:家长姓名:联系电话:联系电话:8.8.您的小孩视力是否正常?(您的小孩视力是否正常?(1)正常)正常(2)不正常)不正常9.9.如果您的小孩视力有问题,是属于那种情况:如果您的小孩视力有问题,是属于那种情况:(1)弱视:)弱视:a.左眼左眼 b.右眼右眼 c.双眼双眼(2)斜视:)斜视:a.左眼左眼 b.右眼右眼 c.双眼双眼 (3)散光:)散光:a.左眼左眼 b.右眼右眼 c.双眼双眼 10.10.调查者:调查者:11.11.调查日期:调查日期:年年 月月 日日39制定调查表时应注意的问题制定调查表时应注意的问题制定调查表时应注意的问题制定调查表时应注意的问题v调查项目要包括分析项目和
23、备择项目调查项目要包括分析项目和备择项目 v表中每一问题有一明确目的表中每一问题有一明确目的v项目的多少以精简为原则。项目的多少以精简为原则。v语言简洁、准确、通俗易懂。语言简洁、准确、通俗易懂。v问题流畅,尽可能清晰和明确问题流畅,尽可能清晰和明确v避免问题有诱导性或引起偏倚避免问题有诱导性或引起偏倚v尊重应答者的尊严和隐私尊重应答者的尊严和隐私 v封闭式问题为主,开放式问题为辅。封闭式问题为主,开放式问题为辅。v问题的安排顺序要合乎逻辑。问题的安排顺序要合乎逻辑。v要考虑到计算机分析资料的方便性。要考虑到计算机分析资料的方便性。40第四节第四节 常用的抽样方法常用的抽样方法(methods
24、 for sampling)v单纯随机抽样单纯随机抽样 simple random sampling v系统随机抽样系统随机抽样 systematic random sampling v整群随机抽样整群随机抽样 clustered random sampling v分层随机抽样分层随机抽样 stratified random sampling v多阶段随机抽样多阶段随机抽样 multistage random sampling 41一、单纯随机抽样(一、单纯随机抽样(simple random sampling)v即先将调查总体的全部观察单位编号,再用随机数字即先将调查总体的全部观察单位编号,
25、再用随机数字表或抽签等方法随机抽取部分观察单位作样本表或抽签等方法随机抽取部分观察单位作样本 v单纯随机抽样是最基本的抽样方法。也是其他抽样方单纯随机抽样是最基本的抽样方法。也是其他抽样方法的基础。优点是计算误差方便,缺点是当总体含量法的基础。优点是计算误差方便,缺点是当总体含量较大时,要对观察单位一一编号,甚为繁复,往往难较大时,要对观察单位一一编号,甚为繁复,往往难以做到以做到 42单纯随机抽样举例单纯随机抽样举例病人病人ABCDEFGHIJ出生出生年月年月65.460.367.666.165.169.463.261.660.866.2现有现有10例某种罕见疾病的病人,欲随机从例某种罕见疾
26、病的病人,欲随机从中抽出中抽出4例进行研究。例进行研究。43单纯随机抽样举例单纯随机抽样举例病人病人BIHGEADJCF出生出生年月年月60.360.861.661.265.165.466.166.267.669.4 第一步 标识抽样单元 44单纯随机抽样举例单纯随机抽样举例病人病人BIHGEADJCF出生出生年月年月60.360.861.661.265.165.466.166.267.669.4随机随机数字数字18462334278513992444 第二步 匹配随机数字并抽取样本 45二、机械抽样或系统抽样二、机械抽样或系统抽样 (systematic sampling)v按按照照一一定定
27、顺顺序序,机机械械地地每每隔隔若若干干单单位位抽抽取取一一单单位位的的方方法法叫叫机机械械抽抽样样。它它在在以以下下情情况况时时适适合合采采用用:(1)按按抽抽样样顺顺序序,观观察察单单位位的的分分布布基基本本上上是是随随机机的的;(2)再再分分层抽样时,每层独立采用机械抽样。层抽样时,每层独立采用机械抽样。v该该方方法法的的优优点点是是简简便便易易行行,容容易易得得到到一一个个按按比比例例分分配配的的样样本本,一一般般情情况况下下,其其抽抽样样误误差差小小于于单单纯纯随随机机抽抽样样。缺缺点点是是当当总总体体的的观观察察单单位位按按顺顺序序有有周周期期趋趋势势,则则易易产产生明显偏性,尚无可
28、靠的方法估计其抽样误差。生明显偏性,尚无可靠的方法估计其抽样误差。46系统随机抽样系统随机抽样v排序编号排序编号v确定抽样比例和抽样间隔确定抽样比例和抽样间隔nP=n/NnI=1/Pv随机确定第一个抽取对象随机确定第一个抽取对象 v系统性的抽取全部对象系统性的抽取全部对象 47系统随机抽样举例系统随机抽样举例v欲从欲从15000 名儿童中抽取名儿童中抽取750名组成样本。名组成样本。(1)按某特征将)按某特征将15000 名儿童编号;名儿童编号;(2)确定抽样比例和抽样间隔:)确定抽样比例和抽样间隔:抽样比例:抽样比例:75015000=1/20 抽样间隔:抽样间隔:11/20=20(3)随机
29、抽取第一个观察对象;)随机抽取第一个观察对象;(4)按抽样间隔抽取第)按抽样间隔抽取第2个、第个、第3个、个、第第 n个观察对象。个观察对象。48四、整群抽样四、整群抽样(cluster sampling)v直直接接由由n个个群群组组的的总总体体中中随随机机抽抽取取n个个“群群”,再再对对被被抽抽取取的的每每个个群群的的全全部部观观察察单单位位加加以以调调查查,这这里里的的群群称称为为初初级级抽抽样样单单位位。实实际际工工作作中中常常以以地地区区分分群群,称称为为地地区抽样。区抽样。v在在大大规规模模调调查查中中,整整群群抽抽样样易易于于组组织织,可可节节省省人人力力物物力,但一般来说各群间差
30、异较大,所以抽样误差较大。力,但一般来说各群间差异较大,所以抽样误差较大。49系统整群抽样的步骤系统整群抽样的步骤v确定总体内的个体数确定总体内的个体数N及所需样本含量及所需样本含量n。v估计抽样比例估计抽样比例p=n/N。v估计每一抽样群内的个体数估计每一抽样群内的个体数ni,实际上实际上n1=n2=n3=v总体内划分的群数就是总体内划分的群数就是K=N/ni,所需抽样的群数是所需抽样的群数是k,即研究者即研究者需要从需要从K群中随机抽取群中随机抽取k群,群,n=kni=ni,k/Kn/N。v确定系统整群抽样的间隔和起点。抽样间隔确定系统整群抽样的间隔和起点。抽样间隔B=N/k。在在1,2B
31、中随机抽取一个数字作为抽样的起点。因此,抽中的随机数字是中随机抽取一个数字作为抽样的起点。因此,抽中的随机数字是b,b+B,b+2B.v这些随机数字所代表的个体所在的组就是抽中的群(自然群),这些随机数字所代表的个体所在的组就是抽中的群(自然群),一共应为一共应为k群,在这群,在这k个自然群的每一群中用随机方法抽取个自然群的每一群中用随机方法抽取ni个个个个体,如果该自然群内的个体数小于体,如果该自然群内的个体数小于ni,也可在下一群中随机抽取也可在下一群中随机抽取补足。补足。50v外来人口中外来人口中15-49岁育龄妇女总数为岁育龄妇女总数为2943人,按计划要抽查人,按计划要抽查275人,
32、人,m=275,N=2943,抽样比例为抽样比例为P=2752943=0.0934,v按通常习惯,把每按通常习惯,把每50人作为一群,人作为一群,2943/50=59群,现需从群,现需从59群中抽取群中抽取6群(群(300人),人),K=59,k=6v潍坊街道的外来人口中潍坊街道的外来人口中15-59岁育龄妇女分布如表所示岁育龄妇女分布如表所示v确定抽中号码确定抽中号码.因为因为2943/6=490,B=490,先从先从1-490中随机抽中随机抽取一个号码取一个号码.事先规定数字为事先规定数字为1-980为有效为有效,抽得数字为抽得数字为858,所以所以858-490=368就是抽中的号码就是
33、抽中的号码,b=368v最后决定在下列最后决定在下列6个居委会中扣抽查个居委会中扣抽查50群群整群随机抽样举例整群随机抽样举例51居委居委人数人数累计编号累计编号抽中的群抽中的群潍坊潍坊1村村2525潍坊潍坊2村村92117潍坊潍坊3村村37154潍坊潍坊4村村67221潍坊潍坊5村村17258潍坊潍坊6村村23275潍坊潍坊7村村58298潍坊潍坊8村村112356潍坊潍坊9村村36468潍坊潍坊10村村1居居60504潍坊潍坊10村村2居居5956452居委居委人数人数累计编号累计编号抽中的群抽中的群朱家滩朱家滩601000王家宅王家宅591065扬东扬东3771135崂山东路崂山东路65
34、1177竹园竹园701304竹南竹南421372源竹源竹1271404福竹福竹681440张扬张扬321498张家浜张家浜361594谢家宅谢家宅581653陆家宅陆家宅96182953居委居委人数人数累计编号累计编号抽中的群抽中的群东方里东方里1761829老白渡老白渡2882117大庆街大庆街1342251庆余里庆余里842335杨家渡杨家渡1372472明德里明德里2232695东南新村东南新村572752北塘北塘1912943合计合计294354三、分层抽样三、分层抽样(stratified sampling)v先先按按某某种种特特征征把把调调查查对对象象分分为为若若干干类类型型,部部
35、分分或或区区域域(统统计计上上叫叫“层层”),然然后后在在各各层层中中作作随随机机抽抽样样,实实际工作中常在下列情况下采用分层抽样:际工作中常在下列情况下采用分层抽样:v(1)提提高高效效率率,层层间间均均数数相相差差越越大大,各各层层内内部部变变异异越越小,则效率越高。小,则效率越高。v(2)便于对不同层独立进行分析。)便于对不同层独立进行分析。55分层随机抽样分层随机抽样 是为了克服总体中个体变异过大,提高样本代表是为了克服总体中个体变异过大,提高样本代表性的一种有控制的抽样方法。分层抽样首先根据研究性的一种有控制的抽样方法。分层抽样首先根据研究对象所具有的,对研究结果有明显影响的,而且本
36、身对象所具有的,对研究结果有明显影响的,而且本身的个体差异又很大的特性,把这些研究对象分为个体的个体差异又很大的特性,把这些研究对象分为个体差异相对较小的亚层,然后再在每一亚层中进行随机差异相对较小的亚层,然后再在每一亚层中进行随机抽样,最后,把各层所抽的样本合并起来得到一个完抽样,最后,把各层所抽的样本合并起来得到一个完整的随机样本。整的随机样本。56分层随机抽样步骤分层随机抽样步骤v分层分层 v确定每层内样本例数确定每层内样本例数 ni=nNi/N=nPinNi 为第为第 i 层抽样单元总数,层抽样单元总数,nN 为抽样单元总数,为抽样单元总数,nn 为最终样本大小,为最终样本大小,nni
37、 各层内样本例数。各层内样本例数。v层内抽样层内抽样 57分层抽样举例分层抽样举例v抽样调查估计某市新生儿出生体重抽样调查估计某市新生儿出生体重,把婴儿分成把婴儿分成4层层,即根据产妇即根据产妇是本地户籍和非本地户籍是本地户籍和非本地户籍,再分成男婴和女婴再分成男婴和女婴.v第第I层抽取的样本层含量层抽取的样本层含量ni有有3种决定方法种决定方法v任意的任意的niv按比例分层随机抽样按比例分层随机抽样(proportional stratified sampling),即第即第I层的样本含量层的样本含量ni是与该层总体中个体数是与该层总体中个体数Ni成比例的成比例的,ni/Ni是常数是常数v最
38、优分配分层随机抽样最优分配分层随机抽样(optium allocation in stratified sampling)即各层样本含量的分配能使抽样误差最小即各层样本含量的分配能使抽样误差最小(条件条件:总样总样本含量与总的经费本含量与总的经费)58五、多阶段抽样五、多阶段抽样(multiple stage sampling)v客客观观实实际际中中往往往往存存在在可可供供多多阶阶段段抽抽样样使使用用的的自自然然分分段段,例例如如城城市市的的市市区区街街道道办办事事处处居居委委会会居居民民小小组组;农农村村的的县县乡乡镇镇村村村村民民小小组;工厂的厂组;工厂的厂车间车间班组等。班组等。v当当样
39、样本本含含量量确确定定后后,多多阶阶段段抽抽样样的的观观察察单单位位在在总总体体中较为分散,可比取较大的整群提高精密度。中较为分散,可比取较大的整群提高精密度。59多阶段随机抽样举例多阶段随机抽样举例 中国中国1993年全国卫生服务需求总调查的根年全国卫生服务需求总调查的根本目的,在于把握和了解我国计划经济向市场经济转本目的,在于把握和了解我国计划经济向市场经济转轨的过程中,城乡人民的医疗卫生服务需求及其影响轨的过程中,城乡人民的医疗卫生服务需求及其影响因素。采用了四阶段随机抽样技术。因素。采用了四阶段随机抽样技术。60多阶段随机抽样举例多阶段随机抽样举例vv首首首首先先先先,把把全全国国24
40、00多多个个县县级级行行政政单单位位划划分分为为大大、中中、小小城城市市和和一一、二二、三三、四四类类农农村村等等7层层。再再在在每每层层中中按按比比例例,随随机机抽抽取取一一定定的县、市的县、市/区作为第一阶段的抽样。即分层整群随机抽样。区作为第一阶段的抽样。即分层整群随机抽样。vv第第第第二二二二,以以本本县县/区区的的的的乡乡级级行行政政单单位位为为抽抽样样单单元元,按按人人口口数数进进行行排序,按一定比例系统抽样,取得一定量的乡排序,按一定比例系统抽样,取得一定量的乡/街道。街道。vv第三第三第三第三,每个乡的村级行政单位按人口多少排序,系统抽样。,每个乡的村级行政单位按人口多少排序,
41、系统抽样。vv第四第四第四第四,到村一级行政单位,以户为抽样单位,随机抽取一定比例,到村一级行政单位,以户为抽样单位,随机抽取一定比例的户作为研究样本。的户作为研究样本。61六、时序抽样六、时序抽样(time series sampling)v时序抽样是为了掌握总体在不同时间上的变化,防止时序抽样是为了掌握总体在不同时间上的变化,防止同一样本丧失其观察性,在一定时期内用反复抽样修同一样本丧失其观察性,在一定时期内用反复抽样修正样本的一种抽样方法。正样本的一种抽样方法。v使样本更换的方式有:使样本更换的方式有:每次全都抽取新样本;每次全都抽取新样本;每每次部分地变更样本;次部分地变更样本;后次样
42、本作为前次样本的一部后次样本作为前次样本的一部分。分。62第五节第五节 妇幼卫生信息收集中的偏倚妇幼卫生信息收集中的偏倚(bias)v在在整整个个调调查查研研究究中中,从从设设计计到到推推论论,由由于于各各种种因因素素的的影影响响,所所获获得得的的研研究究结结果果与与真真实实的的情情形形往往往往会会存存在在差差异异,有有时时还还可可能能出出现现完完全全错错误误的的结结论论,造造成成这这种种差差异异的原因主要有两个方面,一是误差,二是由于偏倚。的原因主要有两个方面,一是误差,二是由于偏倚。63一、误差(一、误差(error)v误差是指原始数据与真实值之差,或样本的统计量与误差是指原始数据与真实值
43、之差,或样本的统计量与总体参数之差。总体参数之差。v可将误差粗略地分为非随机误差和随机误差可将误差粗略地分为非随机误差和随机误差 64误差的种类误差的种类v1.非随机误差(非随机误差(nonrandom error)n非系统误差(非系统误差(nonsystematic error)n系统误差(系统误差(systematic error)v 试验过程中产生的一些误差,假若其值是固定不变的,试验过程中产生的一些误差,假若其值是固定不变的,或者遵循一定的规律变化则称为系统误差。或者遵循一定的规律变化则称为系统误差。v产生的原因往往是可知的或可能掌握的。产生的原因往往是可知的或可能掌握的。65随 机
44、误 差 random error v由由于于个个体体的的变变异异性性,而而引引起起样样本本结结果果与与总总体体结结果果存存在在差异,使得推断的结果失去一部分准确性。差异,使得推断的结果失去一部分准确性。v理论上,只有通过增加样本含量来减小随机误差。理论上,只有通过增加样本含量来减小随机误差。v随机误差是不可避免的,服从正态分布可以用医学统随机误差是不可避免的,服从正态分布可以用医学统计的方法进行分析和推断。计的方法进行分析和推断。66系统误差或偏倚(bias)v偏偏倚倚(bias),是是指指在在科科学学研研究究或或推推论论过过程程中中,由由于于某某些些非非试试验验因因素素的的干干扰扰所所形形成
45、成的的系系统统误误差差歪歪曲曲了了处处理理因因 素素 的的 真真 实实 效效 果果,不不 是是 由由 随随 机机 抽抽 样样 引引 起起 的的。n选择偏倚选择偏倚 selection biasn信息偏倚信息偏倚 information bias n混杂偏倚混杂偏倚 confounding671.选择偏倚选择偏倚(selection bias)v由于纳入观察对象的方法不正确由于纳入观察对象的方法不正确而使指被选择的调查而使指被选择的调查对象与总体中其他研究对象的某些特征存在系统差异。对象与总体中其他研究对象的某些特征存在系统差异。v多见于现况研究、病例对照研究和队列研究多见于现况研究、病例对照研
46、究和队列研究68选择偏倚的控制选择偏倚的控制v建立建全的健康信息系统(建立建全的健康信息系统(health information system)v严格科学的研究设计,明确定义源人群和样本人群严格科学的研究设计,明确定义源人群和样本人群v明确对象纳入标准、加强随访、提高应答率明确对象纳入标准、加强随访、提高应答率69检出症候偏倚(检出症候偏倚(detection signal bias)入院率偏倚入院率偏倚奈曼偏倚(奈曼偏倚(Neyman bias)无应答偏倚无应答偏倚(non-response bias)失访偏倚(失访偏倚(loss to follow-up bias)志愿者偏倚(志愿者偏倚
47、(volunteer bias)选择偏倚种类选择偏倚种类70检出症候偏倚(检出症候偏倚(detection signal bias)在用病例对照设计研究某暴露因子同某疾病之间在用病例对照设计研究某暴露因子同某疾病之间的联系时,若病例的纳入受该暴露因子的影响,使具的联系时,若病例的纳入受该暴露因子的影响,使具有该暴露因子的病例会早期出现某种临床症状,促其有该暴露因子的病例会早期出现某种临床症状,促其早日就诊,从而使同暴露因子有关的病例有选择性地早日就诊,从而使同暴露因子有关的病例有选择性地被选入观察样本,因而被选入的病例在被研究的特征被选入观察样本,因而被选入的病例在被研究的特征方面(某暴露因子
48、)同未被选入的病例有系统的差别。方面(某暴露因子)同未被选入的病例有系统的差别。71例如:例如:19751975年年ZielZiel和和FinkleFinkle用病例对照研究,从美国用病例对照研究,从美国加州洛杉矶妇女中调查口服雌激素同子宫内膜癌之间加州洛杉矶妇女中调查口服雌激素同子宫内膜癌之间的关系。结果认为两者间存在高度的关联,结论是口的关系。结果认为两者间存在高度的关联,结论是口服雌激素是妇女子宫内膜癌的危险因素。服雌激素是妇女子宫内膜癌的危险因素。72入院率偏倚入院率偏倚伯克森偏倚(伯克森偏倚(Berkson bias)评价两种手术方法(扩大根治术和一般子宫全切术)治疗子宫颈癌的疗效。
49、在某教学医院连续选取100例经扩大根治术手术的子宫颈癌患者进行跟踪随访,同时在另外一家医院选择经一般子宫全切术的子宫颈癌患者进行随访观察。最后结果显示,接受一般子宫全切术的病人平均存活期长于经扩大根治术手术的病人。73奈曼偏倚(奈曼偏倚(Neyman bias)现患现患-新发病例偏倚(新发病例偏倚(prevalence-incidence bias)例:在医院内心肌梗死病人中调查大量饮用咖啡者心肌例:在医院内心肌梗死病人中调查大量饮用咖啡者心肌梗死发病的危险性是否提高,得出大量饮用咖啡对心梗死发病的危险性是否提高,得出大量饮用咖啡对心肌梗死的发病并无影响得结论。而事实上大量报道大肌梗死的发病并
50、无影响得结论。而事实上大量报道大量饮用咖啡心肌梗死发病危险性是对照的量饮用咖啡心肌梗死发病危险性是对照的2倍。倍。74志愿者偏倚(志愿者偏倚(volunteer bias)研究心肌梗塞患者研究心肌梗塞患者“轻运动疗法轻运动疗法”是否优于其它康复是否优于其它康复方法(如减少复发率)。愿意参加者为试验组,不愿方法(如减少复发率)。愿意参加者为试验组,不愿意参加者为对照组。结果参加意参加者为对照组。结果参加“轻运动疗法轻运动疗法”的病人的病人复发率低于对照组,提示复发率低于对照组,提示“轻运动疗法轻运动疗法”优于其他康优于其他康复方法。复方法。75无应答偏倚(无应答偏倚(non-response b