《定性变量的统计描述资料课件.pptx》由会员分享,可在线阅读,更多相关《定性变量的统计描述资料课件.pptx(115页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 【案例案例】某某年年甲甲乙乙两两地地发发生生麻麻疹疹流流行行,甲甲地地发发病病人人数数为为人人,乙乙地地发发病病人人数数为为人人,甲甲地地发发病病人人数数比比乙乙地地多多人人,能能否否据据此此认认为为甲甲地地麻麻疹疹发发病病比比乙乙地地严严重重呢呢?.第1页/共115页目的:比较甲、乙两地麻疹的发病情况。目的:比较甲、乙两地麻疹的发病情况。问题问题1.甲地麻疹发病比乙地严重吗?甲地麻疹发病比乙地严重吗?问题问题2.该怎样表示两地麻疹发病强度该怎样表示两地麻疹发病强度?绝对数绝对数相对数相对数分类资料的统计描述常用分类资料的统计描述常用相对数相对数往往先统计具有某种属性的个体数,进而往往先统计
2、具有某种属性的个体数,进而用相对数来描述和比较这类变量。用相对数来描述和比较这类变量。第2页/共115页相对数相对数(Relativenumber)的概念:的概念:是两个是两个具有内在联系的指标之比。具有内在联系的指标之比。包括包括频率频率(FrequencyorProportion)强度强度(Intensity)相对比相对比(Relativeratio)第3页/共115页第第一一节节 定定性性变变量量频频率率分分布布第4页/共115页定性资料定性资料频率分布表频率分布表/图图特点:能特点:能描述一个全面的分布特征,即把描述一个全面的分布特征,即把所有各种可能性的特征都给描述出来。所有各种可能
3、性的特征都给描述出来。相对数指标相对数指标特点:特点:从某个侧面来描述定性变量,尽管不从某个侧面来描述定性变量,尽管不一定能全面的描写某分布,但有助于统计描述和推断。一定能全面的描写某分布,但有助于统计描述和推断。相对数指标相对数指标频率分布表频率分布表/图图分布特征分布特征频率型指标频率型指标强度型指标强度型指标相对比指标相对比指标一、多分类变量的频率分布一、多分类变量的频率分布第5页/共115页表表3-1某课题组为了解城乡居民慢性病的患病情况,于某课题组为了解城乡居民慢性病的患病情况,于2010年对某地区城乡年对某地区城乡25个社区的居民进行了调查。课题组个社区的居民进行了调查。课题组对资
4、料进行了整理,将对资料进行了整理,将1381例被访者和例被访者和284例慢性病患者例慢性病患者按职业分组制成频数表见表按职业分组制成频数表见表3-1表表3-12010年某地区被访者和慢性病患者按职业分组的频率分布年某地区被访者和慢性病患者按职业分组的频率分布第6页/共115页 图图3-1 2010年某地区调查的被访者和慢性病患者的职业分布年某地区调查的被访者和慢性病患者的职业分布第7页/共115页图图3-2 2010年某地区慢性病患者的职业分布年某地区慢性病患者的职业分布第8页/共115页二、二分类变量的频率分布二、二分类变量的频率分布患患慢性病的频率占慢性病的频率占:284/181=20.6
5、%不患病的频率占:不患病的频率占:1-20.6%=79.4%(2)所以对这样一个二项分类来说,用一个)所以对这样一个二项分类来说,用一个20.6%就能描述整个资料的频率分布。就能描述整个资料的频率分布。表表3-2 2010年某地区年某地区1381例被访者是否慢性病患者的频率分布例被访者是否慢性病患者的频率分布第9页/共115页二分类资料,对二分类资料,对1381名被访者中,农民患病的频名被访者中,农民患病的频率占率占19.8%,不患病的占,不患病的占80.2%。表表3-3 2010年某地区年某地区1381例被访者按职业分组的慢性病患病率例被访者按职业分组的慢性病患病率第10页/共115页图图3
6、-3 2010年某地区年某地区1381例被访者不同职业的慢性病的患病率例被访者不同职业的慢性病的患病率(%)患病率(%)第11页/共115页表3-4 2010年某地区1381例被访者按职业和性别分组的慢性病患病率第12页/共115页图图3-4 某地区某地区1381例被访者按职业和性别分组的慢性病患病率例被访者按职业和性别分组的慢性病患病率(%)第13页/共115页第第 二二 节节 常常 用用 相相 对对 数数 指指 标标第14页/共115页一、一、频率型指标频率型指标(Frequency)指某现象发生的频率,或指某现象发生的频率,或表示事物内部某个组成成表示事物内部某个组成成分所占的比重或分布
7、。分所占的比重或分布。频率的特征:频率的特征:分子是分母的一部分;分子是分母的一部分;无量纲,在无量纲,在01之间取值之间取值。计算公式:计算公式:麻疹患者麻疹患者300人甲地甲地30000人第15页/共115页二、强度(二、强度(intensity)强度是流行病学、统计学术语,指单位时间内某现强度是流行病学、统计学术语,指单位时间内某现象发生的频率。象发生的频率。分母含有时间,指单位时间内的频率;分母含有时间,指单位时间内的频率;其统计学本质为频率强度,即概率强度的近似值。其统计学本质为频率强度,即概率强度的近似值。计算公式:计算公式:特点:特点:第16页/共115页“人时人时”:人:人观察
8、时间(年、月)观察时间(年、月)举例:举例:10个人观察个人观察1年年单位单位“人年人年”10人年人年1个人观察个人观察10年年有有3个人,第个人,第1个人观察个人观察10年年第第2个人观察个人观察5年年第第3个人观察个人观察1年年16人年人年相当于相当于16个人观察了个人观察了1年年观察人时的总和观察人时的总和=单位时间单位时间折合的观察人数折合的观察人数1个人观察个人观察1年年1人年人年第17页/共115页 单位时间内新发生的概率 式中的式中的K为为比例基数比例基数,可以为,可以为100%、1000、10000/万、万、100000/10万等。万等。第18页/共115页例例3-2某企业某企
9、业2003年有年有2839名职工,该企业每年都对职工名职工,该企业每年都对职工进行体检,这一年新发生高血压病人进行体检,这一年新发生高血压病人5例,试求例,试求2003年的年的高血压发病率:高血压发病率:答:答:即:即:2003年的高血压发病率为年的高血压发病率为1.76人人/1000人年。人年。据此推测据此推测2003年观察人群发生高血压的概率是年观察人群发生高血压的概率是1.76。第19页/共115页【举例举例】:在某医院院内感染调查中,:在某医院院内感染调查中,5031个病人共观察个病人共观察了了127859人日(人均人日(人均25.4日,也相当于日,也相当于127859人各观察人各观察
10、1日)日),其中有,其中有596人在医院发生感染,试求其院内感染率?人在医院发生感染,试求其院内感染率?100%5031人人25.4日日596人人=院内感染率院内感染率K观察人数总和观察人数总和新发病例数新发病例数=0.47人人/100人日人日=答:答:即每天医院内发生院内感染的频率是即每天医院内发生院内感染的频率是0.47人人/100人人日,据此推测平均每天日,据此推测平均每天100人中有人中有0.47个患者将在医院个患者将在医院内发生感染。内发生感染。第20页/共115页三、相对比三、相对比(relative ratio)是两个有关联的指标是两个有关联的指标A与与B,实际应用中简称比,实际
11、应用中简称比(ratio),说明二者的对比水平。),说明二者的对比水平。计算公式:计算公式:意义:意义:表示相对于表示相对于B 的一个单位,的一个单位,A 有多少个单位,有多少个单位,或或A为为B的若干倍或百分之几。的若干倍或百分之几。第21页/共115页1.A和B是绝对数,也可是相对数、平均数。2.A和B可是同性质的指标,也可是不同性质的指标,即其量纲可以相同,也可以不同。3.但A 和B应互不包含。人口调查中使用的男女性别比例比。人口调查中使用的男女性别比例比。某病年龄组发病率之比。某病年龄组发病率之比。甲乙两地亩产量之比甲乙两地亩产量之比 医院管理中医院管理中“医护人员与病床数医护人员与病
12、床数”之比之比注意:注意:【举例举例】第22页/共115页【举例举例】某市某市19771979年肺癌死亡率城区年肺癌死亡率城区为为19.39/10万,郊区为万,郊区为9.99/10万,比较二者万,比较二者的严重程度。的严重程度。答:答:即城区肺癌死亡率为郊区的即城区肺癌死亡率为郊区的1.94倍。倍。R=19.39/9.99=1.94第23页/共115页四、应用相对数时应注意的问题:四、应用相对数时应注意的问题:(一)不可望文生义(一)不可望文生义不少指标命名混乱,不少指标命名混乱,某某率某某率满天飞!满天飞!有的某某率实际上只是有的某某率实际上只是相对比相对比!更多的指标笼统的称为更多的指标笼
13、统的称为“率率”,但分不清究,但分不清究竟是竟是频率频率,还是,还是强度强度。故实践中遇到相对比的指标,应认真思考故实践中遇到相对比的指标,应认真思考其定义,辩别其性质,切不可顾名思义。其定义,辩别其性质,切不可顾名思义。第24页/共115页(二)(二)频率型指标的解释要紧扣总体与属性频率型指标的解释要紧扣总体与属性表表3-1 2010年某地区被访者和慢性病患者按职业分组的频率分布年某地区被访者和慢性病患者按职业分组的频率分布第25页/共115页表表3-2 2010年某地区年某地区1381例被访者是否慢性病患者的频率分布例被访者是否慢性病患者的频率分布表表3-3 2010年某地区年某地区138
14、1例被访者按职业分组的慢性病患病率例被访者按职业分组的慢性病患病率第26页/共115页(三)(三)计算相对数的分母应有足够数量。计算相对数的分母应有足够数量。例一:例一:甲医院治疗甲医院治疗100例患者,其中例患者,其中40例有效。例有效。甲医院有效率是甲医院有效率是40%例二:例二:乙医院治疗乙医院治疗5例患者,其中例患者,其中2例有效。例有效。乙医院有效是乙医院有效是2/5,其疗效有待于进步观察,其疗效有待于进步观察故资料总例数过少,则计算所得相对数的偏差会故资料总例数过少,则计算所得相对数的偏差会比较大,这种情况下直接报告原始数据更为可取。比较大,这种情况下直接报告原始数据更为可取。第2
15、7页/共115页(四)(四)正确的合并估计频率正确的合并估计频率举例:举例:甲医院治疗患者甲医院治疗患者100例,例,40例有效。乙医院治例有效。乙医院治疗同类患者疗同类患者90例,例,30例有效,计算两院的总有效率。例有效,计算两院的总有效率。答:分别计算甲、乙两答:分别计算甲、乙两院的有效率,相加后除院的有效率,相加后除2:就分别将分子(分母)相加作为合并估计的分子(分母)就分别将分子(分母)相加作为合并估计的分子(分母)有效率有效率=21100409030(+)正确合并正确合并:100+9040+30有效率有效率=36.8%第28页/共115页(五)(五)相对数间的比较要具有可比性相对数
16、间的比较要具有可比性观察对象、研究方法观察对象、研究方法(检验手段、抽样方法检验手段、抽样方法)、观察时间等;观察时间等;观察对象的内部构成;观察对象的内部构成;非同期资料对比时应注意客观条件的变化非同期资料对比时应注意客观条件的变化注意以下几个方面:注意以下几个方面:第29页/共115页(六)(六)对样本相对数的统计推断:对样本相对数的统计推断:统计学研究特点:统计学研究特点:n 抽样研究:研究的是抽样研究:研究的是样本样本,目的对,目的对总体总体作出推断作出推断n 得到的是得到的是频率频率,要对,要对概率概率作出推断。作出推断。从样本估计总体相对数,需进行从样本估计总体相对数,需进行参数估
17、计参数估计和和假设检验假设检验对对频率频率分布进行统计推断比较成熟分布进行统计推断比较成熟对对强度强度指标进行统计推断不容易指标进行统计推断不容易对对相对比相对比进行统计推断非常困难进行统计推断非常困难理论和技术理论和技术第30页/共115页第第三三节节 医医学学人人口口统统计计常常用用指指标标第31页/共115页医学人口统计:是从卫生保健的角度研究和描述人口数量、分布、结构、变动及其规律,研究人口与卫生事业发展的关系,是卫生统计学的重要组成部分。第32页/共115页一、医学人口统计资料的来源一、医学人口统计资料的来源(一)人口普查资料 人口普查(census)是收集、整理和分析一个国家或一定
18、地区在某一特定时间的人口、经济和社会资料的全过程,人口普查提供了最基本的人口数据和社会经济方面的资料.第33页/共115页(二)人口抽样调查资料 人口抽样调查则相对省力,可以多次进行,也可以一次调查较多的项目 根据样本所具有的数量特征还可推论总体的相应特征。第34页/共115页(三)人口登记资料 人口登记是指人口事件发生后随即进行登记。生命事件登记 简称生命登记,联合国将其定义为:生命事件登记是对生命事件(包括出生、死亡等)的法定登记,记录和报告生命事件的发生,收集、整理和分析生命事件的有关资料人口迁移变动登记 是对所发生的人口迁出或迁入事件进行记录,包括迁入或迁出的时间、地点、原因及个人的基
19、本情况等。户口登记 是按人或按户建立每个人一生(从出生到死亡)中一切人口事件的记录,包括姓名、性别等基本情况,此外还设有因出生、死亡、迁移及常住人口婚姻状况变动、分居、合居、失踪、寻回、收养、认领等引起户口变动方面的登记。第35页/共115页二、描述人口学特征的常用指标二、描述人口学特征的常用指标(一)人口总数人口总数:(population size)一般指一个国家或地区在某一特定时间的人口数。按惯例,一般采用一年的中点,即7月1日零时为标准时刻来进行统计 当人口数在一年中是均匀变动时,可用相邻两年年末(12月31日)人口数的平均值计算年平均人口数;也可用年中(7月1日零时)人口数代表全年的
20、平均人口数。第36页/共115页(二)人口学特征指标 人口学的基本特征包括年龄、性别、文化、职业等,其中最常用来描述人口构成情况的是性别和年龄。老年(人口)系数指老年人口在总人口中所占比重,是说明人口年老程度的指标,可作为划分人口类型的尺度一般把65岁及以上的人口称为老年人口。少年儿童(人口)系数指14岁及以下少年儿童在总人口中所占比重。第37页/共115页负担系数(dependency ratio):又称抚养比或抚养系数,是指人口中非劳动年龄人数与劳动年龄人数之比。老少比:指65岁及以上的老年人口与14岁及以下的少年儿童人口之比,表示每100名少年儿童对应多少老年人,是划分人口类型的标准之一
21、。性别比(sex ratio):指男性人口与女性人口的比值 第38页/共115页表表3-5人口学特征指标人口学特征指标指标指标分子分子分母分母基数基数指标类型指标类型老年老年(人口人口)系数系数65岁人口数岁人口数人口总数人口总数100%频率型频率型少儿少儿(人口人口)系数系数14岁人口数岁人口数人口总数人口总数100%频率型频率型总负担系数总负担系数14岁人口数岁人口数+65岁人口数岁人口数1564岁人口数岁人口数100%相对比相对比型型少儿负担系数少儿负担系数老年负担系数老年负担系数老少比老少比性别比性别比14岁人口数岁人口数65岁人口数岁人口数65岁人口数岁人口数男性人口数男性人口数15
22、64岁人口数岁人口数1564岁人口数岁人口数14岁人口数岁人口数女性人口数女性人口数100%100%100%100%相对比型相对比型相对比型相对比型相对比型相对比型相对比型相对比型第39页/共115页三、有关生育的常用统计指标三、有关生育的常用统计指标有关生育的常用统计指标 生育与计划生育统计资料的来源公安、卫生、民政和计划生育等部门反映生育水平的统计指标 粗出生率(crude birth rate,CBR)指某地某年的活产率 总生育率(general fertility rate,GFR)指某地某年平均每千名育龄妇女的活产数第40页/共115页年龄组生育率(age-specific fert
23、ility rate,ASFR)又称年龄别生育率,消除了育龄妇女内部年龄构成不同对生育水平的影响;终生生育率(life-time fertility rate,LTFR)测量人口再生育的统计指标 自然增长率(natural increase rate,NIR)是粗出生率(CBR)与粗死亡率(CDR)之差,即NIR=CBRCDR。第41页/共115页粗再生育率(gross reproduction rate,GRR)是只计算女婴的总和生育率。净再生育率(net reproduction rate,NRR)确切能替代母亲一代执行生育职能的比例第42页/共115页表表3-6生育与计划生育统计指标生育
24、与计划生育统计指标指标指标分子分子分母分母基数基数指标类型指标类型粗出生率粗出生率同年活产数同年活产数同年平均人口数同年平均人口数1年年1000强度型强度型(近近似似)总生育率总生育率同年活产数同年活产数同年同年1549岁妇女数岁妇女数1000相对比型相对比型年龄组生育率年龄组生育率 同年某年龄组活产数同年某年龄组活产数同年某年龄组平均同年某年龄组平均妇女数妇女数1年年1000强度型强度型(近近似似)终生生育率终生生育率同批妇女所生子女数同批妇女所生子女数经历育龄期的同批经历育龄期的同批妇女数妇女数1000相对比型相对比型避孕现用率避孕现用率同期接受避孕措施人同期接受避孕措施人数数同期同期15
25、49岁妇女数岁妇女数1000相对比型相对比型计划生育率计划生育率同年符合计划生育的同年符合计划生育的活产数活产数同年活产总数同年活产总数100%频率型频率型人工流产率人工流产率年内人工流产次数年内人工流产次数同年同年1549岁妇女数岁妇女数100%相对比型相对比型第43页/共115页反映计划生育工作情况的统计指标 避孕现用率(contraceptive prevalence)指育龄妇女中,已经采用避孕措施的频率;人工流产率(induce abortion rate)指某年内育龄妇女中人工流产的强度;计划生育率表示活产中符合计划生育要求的频率,它综合说明计划生育的质量.第44页/共115页(二)
26、人口死亡统计指标 我国人口死亡资料主要由公安部门负责收集,死因要严格按照国际疾病和有关健康问题的国际统计分类第十版(International classification of diseases,ICD-10)中的死因分类填写 第45页/共115页常用人口死亡统计指标 测量死亡水平的指标:粗死亡率(crude death rate,CDR),或称为死亡率(mortality rate),指某地某年平均每千人口中的死亡数,它反映居民总的死亡水平。第46页/共115页表表3-7人口死亡统计指标人口死亡统计指标指标指标分子分子分母分母基数基数类类型型粗死亡率粗死亡率某年龄组死亡率某年龄组死亡率同年
27、内死亡人数同年内死亡人数同年年龄组死亡人数同年年龄组死亡人数同年同年1周岁死亡人数周岁死亡人数同年同年28天死亡人数天死亡人数同年围生期死胎数同年围生期死胎数+死死产数产数+7天死亡人数天死亡人数同年同年5岁以下儿童死亡岁以下儿童死亡数数同年孕产妇死亡数同年孕产妇死亡数同年内某原因死亡人同年内某原因死亡人数数同年某病死亡人数同年某病死亡人数同年某死因死亡数同年某死因死亡数年平均人口数年平均人口数1年年同年年龄组平均人口同年年龄组平均人口数数1年年10001000强度型强度型(近似近似)强度型强度型(近似近似)婴儿死亡率婴儿死亡率新生儿死亡率新生儿死亡率同年活产儿总数同年活产儿总数同年活产儿总数
28、同年活产儿总数10001000频率型频率型(近似近似)频率型频率型(近似近似)围生儿死亡率围生儿死亡率5岁以下儿童死亡岁以下儿童死亡率率孕产妇死亡率孕产妇死亡率某死因死亡率某死因死亡率某病病死率某病病死率比例死亡比比例死亡比同年围生期死胎数同年围生期死胎数+死产数死产数+活产数活产数同年活产儿总数同年活产儿总数同年活产儿总数同年活产儿总数同年平均人口数同年平均人口数1年年同年患该病总数同年患该病总数同年内死亡总数同年内死亡总数1000100010万万/10万万10万万/10万万100%100%频率型频率型(近似近似)相对比相对比相对比相对比强度型强度型(近似近似)频率型频率型(近似近似)频率型
29、频率型(近似近似)第47页/共115页婴儿死亡率(infant mortality rate,IMR)指某年活产儿中不满1周岁(婴儿)的死亡频率,新生儿死亡率(neonatal mortality rate,NMR)指某地某年活产儿中未满28天的新生儿死亡频率;新生儿后期死亡率(post-neonatal mortality rate,PNMR)指某地某年活产儿中满28天但未满1岁的新生儿死亡频率第48页/共115页围生儿死亡率(perinatal mortality)5岁以下儿童死亡率(child mortality under age 5)孕产妇死亡率(maternal mortality
30、 rate)死因别死亡率(cause-specific death rate,CSDR)某病病死率(case fatality rate,CFR)第49页/共115页反映死因构成及死因顺位的指标比例死亡比(proportionate mortality rate,PMR)也称为死因构成或相对死亡比(proportion of dying of a specific cause),指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的相对重要性。死因顺位是指按各类死因构成比的大小由高到低排列的位次,说明各类死因的相对重要性。第50页/共115页第第四四节节 疾疾病病统统计计常常用用指指标标第
31、51页/共115页疾病统计资料的来源疾病统计资料的来源疾病报告和报表资料 医疗卫生工作记录 疾病专题调查资料 第52页/共115页一、疾病和死因分类疾病的命名(nomenclature of diseases)为了深入认识疾病,有必要将各种不同的疾病加以命名和分类。就是要对每一种法定疾病情况给以确切的名称,疾病分类(classification of diseases)是在疾病命名法的基础上,考虑到对疾病的认识及防治需要,将一些具有共同特性的疾病归纳在一起,加以分类。现在国际上使用的是ICD的第十次修订本(简称ICD-10)。第53页/共115页二、疾病统计指标 发病率(incidence r
32、ate,IR)表示一定时期内,在可能发生某病的一定人群中新发生某病的强度。患病率(prevalence rate,PR)又称为现患率,指某时点上受检人数中现患某种疾病的频率,患病率分为时点患病率(point prevalence rate)和期间患病率(period prevalence rate)。第54页/共115页治愈率(cure rate)表示受治病人中治愈的频率。有效率表示受治病人中治疗有效的频率。生存率(survival rate):指病人能活到某一时点的概率第55页/共115页表表3-8疾病统计常用指标疾病统计常用指标指标指标分子分子分母分母基数基数类型类型某病发病率某病发病率时
33、期内新发生时期内新发生的某病病例数的某病病例数年平均人口年平均人口数数1年年10万万/10万万强度型强度型(近似近似)时点患病率时点患病率时点现患疾病时点现患疾病人数人数检查人口数检查人口数10万万/10万万频率型频率型期间患病率期间患病率时期现患疾病时期现患疾病人数人数检查人口数检查人口数10万万/10万万频率型频率型治愈率治愈率治愈人数治愈人数接受治疗人接受治疗人数数100%频率型频率型生存率生存率活满特定时期活满特定时期的人数的人数期初存活的期初存活的人数人数100%频率型频率型残疾患病率残疾患病率残疾患者人数残疾患者人数 检查人数检查人数100%频率型频率型第56页/共115页第第 五
34、五 节节 粗粗 率率 的的 标标 准准 化化 法法第57页/共115页【分析分析】:病型病型A疗法疗法B疗法疗法病例病例治愈数治愈数治愈率(治愈率(%)病例病例治愈数治愈数治愈率(治愈率(%)普通型普通型30018060.01006565.0重型重型1003535.030012541.7合计合计40021553.840019047.5例例3-3:比较比较A、B两种疗法的治愈率两种疗法的治愈率 该病的严重情况对治愈率有直接的影响,但在两组的该病的严重情况对治愈率有直接的影响,但在两组的分布明显不同。分布明显不同。比较两疗法的治愈率,从合计率看比较两疗法的治愈率,从合计率看A法优于法优于B法。法。
35、因为两组该病轻重病型构成不同,所以粗治愈率不因为两组该病轻重病型构成不同,所以粗治愈率不能直接拿来比较。能直接拿来比较。第58页/共115页【分析分析】:【例例2】:比较某地有一个钢铁厂,一个棉纺比较某地有一个钢铁厂,一个棉纺厂,两厂人数、规模近似,体检时发现,棉纺厂,两厂人数、规模近似,体检时发现,棉纺厂的胆囊炎患者明显地高于钢铁厂,这能否说厂的胆囊炎患者明显地高于钢铁厂,这能否说明棉纺厂的胆囊炎患病情况比钢铁厂严重?明棉纺厂的胆囊炎患病情况比钢铁厂严重?不能不能性别构成是影响胆囊炎患病的因素,女性易患性别构成是影响胆囊炎患病的因素,女性易患胆囊炎。胆囊炎。两厂性别构成不同两厂性别构成不同,
36、棉纺厂女性所占比例明显,棉纺厂女性所占比例明显高于钢铁厂,所以不能得出该结论。高于钢铁厂,所以不能得出该结论。第59页/共115页“率的标准化率的标准化”的意义和基本思的意义和基本思想想如需比较,须采用如需比较,须采用统一标准构成统一标准构成消除该因素的内部构消除该因素的内部构成不同对粗率的影响后,用标准化后的统一标准化率成不同对粗率的影响后,用标准化后的统一标准化率再进行比较。再进行比较。当当年龄、性别、工龄、病情年龄、性别、工龄、病情等因素在两组的内部等因素在两组的内部构成不同并有可能影响到粗率的情况时,则粗死构成不同并有可能影响到粗率的情况时,则粗死亡率、发病率、粗治愈率亡率、发病率、粗
37、治愈率不能直接不能直接进行比较。进行比较。率的标准化率的标准化第60页/共115页一、基本概念:一、基本概念:率的标准化法率的标准化法(standardization):常用一定技术手:常用一定技术手段,消除待比较两组率的在人口构成上的差异,从段,消除待比较两组率的在人口构成上的差异,从而推算出统一人口构成的合计率,这一过程,叫率而推算出统一人口构成的合计率,这一过程,叫率的标准化法。的标准化法。标准化率标准化率(standardizedrate)或调整率()或调整率(adjustmentrate):消除了内部构成差异后计算得出的合计率:消除了内部构成差异后计算得出的合计率称为标准化率。称为标
38、准化率。常需标化的指标:常需标化的指标:人口死亡率、病死率、发病率等人口死亡率、病死率、发病率等常见的混杂因素:常见的混杂因素:年龄、性别、病情等年龄、性别、病情等第61页/共115页二、标准化率的计算:二、标准化率的计算:直接法直接法和和间接法间接法(一)直接法(一)直接法适用条件适用条件:已知各组已知各组粗率粗率 P甲甲380/800100%47.5%P乙乙427/800100%53.4%第62页/共115页具体步骤:具体步骤:原则:原则:一般地,有一个重要的一般地,有一个重要的分类变量分类变量,它在两组个体,它在两组个体(j=1,2)中的分布不同,且)中的分布不同,且已知第已知第j 组每
39、个类别中发组每个类别中发生某事件的频率生某事件的频率Pij,i=1,2,。1.选定选定“标准人口标准人口”,每个类别的个体数记为每个类别的个体数记为Ni,i=1,2,u选定两组之一作人口构成。选定两组之一作人口构成。u两组合并作人口构成两组合并作人口构成。u在两组之外另选一个群体,如采用全国、全在两组之外另选一个群体,如采用全国、全省或全地区的对象,将其作为标准。省或全地区的对象,将其作为标准。选择方法:选择方法:要求要求:就选择有:就选择有代表性的代表性的、较稳定的较稳定的、数量较大的数量较大的人群人群第63页/共115页第64页/共115页计算各标化组预期死亡数:计算各标化组预期死亡数:各
40、组预期治愈数标准构成人口数各组预期治愈数标准构成人口数各组粗治愈率各组粗治愈率 2.分别计算分别计算“标准人口标准人口”下的预期治愈人数之和下的预期治愈人数之和计算预期治愈总数:计算预期治愈总数:De=NiPij标准构成人标准构成人口数口数相应组粗相应组粗治愈率治愈率各组预期治各组预期治愈人数愈人数NiPij,j=1,2,第65页/共115页第66页/共115页N i为标准构成为标准构成的人口数的人口数NPNpii=P i为被标化组的为被标化组的粗治愈率粗治愈率N 为标准总人口数为标准总人口数3.分别计算各比较组的标准化治愈率分别计算各比较组的标准化治愈率 P甲甲380/800100%47.5
41、%P乙乙427/800100%53.4%第67页/共115页(二)间接法(二)间接法适用条件适用条件:各组粗率未知,仅知两比较组各组粗率未知,仅知两比较组患患病或者死亡总人数病或者死亡总人数,各组各组调查人口的构成情况调查人口的构成情况。第68页/共115页 年龄别标准患年龄别标准患病率病率第69页/共115页具体步骤:具体步骤:原则:原则:一般地,有一个重要的一般地,有一个重要的分类变量分类变量,它在两,它在两组个体(组个体(j=1,2)的分布不同,且已知)的分布不同,且已知第第j 组每组每个类别的个体数个类别的个体数nij,i=1,2,和和实际发生某事件实际发生某事件的总人数的总人数rj,
42、j=1,2,。1.选定选定“标准患病率标准患病率”,每个类别发生率记为,每个类别发生率记为Pi,i=1,2,合计发生率为合计发生率为P。第70页/共115页年龄别标准患年龄别标准患病率病率第71页/共115页计算各标化组预期患病人数:计算各标化组预期患病人数:各组预期患病人数调查各组人口数各组预期患病人数调查各组人口数各组标准患病率各组标准患病率2.分别计算分别计算“标准患病率标准患病率”下预期患病人数之和下预期患病人数之和计算预期患病总人数:计算预期患病总人数:De=nijPi各调查组人各调查组人口数口数相应标准相应标准患病率患病率各组预期患各组预期患病率病率nijPi,j=1,2,第72页
43、/共115页 第73页/共115页预期患病总人数预期患病总人数实际患病总数实际患病总数3.分别计算两比较组的标准化患病率分别计算两比较组的标准化患病率第74页/共115页计算各组的间接标化率计算各组的间接标化率 P。标化死亡比标化死亡比(standard mortality ratio,SMR):实际死亡总数和期望死亡总数的之比,其实际死亡总数和期望死亡总数的之比,其 意意义是被标化人群和标准组人群死亡率的比较。义是被标化人群和标准组人群死亡率的比较。p=SMR 标准死亡总率标准死亡总率SMR1说明被标化人群的死亡率说明被标化人群的死亡率大于大于标准组标准组SMR1说明被标化人群的死亡率说明被
44、标化人群的死亡率小于小于标准组标准组第75页/共115页小结:小结:标化死亡率的直接法和间接法标化死亡率的直接法和间接法第76页/共115页三、应用标准化法时的注意事项三、应用标准化法时的注意事项1.标准化法的应用范围很广标准化法的应用范围很广“一个重要的分类变量一个重要的分类变量”:病情、年龄、性别、职业等:病情、年龄、性别、职业等“某事件的发生率某事件的发生率”:治愈率、患病率、发病率、死亡率:治愈率、患病率、发病率、死亡率等等3.由于选择的标准不同,算出的标准化率也不同,比较由于选择的标准不同,算出的标准化率也不同,比较的结果也未必相同,因而报告结果时必须说明所选用的结果也未必相同,因而
45、报告结果时必须说明所选用的的“标准标准”及理由。及理由。2.标化后的标准化率已不再反映当地的实际水平,它只标化后的标准化率已不再反映当地的实际水平,它只是表示相互比较的资料间的相对水平。是表示相互比较的资料间的相对水平。4.两样本的标准化率是样本值,存在抽样误差。要比较两样本的标准化率是样本值,存在抽样误差。要比较时,当样本含量较小时,还应作假设检验。时,当样本含量较小时,还应作假设检验。第77页/共115页动态数列动态数列(dynamicseries):是一系列按:是一系列按时间顺序时间顺序排列起来的统计指标(包括绝对数、排列起来的统计指标(包括绝对数、相对数或平均数),用以说明事物在时间上
46、相对数或平均数),用以说明事物在时间上的变化和发展趋势。的变化和发展趋势。动态数列是建立在相对比的基础上,采动态数列是建立在相对比的基础上,采用定基比和环比两种方式。用定基比和环比两种方式。第六节第六节动态数列及其分析指标动态数列及其分析指标第78页/共115页动态数列的常用分析指标:动态数列的常用分析指标:一、一、绝对增长量绝对增长量说明事物在一定时期所说明事物在一定时期所增加的绝对数量。可分别计算累计增长量和增加的绝对数量。可分别计算累计增长量和逐年增长量。逐年增长量。1.累计增长量:报告年的指标与某一固定累计增长量:报告年的指标与某一固定年(基期水平)指标之差。年(基期水平)指标之差。2
47、.逐年增长量:报告年的指标与前一年逐年增长量:报告年的指标与前一年指标之差。指标之差。第79页/共115页7第80页/共115页二、二、发展速度和增长速度发展速度和增长速度1.定基发展速度:统一用某个时间的指标做基数,定基发展速度:统一用某个时间的指标做基数,以各时间的指标与之相比。以各时间的指标与之相比。2.环比发展速度:以前一个时间的指标做基数,环比发展速度:以前一个时间的指标做基数,以相临的后以相临的后一时间的指标与之相比。一时间的指标与之相比。增长速度增长速度=发展速度发展速度1第81页/共115页7第82页/共115页三、平均发展速度和平均增长速度三、平均发展速度和平均增长速度用于概
48、括某一时期的速度变化,即该时期环比的用于概括某一时期的速度变化,即该时期环比的几何均数。几何均数。平均发展速度平均发展速度a0:基期指标,基期指标,an第第n年指标。年指标。平均增长速度平均增长速度=平均发展速度平均发展速度-1例例根据表根据表3-13资料做动态分析。资料做动态分析。平均发展速度平均发展速度平均增长速度平均增长速度=平均发展速度平均发展速度-1=1.065-1=0.065=6.5%第83页/共115页动态数列的分析不仅可以总结过去,而且可以展望动态数列的分析不仅可以总结过去,而且可以展望未来,进行预测,即根据平均发展速度公式计算几年后未来,进行预测,即根据平均发展速度公式计算几
49、年后达到的指标。达到的指标。例例根据表根据表3-13资料预测资料预测2012年职工医疗费用。年职工医疗费用。根据该地根据该地2003-2010年职工医疗费用的平均发展速度,年职工医疗费用的平均发展速度,预计到预计到2012年该地职工医疗费用可达年该地职工医疗费用可达11164865元。元。预测时宜用近期比较稳定的发展速度,可求得更为预测时宜用近期比较稳定的发展速度,可求得更为稳妥的预测值。稳妥的预测值。第84页/共115页四、动态数列统计图线图和半对数线图可以直观的描述动态数列的发展变化趋势1.线图(line chart)是用线段的升降来表示统计指标的变化趋势,或某现象随另一现象的变迁的情况,
50、适用于连续性变量。线图分为单式线图和复式线图。横轴和纵轴都是算术尺度。第85页/共115页图图3-5 某地区某地区2003-2010年职工医疗费用动态变化年职工医疗费用动态变化第86页/共115页第87页/共115页图图3-6某地某地19501966年伤寒和结核病的死亡率变化情况年伤寒和结核病的死亡率变化情况第88页/共115页注注 意意横轴代表分组标志,纵轴代表统计指标。横轴和纵轴的刻度都可以不从“0”开始;用短线依次将相邻各点连接即得线图,不应将折线描成光滑曲线;线图中只有一条线,称为单式线图。若有两条及以上的线条,称为复式线图;在绘图时,一定要注意纵横轴比例,由于比例不同,给人的印象也不