分类变量的描述性统计精选PPT.ppt

上传人:石*** 文档编号:51228007 上传时间:2022-10-18 格式:PPT 页数:54 大小:740.50KB
返回 下载 相关 举报
分类变量的描述性统计精选PPT.ppt_第1页
第1页 / 共54页
分类变量的描述性统计精选PPT.ppt_第2页
第2页 / 共54页
点击查看更多>>
资源描述

《分类变量的描述性统计精选PPT.ppt》由会员分享,可在线阅读,更多相关《分类变量的描述性统计精选PPT.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于分类变量的描述性统计第1页,讲稿共54张,创作于星期日分类变量的整理(分类变量的整理(1)婚姻状况频数单身 3已婚 5离异 2分居 4合计14 14名成人的婚姻状况名成人的婚姻状况编号性别身高婚姻状况1男175单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据名成人的原始数据第2页,讲稿共54张,创作于星期日分类变量的整理(分类变量的整理(2)婚姻状况性别男女单身21已婚23离异11分居22不同性别的婚姻状况不同性别的婚姻状况

2、编号性别身高婚姻状况1男175单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据名成人的原始数据第3页,讲稿共54张,创作于星期日一 常用的比例指标常用的比例指标绝对数:资料整理后各组的例数相对数:两个绝对数之比中得到的一种数值第4页,讲稿共54张,创作于星期日例:调查得某年小学生中流脑发病:甲地区63例,乙地区35例。v甲地区流脑流行比乙地区严重 v如已知小学生总人数:甲地区50051人,乙地区14338人,可算出两个发病率:v

3、甲地区流脑发病率:63/500511000=1.26v 乙地区流脑发病率:35/14338 1000=2.44 v乙地区流脑流行比甲地区严重乙地区流脑流行比甲地区严重第5页,讲稿共54张,创作于星期日1.率:率:速率(速率(rate):与时间有关,如某年某病发病率、死亡率。):与时间有关,如某年某病发病率、死亡率。比率(比率(proportion):与时间无关,如某病治愈率。):与时间无关,如某病治愈率。2.比:比:构成比(构成比(constituent ratio):部分与全部之比):部分与全部之比相对比(相对比(relative ratio):两指标之比):两指标之比常用的比例指标及其意义

4、常用的比例指标及其意义第6页,讲稿共54张,创作于星期日1.率又称强度相对数或频率反映某现象出现的频率或强度。某现象的发生数率=比例基数 可能发生某现象的总数比例基数:100%、1000、10000/万等选取原则:习惯用法、数值大小第7页,讲稿共54张,创作于星期日 例例 1999年年某某幼幼儿儿园园有有36名名儿儿童童患患了了腮腮腺腺炎炎,该该幼幼儿儿园园共共有有200名名儿儿童童(其其中中25名名儿儿童童以以前前患患过过),求求该幼儿园该幼儿园1999年腮腺炎的发病率。年腮腺炎的发病率。腮腺炎腮腺炎发发病率病率=第8页,讲稿共54张,创作于星期日 某医生研究了慢性阻塞性肺病(COPD)病人

5、的吸烟情况,自19982000年收治COPD病人356人,其中231人有三十年及以上的经常吸烟史(日平均1支以上),在本院其它科室收治的同年龄组段的非COPD病人(无其它呼吸系统疾患)479人,其中有三十年及以上的经常吸烟史的183人,试计算并比较两组病人的吸烟率。表 慢性阻塞性肺病(COPD)病人的吸烟情况第9页,讲稿共54张,创作于星期日速率速率 (rate)速率速率 (rate)是反映单位时间内某事件出现的可能是反映单位时间内某事件出现的可能性大小,多用于面向人群的出生、死亡和发病资料的统计性大小,多用于面向人群的出生、死亡和发病资料的统计.人口出生率人口出生率=(某年中活产总数某年中活

6、产总数/该年平均人口数该年平均人口数)100%第10页,讲稿共54张,创作于星期日常见的几种率 调查时某病患病人数调查时某病患病人数(1)某病患病率某病患病率100 调查人数调查人数 一定期间内某病新病例数一定期间内某病新病例数(2)某病发病率某病发病率1000同期平均人口数同期平均人口数第11页,讲稿共54张,创作于星期日l 某病死亡人数某病死亡人数(3)某病病死率某病病死率100l 某病患病人数某病患病人数l l 某期间某病死亡人数某期间某病死亡人数(4)某病死亡率某病死亡率1000l同期平均人口数同期平均人口数 第12页,讲稿共54张,创作于星期日l 某病治愈人数某病治愈人数(5)某病治

7、愈率某病治愈率100l治疗某病人数治疗某病人数 l 错误诊断人数错误诊断人数(6)误诊率误诊率100l 诊断某病人数诊断某病人数 第13页,讲稿共54张,创作于星期日l 漏诊人数漏诊人数(7)漏诊率漏诊率 100l某病患病人数某病患病人数 l带某病原体带某病原体(阳性结果阳性结果)人数人数(8)感染阳性率感染阳性率100l检查人数检查人数 第14页,讲稿共54张,创作于星期日 率的正确使用需要注意以下几点:率的正确使用需要注意以下几点:(1)分子为阳性数,分母为(阳性)分子为阳性数,分母为(阳性+阴性数)。阴性数)。(2)当当计计算算麻麻疹疹这这样样具具有有终终生生免免疫疫力力的的传传染染病病

8、发发病病率率时时,分分母母不不应应该该包包括括已已患患过过麻麻疹疹或或腮腮腺腺炎炎的的那那部分人。部分人。(3)率率只只与与本本身身的的频频率率或或强强度度有有关关,而而不不受受其其它它数数据据的的影影响响。如如某某地地红红眼眼病病的的流流行行不不会会导导致致该该地地肝肝癌癌死死亡亡率率下降或上升。下降或上升。第15页,讲稿共54张,创作于星期日关于率的几点说明(一)l分子和分母都是计数值,从定义上来看,分子应为分母的一部分,但在实际应用中一些率的指标可能并不符合率的定义,但它们是约定俗成、沿习使用的。l根据频率的稳定性,分母较大时,可以用率作为该事件发生机会(即概率)的近似值。例如:医治10

9、0例病人,90例痊愈,则:治愈率=90/100=90%。它近似的反映了病人治愈机会的大小。第16页,讲稿共54张,创作于星期日关于率的几点说明(二)l0 rate1l率常以百分率(%)、千分率()、万分率(1万)、十万分率(l10万)等表示。l比例基数(K)可以是100、1000、,其选取是根据习惯用法和需要选用,主要使算得的率至少保留12位整数,便于阅读。患病率、发病率、感染率:百分率(%)人口出生率与死亡率:千分率()肿瘤死亡率:十万分率(l10万)第17页,讲稿共54张,创作于星期日2.比(1)构成比(百分比、结构相对数)表示某现象内部各个构成部分所占的比重。某一构成部分的数量构成比=1

10、00%各构成部分数量之和 第18页,讲稿共54张,创作于星期日设某事物个体数的合计由设某事物个体数的合计由A A1 1,A A2 2,Ak k个部分组成,构成比计算为:第19页,讲稿共54张,创作于星期日构成比的特点:l同一事物内部的同一事物内部的k个组成部分构成比总和为个组成部分构成比总和为100%。l各部分构成比之间是相互影响的,某一部分比重的各部分构成比之间是相互影响的,某一部分比重的变化受到两方面因素的影响:其一是这个部分自身变化受到两方面因素的影响:其一是这个部分自身数值的变化,其二受其他部分数值变化的影响。数值的变化,其二受其他部分数值变化的影响。第20页,讲稿共54张,创作于星期

11、日第21页,讲稿共54张,创作于星期日第22页,讲稿共54张,创作于星期日例 资料见表,计算患病率及病人数百分比。表 某市工人中冠心病调查资料年龄 检查人数 病人数 病人数百分比(%)患病率(%)30-850 9 40-800 2750-750 54 60-195 25合计合计 2595 115 7.8 1.1 23.5 3.4 47.0 7.2 21.7 12.8100.0 4.4第23页,讲稿共54张,创作于星期日率与构成比率与构成比率率构成比构成比概念概念发生的频率或发生的频率或强度强度各组成部分所占各组成部分所占的比重的比重强调点强调点随机发生事件随机发生事件各部分的构成各部分的构成资

12、料获得资料获得较难较难容易容易特点特点不一定不一定合计为合计为100100第24页,讲稿共54张,创作于星期日(2 2)相对)相对比l相对比相对比(ratio),是,是 A、B两个有关指标之比。两个有关指标之比。l说明说明A为为B的若干倍或百分之几,它是对比的最的若干倍或百分之几,它是对比的最简单形式。简单形式。A、B两个指标可以是绝对数,也可两个指标可以是绝对数,也可以是相对数;可以性质相同,也可以性质不同;以是相对数;可以性质相同,也可以性质不同;可以是定性资料,也可以是定量资料。可以是定性资料,也可以是定量资料。第25页,讲稿共54张,创作于星期日人口统计中常用的比的指标l受精时性别比受

13、精时性别比(第一性比例第一性比例)一般为一般为110 170,平均,平均120;出生时性;出生时性别比别比(第二性比例第二性比例)绝大多数国家为绝大多数国家为103 107,平均,平均106;婚龄期;婚龄期性别比性别比(第三性比例第三性比例)约为约为100;性别比性别比(sex ratio)又称性比例,是指男性人口与女性人口的又称性比例,是指男性人口与女性人口的比值。比值。第26页,讲稿共54张,创作于星期日相对比的种类相对比的种类l2.2.两个率之比两个率之比 l某地某年龄组男性吸烟和非吸烟的冠心某地某年龄组男性吸烟和非吸烟的冠心病死亡资料下表所示病死亡资料下表所示,试分析其相对危害试分析其

14、相对危害度。度。分组分组死亡数死亡数 观察人年数观察人年数 死亡率(死亡率(1/101/10万人年)万人年)吸烟组吸烟组 104 43248 240.5104 43248 240.5 非吸烟组非吸烟组 12 10673 112.412 10673 112.4第27页,讲稿共54张,创作于星期日RRRR=240.5=240.5112.4=2.139 112.4=2.139 说明男性吸烟的冠心病死亡率是不吸说明男性吸烟的冠心病死亡率是不吸烟的死亡率的烟的死亡率的2.1392.139倍。这种指标在流行倍。这种指标在流行病学研究中称为相对危险度病学研究中称为相对危险度(relative(relativ

15、e riskrisk简写为简写为RR RR)。第28页,讲稿共54张,创作于星期日相对比的种类相对比的种类l3.3.两个相对比之比两个相对比之比 l 临床医生欲探索某病的病因,在以医院病例为基础作病例对照研究临床医生欲探索某病的病因,在以医院病例为基础作病例对照研究时,一般不能计算出时,一般不能计算出RRRR,但可以计算出疾病组暴露比数与对照组暴露比数,但可以计算出疾病组暴露比数与对照组暴露比数之比,称之为比数比或优势比(之比,称之为比数比或优势比(odds ratioodds ratio简写为简写为OROR)l服用反应停与肢体缺陷关系病例对照研究服用反应停与肢体缺陷关系病例对照研究服用反应停

16、畸型儿组对 照 组合计 使 用 未使用 34(a)16(c)2(b)88(d)36 104 合 计 50 90 140第29页,讲稿共54张,创作于星期日本例本例 第30页,讲稿共54张,创作于星期日正确应用相对数(一)l计算相对数的分母不宜过小计算相对数的分母不宜过小 例数较少,相对数波动较大。如:0/2,1/2,2/2例数较少时,宜用绝对数表示,必须用相对数时,可同时列出其可信区间。二 相对数使用应注意的问题第31页,讲稿共54张,创作于星期日l分析时不能以构成比代替率分析时不能以构成比代替率率反映的是频率或者强度构成比反映的是比重或分布正确应用相对数(二)第32页,讲稿共54张,创作于星

17、期日正确应用相对数(三)l正确计算合并率正确计算合并率对观察单位数不等的几个率,不能直接相加对观察单位数不等的几个率,不能直接相加求其平均率求其平均率(或称总率或称总率)例如用某疗法治疗肝炎,第一次治疗例如用某疗法治疗肝炎,第一次治疗150150人,治愈人,治愈3030人,治愈率人,治愈率20%20%;第二次治疗;第二次治疗100100人,治愈人,治愈3030人,人,治愈率治愈率30%30%。试计算两批的合并治愈率。试计算两批的合并治愈率。第33页,讲稿共54张,创作于星期日正确应用相对数(四)l计算率时要注意资料的同质性计算率时要注意资料的同质性l对比分析时应注意资料的可比性对比分析时应注意

18、资料的可比性 v所谓可比,就是说除了要对比的因素外(如不同药物),其余的影响因素应尽可能的相同、相似或接近。观察对象同质,研究方法相同,观察时间相等,以及地区、周围环境、风俗习惯和经济条件应一致或相近。观察对象内部构成内部构成是否相同,若两组资料的年龄、性别构成不同,可以分组或进行标准化后再作比较。第34页,讲稿共54张,创作于星期日正确应用相对数(五)l样本率或构成比比较时,不能仅凭表面上的数值大小下结论,应考虑到其抽样抽样误差误差,进一步作统计学处理。第35页,讲稿共54张,创作于星期日例题:下表为一抽样研究资料,作如下分析:例题:下表为一抽样研究资料,作如下分析:l填补空白;填补空白;l

19、对(对(5 5)()(6 6)()(7 7)栏做简要分析;)栏做简要分析;l比较比较2020岁于岁于4040岁年龄组死亡率由无差别?岁年龄组死亡率由无差别?第36页,讲稿共54张,创作于星期日年龄年龄 人口数人口数 死亡总数死亡总数 恶性肿瘤恶性肿瘤 恶性肿瘤死亡恶性肿瘤死亡 恶性肿瘤死亡恶性肿瘤死亡 年年龄别死亡龄别死亡(1)(2)(3)死亡总数死亡总数 占总死亡的占总死亡的%率(率(1/10万)万)率(率()(4)(5)(6)(7)0-82920 138 4 2.90 4.82 1.6620-46638 63 12 19.05 25.73 1.3540-28161 172 42 24.42

20、 149.14 6.1160-9371 342 32 9.36 341.48 36.50合计合计 167090 715 90 12.59 53.86 4.28某地各年龄组恶性肿瘤死亡情况某地各年龄组恶性肿瘤死亡情况第37页,讲稿共54张,创作于星期日年龄年龄 人口数人口数 死亡总数死亡总数 恶性肿瘤恶性肿瘤 恶性肿瘤死亡恶性肿瘤死亡 恶性肿瘤死亡恶性肿瘤死亡 年年龄别死亡龄别死亡(1)(2)(3)死亡总数死亡总数 占总死亡的占总死亡的%率(率(1/10万)万)率(率()(4)(5)(6)(7)0-82920 138 4 2.90 4.82 1.6620-46638 63 12 19.05 25

21、.73 1.3540-28161 172 42 24.42 149.14 6.1160-9371 342 32 9.36 341.48 36.50合计合计 167090 715 90 12.59 53.86 4.28某地各年龄组恶性肿瘤死亡情况某地各年龄组恶性肿瘤死亡情况第38页,讲稿共54张,创作于星期日三三 率的标准化法率的标准化法目的:目的:用用统一的标准统一的标准(如年龄别人口数、(如年龄别人口数、年龄别人口构成比、年龄别人死亡率)年龄别人口构成比、年龄别人死亡率),消除,消除内部构成不同内部构成不同对平均率所产生对平均率所产生的影响,使两组平均率具有的影响,使两组平均率具有可比性可比

22、性。第39页,讲稿共54张,创作于星期日第40页,讲稿共54张,创作于星期日一)、方法的选择 1.直接法:各小组率已知,各小组观直接法:各小组率已知,各小组观察数或构成作为标准察数或构成作为标准 2.间接法:各小组观察数或构成,以间接法:各小组观察数或构成,以及平均率已知,以各小组率作为标及平均率已知,以各小组率作为标准准第41页,讲稿共54张,创作于星期日二)、标准的选取 1 选一个具有代表性的、内部构成相选一个具有代表性的、内部构成相对稳定的较大人群作为标准对稳定的较大人群作为标准 2.将要比较的两组资料内部各相应小将要比较的两组资料内部各相应小组的观察单位数相加作为标准组的观察单位数相加

23、作为标准 3.从要比较的两组中任选一组作为标从要比较的两组中任选一组作为标准。准。第42页,讲稿共54张,创作于星期日直接法(各小组出院人数合计为标准)第43页,讲稿共54张,创作于星期日直接法(各小组出院人数构成为标准)第44页,讲稿共54张,创作于星期日应用标准化时的注意事项l标准化率的应用价值标准化率的应用价值l仅限于相互比较,不反映具体的实际水平。l要反映实际情况,则需用未标化前的率。第45页,讲稿共54张,创作于星期日应用标准化时的注意事项l标准化率的适用范围标准化率的适用范围仅适用于某因素两组内部构成不同,并有可能影响两组总率的比较,对于因其他条件不同而产生的不可比性问题,标准化率

24、不能解决。第46页,讲稿共54张,创作于星期日应用标准化时的注意事项l标准化率也有抽样误差标准化率也有抽样误差两样本标准化率作比较时,当样本含量较小时,还应作假设检验第47页,讲稿共54张,创作于星期日表表 两矿工人尘肺患病比较两矿工人尘肺患病比较工龄工龄(年)(年)甲甲矿矿乙乙矿矿检查检查 人人数数尘肺尘肺 人人数数患病率患病率(%)检查检查 人人数数尘肺尘肺 人人数数患病率患病率(%)6140261200.86 99220.20610 428525421683163.9212.431905101481170.4211.54合计合计208566042.9039111273.25第48页,讲稿

25、共54张,创作于星期日四四 动态数列动态数列l动态数列(动态数列(dynamic seriesdynamic series):一系列按):一系列按时间顺序排列起来的统计指标,用以观察时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。和比较该事物在时间上的变化和发展趋势。第49页,讲稿共54张,创作于星期日常用指标:常用指标:增长量增长量:分为累积增长量、逐年增长量:分为累积增长量、逐年增长量定基比定基比:统一用某个时间的指标作基数以各:统一用某个时间的指标作基数以各时间的指标分别与之对比。时间的指标分别与之对比。环比环比:依次用前一个时间的指标作基数,以:依次用前一个时

26、间的指标作基数,以相邻的后一个时间的指标与之对比。相邻的后一个时间的指标与之对比。第50页,讲稿共54张,创作于星期日增长速度增长速度=发展速度发展速度1a0a1a2a3a4第51页,讲稿共54张,创作于星期日平均发展速度与平均增长速度平均发展速度与平均增长速度l平均发展速度:各环比发展速度的几何平均数,平均发展速度:各环比发展速度的几何平均数,表示逐期平均发展的速度表示逐期平均发展的速度 l平均增长速度:各环比增长速度的平均数,表示平均增长速度:各环比增长速度的平均数,表示逐期平均增长的速度逐期平均增长的速度第52页,讲稿共54张,创作于星期日l平均发展速度(平均每年相当于前一年的平均发展速度(平均每年相当于前一年的1.188 1.188 倍)倍)l平均增长速度:平均增长速度:平均增长速度平均增长速度=1.188-1=0.188=1.188-1=0.188l根据平均发展速度进行预测根据平均发展速度进行预测 如预测如预测19951995年的次均费用为:年的次均费用为:第53页,讲稿共54张,创作于星期日感感谢谢大大家家观观看看10/17/2022第54页,讲稿共54张,创作于星期日

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁