医学统计学第二章.pptx

上传人:莉*** 文档编号:87218341 上传时间:2023-04-16 格式:PPTX 页数:52 大小:543.77KB
返回 下载 相关 举报
医学统计学第二章.pptx_第1页
第1页 / 共52页
医学统计学第二章.pptx_第2页
第2页 / 共52页
点击查看更多>>
资源描述

《医学统计学第二章.pptx》由会员分享,可在线阅读,更多相关《医学统计学第二章.pptx(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、原始资料杂乱无章【例2.1】2011年某市120名7岁男童身高(cm)资料如下,试编制频数表。第1页/共52页分类资料的整理列出类别,计算频数,列表第2页/共52页2.1 频数表资料整理的必要性 条理化,系统化,显示数量特征、分布规律,便于进一步统计分析数值变量资料的整理第3页/共52页2.1.1.频数表的编制【例2.1】2011年某市120名7岁男童身高(cm)资料如下,试编制频数表。第4页/共52页频数表的编制方法如下:(1)找出观察值中的最大值和最小值,并求出极差极差(2)决定组段数、组段和组距 确定组段数要以充分反映数据的分布特征为原则 组距26.6/102.66可以参考斯特奇斯(St

2、urges)提出的经验公式来确定分组数第5页/共52页(3)列表划记:计算各组段包含的观察单位个数第6页/共52页2.1.2 频数分布的图示 图2.1 2011年某地120名7岁男童身高的频数分布 第7页/共52页2.1.3.频数分布的分析对频数表的分析,主要在于以下几个方面:(1)有无可疑值 通过对频数分布的分析,发现某些特大或特小的离 群值、可疑值(2)分布的类型 频数分布可分为对称分布和偏态分布两种类型.不同类型的分布,应采用不同的统计分析方法 第8页/共52页对称分布,是指观察值向中央部分集中,以中等数据居多,左右两侧分布大体对称。如:正常人身高、体重,脉搏,血红蛋白等的分布对称分布对

3、称分布对称分布 第9页/共52页所谓偏态分布,是指观察值偏离中央 尾部偏向数轴正侧(或右侧),称正偏态(或右偏态);如:食物中毒引起腹泻的潜伏期尾部偏向数轴负侧(或左侧),称负偏态(或左偏态)如:慢性病患者年龄的分布 左偏态左偏态左偏态 右偏态右偏态右偏态第10页/共52页(3)分布特征 分布的两个重要特征:集中趋势和离散趋势 总体中的个体总是具有同质性,这些同质性使得观察值应趋向同一数值(即集中趋势)。同一总体中的个体之间又普遍存在着各种差别,使得个体观察值不会完全相同。第11页/共52页2.2 集中趋势的描述平均数反映一组观察值的集中趋势、中心位置或平均水平它是该组数据的代表,能对一群同类

4、事物或现象的数量特征作出概括的说明,是统计学中应用最广泛、最重要的一个指标体系。常用的平均数有(算术)均数,几何均数和中位数 第12页/共52页2.2.1 均数均数 均数是算术均数的简称,习惯上用希腊字母 表示总体均数;用 表示样本均数。均数反映一组观察值在数量上的平均水平,最适合单峰对称分布资料的平均水平的描述。1)未分组资料(原始资料)的均数的计算方法:将所有的观察值直接相加,再除以总观察数n第13页/共52页第14页/共52页【例 2.3】求表2.1中资料的均数第15页/共52页2.2.2 几何均数几何均数 有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数

5、变化(等比关系),算术均数对这类资料集中趋势的代表性就差,这时宜用几何均数反映其平均增(减)倍数。几何均数一般用G表示,适用于各变量值之间成倍数关系,但作对数变换后指标成单峰对称分布的资料。第16页/共52页第17页/共52页【例例2.4】5人的血清抗体滴度分别为1:10,1:20,1:40,1:40,1:160,求平均滴度。第18页/共52页第19页/共52页【例例2.5】某地107人接种疫苗后抗体滴度见表2.2第(1)(2)栏,求平均滴度。表表2.2 107例试验受试者免疫后麻疹例试验受试者免疫后麻疹HI抗体滴度及平均滴度计算抗体滴度及平均滴度计算第20页/共52页计算几何均数时注意变量值

6、中不能有0,因为0与任何数的乘积均为0,且0不能取对数。同一组变量值不能同时存在正、负值。若变量值全为负值,可在计算时将负号除去,算出结果后再冠以负号 第21页/共52页2.2.3 中位数与百分位数 资料是偏态分布的,资料中的少数数据过分偏大(或偏小),分布不规则,一端或两端有不确定数据(开口资料)时,用中位数表示他们的集中趋势比算术均数合理。中位数(median,简记为M)是将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数第22页/共52页百分位数(percentile)是一种位置指标,以 表示,一个百分位数 将总体或样本的全部观察值分为两个部分,理论上有X的观察值比 小,有(10

7、0-X)观察值比 大第23页/共52页中位数和均值的关系中位数和均值的关系左偏分布左偏分布左偏分布均值均值均值 中位数中位数中位数 对称分布对称分布对称分布 均值均值均值=中位数中位数中位数右偏分布右偏分布右偏分布 中位数中位数中位数 均值均值均值第24页/共52页中位数与百分位数的计算(1)未分组资料的中位数计算法 设个观察值X1,X2,Xn已按从小到大的顺序排列,则:【例2.6】9名沙门菌食物中毒患者的潜伏期(小时)为:2,5,9,12,14,15,18,24,60。求其中位数。第25页/共52页【例2.7】8名杆菌痢疾治愈者的住院天数如下,求其中位数。4,9,10,12,14,20,24

8、,61第26页/共52页(2)分组资料的中位数和百分位数计算法 百分位数的计算公式:第27页/共52页第28页/共52页第29页/共52页2.3 离散程度的描述【例2.9】三组同性别、同年龄儿童的体重(kg)如下,试分析其集中趋势和离散程度。甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34 第30页/共52页三组的的均数相同,但显然5个数据间参差不齐的程度是不一样的。二者结合,才能全面认识事物。描述离散程度的指标有极差、四分位数间距、方差、标准差及变异系数 第31页/共52页2.3.1.极差极差(range,记为R)亦称全距。即一组数据

9、中最大值与最小值之差。反映个体的变化范围。极差大,说明变异度大;反之,说明变异度小 优点:优点:计算简单,意义明确。缺点:缺点:1.除了最大值和最小值外,不能反映组内其它数据的变异程度;2.样本例数悬殊时不宜比较极差;3.抽样误差较大,极不稳定。第32页/共52页2.3.2 四分位数间距四分位数四分位数(quartile,记为Q),是特定的百分位数,即P25(下四分位数)和P75(上四分位数)四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差 QQUQL 四分位数间距可看成中间一半观察值的极差第33页/共52页用四分位数间距反映变异程度的大小 优点:优点:比

10、极差稳定,缺点:缺点:但仍未考虑全部观察值的变异程度。适用场合:如集中趋势用中位数描述,则相应的离散趋势用四分位数间距描述。第34页/共52页2.3.3 方差与标准差离均差:总体中每个变量值X与总体均数之差,X-,称为离均差 离均差平方和:将离均差平方后再相加,得(X-)2,称为离均差平方和(sum of squares),其除了与变异度有关,还与变量值的个数N有关。总体方差:第35页/共52页方差的度量单位是原变量值度量单位的平方总体标准差:方差标准差越大说明个体的变异度越大;反之,说明个体的变异度就越小第36页/共52页样本标准差s:实际计算时用公式:第37页/共52页分组资料用公式:第3

11、8页/共52页2.3.4.相对离散度相对离散度为什么要引进相对离散度?常用的相对离散度指标有:极差与中位数之比;四分位数间距(QU-QL)与(QU+QL)之比;而最常用的是变异系数(coefficient of variation,记为CV)。变异系数(离散系数):主要用于:1.度量衡单位不同的几组资料间的比较 2.均数相差悬殊的几组资料间的比较 第39页/共52页注解:第40页/共52页2.4 分类资料的率和比分类资料常用的描述性指标是相对数第41页/共52页2.4.1 比(相对比)比亦称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几。比A/B例如:新生婴儿(全人口)性别比,

12、医护比,病床数与医护人员之比,医院的门诊人数与病床数之比,发展速度和增长速度等等。第42页/共52页2.4.2 2.4.2 构成比 说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,计算公式为:如:班级女生比例,不及格比例,死因构成比第43页/共52页2.4.3 2.4.3 率u如:流感发生有季节性;南部非洲是爱滋病的重灾区,说明现象发生的强度是有差异的说明某现象发生的频率或强度.常以百分率()、千分率()、万分率(1/万)、十万分率(1/10万)等表示。计算公式为:比例基数的选取:至少保留一二位整数医学中有些频率指标的定义并不符合率的定义第44页/共52页2.4.4.2.4.4.应

13、用相对数时应注意的问题1.1.计算相对数的分母不宜过小 原理:频率的稳定性 实际应用中,如果观察例数小于20时,都不宜计算相对数。发生率的大小对抽样研究中的样本的大小有指导意义 设计的周密程度,实验条件的严格控制不同时对研究对象的例数要求不同2.2.分析时不能以构成比代替率(强度相对数)构成比(构成相对数)只能说明事物各组成部分的比重,并不说明某现象发生的频率或强度第45页/共52页3.当各分组的观察单位数不等时,不能直接将各分组的率相加求其平均而成为总率 4.对比时应注意资料的可比性 除研究因素外,其他的重要影响因素应相同或相近观察对象同质,时间相近,研究方法相同,以及地区、民族等客观条件一

14、致 其它影响因素在各组的内部构成应相近第46页/共52页2.4.5 2.4.5 标准化法(1)(1)标准化法的概念 当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影响指标水平的重要特征在构成上不同,往往会造成总率的上升或下降,在这种情况下,冒然进行两总率的比较,会产生错误的结论,此时,必须设法消除这种内部构成上的差别,才能进行比较。统计学上特将这种方法称为率的标准化,即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,调整后的率为标准化率,简称为标化率,亦称调整率。第47页/共52页第48页/共52页第49页/共52页第50页/共52页3)标准组的选取 应选择有代表性的、较稳定的、来自数量较大的人群的指标 合并的数据也是常用的标准组4)标准化的目的是为了进行合理的比较,其使用价值仅限于相互比较时判明孰大孰小的相对关系。第51页/共52页谢谢您的观看!第52页/共52页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁