常用医学统计方法ppt课件.ppt

上传人:飞****2 文档编号:92228610 上传时间:2023-06-01 格式:PPT 页数:205 大小:1.41MB
返回 下载 相关 举报
常用医学统计方法ppt课件.ppt_第1页
第1页 / 共205页
常用医学统计方法ppt课件.ppt_第2页
第2页 / 共205页
点击查看更多>>
资源描述

《常用医学统计方法ppt课件.ppt》由会员分享,可在线阅读,更多相关《常用医学统计方法ppt课件.ppt(205页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章第四章 常用医学统计方法常用医学统计方法 主要内容主要内容第一节第一节 医学统计学基本概念医学统计学基本概念第二节第二节 医学统计学工作基本步骤医学统计学工作基本步骤第三节第三节 计量资料统计分析计量资料统计分析第四节第四节 计数资料统计分析计数资料统计分析第五节第五节 非参数检验非参数检验第六节第六节 直线相关与直线回归直线相关与直线回归第七节第七节 统计表与统计图统计表与统计图第八节第八节 常见统计学方法误用常见统计学方法误用第一节第一节 医学统计学基本概念医学统计学基本概念一、变量二、同质与变异三、总体与样本四、参数与统计量五、误差六、频率与概率一、变量一、变量 在医学研究中,需要

2、根据研究目的对研究对象的某种或某些特征进行观测和记录,这些特征(指标或属性)称为变量(variable),又称观察指标,如人的年龄、体重、身高、血型和疾病的分期等 变量的观察结果或测定值称为变量值(value of variable)一、变量一、变量(一)数值变量(一)数值变量 数值变量(numerical variable)又称定量变量,其变量值是用定量方法测量的,通常具有一定的度量衡单位1.连续型变量2.离散型变量一、变量一、变量(二)分类变量(二)分类变量 分类变量(categorical variable)又称定性变量或名义变量,其变量值是用定性方法得到的。通常按事物的属性或类别进行分

3、类,然后清点个数所得到的数值,如性别、血型、职业等1.无序分类变量2.有序分类变量一、变量一、变量(二)分类变量(二)分类变量1.1.无序分类变量无序分类变量 无序分类变量的属性或类别之间没有程度和顺序的差别,按照属性或类别的数目又可分为(1)二项分类变量:如性别(男、女)、疾病(无、有)、过敏反应(阴性、阳性)等(2)多项分类变量:如血型(A、B、AB、O)、职业(工、农、商、学、兵等)、民族(汉、回、蒙、满等)等2.2.有序分类变量有序分类变量 又称等级变量 一、变量一、变量(三)变量的转化(三)变量的转化 在实际工作中,根据研究目的和统计分析方法的具体要求,各种不同的变量间可以转化 变量

4、可从高级向低级转化 定量有序多项分类二项分类 但不能做反方向的转化二、同质与变异二、同质与变异 同质(homogeneity)指被研究的事物在某些性质上相同,它是进行研究的前提 变异(variation)指在同质基础上的个体之间的差异,如同地区、年龄、性别、民族的健康儿童的身高、体重不尽相同三、总体与样本三、总体与样本 总体(population)是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位观察值(变量值)的集合 样本(sample)是从总体中随机抽取具有代表性的一部分个体。实际工作中,经常用样本信息来推断总体特征 四、参数与统计量四、参数与统计量 参数(paramet

5、er)是根据总体分布特征计算的统计指标,用希腊字母表示 统计量(statistic)是从总体中随机抽取样本,对样本观测数据进行统计分析所得的统计指标。统计量用英文字母表示 五、误差五、误差 误差(error)指观察值与真值之间的差别,统计学中的误差指样本统计量与总体参数之间的差别1.系统误差2.随机测量误差3.随机抽样误差六、频率与概率六、频率与概率 频率(frequency):在相同条件下重复进行某试验,一个事件出现的次数和试验次数之比,称为这个事件在这次试验中出现的频率 概率(probability):当试验次数很大时,该频率将趋近于一个较稳定的常数,这个常数即该事件发生的概率 小概率事件

6、特指发生概率P0.05或P0.01的事件,即发生的可能性很小 第二节第二节 医学统计学工作基本步骤医学统计学工作基本步骤一、设计二、收集资料三、整理资料四、统计分析和表达一、设计一、设计 设计(design)是医学统计工作的首要环节,是决定医学科研成败的关键。设计是对医学科研的 总体规划和安排,一般包括专业设计和统计设计 二、收集资料二、收集资料1.统计报表和统计年鉴 如传染病报表、疾病监测报表、医院年度统计报表、国家卫生部编制的卫生统计年鉴等2.登记和报告卡 如传染病发病报告卡、出生报告卡、死亡报告卡等3.医疗卫生的日常工作记录 如门诊病历、住院病历、化验报告等4.专题研究 通过专门的调查或

7、实验收集数据 三、整理资料三、整理资料 整理资料(date sorting)的目的是把杂乱无章的原始资料系统化、条理化,便于进一步计算统计指标和分析。资料整理的过程如下(一)核查资料(二)数据录入(三)设计分组与汇总四、统计分析和表达四、统计分析和表达 统计分析包括统计描述和统计推断 统计描述是运用统计指标、统计表和统计图对资料的数量特征和分布规律进行描述 统计推断包括参数估计和假设检验 第三节第三节 计量资料统计分析计量资料统计分析一、计量资料的频数分布二、计量资料的统计描述三、计量资料的统计推断一、计量资料的频数分布一、计量资料的频数分布(一)频数分布表(一)频数分布表 某地2009年测量

8、102名成年男性的血红蛋白(g/L),数据如下,试编制血红蛋白的频数表1091091301301431431181181371371581581181181031031251251381381211211351351521521301301111111241241441441221221361361531531291291161161281281381381231231331331571571241241151151291291411411191191311311521521271271131131281281431431201201321321551551261261171171341341

9、421421321321351351561561301301171171331331391391371371311311541541251251211211311311461461351351331331531531291291491491351351461461431431311311601601271271471471411411451451421421331331621621371371481481411411471471381381321321611611451451511511401401501501401401441441731731471471501501391391451451

10、42142138138150150148148140140142142145145151151一、计量资料的频数分布一、计量资料的频数分布(一)频数分布表(一)频数分布表1.1.频数分布表的编制频数分布表的编制 (1)计算极差R(range)极差也称全距,是指全部观察值中最大值与最小值之差 本例极差R173-10370(g/L)一、计量资料的频数分布一、计量资料的频数分布(一)频数分布表(一)频数分布表1.1.频数分布表的编制频数分布表的编制(2)确定组数、组距及组段 组数要适当,一般在1015组之间选择 本例组距=70/10=7(g/L)(3)汇总各组段的频数 采用计算机汇总或用手工划记法,

11、得到各组段内的观察值个数即频数,将各组段与相应频数列表 组段(组段(1 1)频数(频数(2 2)103103 2 2110110 4 411711710101241241515131131202013813821211451451717152152 9 9159159 3 3 166 166173173 1 1合计合计102102 一、计量资料的频数分布一、计量资料的频数分布(一)频数分布表(一)频数分布表 2.2.频数分布表的用途频数分布表的用途(1)描述频数的分布类型和分布特征(2)便于进一步计算有关指标或进行统计分析(3)异常值的识别(4)绘制频数分布图 一、计量资料的频数分布一、计量资

12、料的频数分布(二)频数分布的类型(二)频数分布的类型 频数分布的类型有对称分布和偏态分布两种 对称分布是指集中位置在中间,左右两侧的频数分布基本对称 偏态分布是指集中位置偏向一侧,频数分布不对称,可分为正偏态(positive skewness)和负偏态(negative skewness)两种分布类型对称分布对称分布正偏态分布正偏态分布负偏态分布负偏态分布二、计量资料的统计描述二、计量资料的统计描述 (一)集中趋势的描述(一)集中趋势的描述 平均数(average)是一类用于描述计量资料集中趋势的统计指标 常用的平均数有算术平均数、几何均数、中位数及众数二、计量资料的统计描述二、计量资料的统

13、计描述(一)集中趋势的描述(一)集中趋势的描述 1.1.算术平均数算术平均数(mathematic mean)简称均数(mean),用 表示样本均数,用希腊字母 表示总体均数。均数用来描述一组观察值的平均水平,适用于对称分布资料,特别是正态或近似正态分布的资料 (一)集中趋势的描述(一)集中趋势的描述 1.1.算术平均数(算术平均数(mathematic meanmathematic mean)(1 1)直接法)直接法 将所有原始观察值直接相加后,再除以观察值的个数 7例成年男性的血红蛋白含量(g/L)为120,126,128,129,131,134,135,计算其均数 (一)集中趋势的描述(

14、一)集中趋势的描述 1.1.算术平均数(算术平均数(mathematic meanmathematic mean)(2 2)加权法)加权法(weight method)用于相同观察值较多时,是将相同观察值的例数乘以该观察值,以替代相同观察值的逐个相加。(一)集中趋势的描述(一)集中趋势的描述 1.1.算术平均数(算术平均数(mathematic meanmathematic mean)(3 3)均数的两个重要特性)均数的两个重要特性 1)样本中各观察值与其均数差值(简称离均差)的总和等于0,即 2)样本中各观察值与其均数的差值平方和 小于各观察值与任意其他数值的差值平方和,即离均差平方和最小

15、(一)集中趋势的描述(一)集中趋势的描述 2.2.几何均数(几何均数(geometric meangeometric mean)简记为G,适用于各观察值之间呈倍数变化(等比关系)的资料,或频数分布呈偏态分布、但经对数变换后呈正态分布或近似正态分布的资 料 (一)集中趋势的描述(一)集中趋势的描述 2.2.几何均数(几何均数(geometric meangeometric mean)(1 1)直接法)直接法 将所有原始观察值连乘后再开n次方 或或5名男子接种某疫苗后,抗体滴度水平为1:2,1:4,1:8,1:16,1:32,计算其几何均数 此例的几何均数为1:8(一)集中趋势的描述(一)集中趋势

16、的描述 2.2.几何均数(几何均数(geometric meangeometric mean)(2 2)加权法()加权法(weight methodweight method)当相同观察值的例数较多时,可用加权法计算几何均数。(一)集中趋势的描述(一)集中趋势的描述 3.3.中位数和百分位数中位数和百分位数 中位数(median)简记为 ,将一组观察值按照由小到大的顺序排列,位置居中的数值即为中位数 中位数常用于偏态分布及一端或两端无确切值的开口资料(一)集中趋势的描述(一)集中趋势的描述 3.3.中位数和百分位数中位数和百分位数 百分位数(percentile,)是一种位置指标,用于描述样本

17、或总体观察值序列某百分位置的水平。中位数是个特殊的百分位数,即第50百分位数 (一)集中趋势的描述(一)集中趋势的描述 3.3.中位数和百分位数中位数和百分位数(1 1)中位数的直接计算法)中位数的直接计算法首先将观察值按照由小到大的顺序排列n为奇数时:n为偶数时:(一)集中趋势的描述(一)集中趋势的描述 3.3.中位数和百分位数中位数和百分位数(2 2)中位数及百分位数频数表计算法)中位数及百分位数频数表计算法 当观察值较多时,应先编制频数表,再按频数表计算中位数及百分位数。二、计量资料的统计描述二、计量资料的统计描述(二)(二)离散趋势的描述离散趋势的描述 常用的离散趋势指标有极差、四分位

18、数间距、方差、标准差及变异系数二、计量资料的统计描述二、计量资料的统计描述(二)(二)离散趋势的描述离散趋势的描述1 1极差(极差(rangerange)也称全距,是一组观察值中最大值与最小值之差优点:计算极为简单缺点:(1)代表性较差 (2)不稳定极差通常与其他离散趋势的指标联合使用(二)(二)离散趋势的描述离散趋势的描述2 2四分位数间距(四分位数间距(quartile intervalquartile interval)上四分位数()与下四分位数()之差,用 来表示 四分位数间距包括了一组观察值居中的一半,故四分位数间距可被看作中间50观察值的极差 (二)(二)离散趋势的描述离散趋势的描

19、述3.3.方差(方差(variancevariance)反映一组数据的平均离散水平。总体方差 样本方差 (二)(二)离散趋势的描述离散趋势的描述4 4标准差(标准差(standard deviationstandard deviation)由于方差的度量衡单位是原单位的平方,与原始资料不一致,因此将方差开方后可得到总体标准差 和样本标准差(1 1)极差只能反应最大值与最小值的差异,而标准)极差只能反应最大值与最小值的差异,而标准差则充分利用了全部观察值。差则充分利用了全部观察值。(2 2)三组资料的均数相同,而标准差均有差异,说)三组资料的均数相同,而标准差均有差异,说明在对计量资料进行描述时

20、,必须将集中趋势指标与明在对计量资料进行描述时,必须将集中趋势指标与离散趋势指标结合才能充分体现资料的分布特征。离散趋势指标结合才能充分体现资料的分布特征。(二)(二)离散趋势的描述离散趋势的描述5 5变异系数(变异系数(coefficient of variationcoefficient of variation)又称离散系数,简记为CV 主要用于比较两组(或多组)度量衡单位不同或均数相差悬殊资料间的变异程度 某地调查了80名10岁男孩身高的均数为138cm,标准差为5cm;体重均数为38kg,标准差为5kg,试比较该地10岁男孩身高和体重的变异程度 身高的变异系数:体重的变异系数:二、计

21、量资料的统计描述二、计量资料的统计描述(三)(三)正态分布及其应用正态分布及其应用 正态分布是生物医学和统计学上极其重要的一种正态分布是生物医学和统计学上极其重要的一种分布,人体很多指标都服从或近似服从正态分布,分布,人体很多指标都服从或近似服从正态分布,在统计学上,很多分布都是由正态分布导出,同时在统计学上,很多分布都是由正态分布导出,同时正态分布又是多种分布的极限分布正态分布又是多种分布的极限分布(三)(三)正态分布及其应用正态分布及其应用1.1.正态分布及其特征正态分布及其特征(1 1)正态分布)正态分布直方图随着样本量增加逐渐退化为正态曲线 如上图所示,当样本量不断增大,组距可以不断细

22、分而缩小,直方图将逐渐接近一条光滑的曲线,即接近于近似正态曲线。当我们研究的样本量增加至总体时,其相应变量的分布即为正态分布,对应的曲线即正态分布曲线(三)(三)正态分布及其应用正态分布及其应用1.1.正态分布及其特征正态分布及其特征(1 1)正态分布)正态分布 正态分布曲线对应的函数表达式 任何一个正态分布都可以通过下式变换为标准正态分布 标准正态分布概率密度函数为(三)(三)正态分布及其应用正态分布及其应用1.1.正态分布及其特征正态分布及其特征(2 2)正态分布的特征和分布规律)正态分布的特征和分布规律 1)正态分布是一条单峰分布,高峰位置在均数处,即 =处,此时,等于 2)正态分布以均

23、数为中心,左右完全对称3)正态分布有两个参数,即位置参数 和形态参数 。越大,则曲线沿横轴向右移动,反之,则相反;小,则变异小,曲线表现为“瘦高”,反之,则曲线形态“矮胖”。(2 2)正态分布的特征和分布规律)正态分布的特征和分布规律 4)正态分布曲线下的面积分布具有一定的规律。正态分布曲线与横轴所夹面积为1区间在(,)内的面积或概率为0.90区间在(,)内的面积或概率为0.95区间在(,)内的面积或概率为0.99(三)(三)正态分布及其应用正态分布及其应用2.2.正态分布的应用正态分布的应用(1 1)制定医学参考值范围)制定医学参考值范围 (2 2)质量控制)质量控制 统计学规定:为警戒线

24、为控制线 2.2.正态分布的应用正态分布的应用(1 1)制定医学参考值范围)制定医学参考值范围 医学参考值范围是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标的波动范围,并作为判定某项指标正常还是异常的参考标准 2.2.正态分布的应用正态分布的应用(1 1)制定医学参考值范围)制定医学参考值范围 1)作用及意义 用以区分“正常”和“异常”个体,为临床诊断提供参考 可用以反映不同时间、地区人群某项指标的生理变迁2.2.正态分布的应用正态分布的应用(1 1)制定医学参考值范围)制定医学参考值范围 2 2)制定参考值范围的基本步骤)制定参考值范围的基本步骤确定“正常人”对象的范围

25、:即根据研究目的确定的未患有研究疾病的个体统一测定标准:即检验用的试剂批号、仪器、人员、条件等应相同确定分组:一般需用年龄、性别等对“正常人”对象进行分组2.2.正态分布的应用正态分布的应用(1 1)制定医学参考值范围)制定医学参考值范围 2 2)制定参考值范围的基本步骤)制定参考值范围的基本步骤样本含量确定:一般来讲,正态分布资料所需的样本含量应在100以上,偏态或未知分布时样本含量应更大确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧确定百分位点:一般取95%或99%2.2.正态分布的应用正态分布的应用(1 1)制定医学参考值范围)制定医学参考值范围3 3)参考值范围的

26、制定方法)参考值范围的制定方法正态分布法百分位数法三、计量资料的统计推断三、计量资料的统计推断(一)均数的抽样误差与总体均数的估计(一)均数的抽样误差与总体均数的估计1.1.均数的抽样误差与标准误均数的抽样误差与标准误 统计学上把由抽样造成的样本统计量与样本统计量之间、样本统计量与总体参数之间的差异称为抽样误差。抽样误差是不可避免的,对于计量资料,其大小可用样本均数的标准差来衡量 均数的标准差称为标准误(一)均数的抽样误差与总体均数的估计(一)均数的抽样误差与总体均数的估计1.1.均数的抽样误差与标准误均数的抽样误差与标准误 标准误越大,均数的抽样误差就越大,说明样本均数对总体均数的代表性越差

27、 三、计量资料的统计推断三、计量资料的统计推断(一)均数的抽样误差与总体均数的估计(一)均数的抽样误差与总体均数的估计2.2.t t分布分布 (一)均数的抽样误差与总体均数的估计(一)均数的抽样误差与总体均数的估计2.2.t t分布分布 实际工作中,由于 未知,用 代替,则 不再服从标准正态分布,而服从t分布 。(一)均数的抽样误差与总体均数的估计(一)均数的抽样误差与总体均数的估计2.2.t t分布分布 t t 分布的图形与特征分布的图形与特征 t t分布是一簇对称于0的单峰分布曲线。自由度越小,曲线的中间越低,两边越高;随自由度越大,t t分布曲线逼近标准正态分布曲线。t t分布曲线下面积

28、为95%或99%的界值不是一个常量,而是随自由度的大小而变化 三、计量资料的统计推断三、计量资料的统计推断(一)均数的抽样误差与总体均数的估计(一)均数的抽样误差与总体均数的估计3.3.总体均数的估计总体均数的估计(1)点估计(point estimation):即直接用样本均数作为总体均数的估计值。其优点是方法简单,缺点是未考虑抽样误差的影响(2)区间估计(interval estimation):在确定的(1-)下,样本均数符合分布的特点,利用分布曲线下的面积规律估计总体均数所在的区间,称为可信区间(confidence interval,CI),可信度常取95%或99%未知,小样本资料总

29、体均数的可信区间:当n较小时(n100),一般按照分布原理,计算方法如下:测得某地9名成年男性总胆固醇的均数为5.5mmol/L,标准差为0.9mmol/L,估计该地成年男性总胆固醇总体均数的95%(5.5-2.306x0.3,5.5+2.306x0.3)=(4.8,6.2)已知:未知,但足够大:测得某地102名成年人血红蛋白的均数为137.5g/L,标准差为13.2g/L,估计该地成年人血红蛋白总体均数的95%CI(137.5-1.96x1.31,137.5+1.96x1.31)=(134.9,140.1)三、计量资料的统计推断三、计量资料的统计推断(二)假设检验概述(二)假设检验概述 假设

30、检验(hypothesis testing)也称显著性检验(significance test),就是先对总体的参数或分布作出某种假设,如假设总体均数(或率)为一定值;两总体均数(或率)相等;总体服从正态分布或两总体分布相同等,然后根据样本信息选用适当的统计方法,推断假设应当拒绝或不拒绝 三、计量资料的统计推断三、计量资料的统计推断(二)假设检验概述(二)假设检验概述1.假设检验的基本思想假设检验的基本思想假设检验的基本思想是小概率反证法思想 三、计量资料的统计推断三、计量资料的统计推断(二)假设检验概述(二)假设检验概述2.2.假设检验的基本步骤假设检验的基本步骤(1)提出假设,确定检验水准

31、(2)选择检验方法,计算检验统计量(3)确定P值,作出推断结论 三、计量资料的统计推断三、计量资料的统计推断(三)(三)t t检验和检验和u u检验检验 t检验和u检验就是统计量为t、u的假设检验,常用于两均数比较,二者均是常见的假设检验方法 当样本含量较大,资料符合正态或近似正态分布时,可用u检验进行分析 当样本含量较小,资料符合正态或近似正态分布且方差齐时,则用t检验 三、计量资料的统计推断三、计量资料的统计推断(三)(三)t t检验和检验和u u检验检验 样本均数与总体均数比较的检验样本均数与总体均数比较的检验 样本均数与总体均数比较的t检验也称单样本t检验(one sample t-t

32、est),实际上是推断该样本来自的总体均数与已知的某一总体均数(常为理论值或标准值)有无差别 已知健康成年男性血红蛋白的均数为140.0g/L,某医生随机抽查了25名从事铅作业的男性工人,求得其均数为130.5g/L,标准差为18.5g/L,据此能否认为从事铅作业的男性工人与健康成年男性的血红蛋白含量有差异?2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推断结论值,做出推断结论 三、计量资料的统计推断三、计量资料的统计推断(三)(三)t t检验和检验和u u检验检验配对设计的配对设计的t t检验检验异体配对:将受试对象按一定条件配成对子(如同体重、同年龄、同性别等),再随机

33、分配每对中的两个受试对象到不同的处理组同体配对:同一受试对象分别接受两种不同处理,其目的是推断两种处理的效果有无差别自身前后对照:同一受试对象处理前后的比较,其目的是推断某种处理有无作用 研究某药物治疗高血压的疗效,10例患者治疗前后收缩压的结果见表,问此药物是否有效?编号编号1 12 23 34 45 56 67 78 89 91010疗前疗前155 155 150 150 150 150 150 150 140 140 150 150 137 137 140 140 128 128 145 145 疗后疗后135 135 145 145 140 140 130 130 130 130 14

34、0 140 125 125 140 140 120 120 135 135 差值差值20 20 5 5 10 10 20 20 10 10 10 10 12 12 0 0 8 8 10 10 2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推断结论值,做出推断结论 三、计量资料的统计推断三、计量资料的统计推断(三)(三)t t检验和检验和u u检验检验 成组设计两样本均数比较的成组设计两样本均数比较的t t检验检验 成组设计两样本均数比较的检验又称成组比较或完全随机设计的检验 目的是推断两个样本分别代表的总体均数是否相等 检验过程与上述两种检验也没有大差别,只是假设的表达和值

35、的计算公式不同,且要求两总体方差齐同(三)(三)t t检验和检验和u u检验检验成组设计两样本均数比较的成组设计两样本均数比较的t t检验检验两小样本均数的比较两小样本均数的比较 将20名2型糖尿病患者随机等分为试验组与对照组分别测得试验开始前和8周后的空腹血糖,算得空腹血糖的下降值见表,能否认为两组的疗效有差异?2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推断结论值,做出推断结论 (三)(三)t t检验和检验和u u检验检验成组设计两样本均数比较的成组设计两样本均数比较的t t检验检验两大样本均数的比较两大样本均数的比较 某地随机抽取正常男性100名,测得血红蛋白的均数

36、为140.5g/L,标准差为20.2g/L,正常女性100名,测得血红蛋白的均数为130.2g/L,标准差为19.5g/L,问男、女血红蛋白含量有无差别?2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推断结论值,做出推断结论 三、计量资料的统计推断三、计量资料的统计推断(四)方差分析(四)方差分析 方差分析(analysis of variance,简写为ANOVA)是用途广泛的统计学方法,其目的是推断两组或多组计量资料的总体均数是否相同三组肺癌患者治疗后自然杀伤细胞(NK细胞)的测定结果如表,比较三组间NK细胞的总体均数有无差异?组组组组组组74.074.068.068.

37、071.071.072.072.056.056.066.066.074.074.042.042.079.079.065.065.056.056.073.073.059.059.046.046.080.080.073.073.061.061.076.076.074.074.058.058.066.066.065.065.055.055.071.071.0(四)方差分析(四)方差分析方差分析的基本思想方差分析的基本思想 总变异有以下两个来源(1)组内变异(2)组间变异 方差分析就是用组间均方与组内均方的比值(即F值)与1相比较,若F值接近1,则说明各组均数间的差异没有统计学意义,若F值远大于1,则

38、说明各组均数间的差异有统计学意义(四)方差分析(四)方差分析方差分析的应用条件方差分析的应用条件 (1)各观察值相互独立,均服从正态分布(2)各组资料总体方差相等,即具有方差齐性(homogeneity of variance)(四)方差分析(四)方差分析 单因素方差分析的分析步骤单因素方差分析的分析步骤 2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推断结论值,做出推断结论 (四)方差分析(四)方差分析多个样本均数的两两比较多个样本均数的两两比较 多个样本均数间两两比较常用检验,即Student-Newman-kueuls法,简称SNK 其基本步骤为 建立检验假设;样本均

39、数由大到小排序;计算q值 查界值表判断结果。2.2.计算检验统计量计算检验统计量将三组资料的均数按照由大到小的顺序排列,并编组次将三组资料的均数按照由大到小的顺序排列,并编组次均数均数72.7572.7569.5069.5055.2555.25秩次秩次1 12 23 3组别组别组组组组组组三个样本均数两两比较的三个样本均数两两比较的q q检验检验A A与与B B(1 1)均数均数差值差值(2 2)标准误标准误(3 3)q q值值(4 4)组数组数a a(5 5)q q界值界值 (6 6)P P值值(7 7)1 1与与2 23.253.253.263.261.001.002 22.952.950

40、.050.051 1与与3 317.5017.503.263.265.375.373 33.853.850.050.052 2与与3 314.2514.253.263.264.374.372 22.952.950.050.053.3.确定确定P P值,做出推断结论值,做出推断结论 三、计量资料的统计推断三、计量资料的统计推断(五)假设检验中的两类错误及应注意问题(五)假设检验中的两类错误及应注意问题 两类错误两类错误 I 型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率

41、是(其值未知)(五)假设检验中的两类错误及应注意问题(五)假设检验中的两类错误及应注意问题应注意问题应注意问题(1)做假设检验前,注意资料是否有可比性(2)根据资料的类型和统计设计要求选用正确的假设检验方法;根据专业及经验确定选用单侧检验还是双侧检验(3)注意类错误与类错误(4)当差别有统计学意义时应注意判断结论时不能绝对化,应注意无论拒绝或不拒绝检验假设,都有判断错误的可能性(5)报告结论时须说明所用的检验统计量,检验的单双侧及值确切范围第四节第四节 计数资料的统计分析计数资料的统计分析 一、计数资料的统计描述二、计数资料的统计推断一、计数资料的统计描述(一)常用相对数(一)常用相对数1.率

42、2.构成比3.相对比(一)常用相对数(一)常用相对数 1.1.率(率(raterate)率表示在一定条件下,某种现象实际发生的例数与可能发生这种现象的总例数之比,用以说明某种现象发生的频率与强度(一)常用相对数(一)常用相对数 2.构成比(proportion)构成比又称构成指标或百分比,它说明某一事物内部各组成部分所占的比重,常以百分数表示(一)常用相对数(一)常用相对数 3.相对比 相对比又称比,表示两个有关联的指标之对比,说明两者的相对水平,常以百分数和倍数表示,其公式为 一、计数资料的统计描述一、计数资料的统计描述 (二)(二)应用相对数时的注意事项应用相对数时的注意事项1.计算相对数

43、时,观察单位数应足够多2.分析时构成比和率不能混淆 3.正确计算平均率4.比较率或构成比时,应注意资料的可比性 5.样本率或构成比的比较应做假设检验 一、计数资料的统计描述一、计数资料的统计描述(三)率的标准化法及其应用(三)率的标准化法及其应用 率的标准化法是指采用统一的标准对内部构成不同的各组进行调整,然后进行调整率的对比方法。采用统一的标准调整后的率称为标准化率,简称标化率。计算标化率的方法有直接法和间接法二、计数资料的统计推断二、计数资料的统计推断 (一)率的抽样误差和标准误(一)率的抽样误差和标准误 率的抽样误差大小可用率的标准误来表示,计算公式如下 二、计数资料的统计推断二、计数资

44、料的统计推断(二)总体率的估计(二)总体率的估计 正态近似法正态近似法 当样本含量足够大,且样本率p和(1p)均不太小,如p或(1p)均5时,样本率的分布近似正态分布,则总体率的可信区间可由下列公式估计 总体率的95%可信区间:p1.96 总体率的99%可信区间:p2.58 二、计数资料的统计推断二、计数资料的统计推断(三)率的检验(三)率的检验 当样本含量足够大、样本率p和(1p)均不太小,且p和(1p)均大于5时,样本率的分布近似于正态分布,样本率和总体率之间、两个样本率之间差异来源的判断可用u检验(三)率的检验(三)率的检验样本率与总体率的比较样本率与总体率的比较 根据大量调查资料,城镇

45、25岁及以上者高血压患病率为11%。某研究组在某油田职工家属区随机抽查了25岁及以上者598人,82人确诊为高血压。问油田职工家属的高血压患病率与一般人有无不同?2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推断结论值,做出推断结论 (三)率的检验(三)率的检验 两个样本率的比较两个样本率的比较某流行病学课题组研究体重指数(BMI)与2型糖尿病的关系,检查了55岁70岁的居民1670人,BMI25者为988人,52人为糖尿病患者;BMI25者682人,69人为糖尿病患者,问BMI不同者糖尿病患病率是否相同?2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推

46、断结论值,做出推断结论 二、计数资料的统计推断二、计数资料的统计推断(四)(四)检验(卡方检验)检验(卡方检验)(四)(四)检验(卡方检验)检验(卡方检验)四格表资料的卡方检验四格表资料的卡方检验 某医生用两种疗法治疗肺癌,出院后随访24个月。甲疗法治疗46例,乙疗法治疗58例,结果见表4-14。问两种疗法治疗肺癌患者的两年生存率是否相同?2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推断结论值,做出推断结论 四格表资料卡方检验的专用公式四格表资料卡方检验的专用公式 四格表资料卡方值的校正四格表资料卡方值的校正 四格表资料卡方检验公式选择条件 专用公式;校正公式;直接计算概

47、率。卡方连续性校正仅用于四格表资料卡方连续性校正仅用于四格表资料(四)(四)检验(卡方检验)检验(卡方检验)配对资料的卡方检验配对资料的卡方检验 某医师对55例类风湿关节炎患者,分别采用免疫比浊法(ITA)与乳胶凝集试验(LAT)法检测类风湿因子(RF),结果见表,问两种方法检测效果有无差别?b+c40时 b+c40时2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推断结论值,做出推断结论 (四)(四)检验(卡方检验)检验(卡方检验)行行列表资料的卡方检验列表资料的卡方检验 某预防医学研究人员调查了335例离退休老人的生活满意度和家庭关系,结果见表,试分析家庭关系类型与老人生

48、活满意度的关系 家庭关系家庭关系满意度满意度合计合计满意度满意度(%)满意满意不满意不满意和睦和睦174174606023423474.3674.36一般一般36365757939338.7138.71差差6 61010161637.5037.50合计合计21621612712734334362.9762.97三组总体满意率不同或不全相同三组总体满意率不同或不全相同 2.2.计算检验统计量计算检验统计量3.3.确定确定P P值,做出推断结论值,做出推断结论 第五节第五节 非参数检验非参数检验一、配对设计的符号秩和检验二、两样本比较的秩和检验三、多样本比较的秩和检验 凡是以样本来自已知分布(如正

49、态分布)的总体为假设基础,对总体参数如总体均数进行估计或检验的方法称为参数统计(parametric statistics)有时总体的分布不易确定,则需要应用一种不依赖于总体分布类型的“非参数统计”(nonparametric statistics)进行假设检验非参数统计方法的主要优点非参数统计方法的主要优点应用范围广,对变量的类型和分布无特殊要求,不论样本资料来自的总体分布形式如何,甚至是未知的,都能适用对数据要求不严,对某些指标不便准确测定,只能以严重程度、优劣等级、先后次序等做记录的资料也可应用多数非参数统计方法简便,易于理解和掌握 非参数检验的主要缺点非参数检验的主要缺点对于符合参数检

50、验的资料如果用非参数检验,由于没有充分利用资料提供的信息,故检验效能低于参数检验,即发生类错误的概率会增加,若要使检验效能相同,往往需要更大的样本含量一、配对设计的符号秩和检验一、配对设计的符号秩和检验 某医院某病患者使用中西医结合治疗前后谷草转氨酶(u/L)的变化情况见表,比较治疗前后谷草转氨酶变化差别有无显著性?病例编号病例编号(1 1)治疗前治疗前(2 2)治疗后治疗后(3 3)差值差值(4 4)=(2 2)-(3 3)秩次秩次(5 5)1 122.922.947.647.6-24.7-24.7-8-82 2 9.8 9.8 6.5 6.5 3.3 3.3 5 53 321.221.22

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁