循证医学实践中常用统计学方法.ppt

上传人:wuy****n92 文档编号:80414755 上传时间:2023-03-23 格式:PPT 页数:101 大小:2.03MB
返回 下载 相关 举报
循证医学实践中常用统计学方法.ppt_第1页
第1页 / 共101页
循证医学实践中常用统计学方法.ppt_第2页
第2页 / 共101页
点击查看更多>>
资源描述

《循证医学实践中常用统计学方法.ppt》由会员分享,可在线阅读,更多相关《循证医学实践中常用统计学方法.ppt(101页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第五章 循证医学实践中常用统计方法(Statistical methods commonly used in the practice of evidence-based medicine)循证医学循证医学 Evidence-Based Medicine作者单位作者单位 中南大学中南大学 长沙医学院长沙医学院作者姓名作者姓名 王乐三王乐三 欧阳江欧阳江目 录第一节第一节 概概 述述1第第二二节 常用常用统计方法方法23第第三三节 统计方法常方法常见错误及辨析及辨析教学要求:教学要求:1.1.掌握医学统计的基本概念;掌握医学统计的基本概念;2.2.熟悉医学统计学的基本内容;熟悉医学统计学的基本内

2、容;3.3.了解多变量资料统计分析方法及选择思路。了解多变量资料统计分析方法及选择思路。【案案 例例】某作者比某作者比较腹腔腹腔镜胰十二指胰十二指肠切除切除术与与传统开腹手开腹手术行胰十二指行胰十二指肠切除切除术的近期的近期临床床疗效和安全性,效和安全性,结局局指指标有:手有:手术时间;术中出血量;是否再次手中出血量;是否再次手术;住住院院时间;是否是否围手手术期死亡;期死亡;是否有胰漏是否有胰漏发生、切生、切口感染、延口感染、延迟性胃排空等。有关的性胃排空等。有关的结局指局指标涉及的涉及的统计资料料类型有哪些?有关的参数估型有哪些?有关的参数估计和假和假设检验方法有哪方法有哪些?些?5第一节

3、第一节 概概 述述1234医学统计学定义医学统计学定义基本概念基本概念统计资料常见类型统计资料常见类型小结思考小结思考6l若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。Florence Nightingale 1820一1910What is Statistics?什么是统计学?什么是统计学?7天气预报天气预报无处不在的统计学无处不在的统计学8人类学人类学文学文学经济学经济学史学史学地理学地理学物理学物理学社会学社会学农学农学生物学生物学医学医学药学药学中医学中医学气象学气象学法学法学医学统计学医学统计学MedicalStatistics卫生统计学卫生统计学Health

4、Statistics生物统计学生物统计学Biostatistics科研中的统计学vWebsters International Dictionary:A science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”vJohn M.Last,A Dictionary of Epidemiology:The science and art of dealing with variation in data through collection,cla

5、ssification,and analysis in such a way as to obtain reliable results”10医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。医学统计学医学统计学(Medical Statistics)(Medical Statistics)医学统计学的定义医学统计学的定义11医学研究的基本内容1.1.医学科研的统计设计医学科研的统计设计2.2.资料分析资料分析假设假设搜集、整理、分析数据搜集、整理、分析数据v调查设计v实验设计l统计描述:统计指标l统计推断:参数估计、假设检验医

6、学统计学的应用医学统计学的应用12n 以正确的方式收集资料n 描述资料的统计特征n 统计推断及得出正确结论13一、一些重要概念一、一些重要概念v同质和异质同质和异质v变异变异v总体和个体总体和个体v参数和统计量参数和统计量v随机随机v概率和频率概率和频率v小概率事件和小概率原理小概率事件和小概率原理v抽样误差抽样误差14基本概念之一:同质和异质基本概念之一:同质和异质l同质(homogeneity):性质相同l异质(heterogeneity):性质不同同质和异质是相对的概念同质和异质是相对的概念不同质的个体不能笼统地混在一起分析不同质的个体不能笼统地混在一起分析个体的同质性是构成研究总体的必

7、备条件个体的同质性是构成研究总体的必备条件研究内容研究内容(指标指标/变量变量)不同,对同质性的要求不同不同,对同质性的要求不同15在研究事物的形状时同质和异质示例同质和异质示例在研究事物的颜色时16基本概念之二:变异基本概念之二:变异 v同质事物之间的差别称为同质事物之间的差别称为变异变异(Variation)v变异的两个方面:变异的两个方面:不同观察单位(个体)间的差别不同观察单位(个体)间的差别同一个体在不同阶段的差别(重复测量)同一个体在不同阶段的差别(重复测量)17变异示例变异示例发热者体温波动正常人体温波动18基本概念之二:变异基本概念之二:变异v同质个体间的差异。同质个体间的差异

8、。v结果是随机的,不可预测的。结果是随机的,不可预测的。v一种或多种不可控因素一种或多种不可控因素(已知的或未知的已知的或未知的)作用下的综合表现。作用下的综合表现。v个体变异是普遍存在的。个体变异是普遍存在的。v个体变异是有规律的。个体变异是有规律的。v没有个体变异,就没有统计学!没有个体变异,就没有统计学!19基本概念之三:总体、个体和样本基本概念之三:总体、个体和样本 v总总体体(population):按按研研究究目目的的所所确确定定的的同同质质研研究究对对象象某某项项观观察察指指标标的的全全体体,即即全体观察单位。全体观察单位。有限总体有限总体(finite)无限总体无限总体(inf

9、inite)v个个体体(individual):是是构构成成总总体体的的最最基基本本观察单位;观察单位;v样样本本(randomsample):从从研研究究总总体体中中随随机抽取具有代表性的部分观察单位。机抽取具有代表性的部分观察单位。代表性,包含了总体的特性代表性,包含了总体的特性为什么要抽样?为什么要抽样?20基本概念之四:参数和统计量基本概念之四:参数和统计量 l总体参数总体参数(parameter):刻画总体特征的指标;刻画总体特征的指标;一般用希腊字母表示,如:一般用希腊字母表示,如:、pl统计量统计量(statistic):样本统计指标样本统计指标一般用拉丁字母表示,如:一般用拉丁

10、字母表示,如:、s、pl在在总总体体被被确确定定之之后后,总总体体参参数数就就是是一一个个常常数数,是是不不会会变变化化的的,不不管管你你是是否否确确切切知知其其大大小小;而而统计量是几乎总是随着样本而变的。统计量是几乎总是随着样本而变的。21基本概念之五:随机基本概念之五:随机v随机随机(random):):是指机会均等,无主观影响,目是指机会均等,无主观影响,目的是保证样本对总体的代表性、可靠性。的是保证样本对总体的代表性、可靠性。机会均等,无主观影响机会均等,无主观影响抽样随机抽样随机(randomsampling)有相同的机会被抽到有相同的机会被抽到分组随机分组随机(randomall

11、ocation)有相同的机会被分到不同的组中有相同的机会被分到不同的组中顺序随机顺序随机(randomorder)有相同的机会先后接受处理有相同的机会先后接受处理22基本概念之六:频率和概率基本概念之六:频率和概率v频率频率Relativefrequency:在在n次随机试验中,次随机试验中,事件事件A发生了发生了m次,则比值次,则比值称为事件称为事件A在这在这n次试验中出现的次试验中出现的频率频率23基本概念之六:频率和概率基本概念之六:频率和概率抛硬币试验在概率的统计学定义上的诠释抛硬币试验在概率的统计学定义上的诠释试验者试验者投掷次数投掷次数出现出现“正面正面”次数次数频率频率XXX20

12、120.6000Buffon404020480.5069DeMorgan409220480.5005Fisher1000049790.4979K.Pearson1200060190.5016K.Pearson24000120120.500524基本概念之六:频率和概率基本概念之六:频率和概率v概率的统计学定义:概率的统计学定义:数理统计学中的大数定理表明:当观察次数数理统计学中的大数定理表明:当观察次数n越来越大,越来越大,频率频率f 的随机波动幅度越来越小,并最终趋向于一个常数的随机波动幅度越来越小,并最终趋向于一个常数p:随机事件:随机事件A发生的发生的概率概率(Probability)。

13、v概率概率描述事件发生可能性大小的一个度量描述事件发生可能性大小的一个度量。是一种参数。是一种参数。常用常用P来表示;来表示;0P 125基本概念之七:小概率事件v小概率事件小概率事件(rareevent)当某事件发生的概率很小当某事件发生的概率很小(可能性很小可能性很小),统计学上称该事件为小概率,统计学上称该事件为小概率事件。事件。医学上:小于或等于医学上:小于或等于0.050.05v小概率原理小概率原理小小概概率率事事件件并并不不表表示示不不可可能能发发生生,但但在在某某一一次次试试验验中中,可可认认为为是是不不会会发生的。发生的。26v误差误差(error)指实际观察值与观察真值之差、

14、样本指标指实际观察值与观察真值之差、样本指标与总体指标之差。与总体指标之差。基本概念之八:抽样误差基本概念之八:抽样误差 误差分类产生原因对观察值的影响处理方法系统误差仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等。使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。通过实验设计的完善和技术措施的改进来消除或减少。随机误差排除系统误差后,其他多种不确定因素。使观察值不按方向性、系统性而随机的变化,误差变量一般服从正态分布。可通过统计处理估计随机误差。27二、统计资料常见类型 在在医医学学研研究究中中,根根据据研研究究目目的的的的要要求求对对一一些些观观察察项项

15、目目或或研研究究指指标标在在一一些些研研究究对对象象中中进进行行观观察察(或或测测量量),由由于于这这些些指指标标存存在在着着变变异异,故故把把这这些些观观察察项项目目或或研研究究指指标标称称为为随随机机变变量量,简简称称变变量量(variable),而而观观察察结结果果对对应应的的取取值值称为称为变量值或观察值变量值或观察值。28v按照取值的特性:数值变量 Numerical Variable 定量变量:既有顺序的意义,又有间隔的意义,可以认为是连续的;往往有单位;取值间的差异是可以度量的分类变量 Categorical Variable:取值是是分散、定性的,表现为互不相容的类别和属性无序

16、分类 Unordered Categorical定性变量:无顺序,无间隔,仅有分类二项分类多项分类有序分类 Ordered Categorical 等级变量:仅有顺序,无单位;取值间的差异是不可度量的29资料类型的判断病例号年龄(岁)性别身高(cm)血型心电图尿WBC职业RBC1012/L135女1.65A正常教师4.67244男1.74B正常工人5.21326男1.80O正常职员4.10425女1.61AB正常农民3.92541男1.71A异常+工人3.49645女1.58B正常+工人5.48750女1.60O异常+干部6.78828男1.76AB正常+干部7.10931女1.62O正常军人

17、5.2430v不同分类的互相转化不同分类的互相转化 定量资料(数值变量)定量资料(数值变量)定性资料(无序分类变定性资料(无序分类变量)量)定量资料(数值变量)定量资料(数值变量)等级资料(有序分类变等级资料(有序分类变量)量)等级资料(有序分类变量)等级资料(有序分类变量)定性资料(无序分定性资料(无序分类变量)类变量)信息量只有减少,不可增加信息量只有减少,不可增加31基本概念汇总基本概念汇总总体个体、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风 险32总结总结l基本概念:基本概念:统计学,统计学研究的步骤统计学,统计学研究的步骤统计资料的分类统计资料的分类同质

18、、变异同质、变异总体、个体、样本总体参数、样本统计量、样本含量总体、个体、样本总体参数、样本统计量、样本含量随机随机概率、小概率事件、小概率原理概率、小概率事件、小概率原理抽样误差抽样误差变量的分类变量的分类33第二节第二节 常用统计方法常用统计方法1234分类变量资料常用统计方法分类变量资料常用统计方法数值变量资料常用统计方法数值变量资料常用统计方法常用统计方法的选择常用统计方法的选择思考题思考题34l描描述述性性统统计计分分析析:以以统统计计表表、统统计计图图统统计计指指标标(如如均均数数、标标准准差差等等)对对资资料料的的数数量量特特征征及及其其分分布布规规律律进行测定和描述。进行测定和

19、描述。l推推断断性性统统计计分分析析:如如何何由由样样本本信信息息推推断断总总体体特特征征的的问题。问题。参数估计:区间估计(参数估计:区间估计(95%CI)假设检验:假设检验:t,F,z检验等检验等基本统计分析方法基本统计分析方法35一、分类变量资料常用统计方法一、分类变量资料常用统计方法1.1.分类变量资料的统计描述分类变量资料的统计描述数据形式数据形式绝对数绝对数相对数相对数比、比例、率比、比例、率36比比(ratio)(ratio)两者的相对水平两者的相对水平分子分子不必包含不必包含在分母里在分母里可以比较不同属性的事件或状态可以比较不同属性的事件或状态=5/2 =2.5/137构成比

20、构成比(proportion)(proportion)某一事物内部各组成部分所占的比重某一事物内部各组成部分所占的比重分子分子必须包含必须包含在分母里在分母里比较的必须是同一属性的事件或状态比较的必须是同一属性的事件或状态波动范围只能是波动范围只能是0 01 12-=0.5=50%4率率(rate)(rate)38描述特定时间里某事件发生的速度描述特定时间里某事件发生的速度分子:分子:特定时间里观察的特定时间里观察的新发事件数新发事件数分母:分母:事件发生的人群基数事件发生的人群基数 (危险人口)危险人口)2-=0.02/year 100Observed in 199839n防止概念混淆防止概

21、念混淆n计算相对数时分母应有足够数量计算相对数时分母应有足够数量 n正确地合并估计频率正确地合并估计频率(或强度或强度)型指标型指标 n相相对对数数间间的的比比较较要要具具备备可可比比性性:观观察察的的对对象象是是否否同同质质,研研究究的的方方法法(如如检检测测手手段段、抽抽样样方方法法)是是否否相相同同,观观察察的的时时间间是是否否一一致致等等;被被比比较较的的总总体体是否具有可比性是否具有可比性 n对相对数的统计推断对相对数的统计推断 应用相对数应注意的事项应用相对数应注意的事项402.2.分类变量资料的统计推断分类变量资料的统计推断参数估计:参数估计:点估计点估计 区间估计区间估计假设检

22、验:假设检验:检验、检验、u u检验检验 非参数检验非参数检验 无序分类资料统计方法无序分类资料统计方法41比较目的比较目的 应用条件应用条件统计方法统计方法样本与总体检验样本与总体检验np5,n(1-P)5二项分布二项分布u检验检验n很小很小二项分布直接法二项分布直接法两样本比较检验两样本比较检验np5,n(1-P)5二项分布二项分布u检验检验n40,T5四格表四格表 检验检验n40,1T40配对配对检验检验b+c1,1T5的格的格子数超过子数超过1/5列联表列联表检验检验T1四格表确切概率法四格表确切概率法等级资料统计方法等级资料统计方法42比较目的比较目的 统计方法统计方法配对等级资料配

23、对等级资料Wilcoxon单样本秩和检验单样本秩和检验两独立样本等级资料两独立样本等级资料Wilcoxon两样本秩和检验两样本秩和检验多组独立样本等级资料多组独立样本等级资料Kruskal-Wallis秩和检验秩和检验单变量计数资料的统计方法选择思路单变量计数资料的统计方法选择思路4344二、数值变量资料常用统计方法二、数值变量资料常用统计方法1.1.数值变量资料的统计描述数值变量资料的统计描述集中趋势和离散趋势124132140148156164010203040人数身高(cm)45n 集中趋势的描述集中趋势的描述 即即大大多多数数数数值值落落在在什什么么位位置置上上。(针针对对一一个个变量

24、的若干个数值)变量的若干个数值)1.1.算术均数(均数)算术均数(均数)2.2.几何均数几何均数3.3.中位数中位数46算术均数(均数)算术均数(均数)l意义:一组性质相同的观察值在数量上的平均水平。意义:一组性质相同的观察值在数量上的平均水平。l表示表示 (总体)(总体)X X(样本)样本)l特征:特征:(X(X-X)=0X)=0l应用:正态分布或近似正态分布应用:正态分布或近似正态分布l注意:合理分组,才能求均数,否则没有意义。注意:合理分组,才能求均数,否则没有意义。47几何均数几何均数l意意义义:N N个个数数值值的的乘乘积积开开N N次次方方即即为为这这N N个个数数的的几几何何均数

25、。均数。l表示:表示:G Gl应应用用:原原始始数数据据分分布布不不对对称称,经经对对数数转转换换后后呈呈对对称称分分布布的的资资料料。数数值值范范围围跨跨越越多多个个数数量量级级。例例如如抗抗体体滴度。滴度。48中位数、百分位数中位数、百分位数l意意义义:将将一一组组观观察察值值从从小小到到大大排排序序后后,居居于于中中间间位位置的那个值或两个中间值的平均值。(身高排队)置的那个值或两个中间值的平均值。(身高排队)l表示:表示:M M、PXPXl百百分分位位数数:将将N N个个观观察察值值从从小小到到大大依依次次排排列列,再再分分成成100100等等份份,对对应应于于X%X%位位的的数数值值

26、即即为为第第X X百百分分位位数数。中位数是百分位的特殊形式。中位数是百分位的特殊形式。l应用:偏态资料,开口资料应用:偏态资料,开口资料49n 离散趋势的描述:离散趋势的描述:反映一组数据的变异大小反映一组数据的变异大小l极差极差l四分位数间距四分位数间距l方差方差l标准差标准差l变异系数变异系数 常用指标常用指标50标准差标准差l相关概念:离均差、离均差之和、离均差平方和、方相关概念:离均差、离均差之和、离均差平方和、方差(差(2S2)l标准差的符号:标准差的符号:S l意义:全面反映了一组观察值的变异程度意义:全面反映了一组观察值的变异程度(大小大小)l应用:描述变异程度、计算标准误、计

27、算变异系数、应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围描述正态分布、估计正常值范围512.2.数值变量资料的统计推断数值变量资料的统计推断参数估计:参数估计:点估计点估计 区间估计区间估计假设检验:假设检验:t 检验、方差分析检验、方差分析 非参数检验非参数检验 52t检验(检验(N30、60)应用条件:应用条件:来自正态分布的总体;来自正态分布的总体;所比较总体的方差相同。所比较总体的方差相同。用途:用途:n样本均数与总体均数的比较样本均数与总体均数的比较n配对资料差值均数的比较配对资料差值均数的比较n两样本均数的比较两样本均数的比较53u检验(检验(N30、

28、60)用途:用途:n样本均数与总体均数的比较样本均数与总体均数的比较n配对资料差值均数的比较配对资料差值均数的比较n两样本均数的比较两样本均数的比较54方差分析方差分析应用条件:应用条件:来自正态分布的总体;来自正态分布的总体;所比较总体的方差相同。所比较总体的方差相同。用途:用途:n完全随机设计方差分析完全随机设计方差分析n随机区组设计方差分析随机区组设计方差分析n多个样本均数间的两两比较多个样本均数间的两两比较55秩和检验秩和检验(非参数方法非参数方法)用途:用途:n配对资料差值的符号秩和配对资料差值的符号秩和 检验检验n成组设计两样本比较秩和成组设计两样本比较秩和 检验检验n成组设计多样

29、本比较秩和成组设计多样本比较秩和 检验检验56单变量数值变量资料的统计方法选择思路单变量数值变量资料的统计方法选择思路57双变量资料的统计学检验方法选择思路双变量资料的统计学检验方法选择思路583.3.双变量资料分析常用统计方法双变量资料分析常用统计方法分析目的分析目的 应用条件应用条件统计方法统计方法两变量的相互关系两变量的相互关系二元正态分布二元正态分布Pearson积矩相关分析积矩相关分析分分布布未未知知、等等级级资料资料Spearman秩相关分析秩相关分析两变量的依存关系两变量的依存关系应应变变量量正正态态、有有线性趋势线性趋势线性回归的分析线性回归的分析曲线趋势曲线趋势曲线回归分析曲

30、线回归分析 593.3.多变量资料分析常用统计方法多变量资料分析常用统计方法资料类型资料类型应用条件应用条件统计方法统计方法有应变量有应变量自、应变量都是正态自、应变量都是正态多元线性回归多元线性回归应变量为生存时间应变量为生存时间Cox生存分析生存分析应变量为分类变量应变量为分类变量Logistic回归回归无应变量无应变量聚类、因子、主成分分析聚类、因子、主成分分析相关分析相关分析多重线性、典型相关分析多重线性、典型相关分析60三、常用统计方法的选择三、常用统计方法的选择不同类型的资料采用不同的统计分析方法不同类型的资料采用不同的统计分析方法 计计量量资资料料的的统统计计分分析析方方法法:t

31、检检验验、u检检验验、方方差差分析、相关与回归分析分析、相关与回归分析 计计数数资资料料的的统统计计分分析析方方法法:卡卡方方检检验验、二二项项分分布和布和Poission分布、相关与回归分析分布、相关与回归分析 等级资料的统计分析方法:等级资料的统计分析方法:秩和检验秩和检验 61不同设计类型采用相应的统计分析方法不同设计类型采用相应的统计分析方法完完全全随随机机设设计计:对对两两组组计计量量资资料料的的比比较较:t检检验验、完全随机设计方差分析、完全随机设计方差分析、Kruskal-Wallis检验;检验;区区组组随随机机设设计计(或或配配对对设设计计):配配对对t检检验验、区区组组随随机

32、机设设计计的的方方差差分分析析、Friedman检检验验、kappa检验检验62例例5-1 5-1 某某研研究究所所为为研研究究某某药药物物的的抑抑癌癌作作用用,使使一一批批小小白白鼠鼠致致癌癌后后,将将一一批批致致癌癌小小白白鼠鼠4040只只按按完完全全随随机机设设计计的的方方法法分分为为四四组组,A A、B B、C C三三个个试试验验组组和和一一个个对对照照组组,分分别别接接受受不不同同的的处处理理。A A、B B、C C三三个个试试验验组组,分分别别注注射射0.5m10.5m1、1.0m11.0m1和和1.5m1 1.5m1 3030的的注注射射液液,对对照照组组不不用用药药。经经一一定

33、定时时间间以以后后,测测定定四四组组小小白鼠的肿瘤重量白鼠的肿瘤重量(g)(g),测量结果见表,测量结果见表5-75-7。试进行统计分析。试进行统计分析。63某药物对小白鼠抑癌作用某药物对小白鼠抑癌作用(肿瘤重量,肿瘤重量,g)的试验结果的试验结果对照组对照组试试验验组组ABC3.63.00.43.34.52.31.81.24.22.42.11.34.41.14.52.53.74.03.63.15.63.71.33.27.02.83.20.64.11.92.11.45.02.62.61.34.51.32.32.164各组的均数、标准差、标准误及总体均数各组的均数、标准差、标准误及总体均数95%

34、可信区间可信区间组别组别n95%可信区可信区间间对照组对照组104.6600 1.00907.31910 3.93825.3818实验组实验组A 102.5100.93387.29532 1.84203.1780实验组实验组B 102.3900 1.16852.36952 1.55413.2259实验组实验组C 102.0000.97411.30804 1.30322.6968本本例例为为单单变变量量计计量量资资料料,分分组组因因素素只只有有药药物物1个个,共共4个个水水平平,设设计计类类型型为为完完全全随随机机设设计计,4组组资资料料经经方方差差齐齐性性检检验验,Levene统统计计量量为为

35、0.178,P=0.910,在在的的水水准准,各各组组方方差差差差别别无无统统计计学学意意义义,可可选选择择单单因因素素方方差差分分析析(one-wayANOVA)。方方差差分分析析结结果果,P0.001,可可认认为为4个个不不同同剂剂量量药药物物注注射射液液的的抑抑癌癌作作用用有有差差别别。再再用用Dunnett-t检检验验作作多多个个实实验验组组与与一一个个对对照照组组之之间间的的比比较较,结结果果。,-,在在=0.01水水准准上上均均有有统统计计学学意意义义;可可认认为为3个个不不同同剂剂量量药药物物注注射射液液与与对对照照组组的的小小白白鼠鼠肿肿瘤瘤重重量量有有差差别别,即即3个个不不

36、同同剂剂量量药药物注射液都有抑癌作用。物注射液都有抑癌作用。6566例例5-2 5-2 某某研研究究者者收收集集103103例例冠冠心心病病患患者者和和100100例例正正常常对对照照者者的的多多项项指指标标,部部分分资资料料见见表表5-95-9。其其中中G G为为组组别别,X1X1为为性性别别,X2,X2为为年年龄龄,X3X3为为患患高高血血压压史史,X4X4为为吸吸烟烟史史,X5X5为为胆胆固固醇醇含含量量,X6X6为为甘甘油油三三酯酯含含量量,X7X7为为低低密密度度脂脂蛋蛋白白含含量量,X8X8为为高高密密度度脂脂蛋蛋白白含含量量,X9X9为为脂脂蛋蛋白白含含量量,X10X10为为载载

37、脂脂蛋蛋白白A1A1含含量量,X11X11为为载载脂脂蛋蛋白白B B含含量量,X12X12为为基基因因EcoREcoR型型。表表5-105-10简简要要列列出出根根据据研研究者部分研究目的而拟采用的统计分析方法。究者部分研究目的而拟采用的统计分析方法。67编号编号GX1X2X3X4X5X6X7X8X9X10X11X1211男男60NN223 205 122 30106 0.920.74-/-21女女46NN166 518457561.140.54+/-1031男男76YY195 101 135 42302 0.910.65+/+1042女女39NN223 48157 55321.060.71+

38、/+2022男男40NN152 91100 46621.000.55-/-2032男男60NY168 84106 33205 0.670.69+/+冠心病患者和正常对照者多项指标的部分观测结果冠心病患者和正常对照者多项指标的部分观测结果68研究目的和拟采用的统计分析方法研究目的和拟采用的统计分析方法编号编号 研究目的研究目的拟采用统计分析方法拟采用统计分析方法1 1EcoREcoR基基因因型型不不同同的的冠冠心心病病患患者者,每每项项的的血血脂脂指指标标有无差有无差别别单因素方差分析单因素方差分析2 2EcoREcoR基基因因型型不不同同的的冠冠心心病病患患者者,整整体体的的血血脂脂指指标标有

39、无差有无差别别多元方差分析多元方差分析3 3根据血脂指标对冠心病患者进行分类根据血脂指标对冠心病患者进行分类样品聚类分析样品聚类分析4 4对冠心病患者血脂指标进行分类对冠心病患者血脂指标进行分类指标聚类分析指标聚类分析5 5利用血脂指标对冠心病可疑患者进行辅助诊断利用血脂指标对冠心病可疑患者进行辅助诊断判别分析判别分析6 6对对冠冠心心病病患患者者血血脂脂指指标标进进行行降降维维,寻寻找找独独立立的的综合指标综合指标主成分分析主成分分析7 7筛选冠心病的危险因素,筛选冠心病的危险因素,LogisticLogistic回回归归分析分析思考题691某某医医院院用用新新药药与与常常规规药药物物治治疗

40、疗婴婴幼幼儿儿贫贫血血,将将20名名贫贫血血患患儿儿随随机机分分为为两两组组,分分别别接接受受两两种种药药物物治治疗疗,测测得得血血红红蛋蛋白白增加量增加量(g/L)如下表,请回答下列问题:如下表,请回答下列问题:1)新药与常规药的疗效有无差别?新药与常规药的疗效有无差别?2)根据研究问题,请分别给出两个样本所在总体的定义。根据研究问题,请分别给出两个样本所在总体的定义。新药组新药组 24362514263423201519常规组常规组14182015222421252723两种药物治疗婴幼儿贫血的血红蛋白增加量(两种药物治疗婴幼儿贫血的血红蛋白增加量(g/L)思考题70224名名甲甲状状腺腺

41、功功能能低低下下的的婴婴儿儿,按按病病情情严严重重程程度度把把他他们们分分为为3个个水水平平:轻轻度度组组9名名,中中度度组组8名名,重重度度组组7名名。表表中中列列出了他们的血清甲状腺素含量出了他们的血清甲状腺素含量(nmol/l)。试试分分析析不不同同严严重重程程度度的的婴婴儿儿血血清清甲甲状状腺腺素素水水平平是是否否差差异异有有统统计计学学意意义义。分分别别用用LSD法法和和Bonferroni法法作作多多重重比比较较,对对结果作出统计学和专业领域内的解释。结果作出统计学和专业领域内的解释。病情分类病情分类例数例数 甲状腺素含量甲状腺素含量轻度轻度934454955585960中度中度8

42、825364042536574重度重度758183245476571第三节第三节常用统计方法典型错误及辨析常用统计方法典型错误及辨析123统计描述典型错误辨析统计描述典型错误辨析统计推断错误辨析统计推断错误辨析思考题思考题72一、统计描述典型错误辨析一、统计描述典型错误辨析(一)不考虑资料的分布状态滥用均数和标准差(一)不考虑资料的分布状态滥用均数和标准差例例5-3 5-3 某某地地发发生生一一起起原原因因不不明明疾疾病病,共共有有8080人人发发病病,从从接接触触传传染染源源到到发发病病的的时时间间(潜潜伏伏期期)见见表表5-115-11,作作者者求得其平均潜伏期求得其平均潜伏期x=9.1x

43、=9.1天。该结论对否?天。该结论对否?表表5-11某地原因不明疾病的发病时间某地原因不明疾病的发病时间潜伏期(天)潜伏期(天)发病人数发病人数526575815940101211121合计合计8073一、统计描述典型错误辨析一、统计描述典型错误辨析辨辨析析:从从表表中中可可以以看看出出,该该资资料料为为偏偏态态分分布布资资料料,描描述述其其平平均均潜潜伏伏期期应应该该用用中中位位数数,而而不不能能用用均均数数表表示,计算得出平均潜伏期示,计算得出平均潜伏期M=8.3M=8.3天,而不能用天,而不能用 x x。74一、统计描述典型错误辨析一、统计描述典型错误辨析(一)不考虑资料的分布状态滥用均

44、数和标准差(一)不考虑资料的分布状态滥用均数和标准差例例5-4 5-4 某某医医生生研研究究某某药药对对糖糖尿尿病病的的治治疗疗效效果果,结结果果见见表表5-125-12。表表5-12某药对糖尿病病人血糖的影响(某药对糖尿病病人血糖的影响(xs x)组组别别观察例数观察例数血糖(血糖(mmol/L)对照组对照组3018.3 310.9实验组实验组306.84.675一、统计描述典型错误辨析一、统计描述典型错误辨析辨辨析析:从从表表5-12可可以以看看出出,研研究究者者的的目目的的是是要要分分析析实实验验组组和和对对照照组组血血糖糖的的平平均均水水平平,分分别别用用 xs x表表示示。该该结结果

45、果数数据据显显示示,实实验验组组的的标标准准差差为为19.71,对对照照组组的的标标准准差差为为59.70,实实验验组组和和对对照照组组血血糖糖的的标标准准差差都都是是均均数数的的若若干干倍倍,此此资资料料不不太太可可能能为为正正态态分分布布。而而用用 xs x或或 xs表表达达结结果果时时,需需要要资资料料服从正态或近似正态分布。服从正态或近似正态分布。76一、统计描述典型错误辨析一、统计描述典型错误辨析注意:当资料服从正态分布时,用以上两种方法表注意:当资料服从正态分布时,用以上两种方法表达,其含意是不一致的。达,其含意是不一致的。xs x 反反映映的的是是在在相相同同的的实实验验条条件件

46、下下,样样本本均均值值与与总总体体均均值值的的接接近近程程度度,即即68.27的的可可能能性性包包含含总总体体均均数数,标准误的大小反映实验的准确度;标准误的大小反映实验的准确度;xs 反反映映在在相相同同的的实实验验条条件件下下观观测测值值在在样样本本均均数数附附近近的的波波动动大大小小,即即约约有有68.27的的观观测测值值在在 xs范范围围之之内内,标准差的大小反映实验的精密度。标准差的大小反映实验的精密度。77一、统计描述典型错误辨析一、统计描述典型错误辨析如如果果无无法法判判断断资资料料的的分分布布类类型型,先先对对资资料料进进行行正正态态性性检检验验,若若满满足足正正态态性性,根根

47、据据研研究究目目的的准准确确选选择择 xs x或或 xs。若若不不满满足足正正态态性性,可可进进行行数数据据转转换换,转转换换后后的的数数据据服服从从正正态态分分布布,可可用用以以上上两两种种方方法法描描述述,若若数数据据转转换换后后仍仍不不满满足足正正态态分分布布,用用中中位位数数描描述述血血糖糖平平均均水水平平,四四分位间距描述血糖值的离散程度。分位间距描述血糖值的离散程度。78一、统计描述典型错误辨析一、统计描述典型错误辨析(二)相对数应用错误(二)相对数应用错误例例5-5 5-5 300300例例糖糖尿尿病病患患者者中中2525岁岁以以下下者者占占25%25%,25254545岁岁者者

48、占占35%35%,4545岁岁及及以以上上者者占占40%40%,随随着着年年龄龄的的增增高高,糖糖尿尿病发病率也增高。病发病率也增高。辨辨析析:构构成成比比和和率率均均为为相相对对数数,都都可可以以用用百百分分率率表表示示,但但是是两两者者有有本本质质的的区区别别。构构成成比比表表示示事事物物内内部部各各个个组组成成部部分分所所占占总总体体的的比比重重;率率是是表表示示某某种种现现象象发发生生数数与与该该现现象象可可能能发发生生的的总总数数之之比比,即即某某种种现现象象发发生生的的频频率率或或强强度度。例例3中中的的三三个个相相对对数数均均是是构构成成比比,反反映映不不同同年年龄龄组组糖糖尿尿

49、病病的的病病例例数数占占总总病病例例数数的的比比重重,而而不不是是发发病病率率。因因此此,“随随着着年年龄龄的增高,糖尿病发病率也增高的增高,糖尿病发病率也增高”的结论是错误的。的结论是错误的。1.以以“构成比构成比”代代“率率”79一、统计描述典型错误辨析一、统计描述典型错误辨析例例5-6 5-6 用用不不同同抗抗癌癌药药物物治治疗疗胸胸腺腺肿肿瘤瘤大大鼠鼠,观观察察6 6周周大大鼠存活情况,结果见表鼠存活情况,结果见表5-135-13。2.计算相对数时分母太小计算相对数时分母太小组别组别鼠数(只)鼠数(只)存活鼠数(只)存活鼠数(只)6周存活率(周存活率(%)1周周2周周4周周6周周对照组

50、对照组66666100.0A药组药组6543233.3B药组药组6665583.3表表5-13 5-13 不同抗癌药对胸腺肿瘤大鼠不同抗癌药对胸腺肿瘤大鼠6 6周存活的影响周存活的影响80一、统计描述典型错误辨析一、统计描述典型错误辨析辨辨析析:计计算算相相对对数数时时的的分分母母不不能能太太小小。从从表表5-13中中可可以以看看出出,计计算算存存活活率率时时分分母母只只有有只只,显显然然分分母母太太小小,偶偶然然性性较较大大,不不能能反反映映真真实实情情况况。因因此此,在在这这种种情情况况下下用用绝绝对对数数表示即可。表示即可。81二、统计推断错误辨析二、统计推断错误辨析(一)定量资料统计推

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁