《循证医学实践中常用统计学方法.pptx》由会员分享,可在线阅读,更多相关《循证医学实践中常用统计学方法.pptx(101页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、目 录第一节第一节 概概 述述1第二二节 常用统计方法23第三三节 统计方法常见错误及辨析第1页/共101页教学要求:教学要求:1.1.掌握医学统计的基本概念;掌握医学统计的基本概念;2.2.熟悉医学统计学的基本内容;熟悉医学统计学的基本内容;3.3.了解多变量资料统计分析方法及选择思路。了解多变量资料统计分析方法及选择思路。第2页/共101页 【案 例】某作者比较腹腔镜胰十二指肠切除术与传统开腹手术行胰十二指肠切除术的近期临床疗效和安全性,结局指标有:手术时间;术中出血量;是否再次手术;住院时间;是否围手术期死亡;是否有胰漏发生、切口感染、延迟性胃排空等。有关的结局指标涉及的统计资料类型有哪
2、些?有关的参数估计和假设检验方法有哪些?第3页/共101页4第一节第一节 概概 述述1234医学统计学定义医学统计学定义基本概念基本概念统计资料常见类型统计资料常见类型小结思考小结思考第4页/共101页5l若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。Florence Nightingale 1820一1910What is Statistics?什么是统计学?第5页/共101页6天气预报天气预报无处不在的统计学第6页/共101页7人类学人类学文学文学经济学经济学史学史学地理学地理学物理学物理学社会学社会学农学农学生物学生物学医学医学药学药学中医学中医学气象学气象学法学
3、法学医学统计学医学统计学MedicalStatistics卫生统计学卫生统计学HealthStatistics生物统计学生物统计学Biostatistics科研中的统计学第7页/共101页Websters International Dictionary:A science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”John M.Last,A Dictionary of Epidemiology:The science and art of d
4、ealing with variation in data through collection,classification,and analysis in such a way as to obtain reliable results”第8页/共101页9医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。医学统计学(Medical Statistics)医学统计学的定义医学统计学的定义第9页/共101页10医学研究的基本内容1.1.医学科研的统计设计医学科研的统计设计2.2.资料分析资料分析假设假设搜集、整理、分析数据搜集
5、、整理、分析数据调查设计实验设计l统计描述:统计指标l统计推断:参数估计、假设检验第10页/共101页医学统计学的应用11n 以正确的方式收集资料n 描述资料的统计特征n 统计推断及得出正确结论第11页/共101页12一、一些重要概念同质和异质同质和异质变异变异总体和个体总体和个体参数和统计量参数和统计量随机随机概率和频率概率和频率小概率事件和小概率原理小概率事件和小概率原理抽样误差抽样误差第12页/共101页13基本概念之一:同质和异质l同质(homogeneity):性质相同l异质(heterogeneity):性质不同同质和异质是相对的概念同质和异质是相对的概念不同质的个体不能笼统地混在
6、一起分析不同质的个体不能笼统地混在一起分析个体的同质性是构成研究总体的必备条件个体的同质性是构成研究总体的必备条件研究内容研究内容(指标指标/变量变量)不同,对同质性的要求不同不同,对同质性的要求不同第13页/共101页14在研究事物的形状时同质和异质示例在研究事物的颜色时第14页/共101页15基本概念之二:变异 同质事物之间的差别称为同质事物之间的差别称为变异变异(Variation)变异的两个方面:变异的两个方面:不同观察单位(个体)间的差别不同观察单位(个体)间的差别同一个体在不同阶段的差别(重复测量)同一个体在不同阶段的差别(重复测量)第15页/共101页16变异示例发热者体温波动正
7、常人体温波动第16页/共101页17基本概念之二:变异同质个体间的差异。同质个体间的差异。结果是随机的,不可预测的。结果是随机的,不可预测的。一种或多种不可控因素一种或多种不可控因素(已知的或未知的已知的或未知的)作用下的综合表现。作用下的综合表现。个体变异是普遍存在的。个体变异是普遍存在的。个体变异是有规律的。个体变异是有规律的。没有个体变异,就没有统计学!没有个体变异,就没有统计学!第17页/共101页18基本概念之三:总体、个体和样本 总总体体(population):按按研研究究目目的的所所确确定定的的同同质质研研究究对对象象某某项项观观察察指指标标的的全全体体,即全体观察单位。即全体
8、观察单位。有限总体有限总体(finite)无限总体无限总体(infinite)个个体体(individual):是是构构成成总总体体的的最最基基本观察单位;本观察单位;样样本本(randomsample):从从研研究究总总体体中中随机抽取具有代表性的部分观察单位。随机抽取具有代表性的部分观察单位。代表性,包含了总体的特性代表性,包含了总体的特性为什么要抽样?为什么要抽样?第18页/共101页19基本概念之四:参数和统计量 l总体参数总体参数(parameter):刻画总体特征的指标;刻画总体特征的指标;一般用希腊字母表示,如:一般用希腊字母表示,如:、pl统计量统计量(statistic):样
9、本统计指标样本统计指标一般用拉丁字母表示,如:一般用拉丁字母表示,如:、s、pl在在总总体体被被确确定定之之后后,总总体体参参数数就就是是一一个个常常数数,是是不不会会变变化化的的,不不管管你你是是否否确确切切知知其其大大小小;而而统计量是几乎总是随着样本而变的。统计量是几乎总是随着样本而变的。第19页/共101页20基本概念之五:随机随机随机(random):):是指机会均等,无主观影响,目的是保证是指机会均等,无主观影响,目的是保证样本对总体的代表性、可靠性。样本对总体的代表性、可靠性。机会均等,无主观影响机会均等,无主观影响抽样随机抽样随机(randomsampling)有相同的机会被抽
10、到有相同的机会被抽到分组随机分组随机(randomallocation)有相同的机会被分到不同的组中有相同的机会被分到不同的组中顺序随机顺序随机(randomorder)有相同的机会先后接受处理有相同的机会先后接受处理第20页/共101页21基本概念之六:频率和概率频率频率Relativefrequency:在在n次随机试验中,事件次随机试验中,事件A发生了发生了m次,则次,则比值比值称为事件称为事件A在这在这n次试验中出现的次试验中出现的频率频率第21页/共101页22基本概念之六:频率和概率抛硬币试验在概率的统计学定义上的诠释抛硬币试验在概率的统计学定义上的诠释试验者试验者投掷次数投掷次数
11、出现出现“正面正面”次数次数频率频率XXX20120.6000Buffon404020480.5069DeMorgan409220480.5005Fisher1000049790.4979K.Pearson1200060190.5016K.Pearson24000120120.5005第22页/共101页23基本概念之六:频率和概率概率的统计学定义:概率的统计学定义:数理统计学中的大数定理表明:当观察次数数理统计学中的大数定理表明:当观察次数n越来越越来越大,频率大,频率f 的随机波动幅度越来越小,并最终趋向于一的随机波动幅度越来越小,并最终趋向于一个常数个常数p:随机事件:随机事件A发生的发
12、生的概率概率(Probability)。概率概率描述事件发生可能性大小的一个度量描述事件发生可能性大小的一个度量。是一种参。是一种参数。数。常用常用P来表示;来表示;0P 1第23页/共101页24基本概念之七:小概率事件小概率事件小概率事件(rareevent)当某事件发生的概率很小当某事件发生的概率很小(可能性很小可能性很小),统计学上称该事件为,统计学上称该事件为小概率事件。小概率事件。医学上:小于或等于医学上:小于或等于0.050.05小概率原理小概率原理小小概概率率事事件件并并不不表表示示不不可可能能发发生生,但但在在某某一一次次试试验验中中,可可认认为为是是不会发生的。不会发生的。
13、第24页/共101页25误差误差(error)指实际观察值与观察真值之差、样本指标与总指实际观察值与观察真值之差、样本指标与总体指标之差。体指标之差。基本概念之八:抽样误差 误差分类产生原因对观察值的影响处理方法系统误差仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等。使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。通过实验设计的完善和技术措施的改进来消除或减少。随机误差排除系统误差后,其他多种不确定因素。使观察值不按方向性、系统性而随机的变化,误差变量一般服从正态分布。可通过统计处理估计随机误差。第25页/共101页26二、统计资料常见类型 在在医医学学研
14、研究究中中,根根据据研研究究目目的的的的要要求求对对一一些些观观察察项项目目或或研研究究指指标标在在一一些些研研究究对对象象中中进进行行观观察察(或或测测量量),由由于于这这些些指指标标存存在在着着变变异异,故故把把这这些些观观察察项项目目或或研研究究指指标标称称为为随随机机变变量量,简简称称变变量量(variable),而而观观察察结结果果对对应应的的取取值值称为称为变量值或观察值变量值或观察值。第26页/共101页27按照取值的特性:数值变量 Numerical Variable 定量变量:既有顺序的意义,又有间隔的意义,可以认为是连续的;往往有单位;取值间的差异是可以度量的分类变量 Ca
15、tegorical Variable:取值是是分散、定性的,表现为互不相容的类别和属性无序分类 Unordered Categorical定性变量:无顺序,无间隔,仅有分类二项分类多项分类有序分类 Ordered Categorical 等级变量:仅有顺序,无单位;取值间的差异是不可度量的第27页/共101页28资料类型的判断病例号年龄(岁)性别身高(cm)血型心电图尿WBC职业RBC1012/L135女1.65A正常教师4.67244男1.74B正常工人5.21326男1.80O正常职员4.10425女1.61AB正常农民3.92541男1.71A异常+工人3.49645女1.58B正常+工
16、人5.48750女1.60O异常+干部6.78828男1.76AB正常+干部7.10931女1.62O正常军人5.24第28页/共101页29不同分类的互相转化不同分类的互相转化 定量资料(数值变量)定量资料(数值变量)定性资料(无序分类变量)定性资料(无序分类变量)定量资料(数值变量)定量资料(数值变量)等级资料(有序分类变量)等级资料(有序分类变量)等级资料(有序分类变量)等级资料(有序分类变量)定性资料(无序分类变量)定性资料(无序分类变量)信息量只有减少,不可增加信息量只有减少,不可增加 第29页/共101页30基本概念汇总总体个体、个体变异总体参数未知样本代表性、抽样误差随机抽样样本
17、统计量已知统计推断风 险第30页/共101页31总结l基本概念:基本概念:统计学,统计学研究的步骤统计学,统计学研究的步骤统计资料的分类统计资料的分类同质、变异同质、变异总体、个体、样本总体参数、样本统计量、样本含量总体、个体、样本总体参数、样本统计量、样本含量随机随机概率、小概率事件、小概率原理概率、小概率事件、小概率原理抽样误差抽样误差变量的分类变量的分类第31页/共101页32第二节 常用统计方法常用统计方法1234分类变量资料常用统计方法分类变量资料常用统计方法数值变量资料常用统计方法数值变量资料常用统计方法常用统计方法的选择常用统计方法的选择思考题思考题第32页/共101页33l描描
18、述述性性统统计计分分析析:以以统统计计表表、统统计计图图统统计计指指标标(如如均均数数、标标准准差差等等)对对资资料料的的数数量量特特征征及及其其分分布布规规律律进行测定和描述。进行测定和描述。l推推断断性性统统计计分分析析:如如何何由由样样本本信信息息推推断断总总体体特特征征的的问题。问题。参数估计:区间估计(参数估计:区间估计(95%CI)假设检验:假设检验:t,F,z检验等检验等基本统计分析方法第33页/共101页34一、分类变量资料常用统计方法1.1.分类变量资料的统计描述分类变量资料的统计描述数据形式数据形式绝对数绝对数相对数相对数比、比例、率比、比例、率第34页/共101页35比(
19、ratio)两者的相对水平两者的相对水平分子分子不必包含不必包含在分母里在分母里可以比较不同属性的事件或状态可以比较不同属性的事件或状态=5/2 =2.5/1第35页/共101页36构成比(proportion)某一事物内部各组成部分所占的比重某一事物内部各组成部分所占的比重分子分子必须包含必须包含在分母里在分母里比较的必须是同一属性的事件或状态比较的必须是同一属性的事件或状态波动范围只能是波动范围只能是0 01 12-=0.5=50%4第36页/共101页率(rate)37描述特定时间里某事件发生的速度描述特定时间里某事件发生的速度分子:分子:特定时间里观察的特定时间里观察的新发事件数新发事
20、件数分母:分母:事件发生的人群基数事件发生的人群基数 (危险人口)危险人口)2-=0.02/year 100Observed in 1998第37页/共101页38n防止概念混淆防止概念混淆n计算相对数时分母应有足够数量计算相对数时分母应有足够数量 n正确地合并估计频率正确地合并估计频率(或强度或强度)型指标型指标 n相相对对数数间间的的比比较较要要具具备备可可比比性性:观观察察的的对对象象是是否否同同质质,研研究究的的方方法法(如如检检测测手手段段、抽抽样样方方法法)是是否否相相同同,观观察察的的时时间间是是否否一一致致等等;被被比比较较的的总总体体是否具有可比性是否具有可比性 n对相对数的
21、统计推断对相对数的统计推断 应用相对数应注意的事项第38页/共101页392.2.分类变量资料的统计推断分类变量资料的统计推断参数估计:参数估计:点估计点估计 区间估计区间估计假设检验:假设检验:检验、检验、u u检验检验 非参数检验非参数检验 第39页/共101页无序分类资料统计方法40比较目的比较目的 应用条件应用条件统计方法统计方法样本与总体检验样本与总体检验np5,n(1-P)5二项分布二项分布u检验检验n很小很小二项分布直接法二项分布直接法两样本比较检验两样本比较检验np5,n(1-P)5二项分布二项分布u检验检验n40,T5四格表四格表 检验检验n40,1T40配对配对检验检验b+
22、c1,1T5的格的格子数超过子数超过1/5列联表列联表检验检验T1四格表确切概率法四格表确切概率法第40页/共101页等级资料统计方法41比较目的比较目的 统计方法统计方法配对等级资料配对等级资料Wilcoxon单样本秩和检验单样本秩和检验两独立样本等级资料两独立样本等级资料Wilcoxon两样本秩和检验两样本秩和检验多组独立样本等级资料多组独立样本等级资料Kruskal-Wallis秩和检验秩和检验第41页/共101页单变量计数资料的统计方法选择思路42第42页/共101页43二、数值变量资料常用统计方法1.1.数值变量资料的统计描述数值变量资料的统计描述集中趋势和离散趋势124132140
23、148156164010203040人数身高(cm)第43页/共101页44n 集中趋势的描述集中趋势的描述 即即大大多多数数数数值值落落在在什什么么位位置置上上。(针针对对一一个个变量的若干个数值)变量的若干个数值)1.1.算术均数(均数)算术均数(均数)2.2.几何均数几何均数3.3.中位数中位数第44页/共101页45算术均数(均数)算术均数(均数)l意义:一组性质相同的观察值在数量上的平均水平。意义:一组性质相同的观察值在数量上的平均水平。l表示表示 (总体)(总体)X X(样本)样本)l特征:特征:(X(X-X)=0X)=0l应用:正态分布或近似正态分布应用:正态分布或近似正态分布l
24、注意:合理分组,才能求均数,否则没有意义。注意:合理分组,才能求均数,否则没有意义。第45页/共101页46几何均数几何均数l意意义义:N N个个数数值值的的乘乘积积开开N N次次方方即即为为这这N N个个数数的的几几何何均数。均数。l表示:表示:G Gl应应用用:原原始始数数据据分分布布不不对对称称,经经对对数数转转换换后后呈呈对对称称分分布布的的资资料料。数数值值范范围围跨跨越越多多个个数数量量级级。例例如如抗抗体体滴度。滴度。第46页/共101页47中位数、百分位数中位数、百分位数l意意义义:将将一一组组观观察察值值从从小小到到大大排排序序后后,居居于于中中间间位位置的那个值或两个中间值
25、的平均值。(身高排队)置的那个值或两个中间值的平均值。(身高排队)l表示:表示:M M、PXPXl百百分分位位数数:将将N N个个观观察察值值从从小小到到大大依依次次排排列列,再再分分成成100100等等份份,对对应应于于X%X%位位的的数数值值即即为为第第X X百百分分位位数数。中位数是百分位的特殊形式。中位数是百分位的特殊形式。l应用:偏态资料,开口资料应用:偏态资料,开口资料第47页/共101页48n 离散趋势的描述:离散趋势的描述:反映一组数据的变异大小反映一组数据的变异大小l极差极差l四分位数间距四分位数间距l方差方差l标准差标准差l变异系数变异系数 常用指标常用指标第48页/共10
26、1页49标准差l相关概念:离均差、离均差之和、离均差平方和、方相关概念:离均差、离均差之和、离均差平方和、方差(差(2S2)l标准差的符号:标准差的符号:S l意义:全面反映了一组观察值的变异程度意义:全面反映了一组观察值的变异程度(大小大小)l应用:描述变异程度、计算标准误、计算变异系数、应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围描述正态分布、估计正常值范围第49页/共101页502.2.数值变量资料的统计推断数值变量资料的统计推断参数估计:参数估计:点估计点估计 区间估计区间估计假设检验:假设检验:t 检验、方差分析检验、方差分析 非参数检验非参数检验 第5
27、0页/共101页51t检验(检验(N30、60)应用条件:应用条件:来自正态分布的总体;来自正态分布的总体;所比较总体的方差相同。所比较总体的方差相同。用途:用途:n样本均数与总体均数的比较样本均数与总体均数的比较n配对资料差值均数的比较配对资料差值均数的比较n两样本均数的比较两样本均数的比较第51页/共101页52u检验(检验(N30、60)用途:用途:n样本均数与总体均数的比较样本均数与总体均数的比较n配对资料差值均数的比较配对资料差值均数的比较n两样本均数的比较两样本均数的比较第52页/共101页53方差分析方差分析应用条件:应用条件:来自正态分布的总体;来自正态分布的总体;所比较总体的
28、方差相同。所比较总体的方差相同。用途:用途:n完全随机设计方差分析完全随机设计方差分析n随机区组设计方差分析随机区组设计方差分析n多个样本均数间的两两比较多个样本均数间的两两比较第53页/共101页54秩和检验秩和检验(非参数方法非参数方法)用途:用途:n配对资料差值的符号秩和配对资料差值的符号秩和 检验检验n成组设计两样本比较秩和成组设计两样本比较秩和 检验检验n成组设计多样本比较秩和成组设计多样本比较秩和 检验检验第54页/共101页55单变量数值变量资料的统计方法选择思路第55页/共101页56双变量资料的统计学检验方法选择思路第56页/共101页573.3.双变量资料分析常用统计方法双
29、变量资料分析常用统计方法分析目的分析目的 应用条件应用条件统计方法统计方法两变量的相互关系两变量的相互关系二元正态分布二元正态分布Pearson积矩相关分析积矩相关分析分分布布未未知知、等等级级资料资料Spearman秩相关分析秩相关分析两变量的依存关系两变量的依存关系应应变变量量正正态态、有有线性趋势线性趋势线性回归的分析线性回归的分析曲线趋势曲线趋势曲线回归分析曲线回归分析 第57页/共101页583.3.多变量资料分析常用统计方法多变量资料分析常用统计方法资料类型资料类型应用条件应用条件统计方法统计方法有应变量有应变量自、应变量都是正态自、应变量都是正态多元线性回归多元线性回归应变量为生
30、存时间应变量为生存时间Cox生存分析生存分析应变量为分类变量应变量为分类变量Logistic回归回归无应变量无应变量聚类、因子、主成分分析聚类、因子、主成分分析相关分析相关分析多重线性、典型相关分析多重线性、典型相关分析第58页/共101页59三、常用统计方法的选择三、常用统计方法的选择不同类型的资料采用不同的统计分析方法不同类型的资料采用不同的统计分析方法 计计量量资资料料的的统统计计分分析析方方法法:t检检验验、u检检验验、方方差差分析、相关与回归分析分析、相关与回归分析 计计数数资资料料的的统统计计分分析析方方法法:卡卡方方检检验验、二二项项分分布和布和Poission分布、相关与回归分
31、析分布、相关与回归分析 等级资料的统计分析方法:等级资料的统计分析方法:秩和检验秩和检验 第59页/共101页60不同设计类型采用相应的统计分析方法不同设计类型采用相应的统计分析方法完完全全随随机机设设计计:对对两两组组计计量量资资料料的的比比较较:t检检验验、完全随机设计方差分析、完全随机设计方差分析、Kruskal-Wallis检验;检验;区区组组随随机机设设计计(或或配配对对设设计计):配配对对t检检验验、区区组组随随机机设设计计的的方方差差分分析析、Friedman检检验验、kappa检验检验第60页/共101页61例5-1 5-1 某某研研究究所所为为研研究究某某药药物物的的抑抑癌癌
32、作作用用,使使一一批批小小白白鼠鼠致致癌癌后后,将将一一批批致致癌癌小小白白鼠鼠4040只只按按完完全全随随机机设设计计的的方方法法分分为为四四组组,A A、B B、C C三三个个试试验验组组和和一一个个对对照照组组,分分别别接接受受不不同同的的处处理理。A A、B B、C C三三个个试试验验组组,分分别别注注射射0.5m10.5m1、1.0m11.0m1和和1.5m1 1.5m1 3030的的注注射射液液,对对照照组组不不用用药药。经经一一定定时时间间以以后后,测测定定四四组组小小白鼠的肿瘤重量白鼠的肿瘤重量(g)(g),测量结果见表,测量结果见表5-75-7。试进行统计分析。试进行统计分析
33、。第61页/共101页62某药物对小白鼠抑癌作用某药物对小白鼠抑癌作用(肿瘤重量,肿瘤重量,g)的试验结果的试验结果对照组对照组试试验验组组ABC3.63.00.43.34.52.31.81.24.22.42.11.34.41.14.52.53.74.03.63.15.63.71.33.27.02.83.20.64.11.92.11.45.02.62.61.34.51.32.32.1第62页/共101页63各组的均数、标准差、标准误及总体均数各组的均数、标准差、标准误及总体均数95%可信区间可信区间组别组别n95%可信区间对照组对照组104.6600 1.00907.31910 3.93825
34、.3818实验组实验组A 102.5100.93387.29532 1.84203.1780实验组实验组B 102.3900 1.16852.36952 1.55413.2259实验组实验组C 102.0000.97411.30804 1.30322.6968第63页/共101页本本例例为为单单变变量量计计量量资资料料,分分组组因因素素只只有有药药物物1个个,共共4个个水水平平,设设计计类类型型为为完完全全随随机机设设计计,4组组资资料料经经方方差差齐齐性性检检验验,Levene统统计计量量为为0.178,P=0.910,在在的的水水准准,各各组组方方差差差差别别无无统统计计学学意意义义,可可
35、选选择择单单因因素素方方差差分分析析(one-wayANOVA)。方方差差分分析析结结果果,P0.001,可可认认为为4个个不不同同剂剂量量药药物物注注射射液液的的抑抑癌癌作作用用有有差差别别。再再用用Dunnett-t检检验验作作多多个个实实验验组组与与一一个个对对照照组组之之间间的的比比较较,结结果果。,-,在在=0.01水水准准上上均均有有统统计计学学意意义义;可可认认为为3个个不不同同剂剂量量药药物物注注射射液液与与对对照照组组的的小小白白鼠鼠肿肿瘤瘤重重量量有有差差别别,即即3个个不不同同剂剂量量药药物注射液都有抑癌作用。物注射液都有抑癌作用。64第64页/共101页65例例5-2
36、5-2 某某研研究究者者收收集集103103例例冠冠心心病病患患者者和和100100例例正正常常对对照照者者的的多多项项指指标标,部部分分资资料料见见表表5-95-9。其其中中G G为为组组别别,X1X1为为性性别别,X2,X2为为年年龄龄,X3X3为为患患高高血血压压史史,X4X4为为吸吸烟烟史史,X5X5为为胆胆固固醇醇含含量量,X6X6为为甘甘油油三三酯酯含含量量,X7X7为为低低密密度度脂脂蛋蛋白白含含量量,X8X8为为高高密密度度脂脂蛋蛋白白含含量量,X9X9为为脂脂蛋蛋白白含含量量,X10X10为为载载脂脂蛋蛋白白A1A1含含量量,X11X11为为载载脂脂蛋蛋白白B B含含量量,X
37、12X12为为基基因因EcoREcoR型型。表表5-105-10简简要要列列出出根根据据研研究者部分研究目的而拟采用的统计分析方法。究者部分研究目的而拟采用的统计分析方法。第65页/共101页66编号编号GX1X2X3X4X5X6X7X8X9X10X11X1211男男60NN223 205 122 30106 0.920.74-/-21女女46NN166 518457561.140.54+/-1031男76YY195 101 135 42302 0.910.65+/+1042女女39NN223 48157 55321.060.71+/+2022男男40NN152 91100 46621.000
38、.55-/-2032男男60NY168 84106 33205 0.670.69+/+冠心病患者和正常对照者多项指标的部分观测结果冠心病患者和正常对照者多项指标的部分观测结果第66页/共101页67研究目的和拟采用的统计分析方法研究目的和拟采用的统计分析方法编号编号 研究目的研究目的拟采用统计分析方法拟采用统计分析方法1 1EcoREcoR基因型不同的冠心病患者,每项的血脂指标有无差别单因素方差分析单因素方差分析2 2EcoREcoR基因型不同的冠心病患者,整体的血脂指标有无差别多元方差分析多元方差分析3 3根据血脂指标对冠心病患者进行分类根据血脂指标对冠心病患者进行分类样品聚类分析样品聚类分
39、析4 4对冠心病患者血脂指标进行分类对冠心病患者血脂指标进行分类指标聚类分析指标聚类分析5 5利用血脂指标对冠心病可疑患者进行辅助诊断利用血脂指标对冠心病可疑患者进行辅助诊断判别分析判别分析6 6对对冠冠心心病病患患者者血血脂脂指指标标进进行行降降维维,寻寻找找独独立立的的综合指标综合指标主成分分析主成分分析7 7筛选冠心病的危险因素,筛选冠心病的危险因素,LogisticLogistic回归分析第67页/共101页思考题681某某医医院院用用新新药药与与常常规规药药物物治治疗疗婴婴幼幼儿儿贫贫血血,将将20名名贫贫血血患患儿儿随随机机分分为为两两组组,分分别别接接受受两两种种药药物物治治疗疗
40、,测测得得血血红红蛋蛋白白增加量增加量(g/L)如下表,请回答下列问题:如下表,请回答下列问题:1)新药与常规药的疗效有无差别?新药与常规药的疗效有无差别?2)根据研究问题,请分别给出两个样本所在总体的定义。根据研究问题,请分别给出两个样本所在总体的定义。新药组新药组 24362514263423201519常规组常规组14182015222421252723两种药物治疗婴幼儿贫血的血红蛋白增加量(两种药物治疗婴幼儿贫血的血红蛋白增加量(g/L)第68页/共101页思考题69224名名甲甲状状腺腺功功能能低低下下的的婴婴儿儿,按按病病情情严严重重程程度度把把他他们们分分为为3个个水水平平:轻轻
41、度度组组9名名,中中度度组组8名名,重重度度组组7名名。表表中中列列出了他们的血清甲状腺素含量出了他们的血清甲状腺素含量(nmol/l)。试试分分析析不不同同严严重重程程度度的的婴婴儿儿血血清清甲甲状状腺腺素素水水平平是是否否差差异异有有统统计计学学意意义义。分分别别用用LSD法法和和Bonferroni法法作作多多重重比比较较,对对结果作出统计学和专业领域内的解释。结果作出统计学和专业领域内的解释。病情分类病情分类例数例数 甲状腺素含量甲状腺素含量轻度轻度934454955585960中度中度8825364042536574重度重度7581832454765第69页/共101页70第三节第三
42、节常用统计方法典型错误及辨析常用统计方法典型错误及辨析123统计描述典型错误辨析统计描述典型错误辨析统计推断错误辨析统计推断错误辨析思考题思考题第70页/共101页71一、统计描述典型错误辨析一、统计描述典型错误辨析(一)不考虑资料的分布状态滥用均数和标准差(一)不考虑资料的分布状态滥用均数和标准差例例5-3 5-3 某某地地发发生生一一起起原原因因不不明明疾疾病病,共共有有8080人人发发病病,从从接接触触传传染染源源到到发发病病的的时时间间(潜潜伏伏期期)见见表表5-115-11,作作者者求得其平均潜伏期求得其平均潜伏期 x=9.1x=9.1天。该结论对否?天。该结论对否?表表5-11某地
43、原因不明疾病的发病时间某地原因不明疾病的发病时间潜伏期(天)潜伏期(天)发病人数发病人数526575815940101211121合计合计80第71页/共101页72一、统计描述典型错误辨析一、统计描述典型错误辨析辨辨析析:从从表表中中可可以以看看出出,该该资资料料为为偏偏态态分分布布资资料料,描描述述其其平平均均潜潜伏伏期期应应该该用用中中位位数数,而而不不能能用用均均数数表表示,计算得出平均潜伏期示,计算得出平均潜伏期M=8.3M=8.3天,而不能用天,而不能用 x x。第72页/共101页73一、统计描述典型错误辨析一、统计描述典型错误辨析(一)不考虑资料的分布状态滥用均数和标准差(一)
44、不考虑资料的分布状态滥用均数和标准差例例5-4 5-4 某某医医生生研研究究某某药药对对糖糖尿尿病病的的治治疗疗效效果果,结结果果见见表表5-125-12。表表5-12某药对糖尿病病人血糖的影响(某药对糖尿病病人血糖的影响(xs x)组组别别观察例数观察例数血糖(血糖(mmol/L)对照组对照组3018.3 310.9实验组实验组306.84.6第73页/共101页74一、统计描述典型错误辨析一、统计描述典型错误辨析辨辨析析:从从表表5-12可可以以看看出出,研研究究者者的的目目的的是是要要分分析析实实验验组组和和对对照照组组血血糖糖的的平平均均水水平平,分分别别用用 xs x表表示示。该该结
45、结果果数数据据显显示示,实实验验组组的的标标准准差差为为19.71,对对照照组组的的标标准准差差为为59.70,实实验验组组和和对对照照组组血血糖糖的的标标准准差差都都是是均均数数的的若若干干倍倍,此此资资料料不不太太可可能能为为正正态态分分布布。而而用用 xs x或或 xs表表达达结结果果时时,需需要要资资料料服从正态或近似正态分布。服从正态或近似正态分布。第74页/共101页75一、统计描述典型错误辨析一、统计描述典型错误辨析注意:当资料服从正态分布时,用以上两种方法表注意:当资料服从正态分布时,用以上两种方法表达,其含意是不一致的。达,其含意是不一致的。xs x 反反映映的的是是在在相相
46、同同的的实实验验条条件件下下,样样本本均均值值与与总总体体均均值值的的接接近近程程度度,即即68.27的的可可能能性性包包含含总总体体均均数数,标准误的大小反映实验的准确度;标准误的大小反映实验的准确度;xs 反反映映在在相相同同的的实实验验条条件件下下观观测测值值在在样样本本均均数数附附近近的的波波动动大大小小,即即约约有有68.27的的观观测测值值在在 xs范范围围之之内内,标准差的大小反映实验的精密度。标准差的大小反映实验的精密度。第75页/共101页76一、统计描述典型错误辨析一、统计描述典型错误辨析如如果果无无法法判判断断资资料料的的分分布布类类型型,先先对对资资料料进进行行正正态态
47、性性检检验验,若若满满足足正正态态性性,根根据据研研究究目目的的准准确确选选择择 xs x或或 xs。若若不不满满足足正正态态性性,可可进进行行数数据据转转换换,转转换换后后的的数数据据服服从从正正态态分分布布,可可用用以以上上两两种种方方法法描描述述,若若数数据据转转换换后后仍仍不不满满足足正正态态分分布布,用用中中位位数数描描述述血血糖糖平平均均水水平平,四四分位间距描述血糖值的离散程度。分位间距描述血糖值的离散程度。第76页/共101页77一、统计描述典型错误辨析一、统计描述典型错误辨析(二)相对数应用错误(二)相对数应用错误例例5-5 5-5 300300例例糖糖尿尿病病患患者者中中2
48、525岁岁以以下下者者占占25%25%,25254545岁岁者者占占35%35%,4545岁岁及及以以上上者者占占40%40%,随随着着年年龄龄的的增增高高,糖糖尿尿病发病率也增高。病发病率也增高。辨辨析析:构构成成比比和和率率均均为为相相对对数数,都都可可以以用用百百分分率率表表示示,但但是是两两者者有有本本质质的的区区别别。构构成成比比表表示示事事物物内内部部各各个个组组成成部部分分所所占占总总体体的的比比重重;率率是是表表示示某某种种现现象象发发生生数数与与该该现现象象可可能能发发生生的的总总数数之之比比,即即某某种种现现象象发发生生的的频频率率或或强强度度。例例3中中的的三三个个相相对
49、对数数均均是是构构成成比比,反反映映不不同同年年龄龄组组糖糖尿尿病病的的病病例例数数占占总总病病例例数数的的比比重重,而而不不是是发发病病率率。因因此此,“随随着着年年龄龄的增高,糖尿病发病率也增高的增高,糖尿病发病率也增高”的结论是错误的。的结论是错误的。1.以以“构成比构成比”代代“率率”第77页/共101页78一、统计描述典型错误辨析一、统计描述典型错误辨析例例5-6 5-6 用用不不同同抗抗癌癌药药物物治治疗疗胸胸腺腺肿肿瘤瘤大大鼠鼠,观观察察6 6周周大大鼠存活情况,结果见表鼠存活情况,结果见表5-135-13。2.计算相对数时分母太小计算相对数时分母太小组别组别鼠数(只)鼠数(只)
50、存活鼠数(只)存活鼠数(只)6周存活率(周存活率(%)1周周2周周4周周6周周对照组对照组66666100.0A药组药组6543233.3B药组药组6665583.3表表5-13 5-13 不同抗癌药对胸腺肿瘤大鼠不同抗癌药对胸腺肿瘤大鼠6 6周存活的影响周存活的影响第78页/共101页79一、统计描述典型错误辨析一、统计描述典型错误辨析辨辨析析:计计算算相相对对数数时时的的分分母母不不能能太太小小。从从表表5-13中中可可以以看看出出,计计算算存存活活率率时时分分母母只只有有只只,显显然然分分母母太太小小,偶偶然然性性较较大大,不不能能反反映映真真实实情情况况。因因此此,在在这这种种情情况况