《《卫生统计学》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《卫生统计学》PPT课件.ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章 两组定量两组定量(或等级或等级)资料资料 平均值的比较平均值的比较 Nov,10,2009计量资料的统计分析计量资料的统计分析统计描述统计描述统计推断统计推断集中趋势集中趋势离散趋势离散趋势参数估计参数估计假设检验假设检验点估计,区间估计点估计,区间估计两样本均数比较两样本均数比较t,u-test多个样本均数比较多个样本均数比较F-testNov,10,2009两组定量资料(或等级资料)平均值的比较,是通过比较两组样本资料的平均值,来推断两组样本资料分别来自的总体的平均值是否相等,是统计推断的另一内容,即假设检验(hypothesis test)。Nov,10,2009假设检验的
2、步骤和原理假设检验的步骤和原理例 已知一般中学男生的心率的均数为0=74次/分,为研究经常参加体育锻炼的中学生心脏功能是否增强,在某地中学生中随机抽取常年参加体育锻炼的男生100名,得到心率平均值为65次/分,标准差s=6次/分。问常年参加体育锻炼的中学男生心率与一般中学男生的心率是否相等?Nov,10,2009Hypothesis test task 0(65|t|t0.01/2,9999,0.01,0.01,接受接受,拒绝,拒绝,差异有统计学意义差异有统计学意义专业结论:可认为经常参加体育锻炼的中学专业结论:可认为经常参加体育锻炼的中学男生心率的平均水平低与一般男生男生心率的平均水平低与一
3、般男生Nov,10,2009假设检验的基本思想假设检验的基本思想-概率反证法概率反证法先提出一个假设,然后借助一定的分布,先提出一个假设,然后借助一定的分布,看实际样本情况是否属小概率事件,对看实际样本情况是否属小概率事件,对所提出的假设做出统计推断所提出的假设做出统计推断-是否拒绝是否拒绝它。这种推断的基础是它。这种推断的基础是“小概率事件在小概率事件在一次试验(或观察)中是不发生的一次试验(或观察)中是不发生的”。Nov,10,2009第一节 样本均数与总体均数的比较样本均数与总体均数的比较是检验样本均数代表的未知总体均数和已知总体均数0(一般为理论值、标准值或经过大量观察所得的稳定值等)
4、的是否相等。Nov,10,2009一一、服从正态分布样本均数与总体均服从正态分布样本均数与总体均数的比较数的比较 正态分布样本均数与总体均数比较的t检验又称为单样本t检验,其运用条件为:样本含量n较小(一般n50),样本来自的总体是正态分布或近似正态分布,总体标准差未知;如样本量较小,但总体标准差已知,可选用u 检验。特殊情况:当样本含量较大,样本来自偏态分布的总体也可采用t-test;Nov,10,2009Nov,10,2009H H0 0 :0 0 ,即该地难产儿体重与一般婴儿出生体重相等,即该地难产儿体重与一般婴儿出生体重相等H H1 1 :0 0 ,即该地难产儿体重与一般婴儿出生体重不
5、同即该地难产儿体重与一般婴儿出生体重不同 0.002P 0 0 ,高原地区男子的血红蛋白含量高于一般成年男子高原地区男子的血红蛋白含量高于一般成年男子 因单侧界值u,故概率P3 在5冰箱中放置3天,溶液中的细菌数会增长(超过3个)单侧Nov,10,2009正态近似法正态近似法 当总体均数相当大时,Poisson分布近似正态分布,故当未知总体均数相当大时(一般20),可用标准正态统计量u公式Nov,10,2009第二节第二节 配对设计定量资料的假设检验配对设计定量资料的假设检验 配对设计有两种情况,自身配对和异源配对。自身配对是同一受试对象处理前后的比较或不同部位给予不同处理后比较,目的是推断该
6、处理有无作用;异源配对是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。解决这类问题,先求出各对差值d,根据差值d的总体资料是否呈正态分布,配对设计数值变量资料的假设检验可选用t检验或非参数检验 Nov,10,2009一、配对设计数值变量资料的一、配对设计数值变量资料的t t检验检验Nov,10,2009H0:d 0,避孕新药对女性血清总胆固醇含量无影响H1:d 0,避孕新药对女性血清总胆固醇含量有影响 以t,查附表2,t界值表得双尾概率0.10P。按水准,不拒绝H0,无统计学意义。还不能认为该新药对女性血清总胆固醇含量有影响。Nov,10,2009二、配对设计数值变
7、量资料的非参数二、配对设计数值变量资料的非参数检验检验参数检验(parametric statistic):t检验和u检验等一些统计推断方法要求样本来自的总体分布类型已知(如正态分布),在这种假设基础上,对总体参数(如总体均数)进行估计或检验 非参数统计(non-parametric statistic):这种方法并不依赖于总体的分布类型,应用时可以不考虑被研究的对象为何种分布以及分布是否已知,也由于这种假设检验方法并非是参数间的比较,而是用于分布之间的比较 Nov,10,2009参数检验与非参数检验优缺点比较参数检验与非参数检验优缺点比较Nov,10,2009什么时候做非参数检验?什么时候做
8、非参数检验?对于小样本的计量资料做t、F检验时,如不满足正态性、方差齐性的要求;即使经过变量变换后仍不满足要求;当资料的分布未知时;当资料中有不确定值时,如或;出现等级资料时,一般要用非参数检验。Nov,10,2009Wilcoxon配对秩和检验 Nov,10,2009第三节第三节 完全随机设计两样本平均值完全随机设计两样本平均值的比较的比较(一)一)t 检验检验/成组设计成组设计t检验检验Nov,10,2009条件:独立性、正态性和方差齐性Nov,10,2009正态性检验图示法:u正态概率纸图:横坐标是指标的刻度(组段),纵坐标是用概率单位的尺度表示的累积概率,应用起来较为方便。如果资料服从
9、正态分布,所画图形应为一条直线。uP-P图:横坐标是所观察数据的累计概率(observed cumulative proportion),纵坐标是假设数据是正态分布的累计概率的期望值(expected cumulative proportion)。Nov,10,2009Nov,10,2009统计检验方法W检验(and):在样本量为3n50时使用 D检验(DAgostino):样本量为50n1000时使用。矩法 利用数学上的矩原理来检验偏度和峰度。偏度指分布不对称的程度和方向,用偏度系数(coefficient of skewness)衡量,样本偏度系数用g1表示,总体偏度系数用1表示;而峰度指
10、分布与正态曲线相比峰的尖峭程度,用峰度系数(coefficient of kurtosis)衡量,样本峰度系数用g2表示,总体峰度系数用2表示。Nov,10,2009正态检验的假设检验格式:H0:样本来自正态分布的总体H1:样本不是来自正态分布的总体检验水准Nov,10,2009方差齐性检验 Nov,10,2009(二)u检验当两个样本含量较大(均大于50),t-test公式可用u-test来近似Nov,10,2009(三)检验当两总体呈正态分布,但方差不等即 时,两小样本均数比较,可选用近似t检验检验。Nov,10,2009二、两样本分布比较的秩和检验二、两样本分布比较的秩和检验成组设计的两
11、组数值资料在不满足正态分布的条件下,比较分布情况时选用两样本分布比较的秩和检验(Wilcoxon)。Nov,10,2009Nov,10,2009步骤步骤建立假设编秩 求秩和 T确定P值和作出推断结论 u查表u正态近似法Nov,10,2009三、两组等级资料比较的秩和检验三、两组等级资料比较的秩和检验当要比较的成组设计的两组资料为等级资料时,亦应用秩和检验。Nov,10,2009Nov,10,2009四、两四、两PoissonPoisson分布均数比较的分布均数比较的u u检验检验两组Poisson分布的资料均服从近似正态分布时,两均数进行比较,可根据正态近似原理选用u检验。u当两样本观察单位(
12、时间、面积、容积)相同时u当两样本观察单位(时间、面积、容积)不同时,需先将观察单位化为相等 Nov,10,2009假设检验的注意事项假设检验的注意事项(一)一)要有严密的设计要有严密的设计不同的资料要有不同的检验方法不同的资料要有不同的检验方法结论不能绝对化(差别有统计学意义)结论不能绝对化(差别有统计学意义)结论要与专业知识相结合结论要与专业知识相结合可信区间与假设检验等效,且可信区间得出可信区间与假设检验等效,且可信区间得出的信息更加丰富的信息更加丰富Nov,10,2009假设检验的注意事项假设检验的注意事项(二)二)I型错误型错误(type one error):拒绝实际上成立的拒绝实际上成立的0,或,或者叫者叫“弃真弃真”,其最大的错误大小为,其最大的错误大小为;II型错误型错误(type two error):接受了实际上不成立的:接受了实际上不成立的0,或者叫,或者叫“取伪取伪”,其大小为,其大小为;检验效能检验效能(power of test):当总体确有差别,按规定当总体确有差别,按规定的水准的水准所能发现该差异的能力所能发现该差异的能力(1-);越大,越大,越小;越小;越小,越小,越大;要同时减少越大;要同时减少,增加样本量,增加样本量n n。Nov,10,2009Nov,10,2009