《总体均数估计与假设检验及t检验.ppt》由会员分享,可在线阅读,更多相关《总体均数估计与假设检验及t检验.ppt(95页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、定量资料的统计推断定量资料的统计推断 在在医医学学科科研研当当中中,常常常常要要利利用用抽抽样样研研究究的的方方法法,通通过过对对总总体体中中部部分分样样本本的的研研究究来来估估计计总总体体。这这种种用用样样本本的的指指标标来来推推断断总总体体的的方方法法,统统计计上上叫叫做做“统统计计推推断断”,统统计计推推断断的的方方法法是是我我们们统统计计工工作作中中最最常常用用的方法。的方法。总体总体样本样本 samplingsampling 统计量统计量统计量统计量 参参参参 数数数数 参数估计参数估计 假设检验假设检验 统计推断的内容统计推断的内容 参数估计参数估计 均数的抽样误差和标准误均数的抽
2、样误差和标准误 t t分布分布 总体均数的估计总体均数的估计 既既然然是是抽抽样样研研究究,那那么么就就一一定定存存在在着着抽抽样样误误差差(由由于于个个体体变变异异),每每次次抽抽到到的的样样本本均均数数之之间间或或者者样样本本均均数数与与总总体体均均数数之之间间都都不不尽尽相相同同,总总是是有有差差别别的的。因因此此,估估计计抽抽样样误误差差的的大大小小,就就成成为为统统计推断必须要解决的问题。计推断必须要解决的问题。一、均数的抽样误差和标准误:一、均数的抽样误差和标准误:n假设一个已知总体,从该总体中重复抽取样本假设一个已知总体,从该总体中重复抽取样本量相等(为量相等(为m)的样本)的样
3、本n次,对每个样本计算样次,对每个样本计算样本统计量本统计量(均数、方差等均数、方差等),观察,观察n个样本统计量个样本统计量的分布规律的分布规律抽样分布规律。抽样分布规律。n考察:考察:n不同的分布不同的分布-正态分布、偏态分布正态分布、偏态分布n不同的样本含量不同的样本含量抽样试验抽样试验 由中心极限定理及大数定理得出:由中心极限定理及大数定理得出:若原变量若原变量X服从正态分布,随机抽取样本含服从正态分布,随机抽取样本含量为量为n的样本均数的样本均数 也服从正态分布。也服从正态分布。即使从偏态总体中随机抽样,当即使从偏态总体中随机抽样,当n足够大足够大(n50),样本均数也近似服从正态分
4、布。),样本均数也近似服从正态分布。这个定理不仅具有理论价值,而且具有很这个定理不仅具有理论价值,而且具有很高的实用价值。因为在实际工作当中,许多医高的实用价值。因为在实际工作当中,许多医学测量结果并不知道它的确切分布,有了这个学测量结果并不知道它的确切分布,有了这个性质,就可以利用正态分布的原理对其特征进性质,就可以利用正态分布的原理对其特征进行统计推断。行统计推断。样本均数的分布:样本均数的分布:从正态分布总体从正态分布总体N N(5.00,0.505.00,0.502 2)中,每次)中,每次随机抽取样本含量随机抽取样本含量n n5 5,并计算其均数与标准,并计算其均数与标准差;重复抽取差
5、;重复抽取10001000次,获得次,获得10001000份样本;计算份样本;计算10001000份样本的均数与标准差,并对份样本的均数与标准差,并对10001000份样本份样本的均数作直方图。的均数作直方图。按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含、样本含量量n n3030的抽样实验;比较计算结果。的抽样实验;比较计算结果。抽样试验(抽样试验(n n=5=5)抽样试验(抽样试验(n n=10=10)抽样试验(抽样试验(n n=30=30)3 3个抽样实验结果图示个抽样实验结果图示样本均数的抽样分布特点样本均数的抽样分布特点n各样本均数未必等于总体均数;各样本均数未必
6、等于总体均数;n样本均数之间存在差异;样本均数之间存在差异;n样本均数的分布很有规律,围绕着总体均数,中间样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布;多、两边少,左右基本对称,也服从正态分布;n样本均数的变异较原变量的变异大大缩小。样本均数的变异较原变量的变异大大缩小。n随着样本含量的增加,样本均数的变异范围逐渐缩随着样本含量的增加,样本均数的变异范围逐渐缩小。小。均数的标准误(均数的标准误(standard error of mean):):样本均数之间的差异,反映了样本均数样本均数之间的差异,反映了样本均数的离散程度,即为抽样误差。这时的样本均的离
7、散程度,即为抽样误差。这时的样本均数的标准差,称为样本均数的标准误,简称数的标准差,称为样本均数的标准误,简称标准误。标准误。标准误的概念标准误的概念 抽样的样本量越大,抽样的样本量越大,标准误标准误就越小;就越小;原来总体变异度小,原来总体变异度小,标准误标准误就越小。就越小。标准误反映了样本均数间的离散程度,也反映了样本均标准误反映了样本均数间的离散程度,也反映了样本均数与总体均数之间的差异。当标准误大时,用样本均数与总体均数之间的差异。当标准误大时,用样本均数对总体均数的估计的可靠程度就小;反之亦然。数对总体均数的估计的可靠程度就小;反之亦然。标准差与标准误标准差与标准误意义意义:标准差
8、用于描述个体值之间的变异,即观察值间的离散度,:标准差用于描述个体值之间的变异,即观察值间的离散度,标准差小,表明观察值围绕均数的波动小;标准误描述统计量的抽标准差小,表明观察值围绕均数的波动小;标准误描述统计量的抽样误差,即样本统计量与总体参数的接近程度。标准误小,表明抽样误差,即样本统计量与总体参数的接近程度。标准误小,表明抽样误差小,则统计量稳定,与参数接近。样误差小,则统计量稳定,与参数接近。用途用途:标准差表示观察值间波动的大小,用于医学参考值范围;标:标准差表示观察值间波动的大小,用于医学参考值范围;标准误表示抽样误差的大小,用于参数估计。准误表示抽样误差的大小,用于参数估计。关系
9、关系:随着样本含量增加,都减小。:随着样本含量增加,都减小。联系联系:都是表示变异度的指标,当样本量一定时,两者成正比。:都是表示变异度的指标,当样本量一定时,两者成正比。标准误用途标准误用途n衡量样本均数的可靠性衡量样本均数的可靠性:标准误越小,表明样:标准误越小,表明样本均数越可靠;本均数越可靠;n参数估计参数估计:估计总体均数的置信区间(区域);:估计总体均数的置信区间(区域);n假设检验假设检验:用于总体均数的假设检验(比较)。:用于总体均数的假设检验(比较)。t-分布分布t-distributiont 分布的概念分布的概念n用样本方差代替总体方差,此时不再服从正态分布。而服从 t 分
10、布。记为:开创了开创了小样本小样本统计的新纪元,统计的新纪元,t分布主要用于总体均数的分布主要用于总体均数的区间估计和区间估计和t检验!检验!t t分布曲线分布曲线 t t 分布分布有如下性质:有如下性质:单峰分布,曲线在单峰分布,曲线在t t0 0 处最高,并以处最高,并以t t0 0为中心为中心左右对称左右对称与正态分布相比,曲线与正态分布相比,曲线最高处较矮,两最高处较矮,两尾部翘得尾部翘得高高(见绿线)(见绿线)随自由度增大,曲线逐随自由度增大,曲线逐渐接近正态分布;分布的渐接近正态分布;分布的极限为标准正态分布。极限为标准正态分布。t t分布曲线下面积(附表分布曲线下面积(附表2 2
11、)双侧双侧t t0.05/20.05/2,9 92.2622.262 单侧单侧t t0.0250.025,9 9单侧单侧t t0.050.05,9 91.8331.833双侧双侧t t0.01/20.01/2,9 93.2503.250 单侧单侧t t0.0050.005,9 9单侧单侧t t0.010.01,9 92.8212.821双侧双侧t t0.05/20.05/2,1.961.96 单侧单侧t t0.0250.025,单侧单侧t t0.050.05,1.641.64 三、总体均数的估计:三、总体均数的估计:是是一一种种参参数数估估计计,是是统统计计推推断断的的一一个个重重要要方方面面
12、。是是指指用用样样本本指指标标(称称为为统统计计量量)估估计计总总体体指指标标(称称为为参参数数),这这里里我我们们主主要要介介绍绍总总体体均均数数的的估估计计。估估计计方方式式有有点点估估计计(point estimation)和和 区区 间间 估估 计计(interval estimation)两种。两种。1点点值值估估计计:是是用用样样本本统统计计量量直直接接作作为为总总体体参参数数的的估估计计值值,这这种种方方法法虽虽简简单单,但但未未考考虑虑抽抽样样误误差差,一一般般不不用。用。2区间估计:是按一定的概率如区间估计:是按一定的概率如95%估计总体均数估计总体均数所在的范围,即总体均数
13、的可信区间或置信区间,通常所在的范围,即总体均数的可信区间或置信区间,通常用样本均数和均数的标准误来估计。估计方法:用样本均数和均数的标准误来估计。估计方法:总体均数估计方法总体均数估计方法总体均数的估计:总体均数的估计:点点值值估估计计(point estimation):例例,120名名成成年年男男子子血血清清铁铁含含量量的的均均数数是是18.57。那那么么,该该总总体体范范围围(这这个个地地区区)的的成成年年男男子子血血清清铁铁含含量量的的均均数数就就是是18.57。这这种种方方法法虽虽简简单单,但但未未考考虑虑抽抽样样误误差差,一般不用。一般不用。区间估计区间估计(interval e
14、stimation)也称置信区间。利用样本信息给出一个区间,也称置信区间。利用样本信息给出一个区间,并同时给出按预先给定的并同时给出按预先给定的概率概率估计该区间包估计该区间包含总体均数的可能范围。含总体均数的可能范围。可信度:给定的概率称为可信度。用可信度:给定的概率称为可信度。用 表表示。通常取示。通常取99%、95%。t分布方法分布方法应用条件:总体方差未知,样本量小应用条件:总体方差未知,样本量小例例 某医师测的某医师测的40名老年性慢性支气管炎病人尿中名老年性慢性支气管炎病人尿中17-酮类固醇排酮类固醇排出量均数为出量均数为15.19umol/d,标准差为,标准差为5.03umol/
15、d,试估计该种病,试估计该种病人尿人尿17-酮类固醇排出量总体均数的酮类固醇排出量总体均数的95%可信区间。可信区间。分析条件:总体方差未知,样本量小分析条件:总体方差未知,样本量小(13.5816.80)正态分布近似法正态分布近似法应用条件:当总体标准差已知时;或总体标准差未知,而应用条件:当总体标准差已知时;或总体标准差未知,而样本量较大时样本量较大时(n50)0-11-1.961.96-2.582.5868.27%95.00%99.00%例例4.3 某市随机抽查某市随机抽查12岁男孩岁男孩100人,得身高均数人,得身高均数139.6cm,标准,标准差差6.85cm。计算该地。计算该地12
16、岁男孩身高均数的岁男孩身高均数的95%的可信区间。的可信区间。分析条件:总体方差未知,但样本量大,用正态分布法分析条件:总体方差未知,但样本量大,用正态分布法(-0.79,7.21)可信区间的意义:可信区间的意义:用样本均数估计出一用样本均数估计出一个总体均数的范围,可信的程度有个总体均数的范围,可信的程度有95%。也。也就是说总体均数落在这个范围的可能性有就是说总体均数落在这个范围的可能性有95%。从理论上讲,这样估计从理论上讲,这样估计100次,约有次,约有95次次是对的,也就是总体均数在这个范围的可能是对的,也就是总体均数在这个范围的可能性是性是95%,约有,约有5次是不对的,也就是总体
17、次是不对的,也就是总体均数没有在这个范围的可能性是均数没有在这个范围的可能性是5%。例题:随机抽样调查例题:随机抽样调查1998年某市区年某市区232例足月龄例足月龄正常女婴的出生体重,结果见下表,试估计正常女婴的出生体重,结果见下表,试估计1998年年该市区正常女婴的出生体重均数所在范围。该市区正常女婴的出生体重均数所在范围。假设检验的推断原理假设检验的推断原理 假设检验的基本步骤假设检验的基本步骤 t t检验和检验和Z Z检验检验 两样本总体方差齐性检验两样本总体方差齐性检验 正态性检验正态性检验 假设检验的两类错误假设检验的两类错误 注意事项注意事项假设检验(假设检验(Hypothesi
18、s test)一、一、假设检验的推断原理假设检验的推断原理 上面介绍过的区间估计方法是统计上面介绍过的区间估计方法是统计推断的内容之一推断的内容之一(对总体参数做对总体参数做估计估计),假设检验是统计推断的另一重要内,假设检验是统计推断的另一重要内容容(对总体参数做对总体参数做比较比较)。正是应用统。正是应用统计推断的理论和方法,人们才能顺利计推断的理论和方法,人们才能顺利地通过有限的样本信息去把握总体特地通过有限的样本信息去把握总体特征,实现抽样研究的目的。征,实现抽样研究的目的。n假设检验是对所估计的总体首先提出一个假设(即假设样本来自这个总体),然后通过样本数据去推断是否拒绝这一假设,如
19、果拒绝,认为该样本很可能不是来自这个总体;否则,认为该样本很可能来自这个总体。例,例,某医生测量了某医生测量了36名从事名从事铅作业男性工人的血红蛋白含量,铅作业男性工人的血红蛋白含量,算得其均数为算得其均数为130.83g/L,标准,标准差为差为25.74g/L。问从事铅作业工。问从事铅作业工人的血红蛋白是否不同于正常成人的血红蛋白是否不同于正常成年男性平均值年男性平均值140g/L?由上面的例子可以看出,需要检验两个方面:由上面的例子可以看出,需要检验两个方面:与正常人群相同,均数之间的差别是由于与正常人群相同,均数之间的差别是由于抽样误差所致,抽样误差影响的可能性大,抽样误差所致,抽样误
20、差影响的可能性大,其它因素影响的可能性小。其它因素影响的可能性小。与正常人群不与正常人群不同,是由于从事铅作业环境条件的影响,抽同,是由于从事铅作业环境条件的影响,抽样误差影响的可能性小。那么,如何进行判样误差影响的可能性小。那么,如何进行判断呢?统计上就是以抽样误差发生的可能性,断呢?统计上就是以抽样误差发生的可能性,也就是以小概率事件发生来判断。也就是以小概率事件发生来判断。假设检验假设检验通过对假设作出取舍抉择来达到解决问题的目的通过对假设作出取舍抉择来达到解决问题的目的A.从事铅作业男性工人血红蛋白含量的总体均数与一从事铅作业男性工人血红蛋白含量的总体均数与一般成年男子的相等般成年男子
21、的相等 无差异假设、零假设无差异假设、零假设 H0(null hypothesis)B.从事铅作业男性工人血红蛋白含量的总体均数与一从事铅作业男性工人血红蛋白含量的总体均数与一般成年男子的不相等般成年男子的不相等 对立假设、备择假设对立假设、备择假设 H1(alternative hypothesis)证明证明A还是证明还是证明B?n在在H0成立的条件下,均数之间的差异是由抽样成立的条件下,均数之间的差异是由抽样误差引起的,有规律可循;误差引起的,有规律可循;n在在H1成立的条件下,均数间的不同包含种种未成立的条件下,均数间的不同包含种种未知情形,无规律可循。知情形,无规律可循。n故从故从H0
22、成立的角度出发,寻求其成立的概率。成立的角度出发,寻求其成立的概率。变量值(血红蛋白)变量值(血红蛋白)X服从正态分布,且为小样服从正态分布,且为小样本,假定本,假定H0成立,样本均数服从成立,样本均数服从t-分布,则分布,则在在H0成立的前提下,当前成立的前提下,当前t值出现的概率有多大值出现的概率有多大?如何给出这个量的界限?如何给出这个量的界限?小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生!从附表从附表2中查出在显著性水平中查出在显著性水平=0.05(双侧),自由度为(双侧),自由度为35所所对应的对应的t界值界值=2.318,即为拒绝,即为拒绝域与接受域的界
23、限。如果计算域与接受域的界限。如果计算出的出的t统计量大于相应的统计量大于相应的t界值,界值,则落在拒绝域中,该统计量出则落在拒绝域中,该统计量出现的概率小于现的概率小于5%,为小概率事,为小概率事件。件。-2.3182.318接受域拒绝域拒绝域拒绝域拒绝域常取常取 的选择要根据实际情况而定的选择要根据实际情况而定通常取通常取0.05检验水准的概念检验水准的概念在假设检验中,称预先规定的小概率值为检在假设检验中,称预先规定的小概率值为检验水准,也称为显著性水准,用表示。验水准,也称为显著性水准,用表示。这里所依据的逻辑是:这里所依据的逻辑是:如果如果H0 是成立的,那么衡量差异大小的某是成立的
24、,那么衡量差异大小的某个统计量落入区域个统计量落入区域 拒绝域拒绝域 是个小概率事件。如是个小概率事件。如果该统计量的实测值落入拒绝域,也就是说,果该统计量的实测值落入拒绝域,也就是说,H0 成立下的小概率事件发生了,那么就认为成立下的小概率事件发生了,那么就认为H0不可信而否定它。不可信而否定它。否则我们就不能否定否则我们就不能否定H0(只(只好接受它)好接受它).1.1.建立检验假设,确定检验水准;建立检验假设,确定检验水准;H H0 0:零假设、无效假设。是与研究假设有关的、被推断特:零假设、无效假设。是与研究假设有关的、被推断特征某种确定的关系;征某种确定的关系;H H1 1:备择假设
25、、对立假设。是被推断总体特征的另一种关:备择假设、对立假设。是被推断总体特征的另一种关系或状况,与系或状况,与H0H0既有联系又互相对立。既有联系又互相对立。检验水准,将小概率事件具体化,即规定概率不超过检验水准,将小概率事件具体化,即规定概率不超过 就是小概率。就是小概率。2.2.根据根据试验设计、资料类型、统计方法的条件选择试验设计、资料类型、统计方法的条件选择检验方法检验方法,计算相应的统计量;,计算相应的统计量;3.3.确定确定P P值,下结论。值,下结论。假设检验的基本步骤:假设检验的基本步骤:3确定确定P P值,下结论值,下结论.根据根据P值大小,在两个假设值大小,在两个假设之间进
26、行二者取一的选择。规则是:之间进行二者取一的选择。规则是:如果如果P(0.05),),意味着在意味着在H0设定的前提下设定的前提下发生了(支持发生了(支持H0的)小概率事件。怀疑的)小概率事件。怀疑H0的真实性的真实性(即推测实际情况应为(即推测实际情况应为H1)。)。从而做出拒绝从而做出拒绝H0,接接受受H1的推断结论。的推断结论。如果如果P(0.05),),按照事先确定的标准,在按照事先确定的标准,在H0的前提下没有发生(支持的前提下没有发生(支持H1的)小概率事件,因的)小概率事件,因而没有充足的理由对而没有充足的理由对H0提出怀疑。于是做出不拒绝提出怀疑。于是做出不拒绝H0的推断结论。
27、的推断结论。无论做出哪一种推断结论,都面临着发生判断错无论做出哪一种推断结论,都面临着发生判断错误的风险。这就是假设检验的两类错误。误的风险。这就是假设检验的两类错误。t 检验检验t-test三、三、t检验和检验和Z检验(参数检验)检验(参数检验)以以t分布为基础的检验称为分布为基础的检验称为t检验。检验。t分布的发现使得小样本统计推断成为可分布的发现使得小样本统计推断成为可能。因而,它被认为是统计学发展历史能。因而,它被认为是统计学发展历史中的里程碑之一。中的里程碑之一。在医学统计学中,在医学统计学中,t检验是重要的假检验是重要的假设检验方法之一。常用于设检验方法之一。常用于两个均数之间两个
28、均数之间差别的比较差别的比较,并根据资料的分布情况及,并根据资料的分布情况及设计类型,选择不同的设计类型,选择不同的t检验方法。检验方法。本章结构本章结构n单个样本单个样本t检验检验n配对样本配对样本t检验检验n两独立样本两独立样本t检验检验nt检验中的注意事项检验中的注意事项n假设检验中两类错误假设检验中两类错误单样本单样本t检验检验One sample t-test试验设计试验设计 一组样本均数(代表未知总体均数)与已知总一组样本均数(代表未知总体均数)与已知总体均数(一般为理论值、标准值或经过大量体均数(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。观察所得稳定值等)的比较。应
29、用条件:样本来自正态分布的总体!应用条件:样本来自正态分布的总体!例:根据大量调查,已知健康成年男子的例:根据大量调查,已知健康成年男子的脉搏均数为脉搏均数为72次次/分。某医生在某山区随分。某医生在某山区随机调查机调查30名健康男子,求得脉搏均数为名健康男子,求得脉搏均数为74.2次次/分,标准差为分,标准差为6.5次次/分。能否认为分。能否认为该山区的成年男子的脉搏均数高于一般该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?成年男子的脉搏均数?1.建立检验假设,确定检验水准;建立检验假设,确定检验水准;2.确定检验方法,计算统计量;确定检验方法,计算统计量;3.确定确定P值,下结论。
30、值,下结论。4.查附表查附表2,t界值为界值为2.045,统计量小于界值,则,统计量小于界值,则P0.05。拒绝。拒绝H1,接受,接受H0,差异无统计学意义。尚不能认为该山区成年男子,差异无统计学意义。尚不能认为该山区成年男子脉搏数与一般男子不同。脉搏数与一般男子不同。配对样本配对样本t检验检验Paired design t-test试验设计试验设计 配对设计配对设计 将受试对象按照某些重要特征(主要是非处理因素)将受试对象按照某些重要特征(主要是非处理因素)配成对子,每对中的两个受试对象随机分配到两处理配成对子,每对中的两个受试对象随机分配到两处理组。组。特点特点 控制较多的个体变异,可比性
31、好,控制较多的个体变异,可比性好,常用于个体变异常用于个体变异较大的资料。较大的资料。类型类型1.将受试对象配成特征相近的对子,随机接受两种处理;将受试对象配成特征相近的对子,随机接受两种处理;2.同一受试对象或同一份样品分成两份,随机分别接受不同同一受试对象或同一份样品分成两份,随机分别接受不同处理;处理;3.同一受试对象处理前后的结果比较。同一受试对象处理前后的结果比较。编编号号 (1)标标准品准品(2)新制品新制品(3)差差值值d(4)=(2)(3)112.010.02.0214.510.04.5315.512.53.0412.013.0-1.087.56.51.098.05.53.51
32、015.08.07.01113.06.56.51210.59.51.039/12=3.2512名儿童分别用两种结核菌素的皮肤浸润反应结果名儿童分别用两种结核菌素的皮肤浸润反应结果(mm)12名接种卡介苗的儿童,名接种卡介苗的儿童,8周后用两批不同结核菌素,一批是标准结核菌素,一批周后用两批不同结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径如下表,问两种结核菌素的反应性有无差别?如下表,问两种结核菌素的反应性有无差别?n配对设计下的数据具有一一对应的特征,人们配对设
33、计下的数据具有一一对应的特征,人们关心的变量是对子的效应差值而不是各自的效关心的变量是对子的效应差值而不是各自的效应值。把两种处理后的数据之差看作处理效果应值。把两种处理后的数据之差看作处理效果的一个样本,假定这种差值服从正态分布,那的一个样本,假定这种差值服从正态分布,那么其总体均数为么其总体均数为0,即表明该处理没有作用。问,即表明该处理没有作用。问题转化为单组完全随机化设计资料总体均数为题转化为单组完全随机化设计资料总体均数为零的检验。零的检验。应用条件:差值服从正态分布!1.建立检验假设,确定检验水准;建立检验假设,确定检验水准;2.计算统计量;计算统计量;3.3.确定确定P值,下结论
34、。值,下结论。假设检验的步骤假设检验的步骤 编编号号 (1)哥特里哥特里罗罗紫法紫法(2)脂肪酸水解法脂肪酸水解法(3)差差值值d(4)=(2)(3)10.8400.5800.26020.5910.5090.08230.6740.5000.17440.6320.3160.31650.6870.3370.35060.9780.5170.46170.7500.4540.29680.7300.5120.21891.2000.9970.203100.8700.5060.3642.724两种方法对乳酸饮料中脂肪含量的测定结果两种方法对乳酸饮料中脂肪含量的测定结果(%)两独立样本两独立样本t检验检验Two
35、 independent sample t-testn试验设计试验设计 完全随机设计完全随机设计 将受试对象将受试对象完全随机完全随机地分配到两组中,分别接受地分配到两组中,分别接受不同的处理;或者从两个总体不同的处理;或者从两个总体完全随机完全随机地抽取一部地抽取一部分个体进行研究。分个体进行研究。目的目的:比较两总体均数是否相同。比较两总体均数是否相同。n特点特点 设计简单易行。常用于个体变异较小、同质性较设计简单易行。常用于个体变异较小、同质性较好的资料。好的资料。应用条件应用条件n两样本含量较小(两样本含量较小(n60););n两样本来源于正态分布的总体;两样本来源于正态分布的总体;n
36、两总体方差相同,即方差齐性。两总体方差相同,即方差齐性。n独立样本。独立样本。方差齐性检验方差齐性检验 (homogeneity of variance test)查附表查附表3F界值表。界值表。附表3方差齐性时方差齐性时方差不齐时方差不齐时检验统计量为:检验统计量为:校正临界值为:校正临界值为:有有25例糖尿病患者随机分成例糖尿病患者随机分成2组,甲组单纯用药物治疗,乙组组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,采用药物治疗合并饮食疗法,2个月后测空腹血糖个月后测空腹血糖(mmol/L),问两组血糖值是否相同?问两组血糖值是否相同?t=2.639t0.05(23)=2.06915
37、.2110.85有两组小白鼠分别饲以高蛋白和低蛋白饲料,有两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠周后记录小白鼠体重增加量体重增加量(g)如下表,问两组动物体重增加量的均数是否相等?如下表,问两组动物体重增加量的均数是否相等?完全随机设计两样本几何均数比较完全随机设计两样本几何均数比较的的t检验检验基本思想:某些资料不服从正态分布,两样本所基本思想:某些资料不服从正态分布,两样本所代表的总体方差也可能不齐,但进行变量变换后代表的总体方差也可能不齐,但进行变量变换后(对数变换),则服从正态分布,相应的两总体(对数变换),则服从正态分布,相应的两总体方差也可能具有齐性。数据变换后两组
38、间的关系方差也可能具有齐性。数据变换后两组间的关系并没有改变。并没有改变。选甲型流感病毒血凝抑制抗体滴度选甲型流感病毒血凝抑制抗体滴度(倒数倒数)小于小于5者者24人,随机人,随机分为分为2组,每组组,每组12人。用甲型流感病毒活疫苗进行免疫,一组人。用甲型流感病毒活疫苗进行免疫,一组用气雾法,另一组用鼻腔喷雾法,免疫一个月后,分别测定血用气雾法,另一组用鼻腔喷雾法,免疫一个月后,分别测定血凝抑制抗体滴度,结果如下表,问两种方法免疫的效果有无差凝抑制抗体滴度,结果如下表,问两种方法免疫的效果有无差别?别?Z检验:检验:这这里里,当当样样本本含含量量较较大大时时,t分分布布临临界界值值接接近近Z
39、分分布布临临界界值值,可可用用1.96或或1.645来来代代替替 。这这就就是所谓的是所谓的Z检验。检验。建议:不管大样本,小样本,均用建议:不管大样本,小样本,均用t检验!检验!五、正态性检验五、正态性检验 进行进行t检验的各种资料,必须检验的各种资料,必须满足符合正态分布的总体,若不满足符合正态分布的总体,若不能满足该条件,就不能进行能满足该条件,就不能进行t检验。检验。正态概率纸法:正态概率纸法:以变量量纲的刻度(组段)为横坐以变量量纲的刻度(组段)为横坐标,以概率单位(相应频率转换)为纵标,以概率单位(相应频率转换)为纵坐标,将数据在直角坐标平面描点,为坐标,将数据在直角坐标平面描点,
40、为正态概率纸法。正态概率纸法。如果数据服从正态分布,所描出的如果数据服从正态分布,所描出的散点(尤其是中间的点)沿一直线分布。散点(尤其是中间的点)沿一直线分布。P-P图法:图法:以以样样本本的的实实际际累累计计频频率率作作为为横横坐坐标标,以以按按照照正正态态分分布布规规律律计计算算的的相相应应的的理理论论累累计计概概率率作作为为纵纵坐坐标标,把把样样本本点点在在直直角角坐坐标标平平面面中中。所所得得到到的的点点图图就就是是P-P图图。如如果果资资料料服服从从正正态态分分布布,样样本本点点应应围围绕绕第第一一象象限限的的对对角线散布。角线散布。Q-Q图法:图法:以以样样本本的的实实际际分分位
41、位数数(PX)作作为为横横坐坐标标,以以按按照照正正态态分分布布规规律律计计算算的的相相应应的的理理论论分分位位数数作作为为纵纵坐坐标标,把把样样本本点点在在直直角角坐坐标标平平面面中中。所所得得到到的的点点图图就就是是Q-Q图图。如如果果资资料料服服从从正正态态分分布布,样样本本点点应应围围绕绕第第一一象象限限的对角线散布。的对角线散布。目前流行的统计学软件主要提供目前流行的统计学软件主要提供P-P图或图或Q-Q图。图。统计检验法:统计检验法:W检检验验(S.S.Shapiro and M.B.Wilk):统计量为统计量为W 值。值。D检验(检验(DAgostino):统计量为:统计量为D值
42、。值。矩矩法法峰峰度度与与偏偏度度检检验验、皮皮尔尔逊逊拟拟合合优优度检验等,也可以用于正态性检验。度检验等,也可以用于正态性检验。25例正常人例正常人TL-6资料的资料的P-P图图 综合上述:综合上述:t检验的应用条件是:检验的应用条件是:正态总体正态总体 方差齐性(完全随机设计的资料)方差齐性(完全随机设计的资料)七、七、应用假设检验需要注意的问题:应用假设检验需要注意的问题:1严格按照研究设计方案,收集客观的数据;样本的严格按照研究设计方案,收集客观的数据;样本的获取必须遵循随机的原则。获取必须遵循随机的原则。2应用检验方法必需符合其适用条件。应用检验方法必需符合其适用条件。3正确理解差
43、别有无统计意义。正确理解差别有无统计意义。4结论不能绝对化结论不能绝对化 5.权衡两类错误的危害来确定权衡两类错误的危害来确定的大小。的大小。6对均数或概率作假设检验时,应与总体参数的区间对均数或概率作假设检验时,应与总体参数的区间估计结合进行。估计结合进行。7作假设检验应注意样本容量是否合理。作假设检验应注意样本容量是否合理。假设检验的前提是要有严密的抽样研假设检验的前提是要有严密的抽样研究设计究设计n这是假设检验的前提。这是假设检验的前提。组间应均衡,具组间应均衡,具有可比性,也就是除对比的主要因素有可比性,也就是除对比的主要因素(如如临床试验用新药和对照药临床试验用新药和对照药)外,其它
44、可能外,其它可能影响结果的因素影响结果的因素(如年龄、性别、病程、如年龄、性别、病程、病情轻重等病情轻重等)在对比组间应相同或相近。在对比组间应相同或相近。保证均衡性的方法主要是从同质总体中保证均衡性的方法主要是从同质总体中随机抽取样本,或随机分配样本。随机抽取样本,或随机分配样本。选用的假设检验方法应符合其应选用的假设检验方法应符合其应用条件用条件n应根据应根据分析目的、资料类型分析目的、资料类型以及以及分布分布、设计方案的种类、设计方案的种类、样本含量大小样本含量大小等选用等选用适当的检验方法。如:配对设计的计量适当的检验方法。如:配对设计的计量资料采用配对资料采用配对t检验。而完全随机设
45、计的检验。而完全随机设计的两样本计量资料,若为小样本且方差齐,两样本计量资料,若为小样本且方差齐,则选用两样本则选用两样本t检验;若方差不齐,则选检验;若方差不齐,则选用近似用近似t 检验检验(Cochran&Cox法或法或Satterthwaite法法)。若为大样本,则可选。若为大样本,则可选用大样本用大样本u检验。检验。正确理解差别有无统计意义正确理解差别有无统计意义n统计统计“显著性显著性”与医学与医学/临床临床/生物学生物学“显著显著性性”统计统计“显著性显著性”对应于统计结论,而对应于统计结论,而医学医学/临床临床/生物学生物学“显著性显著性”对应于专业结对应于专业结论。论。假设检验
46、是为专业服务的,统计结论必假设检验是为专业服务的,统计结论必须和专业结论有机地相结合,才能得出恰如须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。其分、符合客观实际的最终结论。若统计结若统计结论和专业结论一致,则最终结论就和这两者论和专业结论一致,则最终结论就和这两者均一致均一致(即均有或均无意义即均有或均无意义);若统计结论和;若统计结论和专业结论不一致,则最终结论需根据实际情专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计论无意义,则可能由于样本含量过大或设计存在问题
47、,那么最终结论就没有意义。存在问题,那么最终结论就没有意义。正确理解差别有无统计意义正确理解差别有无统计意义n例如:有人欲比较例如:有人欲比较A、B两种降压药物的降压两种降压药物的降压效果,随机抽取了高血压病人各效果,随机抽取了高血压病人各100名,分别名,分别测定两组病人服药后舒张压的改变值,得两组测定两组病人服药后舒张压的改变值,得两组舒张压改变值之差的平均数为舒张压改变值之差的平均数为0.83 mmHg(0.11kPa)。作两大样本。作两大样本u检验得检验得u=6.306,P0.001,有统计学意义。但因,有统计学意义。但因A、B两组高两组高血压病人服药后舒张压改变值之差较小,仅血压病人
48、服药后舒张压改变值之差较小,仅0.83 mmHg,未达到有临床意义的差值,未达到有临床意义的差值5mmHg(0.67kPa),故最终结论没有意义。相,故最终结论没有意义。相反,若统计结论无意义,而专业结论有意义,反,若统计结论无意义,而专业结论有意义,那就应当检查设计是否合理、样本含量是否足那就应当检查设计是否合理、样本含量是否足够。够。结论不能绝对化结论不能绝对化n因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,如写成P=0.040或0.02P0.05,而不简单写成P0.05,以便读者与同类研究进行
49、比较或进行循证医学时采用Meta分析。假设检验中单侧检验与双侧检验假设检验中单侧检验与双侧检验1.699假设检验与可信区间的关系假设检验与可信区间的关系n可信区间具有假设检验的主要功能可信区间具有假设检验的主要功能n可信区间可提供假设检验没有提供的信息可信区间可提供假设检验没有提供的信息n假设检验提供区间估计所不能提供的信息假设检验提供区间估计所不能提供的信息例例4.4 根据大量调查,已知健康成年男子的脉搏均数为根据大量调查,已知健康成年男子的脉搏均数为72次次/分。分。某医生在某山区随机调查某医生在某山区随机调查30名健康男子,求得脉搏均数为名健康男子,求得脉搏均数为74.2次次/分,标准差
50、为分,标准差为6.5次次/分。能否认为该山区的成年男子的脉搏均数分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?高于一般成年男子的脉搏均数?用区间估计的方法:用区间估计的方法:由于由于95区间估计包含了健康成年男子的脉搏均数区间估计包含了健康成年男子的脉搏均数72,故可以认,故可以认为该山区为该山区30名成年男子脉搏的总体均数与健康成年男子的脉搏均名成年男子脉搏的总体均数与健康成年男子的脉搏均数来源于同一总体,两者的总体均数相等与假设检验的结果是数来源于同一总体,两者的总体均数相等与假设检验的结果是相同的相同的 由于假设检验是根据有限的样本信息由于假设检验是根据有限的样本信息