《5终身模块-统计学-抽样误差-假设检验.pptx》由会员分享,可在线阅读,更多相关《5终身模块-统计学-抽样误差-假设检验.pptx(75页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量资料的统计推断计量资料的统计推断statistical inference of measurement data张建军张建军汕大医学院预防医学教研室汕大医学院预防医学教研室Tel: 0754-88900445 Tel: 0754-88900445 统计推断:参数估计,假设检验统计推断:参数估计,假设检验“世上有三种哄人的东西:谎言、该死的谎言、世上有三种哄人的东西:谎言、该死的谎言、统计数据统计数据”-英国政治家迪斯雷里。英国政治家迪斯雷里。“世上有三样激动人心的东西:宣传、要命的世上有三样激动人心的东西:宣传、要命的宣传、统计数据宣传、统计数据”。 均数的抽样误差和标准误均数的抽样误差
2、和标准误均数的抽样误差均数的抽样误差sampling error of mean概念概念:由于总体中存在个体变异,抽样研究中所抽取的由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),样本均(或率)往往不等于总体均数(或率),样本均数之间也互不相等,数之间也互不相等,这种由抽样引起的差异称为这种由抽样引起的差异称为均数的抽样误差均数的抽样误差。即:即:,|iijXXXX称为抽样误差。12 中心极限定理:如果随机变量的总体均数及方差有限,中心极限定理:如果随机变量的总体均数及方差有限,当
3、样本容量趋于无穷大时,样本均数的分布趋近于均数为当样本容量趋于无穷大时,样本均数的分布趋近于均数为总体均数,方差为总体均数,方差为 的正态分布。的正态分布。22X N( ,), N( ,/n)X 如果:那么,2/n 如何估计?如何估计? 用样本均数的标准差来估计,称标准误用样本均数的标准差来估计,称标准误(standard error)。 标准误越大,均数的抽样误差越大,样本均数与标准误越大,均数的抽样误差越大,样本均数与总体均数间的差异越大。总体均数间的差异越大。 计算公式:计算公式: 即:由总体标准差,样本例数求得。但通常以样即:由总体标准差,样本例数求得。但通常以样本标准差作为总体标准差
4、的估计值。因此:本标准差作为总体标准差的估计值。因此:XSSnXn与标准差的区别:与标准差的区别:标准差:表示一般变量值的离散程度;均数标准标准差:表示一般变量值的离散程度;均数标准误特别说明样本均数这一变量值离散程度的指标。误特别说明样本均数这一变量值离散程度的指标。标准误的应用标准误的应用:(1)用来衡量抽样误差的大小,标准误越小,样)用来衡量抽样误差的大小,标准误越小,样本均数与总体均数越接近,样本均数的可信度越本均数与总体均数越接近,样本均数的可信度越高;高;(2)结合标准正态分布与)结合标准正态分布与 t 分布曲线下的面积规分布曲线下的面积规律,估计总体均数的置信区间。律,估计总体均
5、数的置信区间。(3)用于假设检验。)用于假设检验。 假定假定2003年汕头市年汕头市15岁女学生的身高岁女学生的身高(cm)服从服从N(155.4, 5.32)。用计算机做抽样模拟试验,每次。用计算机做抽样模拟试验,每次抽出抽出10个数字,组成一个样本,求出样本均个数字,组成一个样本,求出样本均数数 、样本标准差、样本标准差 S。 再求得此再求得此100个样本均个样本均数的均数、样本均数的标准差(标准误)。数的均数、样本均数的标准差(标准误)。 100个样本均数构成一个新的分布,也是正态分个样本均数构成一个新的分布,也是正态分布(布(即使原分布为偏态分布,当样本含量足够大即使原分布为偏态分布,
6、当样本含量足够大时,新分布也近似正态分布时,新分布也近似正态分布)。新分布的集中趋)。新分布的集中趋势用均数的均数来表示,离散趋势用标准误表示势用均数的均数来表示,离散趋势用标准误表示N( , ) 。各样本均数的均数等于总体均数。各样本均数的均数等于总体均数。X2X0501001502002503003504004502.082.342.612.873.143.403.663.934.194.464.724.985.25均数频数0501001502002503003504004502.082.342.612.873.143.403.663.934.194.464.724.985.25均数频数0
7、501001502002503003504004505002.082.342.612.873.143.403.663.934.194.464.724.985.25均数频数正态总体中抽样正态总体中抽样(样本量(样本量5 5)正态总体中抽样正态总体中抽样(样本量(样本量1010)正态总体中抽样正态总体中抽样(样本量(样本量3030)抽样时样本量抽样时样本量大小决定了样大小决定了样本均数分布的本均数分布的形状,当样本形状,当样本量足够大时,量足够大时,均数分布趋向均数分布趋向正态分布。正态分布。t 分布(分布(t-distribution) u分布分布: u转换转换 将正态分布转换为标将正态分布转换
8、为标准正态准正态, N(0, 1)。同理:将样本均数的分布。同理:将样本均数的分布 也可以转换为标准正态分布也可以转换为标准正态分布 即:即: 实际工作中,总体标准差往往未知,常用实际工作中,总体标准差往往未知,常用S代替代替 计算标准误,因此:就变为:计算标准误,因此:就变为: xu2,()(0,1)XNNXXu/XXXtSSn也就是说:也就是说: 正态分布:标准正态分布 正态变量实现这一转变:x 2()1( )21( )2xf xeu 2()21( )2uue2,( ,)(0,1)xuNN 均数的分布也是这样均数的分布也是这样 如果我们采用另一个正态变量如果我们采用另一个正态变量: 于是,
9、均数的分布变成了标准正态分布于是,均数的分布变成了标准正态分布: XXu2,()(0,1)XNNxu但是,条件发生变化但是,条件发生变化 我们通常用代替我们通常用代替 然而,然而, 随着样本量的变化而变化,所以,我随着样本量的变化而变化,所以,我们称之为们称之为 t-分布,虽然它是正态分布,但只有分布,虽然它是正态分布,但只有当样本量(自由度)无穷大的时候,它才是标当样本量(自由度)无穷大的时候,它才是标准正态分布,此时,准正态分布,此时,u=t/XXXtSSnXXuXXSXS t t分布是一簇分布是一簇对称于对称于0的单峰分布曲线的单峰分布曲线。自由度越。自由度越小(相当于标准差大),曲线的
10、中间越低,两边小(相当于标准差大),曲线的中间越低,两边越高;随自由度增大,越高;随自由度增大, t t分布曲线逐渐逼近于标分布曲线逐渐逼近于标准正态分布曲线。当准正态分布曲线。当自由度无穷大时,自由度无穷大时, t t分布就分布就是标准正态分布曲线是标准正态分布曲线。 每一条每一条t t分布曲线分布曲线,都对应于相应的自由度。,都对应于相应的自由度。 t t分布曲线下的面积规律分布曲线下的面积规律: : 与标准正态曲线下的面积规律相似:在某一个自由度下,与标准正态曲线下的面积规律相似:在某一个自由度下,两侧外部总面积为两侧外部总面积为5%5%的界限的的界限的t t值称为值称为t t0.05/
11、2()0.05/2(), ,把两侧把两侧外部总面积为外部总面积为1%1%的界限的的界限的t t值称为值称为t t0.01/2()0.01/2()。中部占中部占95%95%面积的面积的t t值范围:值范围: t t0.05/2()0.05/2()- t- t0.05/2()0.05/2(), ,中部占中部占99%99%面积的面积的t t值范围:值范围:- t- t0.01/2()0.01/2()- t- t0.01/2()0.01/2()。 当自由度确定时,占一定面积的当自由度确定时,占一定面积的t界限值,可以界限值,可以查表得出。参考附表查表得出。参考附表6(p436)。 例如:查当自由度例如
12、:查当自由度=20,两侧概率之和为,两侧概率之和为0.05时,时,对应的对应的t值:值: t0.05/2(20)=2.086, 单侧概率为单侧概率为0.05时,对应的时,对应的t值:值: t0.05(20)=1.725,t t分布的主要应用:分布的主要应用:(1)(1)总体均数置信区间估计;总体均数置信区间估计;(2)t(2)t检验;检验; 使用使用t值表注意:值表注意: 同一自由度下同一自由度下, P越小,越小,t值越大;值越大;P值相同时,自值相同时,自由度越大,由度越大,t越小;当自由度无穷大时,越小;当自由度无穷大时,t值与值与u值相等。这也是值相等。这也是u分布与分布与t分布的区别。
13、分布的区别。总体均数置信区间的估计总体均数置信区间的估计 参数估计:参数估计: 点估计(点估计(point estimation):用样本统计量作为对用样本统计量作为对总体参数的估计值总体参数的估计值() 。比如均数的估计。比如均数的估计。 区间估计区间估计(interval estimation):根据选定的置信:根据选定的置信度估计总体均数所在的区间(度估计总体均数所在的区间(a 50)足够大足够大 也可参考也可参考u分布进行分布进行 95%置信区间:置信区间: 99%置信区间:置信区间:2.58,2.58XXXSXS1.96,1.96XXXSXS 3、总体标准差未知,样本例数较小、总体标
14、准差未知,样本例数较小 按按t分布原理,依据相应的自由度,查出该自由分布原理,依据相应的自由度,查出该自由度下某个概率相应的界值,再按照度下某个概率相应的界值,再按照中部占中部占95%95%面面积的积的t t值范围:值范围:- t- t0.05/2()0.05/2()- t- t0.05/2()0.05/2(), ,中部占中部占99%99%面积的面积的t t值范围:值范围:- t- t0.01/2()0.01/2()- t- t0.01/2()0.01/2()进行进行估计。估计。 因为:因为: 所以:所以:95%95%置信区间:置信区间: 99%99%置信区间:置信区间:XXtS0.05 /
15、2,0.05 / 2,XXXtSXtS0.01 / 2,0.01 / 2,XXXtSXtS 例子:例子:p236 课堂练习课堂练习 95%置信区间的意义:理论上,用一次抽样所得置信区间的意义:理论上,用一次抽样所得的样本均数估计总体均数,犯错误的概率为的样本均数估计总体均数,犯错误的概率为5%. 或进行或进行100次抽样,可算得次抽样,可算得100个置信区间,平均个置信区间,平均有有95个置信区间包括客观存在的总体均数,只有个置信区间包括客观存在的总体均数,只有5个置信区间未包括总体均数。个置信区间未包括总体均数。估计置信区间的注意事项:估计置信区间的注意事项:(1)区间是以上、下可信限为界的
16、一个范围。)区间是以上、下可信限为界的一个范围。通常用通常用 表示置信限,用表示置信限,用 表示置信区间表示置信区间(2)置信区间与正常值范围的意义、算法不同:)置信区间与正常值范围的意义、算法不同:95%正常值范围一般是指同质总体内包括正常值范围一般是指同质总体内包括95%个个体值的估计范围,若总体为正态分布,常用:体值的估计范围,若总体为正态分布,常用: 计算;计算;95%置信区间是指按照置信区间是指按照95%置置信度估计的总体参数的可能范围,按照下式计算。信度估计的总体参数的可能范围,按照下式计算。 前者用标准差,后者用标准误。前者用标准差,后者用标准误。/ 2, ( )/ 2, ( )
17、(,)XXXtSXtS/ 2, ( )XXtS1.96XS0.05 / 2, ( )0.05 / 2, ( ),XXXtSXtS假设检验的基本思想和步骤假设检验的基本思想和步骤 假设检验(假设检验(hypothesis testing):亦称显著性检验:亦称显著性检验(significance test). 是统计推断的另一个方面。是统计推断的另一个方面。 先对先对总体的参数或分布总体的参数或分布作出某种假设,如假设作出某种假设,如假设总总体均数体均数(或总体率)为一定值,两总体均数(或(或总体率)为一定值,两总体均数(或总体率)总体率)相等相等,总体服从,总体服从正态分布正态分布或两总体或两
18、总体分布分布相同相同等。然后,用适当方法根据样本对总体提供等。然后,用适当方法根据样本对总体提供的信息,推断此假设应当的信息,推断此假设应当拒绝拒绝或或不拒绝不拒绝。其结果。其结果将有助于研究者作出将有助于研究者作出决策决策,采取措施。,采取措施。 在实际情况下:在实际情况下: 由于抽样误差,从某总体中随机抽得的样本,得由于抽样误差,从某总体中随机抽得的样本,得到的到的样本均数与该总体的均数不同样本均数与该总体的均数不同;同一总体中;同一总体中两次抽样的样本均数也不相同两次抽样的样本均数也不相同。这种差别的原因。这种差别的原因在于:要么在于:要么总体均数不同;要么总体均数相同,总体均数不同;要
19、么总体均数相同,差别仅由抽样误差所致。差别仅由抽样误差所致。那么,当我们遇到这种那么,当我们遇到这种情况时,如何判断?可以情况时,如何判断?可以通过某种方法来判断差通过某种方法来判断差别属哪种情况,这种方法就是别属哪种情况,这种方法就是假设检验假设检验。假设检验假设检验 Hypothesis Testing 假设检验的反证思想假设检验的反证思想两种说法非两种说法非A即即B。要证明。要证明B真,只要证明真,只要证明A伪即可。伪即可。 无效假设无效假设Null hypothesis(H0)意在推翻的假设(说法意在推翻的假设(说法A)。)。 备择假设备择假设Alternative hypothesi
20、s(H1)意在接受的假设(说法意在接受的假设(说法B)。)。 从无效假设出发,找出不支持这一假设的证据,从而推从无效假设出发,找出不支持这一假设的证据,从而推翻它。翻它。小概率事件小概率事件small probability event 事件事件A发生的概率是如此之小,以至于在一次试发生的概率是如此之小,以至于在一次试验(抽样)时,我们往往认为它(事件验(抽样)时,我们往往认为它(事件A)不会)不会发生。发生。 统计学中,小概率事件一般是指发生概率统计学中,小概率事件一般是指发生概率 0 , 0 , ( ,则认为是大概率事件,本次的差异仅为则认为是大概率事件,本次的差异仅为抽样误差所致,因此,
21、接受抽样误差所致,因此,接受H0,拒绝拒绝H1,认为两均认为两均数来自同一总体。称数来自同一总体。称差异无统计学意义差异无统计学意义。 本例本例t=0.844,而相应的而相应的t界值:界值:t0.05/2,25=2.064 0.8440.05 按照按照=0.05水平,不拒绝水平,不拒绝H0,不能认为男性健康管理人不能认为男性健康管理人员的血糖均数与一般成年男性的血糖均数不同。员的血糖均数与一般成年男性的血糖均数不同。两均数比较时常用的判断标准两均数比较时常用的判断标准 统计量统计量u: 单侧:单侧:u1.645,双侧:双侧:u0.05, 不拒绝不拒绝H0; 单侧:单侧:u1.645,双侧:双侧
22、:u 1.96, P0.05,拒绝拒绝H0; 统计量统计量t:单侧单侧 ;双侧;双侧 P0.05, 不拒绝不拒绝H0; 单侧:单侧: 双侧双侧 P 0.05,拒绝拒绝H0;0.05,tt0.05 / 2,tt0.05,tt0.05 / 2,tt第一类错误与第二类错误第一类错误与第二类错误type I error & type II error 假设检验的判断,并非百分之百正确,有两种可能错误:假设检验的判断,并非百分之百正确,有两种可能错误:假阳性错误(假阳性错误(false positive error),称为第一类错误),称为第一类错误(type I error),用),用表示,即表示,即
23、检验水准检验水准(level of significance), 通常取:通常取:0.050.05。即:无效假设(即:无效假设(H H0 0:u=u:u=u0 0) 原本是正确的,但被拒绝,误原本是正确的,但被拒绝,误判为有差别(弃真错误)。当无效假设正确时,在判为有差别(弃真错误)。当无效假设正确时,在100100次抽样中,可以有次抽样中,可以有5 5次推断是错误的。次推断是错误的。统计上有意义的界限是允许犯第一类错误的界限。统计上有意义的界限是允许犯第一类错误的界限。 假阴性错误假阴性错误( (false negative error),),称为第二类错误称为第二类错误( (type II
24、 error) )。 即,无效假设(即,无效假设(H H0 0:u=u:u=u0 0)原本)原本是错误的(实际上应是是错误的(实际上应是H H1 1:u=u:u=u1 1), ,但所得统计量但所得统计量t t没有超过没有超过t t0.050.05的水平从而接受了无效假设,错的水平从而接受了无效假设,错误地得出无差别的结论(取伪错误)。用误地得出无差别的结论(取伪错误)。用 表示表示。 检验效能检验效能(power of test):1- power of test):1- 当两个总体存在差异时,所使用的统计检验能够当两个总体存在差异时,所使用的统计检验能够发现这种差异(拒绝发现这种差异(拒绝H
25、 H0 0) )的能力。的能力。 尽管是小概率事件,它还是有可能发生的。尽管是小概率事件,它还是有可能发生的。 I型错误:虽然无效假设为真,但由于抽到了较型错误:虽然无效假设为真,但由于抽到了较大检验统计量的样本,使得大检验统计量的样本,使得P值小于检验水准而值小于检验水准而导致被拒绝。导致被拒绝。 是否为小概率事件是由检验水准而定,所以犯错是否为小概率事件是由检验水准而定,所以犯错误的概率也由检验水准而定。误的概率也由检验水准而定。 II型错误:虽然无效假设为假,但由于抽到了较型错误:虽然无效假设为假,但由于抽到了较小检验统计量的样本,使得小检验统计量的样本,使得P值大于检验水准而值大于检验
26、水准而导致不被拒绝。导致不被拒绝。 选择统计意义水平,应考虑两类错误对所要研究选择统计意义水平,应考虑两类错误对所要研究的事物的影响哪一个重要。的事物的影响哪一个重要。 一般来说,定一般来说,定0.05为有统计学意义的水平是比较为有统计学意义的水平是比较适宜的适宜的。 两类错误的关系:在样本含量固定的条件下,减两类错误的关系:在样本含量固定的条件下,减少少I I类错误,会增大类错误,会增大IIII类错误;增大类错误;增大I I类错误,会类错误,会减少减少IIII类错误。类错误。其他条件不变,增大样本含量可其他条件不变,增大样本含量可使第二类错误的概率减小使第二类错误的概率减小。同时正确的实验设
27、计。同时正确的实验设计能够减少抽样误差,提高检验效能。能够减少抽样误差,提高检验效能。ta 实际差别与统计意义实际差别与统计意义 统计意义:抽到这样大统计量的可能性很小,可统计意义:抽到这样大统计量的可能性很小,可以拒绝以拒绝 H0。但并不意味两总体均数差别很大。但并不意味两总体均数差别很大。 样本量很大时,即使均数差别不大,统计学意义样本量很大时,即使均数差别不大,统计学意义却显著。却显著。 样本小时,即使均数差别很大,统计学意义却不样本小时,即使均数差别很大,统计学意义却不显著。显著。理解检验统计量理解检验统计量 观察到的量可以是一个样本的均数、两个样本均观察到的量可以是一个样本的均数、两
28、个样本均数的差、一个样本的百分构成、两个样本百分构数的差、一个样本的百分构成、两个样本百分构成的差成的差; 检验统计量所服从的分布不一定是正态分布。但检验统计量所服从的分布不一定是正态分布。但只要是已知的理论分布,都可以通过该分布求得只要是已知的理论分布,都可以通过该分布求得P值值。理解理解P值值 P值是指在无效假设的前提下,得到观察到的量值是指在无效假设的前提下,得到观察到的量(或更极端的量)的概率。(或更极端的量)的概率。 P值越小说明无效假设越不可靠。或者说,值越小说明无效假设越不可靠。或者说,P值值越小我们就越有理由推翻无效假设。越小我们就越有理由推翻无效假设。 至于至于P值是否属于值
29、是否属于“小小”,一般的,我们是根据,一般的,我们是根据事先确定的检验水准事先确定的检验水准 来判断的。来判断的。 当当P 时时 非小概率事件非小概率事件在无效假设的前提下,得到观察到的量(或更极在无效假设的前提下,得到观察到的量(或更极端的量)的可能性还是相当大的,我们尚不能拒端的量)的可能性还是相当大的,我们尚不能拒绝无效假设或者说拒绝无效假设的证据不足。绝无效假设或者说拒绝无效假设的证据不足。 具体问题,专业判断具体问题,专业判断P=0.70与与P=0.07“差别有显著性差别有显著性”与与“差别显著差别显著” “差别有高度显著性差别有高度显著性”与与“差别极为显著差别极为显著” 二者之间
30、不存在必然的联系。二者之间不存在必然的联系。“差别显著差别显著”不一不一定导致定导致“差别有显著性差别有显著性”,“差别不显著差别不显著”倒是倒是有很大可能导致有很大可能导致“差别有显著性差别有显著性”。 即使即使“差别有显著性差别有显著性”,临床上也不一定有意义。,临床上也不一定有意义。单侧检验还是双侧检验单侧检验还是双侧检验?One-sided or two-sided test? 双侧检验永远是正确的双侧检验永远是正确的 单侧检验只有在少数情况下才是合适的单侧检验只有在少数情况下才是合适的 即使要做单侧检验,也必须事先确定即使要做单侧检验,也必须事先确定t检验和检验和u检验检验是两种常见
31、的假设检验的方法,因其统计量为是两种常见的假设检验的方法,因其统计量为t, u 而得名。而得名。u检验条件检验条件: 总体标准差已知,资料服从正态分布总体标准差已知,资料服从正态分布情况下(情况下(1)样本均数与总体均数比较()样本均数与总体均数比较(2)两大)两大样本均数的比较;样本均数的比较;t检验条件:用于样本量小、总体标准差未知时(检验条件:用于样本量小、总体标准差未知时(1)样本与总体均数比较(样本与总体均数比较(2)配对设计资料比较()配对设计资料比较(3)两样本均数比较(同时要求两样本的总体方差相两样本均数比较(同时要求两样本的总体方差相同,服从正态分布)同,服从正态分布)一、样
32、本均数与总体均数的比较一、样本均数与总体均数的比较总体均数:大量观测得到的稳定值或理论值,总体均数:大量观测得到的稳定值或理论值, 0 比较的目的是推断样本所代表的未知总体均数与比较的目的是推断样本所代表的未知总体均数与已知总体均数是否相同。已知总体均数是否相同。 样本均数与总体均数比较的样本均数与总体均数比较的t检验检验 P240 例题例题14.10 注意步骤、符号写法注意步骤、符号写法 样本均数与总体均数比较的样本均数与总体均数比较的u检验检验 例题:若通过以往大规模调查,已知某地婴儿出例题:若通过以往大规模调查,已知某地婴儿出生体重均数为生体重均数为3.20kg,标准差,标准差0.39k
33、g,今随机查,今随机查得得25名难产儿平均出生体重为名难产儿平均出生体重为3.42kg,问:出生,问:出生体重与难产是否有关?假定难产儿出生体重的标体重与难产是否有关?假定难产儿出生体重的标准差与一般儿童相同。准差与一般儿童相同。解题步骤解题步骤 据题意:要检验的是,难产儿出生体重总体均数据题意:要检验的是,难产儿出生体重总体均数是否等于是否等于3.20kg( ),0.39看作总体标准差,样看作总体标准差,样本均数本均数3.42,样本含量,样本含量25。 1.建立假设:建立假设:H0,假设难产儿出生体重总体均数假设难产儿出生体重总体均数 和一般婴儿出生体重总体均数相等,即:和一般婴儿出生体重总
34、体均数相等,即:00010:HH 2.计算合适的统计量:计算合适的统计量: 在总体标准差已知,对样本均数和总体均数的差在总体标准差已知,对样本均数和总体均数的差别做统计意义检验,可用公式:别做统计意义检验,可用公式: u值服从均数为值服从均数为0,标准差为,标准差为1的标准正态分布。的标准正态分布。 本例:本例:0XXu003.20,0.39,3.42,250.390.078253.423.202.820.078XXXnnXu则:于是: 3.从正态分布表查临界值:从正态分布表查临界值: 本例:本例: 所以:拒绝无效假设,接受备择假设。认为难产所以:拒绝无效假设,接受备择假设。认为难产和出生体重
35、是有关的。可以为,难产儿的出生体和出生体重是有关的。可以为,难产儿的出生体重平均来说是比较大一些。重平均来说是比较大一些。0.050.011.962.58uu,0.010.01uup故: 如果本例总体标准差未知,只有从样本中求得标如果本例总体标准差未知,只有从样本中求得标准差准差0.42,则应该用,则应该用t检验。公式:检验。公式:0XXtS000.05(24)0.01(24)3.203.420.42,250.420.084253.423.202.620.084125 124,2.064,2.797XXXSnSSnXtSntt 本例:,据:0.05P0.01,结论同前 二、配对资料的比较二、配
36、对资料的比较 配对设计:两样本中的观察值由于存在某种联系配对设计:两样本中的观察值由于存在某种联系而一一对应结成对子(而一一对应结成对子(matching)的情况的情况. 1、同一受试对象处理前后的比较:高血压治疗、同一受试对象处理前后的比较:高血压治疗前后的血压值,或每一名病人有一对数据;前后的血压值,或每一名病人有一对数据; 2、同一对象身体不同部位测定值比较:如左右、同一对象身体不同部位测定值比较:如左右臂皮肤的敏感试验,测得红斑直径;臂皮肤的敏感试验,测得红斑直径; 3、同一样品两种不同方法测定结果:两种仪器,、同一样品两种不同方法测定结果:两种仪器,两名化验员,两种条件等;两名化验员
37、,两种条件等; 4、成对设计:动物配对后随机分到两组后的测、成对设计:动物配对后随机分到两组后的测定结果;定结果; 这些资料的均数比较用这些资料的均数比较用t检验。检验。目的是验证差值目的是验证差值的总体均数是否为零的假设的总体均数是否为零的假设。 P241 例例14.11 计算两组资料的差值以及差值的均数,标准差,计算两组资料的差值以及差值的均数,标准差,并将其差值转化为并将其差值转化为t分布,假设差值的总体均数分布,假设差值的总体均数为为0, 做配对做配对t检验。检验。 三、两样本均数比较三、两样本均数比较 推断两样本所代表的两个总体均数是否相同。推断两样本所代表的两个总体均数是否相同。
38、分两种情况:分两种情况: 1、大样本。、大样本。 两样本含量均两样本含量均50, 用用u检验。检验。 121212122222121212XXXXXXXXXXuSSSSSnn 2、两个小样本均数的比较、两个小样本均数的比较(正态总体,方差齐)正态总体,方差齐) 由专用公式计算合并方差,均数差值的标准误,由专用公式计算合并方差,均数差值的标准误,再计算再计算t值。值。 用用合并自由度合并自由度查查t界值表。确定概率,作出统计界值表。确定概率,作出统计推断。推断。 p243例例14-121212xxxxtS122211221212()()11()(1)(1)xxxxxxSnnnnt检验的条件:检验
39、的条件:正态总体,两总体方差相等正态总体,两总体方差相等。如果:两样本方差不齐,则应该用如果:两样本方差不齐,则应该用t检验。检验。3、方差不齐时均数差别的统计学意义检查方差不齐时均数差别的统计学意义检查 (t检验)检验)如何检验方差齐性?如何检验方差齐性?方差齐性检验方差齐性检验查查F界值表,若大于相应的界值,则有统计学意义。界值表,若大于相应的界值,则有统计学意义。方差齐性检验:方差齐性检验:p244例例14-14,例例14-15,检验总体变异程度,检验总体变异程度2122(SFS大)小)t检验的过程检验的过程1、计算两个样本均数之差的标准误,、计算两个样本均数之差的标准误,t值值12(12)XXXXtS(12)1222221212XXXXSSSSSnn 2、计算临界值:、计算临界值:220.05( 1)0.05( 2)120.052212XXXXS tSttSS220.01( 1)0.01( 2)120.012212XXXXS tSttSS 3、将、将t分别与两个临界值比较,大于临界值,分别与两个临界值比较,大于临界值,则则P小于临界概率。反之,大于临界概率。小于临界概率。反之,大于临界概率。 4、做出两均数是否有区别的判断。、做出两均数是否有区别的判断。