医学统计学-可信区间.ppt

上传人:可****阿 文档编号:72340092 上传时间:2023-02-10 格式:PPT 页数:35 大小:308.50KB
返回 下载 相关 举报
医学统计学-可信区间.ppt_第1页
第1页 / 共35页
医学统计学-可信区间.ppt_第2页
第2页 / 共35页
点击查看更多>>
资源描述

《医学统计学-可信区间.ppt》由会员分享,可在线阅读,更多相关《医学统计学-可信区间.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章第四章可信区间可信区间(confidence interval)曾平曾平流行病与流行病与卫生统计学教研室卫生统计学教研室1o例:某地例:某地120名名12岁男孩身高均数为岁男孩身高均数为142.67cm,标准误为标准误为0.5477cm,问该地问该地12岁男孩平均身高岁男孩平均身高均数是多少?均数是多少?P36前前 言言2o实际工作:抽样研究,从总体到样本实际工作:抽样研究,从总体到样本o研究目的:由研究目的:由样本样本推断推断总体总体o统计推断统计推断(statisticalinference)就是根据样就是根据样本所提供的信息,以一定的概率推断总体的性本所提供的信息,以一定的概率推断

2、总体的性质。包括两方面的内容:质。包括两方面的内容:参数估计和假设检验参数估计和假设检验。3统计推断统计推断(statisticalinference)统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计区间估计4参数估计(parameter estimation)o由样本信息估计总体参数由样本信息估计总体参数n点估计点估计(pointestimation)n区间估计区间估计(intervalestimation)54.1.1 点估计(point estimation)直接用样本统计量作为总体参数的估计值直接用样本统计量作为总体参数的估计值o方法简单,但未考虑抽样误差的大小方法

3、简单,但未考虑抽样误差的大小o在实际问题中,总体参数往往是未知的,但它在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随机变量值。而样本统们是固定的值,并不是随机变量值。而样本统计量随样本的不同而不同,属随机的。计量随样本的不同而不同,属随机的。o该地该地12岁男孩平均身高均数是岁男孩平均身高均数是142.67cm。64.1.2 区间估计(interval estimation)o按一定的概率或可信度按一定的概率或可信度(1-)用一个区间估计用一个区间估计总体参数所在范围,这个范围称作可信度为总体参数所在范围,这个范围称作可信度为1-的可信区间的可信区间(confidenceint

4、erval,CI),又称置又称置信区间信区间。这种估计方法称为区间估计。这种估计方法称为区间估计。7可信区间的确切涵义 o可信度为可信度为95%的可信区间的的可信区间的确切涵义确切涵义是:每是:每100个样本所算得的个样本所算得的100个可信区间,平均有个可信区间,平均有95个包个包含了总体参数含了总体参数。89下列说法正确吗?算得某算得某95%的可信区间,则:的可信区间,则:总体参数有总体参数有95%的可能落在该区间。的可能落在该区间。有有95%的总体参数在该区间内。的总体参数在该区间内。该区间包含该区间包含95%的总体参数。的总体参数。该区间有该区间有95%的可能包含总体参数。的可能包含总

5、体参数。该区间包含总体参数,可信度为该区间包含总体参数,可信度为95%。104.1.3 可信区间的两个要素 o可靠性可靠性反映为可信度反映为可信度1-的大小的大小o精确性精确性用区间长度用区间长度CU-CL衡量衡量114.2 均数的可信区间 12o总体均数的总体均数的(1-)可信区间定义为:可信区间定义为:13大样本资料近似正态法o当当样本含量较大样本含量较大时,例如时,例如n100,t分布近似标分布近似标准正态分布,此时可用标准正态分布代替准正态分布,此时可用标准正态分布代替t分布,分布,作为可信区间的近似计算。相应的作为可信区间的近似计算。相应的100(1-)可信区间为:可信区间为:o14

6、例例4.1随机抽取随机抽取12名口腔癌患者,检测其发锌名口腔癌患者,检测其发锌含量,得均数为含量,得均数为253.05 g/g,标准误标准误为为27.18 g/g,求发锌含量总体均数求发锌含量总体均数95的可信的可信区间。区间。本例自由度本例自由度 =12-1=11,经查表得,经查表得t0.05/2,11=2.201,则,则15o即即口口腔腔癌癌患患者者发发锌锌含含量量总总体体均均数数的的95可可信信区区间间为为:193.23321.87(g/g)。用用该该区区间间估估计计口口腔癌患者发锌含量总体均数的可信度为腔癌患者发锌含量总体均数的可信度为95。16-tt017例例4.2某地某地120名名

7、12岁男孩身高均数为岁男孩身高均数为142.67cm,标准误为标准误为0.5477cm,计算计算该地该地12岁男孩身高总体均数岁男孩身高总体均数90的可的可信区间。信区间。因因n=120100,故可以用标准正态分布,故可以用标准正态分布代替代替t 分布,分布,u0.10/2=1.6418即该地即该地12岁男孩平均身高的岁男孩平均身高的90可信区间为:可信区间为:141.77143.57(cm),可认为该地,可认为该地12岁岁男孩平均身高在男孩平均身高在141.77143.57(cm)之间。之间。19-tt0204.2.2两均数之差的区间估计两均数之差的区间估计o设两样本之样本含量、均数和方差分

8、别为:设两样本之样本含量、均数和方差分别为:n1,n2和和s12,s22,根据根据数理统计数理统计结果:结果:服从自由度为服从自由度为=n1+n2-2的的t分布。分布。2122例例4.3某某医医生生研研究究转转铁铁蛋蛋白白对对病病毒毒性性肝肝炎炎诊诊断断的的临临床床意意义义,测测得得12名名正正常常人人和和15名名病病毒毒性性肝肝炎炎患患者者血血清清转转铁铁蛋蛋白白含含量量,结结果果如如下下,试试估估计计正正常常人人和和患患者者的转铁蛋白含量均数之差的的转铁蛋白含量均数之差的95可信区间。可信区间。正常人正常人(X1)265.4271.5284.6291.3254.8275.9281.7268

9、.6(n1=12)264.4273.2270.8260.5病病毒毒性性肝肝炎炎患患者者(X2)235.9215.4251.8224.7228.3231.1253.0221.7(n2=15)218.8233.8230.9240.7256.9260.7224.423s12=10.382s22=14.39224o两组均数之差的两组均数之差的95可信区间为:可信区间为:o(271.8917-235.2067)2.060 4.95=26.4846.88o可以认为病毒性肝炎患者的血清转铁蛋白含量可以认为病毒性肝炎患者的血清转铁蛋白含量较正常人平均低较正常人平均低36.68,其,其95CI为为26.4846

10、.88。254.3率的可信区间率的可信区间与均数一样,率也存在抽样误差与均数一样,率也存在抽样误差,率的标准差又称率的标准差又称率的标准误为:率的标准误为:4.3.1率的抽样误差率的抽样误差26率的抽样分布率的抽样分布 当总体率当总体率 0.5时为正偏态,时为正偏态,当当 0.5时为负偏态,时为负偏态,当当=0.5时为对称分布。时为对称分布。只有当只有当n 较大、率较大、率 和和(1-)都不太小时,例都不太小时,例如如n 和和n(1-)均大于均大于5时,率的抽样分布近时,率的抽样分布近似于正态分布。似于正态分布。274.3.2总体率总体率 的区间估计的区间估计 o正态近似法正态近似法o查表法查

11、表法28正态近似法o条件条件:样本例数样本例数n足够大,且样本率足够大,且样本率p和和(1-p)都都不不太小时,即太小时,即np 和和n(1-p)均大于均大于5时,时,样本率样本率p 的抽样分布近似正态分布的抽样分布近似正态分布总体率总体率 的可信区间:的可信区间:29例例从某地人群中随机抽取从某地人群中随机抽取144人,检查乙型肝炎表人,检查乙型肝炎表面抗原携带状况,阳性率为面抗原携带状况,阳性率为9.20,求该地人群的,求该地人群的乙型肝炎表面抗原阳性率的乙型肝炎表面抗原阳性率的95可信区间。可信区间。on=144,p=9.2095可信限为:可信限为:9.20%1.962.41%即该地人群

12、的乙型肝炎表面抗原阳性率的即该地人群的乙型肝炎表面抗原阳性率的95可可信区间为:信区间为:4.48%13.92%。30查表法o例例4.5有人调查有人调查29名非吸毒妇女,出狱时有名非吸毒妇女,出狱时有1名名HIV(人免疫缺陷病毒人免疫缺陷病毒)阳性,求阳性率阳性,求阳性率95可信可信区间区间?直接查附表直接查附表6.2,在行,在行n=29,列列x=1交叉处交叉处0.117.8即为即为阳性率阳性率95可信区间。可信区间。31正确理解可信区间的涵义(一)o可信区间一旦形成,它要么包含总体参数,要么可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。不包含总体参数,二

13、者必居其一,无概率可言。所谓所谓9595的可信度是针对可信区间的构建方法而的可信度是针对可信区间的构建方法而言的。言的。o以均数的可信区间为例,其涵义是:如果重复以均数的可信区间为例,其涵义是:如果重复100次抽样,每次样本含量均为次抽样,每次样本含量均为n,每个样本均按,每个样本均按 构建可信区间,则在此构建可信区间,则在此100个可个可信区间内,理论上有信区间内,理论上有95个包含总体均数,而有个包含总体均数,而有5个不包含总体均数。个不包含总体均数。32正确理解可信区间的涵义(二)o在区间估计中,总体参数虽未知,但却是固定在区间估计中,总体参数虽未知,但却是固定的值的值(且只有一个且只有一个),而不是随机变量值,而不是随机变量值。33可信区间与参考值范围的区别 o可信区间用于估计总体参数,总体参数只有一个可信区间用于估计总体参数,总体参数只有一个。o参考值范围用于估计变量值的分布范围,变量值参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限可能很多甚至无限。o95%的可信区间中的的可信区间中的95%是是可信度可信度,即所求可信,即所求可信区间包含总体参数的可信程度为区间包含总体参数的可信程度为95%o95%的参考值范围中的的参考值范围中的95%是一个是一个比例比例,即所求,即所求参考值范围包含了参考值范围包含了95%的正常人。的正常人。3435

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 初中资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁