《h参数估计基础.pptx》由会员分享,可在线阅读,更多相关《h参数估计基础.pptx(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1h参数估计基础参数估计基础(jch)第一页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差 n n抽样研究的目的是用样本信息推断总体特征,即用样本资料计算的统计指标推断总体参数n n常用的统计推断方法(fngf)有参数估计(总体均数和总体概率的估计)和假设检验 第1页/共50页第二页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差 n n样本均数的抽样分布与抽样误差样本均数的抽样分布与抽样误差样本均数的抽样分布与抽样误差样本均数的抽样分布与抽样误差n n 假定某年某地所有假定某年某地所有假定某年某地所有假定某年某地所有13
2、13岁女学生身高服从总体均数岁女学生身高服从总体均数岁女学生身高服从总体均数岁女学生身高服从总体均数=155.4cm,=155.4cm,总体标准总体标准总体标准总体标准差差差差=5.3cm=5.3cm的正态分布的正态分布的正态分布的正态分布NN(,2 2)。在这样一个有限的总体中作随机抽)。在这样一个有限的总体中作随机抽)。在这样一个有限的总体中作随机抽)。在这样一个有限的总体中作随机抽样,共抽样,共抽样,共抽样,共抽100100次。每次均抽取次。每次均抽取次。每次均抽取次。每次均抽取3030例(例(例(例(ni=30ni=30)组成一份样本,可以算出每一份)组成一份样本,可以算出每一份)组成
3、一份样本,可以算出每一份)组成一份样本,可以算出每一份样本的平均身高样本的平均身高样本的平均身高样本的平均身高.最终计算得到最终计算得到最终计算得到最终计算得到(d do)153.6,153.1,154.9,157.7(d do)153.6,153.1,154.9,157.7等等等等100100个样本个样本个样本个样本均数均数均数均数,列于表列于表列于表列于表5-15-1第第第第2 2栏。现将这栏。现将这栏。现将这栏。现将这100100个样本均数看成新的随机变量绘制频数分布个样本均数看成新的随机变量绘制频数分布个样本均数看成新的随机变量绘制频数分布个样本均数看成新的随机变量绘制频数分布表,如表
4、表,如表表,如表表,如表5-25-2所示所示所示所示 第2页/共50页第三页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差样本均数的抽样分布具有以下特点:1.各样本均数未必等于总体均数;2.样本均数之间存在差异;3.样本均数的分布很有规律,围绕着总体均数(155.4cm),中间多、两边少,左右基本对称,也服从(fcng)正态分布。4样本均数的变异较之原变量的变异大大缩小 第3页/共50页第四页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差 n n抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。n
5、n标准误:用于表示均数抽样误差大小的指标(zhbio),也叫样本均数的标准差,它反映了样本均数之间的离散程度。第4页/共50页第五页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差 第5页/共50页第六页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差 表5-2 从正态总体N(155.4,5.32)抽样得到中的100个样本均数的频数(pn sh)分布(ni=30)组段下限值(cm)频数频率%152.6153.2153.8154.4155.0155.6156.2156.8157.4158.0 1 4 422252117 3 2 1
6、1.0 4.0 4.022.025.021.017.0 3.0 2.0 1.0合计 100 100.0第6页/共50页第七页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差n n标准误的计算公式标准误的计算公式(5-1),(5-2)(5-1),(5-2):n n样本均数标准误的大小与标准差成正比,则与样本含量样本均数标准误的大小与标准差成正比,则与样本含量n n的平方根的平方根成反比,即在同一成反比,即在同一(tngy)(tngy)总体中随机抽样,样本含量总体中随机抽样,样本含量n n越大,抽越大,抽样误差越小。所以在实际应用中可通过增加样本含量样误差越小。所以
7、在实际应用中可通过增加样本含量n n来减小样本来减小样本均数的标准误,从而降低抽样误差。均数的标准误,从而降低抽样误差。第7页/共50页第八页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差 非正态总体样本均数的抽样实验(实验5-2)。图5-1(a)是一个(y)正偏峰的分布,用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图 第8页/共50页第九页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差n n图5-1(b)(e)显示,样本均数的总体均数也为仍等于原来的总体均数,样本均数的标
8、准误为仍满足(mnz)(5-1)式;n n当样本量n较小时,样本均数的分布当然并非正态分布,样本量足够大时(例如,n 50),样本均数的分布近似于正态分布。第9页/共50页第十页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差第10页/共50页第十一页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差第11页/共50页第十二页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差第12页/共50页第十三页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差第13页/共50页第十四
9、页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差第14页/共50页第十五页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差n n例5-1 2000年某研究者随机调查某地健康成年男子27人,得到血红蛋白量的均数为125 g/L,标准差为15 g/L。试估计(gj)该样本均数的抽样误差。n n n n =2.89g/Ln n第15页/共50页第十六页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差样本频率样本频率样本频率样本频率(pnl(pnl)的抽样分布与抽样误差的抽样分布与抽样误差的抽样分布与抽样
10、误差的抽样分布与抽样误差 实验实验实验实验4.2 4.2:在一口袋内装有形状、重量完全相同的黑球和白球,已知黑球比例为:在一口袋内装有形状、重量完全相同的黑球和白球,已知黑球比例为:在一口袋内装有形状、重量完全相同的黑球和白球,已知黑球比例为:在一口袋内装有形状、重量完全相同的黑球和白球,已知黑球比例为20%20%(总体概率(总体概率(总体概率(总体概率=20%=20%),从口袋中每摸一次看清颜色后放回去,搅匀后再),从口袋中每摸一次看清颜色后放回去,搅匀后再),从口袋中每摸一次看清颜色后放回去,搅匀后再),从口袋中每摸一次看清颜色后放回去,搅匀后再摸,重复摸球摸,重复摸球摸,重复摸球摸,重复
11、摸球3535次(次(次(次(n=35n=35),计算摸到黑球的百分比(样本频率计算摸到黑球的百分比(样本频率计算摸到黑球的百分比(样本频率计算摸到黑球的百分比(样本频率(pnl(pnl)p)p i i)。重复这样的实验)。重复这样的实验)。重复这样的实验)。重复这样的实验100100次,每次得到次,每次得到次,每次得到次,每次得到100100个黑球的比例分别为个黑球的比例分别为个黑球的比例分别为个黑球的比例分别为14.4%,19.8%,14.4%,19.8%,20.2%,22.5%,20.2%,22.5%,等,将其频数分布列于表等,将其频数分布列于表等,将其频数分布列于表等,将其频数分布列于表
12、5-35-3。第16页/共50页第十七页,共50页。表5-3 总体(zngt)概率为20%时的随机抽样结果(ni=35)黑球比例%样本频数%5.0 3 3.0 8.0 7 7.011.0 5 5.014.0 8 8.017.0 1616.020.0 2222.022.0 1515.025.0 7 7.028.0 7 7.031.0 5 5.034.0 3 3.040.0 2 2.0合计100 100.0第17页/共50页第十八页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差n n频率(pnl)的抽样误差:这种样本率样本频率(pnl)与样本率样本频率(pnl)之
13、间、样本率样本频率(pnl)与总体率总体概率之间的差异。n n频率(pnl)的标准误:表示频率(pnl)的抽样误差的指标第18页/共50页第十九页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差样本频率 的总体均数参数为,率的标准(biozhn)误计算公式(5-3):公式(5-4)第19页/共50页第二十页,共50页。抽样抽样(chu yn)分布与抽样分布与抽样(chu yn)误差误差例5-2 某市随机调查了50岁以上的中老年妇女776人,其中(qzhng)患有骨质疏松症者322人,患病率为41.5%,试估计该样本频率的抽样误差。p=41.5%=0.415,n=
14、776 =第20页/共50页第二十一页,共50页。t分布分布(fnb)t分布的概念分布的概念 从正态分布从正态分布N(,2)抽得样本抽得样本(yngbn)的均数也的均数也服从正态分布服从正态分布,记为记为N(,)。对正态变量)。对正态变量 作变换作变换 实际工作中,当实际工作中,当 未知时,常用未知时,常用 来代替来代替 对正态变量对正态变量 采用的不是采用的不是z 变换变换,而是而是t变换变换 第21页/共50页第二十二页,共50页。t分布分布(fnb)n n英国统计学家英国统计学家W.S.GossetW.S.Gosset于于19081908年以年以“Student”“Student”笔名笔
15、名(b(b mng)mng)发表论文,证发表论文,证明它服从自由度明它服从自由度=n =n 1 1的的t t分布,即分布,即 n n t t分布,分布,=n =n 1 (5-7)1 (5-7)n n又称又称Student tStudent t分布(分布(Students t-distributionStudents t-distribution)。实际上,)。实际上,t t分布十分有用,它是总分布十分有用,它是总体均数的区间估计和假设检验的理论基础。体均数的区间估计和假设检验的理论基础。第22页/共50页第二十三页,共50页。t分布分布(fnb)t t分布的图形和分布的图形和分布的图形和分布的
16、图形和t t分布表分布表分布表分布表 从前述实验从前述实验从前述实验从前述实验4.14.1的的的的1313岁女学生身高这个岁女学生身高这个岁女学生身高这个岁女学生身高这个(zh ge)(zh ge)正态总体中分别作样本量为正态总体中分别作样本量为正态总体中分别作样本量为正态总体中分别作样本量为 3 3和和和和5050的随机抽样,各抽取的随机抽样,各抽取的随机抽样,各抽取的随机抽样,各抽取10001000份样本,并分别份样本,并分别份样本,并分别份样本,并分别得到得到得到得到10001000个样本均数及其标准误。对它们个样本均数及其标准误。对它们个样本均数及其标准误。对它们个样本均数及其标准误。
17、对它们分别作分别作分别作分别作(5-6)(5-6)式的式的式的式的t t转变换,并将转变换,并将转变换,并将转变换,并将t t值绘制相值绘制相值绘制相值绘制相应的直方图(见实验应的直方图(见实验应的直方图(见实验应的直方图(见实验5-45-4)。如图)。如图)。如图)。如图5-12(a)5-12(a)、(b)(b)所示。可以看出,这两个所示。可以看出,这两个所示。可以看出,这两个所示。可以看出,这两个t t值分布图并值分布图并值分布图并值分布图并不完全一样,样本量为不完全一样,样本量为不完全一样,样本量为不完全一样,样本量为3 3的图的图的图的图(a)(a)较之样本较之样本较之样本较之样本量为
18、量为量为量为5050的图的图的图的图(b)(b)显得矮胖,两侧尾部稍高。显得矮胖,两侧尾部稍高。显得矮胖,两侧尾部稍高。显得矮胖,两侧尾部稍高。第23页/共50页第二十四页,共50页。t分布分布(fnb)第24页/共50页第二十五页,共50页。t分布分布(fnb)第25页/共50页第二十六页,共50页。t分布分布(fnb)n nt值的分布与自由度 有关(实际是样本含量n不同)。t 分布的图形(txng)不是一条曲线,而是一簇曲线。=(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3图5-3 不同自由度下的t分布图第26页/共50页第二十七页,共50页。t分布分布
19、(fnb)t t 分布的图形有如下特征:分布的图形有如下特征:单峰分布,以单峰分布,以0 0为中心,左右对称,类似为中心,左右对称,类似(li s)(li s)于标准正态分布。于标准正态分布。自由度自由度 越小,则越大,越小,则越大,t t值越分散,曲线的峰部越矮,尾部越高;值越分散,曲线的峰部越矮,尾部越高;随着自由度随着自由度 逐渐增大,逐渐增大,t t分布逐渐逼近标准正态分布;当分布逐渐逼近标准正态分布;当 趋于趋于 时,时,t t分布就完全成为标准正态分布,故标准正态分布是分布就完全成为标准正态分布,故标准正态分布是t t分布的特例。分布的特例。第27页/共50页第二十八页,共50页。
20、t分布分布(fnb)统计学家将统计学家将t t分布曲线下的尾部面积(即概率分布曲线下的尾部面积(即概率P P)与横轴)与横轴t t值间的关系编制了不同值间的关系编制了不同(b tn(b tn)自由度自由度 下的下的t t界值表(附表界值表(附表2 2)。)。t t界值表:横标目为自由度界值表:横标目为自由度 ,纵标目为概率,纵标目为概率P P。t t临界值:表中数字表示当临界值:表中数字表示当 和和P P 确定时,对应的确定时,对应的值。值。单侧概率单侧概率(one-tailed probability)(one-tailed probability):用:用t t,表示表示 双侧概率双侧概率
21、(two-tailed probability)(two-tailed probability):用:用t t/2,/2,表示表示第28页/共50页第二十九页,共50页。t分布分布(fnb)n n例如例如,当当=16=16,单侧概率,单侧概率P=0.05P=0.05时,由表中查得单侧时,由表中查得单侧t0.05,16=1.746t0.05,16=1.746;而当;而当=16=16,双侧概率,双侧概率P=0.05P=0.05时,由表中查得双侧时,由表中查得双侧t0.05/2,16=2.120t0.05/2,16=2.120。按。按t t分布分布(fnb)(fnb)的规律,理论上有的规律,理论上有
22、n n单侧:单侧:P P(t t t0.05,16t0.05,16)=0.05 =0.05 和和 P P(t t t0.05,16 t0.05,16)=0.05=0.05n n 双侧:双侧:P P(t t t0.05/2,16t0.05/2,16)P P(t t t0.05/2,16 t0.05/2,16)=0.05=0.05 第29页/共50页第三十页,共50页。t分布分布(fnb)更一般的表示方法更一般的表示方法(fngf(fngf)如图如图5-4(a)5-4(a)和和(b)(b)中阴影部分所示为:中阴影部分所示为:单侧:单侧:P P(t t t t,)=和和 P P(t t t t,)=
23、双侧:双侧:P P(t t t t/2,/2,)P P(t t t t/2,/2,)=第30页/共50页第三十一页,共50页。t分布分布(fnb)从t界值表中或表的右上角图列亦可看出(kn ch):在相同自由度时,t值越大,概率P越小;而在相同t值时,双侧概率P为单侧概率P的两倍,即t0.10/2,16=t0.05,16=1.746。第31页/共50页第三十二页,共50页。总体均数及总体概率总体均数及总体概率(gil)的的估计估计n n参数估计的概念参数估计的概念n n参数估计:指用样本参数估计:指用样本(yngbn)指标(统计指标(统计量)估计总体指标(参数)。量)估计总体指标(参数)。n
24、n参数估计有参数估计有n n 点估计(点估计(point estimation)n n 区间估计(区间估计(interval estimation)第32页/共50页第三十三页,共50页。总体均数及总体概率总体均数及总体概率(gil)的的估计估计点估计:用样本统计量直接作为总体参数的点估计值,即直接用随机样本的样本点估计:用样本统计量直接作为总体参数的点估计值,即直接用随机样本的样本点估计:用样本统计量直接作为总体参数的点估计值,即直接用随机样本的样本点估计:用样本统计量直接作为总体参数的点估计值,即直接用随机样本的样本均数作为总体均数均数作为总体均数均数作为总体均数均数作为总体均数 的点估计
25、值的点估计值的点估计值的点估计值,用样本频率用样本频率用样本频率用样本频率p p作为总体概率作为总体概率作为总体概率作为总体概率 的点估的点估的点估的点估计值。计值。计值。计值。用用用用2727例健康成年男性血红蛋白量的样本均数作为总体均数的点估计值,例健康成年男性血红蛋白量的样本均数作为总体均数的点估计值,例健康成年男性血红蛋白量的样本均数作为总体均数的点估计值,例健康成年男性血红蛋白量的样本均数作为总体均数的点估计值,用用用用776776名名名名5050岁以上的中老年妇女骨质疏松症的样本患病率作为总体患病岁以上的中老年妇女骨质疏松症的样本患病率作为总体患病岁以上的中老年妇女骨质疏松症的样本
26、患病率作为总体患病岁以上的中老年妇女骨质疏松症的样本患病率作为总体患病率的点估计值率的点估计值率的点估计值率的点估计值缺点:没有考虑抽样误差,无法缺点:没有考虑抽样误差,无法缺点:没有考虑抽样误差,无法缺点:没有考虑抽样误差,无法(wf(wf)评价其可信度估计值它与真值之间的差距。评价其可信度估计值它与真值之间的差距。评价其可信度估计值它与真值之间的差距。评价其可信度估计值它与真值之间的差距。第33页/共50页第三十四页,共50页。总体均数及总体概率总体均数及总体概率(gil)的的估计估计区间估计:结合样本统计量和标准误可以确定一个具有区间估计:结合样本统计量和标准误可以确定一个具有区间估计:
27、结合样本统计量和标准误可以确定一个具有区间估计:结合样本统计量和标准误可以确定一个具有较大的可信度置信度(如较大的可信度置信度(如较大的可信度置信度(如较大的可信度置信度(如95%95%或或或或99%99%)的包含总)的包含总)的包含总)的包含总体参数的区间,该区间称为总体参数的体参数的区间,该区间称为总体参数的体参数的区间,该区间称为总体参数的体参数的区间,该区间称为总体参数的1 1 可可可可信区间或置信区间(信区间或置信区间(信区间或置信区间(信区间或置信区间(confidence interval,CIconfidence interval,CI)。)。)。)。置信度:置信度:置信度:置
28、信度:值一般取值一般取值一般取值一般取0.050.05或或或或0.010.01,故,故,故,故1 1 为为为为0.950.95或或或或0.990.99。通常用样本均数和均数的标准误估计总体均数的通常用样本均数和均数的标准误估计总体均数的通常用样本均数和均数的标准误估计总体均数的通常用样本均数和均数的标准误估计总体均数的95%95%(或(或(或(或99%99%)置信区间,或用样本频率和率的)置信区间,或用样本频率和率的)置信区间,或用样本频率和率的)置信区间,或用样本频率和率的及其标准误估计总体概率的及其标准误估计总体概率的及其标准误估计总体概率的及其标准误估计总体概率的95%95%(或(或(或
29、(或99%99%)置信)置信)置信)置信区间。区间。区间。区间。如果如果如果如果(rgu(rgu)没有特别说明,一般作双侧的区间估没有特别说明,一般作双侧的区间估没有特别说明,一般作双侧的区间估没有特别说明,一般作双侧的区间估计计计计 第34页/共50页第三十五页,共50页。总体总体(zngt)均数及总体均数及总体(zngt)概率的估计概率的估计置信区间的计算置信区间的计算置信区间的计算置信区间的计算总体均数的置信区间总体均数的置信区间总体均数的置信区间总体均数的置信区间 根据总体标准差根据总体标准差根据总体标准差根据总体标准差 是否已知及样本含量是否已知及样本含量是否已知及样本含量是否已知及
30、样本含量n n的大小,总体均数置信区间的的大小,总体均数置信区间的的大小,总体均数置信区间的的大小,总体均数置信区间的计算有计算有计算有计算有t t分布分布分布分布(fnb)(fnb)和和和和Z Z分布分布分布分布(fnb)(fnb)(标准正态分布(标准正态分布(标准正态分布(标准正态分布(fnb)(fnb))两种方法。)两种方法。)两种方法。)两种方法。1.t1.t分布分布分布分布(fnb)(fnb)方法方法方法方法 当总体标准差当总体标准差当总体标准差当总体标准差未知时,正态总体未知时,正态总体未知时,正态总体未知时,正态总体NN(,2 2)的样本均数的)的样本均数的)的样本均数的)的样本
31、均数的t t变换结果变换结果变换结果变换结果 第35页/共50页第三十六页,共50页。总体均数及总体概率总体均数及总体概率(gil)的的估计估计服从服从 t t分布,若分布,若“砍去砍去”t”t分布双侧尾部分布双侧尾部(wi b)(wi b)面积面积=0.05=5%=0.05=5%,故有,故有95%95%的的t t值满足不等式:值满足不等式:t0.05/2,t0.05/2,t0.05/2,t0.05/2,t0.05/2,t0.05/2,+t0.05/2,t/2,或 n/2X n/2时,应以时,应以时,应以时,应以n n X X值查表,然后从值查表,然后从值查表,然后从值查表,然后从100100
32、中减去查得的数值即为所求的置信区间。中减去查得的数值即为所求的置信区间。中减去查得的数值即为所求的置信区间。中减去查得的数值即为所求的置信区间。例例例例5-7 5-7 某医生用某药物治疗某医生用某药物治疗某医生用某药物治疗某医生用某药物治疗3131例脑血管梗塞例脑血管梗塞例脑血管梗塞例脑血管梗塞(gngs)(gngs)患者,其中患者,其中患者,其中患者,其中2525例患者治例患者治例患者治例患者治疗有效,试求该药物治疗脑血管梗塞疗有效,试求该药物治疗脑血管梗塞疗有效,试求该药物治疗脑血管梗塞疗有效,试求该药物治疗脑血管梗塞(gngs)(gngs)有效概率的有效概率的有效概率的有效概率的95%9
33、5%置信区间。置信区间。置信区间。置信区间。n=31 n=31,X=25 n/2X=25 n/2,所以用,所以用,所以用,所以用n n X=6X=6查附表查附表查附表查附表3 3,得,得,得,得8 388 38,再用,再用,再用,再用100100减去减去减去减去所查的数值所查的数值所查的数值所查的数值 该药物治疗脑血管梗塞该药物治疗脑血管梗塞该药物治疗脑血管梗塞该药物治疗脑血管梗塞(gngs)(gngs)有效概率的有效概率的有效概率的有效概率的95%95%置信区间为置信区间为置信区间为置信区间为62%92%62%92%。第46页/共50页第四十七页,共50页。总体均数及总体概率总体均数及总体概
34、率(gil)的的估计估计正态近似法正态近似法正态近似法正态近似法 当当当当n n足够大,且样本频率足够大,且样本频率足够大,且样本频率足够大,且样本频率p p和(和(和(和(1 1 p p)均不太小时,如)均不太小时,如)均不太小时,如)均不太小时,如npnp与与与与n(1n(1 p)p)均大于均大于均大于均大于5 5时,时,时,时,p p的抽样分布接近的抽样分布接近的抽样分布接近的抽样分布接近(jijn)(jijn)正态分布,此时可按公式正态分布,此时可按公式正态分布,此时可按公式正态分布,此时可按公式(5-125-12)求总体概率的置信区间)求总体概率的置信区间)求总体概率的置信区间)求总
35、体概率的置信区间 p p z z/2Sp/2Sp 公式中公式中公式中公式中SpSp为频率为频率为频率为频率p p的标准误。欲求的标准误。欲求的标准误。欲求的标准误。欲求95%95%置信区间,用置信区间,用置信区间,用置信区间,用z0.05/2=1.96z0.05/2=1.96,欲求,欲求,欲求,欲求99%99%置信区间,用置信区间,用置信区间,用置信区间,用z0.01/2=2.58z0.01/2=2.58。第47页/共50页第四十八页,共50页。总体均数及总体概率总体均数及总体概率(gil)的的估计估计例5-8 用某种仪器检查已确诊(quzhn)的乳腺癌患者120名,检出乳腺癌患者94例,检出
36、率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。解:本例n比较大,且np=94及n(1p)=26均大于5,用公式(5-12)估计总体概率的置信区间 第48页/共50页第四十九页,共50页。总体总体(zngt)均数及总体均数及总体(zngt)概率的估计概率的估计n np p z z/2 Sp=p/2 Sp=p z0.05/2 z0.05/2 n n n n =0.783 =0.783 1.96 1.96n n =0.709 0.857 =0.709 0.857 n n即该仪器乳腺癌总体即该仪器乳腺癌总体(z(z ngtngt)检出率的检出率的95%95%可信区间置信区间为可信区间置信区间为(70.9%,(70.9%,85.7%)85.7%)。第49页/共50页第五十页,共50页。