《应用统计学置信区间估计.pptx》由会员分享,可在线阅读,更多相关《应用统计学置信区间估计.pptx(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、11 由于点估计存在误差,因此仅对总体参数作出点估计是不够的,还需要了解估计的精度及其误差。参数的区间估计就是在给定的可信度下,估计未知参数的可能取值范围。设 为总体分布的未知参数,若由样本确定的两个统计量和对给定的概率(0 Z =0f(x)x z1-二.总体均值的区间估计如图所示,(Z)=1-,因此,可由正态分布表得到 Z。如:要查 Z0.025,由正态分布表可查得:(1.96)=0.975=1-0.025,故 Z0.025=1.96 第10页/共33页11由正态分布的性质可得对给定的置信度1-,0f(x)x z/2/2-z/2/21-N(0,1)由此可得从而的置信度为 1-的置信区间为为便
2、于记忆和理解,将 的置信区间表示为如下形式:2.2.2 已知时总体均值的区间估计有其中 d 称为估计的允许误差。第11页/共33页12可用 Excel 的统计函数 NORMSINV 返回 Z。语法规则如下:格式:NORMSINV(1-)功能:返回 Z 的值。说明:NORMSINV()返回的是 Z1-的值。用 Excel 求 Z第12页/共33页133.t 分布设 XN(0,1),Y 2(n),且 X 与 Y 相互独立,则随机变量服从自由度为 n 的 t 分布,记为 tt(n)。第13页/共33页14t 分布密度函数的图形标准正态分布分布是 t 分布的极限分布。当 n 很大时,t 分布近似于标准
3、正态分布。xf(x)0n=1n=4n=10n=,N(0,1)第14页/共33页150 xf(x)t 分布的右侧 分位点 t(n)t(n)为 t 分布中满足下式的右侧 分位点:P t t(n)=由给定的概率,可查表得到 t(n)。由 t 分布的对称性,可得:t1-(n)=-t(n)。t(n)t1-(n)=-t(n)第15页/共33页16可用 Excel 的统计函数 TINV 返回 t(n)。语法规则如下:格式:TINV(2,n)功能:返回 t(n)的值。说明:TINV(,n)返回的是 t/2(n)的值。用 Excel 求 t/2(n)第16页/共33页174.2 未知时总体均值 的区间估计 t(
4、n-1)设总体 XN(,2),和 S2 分别为样本均值和样本方差。由此可得 的置信度为 1-的置信区间为因此,对给定的置信度 1-,有即X1,X2,Xn 为 X 的容量为 n 的样本,可以证明:第17页/共33页18用样本比例代替总体比例,设总体比例为 P,则当 nP 和 n(1-P)都大于5时,样本成数 p 近似服从均值为 P,方差为 P(1-P)/n 的正态分布。从而对给定的置信度1-,由 可得总体成数 P 的置信度为 1-的置信区间为6.2 总体比例的区间估计第18页/共33页19【例3】求例1中元件平均寿命 的95%置信区间。故所求 的 95%置信区间为 解:解:由例1,/2=0.02
5、5,=1423.1,S=196.5,=1-0.95=0.05,n=10,查表得 t0.025(9)=2.2622 可用 Excel 的【工具】“数据分析”“描述统计”求解正态总体均值 的置信区间。第19页/共33页20课堂练习2:某车床加工的缸套外径尺寸 XN(,2),下面是随机测得的10个加工后的缸套外径尺寸(mm),90.01,90.01,90.02,90.03,89.99 89.98,89.97,90.00,90.01,89.99 (,)求 的置信度为95%的置信区间;第20页/共33页21【例4】某厂为了解产品的质量情况,随机抽取了300件产品进行检验,其中有5件次品,求该厂产品次品率
6、的置信度为95%的置信区间。解:产品次品率为比例,=1-0.95=0.05,/2=0.025,n=300,,查表得 Z0.025=1.96,样本成数 该厂产品次品率的置信度为95%的置信区间为 第21页/共33页22案例思考题国外民意调查机构在进行民意调查时,通常要求在95%的置信度下将调查的允许误差(即置信区间的 d 值)控制在3%以内。问为满足该调查精度要求,至少需要多大的样本?如果要求置信度达到99%,调查误差仍为3%,此时至少需要多大的样本?第22页/共33页23案例思考题解答(1)本案例中,故需要的样本容量至少为 第23页/共33页24案例思考题解答(2)如果要求置信度达到99%,则
7、Z/2=Z0.005=2.575,第24页/共33页256.3 样本容量确定前面的分析都是在给定的样本容量和样本数据下求置信区间。但在实际应用中,应当在随机抽样前就确定所需抽取的样本容量。抽取的样本容量过大,虽然可以提高统计推断的精度,但将增加不必要的人力、物力、费用和时间开支;如果抽取的样本容量过小,则又会使统计推断的误差过大,推断结果就达不到必要的精度要求。确定样本容量的原则在满足所需的置信度和允许误差条件(置信区间的 d 值)下,确定所需的最低样本容量。第25页/共33页261.总体均值区间估计时样本容量的确定在给定置信度和允许误差 d 的条件下,由可得 其中总体标准差或样本标准差也是未
8、知的,通常可以先通过小规模抽样作出估计。由于使用的是近似公式,可知实际采用的最低样本容量应比计算结果稍大。第26页/共33页27【例6】在例3 元件平均寿命的区间估计问题中,要求在95%的置信度下,使估计的允许误差不超过其平均寿命的10%,并设已得到例1的先期抽样数据。求所需的最低样本容量。其他条件不变,在99%的置信度下求所需最低样本容量。解:由例1,S=196.5,d=1423/10=142.3 可知取 n=10 已能满足所给精度要求。可知此时取 n=20 就能满足所给精度要求。在总体均值的区间估计中,通常 n=30 就称为大样本。在大样本时,无论总体服从什么分布,都可用前述公式进行区间估
9、计。第27页/共33页282.总体比例区间估计时样本容量的确定其中样本成数 p 同样可先通过小规模抽样作出估计,也可根据其他信息估计,或取 0.5。第28页/共33页29【例7】某企业要重新制定产品抽样检验的规范。已知过去检验的次品率在3.6%左右,现要求允许误差不超过2%,置信度为95%。问每次至少应抽查多少产品?解:由题意,要推断的是总体成数,p=0.036,1-p=0.964,d=0.02,=0.05,z/2=z0.025=1.96故每次至少应抽查 334 件产品。由此可知,在总体比例的区间估计问题中,要达到一定的精度要求,样本容量至少要在几百以上。第29页/共33页30【例例5】(1)
10、求例1中元件平均寿命的95%置信下限。(2)求元件寿命方差的95%置信上限。解解:(1)从而 的单侧 1-置信下限为本例中,t 0.05(9)=1.8331,故所求置信下限为1423.1-1.8331196.5/该在95%的置信度下,该元件的平均寿命大于1309.2小时。=1390.2可得由6.4 单侧置信限的区间估计 第30页/共33页31同理可得 2 的置信度为 1-的单侧置信上限为本例中,故所求2的95%置信上限为 9196.52/3.325=323.32(小时2)由以上分析可知,求单侧置信限与求双侧置信限的差别仅在于用相应分布的右侧 分位点代替双侧区间估计公式中的右侧/2 分位点。解(2)(2):2 的置信上限第31页/共33页32区间估计小结 P 2 2已知 2未知双侧双侧双侧双侧单侧上限单侧上限单侧下限单侧下限第32页/共33页33谢谢您的观看!第33页/共33页