《应用统计学第6章置信区间估计.ppt》由会员分享,可在线阅读,更多相关《应用统计学第6章置信区间估计.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、本章教学目标:本章教学目标:(1)单个正态总体均值和方差的区间估计。(2)总体比例的区间估计。(3)均值和比例置信区间估计中的样本容量确定。(4)两个正态总体的均值差和方差比的区间估计。(5)单侧置信区间估计。第第6章章 置信区间估计置信区间估计12 由于点估计存在误差,因此仅对总体参数作出点估计是不够的,还需要了解估计的精度及其误差。参数的区间估计就是在给定的可信度下,估计未知参数的可能取值范围。设 为总体分布的未知参数,若由样本确定的两个统计量和对给定的概率(0 Z =0f(x)x z1-二二.总体均值总体均值的区间估计的区间估计如图所示,(Z)=1-,因此,可由正态分布表得到 Z。如:要
2、查 Z0.025,由正态分布表可查得:(1.96)=0.975=1-0.025,故 Z0.025=1.96 11由正态分布的性质可得对给定的置信度1-,0f(x)x z/2/2-z/2/21-N(0,1)由此可得从而的置信度为 1-的置信区间为为便于记忆和理解,将 的置信区间表示为如下形式:2.2.2 已已知知时总体均值时总体均值的区间估计的区间估计有其中 d 称为估计的允许误差允许误差。12可用 Excel 的统计函数 NORMSINV 返回 Z。语法规则如下:格式:NORMSINV(1-)功能:返回 Z 的值。说明:NORMSINV()返回的是 Z1-的值。用 Excel 求 Z133.t
3、 分布分布设 XN(0,1),Y 2(n),且 X 与 Y 相互独立,则随机变量服从自由度为 n 的 t 分布分布,记为 tt(n)。14t 分布密度函数的图形分布密度函数的图形标准正态分布分布是 t 分布的极限分布。当 n 很大时,t 分布近似于标准正态分布。xf(x)0n=1n=4n=10n=,N(0,1)150 xf(x)t 分布的右侧分布的右侧 分位点分位点 t(n)t(n)为 t 分布中满足下式的右侧 分位点:P t t(n)=由给定的概率,可查表得到 t(n)。由 t 分布的对称性,可得:t1-(n)=-t(n)。t(n)t1-(n)=-t(n)16可用 Excel 的统计函数 T
4、INV 返回 t(n)。语法规则如下:格式:TINV(2,n)功能:返回 t(n)的值。说明:TINV(,n)返回的是 t/2(n)的值。用 Excel 求 t/2(n)174.2 未知时总体均值未知时总体均值 的区间估计的区间估计 t(n-1)设总体 XN(,2),和 S2 分别为样本均值和样本方差。由此可得 的置信度为 1-的置信区间为因此,对给定的置信度 1-,有即X1,X2,Xn 为 X 的容量为 n 的样本,可以证明:18用样本比例代替总体比例,设总体比例为 P,则当 nP 和 n(1-P)都大于5时,样本成数 p 近似服从均值为 P,方差为 P(1-P)/n 的正态分布。从而对给定
5、的置信度1-,由 可得总体成数 P 的置信度为 1-的置信区间为6.2 总体比例的区间估计总体比例的区间估计19【例3】求例求例1中元件平均寿命中元件平均寿命 的的95%置信区间置信区间。故所求 的 95%置信区间为 解:解:由例1,/2=0.025,=1423.1,S=196.5,=1-0.95=0.05,n=10,查表得 t0.025(9)=2.2622 可用 Excel 的【工具】“数据分析”“描述统计”求解正态总体均值 的置信区间。20课堂练习课堂练习2:某车床加工的缸套外径尺寸 XN(,2),下面是随机测得的10个加工后的缸套外径尺寸(mm),90.01,90.01,90.02,90
6、.03,89.99 89.98,89.97,90.00,90.01,89.99 (,)求 的置信度为95%的置信区间;21【例例4】某厂为了解产品的质量情况,随机抽取了300件产品进行检验,其中有5件次品,求该厂产品次品率的置信度为95%的置信区间。解解:产品次品率为比例,=1-0.95=0.05,/2=0.025,n=300,,查表得 Z0.025=1.96,样本成数 该厂产品次品率的置信度为95%的置信区间为 22案例思考题案例思考题国外民意调查机构在进行民意调查时,通常要求在95%的置信度下将调查的允许误差(即置信区间的 d 值)控制在3%以内。问为满足该调查精度要求,至少需要多大的样本
7、?如果要求置信度达到99%,调查误差仍为3%,此时至少需要多大的样本?23案例思考题解答案例思考题解答(1)本案例中,故需要的样本容量至少为 24案例思考题解答案例思考题解答(2)如果要求置信度达到99%,则Z/2=Z0.005=2.575,256.3 样本容量确定样本容量确定前面的分析都是在给定的样本容量和样本数据下求置信区间。但在实际应用中,应当在随机抽样前就确定所需抽取的样本容量。抽取的样本容量过大,虽然可以提高统计推断的精度,但将增加不必要的人力、物力、费用和时间开支;如果抽取的样本容量过小,则又会使统计推断的误差过大,推断结果就达不到必要的精度要求。确定样本容量的原则确定样本容量的原
8、则在满足所需的置信度和允许误差条件(置信区间的 d 值)下,确定所需的最低样本容量。261.总体均值区间估计时样本容量的确定总体均值区间估计时样本容量的确定在给定置信度和允许误差 d 的条件下,由可得 其中总体标准差或样本标准差也是未知的,通常可以先通过小规模抽样作出估计。由于使用的是近似公式,可知实际采用的最低样本容量应比计算结果稍大。27【例6】在例在例3 元件平均寿命的区间估计问题中,要求元件平均寿命的区间估计问题中,要求在95%的置信度下,使估计的允许误差不超过其平均寿命的10%,并设已得到例1的先期抽样数据。求所需的最低样本容量。其他条件不变,在99%的置信度下求所需最低样本容量。解
9、解:由例1,S=196.5,d=1423/10=142.3 可知取 n=10 已能满足所给精度要求。可知此时取 n=20 就能满足所给精度要求。在总体均值的区间估计中,通常 n=30 就称为大样本大样本。在大样本时,无论总体服从什么分布,都可用前述公式进在大样本时,无论总体服从什么分布,都可用前述公式进行区间估计行区间估计。282.总体比例区间估计时样本容量的确定总体比例区间估计时样本容量的确定其中样本成数 p 同样可先通过小规模抽样作出估计,也可根据其他信息估计,或取 0.5。29【例7】某企业要重新制定产品抽样检验的规范。已知过去检验的次品率在3.6%左右,现要求允许误差不超过2%,置信度
10、为95%。问每次至少应抽查多少产品?解解:由题意,要推断的是总体成数,p=0.036,1-p=0.964,d=0.02,=0.05,z/2=z0.025=1.96故每次至少应抽查 334 件产品。由此可知,在总体比例的区间估计问题中,要达由此可知,在总体比例的区间估计问题中,要达到一定的精度要求,样本到一定的精度要求,样本容量至少要在几百以上。容量至少要在几百以上。30【例例5】(1)求例1中元件平均寿命的95%置信下限。(2)求元件寿命方差的95%置信上限。解解:(1)从而 的单侧 1-置信下限为本例中,t 0.05(9)=1.8331,故所求置信下限为1423.1-1.8331196.5/该在95%的置信度下,该元件的平均寿命大于1309.2小时。=1390.2可得由6.4 单侧置信限的区间估计单侧置信限的区间估计 31同理可得 2 的置信度为 1-的单侧置信上限为本例中,故所求2的95%置信上限为 9196.52/3.325=323.32(小时2)由以上分析可知,求单侧置信限与求双侧置信限的差别仅在于用相应分布的右侧 分位点代替双侧区间估计公式中的右侧/2 分位点。解解(2)(2):2 的的置信置信上限上限32区间估计小结区间估计小结 P 2 2已知 2未知双侧双侧双侧双侧单侧上限单侧上限单侧下限单侧下限33