《置信区间详细定义及计算.ppt》由会员分享,可在线阅读,更多相关《置信区间详细定义及计算.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于置信区间详细定义及计算现在学习的是第1页,共39页2一、置信区间的概念一、置信区间的概念一、置信区间的概念一、置信区间的概念这种形式的估计称为区间估计区间估计.前面,我们讨论了参数点估计.它是用样本算得的一个值去估计未知参数.但是点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.范围通常用区间的形式给出的。较高的可靠程度相信它包含真参数值.也就是说,我们希望确定一个区间,使我们能以比 这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平.习惯上把置信水平置信水平记作,这里 是一个很小的正数,称为显著水平显著水平。现在学习的是第2页,共
2、39页3定义定义定义定义7.67.67.67.6若由总体X的样本 X1,X2,Xn 确定的则称 为随机区间。两个统计量随机区间与常数区间不同,其长度与在数轴上的位置与样本有关。当一旦获得样本值那么,都是常数。为常数区间。现在学习的是第3页,共39页4定义定义定义定义7.77.77.77.7若满足设 是总体X的 一个未知参数,的置信区间置信区间.(双侧置信区间).的置信水平(置信度)为分别称为置信下限和置信上限为显著水平.为置信度,则称区间 是若存在随机区间对于给定的现在学习的是第4页,共39页5置信水平的大小是根据实际需要选定的.根据一个实际样本,使一个尽可能小的区间 由于正态随机变量广泛存在
3、,指标服从正态分布,特别是很多产品的我们重点研究一个正态总体情形由给定的置信水平,我们求出即取置信水平 或 0.95,0.9 等.例如,通常可取显著水平 等.数学期望 和方差 的区间估计。现在学习的是第5页,共39页6设为总体的样本,分别是样本均值和样本方差。对于任意给定的,我们的任务是通过样本寻找一它以1的概率包含总体X的数学期望。个区间,现在学习的是第6页,共39页7一、数学期望的置信区间一、数学期望的置信区间设则随机变量1 1、已知、已知2 2时,时,的置信区间的置信区间令现在学习的是第7页,共39页8令令这就是说随机区间它以1的概率包含总体 X的数学期望。由定义可知,此区间即为的置信区
4、间置信区间。现在学习的是第8页,共39页9这就是说随机区间这就是说随机区间置信区间也可简记为它以1的概率包含总体X的数学期望。由定义可知,此区间即为的置信区间置信区间。其置信度为 1。置信下限置信上限现在学习的是第9页,共39页10若取若取查表得若由一个样本值算得样本均值的观察值则得到一个区间我们称其为置信度为0.95的的置信区间。其含义是:若反复抽样多次,每个样本值(n=16)按公式即确定一个区间。现在学习的是第10页,共39页11确定一个区间。在这么多的区间内包含的占0.95,不包含的占0.05。本题中属于那些包含的区间的可信程度为0.95.或“该区间包含”这一事实的可信程度注:的置信水平
5、1的置信区间不唯一。为0.95.现在学习的是第11页,共39页12由中心极限定理知,由中心极限定理知,当 n 充分大时,无论X服从什么分布,都近似有的置信区间是总体的前提下提出的。均可看作EX的置信区间。现在学习的是第12页,共39页13例例例例1 1 设总体X N(,0.09),有一组样本值:12.6,13.4,12.8,13.2,求参数的置信度为0.95的置信区间.解解的置信区间为 代入样本值算得 ,12.706,13.294.得到的一个区间估计为注:该区间不一定包含注:该区间不一定包含.有 1=0.95,0=0.3,n=4,现在学习的是第13页,共39页14又如,上例中同样给定又如,上例
6、中同样给定可以取标准正态分布上分位点z0.04 和 z0.01,则又有则的置信度为0.95的置信区间为与上一个置信区间比较,同样是其区间长度不一样,上例比此例短。现在学习的是第14页,共39页15置信区间短表示估计的精度高,置信区间短表示估计的精度高,第一个区间为优(单峰对称的)。可见,像 N(0,1)分布那样概率密度的图形是单峰且对称的情况。当n固定时以的区间长度为最短,我们一般选择它。若以L为区间长度,则可见L随 n 的增大而减少(给定时),有时我们嫌置信度0.95偏低或偏高,也可采用0.99或0.9.对于 1 不同的值,可以得到不同的置信区间。现在学习的是第15页,共39页16估计在区间
7、 内.这里有两个要求:只依赖于样本的界限(构造统计量)可见,对参数 作区间估计,就是要设法找出两个一旦有了样本,就把2.估计的精度要尽可能的高.如要求区间长度尽可能短,或能体现该要求的其它准则.1.要求 很大的可能被包含在区间 内,就是说,概率即要求估计尽量可靠.要尽可能大.可靠度与精度是一对矛盾,条件下尽可能提高精度.一般是在保证可靠度的现在学习的是第16页,共39页17例例例例2 2已知某种油漆的干燥时间X(单位:小时)服从正态分布其中未知,现在抽取25个样品做试验,得数据后计算得取求的置信区间。解解所求为现在学习的是第17页,共39页18例例例例3 3中随机地抽查了9人,其高度分别为:已
8、知幼儿身高现从56岁的幼儿115,120,131,115,109,115,115,105,110cm;现在学习的是第18页,共39页192 2、未、未知知知知2 2 2 2时,时,时,时,的置信区间的置信区间的置信区间的置信区间当总体X的方差未知时,容易想到用样本方差 2代替2 2。已知已知则对给定的,令查t 分布表,可得的值。则的置信度为1 的置信区间为现在学习的是第19页,共39页20例例例例4 4 40名旅游者。解解本题是在2 2未知的条件下求正态总体参数的置信区间。选取统计量为由公式知的置信区间为查表则所求的置信区间为为了调查某地旅游者的消费额为X,随机访问了得平均消费额为元,样本方差
9、设求该地旅游者的平均消费额的置信区间。若2 22525的置信区间为即现在学习的是第20页,共39页21例例例例5 5 用某仪器间接测量温度,重复测量5次得求温度真值的置信度为 0.99 的置信区间。解解设为温度的真值,X表示测量值,通常是一个正态随机变量 问题是在未知方差的条件下求的置信区间。由公式查表则所求的置信区间为现在学习的是第21页,共39页22例例例例6 6解解本题是在2 2未知的条件下求正态总体参数的置信区间。由公式知的置信区间为查表则所求的置信区间为为了估计一批钢索所能承受的平均张力(单位kg/cm2),设钢索所能承受的张力X,分别估计这批钢索所能承受的平均张力的范围与所能承受的
10、平均张力。随机选取了9个样本作试验,即则钢索所能承受的平均张力为 6650.9 kg/cm2由试验所得数据得现在学习的是第22页,共39页23三、方差三、方差2 2 2 2的置信区间的置信区间的置信区间的置信区间下面我们将根据样本找出2 2 的置信区间,这在研究生产的稳定性与精度问题是需要的。已知总体我们利用样本方差对2 2进行估计,由于不知道S2与2 2差多少?容易看出把看成随机变量,又能找到它的概率分布,则问题可以迎刃而解了。的概率分布是难以计算的,而对于给定的现在学习的是第23页,共39页24即即则得到2 2随机区间随机区间以 的概率包含未知方差2 2,这就是2 2的置信度为1的置信区间
11、置信区间。现在学习的是第24页,共39页25例例例例1 1 某自动车床加工零件,抽查16个测得长度(毫米)怎样估计该车床加工零件长度的方差。解解 先求2 2的估计值或查表现在学习的是第25页,共39页26所求所求2 2 2 2的置信度为的置信度为0.950.95的的 置信区间置信区间所求标准差标准差的置信度为0.95的 置信区间由得得得得现在学习的是第26页,共39页27例例例例2 2 为了估计灯泡使用时数(小时)的均值和解解查表测试了10个灯泡得方差2 2,若已知灯泡的使用时数为X,求和2 2的置信区间。由公式知的置信区间为的置信区间为查表即由公式知2 2的置信区间为2 2的置信区间为现在学
12、习的是第27页,共39页28例例例例3 3 电动机由于连续工作时间(小时)过长会烧坏,解解查表烧坏前连续工作的时间X,得求和2 2的置信区间。今随机地从某种型号的电动机中抽取9台,测试了它们在设由公式知的置信区间为即所求2 2的置信度为0.95的 置信区间得得现在学习的是第28页,共39页29寻找置信区间的方法寻找置信区间的方法,一般是从确定误差限误差限入手.使得称 为 与 之间的误差限.,可以找到一个正数 ,只要知道 的概率分布,确定误差限并不难.我们选取未知参数的某个估计量,根据置信水平由不等式可以解出 :这个不等式就是我们所求的置信区间.现在学习的是第29页,共39页30单正态总体的区间
13、估计单正态总体的区间估计单正态总体的区间估计单正态总体的区间估计被估被估参数参数条件条件统计量统计量置信区间置信区间已知已知2未知未知22未知未知现在学习的是第30页,共39页31作业作业P294 4 5 6 8 10 12现在学习的是第31页,共39页32婴儿体重的估计婴儿体重的估计婴儿体重的估计婴儿体重的估计例例4 假定初生婴儿的体重服从正态分布,随机抽取12 名婴儿,测得体重为:(单位:克)3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540 试以 95%的置信度估计初生婴儿的平均体重以及方差.解解 设初生婴儿体重为X 克
14、,则 XN(,2),(1)需估计,而未知 2.现在学习的是第32页,共39页33作为统计量.有有 =,n=,t0.025(11)=,即的置信区间。(1)需估计,而未知 2.现在学习的是第33页,共39页34(2)需估计2,而未知,有 20.025(11)=,20.975(11)=,现在学习的是第34页,共39页35例例例例5 5 解解由置信区间的概念,所求的0.99的 置信区间为在交通工程中需要测定车速(单位 km/h),由以往2、现在作了150次观测,试问平均测量值的误差在 的经验知道,即测量值为X,测量值的误差在 之间。1、至少作多少次观测,才能以0.99的可靠性保证平均之间的概率有多大?
15、由题意要求用平均测量值 来估计其误差由题意知现在学习的是第35页,共39页36至少要作至少要作8686次观测,次观测,才能以0.99的可靠性保持平均测量误差在之间。即则钢索所能承受的平均张力为 6650.9 kg/cm2令现在学习的是第36页,共39页37例例例例6 6 设总体X N(,0.09),有一组样本值:12.6,13.4,12.8,13.2,求参数的置信度为0.95的置信区间.解解:有1=0.95,0=0.3,n=4,是的无偏估计量,是优良估计量,且从而现在学习的是第37页,共39页38 在标准正态分布表中查得上侧分位数得的置信区间为Z/2=Z0.025=1.96现在学习的是第38页,共39页感感谢谢大大家家观观看看现在学习的是第39页,共39页