《统计学总体参数估计.pptx》由会员分享,可在线阅读,更多相关《统计学总体参数估计.pptx(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章 总体参数估计参数估计在统计方法中的地位参数估计在统计方法中的地位参数估计参数估计假设检验假设检验统计方法描述统计描述统计推断统计推断统计第1页/共90页第六章 总体参数估计统计推断的过程统计推断的过程样样本本总体总体样本统计量样本统计量如:样本均值、如:样本均值、比例、方差比例、方差总体均值、比总体均值、比例、方差等例、方差等第2页/共90页第六章 总体参数估计第一节 参数估计的一般问题一、估计量与估计值 用来估计总体参数的统计量的名称,称用来估计总体参数的统计量的名称,称为为估计量估计量,用符号,用符号 表示。表示。用来估计总体参数时计算出来的估计量用来估计总体参数时计算出来的估计量
2、的具体数值,称为的具体数值,称为估计值估计值。(例:样本均值例:样本均值8080就是估计值)就是估计值)第3页/共90页第六章 总体参数估计二、点估计与区间估计(一)点估计定义:用样本估计量的值直接作为总体参数的用样本估计量的值直接作为总体参数的估计值,称作参数的估计值,称作参数的点估计点估计。(例:用样本均值直接作为总体均值的估计)(例:用样本均值直接作为总体均值的估计)第4页/共90页第六章 总体参数估计(二)区间估计定义:在点估计的基础上,给出总体参数估计的一个范围,称为参数的在点估计的基础上,给出总体参数估计的一个范围,称为参数的区区间估计间估计。例如,某班级平均分数在例如,某班级平均
3、分数在例如,某班级平均分数在例如,某班级平均分数在75758585之间,置信水平是之间,置信水平是之间,置信水平是之间,置信水平是95%95%样本统计量样本统计量(点估计点估计)置信区间置信区间置信下限置信下限置信上限置信上限第5页/共90页第六章 总体参数估计置信区间图示置信区间图示x95%95%的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第6页/共90页第六章 总体参数估计置 信 水 平1.将构造置
4、信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平2.表示为(1-)为是总体参数未在区间内的比例3.常用的置信水平值有99%,95%,90%相应的 为0.01,0.05,0.10第7页/共90页第六章 总体参数估计置 信 区 间1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个第
5、8页/共90页第六章 总体参数估计置信水平与置信区间均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了%的区间未包含的区间未包含 11 /2 2 /2 2第9页/共90页第六章 总体参数估计影响置信区间宽度的因素 1 1、总体数据的离散程度(总体标准差)、总体数据的离散程度(总体标准差)2 2、样本容量、样本容量 3 3、置信水平,影响、置信水平,影响z z的大小的大小 第10页/共90页第六章 总体参数估计定义:由样本统计量构造的总体参数估计区由样本统计量构造的总体参数估计区间,称为间,称为置信区间置信区间,其中区间的最小值称为,其中区间的最小值称为置信下限置信下限,最大值
6、称为,最大值称为置信上限置信上限。定义:如果我们将构造置信区间的步骤重复多如果我们将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所次,置信区间中包含总体参数真值的次数所占的比率,称为占的比率,称为置信水平置信水平,或称为置信系数。,或称为置信系数。第11页/共90页第六章 总体参数估计三、评价估计量的标准(一)无偏性定义:无偏性是指估计量抽样分布的数学期望等于无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为被估计的总体参数。设总体参数为 ,所选择的,所选择的估计量为估计量为 ,如果,如果,则称则称 为为 的无偏估的无偏估计量。计量。P P()B BA A无偏
7、无偏无偏有偏有偏有偏第12页/共90页第六章 总体参数估计(二)有效性定义:对同一个参数的两个无偏估计量对同一个参数的两个无偏估计量 和和 ,若,若 ,我们称,我们称 是是 比更有效的一比更有效的一个估计量。个估计量。AB 的抽样分布的抽样分布的抽样分布的抽样分布P P()第13页/共90页第六章 总体参数估计(三)一致性 定义:一致性是指随着样本容量的增大,点估计一致性是指随着样本容量的增大,点估计量的值越来越接近被估计的总体参数。量的值越来越接近被估计的总体参数。AB较小的样本容量较小的样本容量较大的样本容量较大的样本容量P P()第14页/共90页第六章 总体参数估计 第二节 一个总体参
8、数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例方差方差第15页/共90页第六章 总体参数估计一、总体均值的区间估计(一)正态总体、方差已知,或非正态总体、大样本 当当总体服从正态分布总体服从正态分布且且 已知已知,或总体不,或总体不是正态分布但是正态分布但大样本大样本时,样本均值的抽样分布时,样本均值的抽样分布均为正态分布,其数学期望为总体均值均为正态分布,其数学期望为总体均值 ,方,方差为差为 。而样本均值经过标准化后的随机变。而样本均值经过标准化后的随机变量则服从标准正态分布,即量则服从标准正态分布,即 N(0N(0,1)1)。第16页/共90页第六章 总
9、体参数估计 根据正态分布的性质可以构造出总体均根据正态分布的性质可以构造出总体均值在置信水平下的置信区间为:值在置信水平下的置信区间为:第17页/共90页第六章 总体参数估计 如果总体服从正态分布但如果总体服从正态分布但 未知未知,或总,或总体并不服从正态分布,只要在体并不服从正态分布,只要在大样本大样本条件下,条件下,总体方差用样本方差总体方差用样本方差S S2 2代替,这时总体均值在代替,这时总体均值在置信水平下的置信区间可以写为:置信水平下的置信区间可以写为:第18页/共90页第六章 总体参数估计例题:例题:一家食品生产企业以生产袋装食品为主,一家食品生产企业以生产袋装食品为主,每天的产
10、量大约为每天的产量大约为80008000袋左右。按规定每袋袋左右。按规定每袋的重量应为的重量应为100g100g。为对产量质量进行监测,。为对产量质量进行监测,企业质监部门经常要进行抽检,以分析每袋重企业质监部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中量是否符合要求。现从某天生产的一批食品中随机抽取了随机抽取了2525袋,测得每袋重量(单位:袋,测得每袋重量(单位:g g)如表所示。如表所示。第19页/共90页第六章 总体参数估计112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6
11、102.2116.695.497.8108.6105.0136.8102.8101.598.493.3表:表:25袋食品的重量袋食品的重量 已知产品重量服从正态分布,且总体标准差为已知产品重量服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为试估计该批产品平均重量的置信区间,置信水平为95%。第20页/共90页第六章 总体参数估计例题:一家保险公司收集到由例题:一家保险公司收集到由3636投保人组成的随机投保人组成的随机样本,得到每个投保人的年龄数据如表所示。试样本,得到每个投保人的年龄数据如表所示。试建立投保人年龄建立投保人年龄90%90%的置信区间。的置信区间
12、。样本标准差样本标准差:表:表:3636个投保人年龄的数据个投保人年龄的数据 S=S=233539273644364246433133425345544724342839364440394938344850343945484532第21页/共90页第六章 总体参数估计(二)正态总体、方差未知、小样本 需要用样本方差需要用样本方差S S2 2代替代替 ,这时样本均值,这时样本均值经过标准化以后的随机变量则服从自由度为经过标准化以后的随机变量则服从自由度为(n-1n-1)的)的t t分布,即分布,即 t(n-1)t(n-1)这时需要应用这时需要应用t t分布来建立总体均值的置信区间。分布来建立总体
13、均值的置信区间。第22页/共90页第六章 总体参数估计 t t 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它它通通常常要要比比正正态态分分布布平平坦坦和和分分散散。一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随随着着自自由由度度的的增增大大,分分布布也也逐逐渐渐趋于正态分布趋于正态分布 x x xt t 分布与标准正态分布的比较t 分布标准正态分布标准正态分布t t不同自由度的t分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z第23页/共90页第六章 总体参数估计 根据根据t t分布建立的总
14、体均值在置信区间为分布建立的总体均值在置信区间为 是自由度为是自由度为n-1n-1时,时,t t分布中右侧面积为分布中右侧面积为 时时的的t t值,该值,该 值可以通过值可以通过t t分布表查得。分布表查得。第24页/共90页第六章 总体参数估计例题:已知某种灯泡的寿命服从正态分布,现从一例题:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取批灯泡中随机抽取1616只,测得其使用寿命(单位:只,测得其使用寿命(单位:h h)如下:)如下:1510 1450 1480 1460 1520 1480 1490 1460 1510 1450 1480 1460 1520 1480 1490 1
15、460 1480 1510 1530 1470 1500 1520 1510 1470 1480 1510 1530 1470 1500 1520 1510 1470 建立该批灯泡平均使用寿命建立该批灯泡平均使用寿命95%95%的置信区间。的置信区间。第25页/共90页第六章 总体参数估计二、总体比例的区间估计(大样本)总体比例总体比例P P在在 置信水平下的置信区间置信水平下的置信区间 当当P P未知时,用未知时,用p p来代替来代替P P第26页/共90页第六章 总体参数估计例题:例题:某城市要估计下岗职工中女性所占的比某城市要估计下岗职工中女性所占的比例,随机抽取了例,随机抽取了1001
16、00名下岗职工,其中名下岗职工,其中6565人为人为女性。试以女性。试以95%95%的置信水平估计该城市下岗职的置信水平估计该城市下岗职工中女性比例的置信区间。工中女性比例的置信区间。第27页/共90页第六章 总体参数估计三、总体方差的区间估计1.1.估计一个总体的方差或标准差估计一个总体的方差或标准差2.2.假设假设总体服从正态分布总体服从正态分布3.3.总体方差总体方差 的点估计量为的点估计量为 ,且且4.总体方差在总体方差在1-置信水平下的置信区间为置信水平下的置信区间为第28页/共90页第六章 总体参数估计总体方差区间估计总体方差区间估计(图示)(图示)1-1-总体方差总体方差总体方差
17、1-1-1-的置信区间的置信区间的置信区间自由度为自由度为n n-1-1的的 第29页/共90页第六章 总体参数估计【例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了25袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布。以以95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.
18、6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第30页/共90页第六章 总体参数估计例题:已知某种灯泡的寿命服从正态分布,现从一例题:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取批灯泡中随机抽取1616只,测得其使用寿命(单位:只,测得其使用寿命(单位:h h)如下:)如下:1510 1450 1480 1460 1520 1480 1490 1460 1510 1450 1480 1460 1520 1480 1490 1460 1480 1510 1530 1470 1500
19、 1520 1510 1470 1480 1510 1530 1470 1500 1520 1510 1470 建立该批灯泡寿命方差建立该批灯泡寿命方差95%95%的置信区间。的置信区间。第31页/共90页第六章 总体参数估计第三节 两个总体参数的区间估计 一、两个总体均值之差的区间估计一、两个总体均值之差的区间估计 二、两个总体比例之差的区间估计二、两个总体比例之差的区间估计 三、两个总体方差比的区间估计三、两个总体方差比的区间估计第32页/共90页第六章 总体参数估计两个总体参数的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值之差比例之差方差比第33
20、页/共90页第六章 总体参数估计一、两个总体均值之差的区间估计一、两个总体均值之差的区间估计(一)两个总体均值之差的估计:独立样本(一)两个总体均值之差的估计:独立样本1 1、大样本的估计、大样本的估计 假定条件假定条件 两个两个总体都服从正态分布,总体都服从正态分布,、已知已知 若不是正态分布若不是正态分布,可以用正态分布来近似可以用正态分布来近似(n(n1 1 3030和和n n2 2 30)30)两个样本是独立的随机样本两个样本是独立的随机样本第34页/共90页第六章 总体参数估计使用正态分布统计量使用正态分布统计量 z z第35页/共90页第六章 总体参数估计(1)1,2已知时,两个总
21、体均值之差1-2在1-置信水平下的置信区间为(2)(2 2)1 1、2 2未知时,未知时,两个总体均值之差两个总体均值之差 1 1-2 2在在1-1-置信水平下的置信区间为置信水平下的置信区间为第36页/共90页第六章 总体参数估计【例例1 1】某某地地区区教教育育委委员员会会想想估估计计两两所所中中学学的的学学生生高高考考时时的的英英语语平平均均分分数数之之差差,为为此此在在两两所所中中学学独独立立抽抽取取两两个个随随机机样样本本,有有关关数数据据如如右右表表。建建立立两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%95%的置信区间的置信区间 两个样本的有关数据两个样本的有关数
22、据 中学中学1中学中学2n1=46n2=33S1=5.8 S2=7.2第37页/共90页第六章 总体参数估计解解:两个总体均值之差在两个总体均值之差在1-1-置信水平下的置信区间为置信水平下的置信区间为两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为5.035.03分分10.9710.97分分第38页/共90页第六章 总体参数估计2 2、小样本的估计、小样本的估计假定条件两个总体都服从正态分布两个总体方差未知两个独立的小样本(n130和n230)(1)两个总体方差未知但相等:1=2总体方差的合并估计量第39页/共90页第六章 总体参数估计估计量x1-x2的抽样标
23、准差第40页/共90页第六章 总体参数估计两个样本均值之差的标准化两个总体均值之差1-2在1-置信水平下的置信区间为第41页/共90页第六章 总体参数估计【例2】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(分钟)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433
24、.831.232.128.020.033.428.830.030.226.52 21 1第42页/共90页第六章 总体参数估计解解:根据样本数据计算得根据样本数据计算得合并估计量为:合并估计量为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟第43页/共90页第六章 总体参数估计(2 2)两个总体方差未知且不相等:两个总体方差未知且不相等:且且n n1 1=n=n2 2=n=n 使用统计量使用统计量 在在 置信水平下的置信区间为置信水平下的置信区间为第44页/共90页第六章 总体参数估计(3)两个总体方差
25、未知且不相等:两个总体方差未知且不相等:且且n1n1n2n2使用统计量使用统计量样本均值之差将标准化后不再服从自由度为(样本均值之差将标准化后不再服从自由度为(n1+n2-2n1+n2-2)的)的t t分布,而是近分布,而是近似服从自由度为似服从自由度为v v的的t t分布分布第45页/共90页第六章 总体参数估计两个总体均值之差1-2在1-置信水平下的置信区间为自由度自由度第46页/共90页第六章 总体参数估计【例3】沿用前例。假定第一种方法随机安排12名工人,第二种方法随机安排名工人,即n1=12,n2=8,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%
26、的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.22 21 1第47页/共90页第六章 总体参数估计解:根据样本数据计算得自由度为:两种方法组装产品所需平均时间之差的置信区间为0.192分钟9.058分钟第48页/共90页习题二1.1.从两个正态总体中分别抽取两个独立的随机样本,从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表所示:它们的
27、均值和标准差如下表所示:(1 1)求在)求在 90%90%置信水平下的置信区间。置信水平下的置信区间。来自总体来自总体1 1的样本的样本来自总体来自总体2的样本的样本第49页/共90页第六章 总体参数估计2.2.从两个正态总体中分别抽取两个独立的随机样本,它们的均值从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:和标准差如下表:求求 在在95%95%置信水平下的置信区间。置信水平下的置信区间。(1 1)设)设n1=n2=100n1=n2=100。(2 2)设)设n1=n2=10n1=n2=10,。来自总体来自总体1 1的样本的样本来自总体来自总体2的样本的样本第50页/共
28、90页第六章 总体参数估计(3 3)设)设n1=n2=10n1=n2=10,。(4 4)设)设n1=10n1=10,n2=20n2=20,。第51页/共90页第六章 总体参数估计(二)两个总体均值之差的估计:匹配样本(二)两个总体均值之差的估计:匹配样本1 1、匹配大样本、匹配大样本假定条件两个匹配的大样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布两个总体均值之差d=1-2在1-置信水平下的置信区间为对应差值的均值对应差值的标准差第52页/共90页第六章 总体参数估计2 2、匹配小样本、匹配小样本假定条件两个匹配的小样本(n1 30和n2 30)两个总体各观察值的配对差服从
29、正态分布 两个总体均值之差d=1-2在1-置信水平下的置信区间为第53页/共90页第六章 总体参数估计【例】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表。试建立两种试卷分数 之 差d=1-2 95%的置信区间 10名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试卷试卷B差值差值d17871726344193726111489845691741754951-27685513876601698577810553916第54页/共90页第六章 总体参数估计解解:根据样本数据计算得根据样本数据计算得两种试卷所产生的分数之差的置信区间为两种试卷所产
30、生的分数之差的置信区间为6.336.33分分15.6715.67分分第55页/共90页习题三1.1.下表是由下表是由4 4对观察值组成的随机样本:对观察值组成的随机样本:(1 1)计算)计算A A与与B B各对观察值之差,再利用得出的差值计算各对观察值之差,再利用得出的差值计算 和和 。配对号配对号来自总体来自总体A 的样本的样本来自总体来自总体B的样本的样本1202573106485第56页/共90页第六章 总体参数估计(2 2)设)设 设设 分别为总体分别为总体A A和和B B的均值,构造的均值,构造 在在95%95%置信水平下的置信区间。置信水平下的置信区间。第57页/共90页第六章 总
31、体参数估计二、两个总体比例之差的区间估计二、两个总体比例之差的区间估计1、假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的2、两个总体比例之差P1-P2在1-置信水平下的置信区间为第58页/共90页第六章 总体参数估计【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计城市与农村收视率差别的置信区间1 12 2第59页/共90页第六章 总体参数估计解解:已知已知 n n1 1=500=500,n n2 2=400=400,p p1 1=45%=45%,p p2 2=32%
32、=32%,1-1-=95%=95%,z z/2/2=1.96=1.96 P P1 1-P P2 2置信度为置信度为95%95%的置信区间为的置信区间为城城 市市 与与 农农 村村 收收 视视 率率 差差 值值 的的 置置 信信 区区 间间 为为6.68%19.32%6.68%19.32%第60页/共90页习题四:1.从两个总体中各抽取一个n1=n2=250的独立随机样本,来自总体1的样本比例为p1=40%,来自总体2 的样本比例为p2=30%。(1)构造P1-P2在90%的置信水平下的置信区间。(2)构造P1-P2在95%的置信水平下的置信区间。第61页/共90页第六章 总体参数估计三、两个总
33、体方差之比的区间估计三、两个总体方差之比的区间估计1、比较两个总体的方差比2、用两个样本的方差比来判断如果S12/S22接近于1,说明两个总体方差很接近如果S12/S22远离1,说明两个总体方差之间存在差异3、总体方差比在1-置信水平下的置信区间为第62页/共90页第六章 总体参数估计两个总体方差之比的区间估计两个总体方差之比的区间估计(图示)(图示)F FF F1-1-F F 总体方差比总体方差比1-1-的置信区间的置信区间方差比置信区间示意图第63页/共90页第六章 总体参数估计【例】为了研究男女学生在生活费支出(元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果:
34、男学生:女学生:试以90%置信水平估计男女学生生活费支出方差比的置信区间第64页/共90页第六章 总体参数估计解解:根根据据自自由由度度 n n1 1=25-1=24=25-1=24,n n2 2=25-1=24=25-1=24,查查得得 F F/2/2(24)=1.98(24)=1.98,F F1-1-/2/2(24)=1/1.98=0.505(24)=1/1.98=0.505 1 12 2/2 22 2置信度为置信度为90%90%的置信区间为的置信区间为男男 女女 学学 生生 生生 活活 费费 支支 出出 方方 差差 比比 的的 置置 信信 区区 间间 为为0.471.840.471.84
35、 第65页/共90页习题五.生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进减小方差。下面是两部机器生产的袋茶重量(单位:g)的数据:构造两个总体方差比在90%置信水平下的置信区间。机器机器1机器机器23.453.223.903.223.283.353.202.983.703.383.193.303.223.753.283.303.203.053.503.383.353.303.293.332.953.453.203.343.353.273.163.483.123.283.163.283.203.183.253.303.343.25第66页/共90页第六章 总体参数估计
36、第四节 样本容量的确定一、估计总体均值时样本容量的确定一、估计总体均值时样本容量的确定 E E代表所希望达到的边际误差,即代表所希望达到的边际误差,即 本容量的公式本容量的公式 第67页/共90页第六章 总体参数估计公式反映的信息:公式反映的信息:(1 1)样本容量与置信水平成正比;)样本容量与置信水平成正比;(2 2)样本容量与总体方差成正比;)样本容量与总体方差成正比;(3 3)样本容量与边际误差成反比。)样本容量与边际误差成反比。第68页/共90页第六章 总体参数估计【例题】拥有工商管理学士学位的大学毕业生的年拥有工商管理学士学位的大学毕业生的年薪的标准差约为薪的标准差约为2000200
37、0元,假定想要以元,假定想要以95%95%的置信的置信水平估计年薪的置信区间,希望边际误差为水平估计年薪的置信区间,希望边际误差为400400元。应抽取多大的样本容量?元。应抽取多大的样本容量?第69页/共90页第六章 总体参数估计解解:已知已知 =500=500,E E=200,=200,1-1-=95%=95%,z z/2/2=1.96=1.96 1 12 2/2 22 2置信度为置信度为90%90%的置信区间为的置信区间为即应抽取即应抽取9797人作为样本人作为样本 第70页/共90页第六章 总体参数估计二、估计总体比例时的样本容量的确定 E E为所希望达到的边际误差,即为所希望达到的边
38、际误差,即 估计总体比利时样本容量的确定公式估计总体比利时样本容量的确定公式 第71页/共90页第六章 总体参数估计【例题例题】根据以往的生产统计,某种产品的合格根据以往的生产统计,某种产品的合格率约为率约为90%90%,现要求边际误差为,现要求边际误差为5%5%,在求置信,在求置信水平为水平为95%95%的置信区间时,应抽取多少个产品的置信区间时,应抽取多少个产品作为样本?作为样本?第72页/共90页第六章 总体参数估计解解:已已 知知=90%=90%,=0.05=0.05,z z/2/2=1.96=1.96,E E=5%=5%应抽取的样本容量应抽取的样本容量为为应抽取应抽取139139个产
39、品作为样本个产品作为样本第73页/共90页第六章 总体参数估计习题六:习题六:1.1.某超市想要估计每位顾客平均每次购物花费的金额。根据过去某超市想要估计每位顾客平均每次购物花费的金额。根据过去的经验,标准差大约为的经验,标准差大约为120120元,现要求以元,现要求以95%95%的置信水平估计每的置信水平估计每位顾客购物金额的置信区间,并要求边际误差不超过位顾客购物金额的置信区间,并要求边际误差不超过2020元,应元,应抽取多少位顾客作为样本?抽取多少位顾客作为样本?2.2.从一个标准差为从一个标准差为5 5的总体中以重复抽样的方式抽出一个容量为的总体中以重复抽样的方式抽出一个容量为4040
40、的样本,样本均值为的样本,样本均值为25.25.(1 1)样本均值的抽样标准差是多少?)样本均值的抽样标准差是多少?(2 2)在)在95%95%的置信水平下,边际误差是多少?的置信水平下,边际误差是多少?第74页/共90页第六章 总体参数估计3 3.某快餐店想要估计每位顾客午餐的平均花费某快餐店想要估计每位顾客午餐的平均花费金额,在为期金额,在为期3 3周的时间里以重复抽样的方式周的时间里以重复抽样的方式选取选取4949名顾客组成了一个简单随机样本。名顾客组成了一个简单随机样本。(1 1)假定总体标准差为)假定总体标准差为1515元,求样本均值的抽元,求样本均值的抽样标准化差。样标准化差。(2
41、 2)在)在95%95%的置信水平下,求边际误差;的置信水平下,求边际误差;(3 3)如果样本均值为)如果样本均值为120120元,求总体均值在元,求总体均值在95%95%置信水平下的置信区间。置信水平下的置信区间。第75页/共90页第六章 总体参数估计4.4.根据以往的生产数据,某种产品的废品率为根据以往的生产数据,某种产品的废品率为2%2%。如。如果要求在果要求在95%95%置信水平下的置信区间,若要求边际误置信水平下的置信区间,若要求边际误差不超过差不超过4%4%,应抽取多大的样本?,应抽取多大的样本?第76页/共90页第六章 总体参数估计三、估计两个总体均值之差时样本容量的确三、估计两
42、个总体均值之差时样本容量的确定定1、设n1和n2为来自两个总体的样本,并假定n1=n22、根据均值之差的区间估计公式可得两个样本的容量n为其中:其中:其中:第77页/共90页第六章 总体参数估计【例】一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信水平为95%,预先估计两个班考试分数的方差分别为:试验班12=90,普通班22=120。如果要求估计的误差范围(边际误差)不超过5分,在两个班应分别抽取多少名学生进行调查?第78页/共90页第六章 总体参数估计解解:已已知知 1 12 2=90=90,2 22 2=120=120,E E=5,=5,1-1-=95%=95
43、%,z z/2/2=1.96=1.96即应抽取即应抽取3333人作为样本人作为样本 第79页/共90页第六章 总体参数估计四、估计两个总体比例之差时样本容量的确定四、估计两个总体比例之差时样本容量的确定1、设n1和n2为来自两个总体的样本,并假定n1=n22、根据比例之差的区间估计公式可得两个样本的容量n为其中:其中:其中:其中:第80页/共90页第六章 总体参数估计【例例】一一家家瓶瓶装装饮饮料料制制造造商商想想要要估估计计顾顾客客对对一一种种新新型型饮饮料料认认知知的的广广告告效效果果。他他在在广广告告前前和和广广告告后后分分别别从从市市场场营营销销区区各各抽抽选选一一个个消消费费者者随随
44、机机样样本本,并并询询问问这这些些消消费费者者是是否否听听说说过过这这种种新新型型饮饮料料。这这位位制制造造商商想想以以10%10%的的误误差差范范围围和和95%95%的的置置信信水水平平估估计计广广告告前前后后知知道道该该新新型型饮饮料料消消费费者者的的比比例例之之差差,他他抽抽取取的的两两个个样样本本分分别别应应包包括括多多少少人人?(假假定定两两个个样样本本容容量量相等相等)绿色绿色健康饮品健康饮品第81页/共90页第六章 总体参数估计解:E=10%,1-=95%,z/2=1.96,由于没有P的信息,用0.5代替即应抽取193位消费者作为样本第82页/共90页第六章 总体参数估计习题七:
45、习题七:1.1.假定假定n n1 1=n=n2 2,边际误差为,边际误差为0.050.05,相应的置信水平为,相应的置信水平为95%95%,估计两个总体比例之差,估计两个总体比例之差P P1 1-P-P2 2时所需要的样本容时所需要的样本容量为多大?量为多大?第83页/共90页第六章 总体参数估计2.2.假定两个总体的标准差分别为假定两个总体的标准差分别为 和和 ,若要求误差范围不超过若要求误差范围不超过5 5,相应的置信水平为,相应的置信水平为95%95%,假,假定定n1=n2n1=n2,估计两个总体均值之差,估计两个总体均值之差 时所需的时所需的样本容量为多大?样本容量为多大?第84页/共
46、90页第六章 总体参数估计第六章课后作业:1.1.从一个标准差为从一个标准差为5 5的总体中以重复抽样的方的总体中以重复抽样的方式抽出一个容量为式抽出一个容量为4040的样本,样本均值为的样本,样本均值为25.25.(1 1)样本均值的抽样标准差是多少?)样本均值的抽样标准差是多少?(2 2)在)在95%95%的置信水平下,边际误差是多少?的置信水平下,边际误差是多少?第85页/共90页第六章 总体参数估计2.2.某快餐店想要估计每位顾客午餐的平均花费某快餐店想要估计每位顾客午餐的平均花费金额,在为期金额,在为期3 3周的时间里以重复抽样的方式周的时间里以重复抽样的方式选取选取4949名顾客组
47、成了一个简单随机样本。名顾客组成了一个简单随机样本。(1 1)假定总体标准差为)假定总体标准差为1515元,求样本均值的抽元,求样本均值的抽样标准化差。样标准化差。(2 2)在)在95%95%的置信水平下,求边际误差;的置信水平下,求边际误差;(3 3)如果样本均值为)如果样本均值为120120元,求总体均值在元,求总体均值在95%95%置信水平下的置信区间。置信水平下的置信区间。第86页/共90页第六章 总体参数估计3.3.在一项家电调查中,随机抽取了在一项家电调查中,随机抽取了200200户居民,调查他们是否户居民,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占拥有某一品牌
48、的电视机。其中拥有该品牌电视机的家庭占23%23%。求总体比例的置信区间,置信水平分别为。求总体比例的置信区间,置信水平分别为90%90%和和95%95%。4.4.某居民小区共有居民某居民小区共有居民500500户,校小区管理者准备采用一项新户,校小区管理者准备采用一项新的供水设施,想了解居民赞成与否。采取重复抽样方法随机的供水设施,想了解居民赞成与否。采取重复抽样方法随机抽取了抽取了5050户,其中有户,其中有3232户赞成,户赞成,1818户反对。户反对。(1 1)求总体中赞成该项改革的户数比例的置信区间,置信水)求总体中赞成该项改革的户数比例的置信区间,置信水平为平为95%95%。(2
49、2)如果小区管理者预计赞成的比例达到)如果小区管理者预计赞成的比例达到80%80%,应抽取多少,应抽取多少户进行调查?户进行调查?第87页/共90页习题11.1.在一项家电调查中,随机抽取了在一项家电调查中,随机抽取了200200户居民,调查他们户居民,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占家庭占23%23%。求总体比例的置信区间,置信水平分别为。求总体比例的置信区间,置信水平分别为90%90%和和95%95%。2.2.某居民小区共有居民某居民小区共有居民500500户,校小区管理者准备采用一户,校小区管理者准备采用一项新的供水设施,想了解居民赞成与否。采取重复抽样项新的供水设施,想了解居民赞成与否。采取重复抽样方法随机抽取了方法随机抽取了5050户,其中有户,其中有3232户赞成,户赞成,1818户反对。户反对。第88页/共90页(1 1)求总体中赞成该项改革的户数比例的置信区间,置信水平)求总体中赞成该项改革的户数比例的置信区间,置信水平为为95%95%。(2 2)如果小区管理者预计赞成的比例达到)如果小区管理者预计赞成的比例达到80%80%,应抽取多少户进,应抽取多少户进行调查?行调查?第89页/共90页感谢您的观看!第90页/共90页