《统计学第五章参数估计优秀PPT.ppt》由会员分享,可在线阅读,更多相关《统计学第五章参数估计优秀PPT.ppt(94页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 5 章 参数估计5.1 参数估计的一般问题参数估计的一般问题 5.2 一个总体参数的区间估计一个总体参数的区间估计5.3 两个总体参数的区间估计两个总体参数的区间估计5.4 样本容量的确定样本容量的确定学习目标1.估计量与估计值的概念估计量与估计值的概念2.点估计与区间估计的区分点估计与区间估计的区分3.评价估计量优良性的标准评价估计量优良性的标准4.一个总体参数的区间估计方法一个总体参数的区间估计方法5.两个总体参数的区间估计方法两个总体参数的区间估计方法6.样本容量的确定方法样本容量的确定方法估计就是依据你拥有的信息来对现实世界进行估计就是依据你拥有的信息来对现实世界进行某种推断。某种
2、推断。你可以依据一个人的衣着、言谈和举止推断其你可以依据一个人的衣着、言谈和举止推断其身份身份你可以依据一个人的脸色,猜出其心情和身体你可以依据一个人的脸色,猜出其心情和身体状况状况统计中的估计也不例外,它是完全依据数据做统计中的估计也不例外,它是完全依据数据做出的。出的。假如我们想知道北京人认可某饮料的比例,人假如我们想知道北京人认可某饮料的比例,人们只有在北京人中进行抽样调查以得到样本,们只有在北京人中进行抽样调查以得到样本,并用样本中认可该饮料的比例来估计真实的比并用样本中认可该饮料的比例来估计真实的比例。例。从不同的样本得到的结论也不会完全一样。虽从不同的样本得到的结论也不会完全一样。
3、虽然真实的比例在这种抽样过程中恒久也不知道;然真实的比例在这种抽样过程中恒久也不知道;但可以知道估计出来的比例和真实的比例大致但可以知道估计出来的比例和真实的比例大致差多少。差多少。5.1 参数估计的一般问题5.1.1 估计量与估计值估计量与估计值5.1.2 点估计与区间估计点估计与区间估计5.1.3 评价估计量的标准评价估计量的标准估计量与估计值1.估计量:用于估计总体参数的随机变量2.如样本均值,样本比例、样本方差等3.例如:样本均值就是总体均值 的一个估计量4.参数用 表示,估计量用 表示5.估计值:估计参数时计算出来的统计量的具体值6.假如样本均值 x=80,则80就是的估计值估计量与
4、估计值(estimator&estimated value)二战中的二战中的点估计点估计点估计与区间估计点估计(point estimate)1.1.用样本的估计量干脆作为总体参数的估计值用样本的估计量干脆作为总体参数的估计值2.2.用什么样的估计量来估计参数呢?用什么样的估计量来估计参数呢?3.3.事事实实上上没没有有硬硬性性限限制制。任任何何统统计计量量,只只要要人人们觉得合适就可以当成估计量。们觉得合适就可以当成估计量。4.4.例如:用样本均值干脆作为总体均值的估计例如:用样本均值干脆作为总体均值的估计5.5.例例如如:用用两两个个样样本本均均值值之之差差干干脆脆作作为为总总体体均均值值
5、之之差的估计差的估计6.6.2.2.没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息区间估计(interval estimate)当描述一个人的体重时,你一般可能不会说这个人是76.35公斤,你会说这个人是七八十公斤,或者是在70公斤到80公斤之间。这个范围就是区间估计的例子。区间估计(interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个区区间间范范围,该区间由样本统计量加减抽样误差而得到的围,该区间由样本统计量加减抽样误差而得到的2.2.依依据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样
6、样本本统统计计量量与与总总体体参数的接近程度给出一个概率度量参数的接近程度给出一个概率度量3.3.比比如如,某某班班级级平平均均分分数数在在75758585之之间间,置置信信水水平平是是95%95%样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限点估计给出一个数点估计给出一个数字,用起来很便利;字,用起来很便利;而区间估计给出一而区间估计给出一个区间,说起来留个区间,说起来留有余地;不像点估有余地;不像点估计那么确定。计那么确定。区间估计的图示 x95%95%的样本的样本的样本
7、的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-3.为是总体参数未在区间内的比例4.常用的置信水平值有 99%,95%,90%5.相应的 为0.01,0.05,0.10置信水平 1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参
8、数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值4.我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间(confidence interval)置信区间(95%的置信区间)重复构造出重复构造出重复构造出重复构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 点估计值点估计值点估计值点估计值置信区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了区间包含了区间包含了%的区间未
9、包含的区间未包含的区间未包含的区间未包含 1 1 /2 2 /2 2评价估计量的标准无偏性(unbiasedness)无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()一样性(consistency)一样性:随着样本容量的增大,估计量的一样性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数值越来
10、越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()5.2 5.2 一个总体参数的区间估计一个总体参数的区间估计5.2.1 5.2.1 总体均值的区间估计总体均值的区间估计5.2.2 5.2.2 总体比例的区间估计总体比例的区间估计5.2.3 5.2.3 总体方差的区间估计总体方差的区间估计一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均均值值比例比例方差方差 分位数分位数 我我们们有有必必要要引引进进总总体体的的下下侧侧分分位位数数、上上侧侧分分位位数数以及相应的尾概率
11、的概念。以及相应的尾概率的概念。对对于于连连续续型型随随机机变变量量X X,a a下下侧侧分分位位数数(又又称称为为a a分位数,分位数,a-quantilea-quantile)定义为数)定义为数xaxa,它满足关系,它满足关系这里的这里的a a又称为下(左)侧尾概率(又称为下(左)侧尾概率(lower/left lower/left tail probabilitytail probability)而而a a上上侧侧分分位位数数(又又称称a a上上分分位位数数,a-upper a-upper quantilequantile)定义为数)定义为数xaxa,它满足关系,它满足关系这里的这里的a
12、 a也称为上(右)侧尾概率也称为上(右)侧尾概率(upper/right tail probabilityupper/right tail probability)。)。明明显显,对对于于连连续续对对称称分分布布,上上侧侧分分位位数数等等于于(1(1)下下侧侧分分位位数数,而而(1(1)下下侧侧分位数等于分位数等于上侧分位数。上侧分位数。通通常常用用zz表表示示标标准准正正态态分分布布的的上上侧侧分分位位数数,即即对对于标准正态分布变量于标准正态分布变量Z Z,有,有P(Zz)=P(Zz)=。表表示示了了0.050.05上上侧侧分分位位数数z=z0.05z=z0.05及及相相应应的的尾尾概概率
13、率(=0.05=0.05)。有有些些书书用用符符号号z1z1而而不不是是 ;因因此在看参考文献时要留意符号的定义。此在看参考文献时要留意符号的定义。N(0,1)分布右侧尾概率分布右侧尾概率P(zza a)=a a的示意的示意图图总体均值的区间估计总体均值的区间估计 (正态总体、正态总体、已知,或非正态总体、大样本已知,或非正态总体、大样本)总体均值的区间估计总体均值的区间估计(大样本大样本)1.假定条件总体听从正态分布,且方差()未知假如不是正态分布,可由正态分布来近似(n 30)运用正态分布统计量 z3.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为影响区间宽度的
14、因素1.总体数据的离散程度,用 来测度2.样本容量,3.3.置信水平(1-),影响 z 的大小总体均值的区间估计(例题分析)【例例例例 】一一一一家家家家食食食食品品品品生生生生产产产产企企企企业业业业以以以以生生生生产产产产袋袋袋袋装装装装食食食食品品品品为为为为主主主主,为为为为对对对对产产产产量量量量质质质质量量量量进进进进行行行行监监监监测测测测,企企企企业业业业质质质质检检检检部部部部门门门门常常常常常常常常要要要要进进进进行行行行抽抽抽抽检检检检,以以以以分分分分析析析析每每每每袋袋袋袋重重重重量量量量是是是是否否否否符符符符合合合合要要要要求求求求。现现现现从从从从某某某某天天天
15、天生生生生产产产产的的的的一一一一批批批批食食食食品品品品中中中中随随随随机机机机抽抽抽抽取取取取了了了了2525袋袋袋袋,测测测测得得得得每每每每袋袋袋袋重重重重量量量量如如如如下下下下表表表表所所所所示示示示。已已已已知知知知产产产产品品品品重重重重量量量量的的的的分分分分布布布布听听听听从从从从正正正正态态态态分分分分布布布布,且且且且总总总总体体体体标标标标准准准准差差差差为为为为10g10g。试试试试估估估估计计计计该该该该批批批批产产产产品品品品平平平平均均均均重重重重量量量量的的的的置信区间,置信水平为置信区间,置信水平为置信区间,置信水平为置信区间,置信水平为95%95%25袋
16、食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3z z/2/2=1.96=1.96总体均值的区间估计(例题分析)解解解解:已已已已知知知知N(N(,102)102),n=25,n=25,1-1-=95%95%,z z/2=1.96/2=1.96。依据样本数据计算得:。依据样本数据计算得:。依据样本数据计算得:。依据样本数据计算得:总体均值总体均值总体均值总体均值在在在在1
17、-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44g109.28g101.44g109.28g总体均值的区间估计(例题分析)【例例例例】一一家家保保险险公公司司收收集集到到由由3636投投保保个个人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(周周岁岁)数数据据如如下下表表。试建立投保人年龄试建立投保人年龄90%90%的置信区间的置信区间 36个投保人年龄的数据个投保人年龄的数据 2335392736443642464331334253455447243428
18、39364440394938344850343945484532总体均值的区间估计(例题分析)解解解解:已已已已知知知知n=36,n=36,1-1-=90%90%,z z/2=1.645/2=1.645。依依依依据据据据样样样样本本本本数据计算得:数据计算得:数据计算得:数据计算得:,总体均值总体均值总体均值总体均值在在在在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁总体均值的区间估计(正态总体、未知、小样本)总体均值的区间估计(小样本)1.假
19、定条件总体听从正态分布,且方差()未知小样本(n 30)运用 t 分布统计量3.总体均值 在1-置信水平下的置信区间为t 分布 t t 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它它通通常常要要比比正正态态分分布布平平坦坦和和分分散散。一一个个特特定定的的分分布布依依靠靠于于称称之之为为自自由由度度的的参参数数。随随着着自自由由度度的的增增大大,分分布布也也渐渐渐渐趋于正态分布趋于正态分布 x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(
20、dfdf=13)=13)t t(dfdf=5)=5)z z总体均值的区间估计(例题分析)【例例例例】已已已已知知知知某某某某种种种种灯灯灯灯泡泡泡泡的的的的寿寿寿寿命命命命听听听听从从从从正正正正态态态态分分分分布布布布,现现现现从从从从一一一一批批批批灯灯灯灯泡泡泡泡中中中中随随随随机机机机抽抽抽抽取取取取1616只只只只,测测测测得得得得其其其其运运运运用用用用寿寿寿寿命命命命(小小小小时时时时)如如如如下。建立该批灯泡平均运用寿命下。建立该批灯泡平均运用寿命下。建立该批灯泡平均运用寿命下。建立该批灯泡平均运用寿命95%95%的置信区间的置信区间的置信区间的置信区间16灯泡使用寿命的数据灯
21、泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计(例题分析)解解解解:已已已已 知知知知 N(N(,2)2),n=16,n=16,1-1-=95%95%,t t/2(15)=2.131/2(15)=2.131 依据样本数据计算得:依据样本数据计算得:依据样本数据计算得:依据样本数据计算得:,总体均值总体均值总体均值总体均值在在在在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均运运用用寿寿命命的的置置信信区区
22、间间为为1476.81476.8小小时时1503.21503.2小时小时总体比例的区间估计总体比例的区间估计1.假定条件总体听从二项分布可以由正态分布来近似运用正态分布统计量 z3.3.3.总体比例总体比例总体比例 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为总体比例的区间估计(例题分析)【例例例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机地地抽抽取取了了100100名名下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中
23、女女性性比比例例的置信区间的置信区间解解解解:已已知知 n n=100=100,p p65%65%,1 1-=95%95%,z z/2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区间为区间为55.65%74.35%55.65%74.35%总体方差的区间估计总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体听从正态分布总体方差 2 的点估计量为S2,且4.总体方差在1-置信水平下的置信区间为总体方差的区间估计(图示)1-1-1-1-总体方差总体方差总体方差1-1-1-的置信区间的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的
24、的的 总体方差的区间估计(例题分析)【例例例例】一一一一家家家家食食食食品品品品生生生生产产产产企企企企业业业业以以以以生生生生产产产产袋袋袋袋装装装装食食食食品品品品为为为为主主主主,现现现现从从从从某某某某天天天天生生生生产产产产的的的的一一一一批批批批食食食食品品品品中中中中随随随随机机机机抽抽抽抽取取取取了了了了2525袋袋袋袋,测测测测得得得得每每每每袋袋袋袋重重重重量量量量如如如如下下下下表表表表所所所所示示示示。已已已已知知知知产产产产品品品品重重重重量量量量的的的的分分分分布布布布听听听听从从从从正正正正态态态态分分分分布布布布。以以以以95%95%的置信水平建立该种食品重量方
25、差的置信区间的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体方差的区间估计(例题分析)解解解解:已知已知已知已知n n2525,1-1-95%,95%,依据样本数据计算得依据样本数据计算得依据样本数据计算得依据样本数据计算得 s2=93.21
26、 s2=93.21 2 2置信度为置信度为置信度为置信度为95%95%的置信区间为的置信区间为的置信区间为的置信区间为 该企业生产的食品总体重量标准差的的置信区该企业生产的食品总体重量标准差的的置信区间为间为7.54g13.43g7.54g13.43g5.3 5.3 两个总体参数的区间估计两个总体参数的区间估计5.3.1 两个总体均值之差的区间估计两个总体均值之差的区间估计5.3.2 两个总体比例之差的区间估计两个总体比例之差的区间估计5.3.3 两个总体方差比的区间估计两个总体方差比的区间估计两个总体均值之差的区间估计两个总体均值之差的区间估计(独立大样本独立大样本)两个总体均值之差的估计两
27、个总体均值之差的估计(大样本大样本)1.假定条件两个总体都听从正态分布,1、2已知若不是正态分布,可以用正态分布来近似(n130和n230)两个样本是独立的随机样本运用正态分布统计量 z两个总体均值之差的估计(大样本)1.1,2已知时,两个总体均值之差1-2在1-置信水平下的置信区间为2.1 1、2 2未知时,未知时,两个总体均值之差两个总体均值之差 1 1-2 2在在1-1-置信水平下的置信区间为置信水平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例】某某地地区区教教化化委委员员会会想想估估计计两两所所中中学学的的学学生生高高考考时时的的英英语语平平均均
28、分分数数之之差差,为为此此在在两两所所中中学学独独立立抽抽取取两两个个随随机机样样本本,有有关关数数据据如如右右表表。建建立立两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%的的置置信区间信区间 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n2=33S1=5.8 S2=7.2两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解解解:两两个个总总体体均均值值之之差差在在1-1-置置信信水水平平下下的的置置信信区区间间为为 两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为5.035.03分分10.9710.97分
29、分两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本)两个总体均值之差的估计两个总体均值之差的估计(小样本小样本:1 12 2=2 22 2)1.假定条件两个总体都听从正态分布两个总体方差未知但相等:1=2两个独立的小样本(n130和n230)总体方差的合并估计量3.3.估计估计量量 x x1 1-x x2 2的抽样标准差的抽样标准差两个总体均值之差的估计两个总体均值之差的估计(小样本小样本:1 1=)1.两个样本均值之差的标准化2.两个总体均值之差1-2在1-置信水平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例例例】为为为为估估
30、估估计计计计两两两两种种种种方方方方法法法法组组组组装装装装产产产产品品品品所所所所需需需需时时时时间间间间的的的的差差差差异异异异,分分分分别别别别对对对对两两两两种种种种不不不不同同同同的的的的组组组组装装装装方方方方法法法法各各各各随随随随机机机机支支支支配配配配1212名名名名工工工工人人人人,每每每每个个个个工工工工人人人人组组组组装装装装一一一一件件件件产产产产品品品品所所所所需需需需的的的的时时时时间间间间(分分分分钟钟钟钟)下下下下如如如如表表表表。假假假假定定定定两两两两种种种种方方方方法法法法组组组组装装装装产产产产品品品品的的的的时时时时间间间间听听听听从从从从正正正正态
31、态态态分分分分布布布布,且且且且方方方方差差差差相相相相等等等等。试试试试以以以以95%95%的的的的置置置置信信信信水水水水平平平平建建建建立立立立两两两两种种种种方方方方法法法法组组组组装装装装产产产产品品品品所所所所需需需需平平平平均均均均时间差值的置信区间时间差值的置信区间时间差值的置信区间时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5两个总体均值之差
32、的估计两个总体均值之差的估计(例题分析例题分析)解解解解:依据样本数据计算得依据样本数据计算得依据样本数据计算得依据样本数据计算得 合并估计量为:合并估计量为:合并估计量为:合并估计量为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟两个总体均值之差的估计两个总体均值之差的估计(小样本小样本:1 1 )1.假定条件两个总体都听从正态分布两个总体方差未知且不相等:12两个独立的小样本(n130和n230)运用统计量两个总体均值之差的估计两个总体均值之差的估计(小样本小样本:1 1 )两个总体均值之差1-2在
33、1-置信水平下的置信区间为自由度自由度两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例例例】沿沿沿沿用用用用前前前前例例例例。假假假假定定定定第第第第一一一一种种种种方方方方法法法法随随随随机机机机支支支支配配配配1212名名名名工工工工人人人人,其其其其次次次次种种种种方方方方法法法法随随随随机机机机支支支支配配配配名名名名工工工工人人人人,即即即即n1=12n1=12,n2=8 n2=8,所所所所得得得得的的的的有有有有关关关关数数数数据据据据如如如如表表表表。假假假假定定定定两两两两种种种种方方方方法法法法组组组组装装装装产产产产品品品品的的的的时时时时间间间间听听
34、听听从从从从正正正正态态态态分分分分布布布布,且且且且方方方方差差差差不不不不相相相相等等等等。以以以以95%95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.22 21 1两个总体均值
35、之差的估计(例题分析)解解解解:依据样本数据计算得依据样本数据计算得依据样本数据计算得依据样本数据计算得 自由度为:自由度为:自由度为:自由度为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.1920.192分钟分钟9.0589.058分钟分钟两个总体均值之差的区间估计两个总体均值之差的区间估计(匹配样本匹配样本)两个总体均值之差的估计(匹配大样本)1.假定条件2.两个匹配的大样本(n1 30和n2 30)3.两个总体各视察值的配对差听从正态分布4.两个总体均值之差d=1-2在1-置信水平下的置信区间为对应差值的均值对应差值的均值对应差值的均值对应
36、差值的均值对应差值的标准差对应差值的标准差对应差值的标准差对应差值的标准差两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样本)1.假定条件2.两个匹配的大样本(n1 30和n2 30)3.两个总体各视察值的配对差听从正态分布 4.两个总体均值之差d=1-2在1-置信水平下的置信区间为两个总体均值之差的估计(例题分析)【例例例例】由由由由 1010名名名名学学学学生生生生组组组组成成成成一一一一个个个个随随随随机机机机样样样样本本本本,让让让让他他他他们们们们分分分分别别别别接接接接受受受受A A和和和和B B两两两两套套套套试试试试卷卷卷卷进进进进行行行行测测测测试试试试,结结
37、结结果果果果如如如如下下下下表表表表 。试试试试建建建建立立立立两两两两种种种种试试试试卷卷卷卷 分分分分 数数数数 之之之之 差差差差d=d=1-1-2 2 95%95%的置信区间的置信区间的置信区间的置信区间 10名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试试卷卷B差差值值d17871726344193726111489845691741754951-27685513876601698577810553916两个总体均值之差的估计(例题分析)解解解解:依据样本数据计算得依据样本数据计算得依据样本数据计算得依据样本数据计算得两种试卷所产生的分数之差的置信区间为两种试
38、卷所产生的分数之差的置信区间为6.336.33分分15.6715.67分分两个总体比例之差区间的估计两个总体比例之差区间的估计1.假定条件两个总体听从二项分布可以用正态分布来近似两个样本是独立的2.两个总体比例之差1-2在1-置信水平下的置信区间为两个总体比例之差的区间估计两个总体比例之差的区间估计两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)【例例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以90%的置信水平估计城市与农村收视率差别的置信区间 1 12 2两个总体比例之差的估计两个总体
39、比例之差的估计 (例题分析例题分析)解解解解:已知已知 n n1 1=500=500,n n2 2=400=400,p p1 1=45%=45%,p p2 2=32%=32%,1-1-=95%=95%,z z/2/2=1.96=1.96 1 1-2 2置信度为置信度为95%95%的置信区间为的置信区间为城城 市市 与与 农农 村村 收收 视视 率率 差差 值值 的的 置置 信信 区区 间间 为为6.68%19.32%6.68%19.32%两个总体方差比的区间估计两个总体方差比的区间估计两个总体方差比的区间估计1.比较两个总体的方差比用两个样本的方差比来推断假如S12/S22接近于1,说明两个总
40、体方差很接近假如S12/S22远离1,说明两个总体方差之间存在差异总体方差比在1-置信水平下的置信区间为两个总体方差比的区间估计(图示)F FF F1-1-1-1-F F 总体方差比总体方差比总体方差比1-1-1-的置信区间的置信区间的置信区间方差比置信区间示意图方差比置信区间示意图方差比置信区间示意图方差比置信区间示意图两个总体方差比的区间估计(例题分析)【例例】为为了了探探讨讨男男女女学学生生在在生生活活费费支支出出(元元)上上的的差差异异,在在某某高高校校各各随随机机抽抽取取25名名男男学学生生和和25名名女女学生,得到下面的结果:学生,得到下面的结果:男学生:男学生:女学生:女学生:试
41、试以以90%置置信信水水平平估估计计男男女女学学生生生生活活费费支支出出方方差比的置信区间差比的置信区间 两个总体方差比的区间估计(例题分析)解解解解:依依依依据据据据自自自自由由由由度度度度 n1=25-1=24 n1=25-1=24,n2=25-1=24n2=25-1=24,查查查查得得得得 F F/2(24,24)=1.98/2(24,24)=1.98,F1-F1-/2(24,24)=1/1.98=0.505/2(24,24)=1/1.98=0.505 12/12/2222置信度为置信度为置信度为置信度为90%90%的置信区间为的置信区间为的置信区间为的置信区间为男男 女女 学学 生生
42、生生 活活 费费 支支 出出 方方 差差 比比 的的 置置 信信 区区 间间 为为0.471.840.471.84 5.4 样本容量的确定5.4.1 估计总体均值时样本容量的确定估计总体均值时样本容量的确定5.4.2 估计总体比例时样本容量的确定估计总体比例时样本容量的确定5.4.3 估计两个总体均值之差时样本容量的确定估计两个总体均值之差时样本容量的确定5.4.4 估计两个总体比例之差时样本容量的确定估计两个总体比例之差时样本容量的确定估计总体均值时样本容量的确定估计总体均值时样本容量的确定1.估计总体均值时样本容量n为2.样本容量n与总体方差 2、边际误差E、牢靠性系数Z或t之间的关系为3
43、.与总体方差成正比4.与边际误差成反比5.与牢靠性系数成正比估计总体均值时样本容量的确定 其中:其中:估计总体均值时样本容量的确定(例题分析)【例例】拥拥有有工工商商管管理理学学士士学学位位的的高高校校毕毕业业生生年年薪薪的的标标准准差差大大约约为为2000元元,假假定定想想要要估估计计年年薪薪95%的的置置信信区区间间,希希望望边边际际误误差差为为400元,应抽取多大的样本容量?元,应抽取多大的样本容量?估计总体均值时样本容量的确定 (例题分析)解解解解:已知已知 =500=500,E E=400,=400,1-1-=95%=95%,z z/2/2=1.96=1.96 1 12 2/2 22
44、 2置信度为置信度为90%90%的置信区间为的置信区间为即应抽取即应抽取9797人作为样本人作为样本 估计总体比例时样本容量的确定1.依据比例区间估计公式可得样本容量n为估计总体比例时样本容量的确定 2.E的取值一般小于0.13.未知时,可取最大值0.5其中:其中:其中:其中:其中:其中:估计总体比例时样本容量的确定估计总体比例时样本容量的确定 (例题分析例题分析)【例例例例】依依依依据据据据以以以以往往往往的的的的生生生生产产产产统统统统计计计计,某某某某种种种种产产产产品品品品的的的的合合合合格格格格率率率率约约约约为为为为90%90%,现现现现要要要要求求求求 边边边边 际际际际 误误误
45、误 差差差差 为为为为5%5%,在在在在 求求求求 95%95%的的的的置置置置信信信信区区区区间间间间时时时时,应应应应抽抽抽抽取取取取多多多多少少少少个个个个产产产产品作为样本?品作为样本?品作为样本?品作为样本?解解解解:已已 知知=90%=90%,=0.05=0.05,z z/2/2=1.96=1.96,E E=5%=5%应抽取的样本容量应抽取的样本容量为为 应抽取应抽取139139个产品作为样本个产品作为样本估计两个总体均值之差时样本容量的确定1.设n1和n2为来自两个总体的样本,并假定n1=n22.依据均值之差的区间估计公式可得两个样本的容量n为估计两个总体均值之差时样本容量的确定
46、 其中:其中:其中:估计两个总体均值之差时样本容量的确定估计两个总体均值之差时样本容量的确定 (例题分析例题分析)【例例】一一所所中中学学的的教教务务处处想想要要估估计计试试验验班班和和一一般般班班考考试试成成果果平平均均分分数数差差值值的的置置信信区区间间。要要求求置置信信水水平平为为95%,预预先先估估计计两两个个班班考考试试分分数数的的方方差差分分别别为为:试试验验班班 12=90,一一般般班班 22=120。假假如如要要求求估估计计的的误误差差范范围围(边边际际误误差差)不不超超过过5分分,在在两个班应分别抽取多少名学生进行调查?两个班应分别抽取多少名学生进行调查?估计两个总体均值之差
47、时样本容量的确定估计两个总体均值之差时样本容量的确定 (例题分析例题分析)解解解解:已已知知 1 12 2=90=90,2 22 2=120=120,E E=5,=5,1-1-=95%=95%,z z/2/2=1.96=1.96即应抽取即应抽取1717人作为样本人作为样本 估计两个总体比例之差时样本容量的确定1.设n1和n2为来自两个总体的样本,并假定n1=n22.依据比例之差的区间估计公式可得两个样本的容量n为估计两个总体比例之差时样本容量的确定 其中:其中:其中:估计两个总体比例之差时样本容量的确定估计两个总体比例之差时样本容量的确定 (例题分析例题分析)【例例例例】一一家家瓶瓶装装饮饮料
48、料制制造造商商想想要要估估计计顾顾客客对对一一种种新新型型饮饮料料认认知知的的广广告告效效果果。他他在在广广告告前前和和广广告告后后分分别别从从市市场场营营销销区区各各抽抽选选一一个个消消费费者者随随机机样样本本,并并询询问问这这些些消消费费者者是是否否听听说说过过这这种种新新型型饮饮料料。这这位位制制造造商商想想以以10%10%的的误误差差范范围围和和95%95%的的置置信信水水平平估估计计广广告告前前后后知知道道该该新新型型饮饮料料消消费费者者的的比比例例之之差差,他他抽抽取取的的两两个个样样本本分分别别应应包包括括多多少少人人?(假假定定两两个个样样本本容容量量相等相等)绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品估计两个总体比例之差时样本容量的确定估计两个总体比例之差时样本容量的确定 (例题分析例题分析)解解:E=10%,1-=95%,z/2=1.96,由于没有的信息,用0.5代替即应抽取193位消费者作为样本 本章小结1.参数估计的一般问题参数估计的一般问题2.一个总体参数的区间估计一个总体参数的区间估计3.两个总体参数的区间估计两个总体参数的区间估计4.样本容量的确定样本容量的确定