《统计学第4章参数估计幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学第4章参数估计幻灯片.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第4章参数估计第1页,共42页,编辑于2022年,星期二4.1.1 4.1.1 估计量与估计值估计量与估计值1.1.估估计计量量:在在参参数数估估计计中中,用用于于估估计计总总体体参参数数的的统统计计量量的名称的名称.n例如例如:样本均值就是总体均值的一个估计量样本均值就是总体均值的一个估计量 参数用参数用 表示,估计量表示,估计量用用 表示表示2.2.估计值估计值:估计参数时算出来的统计量的具体值:估计参数时算出来的统计量的具体值n如果样本均值如果样本均值 x x=80=80,则,则8080就是就是的估计值的估计值第2页,共42页,编辑于2022年,星期二4.1.2 参数估计的方法参数
2、估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计第3页,共42页,编辑于2022年,星期二一个总体参数的估计一个总体参数的估计总体参数总体参数符号表示符号表示样本统计量样本统计量均均值值比例比例方差方差第4页,共42页,编辑于2022年,星期二1.点估计点估计用用样样本本的的估估计计量量 的的值值直直接接作作为为总总体体参参数数 的估计值的估计值例例如如:用用样样本本均均值值 直直接接作作为为总总体体均均值值 的估计值的估计值.没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息第5页,共42页,编辑于2022年,星期二2.2.区间估计区间估计在在点点估估计
3、计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个区区间间范范围围,该该区区间间由由样样本本统统计计量量加加减减抽抽样样误差而得到的误差而得到的.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量与总体参数的接近程度给出一个概率度量量与总体参数的接近程度给出一个概率度量.如某班级平均分数在如某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95%第6页,共42页,编辑于2022年,星期二4.1.3.评价估计量的标准评价估计量的标准第7页,共42页,编辑于2022年,星期二1.1.无偏性:无偏性:设总体的参数为设总体的参数为,其,其估
4、计量为估计量为 ,如如果果 ,即即估估计计量量 的的数数学学期期望等于被估计的总体参数,我们称估计量望等于被估计的总体参数,我们称估计量 是参数是参数的无偏估计量。的无偏估计量。例如;总体例如;总体X X:(:(3 4 53 4 5)(3333)3 3 (3434)3.5 3.5 (3535)4 4(4343)3.5 (443.5 (44)4 4 (4545)4.54.5(5353)4 4 (5454)4.5 4.5 (5555)5 5第8页,共42页,编辑于2022年,星期二o无偏性无偏性:估计量抽样分布的数学期望等于被:估计量抽样分布的数学期望等于被 估计的总体参数估计的总体参数.P P(
5、)B BA A偏偏偏偏偏偏偏偏偏偏偏偏第9页,共42页,编辑于2022年,星期二 样本平均数是总体平均数样本平均数是总体平均数的无偏估计的无偏估计量。量。以无偏性来评判估计量是很合理的。一个好以无偏性来评判估计量是很合理的。一个好的估计量就某一个具体的估计值而言,可能不的估计量就某一个具体的估计值而言,可能不等于总体参数值,但平均来看有向估计的总体等于总体参数值,但平均来看有向估计的总体参数集中的趋势。参数集中的趋势。NEXT第10页,共42页,编辑于2022年,星期二2.有效性有效性:对同一总体参数的两个无偏点估计量对同一总体参数的两个无偏点估计量 ,有更小标准差的估计量更有效,有更小标准差
6、的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()均值均值均值均值中位数中位数中位数中位数第11页,共42页,编辑于2022年,星期二3.一一致致性性:随随着着样样本本容容量量的的增增大大,估估计计量量的的值值越来越接近被估计的总体参数越来越接近被估计的总体参数AB较较较较 的样本容量的样本容量的样本容量的样本容量较较较较 的样本容量的样本容量的样本容量的样本容量P P()第12页,共42页,编辑于2022年,星期二一致性:一致性:随随着着样样本本容容量量增增大大,估估估估计计计计量量量量会会会会越越越越来来来来越越越越接接接接近
7、近近近被被被被估估估估计计计计的的的的参数。参数。参数。参数。即对任意的即对任意的 ,有,有则称则称 是参数是参数的一致估计量。的一致估计量。一一致致估估计计量量是是大大样样本本所所呈呈现现的的性性质质。若若某某个个估估计计量量是是待待估估参参数数的的一一致致估估计计量量,意意味味着着样样本本容容量量很很大大时时,估计量和待估参数接近的可能性几乎等于估计量和待估参数接近的可能性几乎等于100%100%100%100%。NEXT第13页,共42页,编辑于2022年,星期二4.2 4.2 总体均值的区间估计总体均值的区间估计一一.区间估计的基本原理区间估计的基本原理二二.正态总体或大样本的估计正态
8、总体或大样本的估计三三.正态总体小样本的估计正态总体小样本的估计第14页,共42页,编辑于2022年,星期二4.2.1 4.2.1 区间估计的基本原理区间估计的基本原理第15页,共42页,编辑于2022年,星期二区间估计的图示区间估计的图示 P124 X95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.582.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第16页,共42页,编辑于2022年,星期二区间估计的图示区间
9、估计的图示X100110-21201308070-390-1 0123原始数值标准差34.13%34.13%第17页,共42页,编辑于2022年,星期二1.1.将构造置信区间的步骤重复很多次,置信将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例区间包含总体参数真值的次数所占的比例称为置信水平称为置信水平.2.2.表示为表示为 1-a3.3.a 是总体参数是总体参数未在未在区间内的比例区间内的比例 常用的置信水平值有常用的置信水平值有 99%,95%,90%99%,95%,90%n相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置信水平 第1
10、8页,共42页,编辑于2022年,星期二1.1.由样本统计量所构造的总体参数的估计区由样本统计量所构造的总体参数的估计区间称为置信区间间称为置信区间2.2.统计学家在某种程度上确信这个区间会包统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信含真正的总体参数,所以给它取名为置信区间区间 置信区间置信区间 (confidence interval)(confidence interval)样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限第19页,共42页,编
11、辑于2022年,星期二置信区间与置信水平置信区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-a1-a )%)%区间包含了区间包含了区间包含了区间包含了 a a%的区间未包含的区间未包含1-1-/2 2 /2 21.1.用一个具体的样本所用一个具体的样本所用一个具体的样本所用一个具体的样本所构造的区间是一个特构造的区间是一个特构造的区间是一个特构造的区间是一个特定的区间,我们无法定的区间,我们无法定的区间,我们无法定的区间,我们无法知道这个样本所产生知道这个样本所产生知道这个样本所产生知道这个样本所产生的区间是否包含总体的区间是否包含总体的区间是否包含总体的区间是否
12、包含总体参数的真值参数的真值参数的真值参数的真值2.2.我们只能是希望这个我们只能是希望这个我们只能是希望这个我们只能是希望这个区间是大量包含总体区间是大量包含总体区间是大量包含总体区间是大量包含总体参数真值的区间中的参数真值的区间中的参数真值的区间中的参数真值的区间中的一个,但它也可能是一个,但它也可能是一个,但它也可能是一个,但它也可能是少数几个不包含参数少数几个不包含参数少数几个不包含参数少数几个不包含参数真值的区间中的一个真值的区间中的一个真值的区间中的一个真值的区间中的一个第20页,共42页,编辑于2022年,星期二4.2.2 正态总体或大样本的正态总体或大样本的总体均值的区总体均值
13、的区间估计间估计1.1.假定条件假定条件n总体服从正态分布总体服从正态分布,方差方差()已知已知n如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 (n n 30)30)2.2.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为重复抽样不重复抽样第21页,共42页,编辑于2022年,星期二总体均值的区间总体均值的区间【例例例例】某某某某种种种种零零零零件件件件的的的的长长长长度度度度服服服服从从从从正正正正态态态态分分分分布布布布,从从从从某某某某天天天天生生生生产产产产一一一一批批批批零零零零件件件件中中中中按按按按重重重重复复复复抽抽抽抽样样
14、样样方方方方法法法法随随随随机机机机抽抽抽抽取取取取9 9 9 9个个个个,测测测测得得得得其其其其平平平平均均均均长长长长度度度度为为为为21.4cm21.4cm21.4cm21.4cm。已已已已知知知知总总总总体体体体标标标标准准准准差差差差为为为为 =0.15cm=0.15cm=0.15cm=0.15cm。试试试试估估估估计计计计该该该该批批批批零零零零件件件件平平平平均均均均长长长长度度度度的的的的置置置置信信信信区区区区间间间间,置置置置信信信信水水水水平平平平为为为为95%95%95%95%。解解解解:已已已已知知知知 N N(,0.150.152 2),n n=9,=9,1-1-
15、=95%95%,z z /2/2=1.96=1.96 总总总总体体体体均均均均值值值值 在在在在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为该批零件平均长度的置信区间在该批零件平均长度的置信区间在该批零件平均长度的置信区间在该批零件平均长度的置信区间在21.302cm21.498cm21.302cm21.498cm之间之间之间之间 第22页,共42页,编辑于2022年,星期二总体均值的区间估计【例例】在在在在某某某某天天天天生生生生产产产产的的的的500500500500袋袋袋袋食食食食品品品品中中中中,按按按按不不不不重重重重复复复复抽抽抽
16、抽样样样样方方方方法法法法随随随随机机机机抽抽抽抽取取取取25252525袋袋袋袋进进进进行行行行检检检检查查查查,测测测测得得得得平平平平均均均均每每每每袋袋袋袋的的的的重重重重量量量量为为为为996g996g996g996g。已已已已知知知知该该该该种种种种袋袋袋袋装装装装食食食食品品品品的的的的重重重重量量量量服服服服从从从从正正正正态态态态分分分分布布布布,且且且且标标标标准准准准差差差差为为为为20g20g20g20g。试试试试估估估估计计计计该该该该种种种种食食食食品品品品平平平平均均均均重重重重量量量量的置信区间,置信水平为的置信区间,置信水平为的置信区间,置信水平为的置信区间,
17、置信水平为95%95%95%95%。解解解解:已知已知 N N(,20202 2),n n=25,1-=25,1-=95%=95%,z z/2/2=1.96=1.96 总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该种食品平均重量的置信区间为该种食品平均重量的置信区间为该种食品平均重量的置信区间为该种食品平均重量的置信区间为988.35988.35g g g g1003.651003.65g g g g之间之间之间之间第23页,共42页,编辑于2022年,星期二4.2.3 4.2.3 正态总体小样本正态总体小样本总体均总体均 值的值的区间估计区间估计1.假定条件假定
18、条件n总体服从正态分布总体服从正态分布,且方差且方差()未知未知n小样本小样本 (n n 30)30)2.2.使用使用 t t 分布统计量分布统计量3.3.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为第24页,共42页,编辑于2022年,星期二t t 分布分布 分分分分布布布布是是是是类类类类似似似似正正正正态态态态分分分分布布布布的的的的一一一一种种种种对对对对称称称称分分分分布布布布,它它它它通通通通常常常常要要要要比比比比正正正正态态态态分分分分布布布布平平平平坦坦坦坦和和和和分分分分散散散散。一一一一个个个个特特特特定定定定的的的的分分分分布布布布依依依依
19、赖赖赖赖于于于于称称称称之之之之为为为为自自自自由由由由度度度度的参数。随着自由度的增大,分布也逐渐趋于正态分布的参数。随着自由度的增大,分布也逐渐趋于正态分布的参数。随着自由度的增大,分布也逐渐趋于正态分布的参数。随着自由度的增大,分布也逐渐趋于正态分布 X X Xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)Z Z第25页,共42页,编辑于2022年,星期二【例例例例】已已已已知知知知某某某某种种种种灯灯灯灯泡泡泡泡的
20、的的的寿寿寿寿命命命命服服服服从从从从正正正正态态态态分分分分布布布布,现现现现从从从从一一一一批批批批灯灯灯灯泡泡泡泡中中中中随随随随机机机机抽抽抽抽取取取取16161616只只只只,测测测测得得得得其其其其使使使使用用用用寿寿寿寿命命命命(小小小小时时时时)如如如如下下下下。建建建建立立立立该该该该批批批批灯泡平均使用寿命灯泡平均使用寿命灯泡平均使用寿命灯泡平均使用寿命95%95%的置信区间的置信区间的置信区间的置信区间16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470第
21、26页,共42页,编辑于2022年,星期二解解解解:已已已已知知知知 N N(,2 2),n n=16,=16,1-1-=95%95%,t t /2/2=2.131=2.131。根根根根据样本数据计算得:据样本数据计算得:据样本数据计算得:据样本数据计算得:,总体均值总体均值总体均值总体均值 在在在在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为该该该该种种种种灯灯灯灯泡泡泡泡平平平平均均均均使使使使用用用用寿寿寿寿命命命命的的的的置置置置信信信信区区区区间间间间为为为为1476.81476.8小小小小时时时时1503.21503.2小时小时小
22、时小时第27页,共42页,编辑于2022年,星期二4.3.4.3.总体比例的区间估计总体比例的区间估计一一.大样本重复抽样时的估计方法大样本重复抽样时的估计方法二二.大样本不重复抽样时的估计方法大样本不重复抽样时的估计方法第28页,共42页,编辑于2022年,星期二4.3.1 4.3.1 总体比例的区间估计总体比例的区间估计(重复抽样重复抽样)o1.假定条件假定条件n总体服从二项分布总体服从二项分布n可以由正态分布来近似可以由正态分布来近似2.使用正态分布统计量使用正态分布统计量3.3.3.3.总体比例总体比例总体比例总体比例 在在在在1-1-1-1-置信水平下置信水平下置信水平下置信水平下的
23、置信区间为的置信区间为的置信区间为的置信区间为第29页,共42页,编辑于2022年,星期二4.3.2 总体比例的区间估计总体比例的区间估计(不重复抽样不重复抽样)o1.1.假定条件假定条件n总体服从二项分布总体服从二项分布n可以由正态分布来近似可以由正态分布来近似2.2.使用正态分布统计量使用正态分布统计量3.3.3.总体比例总体比例总体比例总体比例总体比例总体比例 在在在在在在1-1-1-1-1-1-置信水平下置信水平下置信水平下置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为第30页,共42页,编辑于2022年,星期二总体比例的区间估计
24、总体比例的区间估计【例例】某某某某城城城城市市市市想想想想要要要要估估估估计计计计下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性所所所所占占占占的的的的比比比比例例例例,随随随随机机机机抽抽抽抽取取取取了了了了100100100100个个个个下下下下岗岗岗岗职职职职工工工工,其其其其中中中中65656565人人人人为为为为女女女女性性性性职职职职工工工工。试试试试以以以以95%95%95%95%的的的的置置置置信信信信水水水水平平平平估估估估计计计计该该该该城城城城市市市市下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性比比比比例例例例的置信区间的置信区间的置信区间的置信区间
25、解:解:解:解:已知已知已知已知 n n n n=100=100=100=100,p p p p65%65%65%65%,z z z z /2/2/2/2=1.96=1.96=1.96=1.96该该该该城城城城市市市市下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性比比比比例例例例的的的的置置置置信信信信区区区区间为间为间为间为55.65%74.35%55.65%74.35%55.65%74.35%55.65%74.35%第31页,共42页,编辑于2022年,星期二总体比例的区间估计总体比例的区间估计【例例】某某某某企企企企业业业业共共共共有有有有职职职职工工工工10001000100
26、01000人人人人。企企企企业业业业准准准准备备备备实实实实行行行行一一一一项项项项改改改改革革革革,在在在在职职职职工工工工中中中中征征征征求求求求意意意意见见见见,采采采采取取取取不不不不重重重重复复复复抽抽抽抽样样样样方方方方法法法法随随随随机机机机抽抽抽抽取取取取200200200200人人人人作作作作为为为为样样样样本本本本,调调调调查查查查结结结结果果果果显显显显示示示示,有有有有150150150150人人人人表表表表示示示示赞赞赞赞成成成成该该该该项项项项改改改改革革革革,50505050人人人人表表表表示示示示反反反反对对对对。试试试试以以以以95%95%95%95%的的的的
27、概概概概率率率率确确确确定定定定赞赞赞赞成成成成改改改改革革革革的的的的人人人人数数数数比例的置信区间比例的置信区间比例的置信区间比例的置信区间解:解:解:解:已知已知 n n=100=100,p p75%75%,z z/2/2=1.96=1.96该该企企业业职职工工中中赞赞成成改改革革的的人人数数比比例例的的置信区间为置信区间为69.63%80.37%69.63%80.37%之间之间 第32页,共42页,编辑于2022年,星期二4.4.4.4.样本容量的确定样本容量的确定一一.估计总体均值时样本容量的确定估计总体均值时样本容量的确定二二.估计总体比例时样本容量的确定估计总体比例时样本容量的确
28、定第33页,共42页,编辑于2022年,星期二4.4.1 估计总体均值时样本容量的确定估计总体均值时样本容量的确定第34页,共42页,编辑于2022年,星期二1.1.估计总体均值时样本容量估计总体均值时样本容量n n为为重复抽样重复抽样 不重复抽样不重复抽样2.2.样本容量样本容量n n与总体方差成正比,与边际误差成反比,与可靠与总体方差成正比,与边际误差成反比,与可靠性系数成正比性系数成正比估计总体均值时样本容量的确定估计总体均值时样本容量的确定 其中:其中:其中:其中:其中:其中:第35页,共42页,编辑于2022年,星期二估计总体均值时样本容量的确定估计总体均值时样本容量的确定【例例】拥
29、拥有有工工商商管管理理学学士士学学位位的的大大学学毕毕业业生生年年薪薪的的标标准准差差大大约约为为20002000元元,假假定定想想要要估估计计年年薪薪95%95%的的置置信信区区间间,希希望望边边际际误误差差为为400400元元,应应抽抽取取多大的样本容量?多大的样本容量?第36页,共42页,编辑于2022年,星期二估计总体均值时样本容量的确定估计总体均值时样本容量的确定 解解解解:已知已知已知已知 =2000=2000=2000=2000,E E=400,1-=400,1-=95%=95%,z z z z/2/2=1.96=1.96=1.96=1.96 1 1 1 12 2 2 2/2 2
30、 2 22 2 2 2置信度为置信度为置信度为置信度为90%90%90%90%的置信区间为的置信区间为的置信区间为的置信区间为即应抽取即应抽取即应抽取即应抽取97979797人作为样本人作为样本人作为样本人作为样本 第37页,共42页,编辑于2022年,星期二1.1.根据比例区间估计公式可得样本容量根据比例区间估计公式可得样本容量n n为为1.重复抽样重复抽样2.不重复抽样不重复抽样4.4.2 估计总体比例时样本容量的确定估计总体比例时样本容量的确定 2.E的取值一般小于0.13.未知时,可取最大值0.5其中:其中:其中:第38页,共42页,编辑于2022年,星期二估计总体比例时样本容量的确定
31、估计总体比例时样本容量的确定【例例】根根据据以以往往的的生生产产统统计计,某某种种产产品品的的合合格格率率约约为为90%90%,现现要要求求边边际际误误差差为为5%,在求95%95%的的置置信信区区间间时时,应应抽抽取取多多少少个个产品作为样本?产品作为样本?解解:已已已已 知知知知=90%=90%,1-1-=95%=95%,Z Z /2/2=1.96=1.96,E E=5%=5%应抽取的样本容量应抽取的样本容量应抽取的样本容量应抽取的样本容量为为为为 应抽取应抽取应抽取应抽取139139139139个产品作为样本个产品作为样本个产品作为样本个产品作为样本第39页,共42页,编辑于2022年,
32、星期二习题:4、据某市场调查公司对某市据某市场调查公司对某市8080名随机受访的购房名随机受访的购房者的调查,得到该市购房者中本地人的购房比者的调查,得到该市购房者中本地人的购房比例的区间估计,在置信水平例的区间估计,在置信水平=0.10=0.10下,其边际下,其边际误差误差E=0.08E=0.08。则:。则:(1 1)这)这8080名受访者样本中为本地购房者的比例名受访者样本中为本地购房者的比例p p是是多少?多少?(2 2)若置信水平)若置信水平=0.05=0.05,则要保持同样的精度进,则要保持同样的精度进行区间估计,需要调查多少名购房者?行区间估计,需要调查多少名购房者?解:解:第40
33、页,共42页,编辑于2022年,星期二一、填空题o1.某班学生的打字速度的95%的置信区间为44110字/分钟,从某班随机抽取10名学生测试其打字速度,则由10名学生组成的样本平均打字速度的期望是_,标准差是_。能否认为该样本的平均打字速度的抽样分布为正态分布_,理由是_。第41页,共42页,编辑于2022年,星期二2.若从一总体中抽取一样本,样本容量为n,其95%的置信区间为(a,b),则其样本均值为_,若总体方差已知,则该总体方差为_。若总体方差未知,且样本量为15,则其样本均值为_,样本方差为_。若总体方差未知,且样本量为30,则其样本均值为_,样本方差为_。若增加样本容量置信区间会变第42页,共42页,编辑于2022年,星期二