《抽样估计的基本方法PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《抽样估计的基本方法PPT讲稿.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样估计的基本方法第1页,共29页,编辑于2022年,星期日简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一第2页,共29页,编辑于2022年,星期日(一一)矩估计法矩估计法矩估计法是英国统计学家矩估计法是英国统计学家KPearson提出的。其提出的。其基本思想是:由于样本来源于总体,样本矩在一基本思想是:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,定程度上反映了总体矩,而且由大数定律可知
2、,样本矩依概率收敛于总体矩。样本矩依概率收敛于总体矩。(二二)极大似然估计法极大似然估计法 极大似然估计法是由极大似然估计法是由fisher提出的一种参数估计提出的一种参数估计方法。其基本思想是:设总体分布的函数形式已知,方法。其基本思想是:设总体分布的函数形式已知,但有未知参数可以取很多值,在未知参数一切可能但有未知参数可以取很多值,在未知参数一切可能取值中选一个使样本观察值出现的概率为最大的值取值中选一个使样本观察值出现的概率为最大的值作为未知参数的估计值,记作,并称为未知参数的作为未知参数的估计值,记作,并称为未知参数的极大似然估计值。这种求估计量的方法称为极大似极大似然估计值。这种求估
3、计量的方法称为极大似然估计法。然估计法。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一第3页,共29页,编辑于2022年,星期日(三三)估计量优劣的标准估计量优劣的标准 评价估计量的优劣常用下列三个标准。评价估计量的优劣常用下列三个标准。1无偏性无偏性 2有效性有效性 3一致性一致性 点点估估计计的的优优点点是是简简单单、具具体体明明确确。但但由由于于样样本本的的随随机机性性,从从一一个个样样本本得得到到的的估估计计值值往往往往不不会会恰恰好好等等于于实实际际值值,总总有有一一定定的的抽抽样样误误差差。而而点点估估计计本本身身无无法法说说明明抽抽样样误误差差的的大大小小,也也无无
4、法法说说明明估估计计结结果有多大的把握程度。果有多大的把握程度。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一第4页,共29页,编辑于2022年,星期日(四)影响抽样误差的因素四)影响抽样误差的因素1、总体各单位的差异程度(即标准差的大、总体各单位的差异程度(即标准差的大小):小):越大,抽样误差越大;越大,抽样误差越大;2、样本单位数的多少:、样本单位数的多少:越大,抽样误越大,抽样误差越小;差越小;3、抽样方法:、抽样方法:不重复抽样的抽样误差比不重复抽样的抽样误差比重复抽样的抽样误差小;重复抽样的抽样误差小;4、抽样组织方式:、抽样组织方式:简单随机抽样的误差最简单随机抽样
5、的误差最大。大。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一第5页,共29页,编辑于2022年,星期日前面曾指出,为了考察抽样数据与实际数据的差异性,我们计算实际抽样误差,前面曾指出,为了考察抽样数据与实际数据的差异性,我们计算实际抽样误差,只能用抽样平均误差来反映。只能用抽样平均误差来反映。而抽样平均而抽样平均这实际上是做这实际上是做误差的计算,通常要计算总体平均数和所有的样本平均数,误差的计算,通常要计算总体平均数和所有的样本平均数,但实际抽样误差通常是无法计算的,但实际抽样误差通常是无法计算的,不到的。不到的。我们是通过收集一个样本资料方式,来衡量抽样数据与实际数据我们是
6、通过收集一个样本资料方式,来衡量抽样数据与实际数据的差异性的,的差异性的,这必然会出现误差。这必然会出现误差。但对于某一项调查来说,根据客观要求,一般应有一个但对于某一项调查来说,根据客观要求,一般应有一个允许的误差限,也就是说若抽样误差在这个限度之内,允许的误差限,也就是说若抽样误差在这个限度之内,就认为是可允许的,这一允许的误差限度就称为极限误就认为是可允许的,这一允许的误差限度就称为极限误差。差。(五五)抽样极限误差的概念抽样极限误差的概念 面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一第6页,共29页,编辑于2022年,星期日二、区间估计二、区间估计 区间估计就是根据样本
7、估计量以一定可靠程度推区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。这种估计方法不仅以断总体参数所在的区间范围。这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果的把握程以它能给出估计精度,也能说明估计结果的把握程度。设总体参数为度。设总体参数为 、为由样本确定的两个为由样本确定的两个统计量,对于给定的统计量,对于给定的 ,有,有 ,则称则称(,)为参数的置信度为为参数的置信度为1-a的置信区间。的置信区间。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第7页,共29
8、页,编辑于2022年,星期日步骤步骤 计算样本平均数计算样本平均数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;或计;或计算样本方差算样本方差 ,即,即区间估计算步骤区间估计算步骤面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第8页,共29页,编辑于2022年,星期日步步骤骤 计算抽样平均误差:计算抽样平均误差:重复抽样时:重复抽样时:不重复抽样时:不重复抽样时:区间估计算步骤区间估计算步骤面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第9页,共29页,编辑于2022年,星期日步步骤骤 计算抽样极限误差:计算抽样极限误差:确定总体平均数的置信区间:确定总体平均
9、数的置信区间:区间估计算步骤区间估计算步骤面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第10页,共29页,编辑于2022年,星期日(一一)总体均值的区间估计总体均值的区间估计1总体方差已知时,正态总体均值的区间估计总体方差已知时,正态总体均值的区间估计根据样本平均数的抽样分布定理,若给定根据样本平均数的抽样分布定理,若给定1-a,可由,可由标准正态分布表查得临界值标准正态分布表查得临界值 ,即即 上式就是置信度为上式就是置信度为1-a时总体均值的置信区间。时总体均值的置信区间。同时,抽样极限误差可按如下公式来确定:同时,抽样极限误差可按如下公式来确定:面向21世纪课程教材第四章
10、第四章 抽样与抽样估计 第二节 二第11页,共29页,编辑于2022年,星期日(大样本条件下)(大样本条件下)样本平均数的样本平均数的极限误差:极限误差:样本成数的极样本成数的极限误差:限误差:Z Z为概率度,是给定概率保证程度下样本均值为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。偏离总体均值的抽样平均误差的倍数。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第12页,共29页,编辑于2022年,星期日Z与相应的概率保证程度存在一一对应关系,与相应的概率保证程度存在一一对应关系,常常用用Z值及相应的概率保证程度为:值及相应的概率保证程度为:z值值 概率
11、保证程度概率保证程度1.00 0.6827 1.65 0.9000 1.96 0.9500 2.00 0.9545 2.58 0.9900 3.00 0.9973面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第13页,共29页,编辑于2022年,星期日例:某企业生产某种产品的工人有例:某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机人,某日采用不重复抽样从中随机抽取抽取100人调查他们的当日产量,样本人均产量为人调查他们的当日产量,样本人均产量为35件,产量的样本标准差件,产量的样本标准差为为4.5件,试以件,试以0.9545的置信度估计平均产量的抽样极限误差。的
12、置信度估计平均产量的抽样极限误差。由题意知,样本标准差由题意知,样本标准差s解:解:=1000,样本单位数样本单位数n总体单位数总体单位数N=4.5(件),(件),=100属于大样本,并且采用不重复抽样,属于大样本,并且采用不重复抽样,抽样平均误差抽样平均误差。但抽样平均误差和概率度均未知,因此,我们先求。但抽样平均误差和概率度均未知,因此,我们先求因此,因此,平均产量的抽样极限误差平均产量的抽样极限误差然后,再求概率度然后,再求概率度。题中给出题中给出置信度为置信度为0.9545,因此,因此,=0.0455,=0.02275,通过查表并计算,得概率度通过查表并计算,得概率度因此,我们求得因此
13、,我们求得平均产量的抽样极限误差为:平均产量的抽样极限误差为:解释就是根据就是根据,然后查附表。,然后查附表。概率度概率度求法。求法。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第14页,共29页,编辑于2022年,星期日面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二例:某企业从长期实践中得知,其产品直径例:某企业从长期实践中得知,其产品直径X是一个随机变量,服从标是一个随机变量,服从标准差为准差为0.05的正态分布。从某日产品中随机抽取的正态分布。从某日产品中随机抽取6个,测得其直径分别个,测得其直径分别为为14.8、15.3、15.1、14.7、15.1、15
14、(单位:厘米)。在(单位:厘米)。在0.95的置信度的置信度下,求该产品直径的均值置信区间。下,求该产品直径的均值置信区间。查表得查表得样本均值样本均值抽样平均误差抽样平均误差抽样极限误差抽样极限误差所求的置信区间所求的置信区间第15页,共29页,编辑于2022年,星期日【例】【例】某企业生产某种产品的工人有某企业生产某种产品的工人有10001000人,某日采用不重复抽样从中随人,某日采用不重复抽样从中随机抽取机抽取100100人调查他们的当日产量,人调查他们的当日产量,要求在要求在9595的概率保证程度下,的概率保证程度下,估计估计该厂全部工人的日平均产量和日总产该厂全部工人的日平均产量和日
15、总产量量。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第16页,共29页,编辑于2022年,星期日按按 日产量分组日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计合计100126004144100100名工人的日产量分组资料名工人的日产量分组资料面向21世纪课程教材第四章第四章 抽样与抽样
16、估计 第二节 二第17页,共29页,编辑于2022年,星期日解:解:面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第18页,共29页,编辑于2022年,星期日则该企业工人人均产量则该企业工人人均产量 及日总产及日总产量量 的置信区间为:的置信区间为:即该企业工人人均产量在即该企业工人人均产量在124.797124.797至至127.203127.203件件之间,其日总产量在之间,其日总产量在124797124797至至127203127203件之间,件之间,估计的可靠程度为估计的可靠程度为9595。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第19页,共29页,编
17、辑于2022年,星期日2总体方差未知时,正态总体均值区间估计总体方差未知时,正态总体均值区间估计(小样本小样本)根据抽样分布定理,小样本条件下,如果总体是正态分布的,根据抽样分布定理,小样本条件下,如果总体是正态分布的,总体标准差未知而需要用样本标准差总体标准差未知而需要用样本标准差S来代替,则由此可得,来代替,则由此可得,总体均值的置信度为总体均值的置信度为1-a的置信区间:的置信区间:面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二给定概率l-a,抽样极限误差为:第20页,共29页,编辑于2022年,星期日查表得样本均值样本标准差允许误差所求的置信区间面向21世纪课程教材第四章
18、第四章 抽样与抽样估计 第二节 二例:某商场从一批袋装食品中随机抽取10袋,测得每袋(单位:克)重量分别为:789、780、794、762、802、813、770、785、810、806。要求以95%的把握度,估计这批食品平均每袋重量的区间范围。第21页,共29页,编辑于2022年,星期日(二二)总体比率的区间估计总体比率的区间估计 根根据据样样本本比比例例的的抽抽样样分分布布定定理理,在在大大样样本本下下,样样本本比比率率的的分分布布趋趋近近于于均均值值为为总总体体比比率率P,方方差差为为p(1-P)的的正正态态分分布布,服服从从标标准准正正态态分分布布 。因因此此,给给定定置置信信度度(1
19、-a),查查正正态态分分布布表表得得Za/2,样样本本比比例例的的抽抽样样极极限限误误差差为为 ,所所以以,总总体体比比率率的的置置信信度度为为1a的置信区间为的置信区间为:面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第22页,共29页,编辑于2022年,星期日优质品率P的置信置信区间例:某厂对一批产品的质量进行检验,采用重复抽样抽取样品200只,样品优质率为85%,试计算当把握程度为90%时优质率的区间范围。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二第23页,共29页,编辑于2022年,星期日例:某大学在校学生中随机抽取例:某大学在校学生中随机抽取150名学
20、生(重复),调查名学生(重复),调查他们每周看电视的时间,得到资料如下表,要求以他们每周看电视的时间,得到资料如下表,要求以95.45%的的概率把握程度估计该校学生平均每周看电视节目的时间。概率把握程度估计该校学生平均每周看电视节目的时间。每周看电视的时间(小时)每周看电视的时间(小时)学生数(人)学生数(人)组中值组中值4以下以下203463856848781030910以上以上1411合计合计150第24页,共29页,编辑于2022年,星期日第25页,共29页,编辑于2022年,星期日以95.45%的概率把握度估计该校学生平均平均每周看电视在8小时以上人数所占比重。第26页,共29页,编辑
21、于2022年,星期日三、抽样容量的确定三、抽样容量的确定 样本容量是指样本中含有的总体单位数。一般把抽样样本容量是指样本中含有的总体单位数。一般把抽样数目大于数目大于30的样本的样本 称为大样本,而把抽样数目小于称为大样本,而把抽样数目小于30的样本称为小样本。对社会经济现象进行抽样调查一般采的样本称为小样本。对社会经济现象进行抽样调查一般采用大样本。用大样本。若若规规定定在在一一定定概概率率保保证证程程度度下下允允许许误误差差为为 ,则则可可得出确定必要的抽样数目的计算公式为得出确定必要的抽样数目的计算公式为:若采用不重复抽样,也可确定必要的抽样数目:若采用不重复抽样,也可确定必要的抽样数目
22、:面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 三第27页,共29页,编辑于2022年,星期日某大学有学生3000名,根据近年资料,学生的人均月生活费用的标准差为40元,要求误差不超过10元,估计的置信度为95.45%,问需要抽取多少人?已知重复抽样不重复抽样面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 三第28页,共29页,编辑于2022年,星期日从从上上述述公公式式和和例例题题可可见见,必必要要的的抽抽样样数数目目受受以以下下因因素影响:素影响:(1)总体方差总体方差(或总体标准差或总体标准差)。(2)允许误差范围。允许误差范围。(3)置信度置信度(1-a)。(4)抽样方法。抽样方法。(5)抽样组织方式。抽样组织方式。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 三第29页,共29页,编辑于2022年,星期日