《企业抽样估计的方法.pptx》由会员分享,可在线阅读,更多相关《企业抽样估计的方法.pptx(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、教学目的:通过对本章的学习,了解教学目的:通过对本章的学习,了解抽样估计的基本原理,掌握抽样估计抽样估计的基本原理,掌握抽样估计的基本方法。的基本方法。教学设计:对主要的知识点进行讲解,通过在线教学设计:对主要的知识点进行讲解,通过在线学习平台的学习平台的“教学辅导教学辅导”与与“参考资料参考资料”栏目获栏目获取相关知识,从而对重要的知识点有进一步的认取相关知识,从而对重要的知识点有进一步的认识,在此基础上通过练习来加深对相关问题的理识,在此基础上通过练习来加深对相关问题的理解,同时通过网上实时与非实时的答疑解决疑难解,同时通过网上实时与非实时的答疑解决疑难问题。问题。重难点讲解:抽样误差的概
2、念及计算;抽样估计重难点讲解:抽样误差的概念及计算;抽样估计的方法的方法第一节第一节 抽样推断的一般问题抽样推断的一般问题第二节第二节 抽样误差抽样误差第三节第三节 抽样估计的方法抽样估计的方法第四节第四节 抽样组织设计抽样组织设计统计调查方法统计调查方法 全面调查全面调查非非全面调查全面调查 普普 查查 抽样调查抽样调查 重点调查重点调查 典型调查典型调查相关知识回顾:相关知识回顾: 统计报表统计报表 抽样调查抽样调查: :按照按照随机原则随机原则,从总体中抽取一部,从总体中抽取一部分样本单位,根据对样本单位的调查结果来推分样本单位,根据对样本单位的调查结果来推断总体的数量特征。断总体的数量
3、特征。 一、抽样推断的意义一、抽样推断的意义 1 1、概念:、概念: 抽样推断是在抽样调查的基础上,利用样抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。相应数量特征的一种统计分析方法。 第一节第一节 抽样推断的一般问题抽样推断的一般问题推断推断 2 2、特点、特点(1 1)由部分推算整体的一种方法;)由部分推算整体的一种方法;(2 2)抽样推断建立在随机抽样的基础上;)抽样推断建立在随机抽样的基础上;(3 3)抽样推断是运用概率估计的方法;)抽样推断是运用概率估计的方法;(4 4)抽样推断的误
4、差可以计算并加以控制。)抽样推断的误差可以计算并加以控制。推断推断二、抽样推断的内容二、抽样推断的内容(一)参数估计(一)参数估计 用样本的观察资料来估计所研究现象总体的用样本的观察资料来估计所研究现象总体的水平、结构、规模等数量特征,这种推断方法称水平、结构、规模等数量特征,这种推断方法称为参数估计。为参数估计。(二)假设检验(二)假设检验 对总体的状况作出某种假设,然后根据样本对总体的状况作出某种假设,然后根据样本所提供的信息来判断总体未知参数事先所作的假所提供的信息来判断总体未知参数事先所作的假设是否成立的统计分析方法称为假设检验。设是否成立的统计分析方法称为假设检验。三三、抽样的几个基
5、本概念、抽样的几个基本概念 1 1、总体、总体 也称全及总体,指所要认识的研究对象全也称全及总体,指所要认识的研究对象全体,由具有某种共同性质许多单位组成的集合体,由具有某种共同性质许多单位组成的集合体,一般用体,一般用N N表示。表示。 无限总体、有限总体无限总体、有限总体 2 2、样本、样本 又称子样,是从全及总体中随机抽取出来,又称子样,是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体,作为代表这一总体的那部分单位组成的集合体,一般用一般用n n表示。表示。 3 3、随机抽样、随机抽样 按随机原则从总体中抽取样本单位。按随机原则从总体中抽取样本单位。 4 4、非随机抽
6、样、非随机抽样 根据市场调查者的主观分析判断来选取样本根据市场调查者的主观分析判断来选取样本单位。包括偶遇抽样、主观抽样、定额抽样。单位。包括偶遇抽样、主观抽样、定额抽样。5 5、参数、参数 根据总体各单位的标志值或标志特征计算根据总体各单位的标志值或标志特征计算的,反映总体数量特征的综合指标,称为全及的,反映总体数量特征的综合指标,称为全及指标,由总体各单位的标志值或标志特征所决指标,由总体各单位的标志值或标志特征所决定,全及指标的指标值是确定的,唯一的,称定,全及指标的指标值是确定的,唯一的,称为参数。为参数。2 和和总总体体方方差差体体均均值值,常常用用的的总总体体参参数数有有总总对对于
7、于总总体体中中的的数数量量标标志志X FXFNXX FFXXNXX222 对于总体中的品质标志:对于总体中的品质标志: 由于不能用数量来表示,总体参数通常用成数由于不能用数量来表示,总体参数通常用成数P P表示。表示。成数:总体中具有某种性质的单位数在总体全部单位数成数:总体中具有某种性质的单位数在总体全部单位数中的比重,用中的比重,用P P表示。总体中不具有某种性质的单位数在表示。总体中不具有某种性质的单位数在总体中所占的比重,用总体中所占的比重,用Q Q表示表示。有有P+Q=1 P+Q=1 X:X:表示总体变量,有表示总体变量,有N N个单位,所以可以表示为个单位,所以可以表示为nXXX,
8、21道道性性质质的的单单位位数数,可可以以知知表表示示总总体体中中不不具具有有某某种种质质的的单单位位数数,表表示示总总体体中中具具有有某某种种性性表表示示总总体体单单位位数数,用用01NNNNNN 01PNN /1 当某种标志,它的标志表现只有是非两种,可当某种标志,它的标志表现只有是非两种,可 以用以用“1”“1”表示标志表现为表示标志表现为“是是”的标志的标的标志的标志表现,志表现,“0”“0”表示标志表现为表示标志表现为“非非”的标志的标志的标志表现,在此情况下的标志表现,在此情况下: : PNNNNNXP 10101 PQQPPQPQQPNNQNPNNPNPP 22120212022
9、10 PQNN 1/0 6 6、统计量、统计量 根据样本各单位标志值或标志属性计算的综根据样本各单位标志值或标志属性计算的综合指标称为统计量。样本统计量是用来估计总合指标称为统计量。样本统计量是用来估计总体参数的。反映样本的数量特征。体参数的。反映样本的数量特征。 fxfnxx222()()xxxxff n npxp 2ppq 参数参数统计量统计量例题:某批产品共例题:某批产品共500500件,合格品件,合格品480480件,件,不合格品不合格品2020件,要求计算成数合格品率、件,要求计算成数合格品率、PXP %96500480 P%96 PX196. 0%4%96 PQP 7 7、样本容量
10、、样本容量 指一个样本所包含的单位数。指一个样本所包含的单位数。8 8、样本个数、样本个数 又称样本可能数目,是指从一个总体中可能又称样本可能数目,是指从一个总体中可能抽取的样本个数。抽取的样本个数。9 9、重复抽样、重复抽样 从总体从总体N N个单位中随机抽取样本容量为个单位中随机抽取样本容量为n n的样的样本,每次从总体中抽取一个,连续进行本,每次从总体中抽取一个,连续进行n n次实验次实验构成抽样样本。每次抽出一个单位把结果登记构成抽样样本。每次抽出一个单位把结果登记下来又放回,重新参加下一次的抽选。共可抽下来又放回,重新参加下一次的抽选。共可抽取容量为取容量为n n的样本的样本 个。个
11、。nN1010、不重复抽样、不重复抽样 从总体从总体N N个单位中随机抽取容量为个单位中随机抽取容量为n n的样本,的样本,每次从总体中抽取一个,连续进行每次从总体中抽取一个,连续进行n n次实验构次实验构成抽样样本。但每次抽选出的单位就不再放回成抽样样本。但每次抽选出的单位就不再放回参加下一次抽选。共可抽取容量为参加下一次抽选。共可抽取容量为n n的样本的样本N(N-1)(N-2).(N-n+1)N(N-1)(N-2).(N-n+1)个。个。 结论:总体单位数一致,在相同样本容量的情结论:总体单位数一致,在相同样本容量的情况下,重复抽样的样本个数大于不重复抽样的况下,重复抽样的样本个数大于不
12、重复抽样的样本个数。样本个数。 一、抽样误差的概念一、抽样误差的概念概念:概念: 指由于随机抽样的偶然因素使样本各单指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。抽样指标和全及指标之间的绝对离差。 )()(抽抽样样误误差差偶偶然然性性代代表表性性误误差差系系统统偏偏误误系系统统性性代代表表性性误误差差代代表表性性误误差差登登记记性性误误差差调调查查误误差差 系统偏误与登记性误差可以防止或避免,抽样系统偏误与登记性误差可以防止或避免,抽样误差不可避免,只能加以控制。误差不可避免,只能加以控制
13、。影响抽样误差大小的因素:影响抽样误差大小的因素:(1 1)总体各单位标志值的差异程度;)总体各单位标志值的差异程度;(2 2)样本单位数;)样本单位数;(3 3)抽样方法;)抽样方法;(4 4)抽样组织形式。)抽样组织形式。二、抽样平均误差二、抽样平均误差( (抽样指标的标准差抽样指标的标准差) ) 反映抽样误差一般水平的指标。是所有可能反映抽样误差一般水平的指标。是所有可能出现的样本指标和总体指标的平均离差。出现的样本指标和总体指标的平均离差。1 1、抽样平均数的平均误差,也可称为、抽样平均数的平均误差,也可称为抽样平均抽样平均数的标准差数的标准差( (表明各样本均值与总体均值离差表明各样
14、本均值与总体均值离差的一般水平)的一般水平)(1 1)重复抽样情况下)重复抽样情况下 )(计计算算公公式式n nx x :样本单位数:样本单位数总体标准差总体标准差n: 例:设有三个数例:设有三个数8 8、1010、1212,这一总体的均值、标,这一总体的均值、标准差分别为:准差分别为:10312108 X1.6331.6333 32 210)10)(12(122 210)10)(10(102 210)10)(8(8N N2 2x xx x用重复抽样的方法,从用重复抽样的方法,从8 8、1010、1212三个数中抽两个三个数中抽两个数构成样本,求样本的平均值,用以代表三个数的数构成样本,求样本
15、的平均值,用以代表三个数的一般水平,所有可能的样本以及样本的平均值列表一般水平,所有可能的样本以及样本的平均值列表如下:如下:样本个数样本个数样本变量样本变量样本均值样本均值 平均数离差平均数离差 离差平方离差平方 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 8 8 8 10 8 12 10 10 10 12 10 8 12 12 12 8 12 10 8 9 10 10 11 9 12 10 11-2-1 0 0 1 2 0 1-1 410014011 合合 计计 90 0 1210990)( MxxE样样本本平平均均数数的的平平均均数数抽样平均数的标准差:抽样平
16、均数的标准差: 1 1. .1 15 55 5x x 9122nxEx 现在按重复抽样误差公式计算抽样平均误差现在按重复抽样误差公式计算抽样平均误差1 1. .1 15 55 51 1. .6 63 33 32 2 nx 几个基本关系:几个基本关系: a. a.样本平均数的平均数等于总体平均数;样本平均数的平均数等于总体平均数; b. b.抽样平均误差实质上就是抽样平均数的标准抽样平均误差实质上就是抽样平均数的标准差,也称为抽样标准误差;差,也称为抽样标准误差;c.c.抽样平均数的标准差(抽样平均误差)比总体标抽样平均数的标准差(抽样平均误差)比总体标准差小很多,仅为总体标准差的准差小很多,仅
17、为总体标准差的 。 d.d.可以通过调整样本单位数可以通过调整样本单位数n n来控制抽样平均误差来控制抽样平均误差。n1(2)(2)在不重复抽样的情况下在不重复抽样的情况下 12NnNnx )1(2 Nnnx 样本个数样本个数样本变量样本变量样本均值样本均值 平均数离差平均数离差 离差平方离差平方 1 1 2 2 3 3 4 4 5 5 6 6 8 10 8 12 10 12 10 8 12 8 12 10 9 10 11 9 10 11-10 1 -1 0 1 101101 合合 计计 60 0 410660)( MxxE样样本本平平均均数数的的平平均均数数 816.6420 0 x x n
18、xEx 按不重复抽样误差公式计算抽样平均误差按不重复抽样误差公式计算抽样平均误差816. 0)1323(22633. 112 NnNnx )( (差差重重复复抽抽样样的的抽抽样样平平均均误误nNnNn 12代代替替标标准准差差经经常常是是未未知知的的,用用样样本本在在计计算算中中,总总体体标标准准差差s s 12 nxxs )(2nxxs 某工厂有某工厂有15001500个工人,用简单随机重复抽样个工人,用简单随机重复抽样的方法抽取的方法抽取5050个工人作为样本,调查其工资水平,个工人作为样本,调查其工资水平,资料如下:资料如下:月平均工资月平均工资(元)(元)524524534534540
19、540550550560560580580600600660660工人数工人数 (人)(人)4 46 69 910108 86 64 43 3计算样本平均数和抽样平均误差。计算样本平均数和抽样平均误差。5 56 60 0( (元元)5 50 03 36 66 60 06 65 53 34 44 45 52 24 4 fxfx 3 32 2. .4 45 5(元元)5 50 03 34 45 56 60 0) )( (5 52 24 42 2 2)560660(2ffxx )4 4. .5 59 9( (5 50 03 32 2. .4 45 5元元 nx 2 2、抽样成数的平均误差(表明各样本
20、成数与总、抽样成数的平均误差(表明各样本成数与总体成数绝对离差的一般水平)体成数绝对离差的一般水平)(1)(1)在重复抽样下在重复抽样下n nP)P)P(1P(1P P )(2nx P P:总体成数:总体成数n:n:样本单位数样本单位数(2)(2)在不重复抽样下在不重复抽样下1 1) )- -( (N N n nn n) )- -P P) )( (N NP P( (1 1P P ) ) )N Nn n(1(1n np)p)p(1p(1p p( ( 在实际计算中,用样本成数在实际计算中,用样本成数p p代替总体成数代替总体成数P Pnnp1 从从20002000件产品中抽查件产品中抽查20020
21、0件,其中合格品件,其中合格品190190件,件,要求:计算样本合格率及其抽样平均误差。要求:计算样本合格率及其抽样平均误差。 解:在重复抽样下:解:在重复抽样下:95. 0200/190 p0 0. .0 01 15 54 42 20 00 00 0. .0 05 50 0. .9 95 5n np p) )p p( (1 1 p 在不重复抽样下:在不重复抽样下:0 0. .0 01 14 46 6) )N Nn n( (1 1n np p) )p p( (1 1p p 某电子产品使用寿命在某电子产品使用寿命在30003000小时以下为不合格小时以下为不合格品。现在用简单随机抽样方法从品。现
22、在用简单随机抽样方法从50005000个产品中抽取个产品中抽取100100个对其使用寿命进行调查,结果如下表所示个对其使用寿命进行调查,结果如下表所示 使用寿命(小时)使用寿命(小时) 产品数量(个)产品数量(个)30003000以下以下3000300040004000400040005000500050005000以上以上2 2303050501818合计合计100100要求:要求:(1)按重复抽样和不重复抽样计算该产品平均)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差;寿命的抽样平均误差;(2)按重复抽样和不重复抽样计算该产品合格)按重复抽样和不重复抽样计算该产品合格率的抽样平均
23、误差。率的抽样平均误差。解:根据资料可算出解:根据资料可算出 使用寿命(小时)使用寿命(小时) 组中值组中值 产品数量(个)产品数量(个) xfxf30003000以下以下3000300040004000400040005000500050005000以上以上25002500350035004500450055005500 2 2 30 30 50 50 18 18 500050001050001050002250002250009900099000 合计合计 100 100434000434000)(4340100434000小时小时样本均值样本均值 fxfx)(03.73110018434
24、05500243402500222小时样本标准差ffxx%9810098 p样样本本合合格格品品率率)(.小时小时样平均误差样平均误差重复抽样下平均寿命抽重复抽样下平均寿命抽17310003731 nx)(37.725000100110003.731122小小时时抽抽样样平平均均误误差差不不重重复复抽抽样样下下平平均均寿寿命命 Nnnx 014. 01000196. 010002. 098. 01 nppp 平平均均误误差差重重复复抽抽样样下下合合格格率率抽抽样样 01386. 098. 01000196. 05000100110002. 098. 011 样样平平均均误误差差不不重重复复抽抽
25、样样下下合合格格率率抽抽Nnnppp 三、抽样极限误差三、抽样极限误差 指变动的抽样指标与确定的总体指标之间指变动的抽样指标与确定的总体指标之间离差的可能范围,统计上称为抽样极限误差。离差的可能范围,统计上称为抽样极限误差。设设误误差差抽抽样样平平均均数数的的抽抽样样极极限限:x 差差抽抽样样成成数数的的抽抽样样极极限限误误:p Xxx PpP pppPp xxxXx .,),()称称为为置置信信区区间间或或(ppxxppxx 四、抽样误差的概率度四、抽样误差的概率度 xt x xppt 抽抽样样误误差差的的概概率率度度。就就称称为为,得得到到数数值值除除以以或或者者用用除除以以用用ttppx
26、x)( xxt ppt 对某市居民进行生活水平调查,现随机抽取对某市居民进行生活水平调查,现随机抽取100100户,结户,结果户月均收入为果户月均收入为482482元,标准差为元,标准差为5050元,要求该市居民户月元,要求该市居民户月均收入在均收入在472472492492元的范围内,试求抽样极限误差和抽样元的范围内,试求抽样极限误差和抽样概率度。概率度。10482, xxxxxXx解解:根根据据2510510050 xxxtn 又又 第三节第三节 抽样估计的方法抽样估计的方法 一、总体参数的点估计一、总体参数的点估计 根据总体指标的结构形式设计样本指标作为总体参数根据总体指标的结构形式设计
27、样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值,即直接以样本平均数、成数推断总体的平均数的估计值,即直接以样本平均数、成数推断总体的平均数和成数。和成数。的的估估计计量量表表示示总总体体成成数数的的估估计计量量,表表示示总总体体平平均均数数设设PPXXPpXx 优良估计的标准:优良估计的标准: 1 1、无偏性:以抽样指标估计总体指标要求抽样指、无偏性:以抽样指标估计总体指标要求抽样指 标值的平均数等于被估计的总体指标值本身。标值的平均数等于被估计的总体指标值本身。 )1(,(npppnx 2 2、一致性:以抽样指
28、标估计总体指标要求当样、一致性:以抽样指标估计总体指标要求当样本容量增大时,抽样指标也充分地靠近总体指标。本容量增大时,抽样指标也充分地靠近总体指标。3 3、有效性:以抽样指标值估计总体指标要求作为、有效性:以抽样指标值估计总体指标要求作为优良估计量的方差应该比其他估计量的方差小。优良估计量的方差应该比其他估计量的方差小。二、抽样估计的精度二、抽样估计的精度 估计精度估计精度1 1误差率误差率 xXxx 误误差差率率 KPPPXxP 21x x三、抽样估计的置信度三、抽样估计的置信度 表明抽样指标和总体指标的误差不超过一定范表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。围的概率保证
29、程度。样本平均数样本平均数700700800800900900100010001100110012001200130013001400140015001500频数频数 f f1 12 21 12 24 42 21 12 21 1频率频率) )x x( () )f ff f( ( 1 16 61 11 16 62 21 16 61 11 16 62 216164 41 16 62 21 16 61 11 16 62 21 16 61 1根据以上分布写出平均工资落在各种区间范围内的概率根据以上分布写出平均工资落在各种区间范围内的概率P P: 2116216416212001000 xP 85161
30、1621641621611300900 xP 871621611621641621611621400800 xP)100100( Xx)200200( Xx)300300( Xx84)100( XxP87)300( XxP 已经证明,当样本单位数大于或等于已经证明,当样本单位数大于或等于3030的条的条件下,抽样平均数的分布接近与正态分布。件下,抽样平均数的分布接近与正态分布。85)200( XxP 该分布的特点是:该分布的特点是:(1 1)抽样平均数以总体平均数为中心,它大于或小)抽样平均数以总体平均数为中心,它大于或小于总体平均数的概率分布完全呈对称分布;抽样平于总体平均数的概率分布完全呈
31、对称分布;抽样平均数的正误差和负误差的可能性完全相等。均数的正误差和负误差的可能性完全相等。(2 2)抽样平均数越接近总体平均数,其出现的概率)抽样平均数越接近总体平均数,其出现的概率越大;越远离总体平均数,其出现的概率越小。越大;越远离总体平均数,其出现的概率越小。%73.993%45.95227.68 ) )- -P(P() )- -P(P(% %) )P(P( XxXxXx 概率度与概率保证程度之间是函数关系,概概率度与概率保证程度之间是函数关系,概率保证程度是概率度的函数,即:率保证程度是概率度的函数,即:F(t)F(t) )P(P( xtXx )1,( ttx )2,( ttx )3
32、,( ttx 9 99 9. .7 73 3% %F F( (t t) ), ,3 3t t9 95 5. .4 45 5% %F F( (t t) ), ,2 2t t9 95 5F F( (t t) )1 1. .9 96 6t t6 68 8. .2 27 7% %F F( (t t) ), ,1 1t t 时时时时时时时时, t与与F(t)之间的关系可以查正态分布概率表,之间的关系可以查正态分布概率表,附录三附录三四、总体参数的区间估计四、总体参数的区间估计 对于总体的被估计值(总体参数)对于总体的被估计值(总体参数)X X,找出两个,找出两个数值数值 使被估计指标使被估计指标X X落
33、在区间落在区间 内的概率内的概率 为已知的。(用一个具有一为已知的。(用一个具有一定可靠程度的区间范围来估计总体参数)定可靠程度的区间范围来估计总体参数))2 21 1, ,x x( (x x)10(1 置信上限置信上限置信下限;置信下限;:21xx 为置信区间为置信区间21, xx为为置置信信水水平平为为置置信信度度, 1)(21xx 21xx 和和 区间估计的两种方法区间估计的两种方法:1 1、根据已知的抽样误差范围(抽样极限误差)求、根据已知的抽样误差范围(抽样极限误差)求概率保证程度(置信度)。概率保证程度(置信度)。 用用时时数数。估估计计该该批批灯灯泡泡的的平平均均耐耐,试试允允许
34、许误误差差范范围围下下表表,要要求求耐耐用用时时间间的的个个灯灯泡泡的的耐耐用用时时间间见见个个进进行行检检验验,这这随随机机抽抽取取检检查查中中,万万个个灯灯泡泡,在在进进行行质质量量某某灯灯泡泡厂厂某某月月生生产产7 7. .4 40 04 45 50 00 05 50 00 05 50 00 0 x x 并给出相应的概率保证程度并给出相应的概率保证程度耐用时间耐用时间组中值组中值灯泡数灯泡数耐用时间耐用时间组中值组中值灯泡数灯泡数800850825359501000975103850900875127100010501025429009509251851050110010758 2 2.
35、 .4 46 68 8n nx x5 55 5. .1 19 95 50 00 0f f9 92 26 6. .4 45 50 00 08 81 10 07 75 51 12 27 78 87 75 53 35 58 82 25 5f fx xf fx x 50019.5585 .9261075354 .926825222fxx(1 1)样本平均数及抽样平均误差)样本平均数及抽样平均误差( (小小时时)( (小小时时)( (2 2) )9 93 33 3. .8 87 7. .4 40 04 49 92 26 6. .4 49 91 19 97 7. .4 40 04 49 92 26 6.
36、.4 4上上限限下下限限 xxxx3 32 2. .4 46 68 87 7. .4 40 04 4t tx x x x t t( (3 3) ) %73.99)( tF以以99.7399.73的可靠程度推断这批灯泡的耐用时间在(的可靠程度推断这批灯泡的耐用时间在(919919小时,小时,933.8933.8小时)的范围内。小时)的范围内。 若已知样本灯泡的合格率为若已知样本灯泡的合格率为9595,要求合格率的误,要求合格率的误差范围不超过差范围不超过0.970.97,估计该批灯泡的合格率,并给出,估计该批灯泡的合格率,并给出相应的概率保证程度。相应的概率保证程度。 0 0. .0 00 09
37、 97 75 50 00 00 0. .0 04 47 75 5n np p) )p p( (1 1p p )抽抽样样平平均均误误差差( 1(2)求求总总体体合合格格率率的的上上下下限限下下限限:p p 95%0.97%94.0395%0.97%94.03p p上上限限:p p 95%95%0.97%95.970.97%95.97p p1 10 0. .0 00 09 97 70 0. .9 97 7% %t tp pp pt t( (3 3) ) 2 2、给出置信度,求抽样极限误差的可能范围、给出置信度,求抽样极限误差的可能范围 以以68.2768.27的概率保证程度估计该批灯泡的合格的概率
38、保证程度估计该批灯泡的合格率在(率在(94.03%94.03%,95.97%95.97%)范围内。)范围内。%27.68)( tF 某城市某街道所管辖的某城市某街道所管辖的1000010000户居民中,用户居民中,用单纯随机重复抽样方法抽取单纯随机重复抽样方法抽取200200户,对某种商品户,对某种商品的平均需求量和需求倾向进行调查,调查结的平均需求量和需求倾向进行调查,调查结果表明,每户居民对该商品的月平均需求量为果表明,每户居民对该商品的月平均需求量为500500克,标准差为克,标准差为100100克,表示一年内不选择其克,表示一年内不选择其他替代商品,继续消费该商品的居民户为他替代商品,
39、继续消费该商品的居民户为9090,试对总体平均数,总体成数进行区间估计。试对总体平均数,总体成数进行区间估计。(1 1)当置信度)当置信度8585时时1.441.44t t 90%90%p p 100100 500500 x x 200200n n 克)克)克)克)(224.101 . 744. 1( 1 . 7200100 xxxtn 为为克,这种估计的置信度克,这种估计的置信度平均需求量为平均需求量为户居民对该商品的月户户居民对该商品的月户即该街道即该街道852 .5108 .489100002 .5108 .489224.10500224.10500 XXxXxxx0 0. .0 02
40、28 88 80 0. .0 02 21 1. .4 44 4p pt t. .p p0 0. .0 02 22 20 00 00 0. .1 10 0. .9 9n np p) )p p( (1 1p p 0 0. .9 93 3P P0 0. .8 87 70 0. .0 02 28 88 80 0. .9 9P P0 0. .0 02 28 88 80 0. .9 9p pp pP Pp pp p 该街道该街道1000010000户居民表示继续消费该商品的居民户居民表示继续消费该商品的居民户占户占87879393,估计的置信度为,估计的置信度为8585(2)(2)当置信度当置信度9595
41、时时,1.961.96t t 90%90%p p 100100 500500 x x 200200n n 克)克)(9 .131 . 796. 1 xxt 9 .5131 .4869 .135009 .13500 XXxXxxx 该街道该街道1000010000户居民对该商品需求量为户居民对该商品需求量为486.1486.1513.9513.9克,置信度为克,置信度为95959392. 08608. 00392. 09 . 00392. 09 . 00392. 002. 096. 1 PPpPptpppp 总体参数的区间估计的三要素是:估计值、总体参数的区间估计的三要素是:估计值、抽样误差范围
42、、概率保证程度。抽样误差范围、概率保证程度。该街道该街道1000010000户居民表示继续消费该商品的居户居民表示继续消费该商品的居民户占民户占86.186.193.993.9,置信度为,置信度为9595. .例例1 1:某工厂生产一种新型灯泡:某工厂生产一种新型灯泡50005000只,随机只,随机抽取抽取100100只作耐用时间实验,测试结果平均寿只作耐用时间实验,测试结果平均寿命为命为45004500小时,标准差为小时,标准差为300300小时,试在小时,试在95.4595.45概率保证下,估计该新式灯泡平均寿命区概率保证下,估计该新式灯泡平均寿命区间。间。45604440 6030230
43、100300 XxxXxxtxns即即解解:x xx x2 2t t 3 30 00 0 5 50 00 0 x x 1 10 00 0n n 例例2 2:某乡有:某乡有50005000农户,按随机原则重复抽取农户,按随机原则重复抽取100100户调查,得平均每户年纯收入户调查,得平均每户年纯收入1200012000元,标元,标准差准差20002000元,要求元,要求:(1):(1)以以9595的概率估计全乡的概率估计全乡平均每户年纯收入的区间;平均每户年纯收入的区间;(2)(2)以同样概率估以同样概率估计全乡农户年纯收入总额的区间范围。计全乡农户年纯收入总额的区间范围。1239211608(
44、39220096.1)(2001002000196.1,2000,12000,100,5000 XxXxtntsxnNxxxxx元元)元元)(解解: 范范围围内内。,在在全全乡乡农农户户年年纯纯收收入入总总额额710193. 6710804. 5710193. 6123925000710804. 5116085000 例例3 3:某学校进行一次英语测验,为了了解学生的:某学校进行一次英语测验,为了了解学生的考试情况,随机抽选部分学生进行调查,所得资考试情况,随机抽选部分学生进行调查,所得资料如下:料如下:考试成绩考试成绩6060以下以下60607070707080808080909090901
45、00100学生人数学生人数10102020222240408 8试以试以95.4595.45的可靠性估计该学校英语考试的平的可靠性估计该学校英语考试的平均成绩的范围及该校学生成绩在均成绩的范围及该校学生成绩在8080分以上的学生分以上的学生所占的比重的范围。所占的比重的范围。解:该校学生英语考试的平均成绩解:该校学生英语考试的平均成绩)(6 .7610076601008954085227520651055分分 fxfx标准差为标准差为 377.111001294410086 .7695106 .7655222 ffxx 平均成绩的抽样平均误差为平均成绩的抽样平均误差为1377. 1100377
46、.11 nx 平均成绩的抽样极限误差为平均成绩的抽样极限误差为2754. 21377. 12 xxt 该校学生考试的平均成绩的区间范围是该校学生考试的平均成绩的区间范围是xxxXx 89.7832.74 X样本中考试成绩在样本中考试成绩在80分以上的学生比重分以上的学生比重48. 010048 p 04996. 010052. 048. 01 nppp 09992. 004996. 02 ppt 考试成绩在考试成绩在80分以上的学生比重分以上的学生比重pppPp 5799.03801.009992.048.009992.048.0 PP在在95.45概率保证程度下,该校学生成绩在概率保证程度下
47、,该校学生成绩在8080分以分以上的学生所占比重的范围在上的学生所占比重的范围在38.0138.0157.9957.99之间之间例例4:外贸公司出口一种茶叶,规定每包毛重不低于:外贸公司出口一种茶叶,规定每包毛重不低于100克,现用不重复抽样的方法抽取其中的克,现用不重复抽样的方法抽取其中的1 1进行进行检验,其结果如下:检验,其结果如下:每包重量(克)每包重量(克)包数包数9898999999991001001001001011011011011021021010202050502020合计合计100100试以试以99.73(t=3)的概率保证程度估计这批茶叶)的概率保证程度估计这批茶叶合格
48、率范围。合格率范围。解:样本合格率为解:样本合格率为7 . 010070 p 0456. 0002079. 01000010011003 . 07 . 011 Nnnppp 100001100总总体体单单位位数数为为137. 00456. 03 ppt 137. 07 . 0137. 07 . 0即即 PpPppp837. 0563. 0 P以以99.73的概率保证程度保证这批茶叶包装合格率在的概率保证程度保证这批茶叶包装合格率在56.383.7之间。之间。第四节第四节 抽样组织设计抽样组织设计一、抽样组织设计的基本原则一、抽样组织设计的基本原则1 1、保证随机性原则的实现、保证随机性原则的实
49、现(1 1)要有合适的抽样框)要有合适的抽样框 抽样框:指编制抽样单位的目录。抽样框:指编制抽样单位的目录。(2 2)取样的实施问题)取样的实施问题2 2、考虑样本容量问题、考虑样本容量问题3 3、关于抽样的组织形式、关于抽样的组织形式4 4、必须重视调查经费、必须重视调查经费 二、几种常用的抽样组织形式二、几种常用的抽样组织形式 1 1、简单随机抽样(、简单随机抽样(最基本、最简单的抽样组织形式)最基本、最简单的抽样组织形式) 直接从总体直接从总体N N个单位中随机抽取个单位中随机抽取n n个单位作为样本,个单位作为样本,适用于均匀总体。适用于均匀总体。类型类型 (1)(1)抽签法抽签法 (
50、2) (2)随机数表法随机数表法简单随机抽样样本单位数的确定:简单随机抽样样本单位数的确定: a.a.在重复抽样下,由于样本平均数的抽样极限误差公式为:在重复抽样下,由于样本平均数的抽样极限误差公式为: xxxtnntt222 b.b.在不重复抽样下,在不重复抽样下,由于样本平均数的抽样极限误差公式为:由于样本平均数的抽样极限误差公式为:22222)1(22 txNNtnNnntxtx 样样本本单单位位数数c.c.在重复抽样下,由于样本成数的抽样极限误差公式为在重复抽样下,由于样本成数的抽样极限误差公式为ppptppnnpptt2211)()( d.d.在不重复抽样下,由于样本成数的抽样极限误