第四章分层随机抽样(抽样理论与方法河南财政学院).pptx

上传人:修**** 文档编号:12430134 上传时间:2022-04-24 格式:PPTX 页数:64 大小:1.80MB
返回 下载 相关 举报
第四章分层随机抽样(抽样理论与方法河南财政学院).pptx_第1页
第1页 / 共64页
第四章分层随机抽样(抽样理论与方法河南财政学院).pptx_第2页
第2页 / 共64页
点击查看更多>>
资源描述

《第四章分层随机抽样(抽样理论与方法河南财政学院).pptx》由会员分享,可在线阅读,更多相关《第四章分层随机抽样(抽样理论与方法河南财政学院).pptx(64页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章第四章 分层随机抽样分层随机抽样河南财经学院河南财经学院4.1 4.1 概述概述 一、分层抽样(一、分层抽样(stratified sampling)stratified sampling)、分层随机抽样分层随机抽样(stratified random sampling)(stratified random sampling) 分层抽样分层抽样:将容量为:将容量为N N的总体分成的总体分成L L个不相重叠的子总个不相重叠的子总体,子总体的大小分别为体,子总体的大小分别为N N1 1、 N N2 2、 N NL L,皆已知,且皆已知,且 则每个子总体就称为层。从每层中独立地进行抽样,则每个

2、子总体就称为层。从每层中独立地进行抽样,这样的抽样方法称为分层抽样。这样的抽样方法称为分层抽样。 分层随机抽样分层随机抽样:在分层抽样中,如果每层中的抽样都:在分层抽样中,如果每层中的抽样都是简单随机抽样,则这样的分层抽样称为分层随机抽是简单随机抽样,则这样的分层抽样称为分层随机抽样。样。NNL1ih 河南财经学院河南财经学院二、分层抽样的适用场合二、分层抽样的适用场合 不仅需要估计总体参数,也需要估计各层参数。不仅需要估计总体参数,也需要估计各层参数。 便于管理,按现成的地理分布或行政划分来分层。便于管理,按现成的地理分布或行政划分来分层。 希望样本中能包含各个部分,以增加代表性。希望样本中

3、能包含各个部分,以增加代表性。 把一个内部差异很大的总体分成几个内部比较相似的把一个内部差异很大的总体分成几个内部比较相似的子总体(层)进行分层抽样,可以提高估计量的精度。子总体(层)进行分层抽样,可以提高估计量的精度。如果有极端值,也可以把它们分离出来形成一层。即如果有极端值,也可以把它们分离出来形成一层。即“层间方差大,层内方差小层间方差大,层内方差小”。三、进行分层抽样时,应注意的方面三、进行分层抽样时,应注意的方面 层内抽样设计的选择。层内抽样设计的选择。 分层变量的选择。分层变量的选择。 各层样本量的分配,样本总量的确定。各层样本量的分配,样本总量的确定。 层数。层数。 层的分界。层

4、的分界。河南财经学院河南财经学院4.2 4.2 简单估计量及其性质简单估计量及其性质对总体均值或总值的估计:对总体均值或总值的估计:层权层权hhWN/N L21hhL,表示层的编号,表示层的编号,层,以层,以设总体分为设总体分为 nnnnnNNNNNL1ihL1L1ihL1 ,)样样本本(,)总总体体(河南财经学院河南财经学院 hhhhhhn1i2hhih2hN1i2hhih2hn1ihihhN1ihihhn1ihihN1ihihyy1n1sYY1N1Syn1yYN1YyyYYhh)()(层样本层样本第第层层总体第总体第hnhNhhi1hhhhi1hhyyynhYYYNh,个样本单元:个样本单

5、元:层样本有层样本有第第,个总体单元:个总体单元:层有层有总体第总体第河南财经学院河南财经学院例例4.1 4.1 总体由总体由10001000人组成,按以往的收入情况将总体分成人组成,按以往的收入情况将总体分成两层:第一层(高收入层),两层:第一层(高收入层),2020人;第二层(低收入人;第二层(低收入层),层),980980人。从第一层随机抽取人。从第一层随机抽取2 2人,调查上月收入,人,调查上月收入,得数据(单位:元)得数据(单位:元)12001200及及16001600;从第二层随机抽取;从第二层随机抽取8 8人,人,调查上月收入,得数据(单位:元)调查上月收入,得数据(单位:元)2

6、20220、230230、180180、320320、400400、340340、280280、360360。估计这。估计这10001000人上月平均收入。人上月平均收入。解:解: 对比:对比:43.31325.29110009801400100020yWyWNyNyNNYYY2211221121 5131036022016001200y 河南财经学院河南财经学院一、分层抽样中一、分层抽样中, L1hhhhYYYNYh,层,都有层,都有若对任一层,假设为第若对任一层,假设为第 L1hh2hL1hhL1hhhL1hhYVNYVYVYNYY)1()()()(方差方差 L1hh2hstL1hhhL1

7、hhhL1hhst)Y(VWYVYWYNNNYY)2()(方差方差河南财经学院河南财经学院 L1h2hhh2hL1hh2hststSnf1WyVWyVy)()(的方差为的方差为ststL1hhhL1hhhststyY,yWYWyYY. 1记为记为为:为:的无偏简单估计的无偏简单估计 )的无偏估计。)的无偏估计。(且为且为的估计:的估计:的方差的方差yVsnf1W)y(v)y(VY2hL1hhh2hstst hhyY,的简单估计为的简单估计为则则分层随机抽样分层随机抽样河南财经学院河南财经学院 )y( suy),y( suy1Yst21stst21st的置信区间为:的置信区间为:的置信度为的置信

8、度为 L1h2hhh2hL1hh2hL1hhL1hhhL1hhhL1hhSnf1NyVNYVYVyNYNYYY. 2)()()(方差方差的估计:的估计:总体总和总体总和2hL1hhh2hststsnf1W)y(v)y(VY 的无偏估计:的无偏估计:的方差的方差河南财经学院河南财经学院例例3.3. 调查某地区的居民奶制品年消费支出,以居民调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为户为抽样单元,根据经济及收入水平将居民户分为层,每层按简单随机抽样抽取户,调查数据如下,层,每层按简单随机抽样抽取户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差

9、。估计该地区居民奶制品年消费总支出及估计的标准差。样本户奶制品年消费支出样本户奶制品年消费支出层层居民居民户总户总数数样本户奶制品年消费支出样本户奶制品年消费支出1 12 23 34 45 56 67 78 89 910101 1200200101040400 0110110151510104040808090900 02 2400400505013013060608080100100555516016085851601601701703 37507501801802602601101100 014014060602002001801803003002202204 41500150050503

10、53515150 0202030302525101030302525河南财经学院河南财经学院解:解:2096502415001657501054005 .39200yNY)1(L1hhh 23208)Y(v)Y( s1039. 5snf1N)yN(v)Y(v)Y(VY)2(82hL1hhh2hst 的估计:的估计:的方差的方差333.193s24y556.8205s165y667.2166s105y722.1624s5 .39y244233222211 :各层样本均值及方差为各层样本均值及方差为河南财经学院河南财经学院(3 3)该地区居民奶制品年消费总支出的置信度为)该地区居民奶制品年消费总支

11、出的置信度为95%95%的的置信区间为置信区间为 255138164162)Y( suY),Y( suY2121, 河南财经学院河南财经学院例例3.33.3:某市进行家庭收入调查,分城镇居民及农村居:某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居民民两部分抽样,在全部城镇居民2356023560户中随机抽取户中随机抽取300300户,在全部农村居民户,在全部农村居民148420148420户中随机抽取户中随机抽取250250户,户,调查结果是城镇年平均户收入为调查结果是城镇年平均户收入为1518015180元,标准差为元,标准差为29722972元;农村年平均户收入为元;农

12、村年平均户收入为98569856元,标准差为元,标准差为25462546元。求全市年平均户收入的置信度为元。求全市年平均户收入的置信度为90%90%的置信的置信区间。区间。解:解:34.142snf1W)y(v)y( s21i2iii2istst 39.1058598561719801484201518017198023560yWyWy2211st 54.1081924.10351,34.142645. 139.1058590%,即即的置信区间为:的置信区间为:信度为信度为全市年平均户收入的置全市年平均户收入的置 河南财经学院河南财经学院3 3、分层随机抽样中,总体比例、分层随机抽样中,总体比

13、例P P的简单估计的简单估计.pP,pWPWpPL1hhhL1hhhst记记为为的的简简单单估估计计为为 ,则,则的简单估计为的简单估计为设设hhpP L1hh2hststpVWpVp)()(的方差的方差 L1h2hhh2hSnf1W L1hhhhhhh2hQP1NNnf1W很大时)很大时)当当hL1hhhhh2hN(QPnf1W 河南财经学院河南财经学院估计的性质估计的性质(1 1)(2 2)的无偏估计。的无偏估计。且是且是的简单估计为的简单估计为的性质:的性质:stL1hhhststppWpPp 很大时)很大时)当当)()(的方差的方差hL1hhhhh2hL1hhhhhhh2hL1hh2h

14、ststN(QPnf1WQP1NNnf1WpVWpVp 河南财经学院河南财经学院)的无偏估计。)的无偏估计。(且为且为的估计:的估计:的方差的方差stL1hhhhh2hstststpVqp1nf1W)p(v)p(Vp )p( sup),p( sup1Pst21stst21st的置信区间为:的置信区间为:的置信度为的置信度为(3)(3)(4)(4)河南财经学院河南财经学院 L1hh2hL1hh2hL1hhhL1hhhpVNPVNAVApNPNA)()()(的方差的方差4 4河南财经学院河南财经学院例例:在某行业技术人员中,按年龄分层,调查会使用计:在某行业技术人员中,按年龄分层,调查会使用计算机

15、者所占的比例。数据如下:算机者所占的比例。数据如下: 试估计总体中会计算机者占的比例。试估计总体中会计算机者占的比例。层层人数人数入样人数入样人数样本中会使用样本中会使用计算机的人数计算机的人数3030岁以下岁以下778177817171242430-3530-35岁岁749774976868121236-4036-40岁岁977997798989222241-4541-45岁岁46274627424211114545岁以上岁以上5366536650504 4总计总计3505035050320320河南财经学院河南财经学院解:解:2286. 0pWp)1(51hhhst 000534. 01n

16、)p1(p)f1(W)p(v)2(51hhhhh2hst %39.27%,33.18)p(Vup, )p(Vup%95P)3(st21stst21st 的置信区间为:的置信区间为:置信度为置信度为河南财经学院河南财经学院3.3 3.3 各层样本量的分配各层样本量的分配在分层随机抽样中,假设样本量在分层随机抽样中,假设样本量n n固定固定 L1h2hhL1hh2h2h2hL1hhh2hstNSWnSWSnf1W)y(VY的方差:的方差: L1hhh0nccC,则总费用为:,则总费用为:考虑简单线性费用函数考虑简单线性费用函数河南财经学院河南财经学院1.1.比例分配:指按各层层权(各层单元数占总体

17、单元数的比例分配:指按各层层权(各层单元数占总体单元数的比例)进行分配。比例)进行分配。 l1h2hhh2hpropSnf1W)y(VhhhWNNnn L1hhhpropyWy则:则:fNnNnfhhh hin1ihL1hhhyn1NN hin1ihL1hhhyn1nnyyn1L1hn1ihhi l1h2hh2hSnWf1W l1h2hh2w2wl1h2hhSWS,Snf1SWnf1权平均。权平均。为各层方差按层权的加为各层方差按层权的加其中其中河南财经学院河南财经学院例例:假设某公司欲估计某类产品的用户的每年平均支出。:假设某公司欲估计某类产品的用户的每年平均支出。企划人员拟就整个潜在用户的

18、名单,共企划人员拟就整个潜在用户的名单,共80008000户。户。 采用分层随机抽样抽取样本采用分层随机抽样抽取样本200200户,求按比例分配时户,求按比例分配时各层样本量。各层样本量。层层每层每层中的潜在用户中的潜在用户少用少用20002000中等中等40004000多用多用20002000总和总和N=8000N=8000河南财经学院河南财经学院。、各层样本量分别为各层样本量分别为50100505080002000nWn10020080004000nWn3322 5020080002000nWn11 解:解:河南财经学院河南财经学院例例. . 某电视台要在某地区的住户中某电视台要在某地区的

19、住户中, ,调查该台的晚间新闻调查该台的晚间新闻的收视率。该地区包括的收视率。该地区包括3 3个县个县, ,共有共有6740167401家住户。假定家住户。假定该电视台采用等比例分层随机抽样分别从三个县抽取该电视台采用等比例分层随机抽样分别从三个县抽取住户,样本量为住户,样本量为15001500。每个县的总户数以及抽样数据。每个县的总户数以及抽样数据列表如下:列表如下: 求该地区新闻收视率的求该地区新闻收视率的95%95%的置信区间。的置信区间。县县i i每个县的户数每个县的户数N Ni i每个县被抽出每个县被抽出的户数的户数n ni i 每个县的样本收每个县的样本收视率视率 p pi i1

20、12 23 348107481071241912419 6875 6875 10711071 276 276 153 153 0.270.270.180.180.170.17合计合计N=67401N=67401n=1500n=1500河南财经学院河南财经学院解:解:分层随机抽样时,收视率分层随机抽样时,收视率P P的估计为:的估计为: 011. 0182. 015006740115001snf1)p(v)p( s182. 083. 017. 067401687582. 018. 0674011241973. 027. 06740148107qpWsWs243. 0pWp2wstst31hhhh

21、2h31hh2w31hhhst 河南财经学院河南财经学院收视率收视率P P的置信度为的置信度为95%95%的近似置信区间为:的近似置信区间为:即有即有95%95%的把握可以认为,该地区的新闻收视率在的把握可以认为,该地区的新闻收视率在22.1%22.1%26.5%26.5%之间。之间。 265. 0 ,221. 0011. 096. 1243. 0)p( spst21st即即 河南财经学院河南财经学院2.2.最优分配:最优分配: L1hhh0nccC,则总费用为:,则总费用为:考虑简单线性费用函数考虑简单线性费用函数 L1h2hhL1hh2h2h2hL1hhh2hstNSWnSWSnf1W)y

22、(VY的方差:的方差:河南财经学院河南财经学院L, 2 , 1h,c/SWc/SWnnL1hhhhhhhh 样本量的最优分配为:样本量的最优分配为:的方差达到最小值的方差达到最小值在最优分配中,在最优分配中,)y(VYstmin L1h2hhL1hh2h2hstminNSWnSW)y(V L1h2hhL1hhhhL1hhhhNSW)c/SW)(cSW(河南财经学院河南财经学院 L1h2hhL1hh2h2hL1h2hhh2hL1h2hhh2hhNSWnSWS)N1n1(WSnf1WVn ,估计量的方差为,估计量的方差为对给定的对给定的证明:证明: L1hh2h2hL1h2hhnSWNSWVV L

23、1hhh0TnCCC L1hhh0TnCCCC河南财经学院河南财经学院)nC)(nSW(CVL1hhhL1hh2h2h 常数常数有的有的等式成立的条件是对所等式成立的条件是对所许瓦兹不等式许瓦兹不等式根据柯西根据柯西 hh2hh2h2hab,h)ba()b)(a(: 2L1hhhhL1h2hhL1h2hhh)CSW()nC)(nSW(CV 达到最小达到最小时时即即常数常数且当且当CV,CSWKn, )K(SWnCnSWnChhhhhhhhhhhhh )nC)(nSW(L1h2hhL1h2hhh 河南财经学院河南财经学院L, 2 , 1h,c/SWc/SWnnL1hhhhhhhh 样本量的最优分

24、配为:样本量的最优分配为:的方差达到最小值的方差达到最小值在最优分配中,在最优分配中,)y(VYstmin L1h2hhL1hh2h2hstminNSWnSW)y(V L1h2hhL1hhhhL1hhhhNSW)c/SW)(cSW( hhhhhhC/SWKnn河南财经学院河南财经学院例例. .在例在例3.23.2中,样本量仍为中,样本量仍为n=40n=40,则按比例分配和则按比例分配和NeymanNeyman分配时,各层的样本量为多少?分配时,各层的样本量为多少?)时的最优分配。)时的最优分配。用相同(用相同(指每层抽取一个单元费指每层抽取一个单元费分配:分配:L, 1h, ccNeymanh

25、 特例:特例: h2hh2hhhstminstminSWN1SWn1yVyVY,Neyman)()():):(的方差达到最小值的方差达到最小值分配下分配下在在L, 2 , 1h,SWSWnnL1hhhhhh 河南财经学院河南财经学院例例. . 在例在例3.33.3中,样本量仍为中,样本量仍为n=550n=550。 城镇居民城镇居民2356023560户,农村居民户,农村居民148420148420户。户。 城镇居民与农村居民的年收入的标准差分别为城镇居民与农村居民的年收入的标准差分别为S S1 1=3000=3000元元,S,S2 2=2500=2500元。元。 对城镇居民与农村居民抽样平均每

26、户的费用比为对城镇居民与农村居民抽样平均每户的费用比为1 1:2 2。 试求城镇与农村两层比例分配与最优分配的样本量。又若试求城镇与农村两层比例分配与最优分配的样本量。又若不考虑费用因素,那么最优分配的结果如何?不考虑费用因素,那么最优分配的结果如何?河南财经学院河南财经学院7555017198023560nWn111 )比例分配)比例分配(43327.4335503 .19366 .1525nc/SWc/SWnL1hhhh2222 475550171980148420nWn22 11773.1165503 .1936411nc/SWc/SWn2L1hhhh1111 )最优分配)最优分配(解:

27、解:河南财经学院河南财经学院46299.4615505 .25685 .2157nSWSWnL1hhh222 8801.885505 .25680 .411nSWSWnNeyman2L1hhh111 分配分配)(河南财经学院河南财经学院例例3.3.:调查某地区的居民奶制品年消费支出,以居民:调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为户为抽样单元,根据经济及收入水平将居民户分为层,每层按简单随机抽样抽取户,调查数据如下,层,每层按简单随机抽样抽取户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差。估计该地区居民奶制品年消费总支出及估计的标准

28、差。表:样本户奶制品年消费支出表:样本户奶制品年消费支出层层 居民居民户总户总数数样本户奶制品年消费支出样本户奶制品年消费支出1 12 23 34 45 56 67 78 89 910101 1200200101040400 0110110151510104040808090900 02 2400400505013013060608080100100555516016085851601601701703 37507501801802602601101100 014014060602002001801803003002202204 4150015005050353515150 020203030

29、2525101030302525河南财经学院河南财经学院解:按比例分配时,解:按比例分配时, 对于对于NeymanNeyman分配,分配,。、各层样本量分别为各层样本量分别为21106305.21nWn53.10nWn61. 5nWn81. 24007018. 0nWn44332211 5330. 6667.21662850400sW8286. 2722.16242850200sW2211 3181. 7333.19328501500sW8380.23556.82052850750sW4433 河南财经学院河南财经学院51775.40sWL1hhh 79. 251775.408286. 240

30、sWsWnnL1hhh111 。、各层样本量为各层样本量为7246323. 7sWsWnn53.23sWsWnn,45. 6sWsWnnL1hhh444L1hhh333L1hhh222 河南财经学院河南财经学院例:在例例:在例3.33.3中,样本量仍为中,样本量仍为n=550n=550,城镇居民与农村居城镇居民与农村居民年收入的标准差估计分别为民年收入的标准差估计分别为30003000元和元和25002500元,对城元,对城镇居民与农村居民抽样品均每户的费用比为镇居民与农村居民抽样品均每户的费用比为1 1:2 2,试,试求(求(1 1)城镇与农村两层比例分配样本量;()城镇与农村两层比例分配样

31、本量;(2 2)最优)最优分配的样本量。分配的样本量。解解:(:(1 1)按比例分配时,按比例分配时, (2 2)对于)对于NeymanNeyman分配,分配,。、各层样本量分别为各层样本量分别为47575475550863. 0nWn75550137. 0nWn2211 6 .15252/2500863. 0c/sW0 .4111/3000137. 0c/sW222111 6 .1936sWL1hhh 河南财经学院河南财经学院1176 .19360 .411550c/sWc/sWnnL1hhhh1111 。、各层样本量为各层样本量为433117433c/sWc/sWnnL1hhhh1222

32、河南财经学院河南财经学院4.4 4.4 样本总量的确定样本总量的确定1.1.在分层随机抽样中,影响样本总量在分层随机抽样中,影响样本总量n n的因素:的因素:(1 1)只讨论对总体参数的精度要求;)只讨论对总体参数的精度要求;(2 2)样本量的分配形式。)样本量的分配形式。2.2.在估计总体均值时,若精度要求给定,样本总量在估计总体均值时,若精度要求给定,样本总量n n的的确定公式:确定公式:nnwSWN1Vw/SWnVyV)1(hhL1h2hhL1hh2h2hst 其中其中时时)的上限为)的上限为(精度要求:精度要求:河南财经学院河南财经学院证明:证明:时时)的上限为)的上限为(精度要求为:

33、精度要求为:VyVst L1h2hhL1hh2h2hstNSWnSW)y(VY的方差为:的方差为:nnwSWN1Vw/SWnhhL1h2hhL1hh2h2h 其中其中由上式解得:由上式解得:nwn,nnwhhhh 设样本量的配置方式设样本量的配置方式VNSWwSWn1)y(VL1h2hhL1hh2h2hst 则则河南财经学院河南财经学院*V/ )SWN1V(V/ )w/SW(nVyVL1h2hhL1hh2h2hst 时时)的上限为)的上限为(精度要求:精度要求:hhWwa )比例分配:)比例分配:( L1h2hh0SWNV11nVw/SWnL1hh2h2h0 其中其中Nn1nnVSWn00L1

34、h2hh0 ,则,则河南财经学院河南财经学院 L1hhhhhhSWSWwb)奈曼配置:)奈曼配置:( L1hhhhhhhhc/SWc/SWwc)最优配置:)最优配置:( L1h2hh02L1hhh0SWNV11nn,VSWn则则)( L1h2hhL1hhhhL1hhhhSWN1Vc/SWcSWn)()(则则河南财经学院河南财经学院nnwSWN1udw/SWnd1y)2(hhL1h2hh221L1hh2h2hst 其其中中)(的的绝绝对对误误差差限限为为的的置置信信度度精精度度要要求求:nnwSWN1)uYr(w/SWnr1y)3(hhL1h2hh221L1hh2h2hst 其其中中的的相相对对

35、误误差差限限为为的的置置信信度度精精度度要要求求:河南财经学院河南财经学院 nnwSWN1YCw/SWnCy)4(hhL1h2hh2L1hh2h2hst 其其中中的的变变异异系系数数上上限限为为精精度度要要求求:河南财经学院河南财经学院例:某流水线生产了例:某流水线生产了15001500件产品,为估计产品的合格率,件产品,为估计产品的合格率,将产品按早、中、晚班分成三层。各班产量分别为:早将产品按早、中、晚班分成三层。各班产量分别为:早班班550550件,中班件,中班500500件,晚班件,晚班450450件。根据以往的情况,每件。根据以往的情况,每班合格率均在班合格率均在95%95%左右。若

36、要求以左右。若要求以95%95%的把握使估计量的的把握使估计量的绝对误差不超过绝对误差不超过2%2%,分别确定按比例配置和按,分别确定按比例配置和按NeymanNeyman配配置时总样本量和各层样本量。置时总样本量和各层样本量。解:解:456)96. 102. 0(05. 095. 0)/d()P1(PWn)1(222131hhhh0 按比例配置时,按比例配置时,35015004561456Nn1nn00 则则河南财经学院河南财经学院300. 01500/450W333. 01500/500W367. 01500/550W321 105350300. 0nWn117350333. 0nWn12

37、8350367. 0nWn332211 各层样本量分别为:各层样本量分别为:河南财经学院河南财经学院0475. 005. 095. 0QPW19.456)96. 1/02. 0(05. 095. 0)/d(QPWnNeynman)2(L1hhhh22212L1hhhh0 )(分配时分配时350n8 .349)96. 1/02. 0(15000475. 0119.456QPWNV11nn2L1hhhh0 则则河南财经学院河南财经学院105QPWQPWn117nQPWQPWn128nQPWQPWnNeynmanL1hhhh3333L1hhhh2222L1hhhh1111 别为:别为:分配时,各层样

38、本量分分配时,各层样本量分河南财经学院河南财经学院例:(续例例:(续例3.23.2)如果要求在置信度)如果要求在置信度95%95%下,相对误差不下,相对误差不超过超过10%10%,则按比例分配和,则按比例分配和NeymanNeyman分配时,总样本量分配时,总样本量分别为多少?分别为多少?解:解:5614.732850209650NYy22.2697sWstL1h2hh 333.193s24y556.8205s165y667.2166s105y722.1624s5 .39y244233222211 :各各层层样样本本均均值值及及方方差差为为河南财经学院河南财经学院179Nn1nn2 .190)

39、uyr(sWn100221stL1h2hh0 本量为本量为)按比例分配时,总样)按比例分配时,总样(110NsWuyrsWnNeyman)2(2hh221st2hh )()(分配时,总样本量为:分配时,总样本量为:河南财经学院河南财经学院3.3.在估计总体均值时,若总费用给定,精度最高时,样在估计总体均值时,若总费用给定,精度最高时,样本总量本总量n n的确定公式:的确定公式:已知已知,其中其中h0TL1hhh0TccC,nccC L1hc/SWc/SWnn:L1hhhhhhhh,对于最优分配有对于最优分配有 L1hhh0TnccC L1hL1hhhhhhhh)nc/SWc/SWc ( L1h

40、hhhL1hhhhc/SWcSWn河南财经学院河南财经学院 L1hhhhL1hhhh0TcSWc/SW)cC(n河南财经学院河南财经学院4.54.5 分层时的若干问题分层时的若干问题1.1.抽样效果分析抽样效果分析(1 1)分层随机抽样与简单随机抽样的比较)分层随机抽样与简单随机抽样的比较 在相同的样本量下,比较二者的估计量的方差的大在相同的样本量下,比较二者的估计量的方差的大小。分层随机抽样以比例分配为代表。小。分层随机抽样以比例分配为代表。 2srsSnf1yVY )(差为:差为:时,简单随机抽样的方时,简单随机抽样的方估计估计 2S1N)(分解:分解:总体单元指标的平方和总体单元指标的平

41、方和 L1i2hhpropSWnf1yVY)(差为:差为:时,分层随机抽样的方时,分层随机抽样的方估计估计 L1h2hhL1hN1i2hhYYNYYhi)()( L1h2hhL1h2hhYYNS1N)()( L1hN1i2hhiYY)(河南财经学院河南财经学院 L1h2hhL1h2hh2YY1NNS1N1NS)(较大时。较大时。当当)(hL1h2hhL1h2hhN,YYWSW 2srsSnf1yV )( L1h2hhL1h2hhYYWnf1SWnf1)( L1h2hhpropYYWnf1yV)()()(propyV 可以提高精度。可以提高精度。差异大”的原则分层,差异大”的原则分层,按“层内差

42、异小,层间按“层内差异小,层间,与层间方差无关。,与层间方差无关。)只涉及各层层内方差)只涉及各层层内方差(2hpropSyV河南财经学院河南财经学院(2 2)最优分配(以)最优分配(以NeymanNeyman为例)与比例分配在精度上的比较为例)与比例分配在精度上的比较 理论上讲,最优分配的精度应高于相同样本量的任何其理论上讲,最优分配的精度应高于相同样本量的任何其他分配。当然,也高于比例分配的精度。但最优分配在精他分配。当然,也高于比例分配的精度。但最优分配在精度上的改进有多大呢?度上的改进有多大呢? h2hh2hhhstoptSWN1SWn1yVY,Neyman)()(的方差:的方差:分配

43、下分配下在在 L1h2hhL1h2hhpropNSWSWn1)y(VY的方差:的方差:比例分配时,比例分配时, L1hhhL1h2hh2L1hhhL1h2hhstoptpropSWS,)SS(Wn1)SW(n1SWn1)y(V)y(V其中其中.Sh的效果越好的效果越好的差异越大,最优分配的差异越大,最优分配各层标准差各层标准差精度比较:精度比较:最优分配与比例分配的最优分配与比例分配的河南财经学院河南财经学院* *最优分配对于估计总体比例最优分配对于估计总体比例P P的情形较少使用。的情形较少使用。(除非特别小或特别大)(除非特别小或特别大)。配在精度上的收益较小配在精度上的收益较小的差异较小

44、,则最优分的差异较小,则最优分)的变化较小)的变化较小如取值在如取值在随随而而,hhhhhhhhhhhS7 . 03 . 0(PQPQPQP1NNS 河南财经学院河南财经学院2.2.层的划分层的划分()层的划分原则()层的划分原则一种原则是仅为满足估计部分(即子总体)参数的一种原则是仅为满足估计部分(即子总体)参数的需要或为了组织实施的便利。需要或为了组织实施的便利。另一种原则是尽可能提高抽样精度,减少估计量的另一种原则是尽可能提高抽样精度,减少估计量的方差。需要选择恰当的变量变量作为分层标志。方差。需要选择恰当的变量变量作为分层标志。 分层标志的选择:分层标志的选择:可以是调查指标的前期值可

45、以是调查指标的前期值可以是与调查指标有较大线性相关的指标。例可以是与调查指标有较大线性相关的指标。例如交通运输量的调查中,车辆的吨位是与其两个如交通运输量的调查中,车辆的吨位是与其两个主要指标:运量与周转量密切相关的。主要指标:运量与周转量密切相关的。(2 2)层权对估计量的影响)层权对估计量的影响 河南财经学院河南财经学院(3 3)最优分层如何确定各层的分点:下面介绍一种确定)最优分层如何确定各层的分点:下面介绍一种确定层界的快速近似法层界的快速近似法累积平方根法。累积平方根法。它是由它是由DaleniusDalenius和和HodgesHodges提出的。提出的。其做法:将分层变量的分布的

46、累积平方根进行等分其做法:将分层变量的分布的累积平方根进行等分来获得最优分层,所以成为累积平方根法。来获得最优分层,所以成为累积平方根法。例例:某地区电信部门在对利用电话上网的居民家庭安装:某地区电信部门在对利用电话上网的居民家庭安装ADSLADSL意愿进行调查时,以辖区内最近三个月有电话上意愿进行调查时,以辖区内最近三个月有电话上网支出的居民用户为总体(上网电话费为网支出的居民用户为总体(上网电话费为0.020.02元元/ /分分钟),并准备按上网电话费支出(记为钟),并准备按上网电话费支出(记为x x)进行分层,)进行分层,试确定各层的分点。试确定各层的分点。l居民家庭上网电话费支出分布如

47、下页表所示居民家庭上网电话费支出分布如下页表所示河南财经学院河南财经学院范围范围x x频数频数f f 累积累积0-50-56532865328255.5934255.5934255.5934255.59345-105-108924089240298.7306298.7306554.3241554.324110-1510-153612836128190.0737190.0737744.3977744.397715-2015-207752577525278.4331278.43311022.8311022.83120-2520-256240762407249.8139249.81391272.64

48、51272.64525-3025-302459124591156.8152156.81521429.461429.4630-4030-402458624586221.7476221.74761651.2081651.20840-5040-5095829582138.4341138.43411789.6421789.64250-6050-601576115761177.5444177.54441967.1861967.18660-7060-7080998099127.2714127.27142094.4572094.45770-8070-8056765676106.5458106.5458220

49、1.0032201.00380-9080-903453345383.1023583.102352284.1062284.10690-10090-1004256425692.260592.26052376.3662376.366100-150100-15012461246111.6244111.62442487.992487.99150-200150-20080080089.4427289.442722577.4332577.433200-250200-25036536560.4152360.415232637.8482637.848250-300250-300909030302667.8482

50、667.848300-350300-350353518.7082918.708292686.5572686.557350-400350-4005 57.0710687.0710682693.6282693.628400-450400-450121210.9544510.954452704.5822704.5824504507 78.36668.36662712.9492712.949ff河南财经学院河南财经学院 * *计算累积频数时计算累积频数时, ,应注意应注意x x的取值区间不是等长的。的取值区间不是等长的。 3030元以下,以元以下,以5 5元为间距,计算时,按元为间距,计算时,按 累积

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁