2023年《抽样技术复习题》.pdf

上传人:c****1 文档编号:93267534 上传时间:2023-07-01 格式:PDF 页数:4 大小:251.65KB
返回 下载 相关 举报
2023年《抽样技术复习题》.pdf_第1页
第1页 / 共4页
2023年《抽样技术复习题》.pdf_第2页
第2页 / 共4页
点击查看更多>>
资源描述

《2023年《抽样技术复习题》.pdf》由会员分享,可在线阅读,更多相关《2023年《抽样技术复习题》.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、抽样技术期末复习 1、设计效应(Deff)答:设计效应(deff)是由基什提出的,用来对不同抽样方法进行比较,其定义为:srsV(y)deffV(y),其中srsV(y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差。设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。如果 deff 1,则所考虑的抽样设计比比简单随机抽样的效率低。deff 对复杂抽样时确定样本量有很大作用,在一定精度条件下,简单随机抽样所需的样本量 n比 较 容 易 得 到,如 果 可 以 估 计 复 杂 抽 样 的 def

2、f,那 么 复 杂 抽 样 所 需 的 样 本 量 为:n=n deff。2、概率抽样 答:概率抽样也称随机抽样。概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。(2)每个单元被抽中的概率是已知的,或是可以计算出来的。(3)当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关。概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。从另一方面讲,也可以按照要求的精确

3、度,计算必要的样本单元数目。因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本。3、非抽样误差 答:非抽样误差是指除了抽样误差以外的,由于各种原因引起的误差。同抽样误差相比,非抽样误差有如下特点:(1)非抽样误差不是由于抽样的随机性带来的,所以在抽样调查中,它不可能随着样本量的增大而减小。(2)在抽样调查中,由于非抽样误差的影响,往往造成估计量的有偏。(3)有些非抽样误差难以识别和测定。(4)产生非抽样误差的渠道众多,成因复杂,对调查数据质量和估计结果的负面影响非常大。非抽样误差按其来源、性质的不同,可以分为抽样框误差、无回答误差和计量误差等三类。4、不等概率抽样 答:不

4、等概率抽样在抽样前赋予总体每个单元一个入样概率,当然这个入样概率是不相同的,否则抽样就成为等概率的抽样。不等概抽样的优点是大大提高估计精度,减少抽样误差,但使用它也有条件,就是必须要有说明每个单元规模大小的辅助变量来确定每个单元人样的概率,这在抽样及推算时都是必须的。不等概率抽样可以按样本单元是否放回分为放回不等概抽样和不放回不等概抽样。5、最优分配 答:在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下估计量的方差达到最小,或在给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。6、比率估计 答:比率估计(radio estimator)又称比估计,

5、在进行抽样调查时,目标量本身就是总体比率,这样对目标量的估计就叫做比率估计,也可用来提高估计量的精度,它是有偏的。7、试述分别比估计和联合比估计的比较 答:如果每一层都满足比率估计量有效的条件,则除非hR R,都有分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。实际使用时,如果各层的样本量都较大,且有理由认为各层的比率hR 差异较大,则分别比率佑计优于联合比率估计。当各层的样本量不大,或各层比率hR 差异很小,则联合比率估计更好些。8、试述设计效应在抽样设计中的应用。答:设计效应(

6、design effect,简称 deff)是指在相同样本量的条件下,采用特定的抽样设计(一般为较复杂的抽样设计)与不放回简单随机抽样简单估计量的方差之比,如果 deff1,则所考虑的抽样设计比简单随机抽样的效率低。设计效应是抽样调查中的一个重要参数,它可以表明特定抽样设计的估计效率;如果有设计效应的经验数据,也可以用于确定不同调查方式所需要的样本量,从而大大节约计算样本量的时间,因此倍受抽样调查设计人员的关注。9、有人认为“总体愈大,应抽的样本量也愈大”,请对此加以评价。答:这种说法是不正确的。因为,虽然在其他条件相同的条件下,样本量越大,抽样误差越小,但是从抽样误差与样本量的关系图可以看出

7、,抽样误差在开始时随着样本量的增大而显著减小,但经过一定阶段后便趋于稳定。也就是说,经过一定阶段后,用增大样本量的方式减少抽样误差一般是不合算的。当样本增大到一定能够程度,无论总体再大,抽样的精度都差不多。所以,这种说法是不正确的。10、(简单随机抽样的均值、比例估计和样本量的确定)某住宅区调查居民的用水情况,该区共有N=1000 户,调查了n=100 户,得y=12.5 吨,2s=1252,有 40 户用水超过了规定的标准。要求计算:1 该住宅区总的用水量及 95%的置信区间;2 若要求估计的相对误差不超过 10%,应抽多少户作为样本?3 以 95%的可靠性估计超过用水标准的户数;解:已知

8、N=1000,n=100,n 100f 0.1N 1000,2y=12.5 s 1252,1 估计该住宅区总的用水量 Y为:估计该住宅区总的用水量 Y的方差和标准差为:因此,在 95%的置信度下,该住宅总的用水量的置信区间估计为:即,我们可以以 95%的把握认为该住宅总的用水量在 5921 吨 19079 吨之间。2 根据题意,要求估计的相对误差不超过 10%,即 r 0.1,假定置信度为 95%根据公式:2 2 202 2 2 2t s 1.96 1252n 3078r y 0.1 12.5 由于 0n3.078 0.05N,所以需要对0n 进行修正:若要求估计的相对误差不超过 10%,应抽

9、不少于 755 户作为样本。3 以 95%的可靠性估计超过用水标准的户数;令超过用水标准的户数为 A,样本中超过用水标准的户数为 a=40,估计超过用水标准的比例P 为:估计超过用水标准的比例 P 的方差和标准差为:在 95%的可靠性下,超过用水标准的比例 P 的估计区间为:因此,我们有 95%的把握认为,超过用水标准的比例 P 在 30.85%49.15%之间,超过用水标准的户数的点估计为:1000 40%400 户,超过用水标准的户数在1000 30.85%户1000 49.15%户之间,即 309 户 492 户之间。12、(内曼分配和按比例分配的均值和比例估计)有下列数据 层 1 0.

10、35 3.1 2 0.54 2 0.55 3.9 3.3 0.39 3 0.1 7.8 11.3 0.24 的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较如果则所考虑的抽样设计比简 用在一定精度条件下简单随机抽样所需的样本量比较容易得到如果可以估计复杂抽样的那么复杂抽样所需的样本量为 抽样方法具体说来概率抽样具有以下几个特点按一定的概率以随机原则抽取样本每个单元被抽中的概率是已知的或是设 1000 n 1 采用按比例分层抽样的方法估计Y和P并计算其标准误;2 采用奈曼分配的方法估计Y和P并计算标准误;解:1 根据题中已知条件,采用按比例分层抽样的方法估计Y为:估计

11、Y的方差和标准误差为:估计P及其方差和标准误差为:2 采用 Neyman分配的方法估计Y和P的方法和与 1 是一样的,即 但是采用 Neyman分配估计Y和P的方差的方法不同,分别为:13、(两阶段抽样)某市为了了解职工收入情况,从该市的 630 个企业中随机抽取了 5 个企业,在中选的企业中对职工在进行随机抽样,有关数据如下:企业号 iy(元)1 520 10 328 400.056 2 108 10 400 301.134 3 1400 20 310 1303.158 4 1200 20 370 1205.786 5 9000 100 420 4200.000 其中,iM为企业职工数,im

12、为样本量;iy为样本均值,22is为样本方差。试估计该市职工平均收入及标准差。解:已知:N=630,n=5,2i i i 2iM,m,y,s 估计该市职工的平均收入为:估计该市职工平均收入的方差及标准差为:因此,估计该市职工平均收入为 398元,标准差为 26.71669 元 14、(比率估计)(14)某养兔场共有 100 只兔子,上月末称重一次对每只兔的重量作了纪录,并计算平均重量为 3.1 磅,一个月后随机抽取 10 只兔子标重如下:序号 1 2 3 4 5 6 7 8 9 10 上次 3.2 3 2.9 2.8 2.8 3.1 3 3.2 2.9 2.8 本次 4.1 4 4.1 3.9

13、 3.7 4.1 4.2 4.1 3.9 3.9 1 估计这批兔子较上月末增重的比率及其标准误差;2 估计现有兔子的平均重量及其标准误差;3 将比估计方法与均值估计法进行比较,哪一种方法效率高?分析其原因。解:1 已知:N=100,n=10,设 X,Y分别代表上月兔子总重量和本月兔子总重量,则 X=3.1,n 10f=0.1N 100。由表中数据可得:因此,对这批兔子较上月末增重的比率估计为:R 方差的估计为:R 标准误差的估计为:2 对现有兔子的平均重量的比率估计为:Ry 方差的估计为:Ry 标准误差的估计为:3 对现有兔子的平均重量的均值估计为:的估计量的方差与同样样本量条件下的不放回简单

14、随机抽样简单估计量的方差进行比较如果则所考虑的抽样设计比简 用在一定精度条件下简单随机抽样所需的样本量比较容易得到如果可以估计复杂抽样的那么复杂抽样所需的样本量为 抽样方法具体说来概率抽样具有以下几个特点按一定的概率以随机原则抽取样本每个单元被抽中的概率是已知的或是y 方差的估计为:因此,得到现有兔子平均重量的比率估计量设计效应的估计为:对于本问题,均值估计方法的效率比比率估计方法的效率要高。原因是:比率估计是有偏的,当样本量足够大时,估计的偏倚才趋于零,而本问题中的样本量较小,使用比率估计量时不能忽视 其偏倚,所以无法保证估计的有效,使得估计效率比均值估计方法的效率低。的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较如果则所考虑的抽样设计比简 用在一定精度条件下简单随机抽样所需的样本量比较容易得到如果可以估计复杂抽样的那么复杂抽样所需的样本量为 抽样方法具体说来概率抽样具有以下几个特点按一定的概率以随机原则抽取样本每个单元被抽中的概率是已知的或是

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁