《抽样调查-2简单随机抽样.pptx》由会员分享,可在线阅读,更多相关《抽样调查-2简单随机抽样.pptx(80页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Chap 2 Chap 2 简单随机抽样简单随机抽样2.2 简单估计法(SE) 2.1 定义与符号抽样调查 2.5 样本量的确定 2.6 其它相关问题 2.3 比率估计量 2.4 回归估计量4/24/20221抽样调查2.1 定义与符号一、定义与符号 (一)定义上述抽样就称为不放回简单随机抽样 定义定义2.12.1:设有限总体共有N个单元,一次整批抽取 n个单元 使得每个单元被抽中的概率都相等,任何 n个不同单元的组合(样本)都有相同的概率被抽中,这种抽样方法称为简单随机抽样法,所抽到的样本为简单随机样本。 4/24/20222抽样调查 定义定义2.2:(在具体实施过程中,)从总体中逐个等概率
2、抽取单元(每次抽取到尚未入样的任何一个单元的概率都相等),直到抽满 n个为止。如果每次抽中一个单元,然后放回总体,重新抽取。这样一个单元有可能被重复抽中,故又称重复抽样重复抽样。1.nnNN所有可能样本有个,每个样本抽中的概率为4/24/20223抽样调查 定义定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的 CNn 个样本,从CNn 个样本随机抽取一个样本,使每个样本被抽中的概率都等于 1/CNn.上述三中定义其实是完全等价的,而定义定义2.2在实际中容易实施 。4/24/20224抽样调查例2.1 设总体有5个单元(1,2,3,4,5),按有放回简单随机抽样
3、的方式抽取容量为2的样本,则所有可能样本为2552个,如表2.1。 表2.1 放回简单随机抽样所有可能样本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,54/24/20225抽样调查例2.2 上述总体按不放回简单随机抽样方式抽取容量为2的样本,则所有可能样本为1025C个,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2 不放回简单随机抽样所有可能样本4/24/20226抽样调查(二)样本分布与符号从总体,21NNYYY抽样单元。假设顺序被抽中的样本单元的号码为
4、niii,21(入样号码),则样本为),(21niiiYYYy12(,)ny yy,称Nnf 为抽样比(Sampling fraction)。中逐个不放回抽取n个作为随机变量样本有什么分布呢?4/24/20227抽样调查1 y1,yn同分布但不相互独立,其共同分布列为 NYyPi11YYNyENi111)(2211)(1)(YYNyDNi2 ( yi, yj)的联合分布列均同(y1, y2 ),0) 1(1,21jijiNNYyYyPji4/24/20228抽样调查表2.3符号NNiYYYYY211NYYYYNYNNi/ )(1211) 10( ,11orYYNNAPiNiXYXYXYRNiN
5、i1122121)(11NNYYNSNinniyyyy211nyyyyynni/ )(211) 10( ,11oryynnapiaixyxyrnini11212)(11yynsni总体参数样本统计量222YSC4/24/20229抽样调查二、抽样方法(一)抽签法 制作N个外形相同的签,将它们充分混合,然后一次抽取n个签,或一次抽取一个但不放回,抽取n次得到n个签。则这n个签上所对应号码表示入样的单元号。例如例如:某中学为了解学生身体素质的基本状况,从全校N1200人中抽取一个简单样本n100人进行检查。4/24/202210抽样调查1 随机数表(二)随机数法如上例,N1200,则在表中随机连续
6、取四列,顺序往下,选出前面100个不同(不放回抽样)的00011200之间的数字。如果不够100个,可随机再取四列,同样操作,直至抽取100个止。 4/24/202211抽样调查Simple random sampling4/24/202212抽样调查571724208870098113332690229959439094960733883876802892315659098394581789405707437795067344106098711915859745774279175889116071159601796244981700967119006144952956149556783816
7、947228499319430367448312868071965101777298394983358752305662427549938091950582000790684555286776489805668440950862164816117646241643551394057518341218259744656958371041125142917477366391133824807673151487243567038453631545811638629945764885975654171526651678796730996072832063124312389823683108530403
8、875246018819905646747088460133188163744621455123094298319538723917074219786988092722011524321100481250524316181396413697099522535015843168149254052346349168020483152207698241810116101527170463146091507160502292125930795794348813211711209171549881681270050137484992782875180855020351091055309107133643
9、96566072554770214627922705920349089269853061756122176825182394768750612840774138754107091907430568196756348141598504321681782249946375454720185224384614452830953086330804968698087594561107556245878875371626648645498638964835346055750031758290562230237777954187026300Table of random numbers4/24/202213
10、抽样调查2 随机数骰子 随机数骰子是由均匀材质制成的正20面体,每个面上刻有一个09的数字,且每个数字只出现在两个面上。要产生一个m位数的随机数(如m4,N1200),则将m(m=4)个颜色不同的骰子盒中,并规定每个颜色代表的位数,盖上盖子,充分摇动盒子后,打开读出各色骰子的数字,即可得一个随机数。重复上述过程,直至产生了n个满足条件的随机数。4/24/202214抽样调查3 利用统计软件直接抽取法 大部分统计软件都有产生随机数的功能,快捷方便。不过产生的是伪随机数,有一定循环周期的。简单介绍一下利用EXCEL产生随机数的方法. 4/24/202215抽样调查4/24/202216抽样调查4/
11、24/202217抽样调查4/24/202218抽样调查2.2 简单估计法(SE)一、总体均值的估计(一)简单估计定义 .(2.6) Y 11niiyyn(二)简单估计量的性质 引理引理2.1 从大小为N的总体中抽取一个样本容量为n的简单随机样本,则总体中每个特定的单元入样的概率为n/N,两个特定单元入样的概率为n(n1)/N(N-1)。 4/24/202219抽样调查 引理引理2.2从大小为N的总体中抽取一个样本容量为n的简单随机样本。若令: 1iiYao入样否则 1inE afN 21in NnV affNN 13 cov,1,11ijffnna aijN NNN 则:4/24/20222
12、0抽样调查(二)简单估计量的性质 定理2.1上述简单估计是无偏的,即 E yY 定理2.2 上述简单估计的方差(均方误差)为:221( )NnfV ySSnNn.(2.12/2.18) 4/24/202221抽样调查证明(P35证法1对称证法): 211()niEyYn21()()nijijE yYyYn1221(1) ()()n nE yYyYn2( )V yE yY212 )(1niYyEn2211niE yYn21211nE yYn11()V yn11()()(1)NijijnYYYYnN N211 1()NiYYn N211111()()() (1)NNNijinYYYYYYnN N2
13、211NnSSnNnN222111()NnfSSSnNnNn为0注意样本分布4/24/202222抽样调查推论2.7)(yV的无偏估计为21snf.(2.25) 证明:只须说明样本方差是总体方差的无偏估计即可。 )(11122niyyEnsE211() 1niEyYYyn )(2)()(111122nniiYyYyYynYyEn)(1122YynEYyEni注意)()(1YynYyni11221YynEYynEn)()(11yVyVnn)(11212SnNnNYYNnnNi22211SSnNnNSNNnn4/24/202223抽样调查 例2.3 从某个N100的总体重抽取一个容量n=10的简单
14、随机样本,要估计总体平均水平,并给出置信度为95的置信区间估计。如表2.4序号iiy1 2 3 4 5 6 7 8 9 104 5 2 0 4 6 6 15 0 8表2.4 简单随机样本指标 4/24/202224抽样调查4/24/202225抽样调查(三)有放回简单随机抽样的简单估计量11niyyn11( )V yD yn12211NNSSnNn21211)(snsnNNyvN由于1,nfNN故有放回抽样的精度低于不放回抽样的精度。4/24/202226抽样调查 说明:1 抽样调查中的估计量与传统数理统计中估计量的区别(见表2.5)表2.5 抽样理论与传统数理统计关于样本均值性质异同比较nN
15、CY11niyyn11niyyn E yY E y221( )NnfV ySSnNn2( )V yn2()V X抽样理论数理统计理论假设样本之间不独立,所以可能样本最多 个,欲估计总体特征为 ,当nN时可以求出样本之间独立,所有可能样本最多为无限多个;欲估计总体特征为总体(一般是随机变量X)期望,一般不能通过样本求出 符号、定义期望方差4/24/202227抽样调查 2 总体方差一般也是未知的,故计算估计量方差(估计)值时总是用样本方差直接去估计它,因为该估计无偏,故这样做相对是合理的。 3 对于无限总体的简单随机抽样(或有限总体有放回简单抽样)估计中由于N一般很大, 即从有限总体抽样得到简单
16、随机样本均值得方差是从无限总体抽样得的独立样本均值的方差的1f 倍,要小些,这意味着对同等样本量,不放回简单随机抽样的精度高于有放回的。 由于样本点不会重复,样本量相同时所包含的有效样本点更多,因此信息更多,效果当然好些。 1f又被称为有限总体校正系数。2212111)(SnSnSnNNyVN4/24/202228抽样调查 4样本容量n越大,估计量方差越小。当样本容量一定时,总体方差越大,估计量方差越大。由于总体方差是固定的,因此在简单随机抽样的条件下,要提高估计量精度就只有增加样本容量了。但增加样本容量也会带来计算量骤增和成本增加,所以是矛盾的一对,需要找到合适的平衡点。4/24/20222
17、9抽样调查二、总体总量的估计(一)简单估计量niynNyNyY1.(2.7) (二)估计量性质 推论2.1 2.4 2.8YyEYE 222)1 ()()(SnfNyVNYV222)1 ()()(snfNyvNYv.(2.13) .(2.19) .(2.26) 4/24/202230抽样调查例2.4(续例2.3)估计总体总量,并给出置信度为95条件下的估计相对误差 。三、总体比例的估计 将总体分为两类,一类具有该特征的单元A个,另一类不具有该特征的单元NA个 。调查的目的是估计NAP 或A NiiYi, 2 , 101,否则个总体单元具有该特征第AYYNi1PNYY/若令则4/24/20223
18、1抽样调查(一)估计量的定义 11niayypnnNpyNy(二)估计量性质 推论2.2 2.5 2.9 对于简单随机抽样,p是P无偏估计。 p的方差为 PQNNnfNnNnPQpV111)(方差的无偏估计 pqnfpv11)( (2.27) (2.20)4/24/202232抽样调查例2.5某超市开张一段时间后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。该超市与附近一个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个大小为n=200人的样本。调查发现对购物表示满意或基本满意的居民有130人,估计对该超市购物环境持肯定态度的居民的比例,并在置信度95%条件下,给出估
19、计的绝对误差和置信区间,假设抽样比可以忽略。4/24/202233抽样调查1111(,),(,)( , )( ,),(,)NNNnnX YXYx yx yxy设二维总体,样本为,如前记号:11()()1nxyiisxxyyn样本协方差xyxyxyrsss样本相关系数1cov( , )()();XYfx yE xXyYSn定理2.3:(1)(2)样本协方差是总体协方差的无偏估计. (2.22,2.23) (2.29) XYxySsE考虑二维总体4/24/202234抽样调查证明:仍采用对称法(P40证法1)(1)()()nijijExXyY122(1)()()n nE xXyYn11()()(1
20、)NijijnXX YYnN N)(),cov(YyXxEyx )()(1112nnjiYyXxEn21 ()()iiExXyYn111()()E xXyYn注意样本分布11 1()()NiiXX YYn N1XYNSnN11111()()()()(1)NNNijiinXX YYXX YYnN NXYXYSnNnSnNN11XYSnf1注意为04/24/202235抽样调查 (1)证法2: (构造性)V uUVyxYXV xXiiiuxy,u U分别是该变量的样本均值和总体均值。,uyx V u VyYxXV yY 2cov,yYxX 1cov,2y xV uV yV x于是222112uyx
21、fSSSn2111121NiiifyxYXnN2211NNiiiiyYxX111221NiiifyYxXnNXYSnf1UYXuU是 简单估计展开4/24/202236抽样调查(2)1()()niixXXxyYYy11()()1niiExxyyn()()1nE xXyYn1()()niixxyy)()(1YyXxnYyXxniixyE s11()()1niiE xXyYn11()()1nE xXyYnXYNiiSNnnNYYXXNnn) 1()(111XYXYXYSSNnnNSNnNn) 1() 1() 1(注意)()(1YynYyni11XYnfSnn由(1)4/24/202237抽样调查
22、一、概念与作用一、概念与作用 (一)概念(一)概念 比率(比率(Ratio)与比例()与比例(Proportion)区别)区别 (二)作用(二)作用2.3 比率估计量及其性质apniixyr一种场合是待估的总体参数R是两个变量比值。如人口密度,恩格尔系数等。 分子分母均为r.v.分子为r.v.4/24/202238抽样调查 另一种应用场合,虽然待估的参数是某个研究变量的均值或总体总量,它本来可以通过样本均值加以估计,但是为了提高估计的效率,它通过引进一个辅助变量xi ,来计算比率,即 iixyr再通过这一比率乘以总体已知的辅助变量均值或总量来达到估计的目的。 4/24/202239抽样调查 二
23、、应用条件二、应用条件 (1)辅助变量(auxiliary variable)资料易得或已知 (2)辅助变量与目标变量之间存在高度相关性且相关 性稳定。 (3)样本量一般要求比较大三、简单随机抽样下的比率估计三、简单随机抽样下的比率估计4/24/202240抽样调查 (一)定义(一)定义 比率估计量(比率估计量(ratio estimator)又称比估计)又称比估计。iixyrRxyiRiyyYXXrXxxRNrXNy (2.30) (2.31) iRRiyyYyXXrXxx4/24/202241抽样调查 (二)比率估计的性质(二)比率估计的性质 E RE rR引理引理2.3RE yYXRRE
24、 YYXR定理定理2.6推论推论2.112.3RRYyrX证:,由引理易知4/24/202242抽样调查引理引理2.4 V RV r证:当n充分大时 RxyRrxRyXxxRy1 2V rE rR1,iiiGYRXiN 令,xRyg0XRYG 221V rE yRxX221E gGXNiiGGNnfX1221111NiiiRXYNnfX1221111221111.(2.35)1NiiifYRXXnN221E yRxX221E gX 21V gX0gGG 是 的简单估计4/24/202243抽样调查定理定理2.7NiiiRXYNnf12111()RV y21.(2.37)dfSn22111.(2
25、.36)1NiiifNYRXnN()RV Y2.4RYNXr证:,由引理易知。推论推论2.12/RYYN证:,由定理2.7显然。4/24/202244抽样调查0GYRX2111NiiiYRXNNiiiXRYRXYN1211yxxyRSSRS22222222yxyxSR SR S S 2222112.(2.38)yxyxfV rSR SR S SXn22212RyxyxfV ySR SR S Sn222212RyxyxfV YNSR SR S Sn222211( )2. 2.43yxyxfv rsr srsXn22221 1( )2. 2.44yxyxfv rsr srsxn或因而方差估计有两种
26、思路(2.39)(2.40)4/24/202245抽样调查例例2.6i123456均值XiYi011331151882910464.518表4.1 假设的总体数据4/24/202246抽样调查解:i样本简单估计比率估计123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269
27、219.218.7517.686444/24/202247抽样调查4/24/202248抽样调查 解152112.8234515RRiRiV yyE y 15111815iiE yy151117.6864415RRiiE yy17.68644 180.31356RRB yE yY 1521197.8666715iiV yyE y222.823450.313562.92177RRRMSE yV yBy 4/24/202249抽样调查例例2.7(P51例例2.4) 在二十世纪90年代初的一项工资研究中,人们发现IT行业中,从业者的现薪与起薪之间相关系数高达0.88,已知某IT企业474名员工的评鉴
28、起薪为17 016.00元/年,现根据对100个按简单随机抽样方式选出的员工现薪的调查结果,估计该企业员工的现薪平均水平。数据如下:现薪样本均值y=38 482.56, 起薪样本均值x=18 642.602453189043.23y现薪样本方差s, 2102802243.9x起薪样本方差s2014300yxs样本协方差4/24/202250抽样调查解:简单估计 38482.50Yy 213575795.404yfv ysn ,38111.87,38853.13yt v yyt v y95的置信区间 比率估计 2.064223874Rry x35124.833RRYyrX 95的置信区间 222
29、222112,233780.31821,36469.34868RyxyxRyxyxffytsr srsytsr srsnn4/24/202251抽样调查 例例2.8某县在对船舶月完成的货运量进行调查,对运管部门登记的船舶台帐进行整理后获得注册船舶2 860艘,载重吨位154 626 吨。从2 860艘船舶中抽取一个n10的简单随机样本。调查得到样本船舶月完成的货运量及其载重吨位如表4.2(单位:吨)要估计该县船舶月完成货运量 iiyixiiyix1234578015001005376600100505010206789102170182314501581370120150802050表4.2样
30、本船舶货运量及载重吨位数据 4/24/202252抽样调查 解4/24/202253抽样调查4/24/202254抽样调查niirnr11niiixyn11 rEniirnE11 iE rNiiiXYN11R111NiiYRYXNX11NiiYNX rER 1111NNiiiiYR XNXNX1111NNiiiiiR XR XNXNX11NiiiRXXNX 11NiiiE rRXXNXR 11 111NiiiNE rRXXNX N (三)消除比率估计偏倚的方法(三)消除比率估计偏倚的方法R)1,(1NiiiiiRNRXYR4/24/202255抽样调查HRRr1 11NnyrxNXn 哈特利哈
31、特利-罗斯罗斯(Hartley-Ross,1954)提出的估计量 (2.51) rxS111NiiiRRXXN111NiiiRXXN01NiiXXRrxs111niiirrxxn111niiir xxn1111nniiiiirxrxn1nyr xnrxS 的无偏估计为:于是可以令4/24/202256抽样调查事实上: 1niiirrxx1niiirRRrxXXx1niiirRxXxXrRn111niiiErrxxnrxE s111niiiE rRxXnxXrREnn1XxRrEnn111rxSnNnNnn1NiiXXRRNnn111rxSNnnN1rxS 11,iix r d x r4/24/
32、202257抽样调查例2.9 4/24/202258抽样调查 21ySnfyVxyxyRSSRSRSnfyV212220222xyxSSRSRYSXSyx/21yxCC21四、比率估计的效率四、比率估计的效率1/24/24/202259抽样调查2.4 回归估计量及其性质 比率估计成为最优线性估计的条件:比率估计成为最优线性估计的条件:(1)样本点(yi,xi)形成过原点的直线(2)yi对直线的偏差与xi成比例4/24/202260抽样调查一、回归估计的定义一、回归估计的定义. 2.52lryyXxyxX. 2.53lrYNy二、是已知常数时(记为0) 定理定理2.8 YyElrlrE YY22
33、20012. 2.55lryxxyfV ySSSn22220012lryxxyfV YNSSSn4/24/202261抽样调查Q:“0取何值时,回归估计量的精度最高,即最 小?”022iixyxiYYXXSBSXX定理2.9:三、由样本回归系数计算得到三、由样本回归系数计算得到 2xyxssb 2xxxxyyiii (2.56 Y对X回归系数) 定理定理2.10 这时的均值估计量是渐近无偏估计 注意b并不是B的无偏估计4/24/202262抽样调查 定理定理2.11 lrlryVyMSE2211ySnf2221xySBSnf它的一个近似估计为: lryv21esnfniiixxbyynnf12
34、211niiixxbyyn1221niiniixxbyyn122122122212yxnsb sn2es2,xyxxyxyB S SS S S4/24/202263抽样调查 例2.10 续例2.82xyxssb 8195.1011.216122.23382lryyb Xx652860154626819.102 .112389.1004287398289.100428602221xxysbsnn2es210 1421179.07 10.81952161.11189218.52102 lrYv221esnfN52.1892182860110128602111054232. 1 lrYs 39272
35、4lrYvlrlryNY 4/24/202264抽样调查 四、精度比较四、精度比较 21ySnfyVxyxyRSSRSRSnfyV212222211lryfV ySn1回归估计总优于简单估计,除非=0 2比率估计优于简单估计的条件 12xyCC3回归估计优于比率估计的条件是 xyxySSRSRS22222 五、多变量回归估计(略五、多变量回归估计(略 )02yxSRS20BR或4/24/202265抽样调查2.5 样本量的确定一、总体均值情形1 给定标准误差上限,求满足条件2)()(yVyMSE的最小n 202:Sn 有放回001/nnnN不放回:4/24/202266抽样调查 2 给定绝对误
36、差上限d及信度1,求满足条件1|dYyP的最小n有放回2220t Snd,不放回 22022201/nNt SnnNNdt S3 给定相对误差上限r及信度1,求满足条件1rYYyP的最小n22220t SnY r22tCr220222201/nNt SnnNNr Yt S有放回不放回 4/24/202267抽样调查给定相对标准误差上限 ,求满足条件 22)(YyV的最小n.222220CYSnNnnn/100放回不放回00.05nN 一般则可以忽略。例2.6 在例2.3中,如果要求以95%的把握保证相对误差不超过10%,样本量应该取多少? 4/24/202268抽样调查4/24/202269抽
37、样调查二、总体总量情形 作业 考虑各种情行的公式例 欲估计一个农村的每月平均副业收入,已知该村共有1000户农户,月副业收入的标准差不超过300元。(1)现要求置信度为95%,估计每户月副业收入的误 差不超过50元,应抽取多少户作为样本?(2)若每户调查费用为15元,调查管理费用为800元, 该项调查预计费用是多少?4/24/202270抽样调查例 如果上例目的是要估计全村1000户一月的副业总收入,允许总量的误差为40000,置信度为95%,应抽取多少样本? 三、总体参数P的情形1)(NnNnPQpV( )V y PQNNS122S 四、总体参数的预先估计4/24/202271抽样调查(1)
38、根据以往的经验数据 例如对同类问题获得过一个样本量n0为的简单随机样本,并且已知在一定置信度下(比如95%),该调查对总体均值(或总量)估计的相对误差上限为r0,则在相同的置信度下,如果希望本次调查的相对误差上限为r,则在抽样比可以忽略的情况下,可以近似地计算出本次调查所需的样本量: 0220nrrn 作业 证明上述结论4/24/202272抽样调查(2)在正式调查前进行试点调查,根据试点调查的 结果作出估计,或者采用两步抽样 (3)没有同类调查经验,又不能进行预调查, 则只能通过有经验的专家作一些定性分析, 对总体变异系数C(比较稳定)作出估计。 (4)注意:针对总体参数为 时情形 当估计P
39、0.5,则选取较小的P,如若估计P为0.6,0.8则选取P为0.6 若对P一无所知则取P=0.5。4/24/202273抽样调查 例2.7 某销售公司希望了解全部3000家客户对公司的满意度,决定用电话调查一个简单随机样本。这时销售公司希望以95的把握保证客户满意度比例P在样本比例p10,p+10范围内,但对总体比例P无法给出一个大致范围。这时调查多少个客户,才能保证满足要求?4/24/202274抽样调查2.6 其它相关问题一、逆抽样比例P是稀有事件的比例,一般P0.2 事先给定一个正整数m,然后逐个随机抽取样本,n个单元。 直到抽到m个所考虑特征的单元为止,设共取了11mPp11nmp4/
40、24/202275抽样调查 事实上1()1n mmE pPnn 1(1)!1 (1)!()!mn mn mmnP QnmnmmnmmnmnQPCP122PQPCPklkklkl111, 1mknl利用负二项分布的分布列之和为1 4/24/202276抽样调查mnmmnOPmnmnnmpE)!()!1()!1() 1() 1(222mnmmnmnOPCPmm233221212mPm22()( )V pE pE p2221122mPPPmmPpVpCV)()(21m这样给定了相对标准误差后,就可以确定m 2111nn且接近与4/24/202277抽样调查二、设计效应(Design effect)(L.Kish)()(yVyVdeffsrsdeffnn4/24/202278抽样调查 通常的值因为总体方差未知而事先无法得知,此时需注意在经费允许的前提下,样本量取值应坚持保守原则,尽量大一点,以便留有余地。例如后续的分层抽样的deff1,而取为1. 实际上,我们在调查时无法保证在每个被抽中的样本点上都能如愿地获得有效信息。例如不是每个人都愿意接受访问,也不是每个人都能按要求提供真是答案,尤其当问题涉及隐私或其它敏感内容时,所以必须考虑有效回答率。如估计有效回答率为r,则需再调整样本量为n/r.4/24/202279抽样调查宏村宏村4/24/202280