《第三章 分层随机抽样.ppt》由会员分享,可在线阅读,更多相关《第三章 分层随机抽样.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2022/12/201第三章第三章 分分层层随机抽随机抽样样 第一节 定义与符号第二节 简单估计量及其性质第五节 各层样本量的分配第六节 总样本量的确定第一节 定义与符号(复习)2022/12/202所有总体参数的估计量都采用下标“st”以示区别:2022/12/2032022/12/204 第二节 简单估计量及其性质 总体均值的简单估计总体均值的简单估计对对于分于分层层随机抽随机抽样样,总总体均体均值值 的的简单简单估估计计量量为为 2022/12/205第二节 简单估计量及其性质 总体总量的简单估计总体总量的简单估计对对于分于分层层随机抽随机抽样样,总总体体总总量量 的的简单简单估估计计量
2、量为为 2022/12/2062022/12/2078 第二节 简单估计量及其性质 总体比例的简单估计总体比例的简单估计 n总体比例P的估计为:n估计量的性质 对于一般的分层抽样,如果 是 的无偏估计(),则 是 的无偏估计。的方差为:910例例3.23.2 n在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据(单位:台),要估计该地区居民拥有家庭电脑的比例及估计的标准差。层层居民居民户总户总数数样本户拥有家庭电脑情况样本户拥有家庭电脑情况123456789101200000100010024000100000010375011000010104150010000000001
3、1 解:由上表可得,根据前面对各层层权 及抽样比 的计算结果,可得各层估计量的方差:因此,该地区居民拥有家庭电脑比例的估计为:估计量的方差为:估计量的标准差为:层层居民居民总数总数样本户拥有家庭电脑情况样本户拥有家庭电脑情况12345678910120000010001002400010000001037501100001010415001000000000对总体具有特定特征的单元总数估计2022/12/2012n对于分层随机抽样,总体中具有指定特征的单元总数A的简单估计量 ,n具有如下性质2022/12/2013第五节第五节 各层样本量的分配各层样本量的分配 在分层随机抽样中,总体均值估计量
4、的方差为:n实际工作中有不同的分配方法,可以按各层单元数占总体单元数的比例分配,也可以采用使估计量总方差达到最小、费用最小。2022/12/20142022/12/2015一、比例分配一、比例分配 n按各层单元数占总体单元数的比例,也就是按各层的层权进行分配.n对于分层随机抽样,这时总体均值的估计是自加权2022/12/2016总总体体中中的的任任一一个个单单元元,不不管管它它在在哪哪一一个个层层,都都以以同同样样的的概概率率入入样样,因因此此按按比比例例分分配配的的分分层层随随机机样样本本,估估计计量量的的形形式式特特别别简简单单。这这种种样样本也称为自加权的样本。本也称为自加权的样本。n总
5、体比例的估计是 2022/12/2017二、最优分配二、最优分配(一)最优分配(一)最优分配n在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差达到最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。2022/12/20182022/12/20192022/12/2020定理定理3.7的证明的证明n对所有层成立时,达到极小 常数2022/12/2021n简单线性费用函数,总费用由此得出下面的行为准则,如果某一层n单元数较多n内部差异较大n费用比较省则对这一层的样本量要多分配一些。2022/12/2022三三 Neyman(内曼)最优
6、分配(内曼)最优分配n如果每层抽样的费用相同,最优分配可简化为n这种分配称为Neyman分配。这时,达到最小。2022/12/20232022/12/2024例例3.43.4 某市有甲、乙两个地区,现要进行家庭收入的调查。令n=500,已知甲地区共有20 000户居民,乙地区共有50 000户居民;甲地居民和乙地居民年收入标准差估计分别为S1=2 500,S2=2 000;同时对甲地和乙地每户的平均抽样费用之比为23,请分别计算出在甲地和乙地进行比例分配、一般最优分配(考虑费用因素)以及内曼分配(不考虑费用因素)的样本量。2022/12/20252022/12/20262022/12/2027
7、四、某些层要求大于四、某些层要求大于100%100%抽样抽样时的修正时的修正 n 按最优分配时,有时抽样比f较大,某个层的 又比较大,则可能出现按最优分配计算的这个层的样本量 超过 的情况。n实际工作中,如果第 k 层出现这种情况,最优分配是对这个层进行100%的抽样,即取 ,然后,将剩下的样本量 按最优分配分到各层。2022/12/2028第六节第六节 总样本量的确定总样本量的确定 n令 当方差 给定时 2022/12/2029n当按比例分配时,n实际工作中,n的计算可以分为两步,先计算:n然后进行修正:2022/12/2030n当按Neyman分配时,2022/12/20312、精度要求是以精度要求是以 的绝对误差限的绝对误差限d(在给定的置在给定的置信水平信水平1-下下)的形式给出的的形式给出的2022/12/20322022/12/20333.精度要求以精度要求以 的相对误差限的相对误差限r(在给定的置信水在给定的置信水平平1-下下)的形式给出的形式给出2022/12/20342022/12/2035例3.72022/12/20362022/12/20372022/12/20382022/12/2039二、总费用给定时总样本量的确定n给定V时2022/12/2040给定C时