《第8章抽样调查理论与方法.电子教案教学课件.ppt》由会员分享,可在线阅读,更多相关《第8章抽样调查理论与方法.电子教案教学课件.ppt(78页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2022-5-30统计学第8章抽样调查理论与方法8-1统计学统计学主编:主编:费宇费宇,石磊,石磊2022-5-30统计学第8章抽样调查理论与方法8-2第第8章章 抽样调查理论与方法抽样调查理论与方法F8.1 抽样调查的意义抽样调查的意义F8.2 抽样调查的基本概念抽样调查的基本概念F8.3 抽样误差抽样误差F8.4 抽样方案设计抽样方案设计F8.5 样本容量的确定样本容量的确定2022-5-30统计学第8章抽样调查理论与方法8-38.1 抽样调查的意义抽样调查的意义F8.1.1 抽样调查的概念抽样调查的概念F8.1.2 抽样调查的作用抽样调查的作用F8.1.3 抽样调查的应用领域抽样调查的应
2、用领域2022-5-30统计学第8章抽样调查理论与方法8-48.1.1 抽样调查的概念抽样调查的概念F统计调查统计调查:是获取数据资料的一种重要手段,:是获取数据资料的一种重要手段,它又分为全面调查与非全面调查两类。它又分为全面调查与非全面调查两类。 全面调查全面调查:普查普查 非全面调查:非全面调查:又称为抽样调查,它是指从又称为抽样调查,它是指从研究对象的全体(总体)中抽取一部分单元研究对象的全体(总体)中抽取一部分单元作为样本进行观察,并根据观察结果来推断作为样本进行观察,并根据观察结果来推断全体,以此达到对全体目标量的了解。这是全体,以此达到对全体目标量的了解。这是广义的抽样调查的概念
3、。广义的抽样调查的概念。例:调查北京市民例:调查北京市民对出租车行业的满意度调查对出租车行业的满意度调查2022-5-30统计学第8章抽样调查理论与方法8-5抽样调查的分类抽样调查的分类F依据样本抽取的同,抽样可以分为非概率抽样和概依据样本抽取的同,抽样可以分为非概率抽样和概率抽样两类。率抽样两类。 简简单单随随机机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽样样抽抽样样方方式式2022-5-30统计学第8章抽样调查理论与方法8-6非概率抽样非概率
4、抽样(non-probability sampling) 与概率抽样相对的一种抽样。又称非随机抽样,是指抽样与概率抽样相对的一种抽样。又称非随机抽样,是指抽样时不遵循随机原则,而是按照研究人员的主观经验或其他时不遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法。条件来抽取样本的一种抽样方法。 问题:问题: (1) 其效果好坏依赖于抽样者的主观判断能力和经验其效果好坏依赖于抽样者的主观判断能力和经验 (2) 无法计算和控制抽样误差。无法用样本的量化数据来无法计算和控制抽样误差。无法用样本的量化数据来推断总体。推断总体。 2022-5-30统计学第8章抽样调查理论与方法8
5、-7便利抽样便利抽样F是根据调查者的方便与否来抽取样本的一种非概是根据调查者的方便与否来抽取样本的一种非概率抽样方法。典型的形式是率抽样方法。典型的形式是“拦截式拦截式”调查。调调查。调查查过程中由调查员依据方便的原则,自行确定入过程中由调查员依据方便的原则,自行确定入抽样本的单位抽样本的单位调查员在街头、公园、商店等公共场所进行拦调查员在街头、公园、商店等公共场所进行拦截调查截调查厂家在出售产品柜台前对路过顾客进行的调查厂家在出售产品柜台前对路过顾客进行的调查F优点:优点:容易实施,调查的成本低容易实施,调查的成本低F缺点:样本单位的确定带有偶然性,样本无法代缺点:样本单位的确定带有偶然性,
6、样本无法代表有明确定义的总体,调查结果表有明确定义的总体,调查结果无法根据样本信无法根据样本信息对总体进行数量特征的推断,样本不适合描述息对总体进行数量特征的推断,样本不适合描述性研究和因果关系研究性研究和因果关系研究 2022-5-30统计学第8章抽样调查理论与方法8-8判断抽样判断抽样F是一种凭研究人员的主观意愿、经验和知识,从总是一种凭研究人员的主观意愿、经验和知识,从总体中选择具有典型意义和代表性的样本点构成样本体中选择具有典型意义和代表性的样本点构成样本作为调查客体的一种非概率抽样方法。作为调查客体的一种非概率抽样方法。 一般选择一般选择“平均型平均型” 、“众数型众数型”、“特殊型
7、特殊型”单元作为样本单元作为样本F样本量小及样本不易分门别类挑选时有其较大的优样本量小及样本不易分门别类挑选时有其较大的优越性越性F由于其估计精度严重依赖于研究者对调查对象的了由于其估计精度严重依赖于研究者对调查对象的了解程度、判断水平和对结果的解释情况,所以,一解程度、判断水平和对结果的解释情况,所以,一般不轻易地用于对总体进行数量方面的判断般不轻易地用于对总体进行数量方面的判断2022-5-30统计学第8章抽样调查理论与方法8-9配额抽样配额抽样F 先将总体中的所有单元按一定的标志分为若干先将总体中的所有单元按一定的标志分为若干(组),然后在每个类(组)中按照事先规定的(组),然后在每个类
8、(组)中按照事先规定的比例或数量(即配额)用便利抽样或判断抽样方比例或数量(即配额)用便利抽样或判断抽样方法选取样本点法选取样本点 分类依据通常就是总体单元的某些属性、特征,如分类依据通常就是总体单元的某些属性、特征,如受调查者的受调查者的年龄、性别、社会阶层等年龄、性别、社会阶层等F 方法简单易行,可以保证总体的各个类别都能包方法简单易行,可以保证总体的各个类别都能包括在所抽样本之中,使得样本的结构和总体的结括在所抽样本之中,使得样本的结构和总体的结构类似构类似2022-5-30统计学第8章抽样调查理论与方法8-10配额抽样配额抽样F独立控制配额抽样:独立控制配额抽样:根据调查总体的不同特性
9、,对具根据调查总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额有某个特性的调查样本分别规定单独分配数额 优点优点:方法简单易行,调查人员选择余地较大:方法简单易行,调查人员选择余地较大 缺点缺点:调查人员可能图一时方便,选择样本过:调查人员可能图一时方便,选择样本过于偏向某一组别,从而影响样本的代表性于偏向某一组别,从而影响样本的代表性F交叉控制配额抽样:交叉控制配额抽样:是根据调查对象的各个特性的样是根据调查对象的各个特性的样本数额交叉分配本数额交叉分配 由于各个特性都同时得到了控制,从而克服了由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。独
10、立控制配额抽样的缺点,提高了样本的代表性。2022-5-30统计学第8章抽样调查理论与方法8-11滚雪球抽样滚雪球抽样F 是以是以“滚雪球滚雪球”的方式抽取样本,即通过的方式抽取样本,即通过一些一些“种子种子”样本点以获取更多样本点的样本点以获取更多样本点的信息,样本量逐渐扩大信息,样本量逐渐扩大F 优点:优点:便于有针对性找到被调查者,便于有针对性找到被调查者,调调查的成本也比较低查的成本也比较低F 缺点:缺点:要求样本单元之间必须有一定的联要求样本单元之间必须有一定的联系并且愿意保持和提供这种关系系并且愿意保持和提供这种关系 2022-5-30统计学第8章抽样调查理论与方法8-12概率抽样
11、概率抽样(probability sampling)F又又称随机抽样称随机抽样,是指依据随机原则,按照某种事,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的抽样方先设计的程序,从总体中抽取部分单元的抽样方法法 F特点特点按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本F抽取样本时使每个单位都有一定的机会(概率)被抽取样本时使每个单位都有一定的机会(概率)被抽中抽中F“随机随机”不等于不等于“随便随便”F“随机随机”不等于不等于“等概率等概率”用样本指标数值去推断总体的指标数值用样本指标数值去推断总体的指标数值抽样调查会产生抽样误差,这个误差可以计算,并且抽样调查会
12、产生抽样误差,这个误差可以计算,并且可以加以控制可以加以控制2022-5-30统计学第8章抽样调查理论与方法8-13概率抽样概率抽样(probability sampling)F概率抽样被视为狭义的抽样调查,在实践中被广概率抽样被视为狭义的抽样调查,在实践中被广泛加以采用,通常所谓的抽样调查,均指概率抽泛加以采用,通常所谓的抽样调查,均指概率抽样调查。样调查。F概率抽样有多种形式:概率抽样有多种形式:简单随机抽样、分层抽样、简单随机抽样、分层抽样、系统抽样、整群抽样系统抽样、整群抽样等,这些方法将在等,这些方法将在8.4节逐一节逐一介绍。介绍。2022-5-30统计学第8章抽样调查理论与方法8
13、-148.1.2 抽样调查的作用抽样调查的作用F实际工作不可能进行全面调查,而又需要了解其实际工作不可能进行全面调查,而又需要了解其全面情况的现象全面情况的现象 F对虽然可以进行全面调查,但调查时范围大、单对虽然可以进行全面调查,但调查时范围大、单位数目多,又缺乏原始记录作依据的现象位数目多,又缺乏原始记录作依据的现象F对普查资料的质量进行检查和修正对普查资料的质量进行检查和修正F抽样调查方法可以用于工业生产过程中的质量控抽样调查方法可以用于工业生产过程中的质量控制制 2022-5-30统计学第8章抽样调查理论与方法8-158.1.3 抽样调查的应用领域抽样调查的应用领域F社会经济现象的调查社
14、会经济现象的调查 如:人口变动、农产量、城市居民家计、农村经济、小型如:人口变动、农产量、城市居民家计、农村经济、小型工业企业生产情况、小型商业企业交易情况调查工业企业生产情况、小型商业企业交易情况调查 F社会性的民意调查社会性的民意调查 F市场调查市场调查F卫生调查卫生调查 F资源环境调查资源环境调查2022-5-30统计学第8章抽样调查理论与方法8-168.2 抽样调查的基本概念抽样调查的基本概念 F8.2.1 总体与样本总体与样本F8.2.2 总体参数与统计量总体参数与统计量F8.2.3 抽样单元与抽样框抽样单元与抽样框 F8.2.4 抽样方法与样本可能数目抽样方法与样本可能数目F8.2
15、.5 精度与费用精度与费用2022-5-30统计学第8章抽样调查理论与方法8-178.2.1 总体与样本总体与样本F总体总体:研究对象的全体,或者说是希望从中获取信息:研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体的总体,它是由研究对象中所有性质相同的个体(individual)所组成所组成 1)总体的限定是人为的)总体的限定是人为的 2)在一项调查中,)在一项调查中,总体是唯一的,样本不是唯一的总体是唯一的,样本不是唯一的 3)总体中包含的单元数称为)总体中包含的单元数称为总体容量总体容量,记为,记为F个体个体:构成总体的基本单元:构成总体的基本单元 N2
16、022-5-30统计学第8章抽样调查理论与方法8-18统计总体的种类统计总体的种类有限总体有限总体无限总体无限总体对有限总体可以进行对有限总体可以进行全面调查全面调查,也可也可以进行以进行非全面调查;非全面调查; 对无限总体只能采取对无限总体只能采取非全面调查非全面调查 2022-5-30统计学第8章抽样调查理论与方法8-19F样本样本:是总体的一部分,从总体中按一定程序抽取的那部是总体的一部分,从总体中按一定程序抽取的那部分抽样单元或个体组成。分抽样单元或个体组成。 1)样本也是一个集合,每个被抽中的进入样本的单元称)样本也是一个集合,每个被抽中的进入样本的单元称为为入样单元入样单元, 2)
17、样本包含的单元数称为样)样本包含的单元数称为样样本容量样本容量,记为,记为n 3)样本量对总体容量之比称为)样本量对总体容量之比称为抽样比抽样比,记为,记为fn/N(一(一般是一个很小的数)般是一个很小的数) 4)大样本)大样本 ;小样本;小样本 30n 30n 2022-5-30统计学第8章抽样调查理论与方法8-208.2.2 总体参数与统计量总体参数与统计量F总体参数总体参数:是根据总体中各单位的变量值:是根据总体中各单位的变量值计算出来的用于反映总体的数量特征的指计算出来的用于反映总体的数量特征的指标标 F调查的目标量都是由总体的某些指标来表调查的目标量都是由总体的某些指标来表示的示的F
18、总体参数表现为一系列唯一的常数,但往总体参数表现为一系列唯一的常数,但往往却是未知的,需要去推断和估计往却是未知的,需要去推断和估计 2022-5-30统计学第8章抽样调查理论与方法8-21F统计量:统计量:是根据样本的是根据样本的n个单元的变量值计个单元的变量值计算出来一个量,也叫估计量算出来一个量,也叫估计量(estimator), 1)样本指标是随机变量)样本指标是随机变量 2)往往构成了用于估计总体参数的估计量。)往往构成了用于估计总体参数的估计量。2022-5-30统计学第8章抽样调查理论与方法8-22常见的总体参数包括常见的总体参数包括:F总体均值(平均数)总体均值(平均数)(po
19、pulation mean)F总体总值(总和)(总体总值(总和)(population total)F总体比例(总体比例(proportion)F总体方差总体方差(population variance)F标准差标准差(population standard deviation) 11NiiXXN1NiiXXNX011,1NNNNPQPNNN 2211()NiiXXN211()NiiXXN2022-5-30统计学第8章抽样调查理论与方法8-238.2.3 抽样单元与抽样框抽样单元与抽样框F总体是由个体组成的,可以是有限的,也可以是无限总体是由个体组成的,可以是有限的,也可以是无限的,当从抽样角
20、度而言,总将总体看成是有限的。的,当从抽样角度而言,总将总体看成是有限的。F将总体划分为互不重迭而又穷尽的有限多个部分,将将总体划分为互不重迭而又穷尽的有限多个部分,将这样的每个部分称为这样的每个部分称为抽样单元抽样单元(sampling unit)。)。 1)每个抽样单元都由或多或少的个体组成,当然也)每个抽样单元都由或多或少的个体组成,当然也可以是一个个体。可以是一个个体。 2022-5-30统计学第8章抽样调查理论与方法8-24 2)抽样单元可大可小,可以分级。分别称为一级)抽样单元可大可小,可以分级。分别称为一级抽样单元(抽样单元(psu)、二级抽样单元()、二级抽样单元(ssu),)
21、,基本抽样单元(最小一级抽样单元)。基本抽样单元(最小一级抽样单元)。 3)抽样单元可以是人为划分的,也可以是自然形)抽样单元可以是人为划分的,也可以是自然形成的。成的。2022-5-30统计学第8章抽样调查理论与方法8-25F包含所有抽样单元的名单或者清册,称为包含所有抽样单元的名单或者清册,称为抽样抽样框。框。 1)抽样框的形式是多样的)抽样框的形式是多样的 2)抽样框中的单元原则上既不应有重复,也)抽样框中的单元原则上既不应有重复,也不应有遗漏不应有遗漏抽样框的种类抽样框的种类:名录框、区域框、自然框名录框、区域框、自然框2022-5-30统计学第8章抽样调查理论与方法8-268.2.4
22、 抽样方法与样本可能数目抽样方法与样本可能数目F从总体中抽取样本方式的不同,构成了不同的抽从总体中抽取样本方式的不同,构成了不同的抽样方法样方法 1)放回抽样)放回抽样/回置抽样、不放回抽样回置抽样、不放回抽样 2)等概率抽样、不等概率抽样)等概率抽样、不等概率抽样F对样本开展调查,获得样本数据,形成样本指标,对样本开展调查,获得样本数据,形成样本指标,构造适当的统计量作为总体指标的估计是抽样调构造适当的统计量作为总体指标的估计是抽样调查的必要工作查的必要工作2022-5-30统计学第8章抽样调查理论与方法8-27F重复抽样重复抽样:指每次从总体中抽取一个单元:指每次从总体中抽取一个单元进行观
23、察后,再把这个单元重新放回总体,进行观察后,再把这个单元重新放回总体,使之继续参加下次抽选(回置抽样或重置使之继续参加下次抽选(回置抽样或重置抽样)。抽样)。F不重复抽样不重复抽样:指每次从总体中抽取一个单:指每次从总体中抽取一个单元进行观察后,不再把这个单元重新放回元进行观察后,不再把这个单元重新放回总体,这个总体单元不再继续参加下次抽总体,这个总体单元不再继续参加下次抽选(不回置抽样或不重置抽样)。选(不回置抽样或不重置抽样)。 2022-5-30统计学第8章抽样调查理论与方法8-28F考虑顺序的重复抽样考虑顺序的重复抽样F不考虑顺序的重复抽样不考虑顺序的重复抽样F考虑顺序的不重复抽样考虑
24、顺序的不重复抽样F不考虑顺序的不重复抽样不考虑顺序的不重复抽样1(1)! (1)!nN nNnCnN !(1)(1)()!nNNANNNnNn(1)(1)!1 2! ()!nNNNNnNCnnNn nnnNBN NNN 2022-5-30统计学第8章抽样调查理论与方法8-298.2.5 精度与费用精度与费用 抽样调查的精度抽样调查的精度误差的大小误差的大小 抽样误差的大小抽样误差的大小 (可用估计量,大样本)方差或标准差大小(可用估计量,大样本)方差或标准差大小 抽样调查中,精度的估计主要就是估计量的方差估计抽样调查中,精度的估计主要就是估计量的方差估计 影响方差的最重要的因素是样本量,样本量
25、又与费用有关影响方差的最重要的因素是样本量,样本量又与费用有关 影响精度和费用的另一因素是抽样方法和估计方法影响精度和费用的另一因素是抽样方法和估计方法 对于一个具体的抽样设计,应尽量做到在固定费用的限制下使对于一个具体的抽样设计,应尽量做到在固定费用的限制下使精度最高,或在要求达到的精度的约束下使调查费用最省,称这精度最高,或在要求达到的精度的约束下使调查费用最省,称这样的设计为样的设计为最优设计最优设计2022-5-30统计学第8章抽样调查理论与方法8-30 对精度的讨论基于两个方向对精度的讨论基于两个方向:F对于某类抽样方案,构造合适的估计量并讨论这对于某类抽样方案,构造合适的估计量并讨
26、论这一估计量的方差估计一估计量的方差估计F对于既定的抽样方案,依据给定的精度要求(误对于既定的抽样方案,依据给定的精度要求(误差限要求)讨论方案的细节(如样本量的确定问差限要求)讨论方案的细节(如样本量的确定问题)题)2022-5-30统计学第8章抽样调查理论与方法8-318.3 抽样误差抽样误差 F8.3.1抽样调查中误差的来源抽样调查中误差的来源F8.3.2抽样平均误差、方差与偏差抽样平均误差、方差与偏差 F8.3.3抽样平均误差的计算抽样平均误差的计算 F8.3.4抽样极限误差与置信度抽样极限误差与置信度 2022-5-30统计学第8章抽样调查理论与方法8-328.3.1 抽样调查中的误
27、差来源抽样调查中的误差来源F凡调查就一定有误差,不可能完全避免。抽样调查中误差可分凡调查就一定有误差,不可能完全避免。抽样调查中误差可分为为非抽样误差非抽样误差及及抽样误差抽样误差两大类。两大类。非抽样误差非抽样误差(nonsampling error):指不是由于抽样引起的,指不是由于抽样引起的,在全面普查中也存在。包括:在全面普查中也存在。包括: 1)调查误差:调查所得数据与样本单元的真值不一致所造成的)调查误差:调查所得数据与样本单元的真值不一致所造成的误差。原因包括测量误差、失真回答等。误差。原因包括测量误差、失真回答等。 2)不完整的抽样框误差:抽样框的重复和遗漏。)不完整的抽样框误
28、差:抽样框的重复和遗漏。 3)不回答误差(无相应误差):抽中的样本单元找不到或者拒)不回答误差(无相应误差):抽中的样本单元找不到或者拒绝回答问题或缺失所需要的信息绝回答问题或缺失所需要的信息 4)填写录入误差)填写录入误差2022-5-30统计学第8章抽样调查理论与方法8-33#抽样误差抽样误差(sampling error):指由于抽样所造成的):指由于抽样所造成的误差(用样本估计总体而产生的误差)。其根源在误差(用样本估计总体而产生的误差)。其根源在于样本的随机性,使得样本指标值和总体真实值之于样本的随机性,使得样本指标值和总体真实值之间存在差异间存在差异 1)只要是抽样调查,这个误差不
29、可避免)只要是抽样调查,这个误差不可避免 2)能够计量和控制,可用各种量值表示)能够计量和控制,可用各种量值表示 3)通常样本量愈大,则抽样误差愈小(抽样误差与)通常样本量愈大,则抽样误差愈小(抽样误差与样本量的平方根成反比)样本量的平方根成反比)2022-5-30统计学第8章抽样调查理论与方法8-348.3.2 抽样平均误差、方差和偏差抽样平均误差、方差和偏差2022-5-30统计学第8章抽样调查理论与方法8-35F均方误差可以分解:均方误差可以分解: 2( )()MSEE 22( )( ) ( )MSEEEE 其中:其中: 2()()EEV称为称为的(抽样)的(抽样)方差方差 ()()EB
30、称为称为的的偏差偏差(Bias) 特别地,对于无偏估计量,满足:特别地,对于无偏估计量,满足: ( )E因此:因此: ( )( )MSEV 即:对于无偏估计量,其方差可以表征抽样平均误差程度即:对于无偏估计量,其方差可以表征抽样平均误差程度2022-5-30统计学第8章抽样调查理论与方法8-36F均方误差的平方根称为均方误差的平方根称为抽样平均误差抽样平均误差,方差的平方根称为,方差的平方根称为标准差标准差(standard deviation)。 F抽样平均误差抽样平均误差 、标准差、标准差 和偏差和偏差 三者之间的三者之间的关系:关系:( )MSE( )( )SV( )S( )B()B (
31、 )s2022-5-30统计学第8章抽样调查理论与方法8-378.3.3 抽样平均误差的计算抽样平均误差的计算F本章主要讨论简单随机抽样条件下,以及估计量本章主要讨论简单随机抽样条件下,以及估计量是无偏估计量的抽样平均误差的计算是无偏估计量的抽样平均误差的计算 ( (一一) ) 样本平均数的抽样平均误差样本平均数的抽样平均误差或或xx2 nn 1.1.重重复抽样复抽样2022-5-30统计学第8章抽样调查理论与方法8-38x2202()100小时 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,根据以往资料
32、,产品质量不太稳定,若=200小时,20()于是:小时例例2022-5-30统计学第8章抽样调查理论与方法8-392.不重复抽样:2xNnnN1 2xNnn(1)nN 但但实实际际中中, 往往往往 很很大大, 很很小小,故故改改用用下下列列公公式式:x400100(1)1.99()10010000 上上例例中中,若若为为不不重重复复抽抽样样,则则:小小时时2022-5-30统计学第8章抽样调查理论与方法8-40(二) 样本比例的抽样平均误差 已证明得:已证明得:比例的平均数就是比例本身比例的平均数就是比例本身 比例的方差是比例的方差是 pp p(1p) n p(1p)n (1)nN 在在重重复
33、复抽抽样样情情况况下下:在在不不重重复复抽抽样样情情况况下下:(1)PPP2022-5-30统计学第8章抽样调查理论与方法8-41%1374. 1)150001501 (150)98. 01 (98. 0)1 ()1 ( %14. 1150)98. 01 (98. 0)1 (%98150147 150 15000NnnppnpppnNpp若按不重复抽样方式: 某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例例2022-5-30统计学第8章抽样调查理论与方法8-42
34、得取总体方差的途径有: 1. 1. 用用过去全面调查或抽样调查的资料,若同时有几个方差的过去全面调查或抽样调查的资料,若同时有几个方差的资料,应选用数值较大的那个;资料,应选用数值较大的那个;2. 2. 用用样本标准差代替全及标准差;样本标准差代替全及标准差;3. 3. 在在大规模调查前,先搞个小规模的试验性的调查来确定总大规模调查前,先搞个小规模的试验性的调查来确定总体方差;体方差;4. 4. 用用估计估计的方法。的方法。2022-5-30统计学第8章抽样调查理论与方法8-438.3.4 抽样极限误差和置信度抽样极限误差和置信度F实际问题中,估计量的精度通常采用抽样极限误差来表示实际问题中,
35、估计量的精度通常采用抽样极限误差来表示或要求或要求F抽样极限误差:抽样极限误差:是根据概率理论,以一定的可靠程度保证是根据概率理论,以一定的可靠程度保证抽样误差不超过某一给定的范围,抽样误差不超过某一给定的范围, 。意义意义:在一定的置信度下,估计值与真实值的差异不超过:在一定的置信度下,估计值与真实值的差异不超过 上式表明,样本平均数(比例)是以总体平均数(比例)上式表明,样本平均数(比例)是以总体平均数(比例)为中心,在相应的区间内变动。为中心,在相应的区间内变动。xxxXx pppPp 2022-5-30统计学第8章抽样调查理论与方法8-44F置信度置信度:极限误差是在某种概率意义下的最
36、大误差范:极限误差是在某种概率意义下的最大误差范围,这里的概率称为置信度一般用围,这里的概率称为置信度一般用 表示。表示。F抽样极限误差与抽样平均误差之间的关系,与估计量抽样极限误差与抽样平均误差之间的关系,与估计量的分布有关的分布有关F有:有: 误差限与置信度是成对出现的,置信度越大,则相应误差限与置信度是成对出现的,置信度越大,则相应的误差限就越大。的误差限就越大。 因此,实际问题中,只给出误差限不给出置信度或者因此,实际问题中,只给出误差限不给出置信度或者相反,都是没有意义的。相反,都是没有意义的。Pr1xxX Pr1ppP 01( , ) xxXN ppPN01( , ) 2xxZ 2
37、ppZ12022-5-30统计学第8章抽样调查理论与方法8-458.4 抽样方案设计抽样方案设计 F8.4.1抽样方案设计的基本原则抽样方案设计的基本原则F8.4.2简单随机抽样简单随机抽样 F8.4.3分层抽样分层抽样 F8.4.4系统抽样系统抽样 F8.4.5整群抽样整群抽样 2022-5-30统计学第8章抽样调查理论与方法8-468.4.1抽样方案设计的基本原则抽样方案设计的基本原则F抽样方案的设计关系到调查的准确度有多高以及抽样方案的设计关系到调查的准确度有多高以及必要的样本数目是多少等问题。因此要科学地设必要的样本数目是多少等问题。因此要科学地设计抽样调查方案。计抽样调查方案。1.
38、在抽样设计中要保证实现在抽样设计中要保证实现随机抽取随机抽取的原则(随机的原则(随机原则是概率抽样的基础原则是概率抽样的基础 ) 2. 在抽样设计中要保证实现在抽样设计中要保证实现最大抽样效率最大抽样效率的原则的原则(实现最大抽样效率是经济效益的问题)(实现最大抽样效率是经济效益的问题) 2022-5-30统计学第8章抽样调查理论与方法8-478.4.2 简单随机抽样简单随机抽样(simple random sampling)F从总体从总体N个单位中随机地抽取个单位中随机地抽取n个单位作为样本,个单位作为样本,使得使得每一个容量为每一个容量为n n的样本都有相同的机会的样本都有相同的机会( (
39、概率概率) )被抽中被抽中 F抽取元素的具体方法有抽取元素的具体方法有重复抽样重复抽样和和不重复抽样不重复抽样F特点特点简单、直观,在抽样框完整时,可直接从中抽取样简单、直观,在抽样框完整时,可直接从中抽取样本本用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便F局限性局限性当当N很大时,不易构造抽样框很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率2022-5-30统计学第8章抽样调查理论与方法8-488.4.2 简单随机抽样简单随机抽样F简单随机抽
40、选有各种不同的具体做法,如:简单随机抽选有各种不同的具体做法,如: 1.抽签法抽签法 2.使用统计软件直接抽取法使用统计软件直接抽取法 3.随机数法随机数法F简单随机抽样误差的计算简单随机抽样误差的计算在重复抽样条件下:在重复抽样条件下:在不重复抽样条件下:在不重复抽样条件下:2xn(1)pPPn21xnnN(1)1pPPnnN2022-5-30统计学第8章抽样调查理论与方法8-498.4.3 分层抽样分层抽样(stratified sampling)F将抽样单位按某种特征或某种规则划分为不同的将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本层,然后从不同的层
41、中独立、随机地抽取样本例如例如,在居民生活水平调查中,先按职业分类,在居民生活水平调查中,先按职业分类,然后每种职业分别随机抽取部分居民进行调查。然后每种职业分别随机抽取部分居民进行调查。实质上是实质上是分组法分组法与与随机原则随机原则的结合的结合总体总体N样本样本n等比例抽取等比例抽取不等比例抽取不等比例抽取优最抽取优最抽取2022-5-30统计学第8章抽样调查理论与方法8-50分层抽样分层抽样F优点优点1.既可以对总体参数进行估计,也可以对各层的既可以对总体参数进行估计,也可以对各层的目标量进行估计目标量进行估计2.保证样本的结构与总体的结构比较相近,从而保证样本的结构与总体的结构比较相近
42、,从而提高估计的精度提高估计的精度3.组织实施调查灵活方便组织实施调查灵活方便4.分层样本分别取自各层,在总体中的分布更为分层样本分别取自各层,在总体中的分布更为均匀,不会出现不平衡的情况均匀,不会出现不平衡的情况 2022-5-30统计学第8章抽样调查理论与方法8-51两种类型:1.1.等等比例分配法比例分配法( (类型比例抽样类型比例抽样) )2.2.不不等比例分配法等比例分配法( (类型适宜抽样类型适宜抽样) )实际工作中比较常用的是等比例分配法实际工作中比较常用的是等比例分配法 2022-5-30统计学第8章抽样调查理论与方法8-52分层抽样抽样平均误差的计算分层抽样抽样平均误差的计算
43、F在重复抽样条件下:在重复抽样条件下:F在不重复抽样条件下:在不重复抽样条件下:2ixn(1)pPPn21ixnnN(1)1pPPnnN2022-5-30统计学第8章抽样调查理论与方法8-538.4.4 系统抽样系统抽样(systematic sampling)F将总体中的所有单位将总体中的所有单位(抽样单位抽样单位)按一定顺序按一定顺序排列,在规定的范围内随机地抽取一个单排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规位作为初始单位,然后按事先规定好的规则确定其他样本单位则确定其他样本单位先从数字先从数字1到到k之间随机抽取一个数字之间随机抽取一个数字r作为初作为初始
44、单位,以后依次取始单位,以后依次取r+k,r+2k等单位等单位F优点优点:操作简便,可提高估计的精度:操作简便,可提高估计的精度F缺点缺点:对估计量方差的估计比较困难:对估计量方差的估计比较困难2022-5-30统计学第8章抽样调查理论与方法8-54排列次序用的标志有两种:1.1.无关标志排队:无关标志排队:选择标志与抽样调查选择标志与抽样调查所研究内容无关所研究内容无关2.2.有关标志排队:有关标志排队:选择标志与抽样调查选择标志与抽样调查所研究的内容有关所研究的内容有关研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工
45、人的生活水平,按工人月工资额高低排队。低排队。例例2022-5-30统计学第8章抽样调查理论与方法8-55根据样本抽选的方法不同,可分为:根据样本抽选的方法不同,可分为:(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)2022-5-30统计学第8章抽样调查理论与方法8-562022-5-30统计学第8章抽样调查理论与方法8-57等距抽样抽样平均误差的计算等距抽样抽样平均误差的计算F按无关标志排队按无关标志排队一、在重复抽样条件下:一、在重复抽样条件下:二、在不重复抽样条件下:二、在不重复
46、抽样条件下:21xnnN(1)pPPn2xn(1)1pPPnnN2022-5-30统计学第8章抽样调查理论与方法8-58F按有关标志排队按有关标志排队一、在重复抽样条件下:一、在重复抽样条件下:二、在不重复抽样条件下:二、在不重复抽样条件下: 在等距系统抽样时,每个组内只抽取一个单元,因此在等距系统抽样时,每个组内只抽取一个单元,因此 ,从而从而所以,所以, 2ixn2ixn(1)pPPn21iiixiNnnN(1)1iipiNnPPnN1in 1111iiiiiNnNNN(1)pPPn2022-5-30统计学第8章抽样调查理论与方法8-598.4.5整群抽样整群抽样(cluster samp
47、ling)F将总体中若干个单位合并为组将总体中若干个单位合并为组(群群),抽样时抽样时直接抽取群,然后对中选群中的所有单位直接抽取群,然后对中选群中的所有单位全部实施调查全部实施调查F特点特点抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调调查的地点相对集中,节省调查费用,方便调查的实施查的实施缺点是估计的精度较差缺点是估计的精度较差2022-5-30统计学第8章抽样调查理论与方法8-60ABCDEFGHIJKLMNOPIHPD样本容量样本容量hlpdnnnnn2022-5-30统计学第8章抽样调查理论与方法8-611、抽样平均数的平
48、均误差、抽样平均数的平均误差2、抽样成数的平均误差、抽样成数的平均误差2()1ppRrrR2()1xxRrrR整群抽样整群抽样一般都采用不重复抽样方法。因此,在一般都采用不重复抽样方法。因此,在计算抽样误差时要使用修正系数。计算抽样误差时要使用修正系数。2022-5-30统计学第8章抽样调查理论与方法8-628.5 样本容量的确定样本容量的确定 F8.5.1影响样本容量确定的主要因素影响样本容量确定的主要因素F8.5.2确定抽样单元数的方法确定抽样单元数的方法2022-5-30统计学第8章抽样调查理论与方法8-638.5.1影响样本容量确定的主要因素影响样本容量确定的主要因素F总体被研究标志的
49、变异程度总体被研究标志的变异程度 F调查者对推断精确度的要求调查者对推断精确度的要求F抽样调查的方式和方法抽样调查的方式和方法F人力、物力和财力的允许条件人力、物力和财力的允许条件 2022-5-30统计学第8章抽样调查理论与方法8-648.5.2确定抽样单元数的方法确定抽样单元数的方法(一)简单随机抽样 重复抽样 不重复抽样 2222xxZn222(1)ppZPPn2222222xxNZnNZ 22222(1)(1)ppNZPPnNZPP 2022-5-30统计学第8章抽样调查理论与方法8-658.5.2确定抽样单元数的方法确定抽样单元数的方法(二)分层抽样 重复抽样 不重复抽样 22 ;
50、P(1-P)P(1-P) 2222xxZn222(1)ppZPPn2222222xxNZnNZ 22222(1)(1)ppNZPPnNZPP 2022-5-30统计学第8章抽样调查理论与方法8-668.5.2确定抽样单元数的方法确定抽样单元数的方法(三)整群抽样 由于整群抽样一般为不重复抽样,所以按不重复抽样计算必要抽样群数 不重复抽样 nr ; NR 2222222xxxxRZnRZ 2222222ppppRZnRZ 2022-5-30统计学第8章抽样调查理论与方法8-67 等距抽样的抽样数目,在有总体差异等距抽样的抽样数目,在有总体差异程度和比重的全面资料时,可采用类型抽程度和比重的全面资