《《抽样设计及》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《抽样设计及》PPT课件.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、抽样的必要性 调查的客体是由的客体是由许许多多的个人、群体和多多的个人、群体和组织所所构成的最复构成的最复杂的的总体。其通常既无法象工程体。其通常既无法象工程测量量或科学或科学实验那那样要求要求进行次数很多的重复性行次数很多的重复性测量量或或调查,也无法象工程,也无法象工程测量或科学量或科学实验那那样要求要求进行全面的行全面的测量或量或调查。另外,另外,调查的主体人的主体人财物物资源有限,根本无法源有限,根本无法进行全面行全面调查。优点:费用少速度快准确性高 二、抽样的程序 1 1、定、定义总体体2 2、建立或、建立或选择抽抽样框框3 3、定、定义样本数目本数目4 4、确定抽、确定抽样方法
2、方法5 5、抽、抽选样本本 三、抽样中基本的程序 抽抽样程序程序1 1、确定目、确定目标人群或人群或总体体 内容:内容:1、构成分析的、构成分析的单位是什么?位是什么?2、抽、抽样的的单位是什么?位是什么?3、什么、什么东西指定包括在内?西指定包括在内?4、时限怎么限怎么样,即要,即要获取的信息属于哪一段取的信息属于哪一段时间?5、空、空间限制如何,是那些地区,是否限于城市,或限制如何,是那些地区,是否限于城市,或城市的繁城市的繁华街区?街区?抽样 程序2、建立或建立或选择抽抽样框框抽样框-是构成总体的全部单元的“家庭聚会”街道居委名录、企业名录、电话本、选民花名册、俱乐部名录 抽抽样程序程序
3、3 3、定定义样本数目本数目确定确定样本容量要考本容量要考虑的因素的因素(1)总体体变异程度异程度(2)调查精度要求精度要求(3)总体体规模模(4)抽)抽样方式方式(5)回答率)回答率(6)分)分组需要需要(7)调查经费(8)时间限制限制(9)人力)人力资源限制源限制(10)其他)其他设施、工具等限制施、工具等限制影响样本规模的因素可分为两个方面 与满足数据的可靠性要求有关的因素(如调查经费、时间限制、人力资源)与实际操作上的限制有关的因素(如总体变异、调查精度、总体规模、抽样方式、回答率)基本基本样本含量的估本含量的估计估算公式估算公式连续型型变量量资料:料:离散型离散型变量量资料:料:估估
4、计样本含量的依据本含量的依据 总体中个体的体中个体的变异程度异程度 精度即相精度即相对误差差 置信程度(置信程度(1)确定确定样本量的程序本量的程序(1)根根据据估估计参参数数性性质、总体体变异异大大小小和和调查精度要求精度要求计算基本算基本样本量。本量。(2)根据)根据总体体规模模对基本基本样本量本量进行行调整。整。(3)根据抽)根据抽样方式的方式的设计效效应调整整样本量。本量。(4)根据)根据预期回答率期回答率调整整样本量。本量。(5)根根据据客客户以以及及调查计划划确确定定是是否否需需要要分分组进行行样本量本量计算。算。(6)根据)根据时间经费等各种限制等各种限制调整整样本量。本量。按照
5、确定样本量的程序来介绍如何确定样本容量步骤具体如下:第一步第一步 根据估计参数性质、总体变异大小和调查精度要 求计算基本样本量,其计算公式为:总体变异程度和调查精度要求是确定样本容量要考虑的两个基本因素。通常总体的标准差未知的,一般用下面五种方法来解决:利用以前的调查结果和经验利用试调查或预调查的结果利用同类或相似或有关的二手资料利用某些理论上的结论利用专家的判断。第二步第二步 根据总体规模对基本样本量进行调整,其计算公式为:这是通过有限总体修正系数(fpc=(Nn)/N)对样本容量产生影响的推导过程:由 推出 2220/dSZn=001nNNnn+=-NnNnfpcnn 1001=第三步第三
6、步 根据抽样方式的设计效应调整样本量,其计算公式为:抽样方式对样本量的影响表现为与简单随机抽样相比的情况 设计效应deff是指任意抽样方式下的抽样方差除以简单随机抽样方式下抽样方差的商简单随机抽样的deff=1 分层随机抽样的deff1 整群随机抽样的deff1 机械随机抽样的deff1 第四步第四步 根据预期回答率调整样本量,其计算公式为:调查回答率r是指实际回收的有效问卷数与计划回收的有效问卷数之比 第五步第五步 根据客户以及调查计划确定是否需要分组进行样本量计算第六步第六步 根据时间、经费等各种限制调整样本量抽样程序4、明确抽样方法 见“抽样基本方法”抽样程序5、抽选样本 是指按指定方法
7、抽取受访者是指在某一特定地区或任何地区,按照一系列标准直接指定受访者的抽样方法。【抽样程序4】抽样基本方法掌握几种抽样的概念掌握几种抽样的概念熟悉常用抽样方法的实施熟悉常用抽样方法的实施了解多阶段分层随机抽样方法了解多阶段分层随机抽样方法解决用什么方法抽解决用什么方法抽(抽样方法)、(抽样方法)、抽多少(抽多少(样本含量样本含量)、)、怎么抽(怎么抽(实施步骤实施步骤)、)、如何分析(如何分析(参数估计)参数估计)等几个问题?等几个问题?基本调查方法:基本调查方法:普查(全面调查)普查(全面调查)典型调查典型调查 抽样调查抽样调查总体与样本总体与样本抽样抽样基本抽基本抽样方法方法非概率抽非概率
8、抽样概率抽概率抽样PPS抽抽样基本抽基本抽样方法方法(一一)非概率抽非概率抽样偶遇抽偶遇抽样或自然抽或自然抽样:街街头随随访,邮寄寄调查等等判断式抽判断式抽样:销售需求售需求调查配配额抽抽样:居民家庭情况居民家庭情况调查滚雪球抽雪球抽样:SARS流流调,调查老年人的生活状老年人的生活状况况空空间抽抽样:广告公司广告公司调查基本抽基本抽样方法(二)方法(二)概率抽概率抽样 单纯【简单】随机抽随机抽样系系统抽抽样整群抽整群抽样分分层抽抽样多多阶段抽段抽样概率抽概率抽样(一)(一)单纯随机抽随机抽样:定定义:又称又称简单随机抽随机抽样,简单任意抽任意抽样等,等,指从指从总体体N个抽个抽样单元中,每次
9、抽取一个元中,每次抽取一个单元元时,使每个使每个单元都有相同的概率被抽中,元都有相同的概率被抽中,连续抽取抽取n次,次,组成成简单随机随机样本本样本。本。优点:点:方法方法简单,易于操作,是其它抽,易于操作,是其它抽样方法的方法的基基础 缺点:缺点:要求要求总体同体同质性好,未充分利用性好,未充分利用总体的其体的其他信息,大他信息,大样本不使用本不使用 抽样方法:抽样方法:抽签法、随机数字法、随机数骰子法抽签法、随机数字法、随机数骰子法 抽签法 随机数法 使用统计软件直接抽取 准备2000张卡片,写上所有学生的编号,摇匀后抽出300名学生利用随机数表,从09的第一个个位数,以及两位数,三位数符
10、合某个规律。SPSS,EXCEL,S-PLUS 等概率抽样(二)系系统抽抽样:定定义:或称等距抽或称等距抽样、机械抽、机械抽样。将。将总体的体的观察察单位按照位按照顺序排列或序排列或标志后,每隔一定的距离抽志后,每隔一定的距离抽取一个取一个单位作位作为样本。本。优点:点:更具代表性,方法更具代表性,方法简单,易操作,易操作,应用广用广泛泛 缺点:缺点:周期性影响周期性影响概率抽样(三)整群抽整群抽样:定定义:将将总体各体各观察察单位划分位划分为若干群,随机若干群,随机抽取一部分群,抽取一部分群,对改改该群内所有群内所有单位位进行行调查的的方法。方法。分群原分群原则:尽量尽量扩大群内大群内变异异
11、概率抽概率抽样(四)(四)分分层抽抽样:定定义:也叫也叫类型抽型抽样,指在抽,指在抽样之前,先将之前,先将总体划分称体划分称若干若干层次,然后在每个次,然后在每个层中独立抽中独立抽样。分分层原原则:尽量减小尽量减小层内内变异异步步骤:获得得总体相关信息体相关信息确定分确定分层标准和准和层数数确定各确定各层样本含量本含量各各层独立抽独立抽样概率抽概率抽样(五)(五)多多阶段抽段抽样:定定义:根据根据实际情况将整个抽情况将整个抽样程序分成若干个程序分成若干个阶段,段,一个一个阶段一个段一个阶段地段地进行抽行抽样,以完成整个抽,以完成整个抽样过程,程,这种抽种抽样就叫多就叫多阶抽抽样。特点:特点:便
12、于便于组织抽抽样;抽抽样方式灵活,有利于提高方式灵活,有利于提高抽抽样的估的估计效率;便于效率;便于组织实施;施;应用广泛。用广泛。例:全国例:全国职工收入工收入调查抽抽样方案方案#配额抽样 是一种抽是一种抽选一群特定数目的一群特定数目的满足特定条件的受足特定条件的受访者的者的抽抽样方法方法 和概率抽和概率抽样中的分中的分层抽抽样有些有些类似似各种概率抽样方法比较单纯随机抽样系统抽样整群抽样分层抽样优点简单直观,其它抽样基础,计算简便易理解,简便易行;易得到按照比率分配的样本;便于组织,节省经费,容易控制调查质量可独立分析层参数;灵活,信息利用好缺点大样本不使用,变异大时代表性差周期性影响大抽
13、样误差大层变量选择适用范围总体不大的情况按抽样顺序个体随机分布情况群间差异小层间差异大抽样误差大较小最大小五、抽五、抽样设计注意的事注意的事项抽样设计通常需要取得客户的认可 在精度与预算之间求得平衡 必须与问卷甄别部分相呼应 必须与数据处理方案相呼应 六、抽样原理一、抽样科学性依据部分来自于全体,必带有反映全体的信息;构成(同质)总体的一些个体之间在性质上必定相似或相近,所以彼此有相当代表性;不管原始分布如何,样本平均数的分布总可视为正态分布,而且由此得到总体参数准确估计的概率值极大。二、样本均值的抽样分布 大样本均值的抽样分布及其特征根据单个样本推断 点估计和区间估计 样本比例的抽样分布与总
14、体比例估计三、样本容量的确定 样本均值的抽样分布 1.大样本均值的抽样分布特征是正态分布 分布的均值等于总体均值分布的标准差称为均值的标准差,等于总体标准差除以样本容量的平方根具体公式如下:2.根据单个样本推断 3.点估计和区间估计点估计是把样本均值作为总体均值的估计值,是一个数值点的估计。区间估计是用一个区间去估计总体均值,即把总体均值估计在某两界限之间。总体均值的区间估计步骤及置信区间 4.样本比例的抽样分布与总体比例估计样本比例的抽样分布类似于样本均值的抽样分布,其特征这里不再赘述。简单随机抽样公式 不放回抽样方法的参数计算公式:放回抽样方法的参数计算公式:七、估七、估计 点估计是把样本平均值作为总体平均数的估计值。区间估计就是对变量值如总体平均值的区间或范围进行估计。实际总体体平平均均值在在该区区间范范围之之内内的的概概率率通通常常被称被称为置信系数或是置信度,置信系数或是置信度,区区间则被称被称为置信区置信区间。抽抽样误差差是指样本平均值与真实总体平均值的差距。由于只是根据一次简单随机抽样得到的一个样本的样本平均数来估计总体平均值,这种误差几乎不可避免。