抽样调查与抽样设计.pptx

上传人:修**** 文档编号:12431691 上传时间:2022-04-24 格式:PPTX 页数:41 大小:556.24KB
返回 下载 相关 举报
抽样调查与抽样设计.pptx_第1页
第1页 / 共41页
抽样调查与抽样设计.pptx_第2页
第2页 / 共41页
点击查看更多>>
资源描述

《抽样调查与抽样设计.pptx》由会员分享,可在线阅读,更多相关《抽样调查与抽样设计.pptx(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第七章第七章 抽样设计(上)抽样设计(上)1第七章第七章 抽样设计抽样设计学习目标学习目标 了解抽样技术的分类了解抽样技术的分类 掌握抽样设计过程内容掌握抽样设计过程内容 掌握随机抽样技术和非掌握随机抽样技术和非 随机抽样技术随机抽样技术2给飞机焊上钢板给飞机焊上钢板 最高指挥部对此伤透了脑筋:要降低损失,就得将防弹钢板焊到飞机上;倘若给整个机身“穿上”钢板“防弹衣”,势必影响战机的速度、航程和载弹量。 为了破解这道难题,军方决定求助数学家亚伯拉罕沃尔德。3解决方法 处理的方法很简单:他把制作好的统计表发到地勤技师手中,要求他们把返回的飞机上的弹洞位置,填表上报;接着亚伯拉罕沃尔德在一张铺开的

2、大白纸上画出一个飞机的轮廓,将那些小窟窿一一标上去。最后大家发现,除了飞行员座舱和尾翼两处是空白外,机身上下弹痕累累。 亚伯拉罕沃尔德意味深长地指出:明显违反规律的地方,往往就是问题的关键点。用科学方法从实践中提炼出的规律,堪称致胜的法宝。4抽样调查的一般理论抽样调查的一般理论 抽样与抽样调查抽样:从总体中抽取样本的过程,专门组织的非全面调查依据概率论的中心极限定理。 总体指标:调查对象(总体)必须是明确的,数量限定是人为的,其相关参数为总体指标。如:大学生体育消费的心理特征,某个节目的总体平均收视率等等。 样本统计量:包括样本均值、样本比例、样本方差,大样本条件下,趋于正态分布。5第七章第七

3、章 抽样设计抽样设计基本概念基本概念 目标总体与样本目标总体与样本目标总体(目标总体(N)是指市场研究对象的总体,它可以是一群人、是指市场研究对象的总体,它可以是一群人、家庭、企业、情形或活动等。即由研究对象的全体单位构成的家庭、企业、情形或活动等。即由研究对象的全体单位构成的集合。集合。目标总体必须要精确定义,例如:目标总体必须要精确定义,例如:“农场主农场主”,什么样的人是农场主?,什么样的人是农场主?样本样本(n)是指从总体的所有单位中抽取出来的能代表总体的是指从总体的所有单位中抽取出来的能代表总体的部分单位(集合)。部分单位(集合)。其中称其中称 n30 的样本为的样本为,而称,而称

4、n 30的样本为的样本为。 是根据总体中各标志值计算的,用于反映总体数量是根据总体中各标志值计算的,用于反映总体数量特征的定量指标。特征的定量指标。根据样本中各标志值计算的,用来估计和判断总体数根据样本中各标志值计算的,用来估计和判断总体数量特征的随机性指标,即样本统计量。量特征的随机性指标,即样本统计量。6第七章第七章 抽样设计抽样设计 基本概念基本概念总体指标和样本指标符号及计算公式总体指标和样本指标符号及计算公式 Nn11NiiXXN11niixxn1NPN01NQPN 1npn01nqpn2211()NiiXXN2211()1niSxxn211()NiiXXN211()1iniSxxn

5、(1)PQPP(1)pqpp 其中其中, , 和和 分别表示总体和样本中具有某种性质的个体数;分别表示总体和样本中具有某种性质的个体数; 和和 分别表示总体和样本中不具有某种性质的个体数。分别表示总体和样本中不具有某种性质的个体数。 1N1n0N0n7第七章第七章 抽样设计抽样设计 基本概念基本概念抽样技术抽样技术非随机抽样非随机抽样任意抽样任意抽样判断抽样判断抽样配额抽样配额抽样滚雪球抽样滚雪球抽样系统抽样系统抽样分群抽样分群抽样分层抽样分层抽样 其他抽样技术其他抽样技术 简单随机抽样简单随机抽样随机抽样随机抽样 抽样技术分类抽样技术分类8第七章第七章 抽样设计抽样设计 抽样设计过程抽样设计

6、过程定义目标总体定义目标总体确定抽样框架和个体编号确定抽样框架和个体编号选择抽样技术选择抽样技术确定样本量确定样本量执行抽样过程执行抽样过程 抽样设计过程抽样设计过程9第七章第七章 抽样设计抽样设计 抽样设计过程抽样设计过程 确定抽样框架和个体编号确定抽样框架和个体编号抽样框架是指目标总体中个体的表示法,由一份或抽样框架是指目标总体中个体的表示法,由一份或一组用于识别目标总体的指示说明组成。如电话簿、一组用于识别目标总体的指示说明组成。如电话簿、某个行业的公司名录、企事业单位职工名册等。个某个行业的公司名录、企事业单位职工名册等。个体编号是指对调查总体中的个体进行编号。体编号是指对调查总体中的

7、个体进行编号。 确定样本量确定样本量样本量的大小取决于定性与定量因素,样本量的大小取决于定性与定量因素,定性因素定性因素有有决策的重要性、研究的性质、变量的数目、分析的决策的重要性、研究的性质、变量的数目、分析的性质等;性质等;定量因素定量因素有研究对象的变异程度、研究精有研究对象的变异程度、研究精度要求、要求推断的置信度、抽样的方法等。度要求、要求推断的置信度、抽样的方法等。10第七章第七章 抽样设计抽样设计 抽样设计过程抽样设计过程市场调研使用的样本量市场调研使用的样本量11第七章第七章 抽样设计抽样设计 随机抽样随机抽样(书(书P126P126) 简单随机抽样简单随机抽样 是对调查对象不

8、做任何划类、分组、排队等加工整理是对调查对象不做任何划类、分组、排队等加工整理的一种随机抽样的组织形式,也称的一种随机抽样的组织形式,也称单纯随机抽样单纯随机抽样。 在市场调查中适用于总体容量不太庞大、总体单位差在市场调查中适用于总体容量不太庞大、总体单位差异程度小以及总体分布比较均匀的调查对象。异程度小以及总体分布比较均匀的调查对象。. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 样本样本n总体总体N12第七章第七章 抽样设计抽样设计 随机抽样随机抽样

9、简单随机抽样方法简单随机抽样方法抽签法、抽签法、随机数表法随机数表法 如:从如:从100户居民中抽取户居民中抽取11户调查其空调使用情况户调查其空调使用情况13第七章第七章 抽样设计抽样设计 随机抽样随机抽样 系统抽样系统抽样 也称也称或或,首先要选择,首先要选择标志标志将调查对象的将调查对象的全部个体按一定顺序排队,其次要依简单随机抽样方式全部个体按一定顺序排队,其次要依简单随机抽样方式从总体中抽取第一个样本点,即所谓从总体中抽取第一个样本点,即所谓,然后依,然后依据按某种固定顺序和规律(抽样距离)依次抽取其余样据按某种固定顺序和规律(抽样距离)依次抽取其余样本点,最终构成系统样本。本点,最

10、终构成系统样本。 例例:从从1万个体万个体中抽去样本中抽去样本量为量为100的样的样本本抽样距离抽样距离 = 调研总体数(调研总体数(N)/ 样本数(样本数(n)= 10000/100 = 1001 2 100 101 200 300 10,00014第七章第七章 抽样设计抽样设计 随机抽样随机抽样 分群抽样(整群抽样)分群抽样(整群抽样)在分群抽样中,组成总体的所有部分被分为在分群抽样中,组成总体的所有部分被分为若干大群若干大群,而,而样本是随机地从样本是随机地从某一群或几群某一群或几群中获得的。中获得的。群组群组1群组群组2群组群组3群组群组4群组群组5群组群组6群组群组M. . .总体总

11、体N有有M个群组个群组群组群组1群组群组4群组群组7群组群组n. .样本数为样本数为n个群组个群组15第七章第七章 抽样抽样设计设计 随机抽样随机抽样 分群抽样(整群抽样)分群抽样(整群抽样)对总体的构成资料难以了解全面时;对总体的构成资料难以了解全面时;在需要把研究限制在某个特定地区而节约在需要把研究限制在某个特定地区而节约时间和经费时。时间和经费时。分群抽样多在下面两种情况下使分群抽样多在下面两种情况下使用用一个群内的个体应尽可能的异质,各群之间一个群内的个体应尽可能的异质,各群之间应尽可能同质。(常见形式是区域抽样)应尽可能同质。(常见形式是区域抽样)即:在大规模的市场调查中,当群体内各

12、单即:在大规模的市场调查中,当群体内各单位间的误差较大,而各群体之间的差异较小位间的误差较大,而各群体之间的差异较小时,最适宜采用分群抽样方式。时,最适宜采用分群抽样方式。16第七章第七章 抽样设计抽样设计 随机抽样随机抽样 分层抽样分层抽样根据总体构成中根据总体构成中可辨别的或可测量的特征可辨别的或可测量的特征(年龄、收入、文(年龄、收入、文化水平等),将总体分成若干个层次,样本由每个层次里随化水平等),将总体分成若干个层次,样本由每个层次里随机抽出的个体组成。机抽出的个体组成。层次层次Nn. . .层次层次N3层次层次N2层次层次N1总体总体N=N1+N2+ +Nn. . .抽样抽样n1抽

13、样抽样n2抽样抽样n3抽样抽样nm样本数样本数n= n1+n2+ +nm17第七章第七章 抽样设计抽样设计 随机抽样随机抽样 分层抽样分层抽样等比例分层抽样与非等比例分层抽样等比例分层抽样与非等比例分层抽样例例:某地共有居民某地共有居民20000户户,按收入高低进行分类按收入高低进行分类,其中高收其中高收入居民入居民4000户户,占总体占总体20%,中等收入中等收入12000户户,占总体的占总体的60%,低收入为低收入为4000户户,占总体的占总体的20%,从中抽取从中抽取200户进行户进行购买力调查购买力调查1、等比例分层抽样、等比例分层抽样高收入样本数高收入样本数 = 200*20% =

14、40 (户)(户)中等收入样本数中等收入样本数 = 200*60% = 120(户)(户)低收入样本数低收入样本数 = 200*20% = 40(户)(户)18第七章第七章 抽样设计抽样设计 随机抽样随机抽样2、非等比例分层抽样、非等比例分层抽样 分层抽样分层抽样高收入样本数高收入样本数 = 200*1200000/4000000 =60(户)(户)中收入样本数中收入样本数 = 200*2400000/4000000 =120(户)(户)低收入样本数低收入样本数 = 200*400000/4000000 = 20 (户)(户)19第七章第七章 抽样设计抽样设计 非随机抽样非随机抽样 任意抽样任

15、意抽样指事先不确定样本点,根据调查者的方便与否来抽取样本的指事先不确定样本点,根据调查者的方便与否来抽取样本的一种非随机抽样组织形式。如:街头拦人法、空间抽样法。一种非随机抽样组织形式。如:街头拦人法、空间抽样法。操作简便,能及时获得所需要的信息数据,省时省操作简便,能及时获得所需要的信息数据,省时省力,节省调查经费,效率较高,并能为非正式的探索性力,节省调查经费,效率较高,并能为非正式的探索性研究提供很好的数据源。研究提供很好的数据源。 取得的样本偶然性很大,存在着选择偏差取得的样本偶然性很大,存在着选择偏差, 调查结调查结果可信度低。果可信度低。20第七章第七章 抽样设计抽样设计 非随机抽

16、样非随机抽样 判断抽样判断抽样指基于调查人员的指基于调查人员的主观意愿、经验和知识主观意愿、经验和知识,依据对总体有关特征及实际,依据对总体有关特征及实际情况的了解,从目标总体中抽选有代表性的典型单位作为样本单位,或情况的了解,从目标总体中抽选有代表性的典型单位作为样本单位,或由了解情况的专家圈定样本的一种抽样组织形式。由了解情况的专家圈定样本的一种抽样组织形式。确定样本单位的通常做法确定样本单位的通常做法 选择最能代表普遍情况的群体作为样本,常以选择最能代表普遍情况的群体作为样本,常以“平均型平均型”或或“多数多数型型”为标准。避免为标准。避免“极端型极端型”。 利用总体的全面统计资料,按照

17、主观设定的某一标准,选择样本。利用总体的全面统计资料,按照主观设定的某一标准,选择样本。 方便易行,问卷回答率高,适用于探索性研究。方便易行,问卷回答率高,适用于探索性研究。 样本质量取决于调查者的业务素质和对目标总体的了解。样本质量取决于调查者的业务素质和对目标总体的了解。 适用于总体单位规模小,单位间差异较小的情况。适用于总体单位规模小,单位间差异较小的情况。 21第七章第七章 抽样设计抽样设计 非随机抽样非随机抽样 配额抽样配额抽样根据总体的某些特征将总体分成若干个类(组)。样本根据总体的某些特征将总体分成若干个类(组)。样本被选择的可能与他们在总体中的重要程度成正比。在配被选择的可能与

18、他们在总体中的重要程度成正比。在配额抽样中,在每个类别里抽到的额抽样中,在每个类别里抽到的样本不是随机的样本不是随机的。 配额抽样按配额的要求不同分为:配额抽样按配额的要求不同分为:独立控制配额抽样独立控制配额抽样与与 交叉控制配额抽样交叉控制配额抽样 方便易行,成本较低,与其他非随机抽样方法相方便易行,成本较低,与其他非随机抽样方法相比样本更具有代表性。比样本更具有代表性。 样本质量取决于调查者的业务素质和对目标总体样本质量取决于调查者的业务素质和对目标总体的了解。的了解。22第七章第七章 抽样设计抽样设计 非随机抽样非随机抽样 滚雪球抽样滚雪球抽样指以指以“滚雪球滚雪球”的方式,通过少量的

19、样本单位逐步的方式,通过少量的样本单位逐步获取更多样本单位的信息,逐步扩大样本容量的获取更多样本单位的信息,逐步扩大样本容量的方法。方法。能利用样本单位方便快捷地寻找样本单位,有针能利用样本单位方便快捷地寻找样本单位,有针 对性地找到样本单位。对性地找到样本单位。总体单位间必须有一定联系,并愿意提供和保总体单位间必须有一定联系,并愿意提供和保 持这种关系,或至少不反对向外公开这种关系。持这种关系,或至少不反对向外公开这种关系。通常用于对总体缺乏了解,没有现成的抽样框通常用于对总体缺乏了解,没有现成的抽样框 以及那些现象发生率低的事物。以及那些现象发生率低的事物。23滚雪球抽样 例如:假设一个运

20、动器材的生产商,正在考虑向严肃的成年游戏者营销一种桃木槌球装置。在这个很小的市场上,必须找到一个大样本,如100名严肃的成年槌球游戏者。假如最初的抽样从300个人中找到5个缒球游戏者,那么接下来调研者就会要求这5个缒球游戏者提供其他游戏者的姓名。24第七章第七章 抽样设计(下)抽样设计(下)25第七章第七章 抽样设计(下)抽样设计(下)学习目标学习目标 掌握抽样误差的确定方法掌握抽样误差的确定方法 掌握样本估计与样本量确定方法掌握样本估计与样本量确定方法26第七章第七章 抽样设计(下)抽样设计(下)- -抽样误差及其影响因素抽样误差及其影响因素1、什么是、什么是 抽样误差抽样误差抽样误差抽样误

21、差指使用样本指标值对总体指标值进行估计所造成指使用样本指标值对总体指标值进行估计所造成的误差,也称为的误差,也称为或或。2、影响抽样误差的主要因素、影响抽样误差的主要因素 总体单位之间的标志变异程度总体单位之间的标志变异程度 样本容量样本容量 样本的抽取方法(重复抽样与不重复抽样)样本的抽取方法(重复抽样与不重复抽样) 抽样调查的组织形式抽样调查的组织形式 27第七章第七章 抽样设计(下)抽样设计(下)- -抽样误差及其影响因素抽样误差及其影响因素3 3、非抽样误差、非抽样误差非抽样误差非抽样误差指基于抽样误差之外的各种原因引起的误差。指基于抽样误差之外的各种原因引起的误差。4 4、非抽样误差

22、产生的原因、非抽样误差产生的原因 指由不完善的抽样框引起的误差。指由不完善的抽样框引起的误差。 在调查过程中由于各种原因而无法对抽取的样本单元进在调查过程中由于各种原因而无法对抽取的样本单元进行计量,获取不到有关这些单元的数据所造成的估计量行计量,获取不到有关这些单元的数据所造成的估计量的偏误。的偏误。 指抽样调查所获得的数据与其真值不一致所产生的误差,指抽样调查所获得的数据与其真值不一致所产生的误差,也称回答误差也称回答误差。28第七章第七章 抽样设计(下)抽样设计(下)- -抽样误差的确定抽样误差的确定1、抽样分布、抽样分布指在特定的抽样计划下,为指在特定的抽样计划下,为每个每个可能从目标

23、总体中可能从目标总体中抽出的样本所计算的抽出的样本所计算的样本统计量样本统计量的的数值分布数值分布。例:假定从例:假定从20个班级抽取含有个班级抽取含有5个班级的简单随机样个班级的简单随机样本,可以抽出样本量为本,可以抽出样本量为5的不同样本有的不同样本有20*19*18*17*16/5*4*3*2*1=15,504个,这个,这15,504个不个不同样本的平均值的分布就构成了均值的抽样分布。同样本的平均值的分布就构成了均值的抽样分布。对于大样本,均值的、比例的抽样分布是一个对于大样本,均值的、比例的抽样分布是一个正态正态分布分布29第七章第七章 抽样设计(下)抽样设计(下)- -抽样误差的确定

24、抽样误差的确定2、简单随机抽样的抽样误差简单随机抽样的抽样误差 22( )( )(1)(1)xD xSnnnSnnNnN 重复抽样时 不重复抽样时( )( )(1)(1)(1)(1)(1)(1)pD pPPppnnPPppnnnNnN重复抽样时 不重复抽样时 样本平均数抽样误差计算公式样本平均数抽样误差计算公式 样本成数抽样误差计算公式样本成数抽样误差计算公式30第七章第七章 抽样设计(下)抽样设计(下)- -抽样误差的确定抽样误差的确定 目标总体方差具体处理方法:目标总体方差具体处理方法: 用样本方差代替,这是常使用的一种方法。用样本方差代替,这是常使用的一种方法。用过去同类问题全面调查或抽

25、样调查的经验数据用过去同类问题全面调查或抽样调查的经验数据代替。代替。在正式抽样调查之前,组织试验性抽样,用试验在正式抽样调查之前,组织试验性抽样,用试验样本数据代替。样本数据代替。 31第七章第七章 抽样设计(下)抽样设计(下)- -样本估计与推断方法样本估计与推断方法1. 1. 点估计点估计 指直接用样本指标作为总体指标的估计值。指直接用样本指标作为总体指标的估计值。 常见的点估计的形式:常见的点估计的形式:用样本均值用样本均值 来代表总体均值来代表总体均值 ,即,即 ;用样本成数用样本成数 来代表总体成数来代表总体成数 ,即,即 ;用样本方差用样本方差 来代表总体方差来代表总体方差 ,即

26、,即 。 xXXxpPPp2S222S32第七章第七章 抽样设计(下)抽样设计(下)- -样本估计与推断方法样本估计与推断方法( )( )xtxXxtx2. 2. 区间估计区间估计 指在一定把握程度指在一定把握程度 下,用样本指标和其抽样误差来下,用样本指标和其抽样误差来推算总体相应指标取值的可能范围,即总体指标真值所推算总体相应指标取值的可能范围,即总体指标真值所在的区间。在的区间。 ( )F t 在概率把握度在概率把握度 下,由样本指标下,由样本指标 、 所确定的总体参所确定的总体参数数 和和P P的估计区间即置信区间为:的估计区间即置信区间为:( )F t( )( )ptpPptp抽样均

27、抽样均值允许值允许误差误差33第七章第七章 抽样设计(下)抽样设计(下)- -样本估计与推断方法样本估计与推断方法某高校为了解在校学生用于课外进修开支状况,在某高校为了解在校学生用于课外进修开支状况,在本科生和研究生中,采用简单随机重复抽样分别抽本科生和研究生中,采用简单随机重复抽样分别抽取了取了120人和人和80人,调查他们最后一个学期课外进人,调查他们最后一个学期课外进修支出状况。结果如下表所示,请估计全校学生用修支出状况。结果如下表所示,请估计全校学生用于课外进修的平均开支及其在于课外进修的平均开支及其在95%的把握度下的置的把握度下的置信区间。(据学生部的统计,本科生人数占全校人信区间

28、。(据学生部的统计,本科生人数占全校人数的数的70%)34第七章第七章 抽样设计(下)抽样设计(下)- -样本估计与推断方法样本估计与推断方法ix解:全校学生用于课外进修的平均开支为:解:全校学生用于课外进修的平均开支为:KiiistxWx12 .2764 .3293 . 04 .2537 . 0(元)42.369803673 . 01202317 . 0)(22221222KiiiistnSWxS分层抽样的方差为:分层抽样的方差为:分层抽样估计的标准差为:分层抽样估计的标准差为:(元)32.19)()(2ststxSx全校学生用于课外进修的平均开支在全校学生用于课外进修的平均开支在95%置信

29、度下的置信区间是:置信度下的置信区间是:87.313,53.238,22.1996.12 .276)(即ststxtx35第七章第七章 抽样设计(下)抽样设计(下)- - 样本量的确定样本量的确定22222( )( )tnxx222(1)(1)( )( )t PPPPnpp22222222( )( )NtNnNxtNx 在简单随机重复抽样条件下,用样本平均数和成数去推断总在简单随机重复抽样条件下,用样本平均数和成数去推断总体相应指标值时所需要的必要样本容量为:体相应指标值时所需要的必要样本容量为: 在简单随机不重复抽样条件下,用样本平均数和成数去推在简单随机不重复抽样条件下,用样本平均数和成数

30、去推断总体相应指标值时所需要的必要样本容量为:断总体相应指标值时所需要的必要样本容量为:2222(1)(1)( )(1)( )(1)Nt PPNPPnNpt PPNpPP平均数平均数允许误允许误差平方差平方36第七章第七章 抽样设计(下)抽样设计(下)- - 样本量的确定样本量的确定 抽样允许误差(也称极限误差):抽样允许误差(也称极限误差): t 概率度概率度x-1.960.4750.4751.96xx37第七章第七章 抽样设计(下)抽样设计(下)- - 样本量的确定样本量的确定t( )F tt( )F t38第七章第七章 抽样设计(下)抽样设计(下)- - 样本量的确定样本量的确定解:解:

31、,时,2%45.95)(ttF元则1052)(tx239610000210100000100002100000)(22222222txNNtn需要抽取需要抽取396户家庭户家庭8923%,73.99)(nttF时,当此时需抽取此时需抽取892户家庭户家庭39第七章第七章 抽样设计(下)抽样设计(下)- - 样本量的确定样本量的确定(查表)解:96. 1, 4 . 0)(,16. 0508,9500tPPN不重复抽样数目不重复抽样数目:.91612 509500)16.01(16.096.14.09500)16.01(16.0950096.1 )1()()1(222222PPtpNPNPtn40谢 谢22.4.2423:21:0423:2123:2122.4.2422.4.2423:2123:2123:21:0422.4.2422.4.2423:21:042022年4月24日星期日23时21分4秒

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁