《第三章抽样调查.pptx》由会员分享,可在线阅读,更多相关《第三章抽样调查.pptx(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节第一节 抽样调查中的有关概念抽样调查中的有关概念 在进行抽样设计的过程中,常常要涉及以下一些在进行抽样设计的过程中,常常要涉及以下一些基本概念:基本概念: 一、总体一、总体 总体是指调查对象的全体,亦即通过调查要了解、研究的全部市场对象。例如,假设要调查衡阳市有多少家庭拥有电脑,拥有电脑的家庭与没有电脑的家庭有什么区别,那么调查总体就是衡阳市的所有家庭。第三章第三章 抽样调查抽样调查 样本是由总体中抽取的部分个体构成。每一个被抽到的个体或单位,就是一个样本。例如上面讲的衡阳市家庭电脑拥有率的调查中,被抽到的家庭就构成该项调查的样本,每一个被抽到的家庭就是一个样本。 样本中包含个体的数量,
2、就是所谓的样本量。在调查实施之前,样本量事先确定。 二、样本和样本量 为了便于实现概率抽样,常常将总体划分为若干个互不重叠的部分,每个部分都叫做一个抽样单元。例如,在衡阳市区进行概率抽样,可以把衡阳市区分成几个行政区(如蒸阳区、雁峰区等)作为一级抽样单元,再进一步按街道划分为二级抽样单元,二级抽样单元还可以进一步划分下去。抽样时,给每一个抽样单元赋予一个被抽中的概率,这个概率可以是相等的,也可以是不相等的。 三、抽样单元 在样本设计时,必须有一份全部抽样单元的资料,这份资料就叫做抽样框。如人员名单、地图、电话簿、户口档案、企业名录等都可以作为抽样框。在抽样框中,每个抽样单元都应该有自己对应的位
3、置或序号,这常常通过编号来实现。 四、抽样框样本是总体的一部分,虽然有代表性,但并不等于总样本是总体的一部分,虽然有代表性,但并不等于总体。因此从样本得出的结果估计总体总是会产生一定体。因此从样本得出的结果估计总体总是会产生一定误差,这种由抽样引起的误差就叫做抽样误差。抽样误差,这种由抽样引起的误差就叫做抽样误差。抽样误差越小,估计值的精度就越高。抽样误差是客观存误差越小,估计值的精度就越高。抽样误差是客观存在的但是抽样误差的大小与抽取的样本能否代表总体在的但是抽样误差的大小与抽取的样本能否代表总体有密切的关系。为了使抽样误差减小,要尽可能的使有密切的关系。为了使抽样误差减小,要尽可能的使样本
4、的结构与总体的结构相一致。样本的结构与总体的结构相一致。五、抽样误差和非抽样误差五、抽样误差和非抽样误差 非抽样误差是指在抽样调查中由于人为因素造非抽样误差是指在抽样调查中由于人为因素造成的误差。这种误差是由研究者、访问员和受调查成的误差。这种误差是由研究者、访问员和受调查者造成的。例如由于调查方法不当引起的受调查者者造成的。例如由于调查方法不当引起的受调查者的反应不当;访问员工作不认真、不仔细所造成的的反应不当;访问员工作不认真、不仔细所造成的记录错误;受调查者拒绝配合或不认真作答等等。记录错误;受调查者拒绝配合或不认真作答等等。这类误差是无法测量的,但它可以通过诸如加强对这类误差是无法测量
5、的,但它可以通过诸如加强对访问员的培训,提高调查人员的素质,采用合理的访问员的培训,提高调查人员的素质,采用合理的资料采集手段方法,设计高效的问卷等手段来克服。资料采集手段方法,设计高效的问卷等手段来克服。 六、抽样调查抽样是一种选择样本的程序和方法。抽样调查,是指从市场母体中抽取一部分子体作为样本对样本进行调查,然后根据样本信息,推算市场总体情况的调查方法。抽样调查是广告营销调查中应用最多的方法,它具有以下明显的特点:(1)可以节省调查费用(2)在科学选取样本的前提下,可以比较准确地推断总体(3)应用范围广泛,特别适用于研究市场现象的数量表现; 第二节第二节 抽样调查的基本程序抽样调查的基本
6、程序 抽样调查,特别是随机抽样,有比较严格的设计程序,只有按一定步骤,才能保证调查的顺利完成,取得应有的效果。抽样调查一般分为以下几个步骤: 一、确定调查总体和抽样单元 二、确定置信度和最大允许误差 三、确定样本数量 四、选择抽样方式进行抽样 五、收集样本资料计算样本指标 六、用样本指标推断调查总体指标 置信度指由抽样调查结果来推断总体情况时,保证其抽样误差不超出允许范围的概率水平,抽样推断可靠程度有高低之分,通常用%表示。在抽样调查中,置信度通常为90%,95%和99%。 对于置信度与抽样误差之间的关系,在数理统计中,常用正态分布来描述它,即在抽样误差前乘以t,并使置信度成为t的分布函数F(
7、t),将两者关系对应起来建立正态分布概率表,以便使用时查找。这样任何一个置信度都可以查到对应的t值。如上面提到的90%、95%、99%,所对应的t值分别是:1.65,1.96,2.58。同样任何一个t值也可以查到对应的置信度。t=1时置信度为68.27%,t=2时置信度为95.45%。 确定置信度和最大允许误差之间的关系第三节第三节 随机抽样调查随机抽样调查 随机抽样是按照随机原则在调查母体中进行抽样。这里的随机原则是指保证母体内每个样本被抽取机会都均等的原则。又称“均等原则”。 随机抽样方法多种多样,其中最主要的有简单(单纯)随机抽样、分层随机抽样与分群随机抽样。(一)简单随机抽样 简单随机
8、抽样的指在抽样过程中,抽样人员完全排除了任何有目的选择,采用纯粹偶然的方法从调查母体中抽样。1、抽签法 抽签法(又称丢骰子法)是简单随机抽样中一种常用方法。2、随机号码表法(随机数表示) 随机数又称乱码表。它由摇码机逐个摇出或电子计算机自动生成的一组按二位数(或三位)从09十个自然数的组合表。随机号码表最早出现在英国,后来在其他国家得到广泛的应用。拟在900人中抽取20个样本,可以从下表中任何一个数字开始从左到右,从上到下,连续(或间隔相同位数)进行抽样。16 22 77 94 3984 42 17 53 61 63 01 63 78 5933 21 12 34 2957 60 86 32 4
9、418 18 07 92 4626 62 38 97 7523 42 40 64 7462 36 28 19 9537 85 94 35 1249 54 43 54 8257 24 55 06 88 16 95 55 67 1978 64 56 07 8209 47 27 96 5444 17 16 58 0984 16 07 44 9982 97 77 77 8150 92 26 11 9783 39 50 08 3017 37 93 23 78 77 04 74 47 6798 10 50 71 7562 42 07 44 3840 17 46 09 6279 83 86 19 6283
10、11 46 32 2407 45 32 14 0800 56 76 31 3842 34 07 96 8887 35 20 96 4321 76 33 50 2512 86 73 58 0715 51 00 13 4290 52 84 77 2706 76 50 03 1020 14 85 88 4532 98 94 07 7280 22 02 53 5354 42 06 87 98随机号码表(乱数表) 简单随机抽样是随机抽样的最基本的方法,也是其他随机抽样法的基础。 优点:方法简单,易于理解,直接从总体中抽取样本,抽取概率相同,计算抽样误差及总体指标比较方便。 不足:总体很大的情况下使用,编
11、号工作量繁重;当总体单位差异程度较大时,必须使样本数目足够大才能保证样本推断总体的可靠程度和准确程度;所抽取的样本在总体中的分布或过于集中而不具有代表性,或过于分散而给实际调查带来困难。 分层随机抽样是先将总体按一定标准分层,然后在各层中采用简单随机抽样方式抽取样本的一种抽样方式。由于事先对调查母体进行分层,所以,这种抽样方法的实质是分层加简单随机抽样,它可以提高抽样结果的代表性。 常用的分层随机抽样的形式有分层比例抽样和分层最佳抽样。 1、分层比例抽样 分层比例抽样是指分层以后,按各层占母体比例份额,用简单随机抽样方法进行抽样的一种方法。计算公式如下:二、分层随机抽样分层比例抽样计算公式:n
12、i =(Ni /N) n ni :第i层应抽取的样本数 Ni :第i层样本总数 N :调查母体的样本总数 n :设定的样本数 分层比例抽样法适用于各层具有明显差异,各层内部具有较好一致性,各层在母体中所占比例不过分悬殊的市场母体的调查之中。N 【例题1】某地区有百货商店10 000户,其中大型、中型与小型百货商店分别为1000、2000、7000户,当抽样数为200户时,若用分层比例抽样法应从各层中各抽多少个样本?大型: n大 = 1000/10000200=20(户)中型: n中 = 2000/10000200=40 (户)小型; n小 = 7000/10000200=140 (户)2、分层
13、最佳抽样(非比例抽样法) 分层最佳抽样是指在分层比例抽样的基础上,再根据各层样本标准差的大小,而调整各层样本数的一种抽样方式。计算公式: ni =(Ni Si / Ni Si ) n【例题2】某公司要预测某地区家用电器的潜在用户,这种商品的消费同居民收入水平有关,因而以家庭收入为分层基础。假定该地区居民户即整个母体数为1887户,已确定样本数为200户,家庭收入分高、中、低三层,其中收入高的家庭户为75户,中等收入的家庭为755户,低等收入的家庭为1057户。试用最佳比例抽样法确定各层的样本数。公式中:ni :各层应抽出的样本数目n :样本总数目Ni :第i层的调查单位数Si :第i层的调查单
14、位的样本标准差提示:根据经验,估计高收入层的收入离差为5000元,中收入层的收入离差为3000元,低收入层的收入离差为1000元。(1)求高收入层样本的标准差 根据标准差公式有: S高 = 50002 /200 =353元 S中 = 30002 /200 =212元 S低 = 10002 /200 =71元(2)求各层最佳抽样的样本数 根据计算公式有: n高 = (N高高 S高高 / NS ) n =(75 353/26475+160060+75047) 200=20(户)其中,其中,NS= N高高 S高高 + N中中 S中中+ N低低S低低=261582 同理依次可得出中、低收入的样本数为1
15、22户和58户。 某部门要调查城市居民家用电器潜在的需求数量,这种商品的消费量与居民收入水平相关,且总体中基本单位之间差异较大,因此应先按家庭收入作为分层标准分层。假定该市居民户即调查总体中含家庭总数100万户,已确定计划抽取样本1000个。家庭收入按高、中、低分层,其中高收入户为15万户,中等收入户为65万户,低收入户为20万户。试用最佳比例抽样法确定各层的样本数。(假定标准差估计值为, S高= 300,S中 = 200,S低= 50,)【练习】: 层每层中调查单位总数( Ni ):万各层中标准差估计值(Si )积(Ni Si ):万 高 153004500 中652001300 低2050
16、1000合计18500分层抽样的优点 :1、由于总体中常有少数特殊单元,在简单随机抽样得到的样本里,这些特殊单元所占的比例容易过高或过低,从而影响估计量的精度。分层抽样可以将这些特殊单元作为一层,尽量避免上述情况,使样本更具有代表性;2、可以根据需要对各层的特性加以比较;3、从管理和实施上看,比简单随机抽样便利得多。二、分群随机抽样 分群随机抽样是将市场调查母体划分为若干个群体,然后将若干群体作为抽样样本,采用单纯随机抽样方法确定并对选定群体内的全体样本进行普遍调查的一种方法。 分群随机抽样与分层随机抽样的区别在于:分层随机抽样要求层间异质,层内同质;而分群随机抽样正好相反,它要求群间同质,群
17、内异质。 以居民收入为例,分层随机抽样与分群随机抽样见下图所示。高收入层低收入层中收入层高、高、高高、中、低A群中、中、中低、低、低高、中、低高、中、低B群C群分层随机抽样构成分群随机抽样构成非随机抽样是指抽样时不遵循总体中每个单位都有客观相等的被选中机会的原则,而是按照调查人员主观的判断或标准抽选样本的抽样方法。常用的非随机抽样法主要有:任意抽样法、判断抽样法、配额抽样法、系统抽样法。第四节、非随机抽样一、任意抽样法(Convenient Sampling) 任意抽样法也称便利抽样法,是一种任意选取样本的方法。街头拦人法和方便选择法是任意抽样法的两种最常见的方式。优点:(1)无须精心选取样本
18、 (2)能及时获得所需的信息 (3)省时、省力,节约调查支出二、判断抽样法(Judgement Sampling) 判断抽样法也称目的抽样法,是由调查人员根据主观经验判断而选择调查样本的一种非随机抽样方法。常用判断抽样法有典型抽样调查法和重点抽样调查法两种。优点:(1)抽样简便易行 (2)调查回收率高 调查人员根据调查母体某些属性特征进行分层,对分层后的各次副母本进行配额,配额内的样本抽取由调查人员主观判断抽样的方法。 是非随机抽样中使用最广泛的一种抽样方法。按分配样本数量的不同的不同方法,配额抽样法可分为独立控制和相互控制两种类型。 1、独立控制配额抽样 2、相互控制配额抽样三、配额抽样法(
19、Quota sampling)1、独立控制配额抽样 独立控制配额是指只规定集中控制特性以及各控制特性的抽样配额,而不规定这几种控制特性之间的各抽样配额的相互关系,即控制特性的抽样配额是彼此独立的一种非随机抽样方法。【例题例题】用独立控制配额抽样法调查某品牌服饰的市场需求状况。计划抽取400人,按收入、年龄、性别特征分层,如下表所示。收入水平 人数年龄段人数性别人数 高收入 80 18-34岁 80男200 35-44岁 120 中收入120 45-60岁 140女200 低收入200 60岁以上 60 400 400400表一:独立控制配额抽样表2、相互控制配额抽样 相互控制配额抽样,又称交叉
20、控制配额抽样。指在分层时,严格规定各控制特性的抽样比例,而且在配额时,也严格规定了各控制特性每一副次母体间的相互交叉关系。【例题例题1】试用相互控制配额抽样法设定某品牌皮服的样本配额。假设:计划抽样数400人,其中:高、中、低收入的比例为4610;四个年龄段的比例为4673;男、女性别的比例为11。相互控制配额抽样大致步骤(1)选择控制特性。上例选取收入水平、年龄段、性别三个特征作为分层的标志。(2)确定各控制特性的层次及各层的比例。如例题中:年龄段分4层,由低到高各段比例为4673;收入水平分高中低3层,各层比例为4610;性别分为男女2层,各层比例为11。(3)按比例确定各层样本数。高收入
21、层样本数=400(4/20)=80(人),其中男、女各40人;中收入层样本数=400(6/20)=120 (人),其中男、女各60人;低收入层样本数=400(10/20)=200 (人),其中男、女各100人。(4)样本交叉配额分配。如例题中高收入层男性样本40人按年龄段的比例分为8、12、14、6人;以此类推。最后,按行、列汇总,使行与列的合计总数都等于400。表二:相互控制配额抽样表(见投影仪)【例题例题2】用相互控制配额抽样法调查某地居民消费情况。将这些人按年龄、职业和收入特征分层,如下表所示。假设:其中:高、中、低收入的比例为4115;四个年龄段的比例为5843;年龄职业收入18-34
22、岁50 工人80 高4035-49岁80机关干部知识分子70 中11050-59岁40 低5060 以上30其他职业50 合计200 合计200 合计200【练习练习】 某社区拟抽取样本240人,其中按收入水平分高、中、低三层,其比例为121;年龄段分为老中青三层,其比例为132;职业分为公务员、工人、农民、商人四层,其比例为1211;性别分为男、女两层,其比例为11。试按相互控制配额抽样设计,将配额数填入下表。四、系统抽样法系统抽样法又称等距抽样法。它是将调查母体内全部样本进行统一有序编号,再按一定距离,确定样本单位的区间数。1、系统抽样法的基本步骤:(1)编号(2)计算区间数K。K=N/n
23、。(3)抽样。在第一区间段内,随机抽取一个样本,则第2,3,K段的抽样号码分别为第一段的抽样号码加上1K,2K,(K-1),K即可。 (1)方法简单,适用于大规模调查;(2)样本数均匀分布在总体中,代表性强。【例题例题2】某地区有零售商店110户,假设所确定抽取的样本数为11,试用系统抽样法,对零售商店进行调查。【练习练习】某城市有个人电话簿500页,每页200个电话号码,现拟用系统抽样法,分别用判断抽样法或简单随机抽样法抽取500个样本进行电话调查,问如何抽取样本数?2、系统抽样法的特点第五节第五节 样本容量样本容量一、确定样本容量需考虑的因素 1、调查目的 2、总体性质和特点 3、调查条件
24、二、确定样本容量的方法 n=(t/2d)2 其中: n 样本量 t 与置信度相对应的函数值 d 允许最大误差假设要了解衡阳市平均每一家庭每年用于旅游方面的费用是多少,要求置信度为95%,误差不超过3%,问至少应该调查多少家庭? d=1-95%=0.03,t= 1.96 n=(t/2d)2 = ( 1.96 /2 0.03 ) 2 1067收入水收入水平平N N高高=60=60N N中中=120=120N N低低=60=60=2=24 40 0年龄段年龄段n n老老1010n n中中3030n n青青2020n n老老2020n n中中6060n n青青4040n n老老1010n n中中303
25、0n n青青2020=2=24 40 0公务员公务员1 1 1 1 3 3 3 3 2 2 2 2 2 2 2 2 6 6 6 6 4 4 4 4 1 1 1 1 3 3 3 3 2 2 2 2 =4=48 8工人工人2 2 2 2 6 6 6 6 4 4 4 4 4 4 4 4 1 1 2 2 8 8 8 8 2 2 2 2 6 6 6 6 4 4 4 4 =9=96 6农民农民1 1 1 1 3 3 3 3 2 2 2 2 2 2 2 2 6 6 6 6 4 4 4 4 1 1 1 1 3 3 3 3 2 2 2 2 =4=48 8商人商人1 1 1 1 3 3 3 3 2 2 2 2 2 2 2 2 6 6 6 6 4 4 4 4 1 1 1 1 3 3 3 3 2 2 2 2 =4=48 8性别性别男男女女男男女女男男女女男男女女男男女女男男女女男男 女女男男女女男男女女=2=24 40 0