《第四章 抽样(精品).ppt》由会员分享,可在线阅读,更多相关《第四章 抽样(精品).ppt(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 抽样抽样 总体总体 抽取样本推断总体样本 第四章第四章 抽样抽样 1.1.抽样的意义与作用抽样的意义与作用 2.2.概率抽样的原理与程序概率抽样的原理与程序 3.3.概率抽样方法概率抽样方法 4.4.非概率抽样方法非概率抽样方法 5.5.样本规模与抽样误差样本规模与抽样误差一、抽样的意义与作用一、抽样的意义与作用1.抽样的意义与作用抽样的意义与作用 人们在研究某个自然现象或社会现象时,人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象对象作调查的情况,于是从中抽取一部分对象作
2、调查,这就是作调查,这就是抽样抽样复杂的社会现象复杂的社会现象 有限的研究资源有限的研究资源 抽样主要涉及和处理有关总体与部分之间的关抽样主要涉及和处理有关总体与部分之间的关系问题。抽样作为人们从部分认识整体这一过系问题。抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种程的关键环节,其基本作用是向人们提供一种实现实现“由部分认识总体由部分认识总体”这一目标的途径和手这一目标的途径和手段。段。抽样抽样一、抽样的意义与作用一、抽样的意义与作用 1.1.抽样的作用抽样的作用 n抽样是社会研究的主要内容之一,也是社会调查抽样是社会研究的主要内容之一,也是社会调查的一个重要步骤。
3、的一个重要步骤。n它与研究目的及研究内容紧密相关。它与研究目的及研究内容紧密相关。n它直接关系到资料的收集、整理与分析。它直接关系到资料的收集、整理与分析。n它还涉及到整个研究的费用以及应用的范围。它还涉及到整个研究的费用以及应用的范围。n抽样是否科学,直接关系到研究的成败抽样是否科学,直接关系到研究的成败侯选人侯选人Literary Digest预测预测%选举结果选举结果%罗斯福罗斯福4362兰顿兰顿5738 一个著名的案例抽样中的泰坦尼克事件n1936年美国正从经济大恐慌中复苏,全国仍有9百万人失业当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角逐文学文摘(Literary Dig
4、est)杂志对结果进行了调查预测他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,邮寄1千万份问卷调查表,回收约240万份工作人员获得了大量的样本,对此进行了精确的计算,根据数据的整理分析结果,他们断言:在总统选举中,兰登将以370161的优势,即以57%比43%,领先14个百分点击败罗斯福与之相反,一个名叫乔治盖洛普的人,对文学文摘调查结果的可信度提出质疑他也组织了抽样调查,进行民意测验他的预测与文学文摘截然相反,认为罗斯福必胜无疑结果,罗斯福以62%比38%压倒性地大胜兰登这一结果使文学文摘销声匿迹,而盖洛普则名声大噪年代年代候选人候选人盖洛普民意测验结果(盖洛普民意测验结果(%)总统选
5、举真实结果(总统选举真实结果(%)盖洛普误差(盖洛普误差(%)2000布什布什48.047.9+0.11996克林顿克林顿52.049.2+2.81992克林顿克林顿49.043.3+5.71988老布什老布什56.053.9+2.11984里根里根59.059.2-0.21980里根里根47.050.8-3.81976卡特卡特48.050.1-2.11972尼克松尼克松62.061.8+0.21968尼克松尼克松43.043.5-0.51964约翰逊约翰逊64.061.3+2.71960肯尼迪肯尼迪51.050.1+0.91956艾森豪威尔艾森豪威尔59.557.8+1.71952艾森豪威尔
6、艾森豪威尔51.055.4-4.41948杜鲁门杜鲁门44.549.5-5.01944罗斯福罗斯福51.553.8-2.31940罗斯福罗斯福52.055.0-3.01936罗斯福罗斯福55.762.5-6.8从美国总统大选预测看抽样的效率:从美国总统大选预测看抽样的效率:一、抽样的意义与作用一、抽样的意义与作用 2.2.抽样的概念抽样的概念抽样的概念抽样的概念n在我们的日常生活中经常存在着抽样。如抽血化验,尝试水温,窥一斑而知全豹。n抽样抽样(samplingsamplingsamplingsampling)从组成某个总体的所有元素的集合中,从组成某个总体的所有元素的集合中,从组成某个总体的
7、所有元素的集合中,从组成某个总体的所有元素的集合中,按一定的方式选择或抽取样本的过程按一定的方式选择或抽取样本的过程按一定的方式选择或抽取样本的过程按一定的方式选择或抽取样本的过程 n抽样调查,就是从研究总体中抽取一部分代表加以调查抽样调查,就是从研究总体中抽取一部分代表加以调查研究,然后用所得结果推论和说明总体的特性。研究,然后用所得结果推论和说明总体的特性。n n总体(总体(总体(总体(populationpopulationpopulationpopulation):):):):构成它的所有元素的集合构成它的所有元素的集合构成它的所有元素的集合构成它的所有元素的集合n n样本(样本(样本
8、(样本(samplesamplesamplesample)从总体中按一定方式抽取出的一部分元从总体中按一定方式抽取出的一部分元从总体中按一定方式抽取出的一部分元从总体中按一定方式抽取出的一部分元素的集合素的集合素的集合素的集合n n抽样单位(抽样单位(抽样单位(抽样单位(sampling unitsampling unitsampling unitsampling unit)一次直接的抽样所使用的基本一次直接的抽样所使用的基本一次直接的抽样所使用的基本一次直接的抽样所使用的基本单位单位单位单位一、抽样的意义与作用一、抽样的意义与作用 n抽样框(抽样框(sampling frame)抽样范围,指
9、一次直接抽抽样范围,指一次直接抽样时总体中所有抽样单位的名单样时总体中所有抽样单位的名单 n参数值(参数值(parameter)是对总体中某一变量的综合描是对总体中某一变量的综合描述述,或总体中所有元素某些特征的综合数量表现。最常,或总体中所有元素某些特征的综合数量表现。最常见的参数值是总体某一变量的平均值。见的参数值是总体某一变量的平均值。n统计值(统计值(statistic)是对样本中某一变量的综合描述是对样本中某一变量的综合描述,或样本中所有元素某些特征的综合数量表现。或样本中所有元素某些特征的综合数量表现。根据样本根据样本计算出来的关于样本变量的数量表现计算出来的关于样本变量的数量表现
10、 n置信度(置信度(confidence level)总体参数值落在样本统计总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间内的把握性程度统计值某一区间内的把握性程度n置信区间(置信区间(confidence intevalue)上述上述“某一区间某一区间”,就是置信区间,就是置信区间二、概率抽样的原理与程序二、概率抽样的原理与程序n n概率抽样:概率抽样:(1 1)每一个体有同等机会被抽取)每一个体有同等机会被抽取 (2 2)每一个体的抽取都是相互独立的)每一个体的抽取都是相互独立的二、概率抽样的原理与程序二
11、、概率抽样的原理与程序n n概率抽样的逻辑概率抽样的逻辑 (1)(1)(1)(1)同质性和异质性同质性和异质性同质性和异质性同质性和异质性 如果研究总体是完全同质的,抽样就没有必要;如果研究总体是完全同质的,抽样就没有必要;如果研究总体是完全同质的,抽样就没有必要;如果研究总体是完全同质的,抽样就没有必要;社会科学中的研究总体往往具有较强的异质性;社会科学中的研究总体往往具有较强的异质性;社会科学中的研究总体往往具有较强的异质性;社会科学中的研究总体往往具有较强的异质性;为了实现为了实现为了实现为了实现“通过部分认识整体通过部分认识整体通过部分认识整体通过部分认识整体”,样本应该包含,样本应该
12、包含,样本应该包含,样本应该包含总体的各种差异特征。总体的各种差异特征。总体的各种差异特征。总体的各种差异特征。二、概率抽样的原理与程序二、概率抽样的原理与程序n n概率抽样的逻辑概率抽样的逻辑 (2 2)代表性和选择的概率代表性和选择的概率 如果总体中的每一个体都如果总体中的每一个体都如果总体中的每一个体都如果总体中的每一个体都具有同等机会具有同等机会具有同等机会具有同等机会被选入被选入被选入被选入样本,那么从这一总体中抽取的样本就能够代表样本,那么从这一总体中抽取的样本就能够代表样本,那么从这一总体中抽取的样本就能够代表样本,那么从这一总体中抽取的样本就能够代表总体。总体。总体。总体。概率
13、抽样的优点概率抽样的优点概率抽样的优点概率抽样的优点 (1)(1)(1)(1)样本对总体更具代表性样本对总体更具代表性样本对总体更具代表性样本对总体更具代表性(相对其它类型抽样相对其它类型抽样相对其它类型抽样相对其它类型抽样)(2)(2)(2)(2)可以对样本的精确性和代表性作出估计可以对样本的精确性和代表性作出估计可以对样本的精确性和代表性作出估计可以对样本的精确性和代表性作出估计二、概率抽样的原理与程序二、概率抽样的原理与程序n n总体分布、样本分布、抽样分布总体分布、样本分布、抽样分布 当样本容量继续增大,样本平均数的分布会进当样本容量继续增大,样本平均数的分布会进当样本容量继续增大,样
14、本平均数的分布会进当样本容量继续增大,样本平均数的分布会进一步发生变化。这种变化趋势是:平均数的范围一步发生变化。这种变化趋势是:平均数的范围一步发生变化。这种变化趋势是:平均数的范围一步发生变化。这种变化趋势是:平均数的范围将逐步缩小将逐步缩小将逐步缩小将逐步缩小(即底部越来越窄即底部越来越窄即底部越来越窄即底部越来越窄);相同的平均数会;相同的平均数会;相同的平均数会;相同的平均数会相应增多;全部平均数的分布向总体平均数集中相应增多;全部平均数的分布向总体平均数集中相应增多;全部平均数的分布向总体平均数集中相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显的趋势也会越来越明显的
15、趋势也会越来越明显的趋势也会越来越明显.总体分布(总体分布(population distribution)总体分布总体分布:总体中各元素的观察值所形成的相对频数(频率)分布 分布通常是未知的分布通常是未知的(因为几乎得不到总体所有观察值因为几乎得不到总体所有观察值)可以(根据理论分析)假定它服从某种分布可以(根据理论分析)假定它服从某种分布 总体总体(sample distribution)n样本分布也称经验分布,指一个样本中各观察样本分布也称经验分布,指一个样本中各观察值的形成的相对频数(频率)分布。值的形成的相对频数(频率)分布。当样本容当样本容量量n逐渐增大时,样本分布逐渐接近总体的分
16、逐渐增大时,样本分布逐渐接近总体的分布。布。样样本本抽样的一般程序抽样的一般程序n界定总体界定总体:对从中抽取样本的总体范围与界限作明确的对从中抽取样本的总体范围与界限作明确的界定界定 n制定抽样框制定抽样框:依据已经明确界定的总体范围,收集总体依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框建立起供抽样使用的抽样框 n决定抽样方案决定抽样方案:选择抽样方法,确定样本规模选择抽样方法,确定样本规模 n实际抽取样本实际抽取样本:1.1.先抽好样本,再调查先抽好样本,再调查先抽好样本,再调查
17、先抽好样本,再调查 2.2.一边抽样一一边抽样一一边抽样一一边抽样一边调查边调查边调查边调查 n评估样本质量评估样本质量:对样本的质量、代表性、偏差等进行初步对样本的质量、代表性、偏差等进行初步对样本的质量、代表性、偏差等进行初步对样本的质量、代表性、偏差等进行初步的检验和衡量的检验和衡量的检验和衡量的检验和衡量概率抽样的方法概率抽样的方法抽样的类型抽样的类型 偶遇抽样偶遇抽样判断抽样判断抽样定额抽样定额抽样雪球抽样雪球抽样简单随机抽简单随机抽系统多层抽样系统多层抽样分层抽样分层抽样整群抽样整群抽样多段抽样多段抽样概率抽样概率抽样非概率抽样非概率抽样抽样类型抽样类型三、概样的方法三、概样的方法
18、1.简单随机抽样简单随机抽样n概念:一般地,设一个总体的个体数为概念:一般地,设一个总体的个体数为N,如果通过逐,如果通过逐个个不放回不放回地抽取的方法从中抽取地抽取的方法从中抽取n(nN)个样本,且每个样本,且每次抽取时各个个体被抽到的次抽取时各个个体被抽到的概率相等概率相等,就称这样的抽样,就称这样的抽样为为简单随机抽样简单随机抽样。n要点:它要求被抽取样本的总体的个体数有限要点:它要求被抽取样本的总体的个体数有限它是从总体中逐个进行抽取它是从总体中逐个进行抽取它是一种不放回抽样它是一种不放回抽样它是一种等概率抽样它是一种等概率抽样用从个体数为用从个体数为N的总体中抽取一个容量为的总体中抽
19、取一个容量为n的的样本,那么每个个体被抽取的概率等于样本,那么每个个体被抽取的概率等于 简单随机抽样简单随机抽样的最基本方法:的最基本方法:1.1.总体较少:搅拌抽签;总体较少:搅拌抽签;2.2.总体较多:用随机数表总体较多:用随机数表 见见P P317317.表表4-24-2 3.利用EXCEL的randbetween(a,b)函数实现简单随机抽样简单随机抽样方法的优缺点简单随机抽样方法的优缺点n优点优点:简便易学简便易学n缺点缺点:不容易做不容易做抽样元素多,编号难抽样元素多,编号难必须能够接触到被选中的个体必须能够接触到被选中的个体搅拌均匀不易搅拌均匀不易三、概率抽样的方法三、概率抽样的
20、方法 2.系统抽样(等距抽样或间隔抽样)系统抽样(等距抽样或间隔抽样)n定义:定义:等距抽样或机械抽样,将总体的单位编号等距抽样或机械抽样,将总体的单位编号排序后,按照固定的间隔抽取个体组成样本的方排序后,按照固定的间隔抽取个体组成样本的方法。法。n步骤:步骤:编号编号确定抽样间距确定抽样间距确定抽样起点确定抽样起点等间距抽样等间距抽样2.系统抽样(等距抽样系统抽样(等距抽样)n优点优点:比随机抽样更比随机抽样更简便易行简便易行n条件条件:抽样框里的元素应该是随机排列抽样框里的元素应该是随机排列的的.三、概率抽样的方法三、概率抽样的方法系统抽样的优缺点如何改进?优点优点:n(1)简单易操作)简
21、单易操作n(2)当对总体结构有一定了解时,充分利用已有)当对总体结构有一定了解时,充分利用已有的信息对总体中的个体进行排队后再抽样,可提的信息对总体中的个体进行排队后再抽样,可提高抽样效率高抽样效率 缺点:缺点:n(3)当总体中的个体存在一种)当总体中的个体存在一种按高低、等级的按高低、等级的自然编号自然编号时,采用系统抽样时,采用系统抽样反而增大抽样误差反而增大抽样误差三、概率抽样的方法三、概率抽样的方法 3.分层抽样分层抽样 n首先将总体中的所有单位按某种特征或标志划分首先将总体中的所有单位按某种特征或标志划分成若干类型或层次,然后再在各个类型或层次中成若干类型或层次,然后再在各个类型或层
22、次中采用简单随机抽样或系统抽样的办法抽取一个子采用简单随机抽样或系统抽样的办法抽取一个子样本,最后将这些子样本合起来构成总体的样本样本,最后将这些子样本合起来构成总体的样本。三、概率抽样的方法三、概率抽样的方法 三、概率抽样的方法三、概率抽样的方法 3.分层抽样分层抽样优点:优点:优点:优点:在不增加样本规模的前提下降低抽样误差,提高抽样精在不增加样本规模的前提下降低抽样误差,提高抽样精度,增大代表性。度,增大代表性。便于了解总体内不同层次的情况,以及对总体中的不同便于了解总体内不同层次的情况,以及对总体中的不同层次进行单独研究或者进行比较。层次进行单独研究或者进行比较。缺点:缺点:缺点:缺点
23、:对抽样框的要求比较高,必须有分层的辅助信息;对抽样框的要求比较高,必须有分层的辅助信息;收集或编制抽样框的费用比较高;收集或编制抽样框的费用比较高;若调查变量与分层的变量不相关,效率可能降低;若调查变量与分层的变量不相关,效率可能降低;三、概率抽样的方法三、概率抽样的方法 3.分层抽样分层抽样n分层的标准问题分层的标准问题以分析的主要变量或相关变量作为分层的标准以分析的主要变量或相关变量作为分层的标准以分析的主要变量或相关变量作为分层的标准以分析的主要变量或相关变量作为分层的标准保证各层内部同质性强,各层之间异质性强保证各层内部同质性强,各层之间异质性强保证各层内部同质性强,各层之间异质性强
24、保证各层内部同质性强,各层之间异质性强以已有明显层次区分的变量作为分层变量以已有明显层次区分的变量作为分层变量以已有明显层次区分的变量作为分层变量以已有明显层次区分的变量作为分层变量n分层的比例问题分层的比例问题按比例分层抽样按比例分层抽样按比例分层抽样按比例分层抽样 不按比例分层抽样不按比例分层抽样不按比例分层抽样不按比例分层抽样 三种抽样方法的比较三种抽样方法的比较类别类别各自特点各自特点相互联系相互联系适用范围适用范围 共同点共同点简单随机抽样简单随机抽样 从总体中从总体中逐个抽取逐个抽取总体中的个总体中的个体数较少体数较少抽样过程抽样过程中每个个中每个个体被抽取体被抽取的的概率相概率相
25、等等系统抽样系统抽样将总体均分成几部将总体均分成几部分,按事先确定的分,按事先确定的规则在各部分抽取规则在各部分抽取在起始部分抽样在起始部分抽样时采用简单随机时采用简单随机抽样抽样总体中的个总体中的个体数较多体数较多分层抽样分层抽样将总体分成将总体分成 几层,几层,分层进行抽取分层进行抽取各层抽样时采用各层抽样时采用简单随机抽样或简单随机抽样或系统抽样系统抽样总体由差异总体由差异明显的几部明显的几部分组成分组成简单随机抽样最简单,但是也是相对复杂的。系统抽样操作简单,简单随机抽样最简单,但是也是相对复杂的。系统抽样操作简单,在有充分的总体信息的前提下,估计精度比随机抽样高,且操作在有充分的总体
26、信息的前提下,估计精度比随机抽样高,且操作、简单。分层抽样由于已经利用了总体信息,因此估计精度也比、简单。分层抽样由于已经利用了总体信息,因此估计精度也比随机简单抽样要高。随机简单抽样要高。三、概率抽样的方法三、概率抽样的方法 4.整群抽样整群抽样 将总体按某种标准划分为一些子群体,每个子群为将总体按某种标准划分为一些子群体,每个子群为一个抽样单位,用随机方法从中抽若干子群,将抽出的一个抽样单位,用随机方法从中抽若干子群,将抽出的子群中的所有个体结合起来构成样本。子群中的所有个体结合起来构成样本。三、概率抽样的方法三、概率抽样的方法 整群抽样特点:整群抽样特点:抽样单位不是单个的个体,而是成群
27、的个体抽样单位不是单个的个体,而是成群的个体 优缺点:优缺点:优点:不需要详细的所有元素的名单,简单,费用低优点:不需要详细的所有元素的名单,简单,费用低 缺点:样本的分布面不广,代表性相对较差缺点:样本的分布面不广,代表性相对较差 整群抽样和分层抽样的比较:整群抽样和分层抽样的比较:子群间异质性强,群内同质性强子群间异质性强,群内同质性强分层抽样分层抽样 子群间同质性强,群内异质性强子群间同质性强,群内异质性强整群抽样整群抽样 三、概率抽样的方法三、概率抽样的方法 5.多阶段抽样多阶段抽样 按抽样元素的隶属关系或层次关系,把抽样分为几个阶按抽样元素的隶属关系或层次关系,把抽样分为几个阶段进行
28、。段进行。例例1:大学:大学院系院系班级班级学生学生 例例2:城市:城市区区街道街道居委会居委会 家庭家庭个人个人 n特征:特征:适用于范围大、总体数量多的社会调查适用于范围大、总体数量多的社会调查 n优缺点:优缺点:优点:不需要总体的全部名单,各阶段的抽样单一般较优点:不需要总体的全部名单,各阶段的抽样单一般较少,容易操作少,容易操作 缺点:每一个阶段都存在误差,抽样误差可能较大缺点:每一个阶段都存在误差,抽样误差可能较大 n应对方法:尽量增加开头阶段的样本数适当减少最后阶应对方法:尽量增加开头阶段的样本数适当减少最后阶段的样本数段的样本数 四、非概率抽样方法四、非概率抽样方法 非概率抽样非
29、概率抽样非概率抽样非概率抽样:又称非随机抽样,就是调查者根据自己的方便或主观又称非随机抽样,就是调查者根据自己的方便或主观又称非随机抽样,就是调查者根据自己的方便或主观又称非随机抽样,就是调查者根据自己的方便或主观判断抽取样本,这样的抽样方法不遵循概率均等的原则。判断抽取样本,这样的抽样方法不遵循概率均等的原则。判断抽取样本,这样的抽样方法不遵循概率均等的原则。判断抽取样本,这样的抽样方法不遵循概率均等的原则。常见的非概率抽样方法常见的非概率抽样方法常见的非概率抽样方法常见的非概率抽样方法:偶遇抽样偶遇抽样 判断抽样判断抽样 定额抽样定额抽样 滚雪球抽样滚雪球抽样滚雪球抽样滚雪球抽样四、非概率
30、抽样方法四、非概率抽样方法 1.1.偶遇抽样偶遇抽样 n定义:方便抽样或自然抽样,指研究者根据现实情定义:方便抽样或自然抽样,指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为或者仅仅选择那些离得最近、最容易找到的人作为对象。对象。n适用范围适用范围可用于经常性的市场调查;可用于经常性的市场调查;可用于正式市场调查之前的试验调查;可用于正式市场调查之前的试验调查;任意调查适用于同质总体。任意调查适用于同质总体。1.1.偶遇抽样偶遇抽样n优点:方便、灵活,简便易行,及时取得所需优点:方便、灵活
31、,简便易行,及时取得所需资料,节约时间和费用成本低资料,节约时间和费用成本低n缺点:样本的代表性差、有很大的偶然性。缺点:样本的代表性差、有很大的偶然性。例:例:1.1.在商场、码头等公共场所调查在商场、码头等公共场所调查 2.2.街头拦截调查街头拦截调查 3.3.报刊的读者调查报刊的读者调查四、非概率抽样方法四、非概率抽样方法 四、非概率抽样方法四、非概率抽样方法 判断抽样判断抽样:也叫立意抽样,研究者根据自己的主观判断来抽选样也叫立意抽样,研究者根据自己的主观判断来抽选样本,分为印象判断抽样和经验判断抽样。本,分为印象判断抽样和经验判断抽样。印象判断抽样:纯粹凭研究者的主观印象抽样印象判断
32、抽样:纯粹凭研究者的主观印象抽样经验判断抽样:根据以往经验和对调查对象的了解抽样经验判断抽样:根据以往经验和对调查对象的了解抽样注意的问题注意的问题:判断抽样的关键是抽样标准的确立,这种方法的运用判断抽样的关键是抽样标准的确立,这种方法的运用与研究者本人的因素比如理论修养、实践经验以及对调查与研究者本人的因素比如理论修养、实践经验以及对调查对象的熟悉程度有关对象的熟悉程度有关 四、非概率抽样方法四、非概率抽样方法 判断抽样:n n适用场合适用场合适用场合适用场合:多用于无法确定总体边界、或总体规:多用于无法确定总体边界、或总体规模小、调查所涉及的范围较窄,或调查时间、人模小、调查所涉及的范围较
33、窄,或调查时间、人力等条件有限而难以进行大规模抽样的情况。力等条件有限而难以进行大规模抽样的情况。n优点优点:可以充分发挥研究人员的主观能动作用。:可以充分发挥研究人员的主观能动作用。样本是按照调查人员的需要来选定的,所以较好样本是按照调查人员的需要来选定的,所以较好地满足了特殊的调查需要。地满足了特殊的调查需要。n缺点缺点:如果调查人员在选取样本时主观判断出现:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。样偏差,则判断抽样极易发生较大的抽样误差。样本的代表性难以判断,不能推论。本的代表性难以判断,不能推论。四、非概率抽样方法四、非概率抽样方法 3.3.定额抽样
34、定额抽样 又称又称又称又称配额抽样配额抽样配额抽样配额抽样,先根据总体各个组成部分所,先根据总体各个组成部分所,先根据总体各个组成部分所,先根据总体各个组成部分所包含的抽样单位的比例分配样本数额,然后由调包含的抽样单位的比例分配样本数额,然后由调包含的抽样单位的比例分配样本数额,然后由调包含的抽样单位的比例分配样本数额,然后由调查者在各个组成部分内根据配额的多少采用偶遇查者在各个组成部分内根据配额的多少采用偶遇查者在各个组成部分内根据配额的多少采用偶遇查者在各个组成部分内根据配额的多少采用偶遇抽样或判断抽样方法抽取样本。抽样或判断抽样方法抽取样本。抽样或判断抽样方法抽取样本。抽样或判断抽样方法
35、抽取样本。四、非概率抽样方法四、非概率抽样方法 滚雪球抽样滚雪球抽样 当无法了解总体时,可以从总体中少数成员入手,对当无法了解总体时,可以从总体中少数成员入手,对当无法了解总体时,可以从总体中少数成员入手,对当无法了解总体时,可以从总体中少数成员入手,对他们进行调查,并进一步询问还知道哪些符合条件的再他们进行调查,并进一步询问还知道哪些符合条件的再他们进行调查,并进一步询问还知道哪些符合条件的再他们进行调查,并进一步询问还知道哪些符合条件的再进一步询问进一步询问进一步询问进一步询问 。例:对球迷、戏迷的调查例:对球迷、戏迷的调查例:对球迷、戏迷的调查例:对球迷、戏迷的调查缺点:同质性较强缺点:
36、同质性较强缺点:同质性较强缺点:同质性较强四、非概率抽样方法四、非概率抽样方法 非随机抽样抽选样本的质量,主要取决于调查非随机抽样抽选样本的质量,主要取决于调查非随机抽样抽选样本的质量,主要取决于调查非随机抽样抽选样本的质量,主要取决于调查者的主观状况和各种偶然因素。者的主观状况和各种偶然因素。者的主观状况和各种偶然因素。者的主观状况和各种偶然因素。优点:简单、易行,可以获得对调查对象的大致了解。优点:简单、易行,可以获得对调查对象的大致了解。优点:简单、易行,可以获得对调查对象的大致了解。优点:简单、易行,可以获得对调查对象的大致了解。缺点:代表性差,调查资料不能从数量上推断总体。缺点:代表
37、性差,调查资料不能从数量上推断总体。缺点:代表性差,调查资料不能从数量上推断总体。缺点:代表性差,调查资料不能从数量上推断总体。五、样本规模与抽样误差五、样本规模与抽样误差 样本规模:又又称称样样本本容容量量,就就是是指指样样本本所所含含个个案案的数量。的数量。确确定定样样本本规规模模也也是是每每一一项项具具体体的的社社会研究所必会研究所必须解决的问题之一须解决的问题之一.l统计学与社会研究的样本统计学与社会研究的样本n统计学中通常以30为界,把样本分为大样本和小样本.n社会研究中的样本规模至少不能少于100个个案,五、样本规模与抽样误差五、样本规模与抽样误差 确定样本规模需要考虑的因素:确定
38、样本规模需要考虑的因素:1.1.推断的把握性与精确度;推断的把握性与精确度;2.2.总体的规模;总体的规模;3.3.总体的异质性程度;总体的异质性程度;4.4.研究者所拥有的资源。研究者所拥有的资源。五、样本规模与抽样误差五、样本规模与抽样误差 1.1.推断的把握性与精确度推断的把握性与精确度 置信度:把握性置信度:把握性置信度:把握性置信度:把握性 置信区间:精确度置信区间:精确度置信区间:精确度置信区间:精确度 一一一一般般般般地地地地说说说说,在在在在其其其其他他他他条条条条件件件件不不不不变变变变的的的的情情情情况况况况下下下下,置置置置信信信信度度度度越越越越高高高高,即即即即推推推
39、推断断断断的的的的可可可可靠靠靠靠程程程程度度度度越越越越高高高高,所所所所要要要要求求求求的的的的样样样样本本本本规规规规模模模模就就就就越越越越大大大大;置置置置信信信信区区区区间间间间越越越越小小小小,即即即即样样样样本本本本值值值值与与与与总总总总体体体体值值值值之之之之间间间间误误误误差差差差范范范范围围围围越越越越小小小小,所所所所要要要要求求求求的样本规模就越大的样本规模就越大的样本规模就越大的样本规模就越大。五、样本规模与抽样误差五、样本规模与抽样误差 不同允许误差水平所需的最少样本量不同允许误差水平所需的最少样本量不同允许误差水平所需的最少样本量不同允许误差水平所需的最少样本
40、量 五、样本规模与抽样误差五、样本规模与抽样误差 2.2.总体的规模总体的规模 在在置置信信度度和和抽抽样样误误差差不不变变的的条条件件下下,样样本本规规模模是是随随着着总总体体规规模模的的扩扩大大而而扩扩大大,但但样样本本占占总总体体的的比重却不断缩小比重却不断缩小。当当总总体体规规模模大大到到一一定定程程度度时时(例例如如100100万万),样样本本规规模的增加对抽样误差的影响就微乎其微。模的增加对抽样误差的影响就微乎其微。例如:美国大选的民意调查中样本通常不超过例如:美国大选的民意调查中样本通常不超过30003000五、样本规模与抽样误差五、样本规模与抽样误差 总体规模与样本规模的关系总
41、体规模与样本规模的关系(置信度置信度95%95%,抽样误差,抽样误差3%)3%)总体规模总体规模总体规模总体规模样本规模样本规模样本规模样本规模样本占总体的比重样本占总体的比重样本占总体的比重样本占总体的比重(%)(%)100035035200046023300048016500055011100006006200006403.2500006501.31000006800.685000007000.14五、样本规模与抽样误差五、样本规模与抽样误差 经验确定样本数的范围经验确定样本数的范围总体规模 100以下以下 100-1000 1000-5000 50001万万 1万万10万万 10万以上万以上 样本所占比重 50以上以上 5020 3010 153 51 1以下以下 五、样本规模与抽样误差五、样本规模与抽样误差 抽样调查中的误差来源:抽样调查中的误差来源:抽样误差抽样误差:抽样的随机性引起:抽样的随机性引起非抽样误差非抽样误差:人为原因导致的误差人为原因导致的误差注意:注意:并非样本规模越大调查结果就越精确!并非样本规模越大调查结果就越精确!