教学课件:第五章-抽样调查及其方法.ppt

上传人:wuy****n92 文档编号:92011065 上传时间:2023-05-30 格式:PPT 页数:109 大小:661.50KB
返回 下载 相关 举报
教学课件:第五章-抽样调查及其方法.ppt_第1页
第1页 / 共109页
教学课件:第五章-抽样调查及其方法.ppt_第2页
第2页 / 共109页
点击查看更多>>
资源描述

《教学课件:第五章-抽样调查及其方法.ppt》由会员分享,可在线阅读,更多相关《教学课件:第五章-抽样调查及其方法.ppt(109页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、社会调查理论与方法社会调查理论与方法Research Methods in Social SciencesResearch Methods in Social SciencesResearch Methods in Social SciencesResearch Methods in Social Sciences第五章 抽样调查及其方法1 1 抽样的概念和程序抽样的概念和程序2 2 非随机抽样及其方法非随机抽样及其方法3 3 随机抽样及其方法随机抽样及其方法4 4 随机抽样中的几个实际问题随机抽样中的几个实际问题5 5 抽样误差与样本规模抽样误差与样本规模6 6 抽样调查的优点与局限性抽样调

2、查的优点与局限性抽样调查(Sampling survey)运用一定的方法在调查对象总体中抽取一部分调查对象作为样本,并对样本调查结果来推断总体的方法一、基本概念调查对象(元素)调查对象(元素)(element)调查对象是构成总体的最基本单位,是搜集信息的单位和进行分析的基础 调查总体调查总体 调查总体是研究者从中实际抽取调查样本的个体的集合体 例如1:人口普查调查总体:全国人口。例如2:韶关人调查调查总体:在韶关市区生活、工作、学习,且有韶关市户口,年龄在1660周岁的中国公民。样本样本 样本(sample)就是从总体中按一定方式抽取出的一部分元素的集合 一个样本就是总体的一个子集 抽样抽样

3、所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程过程 抽样是从总体中按一定方式选择或抽取样本的过程 抽样单位抽样单位(sampling unit)抽样单位就是一次直接的抽样所使用的基本单位 指在抽样各阶段中考虑选取的某个元素或者某组元素 在更复杂的抽样中,需要采用不同层次的抽样单位例如:从全班例如:从全班5050人中抽取人中抽取1010人人构成小样本,构成小样本,个人个人(学生)是抽(学生)是抽样单位样单位抽样框抽样框 抽样框(sampling frame)又称做抽样范围,它指的是一次直接抽样时总体中所有抽样单

4、位的名单 二、抽样调查的特点与作用二、抽样调查的特点与作用 1、抽样调查的特点、抽样调查的特点 1)按随机原则抽样 2)样本推论总体 3)抽样误差可以控制 4)节省人力财力和时间5)调查对象只是作为样本的一部分抽样单位。2、抽样调查的作用、抽样调查的作用 不在于说明样本本身的情况,而是要从数量上推断总体,说明总体。抽样方法是架在研究者十分有限的人力、财力和时间与庞杂、广阔、纷繁、多变的社会现象之间的一座桥梁。是人们从部分认识整体的关键环节。3、抽样调查的适用情况:、抽样调查的适用情况:1)有些现象不可能进行全面调查,但又需要了解全面情况时,可采用抽样调查。2)有些现象可以但没有必要进行全面调查

5、时,可采用抽样调查。3)需要对普查统计资料的质量进行检验或修正时,可采用抽样调查。例:1984年美国总统选举预测与实际结果比较%里根蒙代尔时代时代/扬基拉维奇扬基拉维奇今日美国今日美国/黑蛇发女怪黑蛇发女怪哥伦比亚广播公司哥伦比亚广播公司/纽约时代周刊纽约时代周刊盖洛普民意测验盖洛普民意测验/新闻周刊新闻周刊实际投票结果实际投票结果美国广播公司美国广播公司/华盛顿邮报华盛顿邮报哈里斯民意测验哈里斯民意测验罗珀民意测验罗珀民意测验6464636361615959595957575656555536363737393941414141434344444545四、抽样的类型抽样方法非概率抽样概率抽样

6、多段抽样系统抽样分层抽样整群抽样简单随机抽样偶遇抽样判断抽样定额抽样雪球抽样五、抽样调查的一般程序五、抽样调查的一般程序 1、设计抽样方案 2、界定调查总体 3、选择抽样方法 4、编制抽样框 5、实际抽取样本 6、评估样本质量1 1、设计抽样方案:、设计抽样方案:根据研究目的、总体特征、客观条件选择不同的抽样方案。并同时根据调查的精确程度和可靠性的要求,确定样本规模。1)根据研究的目的要求;2)依据各种抽样方法的特点;3)考虑其他有关因素。2、界定调查总体、界定调查总体:就是根据调查课题的要求,把所要调查的对象的范围加以确定。首先要界定研究总体,即从理论上明确定义的所有调查单位的集合体。然后再

7、界定调查总体。例如:韶关人调查,怎样确定调查总体?文摘杂志的错误?盖洛普的成功主要得益于其选取样本的方法。首先他分析了选民酌的性别、年龄、社会阶层、人种等。还分析了人口数量分布特征。再依据分析结果对样本数量进行分配。这就保证了选取样本的质量,在调查方法上他们也否定邮寄问卷的方式,从所选取的调查对象尽可能地用直接面谈的方法进行调查。3、选择抽样方法、选择抽样方法:随机抽样,还是非随机抽样?凡是从数量上推断调查总体的抽样调查,都必须采取随机抽样。例如:题目:韶关市老年人生活状况调查。准备采取抽样调查,是采取随机抽样方法还是非随机抽样方法?4、制定抽样框:、制定抽样框:根据已经明确的总体围,根据已经

8、明确的总体围,收集总体中全部收集总体中全部抽样单位的名单抽样单位的名单,并通过对名单进行并通过对名单进行统一编号统一编号来建立来建立其供抽样使用的抽样框。其供抽样使用的抽样框。如果是分阶段抽样,应该根如果是分阶段抽样,应该根据抽样方案据抽样方案分阶段制定分阶段制定。5、实际抽取样本:、实际抽取样本:从抽样框中抽取一个个的抽样样本,构成调查样本。可以先抽好样本再调查 也可以边抽部分样本边调查6、评估样本质量:、评估样本质量:样本评估:对样本的质量、代表性、偏差等等进行初步的检验和衡量,其目的是防止由于样本的偏差过大而导致调查的失误。方法:对比 非随机抽样:依据研究者的主观意愿、判断或是否方便等因

9、素来抽取对象的方法。偶遇抽样偶遇抽样判断抽样判断抽样定额抽样定额抽样滚雪球抽样滚雪球抽样(一)偶遇抽样(一)偶遇抽样(accidental or convenience sampling)又称方便抽样或自然抽样。指研究者根据现又称方便抽样或自然抽样。指研究者根据现实情况,以自己方便的形式抽取偶然遇到的实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。近的、最容易找到的人作为调查对象。街头拦人、邮寄式调查、杂志内问卷调查街头拦人、邮寄式调查、杂志内问卷调查 区别于随机抽样区别于随机抽样(二)判断抽样

10、(二)判断抽样 (judgmental sampling)(judgmental sampling)又叫又叫立意抽样立意抽样(purposive sampling)(purposive sampling)调查者调查者根据研究的目标和自己主观的分析根据研究的目标和自己主观的分析来选择和确来选择和确定调查对象的方法定调查对象的方法典型调查经常使用这种方法。典型调查经常使用这种方法。难点难点:确定抽样标准:确定抽样标准优点优点:发挥研究者主观能动性:发挥研究者主观能动性缺点缺点:无法判断样本代表性:无法判断样本代表性例如:某村村民对基层选举的看法的调查。例如:某村村民对基层选举的看法的调查。判断抽样

11、判断抽样适用范围:适用范围:1.1.总体结构差异较大,样本容量较小总体结构差异较大,样本容量较小2.2.无法确定总体边界无法确定总体边界3.3.研究者的时间和设备有限无法进行概率抽样研究者的时间和设备有限无法进行概率抽样(三)定额抽样(三)定额抽样涵义:又称作配额抽样;l首先,研究者对总体进行分层,并找出具有首先,研究者对总体进行分层,并找出具有各种不同特征的成员在总体中所占的比例。各种不同特征的成员在总体中所占的比例。l然后选择研究对象,使样本成员在各种特征然后选择研究对象,使样本成员在各种特征上的构成尽量接近总体的结构。上的构成尽量接近总体的结构。注意:注意:a a、按事先规定的条件,有目

12、的地寻找。、按事先规定的条件,有目的地寻找。b b、与分层抽样区分、与分层抽样区分性别独立控制配额抽样性别样本男99女101总计200婚姻状况独立控制配额抽样婚姻状况样本已婚142未婚58总计200举例:分层标准:性别、婚姻状举例:分层标准:性别、婚姻状况、年龄,况、年龄,n=200年龄独立控制配额抽样年龄样本18308031506550以上55总计200举例:分层标准:性别、婚姻举例:分层标准:性别、婚姻状况、年龄,状况、年龄,n=200举例:分层标准:性别、婚姻状况、举例:分层标准:性别、婚姻状况、年龄,年龄,n=200交互控制配额抽样 已婚 未婚 合计 男 女男 女 1830 20 25

13、20 15 803150 25 228 10 6550以上 24 262 3 55小计 69 7330 28总计 142 58 200练习:假设某高校有4000名学生,其中男生占60,女生占40;文科学生和理科学生各占50;一年级学生占40、二年级、三年级、四年级学生分别占30、20和l0。现在要用定额抽样方法依上述三个变数抽取一个规模为100人的样本。依据总体的构成和样本规模,我们得到的定额表 男生(60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(30人)年级一 二 三 四一 二 三 四一 二 三 四一 二 三 四人数?依据总体的构成和样本规模,我们得到的定额表 男生(

14、60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(30人)年级一 二 三 四一 二 三 四一 二 三 四一 二 三 四人数12 9 6 312 9 6 38 6 4 28 6 4 2英克尔斯在研究“人的现代性”时的配额抽样设计(四)雪球抽样(四)雪球抽样 (snowball sampling)当我们无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并再询问他们知道的人。如同滚雪球一样,我们可以找到越来越多具有相同性质的群体成员。注意:具体如何操作。概率抽样是按照概率原理进行的,它要求样本的抽取具有随机性。随机原则就是

15、使总体中每一个体都有一个已知不为零的被选机会进入样本。特点:能够避免抽样过程中的人为误差,保证样本的代表性。所谓随机抽取,就是保证总体中的每一个个体都有同等的机会入选样本。或者说,总体中的每一个成员被抽中的概率相等(也即被抽中的机会相等)。而且,任何一个个体的入选与否,与其他个体毫不相关,互不影响。对于投掷硬币的结果(总体)来说,只有正面和反面(个体)两种可能。每次投掷硬币相当于一次抽样过程(从两种可能性中抽取一种);这种抽样是随机的(两种可能性都可能出现,且出现的机会均等)尽管一次具体的随机抽样(一次投掷)只会有一种结果,或者说出现某一种情况(正面或反面)的概率为100;但是若下次不同的抽样

16、的结果,却总是趋向于两种情况出现的次数各为50即趋向于两种不同结果本身所具有的概率,或者说趋向于总体内在结构中所蕴涵的随机事件的概率。最好的例子:投掷硬币随机抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样一、简单随机抽样(simple random sampling)又称纯随机抽样,是概率抽样的最基本形式。常用的方法:A、总体元素较少时,类似于抽签方法。B、总体元素较多时,随机数表法基本原理:从N中抽取n 练习练习 1 1:我系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取60人进行调查。具体方法(总体元素少时):先编制一个抽样框,把总体各单位编上号码写在纸片上搓成纸团,作成

17、签和阄(给每个学生编号,从001到300,并写在纸片上);然后,把签和阄放在一个盒子内搅拌均匀;最后,随机从盒子内抽取签和阄,被抽中的签和阄上的号码所代表的单位就是样本,直到抽满规定的样本为止(从300张纸条里抽取60张,并找相关同学)。特点:总体单位很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法经常在总体规模较小的时候使用简单随机抽样随机数表总体元素多时,采用随机数表利用随机数表进行抽样的具体步骤:先取得一份总体所有元素的名单(即抽样框)将总体中所有元素一一按顺序编号 根据总体规模是几位数来确定从随机数表中选几位数码 以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍 根

18、据样本规模的要求选择出足够的数码个数 依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素 对照附表中的随机数表,练习随机抽样。要从5000个人(或其他分析单位)的总体中用简单随机抽样的方法选取500个人作为样本进行调查。练习 2步 骤首先,将总体中所有的人编码:本例中编码为1-5000。接下来的问题是从随机数表中随机选取500个数字。这500个数字所对应的人就是样本。接下来是确定所选择的随机数需要几位数。需要有四位数字才能保证所有人都有被选中的机会。(如果总数为21654的话,需要选择五位数的随机数)。因此,我们要从0001到9999的数字中抽取100个随机数。我们可以随意确定表格中选

19、取数字的顺序:依纵列的方向向下选取,也可以依纵列的方向往上选取,由左到右或者由右到左,也可以依对角线的方式选取。什么方式并不重要,关键是从头到尾贯彻使用这种方法。这里我们为了方便选择从纵列方向,当一列到了末端时,可以从下一列最顶端选起,当一页选完以后,可以从下一页的第一纵列继续选取。决定从那里开始。可以闭着眼睛随便戳一个数字。也可以随意想一个行号和列号。假设我们从第二行第三列的0623为起点,那么第一个样本就为0623,由第三列往下,我们选择4430,0175,2011,3126,4860依次进行,选足500个随机数。样本的编码就为0623等。二、等距随机抽样(systematic sampl

20、ing)又称系统抽样或机械抽样具 体 方 法:a、给总体的每一个个体按顺序编上号码,即制定出抽样框;(同简单随机抽样)b、计算出抽样间距,方法是使用总体的规模(N)除以样本的规模(n),即K=N nc、在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号,称作随机的起点;A d、在抽样框中间,自随机起点A开始,每间隔K个个体抽取一个个体;e、抽取n个个体,构成总体的一个样本。注意:总体中个体的排序是随机的。练习练习:在某大学总共3000名学生中,抽取一个容量为100的大学生样本。具体步骤给总体中的每一个个体按顺序编号,即制定出抽样框 计算出抽样间距。计算方法是用总体的规

21、模除以样本的规模:KN N(总体规模)n n(样本规模)K=K=在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为A),它称做随机的起点 e.g.如果K=10,就从01-10号中抽签决定一个号码作为起点,假定为05在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个体的编号分别为A,A十K,A十2K,A十(n一1)K 将这n个个体合起来,就构成了该总体的一个样本 001011021031091002012022032092003013023033093004014024034094005015025035095006016026.0

22、96007017027097008018028098009019029099010020030100随机起始的分层系统抽样 值得注意的是,系统抽样的一个十分重要的前提条件,是总体中个体的排列,相对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。因此,我们在使用系统抽样方法时,一定要注意抽样框的编制方法。注意:总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况 例如:我们从2000户家庭的社区,抽取50户进行消费状况的调查,而2000户家庭的名单是按照家庭收入的多少按照由高到低排列的。抽样间距=2000/50=40 如果两个

23、人选择样本,一个人选择初始号码为3,另一个人选择初始号码为38,那么肯定前者家庭平均收入远远高于后者。解决措施:重新编排总体名单;改用其他抽样方法。总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况 例如:某大学总共3000名学生,抽取100人,抽样间隔为30。但是如果总体名单按教学班排列、每班刚好30人左右,而且各班的名单按照成绩高低排列,如果样本的初始号为2号,那么样本全是好学生;如果样本初始号为25 号,样本全部为差学生。系统抽样系统抽样优缺点:优点:易于实施,工作量少。样本在总体中分布更为均匀,抽样误差小于或至多等于简单随机抽样。系统抽样系统抽样缺点:系统抽样系统抽样是以总体

24、的随机排列为前提,如果总体的排列出现有规律分布时,会使系统抽样系统抽样产生极大误差。当总体内个体类别之间的数目悬殊过大时,样本的代表性可能较差。(3)适用范围:系统抽样系统抽样最适用于同质性较高的总体。等距抽样课堂练习1某杂志对其订阅者进行一次邮寄访问,以更好地了解读者市场。N=150万,n=1500。如何抽取样本?关于“等距随机抽样”课堂练习题2:计算题计算题:l某调查总体人数10000人,样本数是500人,按等距随机抽样方法,起抽号是10,请问第351人的样本号码是几号?解:间距K=N/n=10000/500=20 已知A=10 所以第351号样本号码为:10+(3511)20=7010课

25、外练习课外练习从编号1到900的总体中用系统抽样的办法抽取9个样本某产品共有2563件,产品按出厂顺序编号,号码从1到2563,检测员要从中抽取15件产品进行检测,请给出一个系统抽样方案。要考察某商场2006年的日销售额,从一年时间中抽取52天的销售额作为样本,请给出你的系统抽样方案,并说说你的抽样方案的优点和不足三、分类随机抽样 (stratified sampling)又称做分层随机抽样,类型随机抽样是先将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地域等)划分为若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样本,最后,将这些子样本合起来构成总

26、体的样本。分类分类随机随机抽样抽样总体子群样本分层随机抽样示意图例:800家私营企业,抽取100家。(譬如:我们调查的主题是看各种不同类型企业为国家创税情况)步骤:(1)800家企业按产业分为3个类型,第一产业80个,第二产业320个,第三产业400个。(2)第一产业10%,100*10%应该抽取10个 第二产业40%,100*40%应该抽取40个 第三产业50%,100*50%应该抽取50个 (3)按照简单随机抽样或等距随机抽样抽取样本。优点当一个总体其内部分层明显时,分层抽样能够克服简单随机抽样的缺点。采用分层抽样的最基本目的,正是在于把异质性较强的总体分成一个个同质性较强的子总体,以便提

27、高抽样的效率,达到更好的抽样效果。有些研究不仅要了解总体的情形,而且还要了解某些类别的情形,分层抽样可以同时满足这两个要求,因为我们可以将每一类(层)看作一个总体。此外,对总体的不同部分还可以采用不同的抽样方法。需要注意:分层的标准问题(分层原则):以调查所要分析和研究的主要变量或相关的变量作为分层的标准。以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。以那些已有明显层次区分的变量作为分层变量。分层的比例问题:按比例分层:指的是按照各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。不按比例分层:便于对不同层次的子总体进行专门研究或进行相互比较,但

28、若要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理。分层的比例问题:按比例分层:指的是按照各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。EgEg:某学校某学校20002000名学生中男生占了名学生中男生占了60%60%,女生占,女生占40%40%。按比例分。按比例分层抽样抽取层抽样抽取120120名学生,就需要分别抽取名学生,就需要分别抽取7272名男生和名男生和4848名女生。名女生。用按比例分层抽样的方法能得到更有代表性的样本。用按比例分层抽样的方法能得到更有代表性的样本。不按比例分层:便于对不同层次的子总体进行专门研究或进行相互比较。练习1:20000户

29、居民,按经济收入高低分类,高收入居民4000户,占总体20%;中等收入12000户,占总体60%;低收入户4000户,占总体20%,从中抽取200户,进行购买力调查。按比例分层抽样高收入层样本数=?户中收入层样本数=?户低收入层样本数=?户练习2:某高一学生共某高一学生共500500人,经调查,喜欢人,经调查,喜欢数学的学生占全体学生的数学的学生占全体学生的3030,不喜欢数学,不喜欢数学的人数占的人数占4040,介于两者之间的学生占,介于两者之间的学生占3030。为了考察学生的其中考试的数学成绩,如何为了考察学生的其中考试的数学成绩,如何用分层抽样抽取一个容量为用分层抽样抽取一个容量为505

30、0的样本?的样本?练习3:某公司有某公司有500人,其中人,其中35岁以下的岁以下的125人,人,3549的的280人,人,50以上的以上的95人。为了调人。为了调查员工的身体健康情况,从中抽取查员工的身体健康情况,从中抽取100人,怎人,怎样用分层抽样抽?样用分层抽样抽?四、整群随机抽样 (cluster sampling)整群抽样:又称为聚类随机抽样或者集体随机抽样),它是从总体中随机抽取一些小的群体,然后由所抽出的若干小群体(家庭、学校中的班级、工厂的车间、城市中的居委会)内的所有元素构成抽样调查的样本。最大特点是:抽样单位不是单个的个体,而是成群的个体。从总体中随机抽取一些小的群体,所

31、抽取的若干小群体内的所有元素构成调查的样本。整群抽样中对小群体的抽取可采用简单随机抽样、系统抽样或分层抽样的方法。具体步骤 A、先将总体各单位按一定的标准分成许多群体,并将每一个群体看做一个抽样单位。B、利用简单随机抽样、系统随机抽样或分层抽样从这些群体中抽取若干作为样本。C、对样本群体中每一个单位逐个进行调查。例如:某中学共有100个班级,每班都是30名学生,总共有3000名学生,现在要抽300名学生作为样本进行体检。整群抽样示意图划分划分子群子群随机随机抽样抽样优点:简便易行节省费用缺点:样本分布面不广样本对总体的代表性相对较差几种抽样方法的比较假设我们的总体是全国所有城市的集合,我们要抽

32、取一个规模为40个城市的样本。请分别用简单随机抽样、系统抽样、分层抽样和整群抽样方法进行抽样,并比较彼此之间的异同。比较分层抽样和整群抽样分层抽样分层抽样整群抽样整群抽样样本每层均要选取子样本作为总样本的一部分只选择某几个子群作为整体的代表 层与层的关系层的划分具有较高的代表性,即层之间异质性高 群间异质性低群间异质性低层内性质 层内则尽可能同质 群内异质性高群内异质性高变量选择 研究变量的选择与研究问题高度相关 研究变量与研究问题相关五、多阶段随机抽样(multistage sampling)又称为多级抽样或分段抽样是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行 e.g.大学院

33、系班级学生具体操作从总体中随机抽取若干大群,从大群中抽取小群,一层层抽,抽到最基本的抽样元素为止。例 1:调查某市青年工人的状况以企业为单位抽样,即以全市所有企业为抽样框,从中随机抽取一部分企业 在抽中的企业里,以车间为抽样单位抽样,即从全部车间中抽取若干个车间 再在抽中的车间内抽取青年工人 注 意:在运用多段抽样方法时,需要注意的是要在类别和个体之间保持平衡,或者,保持合适的比例。假设某市共有2.4万名教师,他们分布在全市10个区的200所学校中。现在要抽取一个由1200名教师组成的样本。例 2:抽样方案选择第一阶段第二阶段第三阶段方案1:方案2:方案3:方案4:方案5:方案6:方案7:方案

34、8:方案9:抽抽1010个区个区抽抽2 2个区个区抽抽1010个区个区抽抽8 8个区个区抽抽5 5个区个区抽抽4 4个区个区抽抽3 3个区个区抽抽2 2个区个区抽抽1 1个区个区每个区抽每个区抽4 4所学校所学校每个区抽每个区抽2020所学校所学校每个区抽每个区抽2020所学校所学校每个区抽每个区抽1515所学校所学校每个区抽每个区抽1212所学校所学校每个区抽每个区抽1010所学校所学校每个区抽每个区抽1010所学校所学校每个区抽每个区抽1010所学校所学校每个区抽每个区抽2020所学校所学校每个学校抽每个学校抽3030名教师名教师每个学校抽每个学校抽3030名教师名教师每个学校抽每个学校抽

35、6 6名教师名教师每个学校抽每个学校抽1010名教师名教师每个学校抽每个学校抽2020名教师名教师每个学校抽每个学校抽3030名教师名教师每个学校抽每个学校抽4040名教师名教师每个学校抽每个学校抽6060名教师名教师每个学校抽每个学校抽5050名教师名教师某县20个乡镇,每个乡镇有10个行政村,每个行政村有10个自然村,每个自然村有50户。这样,全县就共有200个行政村,2000个自然村,10万户。现在决定采用多段抽样方法对该县计划生育状况按5/1000的比例进行抽样调查,共抽取500户,如何抽?练习步 骤首先,确定抽样单位。根据该县社会组织的4个层次,即乡镇、行政村、自然村和户,采取4段抽

36、样抽取样本。乡镇为1级单位,行政村为2级单位,自然村为3级单位,户为4级单位。(4级单位也可以是企业、车间、班组、工人;学校、年级、班组、学生。)采用不同的方法,分4段逐步抽取样本:一段抽样,从县抽到乡镇。适宜用分层抽样(由于该县乡镇之间经一段抽样,从县抽到乡镇。适宜用分层抽样(由于该县乡镇之间经济发展状况差异较大)。济发展状况差异较大)。具体做法 首先,编制抽样框。假定以经济发展状况为标准,将该县的20个乡镇分为经济发展状况较好的、一般的和较差的3类,分别为4个、12 个、4个。其次,确定样本的数量。假定在一级单位中抽取25%的单位即5个乡镇作为样本。再次,按照随机抽样和上述比例,在经济状况

37、较好的4个乡镇中抽取1个乡镇,一般的几个乡镇中抽3个乡镇,较差的4个乡镇中抽1个乡镇作为样本。具体做法:首先,编制抽样框。就是把第1级样本中的5个乡镇的50个行政村(2级单位),按一定的标准(如按空间分布)确定他们的编号1-50。其次,计算抽样间隔。假定从第2级单位中抽取20%的单位即10个行政村作为第2级样本,其间隔就是50/10=5。再次,抽取第一个样本,我们随机抽取第3个行政村作为样本。这样我们就抽到了第3、8、13、18、23、28、33、38、43、48这些行政村作为样本。二段抽样,从乡镇抽到行政村,采用系统抽样。二段抽样,从乡镇抽到行政村,采用系统抽样。三段抽样,从行政村抽到自然村

38、,为了便于集中调查,三段抽样,从行政村抽到自然村,为了便于集中调查,节约人财物力和时间,我们采用整群抽样。节约人财物力和时间,我们采用整群抽样。具体做法:首先,划分群体,将2级样本10个行政村所属的100个自然村,按照地理位置把每两个相近的自然村划分为一个群体,共50个群体。其次,抽取第3级样本,即按照随机抽样的原则从50个群体中抽出10个群体作为第3级样本。四段抽样,从自然村到户。(为了简便,选用简单随机四段抽样,从自然村到户。(为了简便,选用简单随机抽样)抽样)某市某市2323个区,个区,714714万人,从中抽万人,从中抽10001000人的样本人的样本 将区作为初级抽样单位将区作为初级

39、抽样单位 每区人数不等,把每区人数的号码范围列出,东区每区人数不等,把每区人数的号码范围列出,东区是是1-1200001-120000号,西区是号,西区是120001-270000120001-270000号号一直排到一直排到71400007140000号号 从这些号码中用随机数字表确定从这些号码中用随机数字表确定1010个号码,这个号码,这1010个个号码所落入的区即为调查区。如抽中号码所落入的区即为调查区。如抽中340000340000号,它落号,它落在南区,则南区为调查区在南区,则南区为调查区从这从这1010个调查区中,每区再随机抽取个调查区中,每区再随机抽取100100人就构成最人就构

40、成最终样本终样本多阶段抽样练习本节自学一、样本规模样本规模又称为样本容量,它指的是样本中所含个案的多少确定样本规模也是每一项具体的社会研究所必须解决的问题之一统计学中通常以30为界,把样本分为大样本(30个个案及以上)和小样本(30个个案以下)当样本规模大于30时,其平均值的分布将接近于正态分布二、影响样本规模确定的因素总体的规模 估计的精确性要求 总体的异质性程度 研究者所拥有的经费、人力和时间 抽样的精确性置信度又称为置信水平,它指的是总体参数值落在样本统计值某一区间的概率,或者说,总体参数值落在样本统计值某一区间中的把握性程度。它反映的是抽样的可靠性程度一般来说,在其他条件一定的情况下,

41、置信度越高,即推论的把握性越大,则所要求的样本规模就越大置信区间是指在一定的置信度下,样本值与总体值之间的误差范围。它所反映的是抽样的精确性程度。范围越大,精确性程度越低;范围越小,精确性程度越高在其他条件一定的情况下,置信区间越小,即样本值与总体值之间的误差范围越小,则所要求的样本规模就越大总体的异质性程度 一般来说,要达到同样的精确性,在同质程度高的总体中抽样时,所需要的样本规模就小一些;而在异质程度高的总体中抽样时,所需要的样本规模就大一些。原 因同质性越高,表明总体在各种变量上的分布越集中,波动性越小,同样规模的样本对总体的反映就越难确。异质性程度越高,表明总体在各种变量上的分布越分散

42、,波动性越大,同样规模的样本对总体的反映就会越差。三、样本规模与抽样误差抽样误差就是用样本值去估计总体值时所出现的误差。它是由于抽样本身的随机性所引起的误差。抽样误差主要取决于总体的分布方差和抽样规模,这两个因素都可以导致抽样误差的增加或降低。注 意对于比较小的样本来说,样本规模上的很小的一点增加,便会带来精确性方面很明显的增加 而对于比较大的样本来说,同样增加这么多个个案,却收效甚微 一、抽样调查的优点l有利调查的客观性和真实性有利调查的客观性和真实性l有利对总体进行定量研究有利对总体进行定量研究l有利提高调查效率有利提高调查效率l可以广泛应用可以广泛应用一、抽样调查的局限性l只宜于做定量研

43、究,不宜定性研究只宜于做定量研究,不宜定性研究l调查广度和深度有限调查广度和深度有限l难于调查新生事物、隐晦现象难于调查新生事物、隐晦现象l数学等知识要求高,难以普及数学等知识要求高,难以普及练习1、调查城市居民的情况,拟抽取、调查城市居民的情况,拟抽取1000样本。该城市有样本。该城市有500个居委会,每个居个居委会,每个居委会平均有委会平均有100户居民。利用整群抽样户居民。利用整群抽样如何操作?如何操作?2、对北京市现住人口进行调查,由于流、对北京市现住人口进行调查,由于流动人口的不确定性,很难得到现住人口动人口的不确定性,很难得到现住人口的住户清单。的住户清单。(1)在这种条件下应该采

44、取那种概率抽在这种条件下应该采取那种概率抽样方法?样方法?(2)大概的思路应该如何?大概的思路应该如何?3 3、某大学食堂为了了解新生的饮食习、某大学食堂为了了解新生的饮食习惯,以分层抽样方式从惯,以分层抽样方式从15001500名新生中名新生中抽取抽取200200人进行调查,新生中南方学生人进行调查,新生中南方学生500500人,北方学生人,北方学生800800人,西部学生人,西部学生200200人,如何抽?人,如何抽?4 4、某市电视台在网上征集节目现场观、某市电视台在网上征集节目现场观众,报名的总人数众,报名的总人数1200012000人,来自人,来自4 4城城区,东城区区,东城区24002400人,西城区人,西城区46054605人,人,南城区南城区37953795人,北城区人,北城区12001200人。用分人。用分层抽样抽取层抽样抽取6060人参加,如何抽?人参加,如何抽?

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁