《社会调查研究方法抽样.ppt》由会员分享,可在线阅读,更多相关《社会调查研究方法抽样.ppt(79页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章 抽样第一节 抽样的意义与作用第二节 非概率抽样方法第三节 概率抽样的原理与程第四节 概率抽样方法第五节 户内抽样与PPS抽样第六节 样本规模与抽样误差1 1教学要求:了解抽样的概念、意义了解抽样的概念、意义掌握概率抽样和非概率抽样的的几种方法掌握概率抽样和非概率抽样的的几种方法教学重点:概率抽样教学重点:概率抽样教学难点:概率抽样中的分层抽样教学难点:概率抽样中的分层抽样2 2第一节 抽样的意义与作用1、抽样估计在统计方法中的地位2、抽样的概念3、抽样的作用4、抽样的优越性5、抽样的类型3 31、抽样估计在统计方法中的地位抽样估计在统计方法中的地位4 42、抽样的概念(1 1)总体()
2、总体()总体()总体(population)population)(2 2)样本)样本)样本)样本(sample)(sample)(3 3)抽样)抽样)抽样)抽样(sampling)(sampling)(4 4)抽样单位)抽样单位)抽样单位)抽样单位(sampling unit)(sampling unit)(5 5)抽样框)抽样框)抽样框)抽样框(sampling frame)(sampling frame)(6 6)参数值)参数值)参数值)参数值(parameter)(parameter)(7 7)统计值)统计值)统计值)统计值(statistic)(statistic)(8 8 8 8)
3、抽样误差)抽样误差)抽样误差)抽样误差(9 9 9 9)置信水平与置信区间)置信水平与置信区间)置信水平与置信区间)置信水平与置信区间5 5(1 1)总体()总体()总体()总体(population)population)总体通常与构成它的元素共同定义,总体是构成总体通常与构成它的元素共同定义,总体是构成它的所有元素的集合,而元素则是构成总体的最它的所有元素的集合,而元素则是构成总体的最基本单位。在社会研究中,最常见的总体是由社基本单位。在社会研究中,最常见的总体是由社会中的某些个人组成的,这些个人便是构成总体会中的某些个人组成的,这些个人便是构成总体的元素。的元素。(2 2)样本)样本)样
4、本)样本(sample)(sample)就是从全体或总体中随机抽取出来并用来代表总就是从全体或总体中随机抽取出来并用来代表总体的那部分单位所构成的新的小总体。体的那部分单位所构成的新的小总体。(3 3)抽样)抽样)抽样)抽样(sampling)(sampling)指的是从组成某个总体的所有元素的集合中,按指的是从组成某个总体的所有元素的集合中,按一定的方式选择和抽取一部分元素(即抽取总体一定的方式选择和抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。按一定方式选择或抽取样本的过程。6 6总体与样本总体
5、与样本样样本本总体总体样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方差差差总体均值、总体均值、总体均值、总体均值、比例、方差比例、方差比例、方差比例、方差7 7(4 4)抽样单位)抽样单位)抽样单位)抽样单位(sampling unit)(sampling unit)就是我们可以单独从总体中抽取出来的基本单位。就是我们可以单独从总体中抽取出来的基本单位。一个理想的抽样框的要求是,它应该尽可能地与一个理想的抽样框的要求是,它应该尽可能地与一个理想的抽样框的要求是,它应该尽可能地与一个理想的抽样框的要求是,它应该
6、尽可能地与目标总体相一致。目标总体相一致。目标总体相一致。目标总体相一致。一般而言,如果总体中的每个元素在清单上分别一般而言,如果总体中的每个元素在清单上分别一般而言,如果总体中的每个元素在清单上分别一般而言,如果总体中的每个元素在清单上分别只出现一次,且清单上又没有总体以外的其他元只出现一次,且清单上又没有总体以外的其他元只出现一次,且清单上又没有总体以外的其他元只出现一次,且清单上又没有总体以外的其他元素出现,则该清单就是一个完备的抽样框。在完素出现,则该清单就是一个完备的抽样框。在完素出现,则该清单就是一个完备的抽样框。在完素出现,则该清单就是一个完备的抽样框。在完备的抽样框中,每个元素
7、必须且只能同一个号码备的抽样框中,每个元素必须且只能同一个号码备的抽样框中,每个元素必须且只能同一个号码备的抽样框中,每个元素必须且只能同一个号码对应。对应。对应。对应。(5 5)抽样框)抽样框)抽样框)抽样框(sampling frame)(sampling frame)又称抽样范畴,是从中抽取样本的抽样单位名又称抽样范畴,是从中抽取样本的抽样单位名单。单。8 8(6)参数值)参数值(parameter)关于总体中某一变量的综合指标,在统计中最常见的总体值是某一变量的平均值。(7)统计值)统计值(statistic)它是关于样本中某一变量的综合描述,它是相应的总体值的估计量。9 9(8 8)
8、抽样误差)抽样误差总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时会有偏差,这种偏差就是抽样误差。(9 9)置信水平与置信区间)置信水平与置信区间置信水平是指总体参数值落在样本统计值某一正负区间内的概率,而置信区间是指在某一置信水平下,样本统计值与总体参数值的误差范围。10103、抽样的作用(1)现实生活中有些研究总体是不可能进行全面调查的,只可能调查其中的一部分。(2)节约人力、物力。(3)对其他调查方法所得到的资料的可信性的检验,尤其是对普查资料的修正与补充,必须进行抽样调查。11114、抽样的优越性(1)调查费用较低。(2)速度快(3)应用范围广。(4)可获得内
9、容丰富的资料。(5)准确度高。1212抽样技术抽样技术非概率抽样非概率抽样概率抽样概率抽样方便抽样方便抽样判断抽样判断抽样配额抽样配额抽样滚雪球抽样滚雪球抽样简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样整群抽样整群抽样多级抽样多级抽样其他抽样技术其他抽样技术按比例按比例不按比例不按比例 5 5、抽样的类型、抽样的类型1313第二节 非概率抽样1、偶遇抽样2、判断抽样3、定额抽样4、滚雪球抽样5、空间抽样14141、偶遇抽样偶遇抽样又称做方便抽样或自然抽样,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近的、最容易找到的人作为对象。常见的未经
10、许可的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。其优点就在于方便省力,速度快,可以用于那些需要迅速了解到信息的调查。但是样本的代表性差,带有很大的偶然性。举例说明:15151、偶遇抽样为为为为了了了了调调调调查查查查某某某某市市市市的的的的交交交交通通通通情情情情况况况况,研研研研究究究究者者者者到到到到离离离离他他他他们们们们最最最最近近近近的的的的公公公公共共共共汽汽汽汽车车车车站站站站,把把把把当当当当时时时时正正正正在在在在那那那那里里里里等等等等车车车车的的的的人人人人选选选选作作作作调调调调查查查查对对对对象。象。象。象。其他类似的偶遇抽样还有:其他类
11、似的偶遇抽样还有:其他类似的偶遇抽样还有:其他类似的偶遇抽样还有:在街口拦住过往行人进行调查;在街口拦住过往行人进行调查;在街口拦住过往行人进行调查;在街口拦住过往行人进行调查;在在在在图图图图书书书书馆馆馆馆阅阅阅阅览览览览室室室室对对对对当当当当时时时时正正正正在在在在阅阅阅阅读读读读的的的的读读读读者者者者进进进进行行行行调调调调查查查查;在在在在商商商商店店店店门门门门口口口口、展展展展览览览览大大大大厅厅厅厅、电电电电影影影影院院院院等等等等公公公公众众众众场场场场所所所所向向向向进进进进出出出出往来的顾客、观众进行的调查;往来的顾客、观众进行的调查;往来的顾客、观众进行的调查;往来
12、的顾客、观众进行的调查;利用报刊杂志向读者进行调查;利用报刊杂志向读者进行调查;利用报刊杂志向读者进行调查;利用报刊杂志向读者进行调查;老老老老师师师师以以以以他他他他所所所所教教教教的的的的班班班班级级级级的的的的学学学学生生生生作作作作为为为为调调调调查查查查样样样样本本本本的的的的调调调调查查查查等等等等等。等。等。等。1616实例实例“都市里的吉卜赛人都市里的吉卜赛人对武汉市外来务工、经商对武汉市外来务工、经商人员的调查人员的调查”,”,青年研究青年研究20012001年第年第6 6期,作者:刘玉等期,作者:刘玉等调调查查对对象象。本本次次调调查查以以武武汉汉市市外外来来务务工工、经经
13、商商人人员员为为对对象象。具具体体做做法法如如下下:在在武武汉汉市市外外来来务务工工、经经商商人人员员集集中中的的地地方方(汉汉正正街街)的的几几条条主主街街道道发发放放调调查查问问卷卷,由由调调查查员员按按照照非非随随机机抽抽样样中中的的偶偶遇遇抽抽样样原原则抽取一定的人员进行调查。则抽取一定的人员进行调查。资料的收集方法。本次调查问卷由资料的收集方法。本次调查问卷由5858个问题组成个问题组成,主要询问了外来务工、经商人员的基本社会特征、主要询问了外来务工、经商人员的基本社会特征、工作、收入与支出、观念、社会交往以及对现有工作、收入与支出、观念、社会交往以及对现有生活的满意度等方面的问题。
14、实际发放问卷生活的满意度等方面的问题。实际发放问卷280280份份,回收有效问卷回收有效问卷252252份份,有效回收率有效回收率90 0%90 0%。问卷采用。问卷采用自填法自填法,由被调查者当场填写回收由被调查者当场填写回收,对一些没有上过对一些没有上过学不识字的被调查者采取由调查员根据问卷的内学不识字的被调查者采取由调查员根据问卷的内容逐一访谈的方式完成。容逐一访谈的方式完成。17172、判断抽样判断抽样又称立意抽样,它是研究者根据研究的目标和自己主观的分析来选择和确定研究对象的方法。这种抽样首先要确定抽样标准。这种通过主观判断对样本的选择通常有两种方法,一是找“平均人”的方法,一是找异
15、常个案的方法。小组座谈会调查属于判断抽样。18182、判断抽样案例:我们要对学生抗议活动中的学生领袖进行研我们要对学生抗议活动中的学生领袖进行研究。许多学生领袖是很容易找到的,但是却究。许多学生领袖是很容易找到的,但是却不大可能对所有的学生领袖的样本进行研究。不大可能对所有的学生领袖的样本进行研究。为了对所有的或大多数样本进行研究,就必为了对所有的或大多数样本进行研究,就必须根据研究目的来搜集资料,所运用的抽样须根据研究目的来搜集资料,所运用的抽样方法就是判断抽样法。方法就是判断抽样法。1919实例:实例:“丹江口水库移民生活满意度的调查丹江口水库移民生活满意度的调查”,载社,载社会会2002
16、2002年年6 6月,作者:陆青华。月,作者:陆青华。这这次次我我们们调调查查的的对对象象是是19781978年年前前因因丹丹江江口口水水库库工工程程而而迁迁出出的的移移民民,着着重重是是了了解解他他们们的的生生活活状状况况以以及及对对移移民民生生活活的的满满意意程程度度,希希望望通通过过对对移移民民们们生生活活中中这这一一敏敏感感而而又又关关键键的的问问题题的的把把握握,为为改改善善移移民民工工作作提供一些有价值的参考意见。提供一些有价值的参考意见。本本次次调调查查以以湖湖北北的的宜宜城城市市和和荆荆门门市市的的部部分分乡乡镇镇的的移移民民为为总总体体,采采用用判判断断抽抽样样方方法法选选取
17、取调调查查对对象象。由由于于该该项项调调查查的的指指导导者者王王茂茂福福教教授授对对宜宜城城一一带带较较熟熟悉悉且且得得到到荆荆门门地地区区移移民民局局的的热热情情支支持持,所所以以我我们们首首选选了了这这两两个个地地区区。此此次次调调查查总总样样本本为为人人。其其中中宜宜城城市市为为人人,占占总总样样本本的的%,%,荆荆门市为人门市为人,占总样本的占总样本的%。资料收集方法:问卷法。资料收集方法:问卷法。20203、定额抽样 定额抽样与分层抽样中的比例抽样相似,也是按调查对象定额抽样与分层抽样中的比例抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然的某种属性或特征将
18、总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层所占比例与他们在总体中所后在各层中抽样,样本中各层所占比例与他们在总体中所占的比例一样,占的比例一样,但不同的是,分层抽样中各层样本是随机抽取的,而定额但不同的是,分层抽样中各层样本是随机抽取的,而定额抽样中各层样本是非随机抽取的。抽样中各层样本是非随机抽取的。定额抽样假定:定额抽样假定:(1 1)只要类型划分较细,那么同一个类型中的每一个个)只要类型划分较细,那么同一个类型中的每一个个体都是同质的,因而无需采用随机抽样。体都是同质的,因而无需采用随机抽样。(2 2)只要类型划分合理,且分配给各类的名额符合总体)只要类型划分合理,且分配
19、给各类的名额符合总体中各类人员的分布,那么,样本就可以准确地反映总体。中各类人员的分布,那么,样本就可以准确地反映总体。21213、定额抽样举例如下:1936年美国的盖洛普使用定额抽样的方法成年美国的盖洛普使用定额抽样的方法成功地预测了总统当选人,而同样的方法却也功地预测了总统当选人,而同样的方法却也造成了他在造成了他在1948年的错误预测。年的错误预测。就像概率抽样一样,定额抽样所强调的也是就像概率抽样一样,定额抽样所强调的也是样本的代表性,虽说二者所达到目的的方法样本的代表性,虽说二者所达到目的的方法不一样。不一样。2222表 4-1 年龄年龄所得所得3434岁以下岁以下3535岁以上岁以
20、上合计合计¥1010,000000以下以下21%21%27%27%48%48%¥1010,101101以上以上12%12%40%40%52%52%合计合计33%33%67%67%100%100%组合不同年龄与所得额可形成四种类型:(1)年龄在34岁以下,所得额在10000元以下;(2)年龄在34岁以下,所得额在10101以上;(3)年龄在35岁以上,所得额在10000元以下;(4)年龄在35岁以上,所得额在 10101元以上;定额抽样示例2323定额抽样示例此时,研究者就根据研究目的从不同的格子里选择样本并搜集资料,而代表每一个格子出现的人,则按照这些格子相对于总体的比例,给予加权。当所有的样
21、本的要素都被加权时,这样的资料就可以合理的代表整个总体了。同样,定额抽样的逻辑有时还可以有效地用于实地调查。2424实例:实例:“职业地位:社会分层的指示器职业地位:社会分层的指示器职业地位:社会分层的指示器职业地位:社会分层的指示器上海社会结构上海社会结构上海社会结构上海社会结构与社会分层研究与社会分层研究与社会分层研究与社会分层研究”,仇立平,社会学研究,仇立平,社会学研究,仇立平,社会学研究,仇立平,社会学研究调查方法和样本:调查方法和样本:研研究究总总体体是是具具有有上上海海户户籍籍的的、年年龄龄在在35-6035-60岁岁的的上上海海职工职工(包括部分郊区农民包括部分郊区农民)。由由
22、于于根根据据研研究究框框架架设设计计的的问问卷卷涉涉及及到到许许多多个个人人隐隐私私,如如家家庭庭财财产产、经经济济收收入入、重重大大生生活活事事件件、家家庭庭出出身身或或家家庭庭成成分分等等,因因此此抽抽样样是是采采用用判判断断抽抽样样法法,即即要要求访问员在自己的熟人范围里选择调查对象。求访问员在自己的熟人范围里选择调查对象。考考虑虑到到样样本本的的代代表表性性,访访问问员员在在选选择择调调查查对对象象时时要要按按照照年年龄龄、性性别别、职职业业等等要要求求,按按配配额额抽抽样样方方法法选选择样本。择样本。计计划划样样本本400400个个,有有效效样样本本391391个个,调调查查时时间间
23、是是19991999年年1 1月。月。2525实例:“职业地位:社会分层的指示器职业地位:社会分层的指示器职业地位:社会分层的指示器职业地位:社会分层的指示器上海社上海社上海社上海社会结构与社会分层研究会结构与社会分层研究会结构与社会分层研究会结构与社会分层研究”,仇立平,社会学研究,仇立平,社会学研究,仇立平,社会学研究,仇立平,社会学研究根根据据调调查查结结果果,样样本本的的基基本本情情况况如如下下:男男性性占占59 59 3%3%,女女性性占占40 40 7%7%;平平均均年年龄龄为为46 46 2525岁岁。大大多多数数调调查查对象的教育程度在初中及以上对象的教育程度在初中及以上(95
24、%)(95%)。本本人人平平均均月月收收入入约约10301030元元,家家庭庭平平均均月月收收入入约约20742074元元;家家庭庭平平均均财财产产(包包括括不不动动产产)为为23 23 2929万万(据据9999上上海海年年鉴鉴,19981998年年职职工工月月平平均均工工资资为为10051005元元,20002000年为年为11881188元。文汇报元。文汇报,2000),2000)。虽虽然然样样本本的的本本人人月月收收入入较较接接近近总总体体状状况况;但但由由于于是是非非概概率率抽抽样样,某某些些指指标标如如性性别别、职职业业等等与与总总体体有有较较大大差差别别,且且样样本本较较小小,因
25、因此此样样本本的的资资料料按按抽抽样样理理论论是不能推论总体的,或者在推论时要谨慎。是不能推论总体的,或者在推论时要谨慎。本本调调查查的的目目的的在在于于检检验验以以“职职业业地地位位”作作为为社社会会分分层层标标准准的的有有效效性性和和可可行行性性,以以及及理理论论假假设设的的内内在在逻逻辑性。辑性。2626配额抽样和分层抽样的区别配额抽样和分层抽样的区别二二者者虽虽然然都都依依据据某某些些特特征征对对总总体体进进行行分分层层,但但二二者的目的不同,抽样方法也不同。者的目的不同,抽样方法也不同。定定额额抽抽样样之之所所以以分分层层分分类类,其其目目的的在在于于要要抽抽选选出出一一个个总总体体
26、的的“模模拟拟物物”,其其方方法法则则是是通通过过主主观观的的分析来确定和选择组成这种模拟物的成员。分析来确定和选择组成这种模拟物的成员。也也就就是是说说,定定额额抽抽样样注注重重的的是是样样本本与与总总体体在在结结构构比例上的表面一致性。比例上的表面一致性。2727配额抽样和分层抽样的区别而分层抽样进行分层,而分层抽样进行分层,一方面是要提高各层间的异质性与同层中的同质性,一方面是要提高各层间的异质性与同层中的同质性,另另一一方方面面也也是是为为了了照照顾顾到到某某些些比比例例小小的的层层次次,使使得得所抽样本的代表性进一步提高,误差进一步减小。所抽样本的代表性进一步提高,误差进一步减小。而
27、而其其抽抽样样的的方方法法则则是是完完全全根根据据概概率率原原则则,排排除除主主观观因因素素,客客观观地地。等等概概率率地地到到各各层层中中进进行行抽抽样样,这这与与定定额额抽抽样样中中那那种种“按按事事先先规规定定地地条条件件,有有目目的的地地寻寻找找”的做法是完全不同的。的做法是完全不同的。28284 滚雪球抽样是先从几个适合的调查对象开始,然后通过他们得是先从几个适合的调查对象开始,然后通过他们得是先从几个适合的调查对象开始,然后通过他们得是先从几个适合的调查对象开始,然后通过他们得到更多的调查对象,这样一步步扩大样本范围。到更多的调查对象,这样一步步扩大样本范围。到更多的调查对象,这样
28、一步步扩大样本范围。到更多的调查对象,这样一步步扩大样本范围。当调查总体中的个体信息不充分时,常采用这种方当调查总体中的个体信息不充分时,常采用这种方当调查总体中的个体信息不充分时,常采用这种方当调查总体中的个体信息不充分时,常采用这种方法。法。法。法。例如,某研究部门在调查某市劳务市场中的保姆问例如,某研究部门在调查某市劳务市场中的保姆问例如,某研究部门在调查某市劳务市场中的保姆问例如,某研究部门在调查某市劳务市场中的保姆问题时,题时,题时,题时,先访问了先访问了先访问了先访问了7 7名保姆,名保姆,名保姆,名保姆,然后请她们再提供其他保姆名单,逐步扩大到近百然后请她们再提供其他保姆名单,逐
29、步扩大到近百然后请她们再提供其他保姆名单,逐步扩大到近百然后请她们再提供其他保姆名单,逐步扩大到近百人。人。人。人。通过对这些保姆的调查,对保姆的来源地、从事工通过对这些保姆的调查,对保姆的来源地、从事工通过对这些保姆的调查,对保姆的来源地、从事工通过对这些保姆的调查,对保姆的来源地、从事工作的性质等状况就有了较全面的掌握。作的性质等状况就有了较全面的掌握。作的性质等状况就有了较全面的掌握。作的性质等状况就有了较全面的掌握。还有对政府工作人员心理素质的测试、家用健身器还有对政府工作人员心理素质的测试、家用健身器还有对政府工作人员心理素质的测试、家用健身器还有对政府工作人员心理素质的测试、家用健
30、身器的应用状况、老人问题调查等等。的应用状况、老人问题调查等等。的应用状况、老人问题调查等等。的应用状况、老人问题调查等等。29294 滚雪球抽样滚雪球抽样的主要优点:滚雪球抽样的主要优点:能够保证抽取的样本均具有某总特征,且抽能够保证抽取的样本均具有某总特征,且抽样误差和成本都较小;样误差和成本都较小;这种由推荐获得的样本能够很好地满足抽样这种由推荐获得的样本能够很好地满足抽样对样本的人口统计学和心理统计学的特征的对样本的人口统计学和心理统计学的特征的要求,因为推荐人对这些特征比随机情景更要求,因为推荐人对这些特征比随机情景更熟悉。熟悉。滚雪球抽样的局限性:有许多个体无法找到,滚雪球抽样的局
31、限性:有许多个体无法找到,产生误差。产生误差。3030实例:实例:“城市非自愿离岗女性的社会支持系统城市非自愿离岗女性的社会支持系统北京市个案研北京市个案研究究”,载妇女研究论从,载妇女研究论从20012001年第年第1 1期,作者:张艳霞期,作者:张艳霞这篇文章借鉴组织制度变迁理论、社会网理论和社会性别理论,通过分析北京市26位非自愿离岗者的个案访谈资料,阐述了城市非自愿离岗女性主要的社会支持需求,揭示了离岗女性的社会支持系统是一个由正式支持系统和非正式支持系统共同组成的多元化结构,并分析了在社会支持系统的具体构成和各组成部分的特点上,离岗女性与男性之间的性别差异。3131实例:实例:“城市
32、非自愿离岗女性的社会支持系统城市非自愿离岗女性的社会支持系统北京市个案北京市个案研究研究”,载妇女研究论从,载妇女研究论从20012001年第年第1 1期,作者:张艳霞期,作者:张艳霞这这个个研研究究主主要要采采用用个个案案深深人人访访谈谈和和定定性性分分析析方方法法。全全国国妇妇联联妇妇女女研研究究所所课课题题组组在在19991999至至20002000年年进进行行了了“北北京京市市暂暂不不在在业业女女性性的的社社会会支支持持系系统统”调调查查研研究究,走走访访了了3030位位非非自自愿愿离离岗岗人人员员,其其中中女女性性2222人人,男男性性8 8人人,对对男男性性个个案案的的调调查查研研
33、究究,主主要要是是为为了了补补充充丰丰富富调调查查资资料料和和进进行行男男女女两两性性的的比比较较分分析析。这这篇篇文文章章基基于于对对其其中中2020位位女女性性、6 6位位男男性性个个案案访访谈谈材材料料的的定定性性分分析析。在在个个案案的的选选择择上上,这这个个研研究究使使用用的的是是滚滚雪雪球球抽抽样样方方法法,在在选选择择调调查查对对象象时时,尽尽量量选选择择了了有有代代表表性性的的个个案案。值值得得一一提提的的是是,在在文文章章最最后后,作作者者补补充充到到由由于于采采用用非非概概率率抽抽样样,调调查查对对象象的的代代表表性性有有一一定定局局限。限。32325 空间抽样是针对一个变
34、动的总体,如游行队伍、集会等进行是针对一个变动的总体,如游行队伍、集会等进行抽样的方法,这种总体虽然是变动的,但在空间上抽样的方法,这种总体虽然是变动的,但在空间上是有限的。是有限的。具体做法如下:同时派出若干名经过训练的调查人具体做法如下:同时派出若干名经过训练的调查人员,排成一排均匀地分布在群体的一侧,每个调查员,排成一排均匀地分布在群体的一侧,每个调查者以它所面对的人为第一个调查对象。者以它所面对的人为第一个调查对象。然后按一定的步数间隔穿过聚集的群体,每一间隔然后按一定的步数间隔穿过聚集的群体,每一间隔停顿下来时碰到的人均为调查对象。当然,还可采停顿下来时碰到的人均为调查对象。当然,还
35、可采用其他的方式进行。用其他的方式进行。3333其他的非概率抽样方法 志志愿愿者者抽抽样样:从与调查目标有关的志愿者中抽取样本,如医疗实验,媒体座谈讨论节目等只能从志愿者中抽选参与者。修修正正的的概概率率抽抽样样:是概率抽样与非概率抽样的结合。在多阶段概率抽样中,前几个阶段均采用概率抽样,在最后阶段采用非概率抽样的方法。3434非概率抽样的缺点 非非非非概概概概率率率率抽抽抽抽样样样样不不是是按按照照概概率率均均等等的的原原则则,而而是是根根据据人人们们的的主主观观经经验验或或其其它它条条件件来来抽抽取取样样本本。因因而而,其其样样本本的的代代表表性性往往往往较较小小,误误差差有有时时相相当当
36、大大,而而且且这这种种误误差差又又无无法法估估计计。(非非概概率率抽抽样样由由于于每每个个个个体体进进入入样样本本的的概概率率是是未未知知的的,而而且且由由于于排排除除不不了了调调查查者者的的主主观观影影响响,因因而而无无法法说说明明样样本本是是否否重重现现了了总总体体的的结结构,用这样的样本推论总体是极不可靠的。构,用这样的样本推论总体是极不可靠的。3535非概率抽样的优点 在很大情况下,严格的随机抽样几乎无法进行,例如调查对在很大情况下,严格的随机抽样几乎无法进行,例如调查对象的总体边界不清而无法制作抽样框。此外有些研究为了符象的总体边界不清而无法制作抽样框。此外有些研究为了符合研究的目的
37、,不得不按照需要从总体中抽取少数有代表性合研究的目的,不得不按照需要从总体中抽取少数有代表性的个体作为样本。的个体作为样本。为了保证随机的原则,对抽样的操作过程要求严格,实施起为了保证随机的原则,对抽样的操作过程要求严格,实施起来比较麻烦,费时费力,因此如果调查的目的仅是对问题的来比较麻烦,费时费力,因此如果调查的目的仅是对问题的初步探索,获得研究的线索和提出假设,而不是由样本推论初步探索,获得研究的线索和提出假设,而不是由样本推论总体,采用随机抽样就不一定是必须的。总体,采用随机抽样就不一定是必须的。综综上上所所述述:非非概概率率抽抽样样操操作作方方便便、省省钱钱省省力力,统统计计上上也也远
38、远较较概概率率抽抽样样简简单单,而而且且若若能能对对调调查查总总体体和和调调查查对对象象有有较较好好的的了了解,抽样也可获得相当的成功。解,抽样也可获得相当的成功。3636第三节 概率抽样的原理与程序1 概率抽样的原理2 抽样的一般程序3 抽样设计的原则37371 概率抽样的原理抽样的最终目的在于通过对样本的统计值的描述来抽样的最终目的在于通过对样本的统计值的描述来相对准确地勾画出总体的面貌。概率抽样的方法可相对准确地勾画出总体的面貌。概率抽样的方法可以帮助我们实现这一过程的目标,并且可以对这种以帮助我们实现这一过程的目标,并且可以对这种勾画的准确程度作出估计。随机抽取是这一过程的勾画的准确程
39、度作出估计。随机抽取是这一过程的关键。所谓随机抽取,就是保证总体中的每一个个关键。所谓随机抽取,就是保证总体中的每一个个体都有同等的机会入选样本。体都有同等的机会入选样本。概率抽样之所以能够保证样本对总体的代表性,其概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好地按总体内在结构中所蕴涵原理就在于它能够很好地按总体内在结构中所蕴涵的各种随机事件的概率来构成样本,使样本成为总的各种随机事件的概率来构成样本,使样本成为总体的缩影。体的缩影。38381 概率抽样的原理在讨论概率抽样的问题时,应对有关放回抽样与不放回抽样的问题作出说明:所谓放回抽样是指抽取一个单位后,在抽选下一个单位时
40、把前一个已被抽中的单位放回总体中再进行抽取;所谓不放回抽样则是将已抽中的单位不放回总体,因而每个单位最多只能被抽中一次。3939界定总体界定总体收集全部名单收集全部名单决定样本大小决定样本大小设计抽样方法设计抽样方法评估样本评估样本 2 抽样的一般程序4040界定总体清楚地说明全部研究对象的范围,包括时间、地点和人物。例如,我们要调查兰州市青年对计划生育的态度,可以界定总体范围如下:2005年年中兰州市界乎1525岁之间的居民。总体的定义越清楚越好。由样本所得的结果,原则上只能推论到这个所界定的总体范围。4141收集全部名单例如,从有关的单位取得符合上述总体定义的青年姓名。这份名单,称为抽样框
41、架。在应用前,必须审核其完整性和准确性例如,有无遗漏?有无列于名单上但实际不存在的个案?名单上的个案有无重复或不属研究范围的?4242决定样本大小决定样本大小的一般准则是:根据所能付出的研究决定样本大小的一般准则是:根据所能付出的研究代价的最大限度抽取最大的样本。其实,除了这个代价的最大限度抽取最大的样本。其实,除了这个准则之外,还有两个准则可供参考:我们愿意容忍准则之外,还有两个准则可供参考:我们愿意容忍多少错误?所研究的个案之间的相互差异有多大?多少错误?所研究的个案之间的相互差异有多大?但总的原则是但总的原则是“宁纵无枉宁纵无枉”。4343设计抽样方法不同的抽样方法所犯的抽样误差会很不一
42、样,所需要付出的代价也不一样。因此,我们在抽样时,要小心选择一种较为恰当的方法。4444评估样本的正误如果总体的资料分布与样本的资料分布基本上一致,如果总体的资料分布与样本的资料分布基本上一致,则我们对样本的代表性就有较大的信心。则我们对样本的代表性就有较大的信心。年龄年龄总体总体(N=100000N=100000)样本(样本(n=1000)n=1000)15171517303028281822182250505151232523252020212145453 抽样设计的原则目的性原则。目的性原则是指在进行抽样方案设计目的性原则。目的性原则是指在进行抽样方案设计时,要以课题研究的总体方案和研究
43、的目标为依据。时,要以课题研究的总体方案和研究的目标为依据。可测性原则。可测性原则指的是抽样设计能够从样可测性原则。可测性原则指的是抽样设计能够从样本自身计算出有效的统计值或者抽样变动的近似值。本自身计算出有效的统计值或者抽样变动的近似值。可行性原则。可行性原则是指研究者所设计的抽样可行性原则。可行性原则是指研究者所设计的抽样方案必须在实践上切实可行。方案必须在实践上切实可行。经济性原则。这一原则指的是抽样方案的设计要与经济性原则。这一原则指的是抽样方案的设计要与研究的可得资源相适应。这种资源主要包括研究的研究的可得资源相适应。这种资源主要包括研究的经费、时间、人力等等。经费、时间、人力等等。
44、4646第四节 概率抽样方法1 简单随机抽样2 系统抽样3 分层抽样4 整群抽样5 多阶段抽样47471 简单随机抽样的概念与操作简单随机抽样又称纯随机抽样,是概率抽样的最基本形式。它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(Nn)。4848简单随机抽样的操作有三种方法直接抽选法:即直接从调查对象中随机抽取一个样本。但这种方法有难以完全遵循随机的缺点,因为在抽选的过程中往往受到主观判断的影响,所以采取这种方法时避免主观判断的影响是关键。在正式调查中,很少采用直接抽选法。4949简单随机抽样的操作抽签法:先将研究总体中的每一个单位统一编号,使每一个单位都有一个号,然后将每
45、一个号作成一个卡号并且混合均匀,最后从中随机抽取卡片,直到抽到额定的数目为止。这种方法在一般日常生活中用得比较多。5050简单随机抽样的操作随机数字表法:其具体步骤如下是先取得一份总体所有元素的名单,将总体中所有元素一一按顺序编号,根据总体规模是几位数来确定从随机数表中选几位数码;然后以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;根据样本规模的要求选择出足够的数码个数;依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。5151一千个随机数字0000004 40500509 91011014 41511519 92022024 42522529 900005446544
46、63 32266222662659065905 57063970639793679365 567382673820101153815389 98520585205188518850 03922639226422442249 990669906690202859485941 14075640756824182414 40201502015138513858 8780307803003036114961149 6944069440 1128611286 8821888218589258925 503638036380404052105219 98161981619106510651 1670796
47、7079 9251192511 598885988852522 系统抽样系统抽样又称等距抽样或机械抽样。它是把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。5353系统抽样的具体步骤(1 1)将总体的所有个体前后排列起来。)将总体的所有个体前后排列起来。(2 2)计算抽样距离。抽样距离是由总体大小和样本)计算抽样距离。抽样距离是由总体大小和样本大小决定的,假设总体所含个体数为大小决定的,假设总体所含个体数为N N,样本所含,样本所含个体数为个体数为n n,则抽样距离应为,则抽样距离应为K=N/nK=N/n。(3 3)在头)在头K K个个体中,用
48、完全随机的方式抽取一个个个体中,用完全随机的方式抽取一个个体,设其所在位置的序号是个体,设其所在位置的序号是k k。(4 4)自)自k k开始,每隔开始,每隔K K个个体抽取一个个体,即陆个个体抽取一个个体,即陆续抽取的个体所在位置序号为续抽取的个体所在位置序号为k k,k+Kk+K,k+2Kk+2K,直,直到到k+k+(n-1n-1)K K。5454系统抽样实例 某地区有零售店某地区有零售店110110户,采用系统抽样方法抽取户,采用系统抽样方法抽取1111户进行调户进行调查。查。第一步:将总体调查对象进行编号,即从第一步:将总体调查对象进行编号,即从1 1号到号到110110号;号;第二步
49、:确定抽样距离。调查总体第二步:确定抽样距离。调查总体N=110N=110户,所需样本数户,所需样本数n=11n=11户,所以,抽样距离户,所以,抽样距离K=10K=10户;户;第三步:确定起抽号数。随机地从第三步:确定起抽号数。随机地从1-101-10中抽取一个数作为中抽取一个数作为抽号;抽号;第四步:确定被抽取单位。从起抽号开始,按照抽样距离第四步:确定被抽取单位。从起抽号开始,按照抽样距离选取样本如果随机抽取了选取样本如果随机抽取了2 2为起抽号,那么:为起抽号,那么:2 2 2+10=12 2+10=12 2+10*2=22 2+10*2=22 等等等等 即所抽的样本为编号是即所抽的样
50、本为编号是2 2,1212,2222,3232,一直到,一直到102102共共1111个个零售店。零售店。5555系统抽样的优点 系统抽样不需多次使用随机数字表抽取个体,系统抽样不需多次使用随机数字表抽取个体,而只需按间隔等距抽样即可而只需按间隔等距抽样即可系统抽样的另一个优点是样本在总体中的分系统抽样的另一个优点是样本在总体中的分布更均匀,故而抽样误差小于或至多等于简布更均匀,故而抽样误差小于或至多等于简单随机抽样,即较其更准确。单随机抽样,即较其更准确。565620111011大家晚上好今天的安排复习上次讲过的内容讲新的内容课堂练习5757复习上次讲过的内容什么是抽样?抽样有什么意义?抽样