《4 7 第四章第七节抽样法.ppt》由会员分享,可在线阅读,更多相关《4 7 第四章第七节抽样法.ppt(109页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 第七第七节 抽抽样法法 抽样调查抽样调查一、一、抽样调查的理解抽样调查的理解二、二、抽样的术语与程序抽样的术语与程序三、三、随机抽样与非随机抽样随机抽样与非随机抽样 一、一、抽样调查的理解抽样调查的理解l抽样调查抽样调查:指从调查研究中抽出一部分要素指从调查研究中抽出一部分要素作为样本,对样本进行调查,并根据抽样所作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性调查活动。得的结果推断总体的一种专门性调查活动。l抽样调查实际一种专门组织的非全面调查。l抽样调查是现代调查中的重要组织形式,是国际上公认和普遍采用的科学的调查手段。l哲学原理:一般反映总体情况 就是指将
2、样本的结论推论到总体的结论。l抽样调查的理论依据 l抽样调查数据之所以能用来代表和推算总体,主要是因为抽样调查本身具有其它非全面调查所不具备的特点,主要是:l(1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。l(2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体。l(3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。l(4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位
3、之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。l基于以上特点,抽样调查被公认为是非全面调查方法中用来推算和代表总体的最完善、最有科学根据的调查方法。选取样本的方法:一是一是随机随机抽样。抽样。随机抽样是按照随机原则抽取样本,即在总体随机抽样是按照随机原则抽取样本,即在总体中抽取单位时,完全排除了人的主观应因素中抽取单位时,完全排除了人的主观应因素的影响,使每一个单位都有同等的可能性被的影响,使每一个单位都有同等的可能性被抽到。抽到。遵守随机原则,一方面可使抽取出来的部分单遵守随机原则,一方面可使抽取出来的部分单位的分布情况有较大的可能性接近总体的分位的分布情况有较大的可
4、能性接近总体的分情况;另一方面,遵循随机原则,可有助于情况;另一方面,遵循随机原则,可有助于调查人员准确地计算抽样误差,并有效的加调查人员准确地计算抽样误差,并有效的加以控制,从而提高调查的精度。以控制,从而提高调查的精度。l所谓随机性原则(同等可能性原则),是指在进行抽样时,总体中每一个体是否被抽选的概率(即可能性)是完全均等的。完全排除了人们主观意义上的选择。l例如:l所有个体单位总共为100个,必须使每个单位都同样有1%的被抽中的机会。二是二是非随机抽样。非随机抽样。非随机抽样不遵循随机原则,它是从方便出发非随机抽样不遵循随机原则,它是从方便出发或根据主观的选择来抽取样本,即根据研究或根
5、据主观的选择来抽取样本,即根据研究任务的要求和对调查对象的分析,主观地有任务的要求和对调查对象的分析,主观地有意识地在研究对象的总体中进行选择。意识地在研究对象的总体中进行选择。非随机抽样无法估计和控制抽样误差,无法用非随机抽样无法估计和控制抽样误差,无法用样本的定量资料,采用统计方法来推断总体,样本的定量资料,采用统计方法来推断总体,但非随机抽样简单易行,尤其适用于做探测但非随机抽样简单易行,尤其适用于做探测性研究。性研究。抽样调查的优点:抽样调查的优点:1 1、经济性。这是抽样调查的一个最显著的优点。经济性。这是抽样调查的一个最显著的优点。由于调查的样本单位通常是总体单位中很小的一由于调查
6、的样本单位通常是总体单位中很小的一部分,调查的工作量小,因而可以节省大量的人部分,调查的工作量小,因而可以节省大量的人力、物力、财力和时间。力、物力、财力和时间。2 2、适应面广。抽样调查可以获得更广泛的信息,、适应面广。抽样调查可以获得更广泛的信息,它适用于各个领域、各种问题的调查。从适用范它适用于各个领域、各种问题的调查。从适用范围和问题来看,它的适用面要广于全面调查的适围和问题来看,它的适用面要广于全面调查的适用面。抽样调查还适用于一些特殊现象的调查,用面。抽样调查还适用于一些特殊现象的调查,比如产品质量检验、农产品实验、医药的临床实比如产品质量检验、农产品实验、医药的临床实验等。从调查
7、的项目和指标来看,抽样调查的内验等。从调查的项目和指标来看,抽样调查的内容和指标可以更详细、更深入。容和指标可以更详细、更深入。3 3、时效性强。由于工作量小,调查的准备时、时效性强。由于工作量小,调查的准备时间、调查时间、数据处理时间等都可以大大间、调查时间、数据处理时间等都可以大大缩减,从而提高数据的时效性。缩减,从而提高数据的时效性。4 4、准确性高。由于抽样调查的工作量较全面、准确性高。由于抽样调查的工作量较全面调查的工作量小,因此,它可以减少由于工调查的工作量小,因此,它可以减少由于工作量大、环节多而造成的误差。当然。用样作量大、环节多而造成的误差。当然。用样本数据去推断总体时会不可
8、避免地出现推断本数据去推断总体时会不可避免地出现推断误差,但这种误差的大小是可以计算并加以误差,但这种误差的大小是可以计算并加以控制的,因此推断的结果通常是可靠的。控制的,因此推断的结果通常是可靠的。优点成立必须依据以下假设优点成立必须依据以下假设部分包含在总体之内;部分包含在总体之内;部分与整体有同样的特征、现象和关系;部分与整体有同样的特征、现象和关系;部分能够为研究者提供一个有关群体生活、部分能够为研究者提供一个有关群体生活、态度、价值等更为清晰的脉络。态度、价值等更为清晰的脉络。尽管抽样调查具有上述优点,但它也存尽管抽样调查具有上述优点,但它也存在着某些局限性,在一定程度上难以满足对在
9、着某些局限性,在一定程度上难以满足对经济活动分析的需要,会影响调查结果的准经济活动分析的需要,会影响调查结果的准确性。确性。抽样调查的局限性抽样调查的局限性抽样调查主要宜于作定量研究而不大宜于作抽样调查主要宜于作定量研究而不大宜于作定性研究。定性研究。对于调查总体尚不清楚、不明晰的调查对象,对于调查总体尚不清楚、不明晰的调查对象,如正在形成中的新生事物以及各种隐秘社会如正在形成中的新生事物以及各种隐秘社会现象(如贪污、吸毒等等),就很难进行抽现象(如贪污、吸毒等等),就很难进行抽样调查。样调查。与典型调查、个案调查比较起来,抽样调查与典型调查、个案调查比较起来,抽样调查的样本单位一般较多,因而
10、调查的广度和深的样本单位一般较多,因而调查的广度和深度往往受到很大局限。度往往受到很大局限。抽样调查需要较多的数学知识和计算机使用抽样调查需要较多的数学知识和计算机使用能力。能力。抽样调查的适用范围l(1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解决。l(2)在经费、人力、物力和时间有限的情况下,采用抽样调查方法可节省费用,争取时效,用较少的人力物力和时间达到满意的调查效果。l(3)运用抽样调查对全面调查进行验证,全面调查涉及面广、工作量大、花费时间和经费多,组织起来比较困难。但调查质量如何需要检查验证,这时,显然不能用全面调查方式进行。l(4)对某种总体的假设进行检验,
11、判断这种假设的真伪,以决定行为的取舍时,也经常用抽样调查来测定。注意注意抽样调查的成功首先要求所选取的样本能够代抽样调查的成功首先要求所选取的样本能够代表总体。表总体。由于总体中的个体总是会存在差异,所以无论由于总体中的个体总是会存在差异,所以无论采取什么样的抽样方法,总会存在误差。采取什么样的抽样方法,总会存在误差。而而随机抽样可以保证抽样出代表性较高的样本,随机抽样可以保证抽样出代表性较高的样本,并能够计算样本误差的大小和可信程度,所并能够计算样本误差的大小和可信程度,所以相对而言,比非随机抽样要科学。以相对而言,比非随机抽样要科学。l二、抽样的术语与程序(一)抽样的术语(一)抽样的术语个
12、体和抽样单位;个体和抽样单位;研究总体与调查总体;研究总体与调查总体;样本样本;抽样框;抽样框;参数值与统计值;参数值与统计值;抽样误差;抽样误差;置信水平和置信区间;置信水平和置信区间;个体和抽样单位个体和抽样单位个体个体:收集信息的基本单位收集信息的基本单位;可以是某个类可以是某个类型的人,也可以是家庭、组织、社区等。型的人,也可以是家庭、组织、社区等。关于关于大学生大学生就业倾向的调查;就业倾向的调查;关于南宁市西乡塘区关于南宁市西乡塘区社区社区服务状况调查;服务状况调查;关于某某市关于某某市家庭家庭消费状况调查;消费状况调查;关于某某市关于某某市私人企业私人企业状况的调查;状况的调查;
13、l抽样单位抽样单位:一次直接的抽样所使用一次直接的抽样所使用的基本单位。抽样单位与分析单位的基本单位。抽样单位与分析单位有时是相同的,有时是不同的。有时是相同的,有时是不同的。单个大学生既是构成某市单个大学生既是构成某市1212万大学生这个总体万大学生这个总体的元素,又是从这一总体中直接抽取的元素,又是从这一总体中直接抽取10001000个个学生的样本时的抽样单位。学生的样本时的抽样单位。如果从如果从1212万总体中直接抽取万总体中直接抽取4040个班级组成个班级组成10001000个学生作为样本,那么抽样单位是班级而不个学生作为样本,那么抽样单位是班级而不是学生了。是学生了。研究总体与调查总
14、体研究总体与调查总体总体是指由调查对象的全部单位所构成的集合总体是指由调查对象的全部单位所构成的集合体。用体。用”N N”表示。表示。例如:要调查例如:要调查某城市居民某城市居民的年龄结构、受教育的年龄结构、受教育程度,则该市的全体市民就构成一个总体。程度,则该市的全体市民就构成一个总体。又如,要调查又如,要调查某区所有职工某区所有职工家庭收入情况,则家庭收入情况,则该区全部职工家庭便构成一个总体。该区全部职工家庭便构成一个总体。l有限总体:总体中所包含的单位数目是有限有限总体:总体中所包含的单位数目是有限的。如:一个地区的人口,一个企业的年产的。如:一个地区的人口,一个企业的年产量等。量等。
15、l无限总体:总体中所包含的单位数目是无限无限总体:总体中所包含的单位数目是无限的。如:湖泊海洋中的鱼尾数。的。如:湖泊海洋中的鱼尾数。研究总体研究总体:理论上明确定义的总体理论上明确定义的总体关于妇女就业率的调查,界定为关于妇女就业率的调查,界定为1616到到5050岁有工岁有工作能力的妇女,这是研究总体。理论上认为作能力的妇女,这是研究总体。理论上认为这个年龄阶段的女性都具有工作能力。这个年龄阶段的女性都具有工作能力。但在实际的操作过程中,这一阶段的女性可能但在实际的操作过程中,这一阶段的女性可能也有个别存在其他特殊情况不能工作的,所也有个别存在其他特殊情况不能工作的,所以要排除这些情况。以
16、要排除这些情况。调查总体调查总体:研究者实际抽取样本的个体的研究者实际抽取样本的个体的集合体集合体;研究总体研究总体有有10000妇女。妇女。而其中有而其中有50人由于特殊情况不能工作或有其人由于特殊情况不能工作或有其他情况的。他情况的。那么那么调查总体调查总体是是9950人,而人,而样本主要是从样本主要是从调调查总体查总体中抽取的中抽取的,而不是从研究总体中选取,而不是从研究总体中选取的。的。样本的结论只能推论调查总体。样本的结论只能推论调查总体。样本样本l进行调查时,往往很难将总体进行调查时,往往很难将总体中的每个个体访问到,有时是不中的每个个体访问到,有时是不可能的。可能的。l从总体中随
17、机选取出部分单位从总体中随机选取出部分单位的集合称为样本。的集合称为样本。l比如:从一批比如:从一批10000只灯泡中抽只灯泡中抽出出20只进行寿命测试,那么这只进行寿命测试,那么这20只灯泡就构成一个样本;只灯泡就构成一个样本;l从全市职工家庭中抽出从全市职工家庭中抽出200户进行户进行家庭收入调查,家庭收入调查,200户职工家庭就户职工家庭就构成一个样本。构成一个样本。l样本中所含单位的数目称为样本容样本中所含单位的数目称为样本容量,记为量,记为 n;样本容量相对于总体容量样本容量相对于总体容量一般是很小的,是个很一般是很小的,是个很小的数,往往是百分之小的数,往往是百分之几或千分之几,最
18、大也几或千分之几,最大也不超过不超过1/3。样本规模样本规模小型调查类:小型调查类:样本规模在样本规模在1003000之间;之间;中型调查类:中型调查类:样本规模在样本规模在300010000之间;之间;大型调查类:大型调查类:样本规模在样本规模在1000030000之间;之间;当总体容量当总体容量N很大时,样本很大时,样本容量容量n本身也必须足够的本身也必须足够的大,这样才能保证样本对大,这样才能保证样本对总体的代表性。总体的代表性。抽样框抽样框抽样框,也叫抽样范围,就是抽样调查前,抽样框,也叫抽样范围,就是抽样调查前,在可能的条件下作出的抽样单位一览表。在可能的条件下作出的抽样单位一览表。
19、从一所中学的全体学生的名单中直接抽取从一所中学的全体学生的名单中直接抽取200200名学生作为调查的样本,那么,这所中学名学生作为调查的样本,那么,这所中学全体学生的名单就是这次抽样的抽样框。全体学生的名单就是这次抽样的抽样框。如果是从所有班级中抽取部分班级的学生作如果是从所有班级中抽取部分班级的学生作为调查样本,那么抽样框就是全校班级的为调查样本,那么抽样框就是全校班级的名单。名单。l抽样框就是所有总体单位的集合,是总体的数据目录或全部总体单位的名单。l理想的完整抽样框应具备以下几个条件:l1.包含尽可能多的样本单位,而且总体是清晰的,易确定的。l2.所有样本单位出现在这一集合中的概率相等。
20、l3.有时可以按照一定原则方法进行人为的假定。参数值与统计值参数值与统计值参数值也称总体值,是关于总体中某参数值也称总体值,是关于总体中某一变量的综合描述,或者说是总体一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量中所有元素的某种特征的综合数量表现。表现。如,某市待业青年的平均年龄、某厂如,某市待业青年的平均年龄、某厂工人的平均收入等。工人的平均收入等。统计值也称为样本值,它是统计值也称为样本值,它是关于样本中某一变量的综合关于样本中某一变量的综合描述。统计值是从样本中计描述。统计值是从样本中计算出来的,它是相应的参数算出来的,它是相应的参数值的估计量。值的估计量。参数值是关于总
21、体中某一变量的综参数值是关于总体中某一变量的综合描述。合描述。参数值是确定不变的,是参数值是确定不变的,是未知的。未知的。统计值是变化的,对于同一个总体统计值是变化的,对于同一个总体来说,不同样本所得的统计值是有来说,不同样本所得的统计值是有差别的差别的;统计值是已知的,是可以统计值是已知的,是可以通过计算得到的。通过计算得到的。抽样误差抽样误差在调查中,无论是全面调查还是非全面调查,在调查中,无论是全面调查还是非全面调查,都有可能发生误差,即代表性误差。都有可能发生误差,即代表性误差。调查误差是指调查的结果和客观实际情况的结调查误差是指调查的结果和客观实际情况的结果的出入和差数,即用样本的统
22、计值去推论果的出入和差数,即用样本的统计值去推论总体参数值时,总会存在着偏差。总体参数值时,总会存在着偏差。是偶然性的代表性误差是偶然性的代表性误差;是抽样调查所固有是抽样调查所固有;是无法避免的是无法避免的;可以事先计算并加以控制可以事先计算并加以控制;l非抽样误差是指因调查方案设非抽样误差是指因调查方案设计或实施抽样设计中的错误或问计或实施抽样设计中的错误或问题而产生的误差。包括误抄、计题而产生的误差。包括误抄、计算等人为过失和其他一些因违反算等人为过失和其他一些因违反随机原则而产生的误差,即登记随机原则而产生的误差,即登记性误差。性误差。影响抽样误差的因素影响抽样误差的因素l1、总体各单
23、位标志值的差异程度、总体各单位标志值的差异程度l总体的方差和均方差越大,抽样误差就总体的方差和均方差越大,抽样误差就越大;反之,则抽样误差越小。如果总越大;反之,则抽样误差越小。如果总体各单位标志值之间没有差异,那么,体各单位标志值之间没有差异,那么,抽样指标和全及指标相等,抽样误差也抽样指标和全及指标相等,抽样误差也就不存在了。就不存在了。l2、样本单位数的多少、样本单位数的多少l在其他条件不变的情况下,抽样单在其他条件不变的情况下,抽样单位数越多,抽样误差就越小,反之,位数越多,抽样误差就越小,反之,则越大。则越大。l3 3、抽样调查的组织形式、抽样调查的组织形式l抽样误差也受抽样组织形式
24、的影响,一抽样误差也受抽样组织形式的影响,一般来说,按照等距抽样和类型抽样方式般来说,按照等距抽样和类型抽样方式组织抽样调查,由于经过排队,可以缩组织抽样调查,由于经过排队,可以缩小差异程度,因而抽取相同数目的样本,小差异程度,因而抽取相同数目的样本,其抽样误差要比简单随机抽样方式的误其抽样误差要比简单随机抽样方式的误差小。差小。置信水平和置信区间置信水平和置信区间置信水平:指总体参数值落在样本统计值某置信水平:指总体参数值落在样本统计值某一区间的概率,它反映抽样的可靠程度。一区间的概率,它反映抽样的可靠程度。如置信度为如置信度为95%,即总体参数值落在样,即总体参数值落在样本统计值某一个区间
25、的概率为本统计值某一个区间的概率为95%。或。或者说有者说有95%的把握认为参数值落在统计的把握认为参数值落在统计值周围的某一个区间。值周围的某一个区间。置信区间:是指在一定置信水平条件下,样置信区间:是指在一定置信水平条件下,样本值与总体值之间的误差范围,它反映抽本值与总体值之间的误差范围,它反映抽样的精确程度。样的精确程度。从从某一个机关某一个机关1 1万名干部中抽取万名干部中抽取200200人为样人为样本,调查其平均工资,若样本平均工资本,调查其平均工资,若样本平均工资为为100100元,那么总体水平工资落在元,那么总体水平工资落在9595105105元元这一区间的概率可能为这一区间的概
26、率可能为96%96%(误误差差5 5元元),落在),落在9090110110元这一区间的元这一区间的概率可能为概率可能为99%99%(误差为(误差为1010元元)。)。置信区间越大,误差范围越大,置信水平置信区间越大,误差范围越大,置信水平越高。越高。(二)抽样的基本程序(二)抽样的基本程序界定研究总体和调查总体;界定研究总体和调查总体;确定抽样框;确定抽样框;设计抽样方案和抽取样本;设计抽样方案和抽取样本;对样本进行评估。对样本进行评估。界定研究总体和调查总体界定研究总体和调查总体界定研究总体和调查总体是对从中抽取样本的界定研究总体和调查总体是对从中抽取样本的总体范围和界限作明确的界定。总体
27、范围和界限作明确的界定。例如:例如:1936年总统选举。文摘杂志确定总体年总统选举。文摘杂志确定总体1000万份,回收万份,回收235万份。依此预测共和万份。依此预测共和党人兰登领先党人兰登领先15%胜出。结果却是:民主胜出。结果却是:民主党人罗斯福以党人罗斯福以60%胜出,超胜出,超20%。另一家命运杂志,只对另一家命运杂志,只对4500人进行调查,却人进行调查,却十分正确地作出了预测。十分正确地作出了预测。l原因:就在于前者的偏误样本太多,没有确原因:就在于前者的偏误样本太多,没有确立好总体。立好总体。l文学摘要文学摘要是依据电话号码簿和汽车注册是依据电话号码簿和汽车注册簿进行抽样作调查对
28、象,那些没有电话号码簿进行抽样作调查对象,那些没有电话号码的人被排除在外了。的人被排除在外了。l而从而从1933年开始的经济大萧条,一方面将年开始的经济大萧条,一方面将大量人口抛入了下层阶层,使选民的结构发大量人口抛入了下层阶层,使选民的结构发生了变化,另一方面,在经济不景气时,罗生了变化,另一方面,在经济不景气时,罗斯福当时提出了帮助穷人的计划。斯福当时提出了帮助穷人的计划。l确定抽样框l确立总体后,收集总体中全部抽样单位的名单。有两种确立方法:l一是全选法,一个不能漏。如大学生社会实习调查。选定总体为全日制大学在校本科生,就要从各院系花名册中统一编号。l二是分层次的样本框:如调查一个城市小
29、学生的学习状况。全市500小学,选10所,再从10所中每个学校选3个班;最后每个班选10名学生。设计抽样方案和抽取样本设计抽样方案和抽取样本总体的规模总体的规模总体的异质性程度总体的异质性程度 在其他条件和抽样误差不变的情况下,总体在其他条件和抽样误差不变的情况下,总体各单位的异质性越大,需要的样本规模就越各单位的异质性越大,需要的样本规模就越大。在考虑样本规模与抽样误差的关系时,大。在考虑样本规模与抽样误差的关系时,必须把总体各单位的异质性程度考虑进去。必须把总体各单位的异质性程度考虑进去。调查者的人力、财力和时间调查者的人力、财力和时间对样本进行评估对样本进行评估对样本的质量。代表性以及偏
30、差等进行初步的对样本的质量。代表性以及偏差等进行初步的检验和衡量,其目的是防止由于样本的偏差检验和衡量,其目的是防止由于样本的偏差过大而导致调查的失误。过大而导致调查的失误。基本方法基本方法:将可得到的反映总体中某些重要特将可得到的反映总体中某些重要特征及其分布资料与样本中的同类指标的资料征及其分布资料与样本中的同类指标的资料进行比较。进行比较。总体:总体:4000名学生;名学生;样本:样本:200名学生名学生;;从学校有关部门得到资料:男生占从学校有关部门得到资料:男生占78%,女生占,女生占22%。样本资料显示为男生占样本资料显示为男生占76%,女生占,女生占24%。三、三、随机抽样与非随
31、机抽样随机抽样与非随机抽样l随机抽样:又叫概率抽样,是根据随机原则抽取样本的的抽样方法。l随机抽样的样本数量是根据对总体进行推断的已知精确度要求来确定的,它的前提是要明确总体的范围,在已知总体数量的基础上迸行抽样。l通常采用的随机抽样的方法有:简单随机抽样,等距抽样,分层抽样、整群抽样和以上几种抽样方法结合使用的多阶段抽样。随机抽样简单随机抽样等距抽样分层随机抽样整群随机抽样多阶段抽样l简单随机抽样简单随机抽样l(纯随机抽样纯随机抽样)是一种最基本的概率抽样,对总体中所有是一种最基本的概率抽样,对总体中所有个体按完全符合随机原则的特定方法抽个体按完全符合随机原则的特定方法抽取样本。取样本。分为
32、两种情况分为两种情况1、抽签法;、抽签法;把总体的每一个单位都编号,将这些号码写在把总体的每一个单位都编号,将这些号码写在一张张小纸条上,然后放入容器如纸盒或者一张张小纸条上,然后放入容器如纸盒或者口袋中,搅拌均匀后,从中任意抽取,直到口袋中,搅拌均匀后,从中任意抽取,直到抽够预定的样本数目。那么抽中的号码所代抽够预定的样本数目。那么抽中的号码所代表的单位组成的就是一个随机样本。表的单位组成的就是一个随机样本。l所谓重复抽样,是指总体中某一单位被抽中作为样本后,再放回总体中,有可能第二次被抽中作为样本。l不重复抽样是指总体中的每个单位只可能抽中一次作为样本。即某一单位抽中作为样本后,不能再放回
33、总体中,也就没有可能第二次被抽中作为样本。简单方便,但总体数目很多时,简单方便,但总体数目很多时,写号码的工作量很大,搅拌写号码的工作量很大,搅拌均匀也不容易,适合总体单均匀也不容易,适合总体单位数较少。位数较少。l2、随机数字表;(乱码表)、随机数字表;(乱码表)l对于总体单位数较多时,则采对于总体单位数较多时,则采用随机数字表来抽样。用随机数字表来抽样。l该表是由该表是由0-9数字组成。数字组成。l随机形成,没有任何规律性。随机形成,没有任何规律性。25 19 64 82 84 62 23 03 65 99 25 03 24 03 37 31 61 28 98 94 61 48 03 10
34、 64 80 15 45 12 51 48 78 89 56 65 32 23 31 02 03 14 5621 43 97 80 21 13 15 00 11 12 51 84 48 95 69 33 55 46 90 50 40 80 78 56 80 48 57 5826 25 65 88 99 55 77 45 65 25 41 23 32 25 56 65 45 55 44 84 78 98 85 86 82 25 21 13 31 51 45 45 58 45 47 58 46 58 52 21 25 26 25 85 88 44 11 12 20 10 30 02 01 08 0
35、7 0500 05 34 56 67 73 34 32 12 32 45 34 23 99 56 52 02 01 05 04 02 02 55 44 84 56 56 45 l使用乱码表的步骤使用乱码表的步骤:l1、先取得一份调查总体所有元素的名单(抽样框);l2、将总体中所有元素按顺序编号;l3、根据总体单位的数目确定使用几位随机号码;l4、从表中的任何一栏的任何一行开始,向任何一个方向摘取数字,凡符合总体单位编号的,即为抽中的单位,直到抽满样本数为止。例如,某企业要调查消费者对某产品的需求量,要从95户居民家庭中抽选10户居民作样本。采用随机号码表法抽选样本,具体步骤如下:第一步:将95
36、户居民家庭编号,每一户家庭一个编号,即0195。(每户居民编号为2数)第二步:在表上,随机确定抽样的起点和抽样的顺序。假定从第一行,第5列开始抽,抽样顺序从左往右抽。l第三步:依次抽出号码,不在总体编号范围内,应排除在外,后再补充号码。由此产生10个样本单位号码。编号为这些号码的居民家庭就是抽样调查的对象。25 19 64 82 84 62 23 03 65 99 25 03 24 03 37 31 61 28 98 94 61 48 03 10 64 80 15 45 12 51 48 78 89 56 65 32 23 31 02 03 14 5621 43 97 80 21 13 15
37、00 11 12 51 84 48 95 69 33 55 46 90 50 40 80 78 56 80 48 57 5826 25 65 88 99 55 77 45 65 25 41 23 32 25 56 65 45 55 44 84 78 98 85 86 82 25 21 13 31 51 45 45 58 45 47 58 46 58 52 21 25 26 25 85 88 44 11 12 20 10 30 02 01 08 07 0500 05 34 56 67 73 34 32 12 32 45 34 23 99 56 52 02 01 05 04 02 02 55 44
38、 84 56 56 45 优点:在抽样过程中完全排除了主观优点:在抽样过程中完全排除了主观因素的干扰,简单,易行,只要有总因素的干扰,简单,易行,只要有总体各单位名单就行。体各单位名单就行。缺点:只适应总体单位数量不大的调缺点:只适应总体单位数量不大的调查,如果总体单位多,则编制抽样框查,如果总体单位多,则编制抽样框的工作量太大;样本可能比较分散或的工作量太大;样本可能比较分散或过分集中,会给调查带来困难。过分集中,会给调查带来困难。等距抽样等距抽样也称系统抽样,它是把总体的元素进行编号排也称系统抽样,它是把总体的元素进行编号排序后,再计算出某种间隔,然后按这固定间序后,再计算出某种间隔,然后
39、按这固定间隔抽取元素来组成样本的方法。隔抽取元素来组成样本的方法。l排列顺序可用与调查项目有关的标志为排列顺序可用与调查项目有关的标志为依据,如在购买力调查中,按收入多少依据,如在购买力调查中,按收入多少由低至高排列,也可用与调查项目无关由低至高排列,也可用与调查项目无关的标志为依据,的标志为依据,如按户口册、姓名笔如按户口册、姓名笔划等。划等。l抽样间隔抽样间隔=总体数总体数/样本数样本数某市有零售商店420户,现要从中抽取10户商店调查今年洗衣粉需求量。用等距抽样法产生样本单位数。其具体步骤如下:其具体步骤如下:将调查总体将调查总体420420户零售商店进行编号,户零售商店进行编号,从从1
40、 1号编到号编到420420号号;计算抽样间隔为计算抽样间隔为4242;在第一个抽样间隔内,随机产生第一个样本在第一个抽样间隔内,随机产生第一个样本的号码,即在的号码,即在1 14242间,随机选一个数字,间,随机选一个数字,假如假如2020,它就是第一个样本单位的号码。,它就是第一个样本单位的号码。按抽样间隔,抽取所有的样本单位,即每隔按抽样间隔,抽取所有的样本单位,即每隔4242产生一个样本单位,它们依次为:产生一个样本单位,它们依次为:2020,6262,104104,146146,188188,230230,272272,314314,356356,398398。上述编号的零售商店,就
41、是抽样调查的上述编号的零售商店,就是抽样调查的样本单位。样本单位。l从上面所述,可以看出,采取等距从上面所述,可以看出,采取等距抽样抽出的样本,能够使样本均衡抽样抽出的样本,能够使样本均衡地分散在总体的各单位中,不会过地分散在总体的各单位中,不会过分集中于某些单位,从而有利于增分集中于某些单位,从而有利于增强样本的代表性,并且抽样的方法强样本的代表性,并且抽样的方法简例易行。简例易行。优点是:优点是:样本在总体中分布比较均匀,具有较高代表性,抽样误差小于简单随机抽样,而且比较简单易行,只要抽取了第一个样本,整个样本就都确定了。缺点是:调查总体单位不能太多,而且要有完缺点是:调查总体单位不能太多
42、,而且要有完整的登记册,否则就难以进行。使用这种方整的登记册,否则就难以进行。使用这种方法要注意避免抽样间隔与调查对象的周期性法要注意避免抽样间隔与调查对象的周期性节奏相重合。节奏相重合。l关于大学生的调查,计算出抽样间关于大学生的调查,计算出抽样间隔是隔是3030。如果每班正好也是。如果每班正好也是3030人,人,并且每班是按照学生的成绩来排列并且每班是按照学生的成绩来排列的,如果当抽到初始号是的,如果当抽到初始号是2 2号,依号,依次为次为3232号,号,6262号等,那么抽取的样号等,那么抽取的样本一般都属于成绩优秀的学生。本一般都属于成绩优秀的学生。l分层随机抽样l也称为类型抽样;也称
43、为类型抽样;先将总体各单位按某先将总体各单位按某种特征或标志(性别、年龄、职业等)种特征或标志(性别、年龄、职业等)分成若干类型(或层次);然后,根据分成若干类型(或层次);然后,根据各类型(或层次)所包含的抽样单位数各类型(或层次)所包含的抽样单位数与总体单位数的比例,确定从各类型中与总体单位数的比例,确定从各类型中抽取样本单位的数量;最后,按照简单抽取样本单位的数量;最后,按照简单随机抽样或等距随机抽样方法从各类型随机抽样或等距随机抽样方法从各类型(或层次)中抽取样本。(或层次)中抽取样本。某单位老中青共计某单位老中青共计1900019000人,其中人,其中老年人占老年人占10%10%,中
44、年人占,中年人占40%40%,青,青年人占年人占50%50%。要了解三个不同年。要了解三个不同年龄层次的人对住房涨价的看法,龄层次的人对住房涨价的看法,我们抽取我们抽取500500人作为样本。那么,人作为样本。那么,老中青应该各抽取多少人?老中青应该各抽取多少人?优点:它适用于总体单位数量较多、单位之间差异较优点:它适用于总体单位数量较多、单位之间差异较大的调查对象,而且抽样误差较小或所需样本数量大的调查对象,而且抽样误差较小或所需样本数量较少。与简单随机抽样和等距随机抽样相比较,在较少。与简单随机抽样和等距随机抽样相比较,在样本数量相同时,它的抽样误差较小;在抽样误差样本数量相同时,它的抽样
45、误差较小;在抽样误差要求相同时,它所需的样本数量较少。要求相同时,它所需的样本数量较少。缺点:必须对总体各单位的情况有较多的了解,否缺点:必须对总体各单位的情况有较多的了解,否则就无法科学分类,而这一点在实际调查之前又往则就无法科学分类,而这一点在实际调查之前又往往难以做到。往难以做到。注意分层标准问题:分层比例问题;整群随机抽样整群随机抽样也叫也叫分群随机抽样分群随机抽样,它是将调查总体划,它是将调查总体划分为若干群体,然后用单纯随机抽样选分为若干群体,然后用单纯随机抽样选出若干群体作为样本,对群体内各个单出若干群体作为样本,对群体内各个单位全部进行调查。位全部进行调查。整群随机抽样的单位是
46、群不是个人。这整群随机抽样的单位是群不是个人。这个群可以是家庭、车间等。个群可以是家庭、车间等。分群随机抽样和分层随机抽样有分群随机抽样和分层随机抽样有相似相似之之处,它们都是首先根据某种标准把调查处,它们都是首先根据某种标准把调查总体分为若干部分层或群。但二者又有总体分为若干部分层或群。但二者又有很大区别:很大区别:分层随机抽样要求所分各层之间有明显分层随机抽样要求所分各层之间有明显差异差异性,同层内部的单位具有相同性;性,同层内部的单位具有相同性;分群随机抽样恰恰相反,要求各群体之分群随机抽样恰恰相反,要求各群体之间具有相同性,同一群体内部的单位具间具有相同性,同一群体内部的单位具有差异性
47、。有差异性。l假设调查居民家庭收入,采用分层抽样假设调查居民家庭收入,采用分层抽样和整群抽样,其不同可以根据下图:和整群抽样,其不同可以根据下图:l分层随机抽样各层及同层内部状况l高收入层高、高、高l中收入层中、中、中l低收入层低、低、低l分群随机抽样各群及同群内部状况分群随机抽样各群及同群内部状况A群体群体高、中、低高、中、低lB群体群体高、中、低高、中、低lC群体群体高、中、低高、中、低总体:全国所有城市分层抽样分层抽样城市规模特大城市中等城市小城市大城市整群随机抽样的使用整群随机抽样的使用31个省(自治区直辖市)湖南省湖南省广西区广西区北京市北京市假设某大学共有100个班级,每班都是30
48、名学生,共有3000名学生。现要抽300名学生作为样本进行调查,如果采用整群抽样,从100个班级中抽取10个班级即可。这10个班级的全部学生构成调查的样本。例如,某市有例如,某市有2020万户居民万户居民分为分为120120个居民委员会,个居民委员会,要抽选要抽选500500户居民做样本,户居民做样本,调查居民的粮食月消费调查居民的粮食月消费量,量,如何从如何从2020万户中抽万户中抽选样本选样本500500户?户?具体步骤如下:将全市20万户居民按居民委员会分群,120个居民委员会,就是120个群。从120个群中,随机抽出若干个群做样本。我们假定抽出5个居民委员会(即5群)做为样本。从每个样
49、本居民委员会中各随机抽取100户居民做抽样调查。(样本总数为500户,有5个样本居委会,所以每个样本居委会抽100户)。优点:优点:样本单位比较集中,调样本单位比较集中,调查工作比较方便,可节省人财查工作比较方便,可节省人财物力和时间。物力和时间。缺点:缺点:样本分布不均匀、代表样本分布不均匀、代表性较差,与上述几种抽样方法性较差,与上述几种抽样方法相比较,在样本数量相同的情相比较,在样本数量相同的情况下抽样误差较大。况下抽样误差较大。多阶段抽样多阶段抽样l又称又称多级随机抽样多级随机抽样或或分段随机抽样分段随机抽样,就是把从总体中抽取样本的过程分就是把从总体中抽取样本的过程分成两个或两个以上
50、阶段进行的抽样成两个或两个以上阶段进行的抽样的方法。的方法。如从市抽出街道,从街道抽出居委会,如从市抽出街道,从街道抽出居委会,从居委会中再抽出居民家庭,就是从居委会中再抽出居民家庭,就是三段式分群抽样。三段式分群抽样。具体步骤是:具体步骤是:先将总体各单位按一定标志分成若干群体,先将总体各单位按一定标志分成若干群体,作为抽样的第作为抽样的第1 1级单位。级单位。依照随机原则,先在第依照随机原则,先在第1 1级单位中抽出若干级单位中抽出若干群体作为第群体作为第1 1级样本,然后再在第级样本,然后再在第1 1级样本中级样本中抽出第抽出第2 2级样本,依此类推,还可抽出第级样本,依此类推,还可抽出