最新四章节抽样调查幻灯片.ppt

上传人:豆**** 文档编号:33320636 上传时间:2022-08-10 格式:PPT 页数:64 大小:994KB
返回 下载 相关 举报
最新四章节抽样调查幻灯片.ppt_第1页
第1页 / 共64页
最新四章节抽样调查幻灯片.ppt_第2页
第2页 / 共64页
点击查看更多>>
资源描述

《最新四章节抽样调查幻灯片.ppt》由会员分享,可在线阅读,更多相关《最新四章节抽样调查幻灯片.ppt(64页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、一、抽样与抽样调查v 是一种选择调查对象的程序和方法:从研究对象的整是一种选择调查对象的程序和方法:从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特性。推论和说明总体的特性。 v 日常生活中的抽样调查日常生活中的抽样调查v 同质性总体和异质性总体同质性总体和异质性总体v 抽样的代表性问题抽样的代表性问题v 概率论和数理统计学中理论证明:遵循随机原则的概概率论和数理统计学中理论证明:遵循随机原则的概率抽样可以保证抽选出有一定代表性的样本,并能够率抽样可以保证抽选出有一定代表性的样本,并能够通过计算估计样本与总体间误差的大

2、小以及这种估计通过计算估计样本与总体间误差的大小以及这种估计的可信程度。的可信程度。 3 3、 决定抽样方案决定抽样方案 对于不同研究目的,不同调查范围、对象和客观条件的社会调查,需要选择合适的抽样方法。还要根据调查的要求确定样本规模及主要目标量的精确程度。 4 4、实际抽取样本、实际抽取样本 严格按照所选定的抽样方法,从抽样框中抽取一个个抽样单位,构成调查样本。 5 5、 评估样本质量评估样本质量v 对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于样本的偏差过大而导致的调查失误。v 基本方法:将可得到的总体有关的特征及其分布的资料与样本中的同类指标进行对比,若二者差别很小,

3、则样本质量较高,代表性较大,反之样本质量不高。v 对样本的评估分为两个阶段: A、正式调查前,对抽出的样本进行评估 B、调查结束后,计算抽样误差由样本统计值推论 总体参数值等 五、抽样的类型 定额抽样定额抽样雪球抽样雪球抽样判断抽样判断抽样随意抽样随意抽样非概率抽样非概率抽样抽样抽样多阶段抽样多阶段抽样整群抽样整群抽样分层抽样分层抽样系统抽样系统抽样简单随机抽样简单随机抽样概率抽样概率抽样抽样方法抽样方法PPS 率率进进行行调调整整权权的的方方法法对对不不相相等等的的概概不不等等概概率率抽抽样样:采采用用加加等等概概率率抽抽样样:随随机机抽抽样样六、概率抽样1 1、简单随机抽样(纯随机抽样)、

4、简单随机抽样(纯随机抽样) (1 1)是最基本的随机抽样,也是最常见的类型。按随机)是最基本的随机抽样,也是最常见的类型。按随机的原则直接从含有的原则直接从含有N N个单位的总体中,抽出个单位的总体中,抽出M M个单位作为个单位作为样本进行调查。严格遵从了使每个单位有同等被抽中的样本进行调查。严格遵从了使每个单位有同等被抽中的原则。原则。 (2 2)具体做法)具体做法 A A、 抽签法抽签法将总体中每个单位的名称或号码,将总体中每个单位的名称或号码,逐个填写在卡片或签条上,再放入同一容器中,打乱次逐个填写在卡片或签条上,再放入同一容器中,打乱次序,进行搅拌,然后从中抽取,直到抽够预定的样本数序

5、,进行搅拌,然后从中抽取,直到抽够预定的样本数目。目。 v可分为:重复抽样、不重复抽样。可分为:重复抽样、不重复抽样。v抽签法的优点是简单易行,缺点是当总体的容量抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便。如果标号的非常大时,费时、费力,又不方便。如果标号的签搅拌得不均匀,会导致抽样不公平。签搅拌得不均匀,会导致抽样不公平。 B B、随机数表法、随机数表法v对于总体元素较多的情形,采用随机数表抽样对于总体元素较多的情形,采用随机数表抽样v随机数表的特点:随机数表中的数码和排列都是随机数表的特点:随机数表中的数码和排列都是随机形成的,没有任何规律性(也称乱数表)。随

6、机形成的,没有任何规律性(也称乱数表)。随机数表如下图所示(截取部分)随机数表如下图所示(截取部分)v 步骤:步骤:v 先取得一份调查总体所有元素的名单(即抽样先取得一份调查总体所有元素的名单(即抽样框);框);v 将总体中所有元素一一按顺序编号;将总体中所有元素一一按顺序编号;v 根据总体规模是几位数来确定从随机数表中选几根据总体规模是几位数来确定从随机数表中选几位数码;位数码;v 以总体的规模为标准,对随机数表中的数码逐一以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;进行衡量并决定取舍;v 根据样本规模的要求选择出足够的数码个数;根据样本规模的要求选择出足够的数码个数;v

7、依据从随机数表中选出的数码,到抽样框中去找依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。出它所对应的元素。v 例:某总体共有3000人,需要从中抽取200人作为样本进行调查,试用随机数表法进行抽样。(2 2)简单随机抽样方法适用对象:总体单位数目)简单随机抽样方法适用对象:总体单位数目不大,总体单位之间差异程度较小的情况。简单不大,总体单位之间差异程度较小的情况。简单随机抽样一般不单独使用。随机抽样一般不单独使用。 (3 3)优点:最符合抽样的随机原则,简便易行。)优点:最符合抽样的随机原则,简便易行。 缺点:适用范围较小。缺点:适用范围较小。 2 2、系统抽样(等距抽样或机械抽

8、样)、系统抽样(等距抽样或机械抽样) v定义:先把总体单位进行编号排序,然后计算出某种定义:先把总体单位进行编号排序,然后计算出某种间隔,再按这一固定间隔抽取个体的号码组成样本。间隔,再按这一固定间隔抽取个体的号码组成样本。v方法步骤方法步骤v 将总体的所有个体按一定顺序排号,前后排列,制将总体的所有个体按一定顺序排号,前后排列,制定抽样框;定抽样框;v计算抽样间距:计算抽样间距:K(K(抽样间距抽样间距)=N ()=N (总体规模总体规模) /n () /n (样样本规模本规模) ) v在前面的在前面的K K个个体中,用简单随机抽样的方法抽取一个个体中,用简单随机抽样的方法抽取一个个体,设其

9、序号为个个体,设其序号为A A;v自自A A开始,每隔开始,每隔K K个个体抽取一个个体,则陆续抽个个体抽取一个个体,则陆续抽取的个体所在位置序号为取的个体所在位置序号为A A,A+K,A+2K,A+(n-1)K 。若抽到最后,仍不足所需样本时,。若抽到最后,仍不足所需样本时,可再回头累积抽取;可再回头累积抽取;v将这将这n个个体和起来,就构成了该总体的一个样本。个个体和起来,就构成了该总体的一个样本。v例:某大学有例:某大学有1200012000名学生,采用系统抽样的方名学生,采用系统抽样的方法抽取法抽取200200名学生作为样本。名学生作为样本。v 优点优点 A A、与简单随机抽样相比,系

10、统抽样易于实施,工作、与简单随机抽样相比,系统抽样易于实施,工作较少较少 B B、样本在总体中分布更平均,抽样误差小于或至多、样本在总体中分布更平均,抽样误差小于或至多等于简单随机抽样,结果更精确。等于简单随机抽样,结果更精确。v 缺点缺点 A A、较适用于同质性较高的群体:若总体内不同类别、较适用于同质性较高的群体:若总体内不同类别之间所含个体数目相差过于悬殊时,采用此种方法样之间所含个体数目相差过于悬殊时,采用此种方法样本的代表性可能较差。本的代表性可能较差。 v 缺点缺点 B B、当总体的排列出现有规律的分布时,就会使系统、当总体的排列出现有规律的分布时,就会使系统的抽样误差很大,降低了

11、样本的代表性的抽样误差很大,降低了样本的代表性 (a a)个体排列具有次序先后,等级高低)个体排列具有次序先后,等级高低 (b b)个体排列的分布周期与抽样间隔相对应)个体排列的分布周期与抽样间隔相对应 解决方法:解决方法:认真考察总体的排列情况与抽样的距离,认真考察总体的排列情况与抽样的距离,如果原有的排列次序可能导致抽样失败的话,就应打如果原有的排列次序可能导致抽样失败的话,就应打乱原有的排列次序或改用其他抽样方法。乱原有的排列次序或改用其他抽样方法。 3、分层抽样分层抽样v定义:定义:先将总体依照一种或几种特征分为几个子总先将总体依照一种或几种特征分为几个子总体(类、群),每个子总体称为

12、一层,然后从每一体(类、群),每个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起即为总层中随机抽取一个子样本,将它们合在一起即为总体的样本,称为分层样本。体的样本,称为分层样本。v例:企业有例:企业有30003000人,抽取人,抽取150150人进行抽样调查。可人进行抽样调查。可按性别、年龄或者二者结合,或者按照工人、干部、按性别、年龄或者二者结合,或者按照工人、干部、技术人员的分层标准技术人员的分层标准v分层的标准分层的标准v研究者一般选择与调查中欲测变量高度相关的变研究者一般选择与调查中欲测变量高度相关的变量,即:对所要研究的变量有很大影响因素的变量,即:对所要研究的变量

13、有很大影响因素的变量作为分层变量。量作为分层变量。v突出总体的内在结构特征,从而使得同层次内同突出总体的内在结构特征,从而使得同层次内同质性强,层间异质性强。质性强,层间异质性强。v具有实用性。例如以那些已有明显层次区分的变具有实用性。例如以那些已有明显层次区分的变量作为分层变量。量作为分层变量。 性别、年龄、文化程度、职业性别、年龄、文化程度、职业等等v分层类型分层类型按各层子样本容量分类按各层子样本容量分类v按比例分层抽样按比例分层抽样指按各种类型或层次中的单指按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的位数目同总体单位数目间的比例来抽取子样本的方法。方法。v例:某厂有

14、工人例:某厂有工人600600名,按性别分层男女比例名,按性别分层男女比例5 5:1 1,抽取抽取6060名工人。名工人。v不按比例分层抽样(非等概率抽样)不按比例分层抽样(非等概率抽样)主要用主要用于了解一些层所代表的子总体的情况,而不是总于了解一些层所代表的子总体的情况,而不是总体情况。体情况。 总体中的某种类型或层次的单位数目太少,若以按比总体中的某种类型或层次的单位数目太少,若以按比例分层抽样的方法,则有的层次在样本中个案太少,例分层抽样的方法,则有的层次在样本中个案太少,不便于了解各个层次的情况。不便于了解各个层次的情况。 注意:推断总体时,则需要先对各层的数据资料进行注意:推断总体

15、时,则需要先对各层的数据资料进行加权处理,使数据资料恢复到总体中各层实际的比例加权处理,使数据资料恢复到总体中各层实际的比例结构,否则会导致推断的偏误。结构,否则会导致推断的偏误。v 优点优点v 当一个总体内部分层明显时,分层抽样能够克服简单的当一个总体内部分层明显时,分层抽样能够克服简单的缺点。缺点。 了解总体的不同层次的情况。了解总体的不同层次的情况。 分层抽样可以提高总体参数估计值的精确度。分层抽样可以提高总体参数估计值的精确度。 4、整群抽样v 定义:定义:将总体按照某种标准划分为若干子群体,将总体按照某种标准划分为若干子群体,每个子群体为一个抽样单位,用随机的方法,抽取若每个子群体为

16、一个抽样单位,用随机的方法,抽取若干个子群体,将所有抽取的子群体合起来作为总体的干个子群体,将所有抽取的子群体合起来作为总体的样本。样本。v 与前几种抽样的最大差别就是抽样单位不是单个的个与前几种抽样的最大差别就是抽样单位不是单个的个体,而是成群的个体。体,而是成群的个体。 v 优点优点 a a、 可以通过转换抽样单位,扩大抽样的应用范围。可以通过转换抽样单位,扩大抽样的应用范围。 b b、 可以节省人力、物力、财力。可以节省人力、物力、财力。v 缺点:缺点: a a、样本分布不均匀,样本总体的代表性较差。、样本分布不均匀,样本总体的代表性较差。 b b、与其它抽样相比,在样本数相同时,抽样误

17、、与其它抽样相比,在样本数相同时,抽样误差较大。差较大。 有数据表明容量为有数据表明容量为800800的整群抽样在效率上的整群抽样在效率上相当于容量为相当于容量为500500的简单随机抽样。的简单随机抽样。 v与分层抽样的异同点与分层抽样的异同点 都是根据某种标准将总体分为若干个子群体。都是根据某种标准将总体分为若干个子群体。子群体的划分原则不同。子群体的划分原则不同。分层抽样分层抽样:层间异质性强,层内同质性强。:层间异质性强,层内同质性强。整群抽样整群抽样:反之。:反之。抽样方式不同。抽样方式不同。分层抽样分层抽样:所有子群体均要抽取一个样本,作为:所有子群体均要抽取一个样本,作为总体的一

18、部分,即总体样本在各层中均有分布。总体的一部分,即总体样本在各层中均有分布。整群抽样整群抽样:将所有子群体作为样本总体,抽取若:将所有子群体作为样本总体,抽取若干个子群体。干个子群体。适用范围不同适用范围不同分层抽样分层抽样:适用于界质分明的总体。:适用于界质分明的总体。整群抽样整群抽样:适用于界质不清的总体。:适用于界质不清的总体。 v 特别注意特别注意 在分析整群抽样资料时,虽然抽样误差、统计推断、在分析整群抽样资料时,虽然抽样误差、统计推断、假设检验比前几种方法复杂,但在大规模、大范围内假设检验比前几种方法复杂,但在大规模、大范围内应用时,实施方便。应用时,实施方便。5、多阶段抽样(多级

19、抽样)v定义:定义:多阶段抽样又称多级抽样或分段抽样,它是多阶段抽样又称多级抽样或分段抽样,它是按抽样元素的隶属关系或层次关系把抽样过程分为按抽样元素的隶属关系或层次关系把抽样过程分为几个阶段进行。几个阶段进行。v在社会研究中,当总体的规模特别大,或者总体分在社会研究中,当总体的规模特别大,或者总体分布的范围特别广时,研究者一般采取多段抽样的方布的范围特别广时,研究者一般采取多段抽样的方法来抽取样本。法来抽取样本。v多段抽样的具体做法是:先从总体中随机抽取若干多段抽样的具体做法是:先从总体中随机抽取若干大群大群( (组组) ),然后再从这几个大群,然后再从这几个大群( (组组) )内抽取几个小

20、内抽取几个小群群( (组组) ),这样一层层抽下来,直至抽到最基本的抽,这样一层层抽下来,直至抽到最基本的抽样元素为止。样元素为止。v在运用多阶段抽样方法时,要在类别和个体之间在运用多阶段抽样方法时,要在类别和个体之间保持平衡,或者保持合适的比例。保持平衡,或者保持合适的比例。v例:假设某市共有例:假设某市共有2.42.4万名教师,分布在万名教师,分布在1010个区个区200200所学校中,现抽取一个由所学校中,现抽取一个由12001200名教师组成的名教师组成的样本,按照三阶段抽样的方法,抽样方案有:样本,按照三阶段抽样的方法,抽样方案有:v确定每一阶段抽样的单位数目时应考虑的因素:确定每一

21、阶段抽样的单位数目时应考虑的因素:v 各个抽样阶段中的子总体同质性程度。同质性各个抽样阶段中的子总体同质性程度。同质性程度越高的子总体,所抽取的规模就应相对小程度越高的子总体,所抽取的规模就应相对小一点;反之,则应大一点。一点;反之,则应大一点。v 各层子总体的人数。各层子总体的人数。v 研究者所拥有的人力和经费。研究者所拥有的人力和经费。v 一般来说,类别相对较多、每类中个体相对较一般来说,类别相对较多、每类中个体相对较少的做法效果较好。少的做法效果较好。v优点优点 A A、通过采用由高级抽样单位过渡到低级抽样单位、通过采用由高级抽样单位过渡到低级抽样单位的方法,解决了低级抽样单位不易获得抽

22、样框的问题,的方法,解决了低级抽样单位不易获得抽样框的问题,并可以使样本的分布较为集中,大大降低了人力、物并可以使样本的分布较为集中,大大降低了人力、物力、财力。适用于范围大、总体对象多的社会调查。力、财力。适用于范围大、总体对象多的社会调查。 B B、多阶段抽样可在各阶段抽样时,根据具体情况,、多阶段抽样可在各阶段抽样时,根据具体情况,灵活选用不同的抽样方法,可以综合各种抽样方法的灵活选用不同的抽样方法,可以综合各种抽样方法的优点,提高样本质量。优点,提高样本质量。 v 缺点缺点 A A、由于每阶段抽样都会产生误差,所以经多阶段、由于每阶段抽样都会产生误差,所以经多阶段抽样得到的样本误差也相

23、应增加。抽样得到的样本误差也相应增加。 B B、解决方法:相对增加开头阶段的样本数,而适、解决方法:相对增加开头阶段的样本数,而适当减少最后阶段的样本数。当减少最后阶段的样本数。 练习:练习: 假定某县有假定某县有20个乡镇,每个乡镇平均有个乡镇,每个乡镇平均有10个个村委会,每个村委会平均有村委会,每个村委会平均有10个自然村,每个自个自然村,每个自然村平均有然村平均有50户。全县共有户。全县共有200个村委会,个村委会,2000个自然村、个自然村、10万户。现决定采用多阶段随机抽样万户。现决定采用多阶段随机抽样方法对该县计划生育状况按户做方法对该县计划生育状况按户做5的抽样调查,的抽样调查

24、,共抽取共抽取500户,请设计抽样方法。户,请设计抽样方法。6、PPS抽样(概率与元素规模大小成比例抽样) (1 1) 实质上是一种不等概率抽样方法。实质上是一种不等概率抽样方法。 (2 2) 适用于当每个元素在总体中的大小不同,或者在适用于当每个元素在总体中的大小不同,或者在总体中的地位不同时,采用不等概率抽样的方法,使总体中的地位不同时,采用不等概率抽样的方法,使得比例大或者在总体中的地位重要的的元素入选的概得比例大或者在总体中的地位重要的的元素入选的概率大率大,比例小的或者在总体中的地位小的元素入选样比例小的或者在总体中的地位小的元素入选样本的概率小,用以提高样本代表性的方法。本的概率小

25、,用以提高样本代表性的方法。 (3 3)例:假设从全市)例:假设从全市100100家不同规模的企业(总共家不同规模的企业(总共2020万名职工)中,抽取万名职工)中,抽取10001000名职工进行调查。名职工进行调查。 u方案一:采用多阶段抽样的方法:方案一:采用多阶段抽样的方法: 先从先从100100家企业随机抽取家企业随机抽取2020家企业;家企业; 再从再从2020家企业中分别抽取家企业中分别抽取5050名职工(名职工(2020* *505010001000)构)构成样本。成样本。 100100家企业的规模不同:最大的企业多达家企业的规模不同:最大的企业多达1600016000名职工,名

26、职工,小的企业只有小的企业只有200200名职工。这两类企业中职工被抽中的名职工。这两类企业中职工被抽中的概率不同:概率不同: P P大企业职工被抽中大企业职工被抽中(20/100)(20/100)* *(50/16000)=0.0625%(50/16000)=0.0625% P P小企业职工被抽中小企业职工被抽中(20/100)(20/100)* *(50/200)(50/200)5%5%u方案二:采用多阶段抽样的方法:方案二:采用多阶段抽样的方法:先将各个元素排列起来;先将各个元素排列起来;然后写出他们的规模,计算他们的规模在总体规模然后写出他们的规模,计算他们的规模在总体规模中所占的比例

27、;中所占的比例;将他们的比例累计起来,并根据比例的累计数依次将他们的比例累计起来,并根据比例的累计数依次写出每一元素所对应的选择号码范围写出每一元素所对应的选择号码范围采用随机抽样的方法或系统抽样的方法选择号码,采用随机抽样的方法或系统抽样的方法选择号码,号码对应的元素入选作为第一阶段的样本;号码对应的元素入选作为第一阶段的样本;再从所选的样本中进行第二阶段抽样再从所选的样本中进行第二阶段抽样村委会村委会编号编号户数户数占总户数占总户数比例(比例(% %)累计比例累计比例(% %)抽样号码抽样号码等距抽样等距抽样选选取的号码取的号码入样村委入样村委会和会和调查户数调查户数合计合计4000400

28、0村委会村委会0101200200村委会村委会0202160160村委会村委会030314401440村委会村委会0404200200村委会村委会0505120120村委会村委会0606760760村委会村委会0707320320村委会村委会0808400400村委会村委会0909280280村委会村委会1010120120u 练习:某乡镇有练习:某乡镇有10个居委会,共个居委会,共4000户居民,每个户居民,每个村委会人数如下表所示。要选取村委会人数如下表所示。要选取200户作为样本,试用户作为样本,试用PPS抽样的方法抽选样本。抽样的方法抽选样本。 七、非概率抽样1 1、 随意抽样(偶遇抽

29、样、方便抽样)随意抽样(偶遇抽样、方便抽样) 研究者在一定时间、一定环境里所遇到或接触到的任均研究者在一定时间、一定环境里所遇到或接触到的任均入选作为样本的方法。入选作为样本的方法。 街头拦人法街头拦人法 在有些调查中,调查过程对被调查者来说是不愉快的或在有些调查中,调查过程对被调查者来说是不愉快的或是比较麻烦的,是比较麻烦的, 此时可以把那些自愿被调查的人作为此时可以把那些自愿被调查的人作为样本。样本。 优点:方便、省力;优点:方便、省力; 缺点:样本代表性差,有很大的偶然性缺点:样本代表性差,有很大的偶然性 2、主观主观抽样抽样(立意抽样、判断抽样)(立意抽样、判断抽样) v 主观的含义:

30、主观的含义:a a、研究者根据主观判断选取可以代表总体的个体作为样、研究者根据主观判断选取可以代表总体的个体作为样本,即样本的代表性取决于研究者对总体的了解程度本,即样本的代表性取决于研究者对总体的了解程度和判断能力;和判断能力;适用于适用于在无法缺点总体边界,或因调查在无法缺点总体边界,或因调查者的时间和设备有限而无法进行概率抽样时。者的时间和设备有限而无法进行概率抽样时。b b、 有目的的选择样本。有目的的选择样本。适用于:适用于:建立分类模型,在于发建立分类模型,在于发现问题,提出假设,不在于对总体作出估计。现问题,提出假设,不在于对总体作出估计。 3、定额抽样(配额抽样)定额抽样(配额

31、抽样) (1 1) 是一种类似于分层抽样的比例抽样。按照调查对象是一种类似于分层抽样的比例抽样。按照调查对象的某种属性或特征将总体中所有个体分为若干类或层,的某种属性或特征将总体中所有个体分为若干类或层,然后在各层中抽样,样本中各层(类)所占的比例与然后在各层中抽样,样本中各层(类)所占的比例与他们在总体中所占的比例一样。他们在总体中所占的比例一样。(2 2) 与分层抽样的区别:分层抽样中各层样本是随机抽与分层抽样的区别:分层抽样中各层样本是随机抽取的,而定额抽样中,各层样本是非随机抽取的。取的,而定额抽样中,各层样本是非随机抽取的。 (3 3) 定额样本的选择也可以是基于属性或特征(变量)定

32、额样本的选择也可以是基于属性或特征(变量)的组合。的组合。 (4 4) 定额抽样假设:只要类型划分的较细,那么同一个定额抽样假设:只要类型划分的较细,那么同一个类型中的每一个个体都是同质的,因而无需采用随机类型中的每一个个体都是同质的,因而无需采用随机抽样方案;只要类型划分合理且分配给各类的名额符抽样方案;只要类型划分合理且分配给各类的名额符合总体中各类人员的分布,那么样本就可以准确的反合总体中各类人员的分布,那么样本就可以准确的反映总体。映总体。 (5 5)假设在理论上成立,但实际实施过程很难做到。)假设在理论上成立,但实际实施过程很难做到。 (6 6)原因:在分层时不能兼顾到总体的众多属性

33、,而只)原因:在分层时不能兼顾到总体的众多属性,而只考虑到几种;有关总体分布变化的最新信息不易得到,考虑到几种;有关总体分布变化的最新信息不易得到,其合理性很难保证。其合理性很难保证。4、滚雪球抽样滚雪球抽样(1 1) 方法:先从几个合适的调查对象开始,通过他们得方法:先从几个合适的调查对象开始,通过他们得到更多的调查对象,然后一步步扩大样本范围。到更多的调查对象,然后一步步扩大样本范围。(2 2) 适用:当调查总体的个体信息不充分时,常采用此适用:当调查总体的个体信息不充分时,常采用此种方法。种方法。(3 3) 局限性:最后仍有多个个体找不到,因某些原因故局限性:最后仍有多个个体找不到,因某

34、些原因故意漏而不提,产生遗漏。意漏而不提,产生遗漏。 八、样本容量的确定(一)样本容量:样本内所含个体数量的多少。(一)样本容量:样本内所含个体数量的多少。 在统计学中,有所谓大样本、小样本的区别和在统计学中,有所谓大样本、小样本的区别和争论,原因在于大样本与小样本的抽样分布不争论,原因在于大样本与小样本的抽样分布不同,因而需要采用不同的统计分析方法。一般同,因而需要采用不同的统计分析方法。一般认为认为30个以上称为大样本。社会统计研究中,个以上称为大样本。社会统计研究中,则认为样本规模超过则认为样本规模超过100个才称为大样本资格。个才称为大样本资格。(二)计算方法:(二)计算方法:简单随机

35、抽样中推论总体平均数的样本简单随机抽样中推论总体平均数的样本n其中:其中:t:置信度所对应的临界值:置信度所对应的临界值总体的标准差总体的标准差 e:抽样误差:抽样误差 222etn *: 推论总体成数(百分比)的样本推论总体成数(百分比)的样本n计算计算公式公式其中:其中:p:为总体成数或百分比,:为总体成数或百分比,t、e含义同上含义同上22)1 (*epptn注意:注意:t t值可以从标准正态分布表中查出;值可以从标准正态分布表中查出;e e是研是研究者根据需要事先确定的;总体标准差,或者总究者根据需要事先确定的;总体标准差,或者总体成数或百分比常常难以得到,可采用下列变通体成数或百分比

36、常常难以得到,可采用下列变通的方法:的方法:利用前人所作的关于同一总体的普查或抽样调查利用前人所作的关于同一总体的普查或抽样调查资料来计算或估计总体方差,由此得出推论总体资料来计算或估计总体方差,由此得出推论总体均值的样本规模;均值的样本规模;在计算推论总体成数(百分比)的样本规模时,在计算推论总体成数(百分比)的样本规模时,可以取可以取p p1/21/2,p p(1 1p p)maxmax,则,可保证,则,可保证n n足够大足够大(三)影响样本规模的确定因素(三)影响样本规模的确定因素1 1、总体的规模:、总体的规模:当总体规模大到一定程度时,样本规模的增加与当总体规模大到一定程度时,样本规

37、模的增加与它并不保持同等的增长速度它并不保持同等的增长速度; ;在其它有关因素一在其它有关因素一定时定时, ,样本样本n n的增加速度大大低于总体规模的增加的增加速度大大低于总体规模的增加速度;速度;2 2、抽样的精确性、抽样的精确性(1 1)置信度越低,推论的可靠性越大,则要求的)置信度越低,推论的可靠性越大,则要求的n n越大;越大;(2 2)在其它条件一定的情况下,置信区间越小,)在其它条件一定的情况下,置信区间越小,即样本统计值与总体参数值之间的误差范围越即样本统计值与总体参数值之间的误差范围越小,则小,则n n越大越大3、总体的异质性程度、总体的异质性程度(1 1)要达到同样的精确度

38、,在同质性越强的总体)要达到同样的精确度,在同质性越强的总体中,则抽样中,则抽样n n小些;异质性强的样本,小些;异质性强的样本,n n大些。大些。(2 2)总体中的大部分成员对某个问题的回答或选)总体中的大部分成员对某个问题的回答或选择与小部分成员的回答或选择不同时,则择与小部分成员的回答或选择不同时,则n n小小些;当选择两种不同的回答的成员比例相差些;当选择两种不同的回答的成员比例相差无几时,无几时,n n大些大些4 4、研究者所拥有的经费、人力和时间、研究者所拥有的经费、人力和时间5 5、常见的经验样本量:、常见的经验样本量:民意调查中:民意调查中: 一般:一般: 1600-2000人

39、,最多不超过人,最多不超过3000人人 最重要的全国调查:最重要的全国调查:15-20万之间万之间不同总体规模下的经验样本量不同总体规模下的经验样本量总体规模总体规模100100以下以下100-1000100-10001000-50001000-50005000-100005000-1000010000-1010000-10万万1010万以上万以上样本占总体的比重样本占总体的比重50%50%以上以上50%-20%50%-20%30%-10%30%-10%15%-3%15%-3%5%-1%5%-1%1%1%以下以下九、抽样误差九、抽样误差非抽样误差:人为操作失误所致:如调查方非抽样误差:人为操作

40、失误所致:如调查方案设计不甚合理、抽样方法有违随机原则、案设计不甚合理、抽样方法有违随机原则、度量误差、在调查中的记录、填答、汇总等度量误差、在调查中的记录、填答、汇总等工作中出现的误差等,即非抽样误差。工作中出现的误差等,即非抽样误差。非抽样误差可通过研究者主观努力尽量减少,非抽样误差可通过研究者主观努力尽量减少,但无法用计量方法计算出这种误差到底有多但无法用计量方法计算出这种误差到底有多大。大。抽样误差:就是在随机抽取样本过程中所产生抽样误差:就是在随机抽取样本过程中所产生的样本统计量与总体参数之间的差别;的样本统计量与总体参数之间的差别;它与抽样过程中的人为操作无关,而与总体的分它与抽样

41、过程中的人为操作无关,而与总体的分布状况、样本容量及所采用的抽样方法等因素有布状况、样本容量及所采用的抽样方法等因素有关。关。大小是可以在样本设计中事先控制的;大小是可以在样本设计中事先控制的;抽样方法对抽样误差的影响:采用不同的抽样抽样方法对抽样误差的影响:采用不同的抽样方法抽取样本,所产生的误差不一样;方法抽取样本,所产生的误差不一样;理论上应该选择抽样误差最小的方法抽取样本。理论上应该选择抽样误差最小的方法抽取样本。但实际研究工作中,抽样方法的选取受到多种因但实际研究工作中,抽样方法的选取受到多种因素的制约。素的制约。运用不同的随机抽样方法时,抽样误差的计算依运用不同的随机抽样方法时,抽

42、样误差的计算依据不同的公式。据不同的公式。总体的分布状况与抽样规模对抽样总体的分布状况与抽样规模对抽样误差的影响:误差的影响:总体的分布状况是指研究总体中各元素的差总体的分布状况是指研究总体中各元素的差异程度或异质性程度。异程度或异质性程度。研究总体的异质性程度越大,抽样误差越大,研究总体的异质性程度越大,抽样误差越大,反之抽样误差越小。研究总体的异质性程度反之抽样误差越小。研究总体的异质性程度与抽样误差成正比;抽取样本的规模与抽样与抽样误差成正比;抽取样本的规模与抽样误差成反比。误差成反比。 统计学中,用总体的标准差表示总体异质性程统计学中,用总体的标准差表示总体异质性程度,用度,用n n表

43、示样本规模,用表示样本规模,用SESE(sampling errorsampling error)表示抽样误差,则:表示抽样误差,则: 由于总体标准差通常未知,用样本标准差由于总体标准差通常未知,用样本标准差S S代替,代替,则:则:nSE1nSSEnSSE或 注意:以上公式是不考虑抽样方法这一因素的注意:以上公式是不考虑抽样方法这一因素的影响时一般性地描述和反映研究总体的异质性影响时一般性地描述和反映研究总体的异质性程度及样本规模与抽样误差之间的数量关系。程度及样本规模与抽样误差之间的数量关系。当把抽样方法(如分层抽样方法、分阶段抽样当把抽样方法(如分层抽样方法、分阶段抽样方法等)考虑进来,

44、则抽样误差的计算公式要方法等)考虑进来,则抽样误差的计算公式要根据抽样方法的不同进行修正或改变。根据抽样方法的不同进行修正或改变。简单随机抽样,可以通过扩大样本简单随机抽样,可以通过扩大样本n来来降低误差降低误差分层抽样,可通过缩小总体的异质性分层抽样,可通过缩小总体的异质性程度、总体分布的方差,提高精确度。程度、总体分布的方差,提高精确度。tne6 6、注意:抽样规模与抽样误差之间的关、注意:抽样规模与抽样误差之间的关系问题系问题对比较小的样本来说,样本规模的很小的一对比较小的样本来说,样本规模的很小的一点增加,会带来精确性方面有很明显的增加点增加,会带来精确性方面有很明显的增加对于比较大的样本来说,同样增加这么多的对于比较大的样本来说,同样增加这么多的个案,收效甚微。个案,收效甚微。因此许多调查公司通常将他们的样本因此许多调查公司通常将他们的样本n限制限制在在2000之内,超过这一点,花费在增加的人之内,超过这一点,花费在增加的人力、力、 物力等相对于增加估计的精确性来说,物力等相对于增加估计的精确性来说,有些得不偿失。有些得不偿失。练习题练习题

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁