《《应用抽烟技术》第一章基本概念.ppt》由会员分享,可在线阅读,更多相关《《应用抽烟技术》第一章基本概念.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学系统计学系 余国合余国合教学目的:教学目的:使学生能系统正确地掌握抽样调查的理论基础,掌握几种基本的抽样方法,培养学生初步具有能结合实际情况对具体项目进行抽样设计和对所获得数据进行处理和分析的能力。第一章第一章 基本概念基本概念第二章第二章 简单随机抽样简单随机抽样第三章第三章 分层随机抽样分层随机抽样第四章第四章 比估计与回归估计比估计与回归估计第五章第五章 不等概率抽样不等概率抽样第六章第六章 整群抽样整群抽样第七章第七章 系统抽样系统抽样第八章第八章 二阶及多阶抽样二阶及多阶抽样参考书目参考书目1.谢邦昌原著,张尧庭等改编,抽样调查的理论及其应用方法,中国统计出版社,1998年.2
2、.赵俊康著,统计调查中抽样设计理论与方法,中国统计出版社,2002年.3.施锡铨,抽样调查的理论与方法,上海财经大学出版社,1999年.4.Kish.L.著,倪加勋等译,抽样调查,中国统计出版社,1997年.第一章基本概念第一章基本概念第一节统计信息与抽样调查第一节统计信息与抽样调查第二节基本概念第二节基本概念第三节如何抽样第三节如何抽样第四节抽样调查程序第四节抽样调查程序第五节第五节 调查员的基本素质调查员的基本素质第一节统计信息与抽样调查第一节统计信息与抽样调查 1.预测需要统计信息 2.企业之间的竞争需要统计信息 3.各种政策的制定需要统计信息 如:要分析人民生活的改善情况,就需要出生率
3、、死亡率、人口平均寿命、人民受教育程度及物质和精神文化消费方面的资料。4.正确的决策离不开充分的信息资源和有效的信息处理技术一、统计信息的重要性一、统计信息的重要性二、数据的类型二、数据的类型 统计数据展示了客观现象数量方面的特征,不同数据的性质和特点存在着差别,因此可以把数据分为两大类:1.调查数据:一般是指客观上已经存在,但需要通过观察或询问才能得到的数据。特点:这类资料大多与时间有关,数据所展示的是特定时期或时点上的结果,如一定时期内的生产量等。这类资料会随着时间的变化而改变,因此定期的收集就非常重要。也有一些数据,它们在短期内变化不大,相对比较稳定。2.试验数据:通常与自然科学的研究相
4、联系,其特点是在试验进行前尚未发生,因而需要通过事先的试验设计,在控制的条件下进行试验,并将试验的结果加以记录和整理,试验通常可以重复进行的。三、抽样调查与抽样类型三、抽样调查与抽样类型1.抽样调查:是一种非全面性调查,它是指从研究对象的全体(总体)中抽取一部分单位作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。2.抽样类型:(1)非概率抽样:没有严格的定义,这类抽样有许多不同的具体抽取样本的方法。如重点调查和典型调查,还有市场调查中的有目的调查、判断调查、方便调查和定额抽样等。(2)概率抽样也称随机抽样:是指总体中的每个单元都有一定的非零概率被抽中,单元之间被抽中的概率可以相
5、等,也可以不相等。1.节约费用;2.时效性强;3.可以承担全面调查无法胜任的项目;4.有助于提高调查数据的质量。概率抽样有三个特点:按一定的概率以随机原则抽取样本;每个单元被抽中的概率是已知的,或是可以计算出来的;当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。即估计量不仅与样本单元的观测值有关,也与其入样的概率有关。四、抽样调查的作用四、抽样调查的作用五、抽样调查与普查五、抽样调查与普查1.抽样调查作为普查的补充;2.用抽样调查对全面统计资料进行评估和修正;3.利用抽样调查做深层次分析;4.利用抽样调查,提前获得总体目标量的估计;5.普查为抽样框提供资料。第二节
6、基本概念第二节基本概念一、目标总体与抽样总体一、目标总体与抽样总体 目标总体:简称为总体,是指所要研究对象的全体,它由研究对象中所有性质相同的个体组成,组成总体的各个个体称为总体单元或单位。抽样总体:是指从中抽取样本的总体。思考:思考:两者是否一致?1.总体:是构成它的所有元素的集合。是研究者总体:是构成它的所有元素的集合。是研究者感兴趣的群体,是研究者要将研究结果进行概化感兴趣的群体,是研究者要将研究结果进行概化的目标。的目标。2.样本:是为研究提供信息的总体中的一部分。样本:是为研究提供信息的总体中的一部分。3.抽样:选择愿意参与研究的个体的过程。抽样:选择愿意参与研究的个体的过程。4.抽
7、样单位:一次直接抽样所使用的基本单位。抽样单位:一次直接抽样所使用的基本单位。5.抽样框:抽样范围,一次直接抽样时总体中所抽样框:抽样范围,一次直接抽样时总体中所有抽样单位的名单。有抽样单位的名单。6.参数值:总体值,关于总体中某一变量的综合参数值:总体值,关于总体中某一变量的综合描述。描述。7.统计值:样本值,关于样本中某一变量的综合统计值:样本值,关于样本中某一变量的综合描述。描述。二、抽样框与抽样单元二、抽样框与抽样单元 抽样框:是一份包含所有抽样单元的名单,给每一个抽样单元编上一个号码,就可以按照一定的随机化程序进行抽样。抽样总体的具体表现是抽样框。抽样单元:是构成抽样框的基本要素,抽
8、样单元可以只包含一个个体,也可以包含若干个个体,抽样单元还可以分级。三、总体指标与样本统计量三、总体指标与样本统计量1.总体总量(population total):2.总体均值(population mean):3.总体比例(proportion):如全部产品中合格品所占比例:当第i单元具有某个特定的特征时,Yi=1,否则Yi=0。4.总体比率(population ratio):式中Y、和X、为两个总体指标值。四、估计量方差、偏倚、均方误差四、估计量方差、偏倚、均方误差1.估计量方差:估计量分布的方差。2.偏倚:是指按照某一抽样方案反复进行抽样,估计值的数学期望与待估参数之间的离差。即:3
9、.均方误差:是指所有可能的估计值与待估参数之间离差平方的均值:其中,为估计量方差;为偏倚的平方。如果估计量的偏倚为零,即满足则称 为无偏估计量,也就是说无偏估计量的均方误差等于它的估计量方差。五、抽样误差与非抽样误差五、抽样误差与非抽样误差 1.抽样误差:是抽取样本的随机性造成的样本值与总体值之间的差异,只要采用抽样调查,抽样误差就不可避免;它的大小随着样本量的增大而显著减小。2.非抽样误差:是相对于抽样误差而言的,它不是由于抽样的随机性,而是由于其他多种原因引起的估计量与总体参数之间的差异。*抽样误差取决于样本均值抽样分布。均值抽样分布由中心极限定理决抽样误差取决于样本均值抽样分布。均值抽样
10、分布由中心极限定理决定,比例抽样分布重复抽样时,服从二项分布;不分布重复抽样时,定,比例抽样分布重复抽样时,服从二项分布;不分布重复抽样时,服从超几何分布,其极限形式都是正态分布服从超几何分布,其极限形式都是正态分布。六、精度与费用六、精度与费用 抽样调查的精度取决于误差的大小,精度的估计主要就是估计量方差的估计,影响估计量方差的最重要因素是样本量,而样本量又直接与调查费用有关。另一个影响精度与费用的因素是抽样方法和估计方法。第三节第三节 如何抽样如何抽样 如何从总体中抽取样本直接影响到抽样调查的质量。抽样推断最根本的依据是“样本是总体的一个代表性剖面”。即是要求所抽取的样本一定要与总体相似,
11、否则无论你采用的统计计算方法多么科学,无论你的计算机有多高级,所得到的结果仍然很成问题。事实告诉人们在抽样调查中这样一条规律:当样本的选择方法发生偏差时,样本再多也无济于事,它只能是更大范围、更大程度地重复这个偏差错误。总之,要评价一组样本是否令人满意,首先要问的是它是如何抽取的,选样中是否存在较大偏差?调查中无回答率是否很大?抽样的类型抽样的类型1.非概率抽样非概率抽样 主要依据研究者的主观意愿、判断或是否方便等因主要依据研究者的主观意愿、判断或是否方便等因素抽取样本;素抽取样本;误差大,难以估计,代表性小,适合探索性研究。误差大,难以估计,代表性小,适合探索性研究。主要有:偶遇抽样、判断抽
12、样、定额抽样、雪球抽样主要有:偶遇抽样、判断抽样、定额抽样、雪球抽样2.概率抽样概率抽样 依据概率论的基本原理,按照随机原则进行抽样;依据概率论的基本原理,按照随机原则进行抽样;主要有:简单随机抽样、系统抽样、分层抽样、整群主要有:简单随机抽样、系统抽样、分层抽样、整群抽样、多段抽样抽样、多段抽样二、非概率抽样二、非概率抽样1、偶遇抽样、偶遇抽样 方便抽样或自然抽样,指研究者根据现实情况,以自己方方便抽样或自然抽样,指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。离得最近、最容易
13、找到的人作为对象。2、判断抽样、判断抽样 目的抽样,研究者根据研究目标和自己的主观分析来选择目的抽样,研究者根据研究目标和自己的主观分析来选择和确定他们认为可以提供所需要信息的人作为样本。和确定他们认为可以提供所需要信息的人作为样本。3、定额抽样、定额抽样 配额抽样,研究者根据可能影响研究变量的因素对总体分配额抽样,研究者根据可能影响研究变量的因素对总体分层,并计算出比例,然后取挑选对象。层,并计算出比例,然后取挑选对象。检验理论、解释关系、比较不同群体时,抽样标准是适合检验理论、解释关系、比较不同群体时,抽样标准是适合性,不是代表性性,不是代表性4、雪球抽样、雪球抽样 在无法了解总体情况时,
14、从少数成员入手调查并询问其他在无法了解总体情况时,从少数成员入手调查并询问其他符合条件的人,在找这些人所知道的人。符合条件的人,在找这些人所知道的人。三、概率抽样三、概率抽样概率抽样的程序概率抽样的程序简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样整群抽样整群抽样多阶段抽样多阶段抽样概率抽样的程序概率抽样的程序随机抽取:总体中的每个个体都有同等的机会入选样本,随机抽取:总体中的每个个体都有同等的机会入选样本,而且每个个体的抽取都是独立的。而且每个个体的抽取都是独立的。1.界定总体:范围与界限界定总体:范围与界限 2.制定抽样框:收集总体中全部抽样单位的名单,并对名制定抽样框:收集总体
15、中全部抽样单位的名单,并对名单统一编号。单统一编号。分段、分层抽样时则要分别建立起几个不同的抽样框分段、分层抽样时则要分别建立起几个不同的抽样框 3.决定抽样方案:确定抽样方法、样本规模、主要目标量决定抽样方案:确定抽样方法、样本规模、主要目标量的精确程度的精确程度 4.实际抽取样本:按照选定方法从抽样框中抽取一个个抽实际抽取样本:按照选定方法从抽样框中抽取一个个抽样单位,构成样本样单位,构成样本 5.评估样本质量:质量、代表性、偏差评估样本质量:质量、代表性、偏差 将可得到的反映总体中某些重要特征及其分布的资料与样将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标进行对比。本中
16、的同类指标进行对比。几种常用的抽样方法几种常用的抽样方法1.简单随机抽样:简单随机抽样也称纯随机抽样,是从抽样框内的N个抽样单元中随机地、一个一个地抽取n个单元作为样本,在每次抽选中,所有未入样的待选单元入选样本的概率是相等的,这n个被抽中的单元就构成了简单随机样本。2.分层抽样:是将抽样单元按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。3.整群抽样:将总体中若干个基本单元合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有基本单元全部实施调查,这样的抽样方法称为整群抽样。4.多阶段抽样:采用类似整群抽样的方法,首先抽取群,但不是调查群内的所有基本单元,
17、而是再进行一步抽样,从选中的群中抽取出若干个基本单元进行调查(二阶段调查)。5.系统抽样:将总体中的所有单元(抽样单元)按一定顺序排列,在规定的范围内随机地抽取一个单元作为初始单元,然后按事先规定好的规则确定其他样本单元,这样抽样的方法称为系统抽样。四、样本规模与抽样误差四、样本规模与抽样误差样本规模样本规模影响样本规模确定的因素影响样本规模确定的因素抽样误差抽样误差样本规模样本规模样本容量,是指样本中所含个案的多少样本容量,是指样本中所含个案的多少合理的样本容量应该是研究者在合理的时间和精合理的样本容量应该是研究者在合理的时间和精力消耗下能够获得的尽可能大的样本。力消耗下能够获得的尽可能大的
18、样本。统计学中,通常以统计学中,通常以30为界,为界,30个个案及其以上为个个案及其以上为大样本,大样本,30个个案以下为小样本。个个案以下为小样本。统计学中的大样本于教育研究中的大样本不是一统计学中的大样本于教育研究中的大样本不是一回事回事在教育研究中,最小样本容量是:在教育研究中,最小样本容量是:1.描述性研究中,描述性研究中,n100 2.相关研究中,相关研究中,n50 3.实验研究中,实验研究中,n30为了进行不同类别之间的比较,必须扩大样本规为了进行不同类别之间的比较,必须扩大样本规模,至少在模,至少在100个。个。影响样本规模确定的因素影响样本规模确定的因素1.总体规模总体规模总体
19、规模达到一定程度后,样本规模的改变很小总体规模达到一定程度后,样本规模的改变很小2.抽样的精确性抽样的精确性其他条件一定的情况下,置信度越高,推论的把其他条件一定的情况下,置信度越高,推论的把握性越大,所要求的样本规模越大;握性越大,所要求的样本规模越大;置信区间越小,抽样的精确度越高,样本值与总置信区间越小,抽样的精确度越高,样本值与总体值之间的误差越小,所要求的样本规模就越大。体值之间的误差越小,所要求的样本规模就越大。3.总体的异质性程度总体的异质性程度异质性大,所需要的样本规模大。异质性大,所需要的样本规模大。4.研究者所拥有的经费、人力和时间研究者所拥有的经费、人力和时间抽样误差抽样
20、误差用样本值估计总体值时所出现的误差。用样本值估计总体值时所出现的误差。抽样误差是不可避免的,其大小可在抽样设抽样误差是不可避免的,其大小可在抽样设计中加以控制计中加以控制抽样误差取决于总体的分布方差和抽样规模抽样误差取决于总体的分布方差和抽样规模公司一般将规模控制在公司一般将规模控制在2000以内以内练习练习某市有某市有300所小学,共有所小学,共有240000名学生。这名学生。这些小学分布在全市些小学分布在全市5个行政区中。其中,重点个行政区中。其中,重点小学有小学有30所,一般小学有所,一般小学有240所,比较差的所,比较差的小学有小学有30所。行政要从全市小学生中抽取所。行政要从全市小
21、学生中抽取1200名进行调查,以了解全市小学生学习情名进行调查,以了解全市小学生学习情况。请设计一个抽样方案。况。请设计一个抽样方案。第四节第四节 抽样调查程序抽样调查程序1.确定调研问题确定调研问题2.抽样方案设计抽样方案设计3.问卷设计问卷设计4.实施调查过程实施调查过程5.数据处理分析数据处理分析6.撰写调查报告撰写调查报告确定调研问题确定调研问题 整个调查的第一步,也是至关重要的一步。在这个过程中首先需要明确的定义问题,包括对整个问题的的叙述以及确定研究问题的具体组成部分。只有问题定义清楚了,才有可能进一步设计和执行。确定调研问题所要回答的是“要做什么样的调查研究”和“为什么要做这项研
22、究”。调研人员需要考虑研究的目的、相关的背景材料、所需要的信息以及这些信息在分析时如何使用。抽样方案设计抽样方案设计 抽样方案要描述样本是如何抽取的。调查中有不同的数据收集方法,如面访调查、电话调查、邮寄调查等。不同的收集方法需要不同的抽样框,抽样方案设计也包括抽样框的设计。此外对样本又有不同的抽取方法,在制定抽样方案时既要考虑方法的科学性,又要照顾实际的可行性。问卷设计问卷设计问卷设计的基本问题1.设置的问题应当围绕调查的目的展开。2.访问时间的长短要适当控制。3.在问卷的开头往往设置问题以区别被访问者的类型。4.所提问题要清晰,用词要妥帖,并注意礼貌。5.问题要有层次地展开,市场调查等问卷
23、中要注意有比较。6.注意问卷的格式。7.一般问卷中应设有编码栏。实施调查过程实施调查过程 在这个过程中要获得样本单元的调查数据,关键的问题是要保证原始数据的质量,这就需要对调查过程进行有效的管理和监控。调查实施前需要对调查员进行技术培训,使调查员熟悉调查问卷,掌握访谈技巧,并增强责任心。在调查过程中加强质量检验,出现问题及时总结,及时补救。调查人员要有操作手册,调查过程中也要有管理制度和措施,使得从事具体调查的人员有章可循。数据处理分析数据处理分析 调查的收获阶段,它为撰写调查报告提供基本的素材。在这个阶段,首先要对经过调查获得的原始数据进行检查、核对,对验收合格的调查问卷进行编码和录入。数据
24、录入后,多数情况下需要进行数据的预处理,为统计分析做好准备。数据的预处理包括:录入数据的再编码,它是对原编码的补充和调整,满足某些统计分析软件对编码的特殊要求,也是根据研究要求对数据的重新归类分组;对缺失值进行插补,以构造出完整的数据集;进行变量的转换,进而进行常规的统计分析;计算目标量的估计值、方差及变异系数的估计值等。撰写调查报告撰写调查报告(1)主题:清楚地指出此调查的目的,并提出对调查结果的使用方式。(2)范围:正确地描述调查范围,包括指定的研究定义及调查的地理区域。(3)调查对象:详细叙述此调查所收集的资料项目及为列表项目的原因。(4)资料收集方法:清楚地叙述所采用的收集资料的方法。
25、此外,收集资料过程中遇到的困难及解决的方法,均应详细说明。(5)调查期、参考期和报告期。(6)抽样设计和估计程序:清楚说明调查中所使用的抽样单元、抽样框、样本大小和抽样方法,指出估计时所用的公式。(7)结论的描述:列表资料应该以清楚且易于理解的方式列出。(8)精确度:调查结果中应该列出估计所达到的精确程度、检验及比较的结果、对调查质量的评估。还必须指出无回答者的种类、比例以及对最后结果的影响程度。(9)责任:主办机构及指挥此调查的机构须在报告中提出。(10)参考文献。第五节第五节 调查员的基本素质调查员的基本素质1.严格遵守访问程序和指示,不允许擅自变通处理;2.访问过程中始终保持中立,不使用任何带诱导性语言;3.忠实被访者的回答,严禁在不经询问或被访人尚未回答之时,擅自代答或代填问卷;4.除出现某种情况下规定的跳答题之外,任何题均要按规定询问,不能因为估计被访人有可能不回答而跳过。若遇到拒绝回答或被访人确实不知道,则应在答卷上一一注明;5.访问大致完成时,访问员应该当场浏览一遍问卷,把漏记和不明确的地方补充完整;6.应尽可能在问卷中详细记录被访人的姓名、单位、地址及电话等,以便于复核。