《抽样调查的基本原理精.ppt》由会员分享,可在线阅读,更多相关《抽样调查的基本原理精.ppt(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样调查的基本原理第1页,本讲稿共21页第一节第一节 有关基本概念有关基本概念 一、总体一、总体一、总体一、总体 总总体体也也叫叫母母体体,它它是是所所要要认认识识对对象象的的全全体体,是是具具有有同同一一性性质质的的许许多多单单位位的的集集合合。组组成成总总体体的的每每个个个个体体叫做单位。叫做单位。在在抽抽样样以以前前,把把总总体体划划分分成成若若干干个个互互不不重重叠叠并并且且能能组组合合成成总总体体的的部部分分,每每个个部部分分称称为为一一个个抽抽样样单单元元,不不论论总总体体是是否否有有限限,总总体体中中的的抽抽样样单单元元数数一一定定是是有有限限的的。抽抽样样单单元元又又有有大大小
2、小之之分分,一一个个大大的的抽抽样样单单元元可可以以分分成成若若干干个个小小的的抽抽样样单单元元,最小的抽样单元就是每一个个体。最小的抽样单元就是每一个个体。2第2页,本讲稿共21页3 总总体体应应具具备备同同质质性性、大大量量性性和和差差异异性性的的特特征征。在在抽抽样样调调查查中中,通通常常将将反反映映总总体体数数量量特特征征的的综综合合指指标标称称为为总总体参数。常见的总体参数主要有:体参数。常见的总体参数主要有:总体总和、总体均值、总体比率、总体比例。总体总和、总体均值、总体比率、总体比例。第3页,本讲稿共21页 二、样本二、样本 样样本本是是由由从从总总体体中中所所抽抽选选出出来来的
3、的若若干干个个抽抽样样单单元元组组成成的的集集合合体体。抽抽样样前前,样样本本是是一一个个n n维维随随机机变变量量,属属样样本本空空间间;抽抽样样后后,样样本本是是一一个个n n元元数数组组,是是样样本本空空间间的的一一个点。个点。抽抽样样的的效效果果好好不不好好,依依赖赖于于样样本本对对总总体体是是否否有有充充分的代表性。影响样本代表性的因素有以下几个方面:分的代表性。影响样本代表性的因素有以下几个方面:(1)(1)总体标志值分布的离散程度。总体标志值分布的离散程度。(2)(2)抽样单元数的多少抽样单元数的多少(或称样本容量的大小或称样本容量的大小)。(3)(3)抽样方法。抽样方法。4第4
4、页,本讲稿共21页5 一一般般将将反反映映样样本本数数量量特特征征的的综综合合指指标标称称之之为为统统计计量量。统统计计量量是是n n元元样样本本的的一一个个实实值值函函数数,是是一一个个随随机机变变量量,统统计计量量的的一一个个具具体体取取值值即即为为统统计计值值。主主要要的的样样本本统统计计量量有有:样样本本总总和和、样样本本均均值值、样样本本比比率率、样样本本比比例。例。第5页,本讲稿共21页 三、必要样本容量和样本可能数目三、必要样本容量和样本可能数目三、必要样本容量和样本可能数目三、必要样本容量和样本可能数目 样样本本中中包包含含的的抽抽样样单单元元个个数数称称为为样样本本容容量量。
5、样样本本容量与总体容量之比为抽样比,用容量与总体容量之比为抽样比,用f f表示,即表示,即f=n/Nf=n/N。样样本本可可能能数数目目则则是是在在容容量量为为N N的的总总体体中中抽抽取取容容量量为为n n的的样样本本时时,所所有有可可能能被被抽抽中中的的不不同同样样本本的的个个数数。正正确确理理解解样样本本可可能能数数目目的的概概念念,对对于于准准确确理理解解和和把把握握抽抽样样误误差差的的计计算算、样样本本统统计计量量的的抽抽样样分分布布、抽抽样样估估计计的的优优良良标标准准等等一系列理论和方法问题都有十分重要的帮助。一系列理论和方法问题都有十分重要的帮助。6第6页,本讲稿共21页 四、
6、抽样框四、抽样框四、抽样框四、抽样框 抽抽样样框框是是在在抽抽样样前前,为为便便于于抽抽样样工工作作的的组组织织,在在可可能能条条件件下下编编制制的的用用来来进进行行抽抽样样的的、记记录录或或表表明明总总体体所所有有抽抽样样单元的框架,在抽样框中,每个抽样单元都被编上号码。单元的框架,在抽样框中,每个抽样单元都被编上号码。抽抽样样框框可可以以是是一一份份清清单单(名名单单抽抽样样框框)、一一张张地地图图(区域抽样框区域抽样框),也可以是一段时序。,也可以是一段时序。7第7页,本讲稿共21页第二节第二节 样本统计量的抽样分布样本统计量的抽样分布 标标准准的的统统计计问问题题为为:总总体体未未知知
7、,故故需需从从总总体体中中抽抽取取一一个个较较小小的的、花花费费不不多多的的随随机机样样本本,然然后后构构造造样样本本统统计计量量,并并以以其其估估计计总总体体。问问题题是是用用样样本本指指标标估估计计总总体体指指标标的的可可靠靠程程度度如如何何?为为此此要要研研究究样样本本统统计计量量的的抽抽样样分分布。布。在此之前,有必要先回顾一下有关正态分布的知识。在此之前,有必要先回顾一下有关正态分布的知识。8第8页,本讲稿共21页 一、正态分布一、正态分布 一一个个正正态态分分布布完完全全由由总总体体的的理理论论平平均均数数和和理理论论方方差差这这两两个个参参数数所所决决定定。如如果果一一个个随随机
8、机变变量量X X服服从从正正态态分分布布,则其分布的密度函数则其分布的密度函数(分布曲线方程分布曲线方程)为:为:9第9页,本讲稿共21页 任任何何正正态态分分布布,它它的的样样本本落落在在任任意意区区间间(a,b)(a,b)内内的的概概率率等等于于直直线线x=ax=a,x=bx=b,横横坐坐标标和和曲曲线线f(x)f(x)所所夹夹的的面面积积(可可由由正正态态分分布布概概率率积积分分表表查查得得)。经经计计算算,正正态态总总体体的的样本落在:样本落在:10第10页,本讲稿共21页 二、抽样分布二、抽样分布 样样本本统统计计量量是是个个随随机机变变量量。把把根根据据所所有有可可能能样样本本计计
9、算算出出来来的的某某一一统统计计量量的的数数值值分分布布,称称为为抽抽样样分分布布。抽抽样样分分布布理理论论是是理理解解抽抽样样调调查查基基本本原原理理的的基基础础。常常见见的的抽抽样样分布有极限分布和精确分布两类。分布有极限分布和精确分布两类。极极限限分分布布也也叫叫做做大大样样本本分分布布,它它只只有有正正态态分分布布一一种种形形式。式。精精确确分分布布又又叫叫做做小小样样本本分分布布,其其前前提提是是总总体体服服从从正正态态分分布布,它它是是正正态态分分布布的的导导出出分分布布,包包括括有有t t分分布布、F F分布和分布和22分布等形式。分布等形式。11第11页,本讲稿共21页第三节第
10、三节 抽样误差抽样误差 一、抽样调查中的误差来源一、抽样调查中的误差来源一、抽样调查中的误差来源一、抽样调查中的误差来源 误误差差就就是是调调查查结结果果与与现现象象的的实实际际结结果果之之间间的的偏偏差差。在在抽抽样样调调查查中中,按按照照形形成成原原因因的的不不同同,一一般般可可将误差分成抽样误差和非抽样误差两大类。将误差分成抽样误差和非抽样误差两大类。抽抽样样误误差差是是用用样样本本统统计计量量推推断断总总体体参参数数时时的的误误差差,它它属属于于一一种种代代表表性性误误差差。抽抽样样误误差差通通常常会会随随样样本本量量的的大大小小而而增增减减;影影响响抽抽样样误误差差的的因因素素还还有
11、有:所所研究现象总体变异程度的大小;抽样的方式方法。研究现象总体变异程度的大小;抽样的方式方法。12第12页,本讲稿共21页 非非抽抽样样误误差差不不是是由由于于抽抽样样引引起起的的。它它又又包包括括调调查查误误差差、无无回回答答误误差差、抽抽样样框框误误差差以以及及登登记记性性误误差差。同同抽抽样样误差相反,非抽样误差是随着样本量的增加而增大的。误差相反,非抽样误差是随着样本量的增加而增大的。13第13页,本讲稿共21页 二、抽样误差的计算二、抽样误差的计算 由由于于从从一一个个总总体体中中抽抽取取容容量量为为n n的的样样本本时时,有有多多种种可可能能的的结结果果,所所以以样样本本指指标标
12、是是随随机机变变量量,而而总总体体指指标标是是唯一确定的常量,故抽样误差也是一个随机变量。唯一确定的常量,故抽样误差也是一个随机变量。一一般般情情况况下下,均均方方误误差差说说明明了了估估计计量量的的准准确确性性,而而估估计计量量的的方方差差则则表表明明了了其其估估计计结结果果的的精精确确性性。通通常常将将精精确确度度定定义义为为估估计计量量方方差差的的倒倒数数,而而将将准准确确度度定定义义为为估估计计量均方误差的倒数。量均方误差的倒数。14第14页,本讲稿共21页第四节第四节 抽样估计抽样估计 抽抽样样估估计计就就是是以以样样本本的的实实际际资资料料为为依依据据,计计算算一一定定的的样样本本
13、统统计计量量,并并按按照照一一定定的的方方法法对对总总体体参参数数作作出出估估计计和推断。和推断。一、抽样估计的特点一、抽样估计的特点一、抽样估计的特点一、抽样估计的特点 第第一一,抽抽样样估估计计在在逻逻辑辑上上运运用用的的是是归归纳纳推推理理而而不不是是演绎推理。演绎推理。第第二二,抽抽样样估估计计在在方方法法上上运运用用不不确确定定的的概概率率估估计计法而不是运用确定的数学分析法。法而不是运用确定的数学分析法。第三,抽样估计的结论存在着一定程度的抽样误差。第三,抽样估计的结论存在着一定程度的抽样误差。15第15页,本讲稿共21页 二、抽样估计的方法二、抽样估计的方法 抽抽样样估估计计的的
14、方方法法多多种种多多样样。如如果果以以估估计计中中所所依依据据的的资资料料不不同同来来区区分分,一一般般可可以以有有简简单单估估计计、比比估估计计和和回回归归估估计计等等三三种种方方法法。简简单单估估计计是是最最简简单单、最最基基本本的的一一种种估估计方法,在实际中应用也最为广泛。计方法,在实际中应用也最为广泛。如如果果以以估估计计结结果果的的表表示示方方式式来来区区分分,则则抽抽样样估估计计可可以有两种形式,即定值估计和区间估计。以有两种形式,即定值估计和区间估计。定定值值估估计计是是指指给给所所要要估估计计的的总总体体参参数数只只给给出出一一个个明明确确的点估计值,同时确定出估计结果的误差
15、。的点估计值,同时确定出估计结果的误差。16第16页,本讲稿共21页 区区间间估估计计则则是是在在一一定定的的概概率率保保证证程程度度(置置信信度度)之之下下,根根据据允允许许的的最最大大绝绝对对误误差差范范围围,确确定定出出一一个个以以点点估估计值为中心的区间作为总体待估参数计值为中心的区间作为总体待估参数的估计区间。的估计区间。17第17页,本讲稿共21页 三、置信区间三、置信区间 一般地说,若估计量是无偏的,且呈正态分布,一般地说,若估计量是无偏的,且呈正态分布,则参数则参数的置信度为的置信度为1-1-的置信区间可以写成的置信区间可以写成 (-KS()(-KS(),+KS()+KS()当
16、调查变量的总体方差当调查变量的总体方差2 2已知时,上述置信区间可已知时,上述置信区间可表示为表示为 (-Z(-Z/2/2S()S(),+Z+Z/2/2S()S()即取即取K=ZK=Z/2/2,Z,Z/2/2的值可以通过查正态分布双侧的值可以通过查正态分布双侧临界值表加以确定。临界值表加以确定。18第18页,本讲稿共21页19 当调查变量的总体方差当调查变量的总体方差2 2未知时,则用相应的样本未知时,则用相应的样本方差方差s s2 2代替。然而,这时有可能会使误差产生一个增代替。然而,这时有可能会使误差产生一个增量,特别是当样本较小时,更容易影响估计的精度。量,特别是当样本较小时,更容易影响
17、估计的精度。因此,为了保持因此,为了保持1-1-的置信度,就应该适当加宽置信的置信度,就应该适当加宽置信区间,即用较大的区间,即用较大的t t/2/2值来代替值来代替Z Z/2/2。此时,置信区间。此时,置信区间就可以表示成就可以表示成 (-t (-t/2/2()(),+t+t/2/2()()其中其中t t/2/2的值可通过查的值可通过查t t分布临界值表来确定,在分布临界值表来确定,在这里自由度为这里自由度为df=n-1df=n-1;()()表示以表示以s s2 2代替代替2 2后对抽样标后对抽样标准误准误S()S()的估计量。的估计量。第19页,本讲稿共21页 四、估计量的优良标准四、估计量的优良标准 要要判判断断一一种种估估计计量量的的好好环环,仅仅从从某某一一次次试试验验的的结结果果来来衡衡量量是是不不够够的的,而而应应从从多多次次重重复复试试验验中中,看看这这种种估估计计量量是是否否在在某某种种意意义义上上最最接接近近于于被被估估计计参参数数的的真真值值。一一般般地地说说,用抽样指标估计总体指标应该有三项基本要求或标准:用抽样指标估计总体指标应该有三项基本要求或标准:1.1.无偏性无偏性 2.2.一致性一致性 3.3.有效性有效性20第20页,本讲稿共21页本章内容讲授结束本章内容讲授结束第21页,本讲稿共21页