《第六章抽样调查 (2)优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第六章抽样调查 (2)优秀PPT.ppt(152页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章抽样调查第一页,本课件共有152页抽样调查概述抽样调查概述抽样平均误差抽样平均误差全及指标的推断全及指标的推断抽样方案设计抽样方案设计主主要要内内容容必要抽样单位数的确定必要抽样单位数的确定假设检验假设检验抽样调查的基本概念及理论依据抽样调查的基本概念及理论依据第二页,本课件共有152页 教学目的教学目的:1 1、理解抽样调查的概念、作用及与抽样调查相关的大数定律、理解抽样调查的概念、作用及与抽样调查相关的大数定律和中心极限定律的意义和中心极限定律的意义2 2、熟练掌握抽样调查中的基本概念、熟练掌握抽样调查中的基本概念3 3、熟练掌握抽样误差的概念、熟练掌握抽样误差的概念4 4、掌握全及
2、指标的推断方法、掌握全及指标的推断方法 教学重点与难点教学重点与难点:1 1、抽样方案的设计、抽样方案的设计2 2、抽样平均误差的计算、抽样平均误差的计算3 3、全及指标的推断、全及指标的推断第三页,本课件共有152页6.1 6.1 抽样调查概述抽样调查概述 一、抽样调查的概念(广义、狭义)一、抽样调查的概念(广义、狭义)广义广义:包括非随机抽样和随机抽样。:包括非随机抽样和随机抽样。无严格定义无严格定义,是一种是一种不按照随机原则不按照随机原则,总体中各单位总体中各单位被抽中概率事先未知或难以确定的抽样被抽中概率事先未知或难以确定的抽样,样本抽取样本抽取主要根据人们的主要根据人们的主观判断主
3、观判断或或简便性原则简便性原则进行。进行。1 1、非随机抽样、非随机抽样第四页,本课件共有152页随意抽样随意抽样 (任意抽样任意抽样)典型抽样典型抽样 (有目的抽样或有代表性抽样)(有目的抽样或有代表性抽样)重点抽样重点抽样 流动总体抽样流动总体抽样 非随机抽样的主要形式有非随机抽样的主要形式有:6.1 6.1 抽样调查概述抽样调查概述 定额抽样定额抽样 (配额抽样)(配额抽样)第五页,本课件共有152页一一般所讲的抽样调查,即指般所讲的抽样调查,即指狭义狭义的抽样调查的抽样调查(随机抽样随机抽样):按照:按照随机原则随机原则从总体中抽取一部分从总体中抽取一部分单位进行观察,并运用单位进行观
4、察,并运用数理统计数理统计的原理,以被抽的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。上的推断分析。2 2、随机抽样(狭义、随机抽样(狭义)本章中所讲的抽样调查,均指狭义抽样本章中所讲的抽样调查,均指狭义抽样6.1 6.1 抽样调查概述抽样调查概述 第六页,本课件共有152页随机抽样的主要形式有随机抽样的主要形式有:简单随机抽样简单随机抽样 类型抽样类型抽样系统抽样系统抽样整群抽样整群抽样 多阶段抽样多阶段抽样 6.1 6.1 抽样调查概述抽样调查概述 第七页,本课件共有152页(一一)与与全面调查全面调查的区别,只抽取
5、总体中的一部分单位的区别,只抽取总体中的一部分单位进行调查。进行调查。(二二)与与重点调查重点调查的区别,用一部分单位的指标数值去推的区别,用一部分单位的指标数值去推断总体的指标数值。断总体的指标数值。(三三)抽选部分单位时要遵循抽选部分单位时要遵循随机性原则随机性原则。(四四)与典型调查的区别,对抽样产生的误差,可进行与典型调查的区别,对抽样产生的误差,可进行预先控制预先控制。二、抽样调查的特点二、抽样调查的特点6.1 6.1 抽样调查概述抽样调查概述 第八页,本课件共有152页 一个反面案例是:一个反面案例是:19361936年美国作家文摘对总统选举的民意年美国作家文摘对总统选举的民意预测
6、调查。该刊从电话簿和俱乐部成员中选取预测调查。该刊从电话簿和俱乐部成员中选取10001000万样本进行调万样本进行调查,其中回收查,其中回收200200万份,根据样本反映共和党候选人万份,根据样本反映共和党候选人LandonLandon(兰(兰登,登,5757)大幅度领先民主党候选人)大幅度领先民主党候选人RossevltRossevlt(罗斯福,(罗斯福,4343),于是该刊预测共和党候选人于是该刊预测共和党候选人LandonLandon将肯定胜出。然而选举结果却将肯定胜出。然而选举结果却是民主党候选人是民主党候选人RossevltRossevlt(6262)以很大优势胜出()以很大优势胜出
7、(LandonLandon,3838)。为什么作家文摘花费那么大精力收集那么多数据会产)。为什么作家文摘花费那么大精力收集那么多数据会产生那么大错误,最终导致该刊不久即生那么大错误,最终导致该刊不久即“关门大吉关门大吉”呢?原来作家呢?原来作家文摘选取样本出了很大问题,完全没有遵循随机性原则。选取得文摘选取样本出了很大问题,完全没有遵循随机性原则。选取得10001000万份样本明显排斥穷人,因为在当时,一般穷人很少拥有私人电话或属万份样本明显排斥穷人,因为在当时,一般穷人很少拥有私人电话或属于哪个俱乐部。众所周知,经济地位很大程度上影响政治态度,穷人压于哪个俱乐部。众所周知,经济地位很大程度上
8、影响政治态度,穷人压倒性支持倒性支持RossevltRossevlt,而有钱人倾心,而有钱人倾心LandonLandon,作家文摘选取样本没有,作家文摘选取样本没有反映出这样的社会现实(总体结构),从而犯了致命错误。反映出这样的社会现实(总体结构),从而犯了致命错误。6.1 6.1 抽样调查概述抽样调查概述 第九页,本课件共有152页三、抽样调查的主要作用三、抽样调查的主要作用 实际工作不可能进行全面调查,而又需要了解其全面实际工作不可能进行全面调查,而又需要了解其全面情况的现象。情况的现象。对某些现象虽然可以进行全面调查,但是由于总对某些现象虽然可以进行全面调查,但是由于总体范围大、单位数目
9、多,又缺乏原始记录可作依据,体范围大、单位数目多,又缺乏原始记录可作依据,实际进行全面调查有许多困难。实际进行全面调查有许多困难。1.1.承担全面调查难以胜任的调查任务承担全面调查难以胜任的调查任务当被调查总体中的单位无限多时,事实上不可能当被调查总体中的单位无限多时,事实上不可能进行全面调查,只能进行抽样调查。进行全面调查,只能进行抽样调查。6.1 6.1 抽样调查概述抽样调查概述 第十页,本课件共有152页2.2.抽样调查能节约费用,快速及时;抽样调查能节约费用,快速及时;3.3.在有些情况下,抽样调查的结果比全面调查要准确;在有些情况下,抽样调查的结果比全面调查要准确;6.6.利用抽样推
10、断的方法,可以对于某种总体的假设进行利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍。检验,来判断这种假设的真伪,以决定取舍。4.4.抽样调查的结果能修正和补充全面调查资料;抽样调查的结果能修正和补充全面调查资料;5.5.抽样调查方法可以用于工业生产过程中的质量控抽样调查方法可以用于工业生产过程中的质量控制制;6.1 6.1 抽样调查概述抽样调查概述 第十一页,本课件共有152页 抽样调查有广泛的应用领域抽样调查有广泛的应用领域。目前,世界上许多国家在以下方面广泛采用抽样调查法:目前,世界上许多国家在以下方面广泛采用抽样调查法:农产品农产品产量调查;产量调查
11、;土地资源利用调查;土地资源利用调查;城乡居民家庭收支调查;城乡居民家庭收支调查;工业产品质量检验;工业产品质量检验;劳动就业调查;劳动就业调查;市场、物价和购买力调市场、物价和购买力调查;查;饮水、住宅、人民健康和社会福利调查;饮水、住宅、人民健康和社会福利调查;科学实验效果科学实验效果调查;调查;环境污染调查;环境污染调查;人口、工业、农业等各种普查后的复人口、工业、农业等各种普查后的复查;民意测验等。查;民意测验等。6.1 6.1 抽样调查概述抽样调查概述 四、抽样调查的主要应用四、抽样调查的主要应用 第十二页,本课件共有152页在我国,抽样法已被广泛应用于生产技术及社会生活各个领域。在
12、我国,抽样法已被广泛应用于生产技术及社会生活各个领域。目前,国家统计调查制度中所包括的统计指标,依靠抽样方法取得目前,国家统计调查制度中所包括的统计指标,依靠抽样方法取得的资料已达到三分之一左右。的资料已达到三分之一左右。在城乡住户调查、农产品调查、价格统计、市场调查等领域,应用在城乡住户调查、农产品调查、价格统计、市场调查等领域,应用抽样调查已取得很好的成果,在人口统计、社会统计、交通统计、抽样调查已取得很好的成果,在人口统计、社会统计、交通统计、商业统计等领域,抽样调查也正在发挥越来越重要的作用。随着我商业统计等领域,抽样调查也正在发挥越来越重要的作用。随着我国社会主义市场经济的发展,抽样
13、调查的应用范围将逐渐扩大,所国社会主义市场经济的发展,抽样调查的应用范围将逐渐扩大,所发挥的作用也将越来越大。发挥的作用也将越来越大。6.1 6.1 抽样调查概述抽样调查概述 第十三页,本课件共有152页抽样调查也有其自身的局限性:抽样调查也有其自身的局限性:首先,由于总体构成的复杂性,通常无法提供总体中各个组成首先,由于总体构成的复杂性,通常无法提供总体中各个组成部分的资料。其次,组织抽样调查要遵守某些条件,被调查对部分的资料。其次,组织抽样调查要遵守某些条件,被调查对象也有一定限制。一些重要的反映国情、国力的统计资料,仍象也有一定限制。一些重要的反映国情、国力的统计资料,仍然必须组织全面调
14、查。因此,既要大力推广和应用抽样调查,然必须组织全面调查。因此,既要大力推广和应用抽样调查,又不能用抽样调查取代其他调查,应根据资料的性质和调查对又不能用抽样调查取代其他调查,应根据资料的性质和调查对象的不同,采用不同的统计调查形式。象的不同,采用不同的统计调查形式。6.1 6.1 抽样调查概述抽样调查概述 第十四页,本课件共有152页(一一)全及总体和抽样总体全及总体和抽样总体(总体和样本总体和样本)全全及总体(总体):所要调查观察的全部事物。及总体(总体):所要调查观察的全部事物。总体单位数用总体单位数用N N表示。表示。五、抽样调查的基本概念五、抽样调查的基本概念6.1 6.1 抽样调查
15、概述抽样调查概述 第十五页,本课件共有152页抽抽样总体(样本):样总体(样本):是从全及总体中随机抽取出来进是从全及总体中随机抽取出来进行调查,并依此推断总体的那部分个体。行调查,并依此推断总体的那部分个体。6.1 6.1 抽样调查概述抽样调查概述 注意:注意:对于某一研究对象,当研究目的确定时,对于某一研究对象,当研究目的确定时,全及全及总体是唯一确定的,抽样总体是不唯一的。总体是唯一确定的,抽样总体是不唯一的。样样本个数本个数指从总体中指从总体中可能可能抽取的样本的数量。抽取的样本的数量。样样本容量本容量指一个样本所包括的单位数。指一个样本所包括的单位数。第十六页,本课件共有152页(二
16、)全及指标与抽样指标(二)全及指标与抽样指标1 1、全及指标全及指标:根据总体中各单位的标志值计算出来的:根据总体中各单位的标志值计算出来的用于反映总体数量特征的指标,也称母体参数。用于反映总体数量特征的指标,也称母体参数。总体平均数(总体均值):总体平均数(总体均值):总体成数:总体成数:总体标准差:总体标准差:总体中具有某种总体中具有某种特性个体数目特性个体数目针对数量标志针对数量标志针对是否标志针对是否标志6.1 6.1 抽样调查概述抽样调查概述 第十七页,本课件共有152页2 2、抽样指标:抽样指标:根据样本中各单位的标志值计算出来的用于反根据样本中各单位的标志值计算出来的用于反映样本
17、数量特征的指标,也称样本参数。映样本数量特征的指标,也称样本参数。抽样平均数(样本均值):抽样平均数(样本均值):样本成数:样本成数:样本标准差:样本标准差:样本中具有某种样本中具有某种特性个体数目特性个体数目6.1 6.1 抽样调查概述抽样调查概述 第十八页,本课件共有152页(三)抽样框(三)抽样框对可以选择作为样本的总体单位列出名册或排序编号,对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若采用抽签的方式或按照随机数表来抽选必要的单位数。若
18、没有抽样框,则不能计算样本单位的概率,从而也就无法没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。进行概率选样。6.1 6.1 抽样调查概述抽样调查概述 大学学生花名册、城市黄页里的电话列表、工商企业大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册名录、街道派出所里居民户籍册、意向购房人信息册。第十九页,本课件共有152页(四)、抽样方法和样本可能数目(四)、抽样方法和样本可能数目6.1 6.1 抽样调查概述抽样调查概述 抽样方法:抽样方法:重复抽样重复抽样 不重复抽样不重复抽样 考虑顺序抽样考虑顺序抽样 不不考虑顺序抽样考虑顺序抽样
19、 样本可能数目样本可能数目1 1、考虑顺序的不重复抽样、考虑顺序的不重复抽样第二十页,本课件共有152页6.1 6.1 抽样调查概述抽样调查概述 2 2、考虑顺序的重复抽样、考虑顺序的重复抽样3 3、不考虑顺序的不重复抽样、不考虑顺序的不重复抽样4 4、不考虑顺序的重复抽样、不考虑顺序的重复抽样第二十一页,本课件共有152页6.1 6.1 抽样调查概述抽样调查概述 六、抽样调查的理论依据六、抽样调查的理论依据(一)大数定律(一)大数定律1 1、独立同分布大数定律:、独立同分布大数定律:样本平均数估计总体平均数样本平均数估计总体平均数 2 2、贝努里大数定律:用频率代替概率、贝努里大数定律:用频
20、率代替概率第二十二页,本课件共有152页大数的意义 1、现象的总体规律性,只有当具有这种现象的足够多的数的单位汇集在一起时才得显现。因此,只有从大量现象的总体中,才能研究这些现象的规律性。2、现象的总规律性,通常以平均数的形式表现出来。第二十三页,本课件共有152页3、当所研究现象包含总体单位越多,平均数就越能反映出这些现象的规律性。4、各单位的共同倾向(表现为主要的、基本的因素)决定着平均数的水平,而各单位对平均数的离差(表现为次要的、偶然的因素)则会由于足够多数单位的综合汇总而相互抵消,趋于消失。第二十四页,本课件共有152页(二二)中心极限定理中心极限定理1 1、独立同分布中心极限定理、
21、独立同分布中心极限定理 2 2、德莫夫、德莫夫-拉普拉斯中心极限定理拉普拉斯中心极限定理6.1 6.1 抽样调查概述抽样调查概述 第二十五页,本课件共有152页在统计调查中,调查资料与实际情况不一致,两者在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。的偏离称为统计误差。抽抽样误差是指样本指标和总体指标之间数量上的差别样误差是指样本指标和总体指标之间数量上的差别(即随机误差)。这种误差是抽样调查固有的误差,是(即随机误差)。这种误差是抽样调查固有的误差,是无法避免的。无法避免的。一、抽样误差的概念一、抽样误差的概念 6.2 6.2 抽样平均误差抽样平均误差第二十六页,本课件共有
22、152页随机误差的两种形式:随机误差的两种形式:抽样平均误差:样本指标抽样平均误差:样本指标(抽样平均数或抽样成数抽样平均数或抽样成数)的标准的标准差。由于抽样的随机性而产生的样本指标与总体指标之间差。由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。的平均离差。抽样推断主要任务抽样推断主要任务:利用样本指标推断总体指标利用样本指标推断总体指标本章中即本章中即:只要只要 则样本指标同总体指标之间就有不同,即则样本指标同总体指标之间就有不同,即利用样本推断总体存在误差。利用样本推断总体存在误差。6.2 6.2 抽样平均误差抽样平均误差第二十七页,本课件共有152页(1 1)总体标志变动度
23、)总体标志变动度各调查单位标志值之间的差异越大各调查单位标志值之间的差异越大抽样分布越分散抽样分布越分散抽样误差越大抽样误差越大即总体内各调查单位标志值之间无即总体内各调查单位标志值之间无差异,则不存在抽样误差差异,则不存在抽样误差 6.2 6.2 抽样平均误差抽样平均误差二、影响抽样平均误差的因素二、影响抽样平均误差的因素第二十八页,本课件共有152页(2 2)样本容量)样本容量样本容量是影响抽样误差大小样本容量是影响抽样误差大小最直接、最有效最直接、最有效的因素的因素(3 3)抽样方法、方式)抽样方法、方式其他条件相同时,其他条件相同时,重复抽样误差重复抽样误差不重复抽样的误差不重复抽样的
24、误差从抽样方式上看,简单随机抽样、分层抽样、系统抽样、整从抽样方式上看,简单随机抽样、分层抽样、系统抽样、整群抽样与多阶段抽样的抽样误差也有区别。群抽样与多阶段抽样的抽样误差也有区别。其他条件相同时其他条件相同时,n,n 越接近越接近 N,N,误差越小误差越小 6.2 6.2 抽样平均误差抽样平均误差第二十九页,本课件共有152页三、抽样平均误差的作用:三、抽样平均误差的作用:1.1.在在于说明抽样指标的代表性程度。于说明抽样指标的代表性程度。误差大,则抽样指标代表性低;误差大,则抽样指标代表性低;误差小,则抽样指标代表性高;误差小,则抽样指标代表性高;误差等于误差等于0 0,则抽样指标和总体
25、指标一样大。,则抽样指标和总体指标一样大。2.2.说说明样本指标和总体指标相差的一般范围。明样本指标和总体指标相差的一般范围。3.3.确确定抽样单位数的多少定抽样单位数的多少 6.2 6.2 抽样平均误差抽样平均误差第三十页,本课件共有152页(一)抽样平均数的抽样平均误差(一)抽样平均数的抽样平均误差四、抽样平均误差的计算四、抽样平均误差的计算 6.2 6.2 抽样平均误差抽样平均误差计算公式计算公式式中:式中:抽样平均数抽样平均数全及平均数全及平均数p p抽样成数抽样成数P P 全及成数全及成数K K 样本可能数目样本可能数目(或抽样平均数的个数或抽样平均数的个数)第三十一页,本课件共有1
26、52页例例 6.2 6.2 抽样平均误差抽样平均误差第三十二页,本课件共有152页101010-20 400102015-15 225103020-10 100104025 -5 25105030 0 0201015-15 225202020-10 100203025 -5 25204030 0 0205035 5 25301020-10 100302025 -5 25303030 0 0304035 5 2530504010 100401025-5 25402030 0 0403035 5 2540404010 10040504515 225501030 0 0502035 5 255030
27、4010 10050404515 22550 505020 400合合 计计-2 500接左:接左:6.2 6.2 抽样平均误差抽样平均误差第三十三页,本课件共有152页 6.2 6.2 抽样平均误差抽样平均误差第三十四页,本课件共有152页以上资料编成次数分配表如下:以上资料编成次数分配表如下:样本数样本数f(f(即次数分配即次数分配)101-20152-15203-10254 -5305 0354 5403 10452 15501 20合计合计 25 -6.2 6.2 抽样平均误差抽样平均误差第三十五页,本课件共有152页抽样平均误差是抽样平均误差是所有可能出现所有可能出现的样本指标的的样
28、本指标的标准差标准差。它是由于抽样的随机性而产生的样本指标与总体指它是由于抽样的随机性而产生的样本指标与总体指标之间的标之间的平均离差平均离差。6.2 6.2 抽样平均误差抽样平均误差上例五户中抽取二户调查,如采取不考虑顺序的不上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:重复抽样方法,则:第三十六页,本课件共有152页 6.2 6.2 抽样平均误差抽样平均误差抽取样本抽取样本 样本平均数样本平均数 离差离差10 2015-1522510 3020-1010010 4025-5 2510 5030 0 020 3025-5 2520 4030 0 020 5035 5 2530
29、 4035 5 2530 50401010040 504515225合合 计计-750第三十七页,本课件共有152页但是,以上公式在实际工作中不常用,因为但是,以上公式在实际工作中不常用,因为 未知,未知,且不可能抽取且不可能抽取k k个样本个样本,所以通常使用根据数理统计所以通常使用根据数理统计学知识导出的公式:学知识导出的公式:6.2 6.2 抽样平均误差抽样平均误差1、重复抽样2、不重复抽样第三十八页,本课件共有152页取得取得的途径有:的途径有:1.1.用过去全面调查或抽样调查的资料,若同时用过去全面调查或抽样调查的资料,若同时有有n个个的资料,应选用数值较大的那个;的资料,应选用数值
30、较大的那个;2.2.用样本标准差用样本标准差S代替全及标准差代替全及标准差;3.3.在大规模调查前,先搞个小规模的试验性的在大规模调查前,先搞个小规模的试验性的调查来确定调查来确定S,代替,代替;4.4.用估计的方法。用估计的方法。6.2 6.2 抽样平均误差抽样平均误差第三十九页,本课件共有152页不重复抽样不重复抽样 6.2 6.2 抽样平均误差抽样平均误差第四十页,本课件共有152页例例1 1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。则抽样平均误差为多少?6.2 6.2 抽样平均误差抽样
31、平均误差第四十一页,本课件共有152页 6.2 6.2 抽样平均误差抽样平均误差第四十二页,本课件共有152页例例2 2:某地对某地对3200户进行年收入调查,抽取户进行年收入调查,抽取5%农户作样本,调查农户作样本,调查结果:结果:2001年每人平均收入年每人平均收入6673元,其年收入的标准差为元,其年收入的标准差为106.80元,试按照重复抽样和不重复抽样计算抽样平均误差。元,试按照重复抽样和不重复抽样计算抽样平均误差。第四十三页,本课件共有152页例例3 3:某学院为了解在校生身高情况,从某学院为了解在校生身高情况,从20002000名学生中名学生中随机抽取了随机抽取了5050名进行调
32、查,所得资料如表所示,试用名进行调查,所得资料如表所示,试用重复抽样和不重复抽样两种方法计算学生平均身高的重复抽样和不重复抽样两种方法计算学生平均身高的抽样误差。抽样误差。6.2 6.2 抽样平均误差抽样平均误差第四十四页,本课件共有152页 6.2 6.2 抽样平均误差抽样平均误差(二)抽样成数的抽样平均误差(二)抽样成数的抽样平均误差交替标志的平均数和标准差计算表交替标志的平均数和标准差计算表q2p+p2q=qppp+q=1合计(0-p)2q(0-p)20-p0q0不合格品(1-p)2p(1-p)21-ppp1合格品(x-x)2f(x-x)2x-xxffx离差平方乘权数离差平方离差变量x成
33、数单位数(成数)交替标志(变量)第四十五页,本课件共有152页当总体成数未知时,可以用样本成数来代替。当总体成数未知时,可以用样本成数来代替。6.2 6.2 抽样平均误差抽样平均误差1、重复抽样、重复抽样2、不重复抽样、不重复抽样第四十六页,本课件共有152页例例1 1:某企业生产的产品,按正常生产经验,合格率为:某企业生产的产品,按正常生产经验,合格率为90%90%,现从,现从50005000件产品中抽取件产品中抽取5050件进行检验,求合格率的件进行检验,求合格率的抽样平均误差。抽样平均误差。6.2 6.2 抽样平均误差抽样平均误差第四十七页,本课件共有152页例例2 2:一批罐头共:一批
34、罐头共6000060000桶,随机抽查桶,随机抽查300300桶,发现桶,发现有六桶不合格,求合格率的抽样误差。有六桶不合格,求合格率的抽样误差。6.2 6.2 抽样平均误差抽样平均误差第四十八页,本课件共有152页 一、点估计一、点估计也叫定值估计,就是以所抽样本资料为依据,直接根也叫定值估计,就是以所抽样本资料为依据,直接根据所选择的估计量对总体指标作出一个确定值的估计。据所选择的估计量对总体指标作出一个确定值的估计。6.3 6.3 全及指标推断全及指标推断第四十九页,本课件共有152页例例 6.3 6.3 全及指标推断全及指标推断第五十页,本课件共有152页二、区间估计二、区间估计根据样
35、本指标和抽样误差去推断全及指标的可能范根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。围,它能说清楚估计的准确程度和把握程度。对总体平均数的区间估计为:对总体平均数的区间估计为:对总体成数的区间估计为:对总体成数的区间估计为:或或或或 6.3 6.3 全及指标推断全及指标推断第五十一页,本课件共有152页1 1、抽样极限误差、抽样极限误差概念:概念:样本指标和全及指标之间误差的可能范围叫做样本指标和全及指标之间误差的可能范围叫做抽样极限误差,用抽样极限误差,用表示。表示。抽样极限误差抽样极限误差是是单个样本值单个样本值与总体指标值之间的与总体指标值之间的绝对
36、离差的可能范围,而抽样平均误差绝对离差的可能范围,而抽样平均误差是是所有可能所有可能样本值样本值与总体指标值之间的平均离差与总体指标值之间的平均离差与抽样平均误差的区别:与抽样平均误差的区别:6.3 6.3 全及指标推断全及指标推断第五十二页,本课件共有152页用抽样极限误差与抽样平均误差相比,从而使由单用抽样极限误差与抽样平均误差相比,从而使由单一样本值得到的抽样极限误差标准化,这样可称为一样本值得到的抽样极限误差标准化,这样可称为抽样标准极限误差,但通常称其为抽样标准极限误差,但通常称其为概率度(概率度(t t)或相或相对误差范围。对误差范围。2 2、抽样估计的概率度、抽样估计的概率度由此
37、可知,标准正态分布变量由此可知,标准正态分布变量t t服从标准正态概率分布。服从标准正态概率分布。6.3 6.3 全及指标推断全及指标推断第五十三页,本课件共有152页3 3、抽样估计的可信程度、抽样估计的可信程度又称又称置信度置信度。具体地说,。具体地说,置信区间置信区间是以一定的是以一定的概率把握程度确定总体指标所在的区间。概率把握程度确定总体指标所在的区间。置信度置信度是是总体指标落在某个区间的概率把握程度。总体指标落在某个区间的概率把握程度。6.3 6.3 全及指标推断全及指标推断抽样估计的可信程度即概率用抽样估计的可信程度即概率用P P表示,表示,P P是是t t的函数。的函数。而而
38、p=F(t)p=F(t)表明概率分布是概率度表明概率分布是概率度t t的函数。确定抽的函数。确定抽样估计的可靠程度,就是要确定抽样平均数(样估计的可靠程度,就是要确定抽样平均数()或抽样成数()或抽样成数(p p)落在置信区间()落在置信区间()或()或()中的概率)中的概率P P。第五十四页,本课件共有152页 6.3 6.3 全及指标推断全及指标推断F(t)F(t)的函数形式为:的函数形式为:第五十五页,本课件共有152页应用标准正态分布概率表,可以得出总体指标落在置应用标准正态分布概率表,可以得出总体指标落在置信区间内的置信度。信区间内的置信度。6.3 6.3 全及指标推断全及指标推断6
39、8.27%95.45%第五十六页,本课件共有152页 6.3 6.3 全及指标推断全及指标推断第五十七页,本课件共有152页当当F(t)=68.27%F(t)=68.27%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的1 1倍倍(t=1);(t=1);当当F(t)=95.45%F(t)=95.45%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的2 2倍倍(t=2);(t=2);当当F(t)=99.73%F(t)=99.73%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的3 3倍倍(t=3);(t=3);可见,抽样极限误差,即扩大
40、或缩小了以后的抽样误差范围。可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。例例 6.3 6.3 全及指标推断全及指标推断第五十八页,本课件共有152页4 4、全及平均数和全及成数的推断、全及平均数和全及成数的推断(1 1)按预定的概率保证程度)按预定的概率保证程度F F(t t)来估计抽样误差可)来估计抽样误差可能范围能范围;(2 2)事先提出允许的误差范围)事先提出允许的误差范围,计算相应的估计,计算相应的估计可靠程度;可靠程度;6.3 6.3 全及指标推断全及指标推断第五十九页,本课件共有152页例例1 1:某农场进行小麦产量的抽样调查,该农场小麦某农场进行小麦产量的抽样调查,该农
41、场小麦播种面积为播种面积为1000010000亩,采用不重复的简单随机抽样从亩,采用不重复的简单随机抽样从中选中选100100亩作为样本,进行实割实测,得到样本的平亩作为样本,进行实割实测,得到样本的平均亩产量为均亩产量为400400千克,样本标准差为千克,样本标准差为1212千克。以千克。以95.45%(t=2)95.45%(t=2)和和99.73%(t=3)99.73%(t=3)的概率估计小麦平均亩的概率估计小麦平均亩产量的可能范围?产量的可能范围?6.3 6.3 全及指标推断全及指标推断第六十页,本课件共有152页解:解:6.3 6.3 全及指标推断全及指标推断第六十一页,本课件共有15
42、2页例例2 2:某农场种植小麦某农场种植小麦50005000亩,收获前夕随机抽取亩,收获前夕随机抽取2525亩亩进行实割实测,测得平均亩产为进行实割实测,测得平均亩产为500500千克,标准差为千克,标准差为5050千克,试求全部千克,试求全部500500亩小麦的平均亩产在亩小麦的平均亩产在480480千克千克520520千克之间的概率。千克之间的概率。6.3 6.3 全及指标推断全及指标推断第六十二页,本课件共有152页例例3 3:某机械厂日产某种产品某机械厂日产某种产品80008000件,现采用纯随机不重复抽样方式件,现采用纯随机不重复抽样方式(按重复抽样公式计算按重复抽样公式计算),从中
43、抽取,从中抽取400400件进行观察,其中有件进行观察,其中有380380件为一件为一级品,试以概率级品,试以概率95.45%95.45%的可靠程度推断全部产品的一级品率及一级品的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:数量的范围。则:抽样一级品率:6.3 6.3 全及指标推断全及指标推断第六十三页,本课件共有152页(一一)直接推断法直接推断法抽样平均数抽样平均数(成数成数)总体单位数总体单位数=总体标志总量总体标志总量1.1.如如果采用点估计方法:上例果采用点估计方法:上例1 1中:中:40010000=400(40010000=400(万千克万千克)如果用区间
44、估计方法:上例中该农场小麦总产量的范围为:如果用区间估计方法:上例中该农场小麦总产量的范围为:t=2:(397.62 t=2:(397.62 402.38)10000=397.62 402.38)10000=397.62 402.38(402.38(万千克万千克)t=3:(396.43 t=3:(396.43 403.57)10000=396.43 403.57)10000=396.43 403.57(403.57(万千克万千克)2.2.上上例例3 3中,全部一级品数量的范围为:中,全部一级品数量的范围为:(92.82%(92.82%97.18%)8000=7425.6 97.18%)8000
45、=7425.6 7774.4(7774.4(件件)三、全及总体总量指标的推断三、全及总体总量指标的推断 6.3 6.3 全及指标推断全及指标推断第六十四页,本课件共有152页(二二)修正系数法修正系数法用用抽样所得的调查结果同有关资料对比的系数来修正全面抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。统计资料时采用的一种方法。6.3 6.3 全及指标推断全及指标推断例例1 1:某村:某村60006000农户,农户,20012001年年末统计养猪头数,从下往上报年年末统计养猪头数,从下往上报的是的是90009000头,现抽头,现抽1010(600(600户户)的农户再复
46、查一下,发现有漏的农户再复查一下,发现有漏报,也有重报。按报,也有重报。按600600户,原来数字是户,原来数字是890890头,实际复查为头,实际复查为935935头,故总的来说,是少报。头,故总的来说,是少报。第六十五页,本课件共有152页例例2 2:某市房地局,年报工资总额某市房地局,年报工资总额3218.13218.1万元。万元。现抽查现抽查1414个单位:个单位:年报:年报:415.03415.03万元万元 多报:多报:0.440.44万元万元 少报:少报:1.471.47万元万元抵冲后抵冲后 1.47-0.44=1.03(1.47-0.44=1.03(万元万元)6.3 6.3 全及
47、指标推断全及指标推断第六十六页,本课件共有152页抽样方案设计的基本原则抽样方案设计的基本原则u抽样随机性原则u最大抽样效果原则 6.4 6.4 抽样方案设计抽样方案设计第六十七页,本课件共有152页一、简单随机抽样一、简单随机抽样(纯随机抽样纯随机抽样)即从总体单位中不加任何分组、排队,完全随机即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。地抽取调查单位。随机抽选可有各种不同的具体做法,如:随机抽选可有各种不同的具体做法,如:1.1.直接抽选法;直接抽选法;2.2.抽签法(总体单位数在抽签法(总体单位数在10001000以内)以内);3.3.随机数码表法;随机数码表法;6.4 6
48、.4 抽样方案设计抽样方案设计第六十八页,本课件共有152页随机数码表法53 74 23 99 67 61 32 28 69 84 94 62 67 86 24 98 33 4163 38 06 86 54 99 00 65 26 94 02 82 90 23 07 79 62 6703 92 18 27 46 57 99 16 96 56 30 33 72 85 22 84 64 3845 17 75 65 57 28 40 39 72 12 25 12 74 75 67 20 44 6043 31 67 72 30 24 02 94 08 63 38 32 36 66 02 69 36 3
49、878 60 73 99 84 43 89 94 36 45 56 69 47 07 41 90 22 9184 37 90 61 56 70 10 23 98 05 85 11 33 76 60 76 48 4555 19 68 97 65 03 73 52 16 56 04 53 55 93 27 33 42 2949 83 43 48 35 82 88 33 69 75 72 36 05 19 76 47 66 1821 31 38 86 24 37 79 81 53 74 73 24 12 13 35 52 83 90 6.4 6.4 抽样方案设计抽样方案设计第六十九页,本课件共有15
50、2页简单随机抽样的抽样平均误差简单随机抽样的抽样平均误差(一一)平均数的抽样平均误差平均数的抽样平均误差1.1.重重复抽样:复抽样:2.2.不不重复抽样:重复抽样:6.4 6.4 抽样方案设计抽样方案设计第七十页,本课件共有152页 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,例例根据以往资料,产品质量不太稳定,若=200小时,6.4 6.4 抽样方案设计抽样方案设计第七十一页,本课件共有152页(二二)成数的抽样平均误差成数的抽样平均误差 已证明得:已证明得:成数的方差为成数的方差为p(1-p)p(1