《第6章 抽样推断.pptx》由会员分享,可在线阅读,更多相关《第6章 抽样推断.pptx(138页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章第六章 抽样推断抽样推断 1234第一节第一节 抽样推断有关概念与理论依据抽样推断有关概念与理论依据 一、抽样推断的意义、内容一、抽样推断的意义、内容(一)概念(一)概念 按照随机原则从总体中抽取一部分单位进按照随机原则从总体中抽取一部分单位进行观察,并根据被抽取的那部分单位的结果,对行观察,并根据被抽取的那部分单位的结果,对总体作出具有一定可靠程度的推断总体作出具有一定可靠程度的推断 。统计推断的过程统计推断的过程(二)特点(二)特点 1 1、按照随机原则抽取部分单位、按照随机原则抽取部分单位, ,2 2、部分单位、部分单位 总体。总体。3 3、抽样误差可以计算和控制。、抽样误差可以计
2、算和控制。(三三)抽样推断的内容抽样推断的内容w 参数估计参数估计 依据所获得的样本观察资料,对依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量所研究现象总体的水平、结构、规模等数量特征进行估计。特征进行估计。w 假设检验假设检验 利用样本的实际资料来检验事先利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的对总体某些数量特征所作的假设是否可信的一种统计分析方法。一种统计分析方法。二、抽样推断的作用二、抽样推断的作用 抽抽样调查方法是市场经济国家在调查方法样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、上的必然选择,和普查相比,它具
3、有准确度高、成本低、速度快、应用面广等优点。成本低、速度快、应用面广等优点。 建立起建立起以周期性普查为基础、经常性抽样以周期性普查为基础、经常性抽样调查为主体,必要的统计报表、重点调查、综调查为主体,必要的统计报表、重点调查、综合分析等为补充的国家统计调查方法体系,是合分析等为补充的国家统计调查方法体系,是我国统计方法制度改革的指导思想。我国统计方法制度改革的指导思想。 1.1.实实际工作不可能进行全面调查观察,而又需要了解际工作不可能进行全面调查观察,而又需要了解其全面资料的事物其全面资料的事物;2.2.虽虽可进行全面调查观察,但比较困难或并不必要;可进行全面调查观察,但比较困难或并不必要
4、;3.3.对对普查或全面调查统计资料的质量进行检查和修正;普查或全面调查统计资料的质量进行检查和修正;4.4.抽抽样方法适用于对大量现象的观察,即组成事物样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假设用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。进行检验,判断这种假设的真伪,以决定取舍。三、抽样推断的基本概念三、抽样推断的基本概念 ( (一一) ) 全及总体和抽样总体全及总体和抽样总体( (总体和样本总体和样本) )全全及总体:所要调查观察的全部事物。及总体:所
5、要调查观察的全部事物。 总体单位数用总体单位数用N N表示。表示。抽抽样总体:抽取出来调查观察的单位。样总体:抽取出来调查观察的单位。 抽样总体的单位数用抽样总体的单位数用n n表示。表示。 n n 30 30 大样本大样本 n 30 n 30时,时,t分布与标准正态分布分布与标准正态分布N(0,1)就非常接近就非常接近. 但对较小的但对较小的n值,值,t分布与标准正态分布之间有较大分布与标准正态分布之间有较大差异差异.且且P|T|t0P|X|t0,其中,其中X N(0,1),即在,即在t分分布的尾部比在标准正态分布的尾部有着更大的概率布的尾部比在标准正态分布的尾部有着更大的概率.t 分布的数
6、学期望与方差分布的数学期望与方差设设Tt (n),则,则E(T)=0,D(T)=.(2)2nnn 设设(X1,X2,Xn)为来自正态总体为来自正态总体 XN( , 2)的样本,则统计量的样本,则统计量 (1)(5.9)XTt nSn 证证由于由于与与S 2相互独立,且相互独立,且 X(0,1),XUNn 222(1)(1)nSn 由定义由定义5.4得得22 (1)(1)(1)XnXTt nSnnSn 设设(X1,X2,Xn1)和和(Y1,Y2,Yn2) 分别是来自正态总体分别是来自正态总体N( 1 , 2)和和N( 2 , 2)的的样本,且它们相互独立,则统计量样本,且它们相互独立,则统计量1
7、21212() (2)(5.10)11nXYTt nnSnn 其中其中22112212(1)(1),2nnSnSSnn 、21S22S分别为两总体的样本方差分别为两总体的样本方差.2分布分布 0,1XN 定义定义 设总体设总体 , 是是 的一个样本的一个样本, , 则称统计量则称统计量 服从自服从自由度为由度为n n的的 分布,记作分布,记作X12,.,nXXX222212nXXX222( )n自由度是指独立随机变量的个数,自由度是指独立随机变量的个数, dfn2n n个相互独立的标准正态分布之平方和个相互独立的标准正态分布之平方和服从自由度为服从自由度为n n的的 分布分布 五、抽样推断的基
8、本原理五、抽样推断的基本原理举例说明举例说明 总体方差已知时总体方差已知时总体均值总体均值的区间估计的区间估计 当当X X ,可以证明抽自该总体的简单随机样本,可以证明抽自该总体的简单随机样本X1,X2X1,X2,XnXn的样本平均数的样本平均数 服从数学期望为服从数学期望为 ,方差,方差为为 的正态分布,即的正态分布,即 采用统计量采用统计量Z Z,将非标准正态分布转化为标准正态分布,将非标准正态分布转化为标准正态分布,2,Nxn/2xn,N2N(0,1)nxZ/例例对于给定的置信概率对于给定的置信概率a1,可以查正态分布表,可以查正态分布表,2/Z( (即概率度即概率度t)t)使得:使得:
9、得出相应的临界值得出相应的临界值aZZZP12/2/aZnxZP1/2/2/anZxnZxP12/2/即在给定的显著性水平即在给定的显著性水平 下,总体均值下,总体均值 在在 的置信概率下的置信区间为的置信概率下的置信区间为 aa1nZxnZxaa2/2/,第二节第二节 抽样误差抽样误差 一、抽样误差的概念及种类一、抽样误差的概念及种类在抽样调查中,总体指标与样本指标不一致,两者在抽样调查中,总体指标与样本指标不一致,两者的偏差称为抽样误差。的偏差称为抽样误差。 -X 抽抽样样误误差差就就是是指指样样本本指指标标和和总总体体指指标标之之间间数数量量上上的的差差别别,即即、p-Pp-P 。抽样误
10、差抽样误差即指随机误差,这是抽样调查即指随机误差,这是抽样调查固有的误差,是无法避免的。固有的误差,是无法避免的。 登登记记误误差差系系统统性性误误差差统统计计误误差差代代表表性性误误差差抽抽样样实实际际误误差差随随机机误误差差抽抽样样平平均均误误差差抽样误差的作用:抽样误差的作用:1. 1. 在在于说明样本指标的代表性大小。于说明样本指标的代表性大小。 误差大,则样本指标代表性低;误差大,则样本指标代表性低; 误差小,则样本指标代表性高;误差小,则样本指标代表性高; 误差等于误差等于0 0,则样本指标和总体指标一样大,则样本指标和总体指标一样大。2. 2. 说说明样本指标和总体指标相差的一般
11、范围。明样本指标和总体指标相差的一般范围。二、抽样平均误差二、抽样平均误差 (一)概念(一)概念 抽样平均误差抽样平均误差是是所有可能出现的样本指标所有可能出现的样本指标的标的标准差。反映样本指标与总体指标之间误差的一般水准差。反映样本指标与总体指标之间误差的一般水平。平。通常用通常用表示。表示。 即是由于抽样的随机性而产生的样本指标与总即是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。体指标之间的平均离差。(二)理论公式(二)理论公式22() () xpMMxXpP 2 1020304050X30()525()五五户户家家庭庭三三月月份份购购买买福福利利彩彩票票的的支支出出:元元
12、, 元元, 元元, 元元, 元元元元现现从从五五户户中中抽抽取取二二户户作作调调查查,如如果果为为重重复复抽抽样样 考考虑虑顺顺序序种种排排列列组组合合如如下下:例例1010102010301040105020102020203020402050301030203030抽抽取取样样本本抽抽取取样样本本3040305040104020403040404050501050205030504050 50合合 计计101010-20 400102015-15 225103020-10 100104025 -5 25105030 0 0201015-15 225202020-10 100203025 -
13、5 25204030 0 0205035 5 25301020-10 100302025 -5 25303030 0 0 x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本304035 5 2530504010 100401025 -5 25402030 0 0403035 5 2540404010 10040504515 225501030 0 0502035 5 2550304010 10050404515 22550 505020 400合合 计计-2 5002()2500 10()25 xMxX 元元(三)实际计
14、算公式三)实际计算公式 (以纯随机抽样为例)(以纯随机抽样为例)x2 n 1.1.重重复抽样复抽样pp(1p) n 2.2.不不重重复抽样复抽样pp(1p)n (1)nN 2xn(1)nN 总体方差未知时解决方法:总体方差未知时解决方法:w 1、用样本方差代替、用样本方差代替22 s 用用代代替替 用用 (1- )(1- )代代替替p(1-p)p(1-p)w2 2、用过去全面调查的资料,也可以、用过去全面调查的资料,也可以用过去用过去 抽样抽样调查的资料代替。调查的资料代替。 某灯泡厂从一天所生产的产品某灯泡厂从一天所生产的产品10,00010,000个中抽取个中抽取100100个个检查其寿命
15、,得平均寿命为检查其寿命,得平均寿命为20002000小时,根据以往资小时,根据以往资料料=20=20小时,试求抽样平均误差。小时,试求抽样平均误差。例例x2220 2n100 (小小时时)2x2n(1)nN20100(1)1.99(10010000 小小时时)重复抽样重复抽样: :不重复抽样不重复抽样: :147 98%150(1)0.98 (10.98)1.14%150ppppn 某玻璃器皿厂某日生产某玻璃器皿厂某日生产1500015000只印花玻璃杯,现只印花玻璃杯,现按重复抽样方法从中抽取按重复抽样方法从中抽取150150只进行质量检验,有只进行质量检验,有147147只合格,试求这批
16、印花玻璃杯合格率的抽样平只合格,试求这批印花玻璃杯合格率的抽样平均误差。均误差。例例 (1)0.98 (10.98)150 (1)(1)1.1374%15015000pppnnN 若若按按不不重重复复抽抽样样方方式式:(四)影响抽样误差的因素:(四)影响抽样误差的因素: 4. 4. 不不同的抽样组织形式。同的抽样组织形式。1. 1. 全全及总体标志变异程度。及总体标志变异程度。2. 2. 抽抽样单位数目的多少。样单位数目的多少。3. 3. 不不同的抽样方法。同的抽样方法。例:例:假定抽样单位数增加假定抽样单位数增加 2 2 倍、倍、0.50.5倍时,倍时, 其他条件不变,抽样平均误差怎样变化?
17、其他条件不变,抽样平均误差怎样变化?解解:抽样单位数增加抽样单位数增加 2 2 倍,即为原来的倍,即为原来的 3 3 倍倍抽样单位数增加抽样单位数增加 0.50.5倍,即为原来的倍,即为原来的 1.51.5倍倍577. 0313nx8165. 05 . 115 . 1nx即:即:当样本单位数增加当样本单位数增加2 2倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.5770.577倍倍。即:即:当样本单位数增加当样本单位数增加0.50.5倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.81650.8165倍倍。例:例:假定抽样平均误差缩小假定抽样平均误差缩小40%40%时,时,其
18、他其他条件不变,条件不变,抽样单位数怎样变化?抽样单位数怎样变化?解解:抽样平均误差缩小抽样平均误差缩小40%40%时,时, 即为原来的即为原来的 60%60%,2.78()0.6xn倍即:即:当抽样平均误差当抽样平均误差缩小缩小40%40% 时,样本时,样本单位数增加单位数增加1.781.78倍倍。一、抽样极限误差一、抽样极限误差 样本指标与总体指标之间允许的误差范围叫抽样极限样本指标与总体指标之间允许的误差范围叫抽样极限误差。也称抽样允许误差。误差。也称抽样允许误差。 它是样本指标可允许变动的上限或下限与总体指标它是样本指标可允许变动的上限或下限与总体指标之差的绝对值。之差的绝对值。即:即
19、:xpXpP 第三节第三节 抽样估计和推算抽样估计和推算 根据中心极限定理,得知当根据中心极限定理,得知当n n足够大时,抽样总体为足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率间叫抽样极限误差,也称置信区间,即在概率F(t)F(t)的保的保证下:证下: = =tt,(,(t t为概率度)为概率度)当当F(t)=68.27%F(t)=68.27%时,抽样极限误差等于抽样平均误差的时,抽样极限
20、误差等于抽样平均误差的1 1倍倍(t=1);(t=1);当当F(t)=95.45%F(t)=95.45%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的2 2倍倍(t=2);(t=2);当当F(t)=99.73%F(t)=99.73%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的3 3倍倍(t=3);(t=3);例例可见,可见, 抽样极限误差,即扩大或缩小了以后的抽样误差范围。抽样极限误差,即扩大或缩小了以后的抽样误差范围。上例资料编成次数分配表如下:上例资料编成次数分配表如下:x样本数样本数f f 101-20152-15203-10254 -530
21、5 0354 5403 10452 15501 20合计合计 25 -xX -30 -30 样本个数样本个数 样本频率样本频率 样本累计频率样本累计频率 0 0 5 5 10 10 15 15 20 20 合计合计 xxt u )F(t)P(x X -30 -30 样本个数样本个数 样本频率样本频率 样本累计频率样本累计频率 0 5 0.20 0 5 0.20 0.200.20 5 8 0.32 0.52 5 8 0.32 0.52 10 6 0.24 0.76 10 6 0.24 0.76 15 4 0.16 0.92 15 4 0.16 0.92 20 2 0.08 1.00 20 2 0
22、.08 1.00 合计合计 25 1.00 -25 1.00 -xP409110)76%0.510)52%1.510)92%P( x30P( x30P( x30 (一)一)点估计点估计二、抽样估计方法二、抽样估计方法XpP是是由由样样本本指指标标直直接接代代替替全全及及指指标标,不不考考虑虑任任何何抽抽样样误误差差因因素素。即即用用直直接接代代表表 ,用用 直直接接代代表表 。 就就(定值估计)(定值估计)x点估计点估计点估计的方法有点估计的方法有矩估计法矩估计法顺序统计量法顺序统计量法最大似然法最大似然法最小二乘法最小二乘法理论基础是理论基础是抽样分布抽样分布x Pp2 =S2 P22设设表
23、示总体平均数表示总体平均数的估计量,的估计量,表示总体成数表示总体成数P P的估计量,的估计量,表示总体方差表示总体方差的估计量,的估计量,则点估计的基本公式为:则点估计的基本公式为:点估计量优劣的标准:点估计量优劣的标准:(三)有效性(三)有效性 (一)无偏性(一)无偏性(二)一致性(二)一致性1 1无偏性无偏性 221nSEPpExE)(E设设为未知参数为未知参数的估计量的估计量,若估计量,若估计量的期望等于未知参数的真值,即的期望等于未知参数的真值,即则称则称为为的无偏估计量。的无偏估计量。 无偏性无偏性 w 估计量的数学期望等于被估计的总体参数估计量的数学期望等于被估计的总体参数w 对
24、于任意给定的对于任意给定的00,有,有对于这种极限,我们称估计量对于这种极限,我们称估计量 依概率收依概率收敛于敛于 。2 2一致性一致性1limP 一致性一致性 w 随着样本容量的增大,估计量越来越接近随着样本容量的增大,估计量越来越接近被估计的总体参数被估计的总体参数3 3有效性有效性21,121212设设为为的两个无偏估计量,的两个无偏估计量,的方差小于的方差小于的方差,即的方差,即V(V() ) V(V() )则称则称是较是较有效的估计量。有效的估计量。 有效性有效性 ( (二二) )区间估计区间估计是是根据样本指标和抽样误差去推断全及指根据样本指标和抽样误差去推断全及指标的可能范围,
25、并能反映出估计的准确程度和把标的可能范围,并能反映出估计的准确程度和把握程度。握程度。 由于区间估计所表示的是一个可能的范围,而不是由于区间估计所表示的是一个可能的范围,而不是一个绝对可靠的范围。就是说,推断全及指标在这个一个绝对可靠的范围。就是说,推断全及指标在这个范围内只有一定的把握程度。用数学的语言讲,就是范围内只有一定的把握程度。用数学的语言讲,就是有一定的概率。有一定的概率。 区间估计区间估计 落在总体均值某一区间内的样本落在总体均值某一区间内的样本xpXpP xxppF(t)XpPp()()t 在在 概概 率率的的 保保 证证 下下 :即即 : 全全 及及 平平 均均 数数 成成
26、数数抽抽 样样 平平 均均 数数 成成 数数l换句话说,对于总体的被估计指标换句话说,对于总体的被估计指标X X,找出样找出样本的两个估计量本的两个估计量x1x1和和x2x2,使被估计指标,使被估计指标X X落在落在区间(区间(x1x1,x2x2)内的概率内的概率1-1-l0101,为已知的。为已知的。l即即P P(x1Xx2)=1-x1Xx2)=1-是给定的。我们称区是给定的。我们称区间(间( x1x1,x2 x2 )为总体指标为总体指标X X的置信区间,其的置信区间,其估计置信度为估计置信度为1 1一一,称称为显著性水平,为显著性水平,x1x1是置信下限,是置信下限,x2x2是置信上限。是
27、置信上限。2xxxX pppP xxX pppP p 2212100 (1)(1)1.19()10010000 xnnN 千千克克 某农场进行小麦产量的抽样调查,该农场小麦播种面积为某农场进行小麦产量的抽样调查,该农场小麦播种面积为1000010000亩,采用不重复的简单随机抽样从中选亩,采用不重复的简单随机抽样从中选100100亩作为样本,进亩作为样本,进行实割实测,得到样本的平均亩产量为行实割实测,得到样本的平均亩产量为400400千克,样本标准差为千克,样本标准差为1212千克。试以概率千克。试以概率95.45%95.45%保证,估计该农场保证,估计该农场1000010000亩小麦平均亩
28、产量亩小麦平均亩产量的可能范围。的可能范围。例例x 2 1.192.38()xt 千千克克xx xXx 400-2.38 397.624002.38402.38( )95.45%XXF t 22xxx 99.73%12100 (1)(1)1.19()10010000 3 1.193.57()400-3.57 4003.57396.43403.57( )99.73%xxnnNtxXxXXF t 若若以以概概率率保保证证, ,千千克克千千克克 某农场进行小麦产量的抽样调查,该农场小麦播种面积为某农场进行小麦产量的抽样调查,该农场小麦播种面积为1000010000亩,采用不重复的简单随机抽样从中选亩
29、,采用不重复的简单随机抽样从中选100100亩作为样本,进亩作为样本,进行实割实测,得到样本的平均亩产量为行实割实测,得到样本的平均亩产量为400400千克,样本标准差为千克,样本标准差为1212千克。试以概率千克。试以概率95.45%95.45%保证,估计该农场保证,估计该农场1000010000亩小麦平均亩产量亩小麦平均亩产量的可能范围。的可能范围。则:则:例例380100%95%400p 某机械厂日产某种产品某机械厂日产某种产品80008000件,现采用纯随机重复件,现采用纯随机重复抽样方式,从中抽取抽样方式,从中抽取400400件进行观察,其中有件进行观察,其中有380380件为件为一
30、级品,试以概率一级品,试以概率95.45%95.45%的可靠程度推断全部产品的的可靠程度推断全部产品的一级品率及一级品数量的范围。一级品率及一级品数量的范围。例例(1)95%(195%)1.09%400pPPn 2 1.09%2.18%ppt pppPp 95%2.18%95%2.18% 92.82% P 97.18%( )95.45%PF t 1380100%95%400(1)95%(195%)1.09%4002 1.09%2.18%95%2.18%95%2.18% 92.82% P 97.18%( )95.45%74267775ppppppPPnpPF tNtPp 某机械厂日产某种产品某机
31、械厂日产某种产品80008000件,现采用纯随机重复件,现采用纯随机重复抽样方式,从中抽取抽样方式,从中抽取400400件进行观察,其中有件进行观察,其中有380380件为件为一级品,试以概率一级品,试以概率95.45%95.45%的可靠程度推断全部产品的的可靠程度推断全部产品的一级品率及一级品数量的范围。一级品率及一级品数量的范围。例例三、全及总体总量指标的推断三、全及总体总量指标的推断( (一一) ) 直接推断法直接推断法1.1.如如果采用点估计方法:上例果采用点估计方法:上例1 1中:中:40040010000=400(10000=400(万千克万千克) ) 如果用区间估计方法:上例如果
32、用区间估计方法:上例1 1中该农场小麦总产量的范围为:中该农场小麦总产量的范围为: t=2: (397.62 t=2: (397.62 402.38)402.38)10000=397.62 10000=397.62 402.38(402.38(万千克万千克) ) t=3: (396.43 t=3: (396.43 403.57)403.57)10000=396.43 10000=396.43 403.57(403.57(万千克万千克) ) 2.2.上上例例2 2中,全部一级品数量的范围为:中,全部一级品数量的范围为: (92.82% (92.82% 97.18%)97.18%)8000=742
33、5.68000=7425.6 7774.4(7774.4(件件) )( (二二) ) 修正系数法修正系数法就就是用抽样所得的调查结果同有关资料是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一对比的系数来修正全面统计资料时采用的一种方法。种方法。 某村某村60006000农户,农户,20052005年年末统计养猪头数,上报的年年末统计养猪头数,上报的是是90009000头,现抽头,现抽1010(600(600户户) )的农户复查,发现有漏报,的农户复查,发现有漏报,也有重报。按也有重报。按600600户,原来数字是户,原来数字是890890头,实际复查为头,实际复查为935
34、935头。头。例例1 1)(9455%)06. 51 (9000 6000%06. 5%06. 589045)(45890935 头农户养猪头数,即:的系数来修正可用差错率头)(09.3226%)248. 01 (1 .3218%248. 003.41503. 1万元年报工资总额正工资总额,则:根据这一系数,再来修差错率某市房地局,年报工资总额某市房地局,年报工资总额3218.13218.1万元。万元。现抽查现抽查1414个单位:个单位: 年报:年报:415.03415.03万元万元 多报:多报:0.440.44万元万元 少报:少报:1.471.47万元万元抵冲后抵冲后 1.47-0.44=1
35、.03(1.47-0.44=1.03(万元万元) )例例2 2 第四节第四节 抽样设计与组织实施抽样设计与组织实施一、抽样设计的有关问题一、抽样设计的有关问题(一)设计抽样调查方案的基本要求(一)设计抽样调查方案的基本要求1 1、遵循随机原则、遵循随机原则2 2、控制误差范围、控制误差范围3 3、考虑投入产出关系、考虑投入产出关系4 4、保证必要的样本容量、保证必要的样本容量5 5、选择适宜的抽样组织方式、选择适宜的抽样组织方式(二)抽样框的编制(二)抽样框的编制抽样框一般有三种形式:抽样框一般有三种形式: 1 1、名录、名录抽样框抽样框 2、区域抽样框、区域抽样框 3、时间抽样框、时间抽样框
36、简单随机抽样简单随机抽样( (纯随机抽样纯随机抽样) )类型抽样类型抽样( (分类抽样分类抽样) )机械抽样机械抽样( (等距抽样等距抽样) )整群抽样整群抽样( (分群抽样分群抽样) )二、抽样组织方式二、抽样组织方式 ( (一一) )简单随机抽样简单随机抽样( (纯随机抽样纯随机抽样) )1 1、内容:、内容: 2 2、随机抽取样本的具体做法:、随机抽取样本的具体做法: (1 1)直接抽取法;)直接抽取法;(2 2)抽签法;)抽签法;(3 3)随机数字表法。)随机数字表法。 对总体中所有单位除编号外不加任何处理,对总体中所有单位除编号外不加任何处理,完全随机地抽取调查单位。完全随机地抽取调
37、查单位。3 3、特点:、特点:(1 1)是最基本的抽样方式;)是最基本的抽样方式; (2 2)简便易行;)简便易行;(3 3)适用于总体单位数不太多的均匀总体。)适用于总体单位数不太多的均匀总体。(四个公式)(四个公式)4 4、 抽样平均误差的计算抽样平均误差的计算5 5、总体指标的区间估计、总体指标的区间估计 (两个不等式)(两个不等式)例例1: 从从某县某县农民家庭中随机抽取农民家庭中随机抽取100户调查其年收入情况,农民户调查其年收入情况,农民家庭按年人均纯收入分组资料如下家庭按年人均纯收入分组资料如下,试以试以95%的概率保证程度对的概率保证程度对全县农民家庭的年人均纯收入和年人均纯收
38、入在全县农民家庭的年人均纯收入和年人均纯收入在10000元以上户元以上户数所占比重作出区间估计数所占比重作出区间估计.年人均纯收入年人均纯收入(元元) 户数户数(户户) 9000以下以下 3 9000-10000 7 10000-11000 28 11000-12000 32 12000-13000 20 13000以上以上 10 合合 计计 100 例例1: 从某县从某县农民家庭中随机抽取农民家庭中随机抽取100户调查其年收入情况,农民家庭户调查其年收入情况,农民家庭按年人均纯收入分组资料如下按年人均纯收入分组资料如下,试以试以95%的概率保证程度对全县的概率保证程度对全县农民家庭的年人均纯
39、收入和年人均纯收入在农民家庭的年人均纯收入和年人均纯收入在10000元以上户数所元以上户数所占比重作出区间估计占比重作出区间估计.年人均纯收入年人均纯收入(元元) 户数户数(户户)f x xf 9000以下以下 3 9000-10000 7 10000-11000 28 11000-12000 32 12000-13000 20 13000以上以上 10 合合 计计 100 2()xxf 例例1: 从某县从某县农民家庭中随机抽取农民家庭中随机抽取100户调查其年收入情况,农民家庭户调查其年收入情况,农民家庭按年人均纯收入分组资料如下按年人均纯收入分组资料如下,试以试以95%的概率保证程度对全县
40、的概率保证程度对全县农民家庭的年人均纯收入和年人均纯收入在农民家庭的年人均纯收入和年人均纯收入在10000元以上户数所元以上户数所占比重作出区间估计占比重作出区间估计.年人均纯收入年人均纯收入(元元) 户数户数(户户)f x xf 9000以下以下 3 8500 25500 250563009000-10000 7 9500 66500 2500470010000-11000 28 10500 294000 2217880011000-12000 32 11500 36800 38720012000-13000 20 12500 25000 24642000 13000以上以上 10 1350
41、0 135000 44521000 合合 计计 100 - 1139000 1417900002()xxf 113900011390()100 xfxf 元元22()1417900001417900100 xxff 2119.081001417900()xn 元元x 1.96119.08233.40()xt 元元xx11390-233.40 11390233.4011156.6011623.40( )95%xXxXXF t p2832201090%100(1)90%(190%)3%100pPPn 1.963%5.88%ppt ppp90%5.88%P90%5.88% 84.12% P 95.8
42、8%F(t)95%Pp 例例2:2: 电视台某栏目主持人欲知观众对该栏目是否喜欢电视台某栏目主持人欲知观众对该栏目是否喜欢,随机抽取随机抽取400名观众调查名观众调查,其中喜欢的有其中喜欢的有240人人.试在试在95.45%的概率保证下的概率保证下,估计喜欢该栏目的观众比重范估计喜欢该栏目的观众比重范围围.如果该主持人希望估计的误差不超过如果该主持人希望估计的误差不超过5%,则有多大则有多大的把握程度的把握程度?24060%400(1)60%(160%)2.45%40022.45%4.9%60%4.9%60%4.9% 55.1% P 64.9%( )95.45%5%,2.45%,5%2.042
43、.45%( )95.87%ppppppppPPnpPF ttPptF t 例例3: 某学校随机抽查某学校随机抽查10名男生,平均身高名男生,平均身高170cm,标准差标准差12cm,问有多大把握估计全校男生身问有多大把握估计全校男生身高介于高介于160.5179.5cm之间?之间?223 .7 9 4 71 01 6 0 .51 2()1 7 03 .7 9 4 71 6 0 .51 7 01 6 0 .52 .53 .7 9 4 7( )9 8 .7 6 %xxnxtc mttFt (二)类型抽样(二)类型抽样( (分类抽样分类抽样) )1 1、内容:、内容: 先对总体各单位按一定标志加以分
44、类先对总体各单位按一定标志加以分类( (组组) ),然后再从各类然后再从各类( (组组) )中按随机原则抽取样本。中按随机原则抽取样本。2 2、样本分配形式:、样本分配形式:(1 1)等等比例抽样;比例抽样;(2 2)不不等比例抽样。等比例抽样。(3 3)抽样调查成本较低。)抽样调查成本较低。3 3、特点:、特点:(1 1)先分组,后抽样;)先分组,后抽样;(2 2)样本代表性高、抽样误差较小;)样本代表性高、抽样误差较小;4 4、抽样平均误差的计算:、抽样平均误差的计算:x2 n pp(1p) n 2xn(1)nN pp(1p)n(1)nN (1 1)重复抽样:)重复抽样:(2 2)不重复抽
45、样:)不重复抽样:2ii2 nin 平平 均均 组组 内内 方方 差差iiiip (1p )nP(1P)n5、总体指标的区间估计、总体指标的区间估计 两个不等式两个不等式 某农场种小麦某农场种小麦1200012000公顷,其中平原公顷,其中平原36003600公顷,公顷,丘陵丘陵60006000公顷,山地公顷,山地24002400公顷。现用类型等比例抽公顷。现用类型等比例抽样调查样调查12001200公顷,平均单位面积产量公顷,平均单位面积产量1500015000千克,千克,高产田面积比重高产田面积比重79%79%。资料如下表。资料如下表。试以试以68.27%68.27%概率保证估计该农场小麦
46、单位面积产量的区间。概率保证估计该农场小麦单位面积产量的区间。以同样概率保证估计该农场小麦高产田面积比重的以同样概率保证估计该农场小麦高产田面积比重的区间。区间。类类 型型全场播全场播种面积种面积(公顷公顷)抽样调抽样调查面积查面积(公顷)(公顷)单位面积单位面积产量不均产量不均匀程度指匀程度指标标(千克千克)高产田比重高产田比重(%) 丘陵地区丘陵地区 6000 75080平原地区平原地区 3600 84090山山 地地 2400100060合合 计计120001200-例例 某农场种小麦某农场种小麦1200012000公顷,其中平原公顷,其中平原36003600公顷,公顷,丘陵丘陵6000
47、6000公顷,山地公顷,山地24002400公顷。现用类型等比例抽公顷。现用类型等比例抽样调查样调查12001200公顷,平均单位面积产量公顷,平均单位面积产量1500015000千克,千克,高产田面积比重高产田面积比重79%79%。资料如下表。资料如下表。试以试以68.27%68.27%概率保证估计该农场小麦单位面积产量的区间。概率保证估计该农场小麦单位面积产量的区间。以同样概率保证估计该农场小麦高产田面积比重的以同样概率保证估计该农场小麦高产田面积比重的区间。区间。类类 型型全场播全场播种面积种面积(公顷公顷)抽样调抽样调查面积查面积(公顷)(公顷)单位面积单位面积产量不均产量不均匀程度指
48、匀程度指标标(千克千克)高产田比重高产田比重(%) pi Ninii丘陵地区丘陵地区 6000 75080平原地区平原地区 3600 84090山山 地地 2400100060合合 计计120001200-例例 某农场种小麦某农场种小麦1200012000公顷,其中平原公顷,其中平原36003600公顷,公顷,丘陵丘陵60006000公顷,山地公顷,山地24002400公顷。现用类型等比例抽公顷。现用类型等比例抽样调查样调查12001200公顷,平均单位面积产量公顷,平均单位面积产量1500015000千克,千克,高产田面积比重高产田面积比重79%79%。资料如下表。资料如下表。试以试以68.
49、27%68.27%概率保证估计该农场小麦单位面积产量的区间。概率保证估计该农场小麦单位面积产量的区间。以同样概率保证估计该农场小麦高产田面积比重的以同样概率保证估计该农场小麦高产田面积比重的区间。区间。类类 型型全场播全场播种面积种面积(公顷公顷)抽样调抽样调查面积查面积(公顷)(公顷)单位面积单位面积产量不均产量不均匀程度指匀程度指标标(千克千克)高产田比重高产田比重(%) pi Ninii丘陵地区丘陵地区 6000600 75080平原地区平原地区 3600360 84090山山 地地 2400240100060合合 计计120001200-例例iin2337500000254016000
50、24000000083151600022iiiin831516000692930()n1200 千克2ixn (1)nN6929301200 (1)519.697522.8()120012000 千克xxt1 22.822.8() 千克xxxXx1500022.8X1500022.814977.2X15022.8F(t)68.27% 类别类别高产田高产田比重比重(%)非高产田非高产田比重比重(%)麦田不均匀麦田不均匀程度指标程度指标(%)抽样调查抽样调查面积面积(公顷公顷)pi(1-pi)nipi1-pipi(1-pi)ni丘陵丘陵802016 60096.0平原平原9010 9 36032.