《统计学基础PPT课件.ppt》由会员分享,可在线阅读,更多相关《统计学基础PPT课件.ppt(110页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据分析数据分析(方法与案例方法与案例)作者作者 贾俊平贾俊平统计学基础统计学基础2010年第第 4 章章 抽样与参数估计抽样与参数估计4.1 抽样与抽样分布抽样与抽样分布4.2 参数估计的基本方法参数估计的基本方法 4.3 总体均值总体均值的区间估计的区间估计4.4 总体比例的总体比例的的区间估计的区间估计4.5 样本容量的确定样本容量的确定2010年4-3统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目学习目标学习目标l抽样方法与抽样分布抽样方法与抽样分布l估计量与估计值的概念估计量与估计值的概念l点
2、估计与区间估计的区别点估计与区间估计的区别l总体均值的区间估计方法总体均值的区间估计方法l总体比例的区间估计方法总体比例的区间估计方法l样本容量的确定方法样本容量的确定方法4-4统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目统计应用统计应用一次失败的民意调查一次失败的民意调查在在在在19361936年年年年的的的的美美美美国国国国总总总总统统统统选选选选举举举举前前前前,一一一一份份份份名名名名为为为为Literary Literary DigestDigest 杂杂杂杂志志志志进进进进行行行行了了了了
3、一一一一次次次次民民民民意意意意调调调调查查查查。调调调调查查查查的的的的焦焦焦焦点点点点是是是是谁谁谁谁将将将将成成成成为为为为下下下下一一一一届届届届总总总总统统统统是是是是挑挑挑挑战战战战者者者者,堪堪堪堪萨萨萨萨斯斯斯斯州州州州州州州州长长长长Alf Alf LandonLandon,还还还还是是是是现现现现任任任任总总总总统统统统 Franklin Delano RooseveltFranklin Delano Roosevelt为为为为了了了了解解解解选选选选民民民民意意意意向向向向,民民民民意意意意调调调调查查查查专专专专家家家家们们们们根根根根据据据据电电电电话话话话簿簿簿簿和
4、和和和车车车车辆辆辆辆登登登登记记记记簿簿簿簿上上上上的的的的名名名名单单单单给给给给一一一一大大大大批批批批人人人人发发发发了了了了简简简简单单单单的的的的调调调调查查查查表表表表(电电电电话话话话和和和和汽汽汽汽车车车车在在在在19361936年年年年并并并并不不不不像像像像现现现现在在在在那那那那样样样样普普普普及及及及,但但但但是是是是这这这这些些些些名名名名单单单单比比比比较较较较容容容容易易易易得得得得到到到到)。尽尽尽尽管管管管发发发发出出出出的的的的调调调调查查查查表表表表大大大大约约约约有有有有一一一一千千千千万万万万张张张张,但但但但收收收收回回回回的的的的比比比比例例例例
5、并并并并不不不不高高高高。在在在在收收收收回回回回的的的的调调调调查查查查表表表表中中中中,Alf Alf LandonLandon非非非非常常常常受受受受欢欢欢欢迎迎迎迎。于于于于是是是是该该该该杂杂杂杂志志志志预预预预测测测测 Landon Landon 将将将将赢赢赢赢得得得得选选选选举举举举。但但但但事事事事实实实实上上上上是是是是Franklin Franklin RooseveltRoosevelt赢得了这次选举赢得了这次选举赢得了这次选举赢得了这次选举调调调调查查查查失失失失败败败败的的的的主主主主要要要要原原原原因因因因是是是是抽抽抽抽样样样样框框框框出出出出现现现现了了了了问
6、问问问题题题题。在在在在经经经经济济济济大大大大萧萧萧萧条条条条时时时时期期期期由由由由于于于于电电电电话话话话和和和和汽汽汽汽车车车车并并并并不不不不普普普普及及及及,只只只只是是是是富富富富裕裕裕裕阶阶阶阶层层层层才才才才会会会会拥拥拥拥有有有有,调调调调查查查查有电话和汽车的人们,并不能够反映全体选民的观点有电话和汽车的人们,并不能够反映全体选民的观点有电话和汽车的人们,并不能够反映全体选民的观点有电话和汽车的人们,并不能够反映全体选民的观点4-5统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目参数
7、估计在统计方法中的地位参数估计在统计方法中的地位4.1 抽样与抽样分布抽样与抽样分布 4.1.1 概率抽样方法概率抽样方法 4.1.2 抽样分布抽样分布第第 4 章章 抽样与参数估计抽样与参数估计2010年4.1.1 概率抽样方法概率抽样方法4.1 抽样与抽样分布抽样与抽样分布2010年4-8统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目有关抽样的几个基本概念有关抽样的几个基本概念1、全及总体、全及总体 全及总体又称总体或母体,是指研究对全及总体又称总体或母体,是指研究对象的全体,它是由许多个性质相同的
8、调查单象的全体,它是由许多个性质相同的调查单位组成的,总体单位数通常用位组成的,总体单位数通常用N N表示表示。例如:全部职工、全部学生、全部产品例如:全部职工、全部学生、全部产品例如:全部职工、全部学生、全部产品例如:全部职工、全部学生、全部产品4-9统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目有关抽样的几个基本概念有关抽样的几个基本概念2、抽样框抽样框 目标总体规定了理论上的抽样范围,但是进行抽目标总体规定了理论上的抽样范围,但是进行抽目标总体规定了理论上的抽样范围,但是进行抽目标总体规定了理论上
9、的抽样范围,但是进行抽样的总体单位与目标总体有时是不一致的,因而,样的总体单位与目标总体有时是不一致的,因而,样的总体单位与目标总体有时是不一致的,因而,样的总体单位与目标总体有时是不一致的,因而,在抽样之前,还必须明确实际进行抽样的总体范在抽样之前,还必须明确实际进行抽样的总体范在抽样之前,还必须明确实际进行抽样的总体范在抽样之前,还必须明确实际进行抽样的总体范围和抽样单位。围和抽样单位。围和抽样单位。围和抽样单位。抽样框抽样框是指用以代表总体,并从中抽选样本的一个是指用以代表总体,并从中抽选样本的一个是指用以代表总体,并从中抽选样本的一个是指用以代表总体,并从中抽选样本的一个框架。框架。框
10、架。框架。目标总体与抽样框有时是一致的;多数情目标总体与抽样框有时是一致的;多数情目标总体与抽样框有时是一致的;多数情目标总体与抽样框有时是一致的;多数情况下,目标总体的范围要率大于抽样框。况下,目标总体的范围要率大于抽样框。况下,目标总体的范围要率大于抽样框。况下,目标总体的范围要率大于抽样框。4-10统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目2、抽样框抽样框抽样框的主要形式有三种:抽样框的主要形式有三种:抽样框的主要形式有三种:抽样框的主要形式有三种:名单抽样框:名单抽样框:名单抽样框:名单抽样
11、框:指可供抽取的所有抽样单位的名录指可供抽取的所有抽样单位的名录指可供抽取的所有抽样单位的名录指可供抽取的所有抽样单位的名录一览表一览表一览表一览表例如:某地区企业名录,某校在籍学生花名册等。例如:某地区企业名录,某校在籍学生花名册等。例如:某地区企业名录,某校在籍学生花名册等。例如:某地区企业名录,某校在籍学生花名册等。区域抽样框:区域抽样框:区域抽样框:区域抽样框:即按地理位置将实际进行抽样的总即按地理位置将实际进行抽样的总即按地理位置将实际进行抽样的总即按地理位置将实际进行抽样的总体范围划分为若干小区域,以每个小区域为抽样体范围划分为若干小区域,以每个小区域为抽样体范围划分为若干小区域,
12、以每个小区域为抽样体范围划分为若干小区域,以每个小区域为抽样单位。单位。单位。单位。例如:调查不同地区的人均收入水平等。例如:调查不同地区的人均收入水平等。例如:调查不同地区的人均收入水平等。例如:调查不同地区的人均收入水平等。有关抽样的几个基本概念有关抽样的几个基本概念4-11统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目时间表抽样框:时间表抽样框:时间表抽样框:时间表抽样框:把总体的时间过程划分为若干个把总体的时间过程划分为若干个把总体的时间过程划分为若干个把总体的时间过程划分为若干个小的时间单位做
13、为抽样单位。小的时间单位做为抽样单位。小的时间单位做为抽样单位。小的时间单位做为抽样单位。例如:对流水线上例如:对流水线上例如:对流水线上例如:对流水线上2424小时内生产的产品进行质量抽小时内生产的产品进行质量抽小时内生产的产品进行质量抽小时内生产的产品进行质量抽 查时,以查时,以查时,以查时,以1010分钟为一个抽样单位。分钟为一个抽样单位。分钟为一个抽样单位。分钟为一个抽样单位。有关抽样的几个基本概念有关抽样的几个基本概念 对于抽样调查来说,样本的代表性如何,抽样调对于抽样调查来说,样本的代表性如何,抽样调对于抽样调查来说,样本的代表性如何,抽样调对于抽样调查来说,样本的代表性如何,抽样
14、调查最终推算的估计值真实性如何,首先取决于抽样框查最终推算的估计值真实性如何,首先取决于抽样框查最终推算的估计值真实性如何,首先取决于抽样框查最终推算的估计值真实性如何,首先取决于抽样框的质量。抽样框在抽样调查中处于基础地位,是抽样的质量。抽样框在抽样调查中处于基础地位,是抽样的质量。抽样框在抽样调查中处于基础地位,是抽样的质量。抽样框在抽样调查中处于基础地位,是抽样调查必不可少的部分,其对于推断总体具有相当大的调查必不可少的部分,其对于推断总体具有相当大的调查必不可少的部分,其对于推断总体具有相当大的调查必不可少的部分,其对于推断总体具有相当大的影响。影响。影响。影响。区域抽样框区域抽样框在
15、商场的大门口在商场的大门口在微波炉柜台前在微波炉柜台前在市区街道旁边在市区街道旁边在某个住宅小区在某个住宅小区中山路中山路桥西区桥西区桥东区桥东区华北地区华北地区东北地区东北地区居民一组居民一组居民二组居民二组某外国公司在大连进行某外国公司在大连进行微波炉市场调查:微波炉市场调查:时间表抽样框时间表抽样框连续出产的产品总体可以连续出产的产品总体可以编制抽样框:编制抽样框:均匀的出产均匀的出产时间、可以预见到的产品时间、可以预见到的产品总量。总量。连续到加油站加油的汽车连续到加油站加油的汽车总体无法编制抽样框:总体无法编制抽样框:时时间不定、总量也无法确定。间不定、总量也无法确定。4-14统计学
16、统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目3、样本总体、样本总体 样本总体,又叫子样,简称样本。它是样本总体,又叫子样,简称样本。它是从全及总体中随机抽取出来,用来代表全及从全及总体中随机抽取出来,用来代表全及总体的那部分单位构成的总体。样本总体的总体的那部分单位构成的总体。样本总体的单位数用小写字母单位数用小写字母n n表示,称为表示,称为样本容量样本容量。从某个城市职工家庭中随机抽取从某个城市职工家庭中随机抽取从某个城市职工家庭中随机抽取从某个城市职工家庭中随机抽取10001000户进户进户进户进行调
17、查,则这行调查,则这行调查,则这行调查,则这10001000户组成的小总体即为样户组成的小总体即为样户组成的小总体即为样户组成的小总体即为样本,样本容量本,样本容量本,样本容量本,样本容量 n=1000 n=1000。例如:例如:例如:例如:有关抽样的几个基本概念有关抽样的几个基本概念4-15统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目对于给定的研究对象,全及总体是唯一确定对于给定的研究对象,全及总体是唯一确定的,而样本总体不是唯一的,它是随机的。的,而样本总体不是唯一的,它是随机的。4、抽样比、抽样
18、比 抽样比是指在抽选样本时,所抽取的样抽样比是指在抽选样本时,所抽取的样本单位数本单位数n n与总体单位数与总体单位数N N之比。一般地讲,之比。一般地讲,n30n30为大样本,为大样本,n n3030为小样本。为小样本。研究社会研究社会经济现象时,通常采用大样本进行抽样调查。经济现象时,通常采用大样本进行抽样调查。有关抽样的几个基本概念有关抽样的几个基本概念4-16统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目概率抽样概率抽样(probability sampling)1.也称随机抽样也称随机抽样2.
19、特点特点n按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本l l抽抽抽抽取取取取样样样样本本本本时时时时使使使使每每每每个个个个单单单单位位位位都都都都有有有有一一一一定定定定的的的的机机机机会会会会被被被被抽中抽中抽中抽中n每每个个单单位位被被抽抽中中的的概概率率是是已已知知的的,或或是是可以计算出来的可以计算出来的 n当当用用样样本本对对总总体体目目标标量量进进行行估估计计时时,要要考虑到每个样本单位被抽中的概率考虑到每个样本单位被抽中的概率4-17统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶
20、贫”项目简单随机抽样简单随机抽样(simple random sampling)1.从从从从总总总总体体体体N N个个个个单单单单位位位位中中中中随随随随机机机机地地地地抽抽抽抽取取取取n n个个个个单单单单位位位位作作作作为为为为样样样样本本本本,每个单位进入样本的概率是相等的每个单位进入样本的概率是相等的每个单位进入样本的概率是相等的每个单位进入样本的概率是相等的2.最基本的抽样方法,是其它抽样方法的基础最基本的抽样方法,是其它抽样方法的基础最基本的抽样方法,是其它抽样方法的基础最基本的抽样方法,是其它抽样方法的基础3.特点特点特点特点n n简简简简单单单单、直直直直观观观观,在在在在抽抽
21、抽抽样样样样框框框框完完完完整整整整时时时时,可可可可直直直直接接接接从从从从中中中中抽抽抽抽取取取取样样样样本本本本n n用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便4.局限性局限性局限性局限性n n当当当当N N很大时,不易构造抽样框很大时,不易构造抽样框很大时,不易构造抽样框很大时,不易构造抽样框n n抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难n n没有利用其它辅助信息以提高估计的
22、效率没有利用其它辅助信息以提高估计的效率没有利用其它辅助信息以提高估计的效率没有利用其它辅助信息以提高估计的效率4-18统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目1、重复抽样、重复抽样 重复抽样也叫重置抽样,是指每次抽取一个元重复抽样也叫重置抽样,是指每次抽取一个元重复抽样也叫重置抽样,是指每次抽取一个元重复抽样也叫重置抽样,是指每次抽取一个元素后又放回,重新参加下一次的抽选,直到抽取素后又放回,重新参加下一次的抽选,直到抽取素后又放回,重新参加下一次的抽选,直到抽取素后又放回,重新参加下一次的抽选
23、,直到抽取n n n n个个个个元素为止。全及总体单位数始终保持不变,每个总元素为止。全及总体单位数始终保持不变,每个总元素为止。全及总体单位数始终保持不变,每个总元素为止。全及总体单位数始终保持不变,每个总体单位都有被重复抽中的可能。体单位都有被重复抽中的可能。体单位都有被重复抽中的可能。体单位都有被重复抽中的可能。n重复抽样通常要考虑单位排列顺序,如电话号重复抽样通常要考虑单位排列顺序,如电话号重复抽样通常要考虑单位排列顺序,如电话号重复抽样通常要考虑单位排列顺序,如电话号码中的码中的码中的码中的“8651”8651”8651”8651”和和和和“1568”1568”1568”1568”不
24、同。不同。不同。不同。其样本可能数目为其样本可能数目为其样本可能数目为其样本可能数目为抽样方法和样本可能数目抽样方法和样本可能数目4-19统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目2、不重复抽样、不重复抽样 不重复抽样也叫不重置抽样,是指每次从总体不重复抽样也叫不重置抽样,是指每次从总体不重复抽样也叫不重置抽样,是指每次从总体不重复抽样也叫不重置抽样,是指每次从总体中抽取一个元素后不再放回,从剩余的元素中抽取中抽取一个元素后不再放回,从剩余的元素中抽取中抽取一个元素后不再放回,从剩余的元素中抽取中抽
25、取一个元素后不再放回,从剩余的元素中抽取下一个元素,直到抽取下一个元素,直到抽取下一个元素,直到抽取下一个元素,直到抽取n n n n个元素为止。总体单位数在个元素为止。总体单位数在个元素为止。总体单位数在个元素为止。总体单位数在不断减少,每个总体单位不可能被重复抽中。不断减少,每个总体单位不可能被重复抽中。不断减少,每个总体单位不可能被重复抽中。不断减少,每个总体单位不可能被重复抽中。n不重复抽样通常不考虑样本单位排列顺序,如不重复抽样通常不考虑样本单位排列顺序,如不重复抽样通常不考虑样本单位排列顺序,如不重复抽样通常不考虑样本单位排列顺序,如篮球队的篮球队的篮球队的篮球队的5 5 5 5个
26、队员按其号码个队员按其号码个队员按其号码个队员按其号码“1,2,3,4,5”1,2,3,4,5”1,2,3,4,5”1,2,3,4,5”排队和排队和排队和排队和“5,4,3,2,1”5,4,3,2,1”5,4,3,2,1”5,4,3,2,1”排队是同一个队。排队是同一个队。排队是同一个队。排队是同一个队。其样本可能数目为其样本可能数目为其样本可能数目为其样本可能数目为抽样方法和样本可能数目抽样方法和样本可能数目4-20统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目分层抽样分层抽样(stratified
27、sampling)1.将将抽抽样样单单位位按按某某种种特特征征或或某某种种规规则则划划分分为为不不同同的的层层,然然后后从从不不同同的的层层中中独独立立、随随机机地抽取样本地抽取样本2.例例例例如如如如:在在在在企企企企业业业业职职职职工工工工收收收收入入入入抽抽抽抽样样样样调调调调查查查查中中中中,可可可可按按按按经经经经济济济济类类类类型型型型将将将将职职职职工工工工分分分分为为为为全全全全民民民民企企企企业业业业职职职职工工工工、集集集集体体体体企企企企业业业业职职职职工工工工、中中中中外外外外合合合合资资资资企企企企业业业业职职职职工工工工等等等等若若若若干干干干类类类类,然然然然后后
28、后后在在在在各各各各类类类类型型型型企企企企业职工中分别抽取一定数目的职工构成样本。业职工中分别抽取一定数目的职工构成样本。业职工中分别抽取一定数目的职工构成样本。业职工中分别抽取一定数目的职工构成样本。4-21统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目2.优点优点n保保保保证证证证样样样样本本本本的的的的结结结结构构构构与与与与总总总总体体体体的的的的结结结结构构构构比比比比较较较较相相相相近近近近,从从从从而提高估计的精度而提高估计的精度而提高估计的精度而提高估计的精度n可可可可以以以以按按按按
29、自自自自然然然然区区区区域域域域或或或或行行行行政政政政区区区区域域域域进进进进行行行行分分分分层层层层,组组组组织织织织实施调查方便实施调查方便实施调查方便实施调查方便n既既既既可可可可以以以以对对对对总总总总体体体体参参参参数数数数进进进进行行行行估估估估计计计计,也也也也可可可可以以以以对对对对各各各各层层层层的目标量进行估计的目标量进行估计的目标量进行估计的目标量进行估计n适适适适用用用用于于于于总总总总体体体体情情情情况况况况复复复复杂杂杂杂、各各各各单单单单位位位位之之之之间间间间差差差差异异异异较较较较大大大大、单位较多的情况。单位较多的情况。单位较多的情况。单位较多的情况。分层
30、抽样分层抽样(stratified sampling)等比例分层抽样等比例分层抽样 不考虑各组单位变异程度,从各组当不考虑各组单位变异程度,从各组当中按同一比例抽取样本单位中按同一比例抽取样本单位不等比例分层抽样不等比例分层抽样 按各组单位变异程度大小来确定抽样按各组单位变异程度大小来确定抽样单位数的多少,变异度大的类型组多抽单位数的多少,变异度大的类型组多抽一些,变异度小的少抽一些,不规定统一些,变异度小的少抽一些,不规定统一的抽样比一的抽样比分层抽样的分类分层抽样的分类实际工作中,由于事先很难了解各组单位变异实际工作中,由于事先很难了解各组单位变异实际工作中,由于事先很难了解各组单位变异实
31、际工作中,由于事先很难了解各组单位变异程度,因此多采用等比例分层抽样方法程度,因此多采用等比例分层抽样方法程度,因此多采用等比例分层抽样方法程度,因此多采用等比例分层抽样方法 在分层抽样方式下,因为是每组都抽取在分层抽样方式下,因为是每组都抽取样本单位,所以对于各组来说,可以看成全样本单位,所以对于各组来说,可以看成全面调查,没有抽样误差。因此分层抽样方式面调查,没有抽样误差。因此分层抽样方式下,组间方差不影响抽样误差,只有各组组下,组间方差不影响抽样误差,只有各组组内方差影响抽样误差。内方差影响抽样误差。对对对对于于于于给给给给定的定的定的定的总总总总体,方差(即体,方差(即体,方差(即体,
32、方差(即总总总总方差)是一定的,方差)是一定的,方差)是一定的,方差)是一定的,划分划分划分划分层时应层时应层时应层时应尽量尽量尽量尽量增大增大增大增大层间层间层间层间差异,差异,差异,差异,缩缩缩缩小小小小层层层层内差异内差异内差异内差异。这这这这是分是分是分是分层层层层抽抽抽抽样样样样法成功的关法成功的关法成功的关法成功的关键键键键。4-24统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目系统抽样系统抽样(systematic sampling)1.将将将将总总总总体体体体中中中中的的的的所所所所有有
33、有有单单单单位位位位(抽抽抽抽样样样样单单单单位位位位)按按按按一一一一定定定定顺顺顺顺序序序序排排排排列列列列,在在在在规规规规定定定定的的的的范范范范围围围围内内内内随随随随机机机机地地地地抽抽抽抽取取取取一一一一个个个个单单单单位位位位作作作作为为为为初初初初始始始始单单单单位位位位,然然然然后后后后按按按按事事事事先先先先规规规规定定定定好好好好的的的的规规规规则则则则确确确确定定定定其其其其它它它它样本单位,也叫样本单位,也叫样本单位,也叫样本单位,也叫等距抽样或机械抽样等距抽样或机械抽样等距抽样或机械抽样等距抽样或机械抽样。n先先先先从从从从数数数数字字字字1 1到到到到k k之之
34、之之间间间间随随随随机机机机抽抽抽抽取取取取一一一一个个个个数数数数字字字字r r作作作作为为为为初始单位,以后依次取初始单位,以后依次取初始单位,以后依次取初始单位,以后依次取r+kr+k,r+2kr+2k等单位等单位等单位等单位2.优优优优点点点点:操操操操作作作作简简简简便便便便,样样样样本本本本分分分分布布布布均均均均匀匀匀匀,可可可可提提提提高高高高估估估估计计计计的精度的精度的精度的精度3.缺点:对估计量方差的估计比较困难缺点:对估计量方差的估计比较困难缺点:对估计量方差的估计比较困难缺点:对估计量方差的估计比较困难4-25统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始
35、对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目系统抽样按照排队时所依据的标志不同,可系统抽样按照排队时所依据的标志不同,可分为按分为按无关标志无关标志排队和按排队和按有关标志有关标志排队。排队。系统抽样系统抽样(systematic sampling)n按无关标志排队,是指用来排队的标志与调查按无关标志排队,是指用来排队的标志与调查按无关标志排队,是指用来排队的标志与调查按无关标志排队,是指用来排队的标志与调查研究的标志无关研究的标志无关研究的标志无关研究的标志无关例如:研究工人的平均收入水平时,将工人按照例如:研究工人的平均收入水平时,将工人按照例如:研究工
36、人的平均收入水平时,将工人按照例如:研究工人的平均收入水平时,将工人按照姓氏笔画顺序排列;姓氏笔画顺序排列;姓氏笔画顺序排列;姓氏笔画顺序排列;在产品连续生产过程中进行质量检查,每在产品连续生产过程中进行质量检查,每在产品连续生产过程中进行质量检查,每在产品连续生产过程中进行质量检查,每隔一定时间抽取一次样品等隔一定时间抽取一次样品等隔一定时间抽取一次样品等隔一定时间抽取一次样品等4-26统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目n按有关标志排队,是指用来排队的标志与调查研按有关标志排队,是指用来排
37、队的标志与调查研按有关标志排队,是指用来排队的标志与调查研按有关标志排队,是指用来排队的标志与调查研究的数量有直接关系究的数量有直接关系究的数量有直接关系究的数量有直接关系例如:研究职工工资收入时按职工的职别排队;例如:研究职工工资收入时按职工的职别排队;例如:研究职工工资收入时按职工的职别排队;例如:研究职工工资收入时按职工的职别排队;农产品调查以往年的平均亩产作为排队标志农产品调查以往年的平均亩产作为排队标志农产品调查以往年的平均亩产作为排队标志农产品调查以往年的平均亩产作为排队标志系统抽样系统抽样(systematic sampling)系统抽样一定是不重复抽样。按系统抽样一定是不重复抽
38、样。按系统抽样一定是不重复抽样。按系统抽样一定是不重复抽样。按无关标志无关标志无关标志无关标志排队,其排队,其排队,其排队,其抽样效果相当于简单随机抽样;按抽样效果相当于简单随机抽样;按抽样效果相当于简单随机抽样;按抽样效果相当于简单随机抽样;按有关标志有关标志有关标志有关标志排队,排队,排队,排队,其抽样效果相当于分层抽样,其样本的代表性优于其抽样效果相当于分层抽样,其样本的代表性优于其抽样效果相当于分层抽样,其样本的代表性优于其抽样效果相当于分层抽样,其样本的代表性优于无关标志排队的系统抽样。无关标志排队的系统抽样。无关标志排队的系统抽样。无关标志排队的系统抽样。4-27统计学统计学基础基
39、础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目系统抽样系统抽样(systematic sampling)系统抽样的实施步骤系统抽样的实施步骤按照某种顺序给总体中个体排列编号,然后按照某种顺序给总体中个体排列编号,然后从某个随机位置开始每隔一定号数抽取一个从某个随机位置开始每隔一定号数抽取一个个体,直至抽够。个体,直至抽够。抽样间隔抽样间隔抽样间隔抽样间隔=总体单位数总体单位数总体单位数总体单位数/样本单位数样本单位数样本单位数样本单位数 例如:要从例如:要从例如:要从例如:要从500500件产品中抽取件产品中抽取件产品中
40、抽取件产品中抽取1010件,则间隔为件,则间隔为件,则间隔为件,则间隔为5050 4-28统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目系统抽样系统抽样(systematic sampling)注意:注意:系统抽样的第一个样本单位位置确定系统抽样的第一个样本单位位置确定以后,其余样本单位的位置也就随之确定以后,其余样本单位的位置也就随之确定了。因此,要避免由抽样间隔和现象本身了。因此,要避免由抽样间隔和现象本身的周期性节奏相重合而引起的系统性影响。的周期性节奏相重合而引起的系统性影响。例如,农产品调查时
41、,农作物的抽样间隔不宜和例如,农产品调查时,农作物的抽样间隔不宜和例如,农产品调查时,农作物的抽样间隔不宜和例如,农产品调查时,农作物的抽样间隔不宜和垅的长度相等;垅的长度相等;垅的长度相等;垅的长度相等;工业产品质量检查时,产品的抽样间隔不工业产品质量检查时,产品的抽样间隔不工业产品质量检查时,产品的抽样间隔不工业产品质量检查时,产品的抽样间隔不要和上下班的时间相一致,以防止发生系统性误要和上下班的时间相一致,以防止发生系统性误要和上下班的时间相一致,以防止发生系统性误要和上下班的时间相一致,以防止发生系统性误差。差。差。差。4-29统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始
42、对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目整群抽样整群抽样(cluster sampling)1.将将总总体体中中若若干干个个单单位位合合并并为为组组(群群),抽抽样样时时直直接接抽抽取取群群,然然后后对对中中选选群群中中的的所所有有单单位全部实施调查位全部实施调查2.特点特点n抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量n调调调调查查查查的的的的地地地地点点点点相相相相对对对对集集集集中中中中,节节节节省省省省调调调调查查查查费费费费用用用用,方方方方便便便便调查
43、的实施调查的实施调查的实施调查的实施n缺点是估计的精度较差缺点是估计的精度较差缺点是估计的精度较差缺点是估计的精度较差n在在在在群群群群间间间间差差差差异异异异性性性性不不不不大大大大或或或或者者者者不不不不适适适适宜宜宜宜单单单单个个个个地地地地抽抽抽抽选选选选调调调调查样本的情况下,可采用这种方式。查样本的情况下,可采用这种方式。查样本的情况下,可采用这种方式。查样本的情况下,可采用这种方式。例如:对农民的人均收入进行调查,可以先将总体例如:对农民的人均收入进行调查,可以先将总体例如:对农民的人均收入进行调查,可以先将总体例如:对农民的人均收入进行调查,可以先将总体分群,如农村的乡、村、组
44、等,然后进行整群抽分群,如农村的乡、村、组等,然后进行整群抽分群,如农村的乡、村、组等,然后进行整群抽分群,如农村的乡、村、组等,然后进行整群抽样;样;样;样;对某工厂生产线生产的产品进行质量调查,对某工厂生产线生产的产品进行质量调查,对某工厂生产线生产的产品进行质量调查,对某工厂生产线生产的产品进行质量调查,在规定时间内,每隔在规定时间内,每隔在规定时间内,每隔在规定时间内,每隔2424小时抽取小时抽取小时抽取小时抽取1 1小时的全部产品小时的全部产品小时的全部产品小时的全部产品加以检查。加以检查。加以检查。加以检查。整群抽样是用整群抽样是用整群抽样是用整群抽样是用抽中群的统计量来估计总体参
45、数抽中群的统计量来估计总体参数抽中群的统计量来估计总体参数抽中群的统计量来估计总体参数,如果,如果,如果,如果所有各群的结构都相同或相近,则被抽中的群就能较所有各群的结构都相同或相近,则被抽中的群就能较所有各群的结构都相同或相近,则被抽中的群就能较所有各群的结构都相同或相近,则被抽中的群就能较好地代表总体的所有群,抽样误差就会很小。所以整好地代表总体的所有群,抽样误差就会很小。所以整好地代表总体的所有群,抽样误差就会很小。所以整好地代表总体的所有群,抽样误差就会很小。所以整群抽样的误差主要取决于群抽样的误差主要取决于群抽样的误差主要取决于群抽样的误差主要取决于群间方差群间方差群间方差群间方差的
46、大小,而与的大小,而与的大小,而与的大小,而与群内群内群内群内方差方差方差方差无关。这一特点刚好与分层抽样相反。无关。这一特点刚好与分层抽样相反。无关。这一特点刚好与分层抽样相反。无关。这一特点刚好与分层抽样相反。4.1.2 抽样分布抽样分布4.1 抽样与抽样分布抽样与抽样分布2010年4-32统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目 抽样的数理基础抽样的数理基础抽样调查抽样调查数理基础数理基础抽样分布抽样分布大数定律大数定律正态分布正态分布中心极限定理中心极限定理4-33统计学统计学基础基础认识
47、到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目抽样分布的形成过程抽样分布的形成过程总体总体总体总体计算样本统计计算样本统计计算样本统计计算样本统计量量量量如:样本均值如:样本均值如:样本均值如:样本均值 、比例、方差、比例、方差、比例、方差、比例、方差样样样样本本本本样本统计量的概率分布样本统计量的概率分布样本统计量的概率分布样本统计量的概率分布4-34统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目1.在重复选取容量为在重复选取容量为在
48、重复选取容量为在重复选取容量为n n的样本时,由每一个样本算的样本时,由每一个样本算的样本时,由每一个样本算的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布出的该统计量数值的相对频数分布或概率分布出的该统计量数值的相对频数分布或概率分布出的该统计量数值的相对频数分布或概率分布 2.是一种理论分布是一种理论分布是一种理论分布是一种理论分布3.样本统计量是样本统计量是样本统计量是样本统计量是随机变量随机变量随机变量随机变量n n样本均值样本均值样本均值样本均值,样本比例,样本方差等样本比例,样本方差等样本比例,样本方差等样本比例,样本方差等4.结果来自结果来自结果来自结果来自容量相
49、同容量相同容量相同容量相同的的的的所有所有所有所有可能样本可能样本可能样本可能样本5.样本统计量为我们提供了长远稳定的信息,是样本统计量为我们提供了长远稳定的信息,是样本统计量为我们提供了长远稳定的信息,是样本统计量为我们提供了长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的进行推断的理论基础,也是抽样推断科学性的进行推断的理论基础,也是抽样推断科学性的进行推断的理论基础,也是抽样推断科学性的重要依据重要依据重要依据重要依据 抽样分布抽样分布(sampling distribution)4-35统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国
50、家对扶贫工作高度重视,已经展开了“精准扶贫”项目1.容量相同的所有可能样本的样本均值的概容量相同的所有可能样本的样本均值的概率分布率分布2.一种理论概率分布一种理论概率分布3.进行推断总体总体均值进行推断总体总体均值 的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布4-36统计学统计学基础基础认识到了贫困户贫困的根本原因,才能开始对症下药,然后药到病除。近年来国家对扶贫工作高度重视,已经展开了“精准扶贫”项目样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设设设一一一一个个个个总总总总体体体体,含含含含有有有有4 4个个个个元元元元素素素素(个个个个体体体体),即