统计学第5章抽样分布幻灯片.ppt

上传人:石*** 文档编号:87617168 上传时间:2023-04-16 格式:PPT 页数:90 大小:5.08MB
返回 下载 相关 举报
统计学第5章抽样分布幻灯片.ppt_第1页
第1页 / 共90页
统计学第5章抽样分布幻灯片.ppt_第2页
第2页 / 共90页
点击查看更多>>
资源描述

《统计学第5章抽样分布幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学第5章抽样分布幻灯片.ppt(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计学第统计学第5 5章抽样分布章抽样分布第1页,共90页,编辑于2022年,星期二学习目标学习目标1.了解常见的抽样方法了解常见的抽样方法2.区分总体分布、样本分布、抽样分布区分总体分布、样本分布、抽样分布3.理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系4.掌握单总体参数推断时样本统计量的分布掌握单总体参数推断时样本统计量的分布5.掌握双总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布第2页,共90页,编辑于2022年,星期二5.1 常见的抽样方法常见的抽样方法第3页,共90页,编辑于2022年,星期二 指样本单位的抽取不受主观因指样本单位的抽取不受主观因素及其

2、他系统性因素的影响,素及其他系统性因素的影响,每个总体单位都有均等的被抽每个总体单位都有均等的被抽中机会中机会一、抽样推断一、抽样推断按照按照随机原则随机原则 从全部研究对象中抽取一部从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。断,从而认识总体的一种统计方法。第4页,共90页,编辑于2022年,星期二并非所有的抽样估计都按随机原并非所有的抽样估计都按随机原则抽取样本,也有则抽取样本,也有非随机抽样非随机抽样总体总体随机样本随机样本非随机样本

3、非随机样本与总体分布特与总体分布特征相同征相同与总体分布特与总体分布特征不同征不同第5页,共90页,编辑于2022年,星期二q按按随机原则随机原则抽取样本单位抽取样本单位q以以样本样本的数量特征推断的数量特征推断总体总体的数量特征的数量特征q抽样推断产生抽样推断产生抽样误差抽样误差,但抽样误差可以事,但抽样误差可以事先先计算并控制计算并控制二、抽样推断的特点二、抽样推断的特点 与全面调查相比,抽样调查既节省了人力、物力、财与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。力和时间,又达到了认识总体数量特征的目的。我国在我国在19941994年确立了以周期性

4、普查为基础,以经常性抽样调整为年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以主体,同时辅之以重点调查、科学核算等综合运用的统计重点调查、科学核算等综合运用的统计调查方法体系。调查方法体系。第6页,共90页,编辑于2022年,星期二三、抽样推断的理论基础三、抽样推断的理论基础大数定律大数定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性质。的性质。大数定律论证了如果独立随机变量总体存在大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本有限的平均数和方差,则对于充分大的样本可以近乎可以近乎100%100%的

5、概率,期望样本平均数与总的概率,期望样本平均数与总体平均数的绝对离差体平均数的绝对离差为任意小。为任意小。如果变量总体存在有限的平均数和方差,如果变量总体存在有限的平均数和方差,那么不论这那么不论这个总体的分布如何,随着样本个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近容量的增加,样本平均数的分布,便趋近于于正态分布正态分布。第7页,共90页,编辑于2022年,星期二q不可能不可能进行全面调查时进行全面调查时q不必要不必要进行全面调查时进行全面调查时q来不及来不及进行全面调查时进行全面调查时q对全面调查资料进行对全面调查资料进行补充修正补充修正时时抽样推断的应用抽样推断的应用第

6、8页,共90页,编辑于2022年,星期二1、根据取样方式、根据取样方式重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容量为个单位中随机抽取一个样本容量为n n的的样本,每次从总体中抽取一个,样本,每次从总体中抽取一个,并把结果登记并把结果登记下来,又放回总体中重新参加下一次的抽选。下来,又放回总体中重新参加下一次的抽选。又称又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不再将其每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称放回参加下一次的抽选。又称不放回抽不放回抽样样.总体单位数总体单位数N N不变,同一单位可能多次不变,同一单位可能多次被抽中

7、。被抽中。总体单位数减少总体单位数减少n n,同一单位只可能,同一单位只可能被抽中一次。被抽中一次。四、抽样方法分类四、抽样方法分类第9页,共90页,编辑于2022年,星期二2、根据对样本的要求不同、根据对样本的要求不同考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。考虑各单位的中选顺序。ABCCBA不考虑各单位的中选顺序。不考虑各单位的中选顺序。ABCCBA考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样综合起来共有综合起来共有四种抽样方法四种抽样方法第1

8、0页,共90页,编辑于2022年,星期二样本的可能数目样本的可能数目考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样第11页,共90页,编辑于2022年,星期二简单随机抽样简单随机抽样分层抽样分层抽样系统抽样系统抽样整群抽样整群抽样3、根据抽取的原则、根据抽取的原则(抽样调查的组织形式抽样调查的组织形式)第12页,共90页,编辑于2022年,星期二(1)它要求被抽取样本的总体的个体数)它要求被抽取样本的总体的个体数有限有限;(2)它是从总体中)它是从总体中逐个逐个进行抽取;进行抽取;

9、(3)它是一种)它是一种等概率等概率抽样。抽样。简简单单随随机机抽抽样样是是在在特特定定总总体体中中抽抽取取样样本本,总总体体中中每每一一个个体体被被抽抽取取的的可可能能性性是是等等同同的的,而而且且任任何何个个体体之之间间彼彼此此被被抽抽取取的的机机会会是是独独立立的的。如如果果用用从从个个体体数数为为N的的总总体体中中抽抽取取一一个个容容量为量为n的样本,那么每个个体被抽取的概卒等于的样本,那么每个个体被抽取的概卒等于 简单随机抽样简单随机抽样(纯随机抽样纯随机抽样)第13页,共90页,编辑于2022年,星期二 简单随机抽样的方法简单随机抽样的方法练习练习:先将总体中的所有个体(共先将总体

10、中的所有个体(共N个)编号(号码可以从个)编号(号码可以从1到到N),),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出签时,每次从中抽出1个号签,连续抽取个号签,连续抽取n次,就得到一个容量为次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。座位号等。抽签法抽签法第14页,共90页,

11、编辑于2022年,星期二 随随机机抽抽样样并并不不是是随随意意或或随随便便抽抽取取,因因为为随随意意或或随便抽取都会带有主观或客观的影响因素随便抽取都会带有主观或客观的影响因素随随机机数数表表是是统统计计工工作作者者用用计计算算机机生生成成的的随随机机数数,并并保保证证表表中的每个位置上的数字是等可能出现的。中的每个位置上的数字是等可能出现的。随随机机数数表表并并不不是是唯唯一一的的,因因此此可可以以任任选选一一个个数数作作为为开开始始,读读数数的的方方向可以向左,也可以向右、向上、向下等等。向可以向左,也可以向右、向上、向下等等。用用随随机机数数表表进进行行抽抽样样的的步步骤骤:将将总总体体

12、中中个个体体编编号号;选选定定开开始始的的数数字;获取样本号码。字;获取样本号码。由由于于随随机机数数表表是是等等概概率率的的,因因此此利利用用随随机机数数表表抽抽取取样样本本保保证证了被抽取个体的概率是相等的。了被抽取个体的概率是相等的。随机数表法随机数表法第15页,共90页,编辑于2022年,星期二如何用随机数表来抽取样本。如何用随机数表来抽取样本。为了检验某种产品的质量,决定从为了检验某种产品的质量,决定从40件产品中抽取件产品中抽取10件进行检件进行检查,利用随机数表抽取这个样本查,利用随机数表抽取这个样本16 22 77 94 39 49 54 43 54 82 17 37 93 2

13、3 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 0

14、9 62 90 52 84 77 27 08 02 73 43 28第16页,共90页,编辑于2022年,星期二注将总体中的注将总体中的N个个体编号时可以从个个体编号时可以从0开始,例如开始,例如N100时编号可以是时编号可以是00,01,02,99,这样总体中的所有个体均可,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表。用两位数字号码表示,便于运用随机数表。第17页,共90页,编辑于2022年,星期二计算机模拟法计算机模拟法是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在计算机计算机中,需要时将总体中,需要时将总

15、体中,需要时将总体中,需要时将总体中各单位编上号码,启用中各单位编上号码,启用中各单位编上号码,启用中各单位编上号码,启用随机数字发生器随机数字发生器随机数字发生器随机数字发生器输出随机数字,输出随机数字,然后从总体中找到相应总体单位形成样本。然后从总体中找到相应总体单位形成样本。第18页,共90页,编辑于2022年,星期二由于每排的座位有由于每排的座位有40个,各排每个号码被抽取的概率都是个,各排每个号码被抽取的概率都是 ,因,因而第而第1排被抽取前,其他各排中各号码被抽取哪率也是排被抽取前,其他各排中各号码被抽取哪率也是 ,也就是,也就是说被抽取的概率是说被抽取的概率是 ,每排的抽样也是简

16、单随机抽样,这种,每排的抽样也是简单随机抽样,这种抽样的方法是系统抽样。抽样的方法是系统抽样。(1)一一个个礼礼堂堂有有30排排座座位位,每每排排有有40个个座座位位。一一次次报报告告会会礼礼堂堂坐坐满满了了听众。会后为听取意见留下了座位号为听众。会后为听取意见留下了座位号为20的的30名听众进行座谈。名听众进行座谈。当当总总体体的的个个数数较较多多时时,将将总总体体分分成成均均衡衡的的部部分分,然然后后按按照照预预先先定定出出的的规规则则,从从每每一一部部分分中中抽抽取取1个个个个体体,得得到到所所需需要要的的样样本本,称为称为系统抽样系统抽样。系统抽样系统抽样(机械抽样、等距抽样机械抽样、

17、等距抽样 )第19页,共90页,编辑于2022年,星期二系统抽样的步骤为:系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔)将整个的编号均衡地分段,确定分段间隔k。是整数时,是整数时,;不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;lnk 系系统统抽抽样样时时,将将总总体体中中的的个个体体均均分分后后的的每每一一段段进进行行

18、抽抽样样时时,采采用用简简单单随随机机抽抽样样;系系统统抽抽样样每每次次抽抽样样时时,总总体体中中各各个个个个体体被被抽抽取取的的概概率率也也是是相相等等的的;如如总总体体的的个个体体数数不不能能被被样样本本容容量量整整除除时时,可可以以先先用用简简单单随随机机抽抽样样从从总总体体中中剔剔除除几几个个个个体体,然然后后再再按按系系统统抽抽样样进进行行。需需要要说说明明的的是是整整个个抽抽样样过过程程中中每每个个个个体被抽到的概率仍然相等。体被抽到的概率仍然相等。第20页,共90页,编辑于2022年,星期二例如例如,为了了解参加某种知识竞赛的,为了了解参加某种知识竞赛的1000名学生的成绩,打算

19、名学生的成绩,打算从中抽取一个容量为从中抽取一个容量为50的样本。假定这的样本。假定这1000名学生的编号是名学生的编号是1,2,1000,由于,由于50:10001:20,我们将总体均分成,我们将总体均分成50个部分,其中每一部分包括个部分,其中每一部分包括20个个体,例如第个个体,例如第1部分的个体部分的个体编号是编号是1,2,20。然后在第一部分随机抽取一个号码,。然后在第一部分随机抽取一个号码,这样得到一个容量为这样得到一个容量为50的样本:的样本:18,38,58,978,998在上面的抽样中,由于在第在上面的抽样中,由于在第1部分(个体编号部分(个体编号120)中的)中的起始号码是

20、随机确定的,每个号码被抽取的概率都等于起始号码是随机确定的,每个号码被抽取的概率都等于0.05,所以在抽取第所以在抽取第1部分的个体前部分的个体前,其他各部分中每个号码被抽其他各部分中每个号码被抽取的概率也都是取的概率也都是0.05.就是说就是说,在这个系统抽样中在这个系统抽样中,每个个体被每个个体被抽到的概率都是抽到的概率都是0.05.第21页,共90页,编辑于2022年,星期二排列次序用的标志有两种:排列次序用的标志有两种:选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关,称无关标称无关标志排队。志排队。选选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有

21、关,称有关称有关标志排队。标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例第22页,共90页,编辑于2022年,星期二机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:随随机起点等距抽样机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)示意图:示意图:第23页,共90页,编辑于2022年,星期二半半距起点等距抽样距起点等距抽样k k kk(k为抽取间隔)示意图:示意图:第24页,共90页,编

22、辑于2022年,星期二对对称等距抽样称等距抽样示意图:示意图:k k k 2k-a 2k+a 4k-a 4k+aak(k为抽取间隔)第25页,共90页,编辑于2022年,星期二分层抽样分层抽样(分类抽样分类抽样)当当已已知知总总体体由由差差异异明明显显的的几几部部分分组组成成时时,为为了了使使样样本本充充分分地地反反映映总总体体的的情情况况,按按照照各各部部分分所所占占比比例例进进行抽样。各部分叫做行抽样。各部分叫做层层。分分层层抽抽样样适适用用于于总总体体由由差差异异明明显显的的几几部部分分组组成成的的情情况况,每每一一部部分分称称为为层层,在在每每一一层层中中实实行行简简单单随随机机抽抽样

23、样。这这种种方方法法较较充充分分地地利利用用了了总总体体己己有有信信息息,是一种实用、操作性强的方法是一种实用、操作性强的方法。分分层层抽抽样样的的一一个个重重要要问问题题是是一一个个总总体体如如何何分分层层。分分层层抽抽样样中中分分多多少少层层,要要视视具具体体情情况况而而定定。总总的的原原则则是是:层层内内样样本本的的差差异异要要小小,而而层层与与层层之之间间的的差差异异尽尽可能地大,可能地大,否则将失去分层的意义否则将失去分层的意义。第26页,共90页,编辑于2022年,星期二类型的划分类型的划分类型的划分类型的划分:必须有清楚的划类界限;必须有清楚的划类界限;必须知道各类中的单位数目和

24、比例;必须知道各类中的单位数目和比例;分类型的数目不宜太多。分类型的数目不宜太多。第27页,共90页,编辑于2022年,星期二类型抽样的好处是:类型抽样的好处是:类型抽样的好处是:类型抽样的好处是:样样本代表性高、抽样误差小、抽样调查成本本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目较低。如果抽样误差的要求相同的话则抽样数目可以减少。可以减少。第28页,共90页,编辑于2022年,星期二例例2、一一个个单单位位的的职职工工有有500人人,其其中中不不到到35岁岁的的有有125人人,3549岁岁的的有有280人人,50岁岁以以上上的的有有95人人。为为了了了了解解

25、该该单单位位职职工工年年龄龄与与身身体体状状况况的的有有关关指指标标,从从中中抽抽取取100名名职职工工作作为为样样本,应该怎样抽取?本,应该怎样抽取?第29页,共90页,编辑于2022年,星期二分层抽样的抽取步骤:分层抽样的抽取步骤:(1)总体与样本容量确定抽取的比例。)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。)对于不能取整的数,求其近似值。第30页,共90页,编辑于2022年,星期二整群抽样整群抽样 整群抽样整群抽样即

26、从全及总体中成群地抽取样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。本单位,对抽中的群内的所有单位都进行观察。整群抽样的好处:整群抽样的好处:组织工作比较简单组织工作比较简单方便,适用于一些特殊的研究对象。其不方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误足之处是,一般比其它抽样方式的抽样误差大。差大。第31页,共90页,编辑于2022年,星期二三种抽样方法的比较三种抽样方法的比较 第32页,共90页,编辑于2022年,星期二5.2 三种不同性质的分布三种不同性质的分布一一.总体分布总体分布二二.样本分布样本分布三三.抽样分布抽样分布第33页,

27、共90页,编辑于2022年,星期二1.总体中各元素的观察值所形成的分布 2.分布通常是未知的3.可以假定它服从某种分布 总体分布总体分布(population distribution)总体总体第34页,共90页,编辑于2022年,星期二1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布样本分布(sample distribution)样样本本第35页,共90页,编辑于2022年,星期二复习:复习:第36页,共90页,编辑于2022年,星期二总体总体的性质的性质一个统计问题总有它明确的研究对象。然而在统计研究中,人们关心总体仅仅是关

28、心其每个个体的一项(或几项)数量指标数量指标和该数量指标在总体中的分布分布情况.这时,每个个体具有的数量指标的全体就是总体总体.参数参数:描述总体及其概率分布的数量值称为:描述总体及其概率分布的数量值称为参数。参数。第37页,共90页,编辑于2022年,星期二总体总体的性质的性质总体可以用一个随机变量及其分布来描述。总体可以用一个随机变量及其分布来描述。例如例如:研究某批灯泡的寿命时,关心的研究某批灯泡的寿命时,关心的数量指标数量指标就是寿命,鉴于此,总体就可用随机变量就是寿命,鉴于此,总体就可用随机变量X表示,或用其分布函数表示,或用其分布函数F(x)表示。表示。第38页,共90页,编辑于2

29、022年,星期二样本的性质样本的性质为样本是随机变量。容量为样本是随机变量。容量为n的样本可以看作的样本可以看作n维随机变量维随机变量。但一旦取定一组样本,得到的是n个具体的数(X1,X2,Xn),称为样本样本的一次的一次观察值观察值,简称,简称样本值样本值。第39页,共90页,编辑于2022年,星期二样本的性质样本的性质代表性:代表性:X1,X2,Xn中每个与所考察的总体有相同中每个与所考察的总体有相同的分布的分布独立性:独立性:X1,X2,Xn是相互独立的随机变量。由是相互独立的随机变量。由简单随机抽样得到的样本称为简单随机样本,简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同

30、分布的它可以用与总体独立同分布的n个相互独立的个相互独立的随随机变量机变量X1,X2,Xn表示表示.若总体的分布函数为若总体的分布函数为F(x),则其简单随机样本的联,则其简单随机样本的联合分布函数为合分布函数为F(x1)F(x2)F(xn)。简单随机样。简单随机样本是应用中最常见的情形,今后,当说到本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本是取自某总体的样本”时,若不特时,若不特别说明,就指别说明,就指简单随机样本简单随机样本.第40页,共90页,编辑于2022年,星期二样本的性质样本的性质简单样本是一组独立、同分布随机变量简单样本是一组独立、同分布随机变量举例

31、(抽样的随机性):从一批平均寿命为1000小时的灯泡中抽取一个样品,若干个样品构成总体的一个样本(随机变量):X1,X2,Xn.第41页,共90页,编辑于2022年,星期二总体、样本、样本值的关系总体、样本、样本值的关系事实上我们抽样后得到的资料都是具体的、具体的、确定的值确定的值。如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本不是样本。我们只能观察到随机变量取的值而见不到随机变量。第42页,共90页,编辑于2022年,星期二样本统计量样本统计量样本统计量样本统计量:设(X1,X2,Xn)是总体的一个样本,f(X1,X2,Xn)是不含任何参数的连续函数,则称

32、f(X1,X2,Xn)为样本(X1,X2,Xn)的一个统计量。统计量的分布称为抽样分布抽样分布。第43页,共90页,编辑于2022年,星期二常用的样本统计量常用的样本统计量 样本均值样本均值:它反映了总体均值的信息 样本方差样本方差:样本样本K阶原点矩阶原点矩:它反映了总体K阶矩的信息样本样本K阶中心矩阶中心矩:它反映了总体K阶中心矩的信息 第44页,共90页,编辑于2022年,星期二1.样本统计量的概率分布2.是一种理论概率分布是一种理论概率分布3.3.随机变量是随机变量是 样本统计量样本统计量样本统计量样本统计量n n样本均值样本均值,样本比例,样本方差等样本比例,样本方差等4.结果来自结

33、果来自容量相同容量相同的所有所有可能样本可能样本5.5.提供了样本统计量长远我们稳定的信息,是进行推断提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据的理论基础,也是抽样推断科学性的重要依据 抽样分布抽样分布 (sampling distribution)第45页,共90页,编辑于2022年,星期二抽样分布抽样分布 (sampling distribution)总体总体计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量例如:样本均值、例如:样本均值、例如:样本均值、比例、方差比例、方差比例、方差样样本本第46页,共90页,

34、编辑于2022年,星期二样本的概率分布样本的概率分布把某一抽样方法的全部可能的样本指标与其相应的把某一抽样方法的全部可能的样本指标与其相应的概率排列起来,就得到样本的概率分概率排列起来,就得到样本的概率分布。布。若将样本指标的取值分别记为若将样本指标的取值分别记为 其相应的概率记为其相应的概率记为P1,P2,Pn,将它们按顺序排列起来,可得如下概率,将它们按顺序排列起来,可得如下概率分布表。分布表。第47页,共90页,编辑于2022年,星期二5.3 样本统计量的抽样分布样本统计量的抽样分布 (一个总体参数推断时一个总体参数推断时)一一.样本均值的抽样分布样本均值的抽样分布二二.样本比例的抽样分

35、布样本比例的抽样分布三三.抽样方差的抽样分布抽样方差的抽样分布第48页,共90页,编辑于2022年,星期二样本均值的抽样分布样本均值的抽样分布第49页,共90页,编辑于2022年,星期二1.容量相同的所有可能样本的样本均值的概率分布2.一种理论概率分布3.进行推断总体总体均值的理论基础样本均值的抽样分布样本均值的抽样分布第50页,共90页,编辑于2022年,星期二样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4 4。4 4 个个个个体体分分别别为为x x1 1=1=1、x x2

36、2=2=2、x x3 3=3=3 、x x4 4=4=4 。总总体体的的均均值值、方差及分布如下方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差第51页,共90页,编辑于2022年,星期二样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)现现从从总总体体中中抽抽取取n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样样条条件下,共有件下,共有4 42 2=16=16个样本。所有样本的结果为3,43,43,33,33,23,23,13,13 32,42,42,32,32,22,22,12,12

37、 24,44,44,34,34,24,24,14,14 41,41,44 41,31,33 32 21 11,21,21,11,11 1第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个观察值观察值观察值观察值所有可能的所有可能的所有可能的所有可能的n n=2 =2 的样本(共的样本(共的样本(共的样本(共1616个)个)个)个)第52页,共90页,编辑于2022年,星期二样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.53.03.02.52.52.02.03 33.03.02.52.52.02.01

38、.51.52 24.04.03.53.53.03.02.52.54 42.52.54 42.02.03 32 21 11.51.51.01.01 1第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个观察值观察值观察值观察值1616个样本的均值(个样本的均值(个样本的均值(个样本的均值(x x)X X样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(X X)1.51.53.03.04.04.03.53.52.02.02.52.5第53页,共90页,编辑于2022年,星期二样本均值的分布与总体分布的比较样

39、本均值的分布与总体分布的比较 (例题分析例题分析)=2.5 2=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布P P(X X)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X X第54页,共90页,编辑于2022年,星期二样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布Xn n=16=16当总体服从正态分布N N(,2 2

40、)时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 X X也也服服从从正正态态分分布布,X X 的的数数学学期期望望为为,方差为 2 2/n n。即 X XN(,2 2/n n)第55页,共90页,编辑于2022年,星期二中心极限定理中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n n 30)30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布中中中中心心心心极极极极限限限限定定定定理理理理:设设从从均均值值为为,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n

41、n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样样分分布布近近似服从均值为似服从均值为、方差为、方差为 2 2/n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体X X第56页,共90页,编辑于2022年,星期二抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布第57页,共90页,编辑于2022年,星期二1.样本均值的数学期望2.样本均值的方差n n重复抽样n n不重复抽样样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方

42、差)第58页,共90页,编辑于2022年,星期二注意:有限总体校正系数注意:有限总体校正系数!由于实际工作中往往是从有限总体中做不重复的抽由于实际工作中往往是从有限总体中做不重复的抽样,尽管抽取前后的元素不再相互独立,样,尽管抽取前后的元素不再相互独立,E(X)不受影响,不受影响,E(X)=,但,但 受受 X之间是否相之间是否相互独立的影响,如果互独立的影响,如果Xi之间不相互独立,计算需要之间不相互独立,计算需要用有限总体校正系数用有限总体校正系数 修正,一般认为如果修正,一般认为如果N/n10,不必校正。,不必校正。第59页,共90页,编辑于2022年,星期二实例实例例例:160件电子元件

43、的重量的均值为件电子元件的重量的均值为5.02克,标准差为克,标准差为0.30克,从中采取不放回抽样抽取克,从中采取不放回抽样抽取64件。件。求求P(4.96 X 5.0)第60页,共90页,编辑于2022年,星期二抽样误差的概念抽样误差的概念 由抽样引起的样本统计量与总体参数间的差异由抽样引起的样本统计量与总体参数间的差异由抽样引起的样本统计量与总体参数间的差异由抽样引起的样本统计量与总体参数间的差异 两种表现形式两种表现形式两种表现形式两种表现形式 n n样本统计量与总体参数间的差异样本统计量与总体参数间的差异样本统计量与总体参数间的差异样本统计量与总体参数间的差异n n样本统计量间的差异

44、样本统计量间的差异样本统计量间的差异样本统计量间的差异 第61页,共90页,编辑于2022年,星期二抽样研究抽样研究 个体变异个体变异抽样误差产生的条件 第62页,共90页,编辑于2022年,星期二均数的均数的抽样误差抽样误差及及标准误标准误 表现一:样本均数与总体均数之差值表现一:样本均数与总体均数之差值表现二:多个样本均数间的离散度表现二:多个样本均数间的离散度第63页,共90页,编辑于2022年,星期二从均数为从均数为、标准差为标准差为 的总体中独立随机抽样,当样本含量的总体中独立随机抽样,当样本含量n n增加时,样本均数的分布将趋于正态分布,此分布的均数为增加时,样本均数的分布将趋于正

45、态分布,此分布的均数为,标准差标准差为为 :第64页,共90页,编辑于2022年,星期二标准误标准误(standard error(standard error,SE)SE),样本统计量的标准差称为标准误,用来衡量抽样误差的样本统计量的标准差称为标准误,用来衡量抽样误差的大小。大小。样本均数的标准差称为样本均数的标准差称为标准误标准误。此标准误与个体变异。此标准误与个体变异 成正比,与样本含量成正比,与样本含量n n的平方根成反比。的平方根成反比。第65页,共90页,编辑于2022年,星期二实际工作中,实际工作中,实际工作中,实际工作中,往往是未知的,一般可用样本标准差往往是未知的,一般可用样

46、本标准差往往是未知的,一般可用样本标准差往往是未知的,一般可用样本标准差s s s s代替代替代替代替 :因为标准差因为标准差因为标准差因为标准差s s s s随样本含量的增加而趋于稳定,故增加样本含量可以随样本含量的增加而趋于稳定,故增加样本含量可以随样本含量的增加而趋于稳定,故增加样本含量可以随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。降低抽样误差。降低抽样误差。降低抽样误差。第66页,共90页,编辑于2022年,星期二均值的均值的抽样标准误抽样标准误1.所有可能的样本均值的标准差,测度所有样本均值的离散程度2.小于总体标准差3.计算公式为第67页,共90页,编辑于2022

47、年,星期二样本比率的抽样分布样本比率的抽样分布第68页,共90页,编辑于2022年,星期二1.总体总体(或样本或样本)中具有某种属性的单位与全部单位总中具有某种属性的单位与全部单位总数之比数之比n n不同性别的人与全部人数之比不同性别的人与全部人数之比n n合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2.2.总体比例可表示为总体比例可表示为3.样本比例可表示为样本比例可表示为4.4.比率比率(proportion)第69页,共90页,编辑于2022年,星期二1.容量相同的所有可能样本的样本比例的概率分布2.当样本容量很大时,样本比例的抽样分布可用正态分布近似 3.一

48、种理论概率分布4.推断总体总体比例的理论基础样本比率的抽样分布样本比率的抽样分布第70页,共90页,编辑于2022年,星期二样本比率的抽样分布(样本比率的抽样分布(实例实例)例:某地区经过长期调查计算,求得初生婴儿能活到例:某地区经过长期调查计算,求得初生婴儿能活到75岁的概率为岁的概率为45%,问在,问在200个初生婴儿的样本中,活到个初生婴儿的样本中,活到75岁者占岁者占50%以上的概率以上的概率?解:n=200,200*0.5=100,远大于远大于5,可以认为样本比率的分布是正,可以认为样本比率的分布是正态态的,的,P(p0.5)=P(z(0.5-0.45)/0.0352)=P(z1.4

49、2)=0.0778第71页,共90页,编辑于2022年,星期二1.样本比率的数学期望2.样本比率的方差n n重复抽样n n不重复抽样样本比率的抽样分布样本比率的抽样分布(数学期望与方差数学期望与方差)第72页,共90页,编辑于2022年,星期二样本方差的抽样分布样本方差的抽样分布第73页,共90页,编辑于2022年,星期二样本方差的分布样本方差的分布设总体服从正态分布N (,2),X1,X X2,Xn为来自该正态总体的简单随机样本,则样本方差 s2 2 的分布为将将 2(n 1)1)称为自由度为(n-1)的卡方分布第74页,共90页,编辑于2022年,星期二c c2 2 分布分布(图示图示)选

50、择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2=(n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布c c c c c c2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体总体第75页,共90页,编辑于2022年,星期二例题例题:第76页,共90页,编辑于2022年,星期二5.4 样本统计量的抽样分布样本统计量的抽样分布 (两个总体参数推断时两个总体参数推断时)一一.两个样本均值之差的抽样分布两个样本均值之差的抽样

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁