第六章 样本与抽样分布.pptx

上传人:修**** 文档编号:5718163 上传时间:2022-01-15 格式:PPTX 页数:53 大小:766.11KB
返回 下载 相关 举报
第六章 样本与抽样分布.pptx_第1页
第1页 / 共53页
第六章 样本与抽样分布.pptx_第2页
第2页 / 共53页
点击查看更多>>
资源描述

《第六章 样本与抽样分布.pptx》由会员分享,可在线阅读,更多相关《第六章 样本与抽样分布.pptx(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、本章转入课程的第二部分本章转入课程的第二部分 数理统计数理统计的特点是应用面广,分支较多。数理统计的特点是应用面广,分支较多。社会的发展不断向统计提出新的问题。社会的发展不断向统计提出新的问题。从历史的典籍中,人们不难发现许多关从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作。但是当时明人们很早就开始了统计的工作。但是当时的统计,只是对有关事实的的统计,只是对有关事实的简单记录和整理简单记录和整理,而没有在一定理论的指导下,作出超越这些而没有在一定理论的指导下,作出超越这些数据范围之外的数据范围之外的推断

2、推断。到了十九世纪末二十世纪初,随着近代到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统数学和概率论的发展,才真正诞生了数理统计学这门学科。计学这门学科。数理统计学是一门应用性很强的学科。数理统计学是一门应用性很强的学科。 它是研究怎样以它是研究怎样以有效的方式有效的方式收集、收集、 整理整理和分析和分析受随机影响的数据受随机影响的数据,并对所考察的,并对所考察的问题作出问题作出推断推断和和预测预测,直至为采取决策和,直至为采取决策和行动提供行动提供依据依据和和建议建议。 数理统计不同于一般的资料统计,数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性它更

3、侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。进行资料的收集、整理和分析。数理统计的任务就是研究怎样有效地数理统计的任务就是研究怎样有效地收集、整理、分析所获得的收集、整理、分析所获得的有限的、局部有限的、局部的的资料,对所研究问题资料,对所研究问题的的整体整体, 尽可能地作出尽可能地作出精确而可靠的结论。精确而可靠的结论。在数理统计中,不是对所研究的对象全在数理统计中,不是对所研究的对象全体体( (称为称为总体总体) )进行观察,而是抽取其中的部进行观察,而是抽取其中的部分分( (称为称为样本样本) )进行观察获得数据(进行观察获得数据(抽样抽样),),并通过这些数据对总体进行推

4、断。并通过这些数据对总体进行推断。由于推断是基于抽样数据,抽样数据又由于推断是基于抽样数据,抽样数据又不能包括研究对象的全部信息。因而由此获不能包括研究对象的全部信息。因而由此获得的结论必然包含得的结论必然包含不肯定性不肯定性。所以,在数理。所以,在数理统计中必然要用到概率论的理论和方法。统计中必然要用到概率论的理论和方法。由此也可以说:由此也可以说:概率论是数理统计的概率论是数理统计的基础基础,而数理,而数理统计是概率论的统计是概率论的重要应用重要应用。但它们是。但它们是并并列列的两个学科,并无从属关系。的两个学科,并无从属关系。需要强调说明一点:需要强调说明一点:统计方法具有统计方法具有“

5、部分推断整体部分推断整体”的的特征特征 。因为我们是从一小部分因为我们是从一小部分样本样本观察值观察值去推断该全体对象(去推断该全体对象(总体总体)情况,即由)情况,即由部分推断全体。部分推断全体。 这里使用的推理方法是这里使用的推理方法是“归纳推理归纳推理”。这种归纳推理不同于数学中的这种归纳推理不同于数学中的“演绎推理演绎推理”。 它在作出结论时,是根据所观察到的大量个它在作出结论时,是根据所观察到的大量个别情况,别情况,“归纳归纳”起来所得,而不是从一些假设、起来所得,而不是从一些假设、命题、已知的事实等出发,按一定的逻辑命题、已知的事实等出发,按一定的逻辑推理推理去去得出来的。得出来的

6、。但此时还应记住毕竟是由但此时还应记住毕竟是由“局部局部”推断推断“整整体体”,因而仍可能,因而仍可能犯错误犯错误,结论往往又是在某个,结论往往又是在某个“可靠性水平可靠性水平”之下得出的。之下得出的。6.1 随机样本随机样本1.1.总体与个体总体与个体 一一个统计问题总有它明确的研究对象。个统计问题总有它明确的研究对象。研究对象的全体称为研究对象的全体称为总体总体(母体母体),总体中每个成员称为总体中每个成员称为个体。个体。 然而在统计研究中,人们关心总体仅仅是关心然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项其每个个体的一项(或几项或几项)数量数量指标指标和该数量指标和该数量指标

7、在总体中的在总体中的分布分布情况。这时,每个个体具有的数量情况。这时,每个个体具有的数量指标的全体就是总体。指标的全体就是总体。该批灯泡寿命的该批灯泡寿命的全体就是全体就是总体总体某品牌轿车百公里耗某品牌轿车百公里耗油量的全体就是油量的全体就是总体总体某批灯泡的寿某批灯泡的寿命命某品牌轿车百公里某品牌轿车百公里耗油量耗油量 由于每个个体的出现是随机的,所以由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性。从相应的数量指标的出现也带有随机性。从而可以把这种数量指标看作一个随机变量而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在,因此随机变量的分布就是该数量

8、指标在总体中的分布。总体中的分布。 这样,这样,总体就可以用一个随机变量总体就可以用一个随机变量及其分布来描述。及其分布来描述。 统计的任务统计的任务, ,是根据从总体中抽取的是根据从总体中抽取的样本样本,去推断总体的性质去推断总体的性质。 由于我们关心的是总体中的个体的某项指由于我们关心的是总体中的个体的某项指标标( (如人的身高、体重,灯泡的寿命如人的身高、体重,灯泡的寿命, ,汽车的汽车的耗油量耗油量) ) ,所谓总体的性质所谓总体的性质,无非就是这无非就是这些指标值的集体的性质些指标值的集体的性质。 而概率分布而概率分布正是刻划这种集体性质的适正是刻划这种集体性质的适当工具。因此在理论

9、上可以当工具。因此在理论上可以把总体与概率分把总体与概率分布等同起来布等同起来。在数理统计中,总体这个概念在数理统计中,总体这个概念的要旨是:的要旨是:总体就是一个概率分布。-500050010001500200005101520252. 样本样本 为推断总体分布及各种特征,按一定为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称以获得有关总体的信息,这一抽取过程称为为 “抽样抽样”,所抽取的部分个体称为,所抽取的部分个体称为样本样本。样本中所包含的个体数目称为样本中所包含的个体数目称为样本容量。样本

10、容量。从某品牌轿车中抽从某品牌轿车中抽5辆进行耗油量试验辆进行耗油量试验样本容量为样本容量为5容量为容量为 n 的样本(也称为子样)的样本(也称为子样)可以可以看作看作 n 维随机变量:维随机变量:( X1 , X2 , , Xn ) 但是,一旦取定一组样本,得到的是但是,一旦取定一组样本,得到的是n个具体的数个具体的数 ( x1 , x2 , , xn ),称为样本,称为样本的一次观察值,简称的一次观察值,简称样本观察值样本观察值 。由于抽样的目的是为了对总体进行统计推断,由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考为了使抽取的样本能很好地反映总体的

11、信息,必须考虑抽样方法。虑抽样方法。最常用的一种抽样方法叫作最常用的一种抽样方法叫作“简单随机简单随机抽样抽样”,它要求抽取的样本满足下面两点,它要求抽取的样本满足下面两点:1. 代表性代表性: X1 , X2 , , Xn 中每一个与所考察中每一个与所考察的总体有相同的分布。的总体有相同的分布。2. 独立性独立性: X1 , X2 , , Xn 是相互独立的随机是相互独立的随机变量。变量。由简单随机抽样得到的样本由简单随机抽样得到的样本(子样)称子样)称为为简单随机样本(子样)简单随机样本(子样)。用用( X1 , X2 , , Xn )表示。表示。 简单随机样本是应用中最常见的情形,简单随

12、机样本是应用中最常见的情形,今后,当说到今后,当说到( X1 , X2 , , Xn )是取自是取自某总体的样本时,若不特别说明,就指某总体的样本时,若不特别说明,就指简简单随机样本单随机样本。3. 总体、样本、样本值的关系总体、样本、样本值的关系总体(理论分布)总体(理论分布) 样本样本 样本值样本值总体分布决定了样本取值的概率规律,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以也就是样本取到样本值的规律,因而可以由样本值去推断总体。由样本值去推断总体。 6.2 抽样分布抽样分布一、样本数据的处理办法1、频数频率分布表;2、图形显示:直方图(频率)、箱线图3、计算经验

13、分布函数来近似总体的分布函数4、构造统计量),(21nXXXgT获得对总体各种参数的认识3、经验分布函数设nXXX21,为取自总体X的一个样本,分布函数F(x)未知若将样本观测值由小到大进行排列为)()2()1(nxxx则)()2()1(nxxx用有序样本定义如下函数:xxxxxnkxxxXPxFnkkn)()1()()1(10)(当当当称为有序样本则)(xFn是一非负又连续函数,且满足1)(0)(nnFF称)(xFn为经验分布函数。说明:对每一个x,)(xFn是样本中事件xxi发生的频率当n固定时,)(xFn样本的函数,它是一个随机变量*由伯努利达数定理:只要n相当大,)(xFn以概率收敛于

14、F(x)Glivenko定理:设)(xFnnXXX21,是取自总体X分布函数为F(x)的样本,是其经验分布函数10| )()(| nnxxFxFSupP表明:当n相当大时,来自样本的经验分布函数是总体分布函数F(x)的一个良好近似,故经典统计学中一切统计推断都已样本为依据。例例 某食品厂生产听装饮料,现从生产线上随机抽取某食品厂生产听装饮料,现从生产线上随机抽取5听听饮料,称得净重为(单位饮料,称得净重为(单位g)351、347、355、344、351,经排序得容量为经排序得容量为5的有序样本:的有序样本:344、347、351、351、355,其经验分布函数为,其经验分布函数为xxxxxxX

15、PxFn3551553553515251513513475151347344513440)(4、统计量、统计量 由样本值去推断总体情况,需要对样本值进行由样本值去推断总体情况,需要对样本值进行“加工加工”,这就要构造一些样本的函数,它把样,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来。本中所含的(某一方面)的信息集中起来。 这种这种不含任何未知参数的样本的函数不含任何未知参数的样本的函数称为称为统统计量。计量。它是完全由样本决定的量。统计量的分布它是完全由样本决定的量。统计量的分布称为抽样分布。称为抽样分布。例如)(21121nnniiniiXXXMaxxFXX、是统计

16、量当2、未知时,11XX、等均不是统计量 二、常见统计量极其抽样分布二、常见统计量极其抽样分布1. 样本均值样本均值niiXnX11反映了总体均值的信息niixx1相应观察值为样本中数据与样本均值的偏差之和为00)(1niixx定理定理: 设设 是来自某总体的样本是来自某总体的样本, 为为 样本均值。样本均值。nXXX,21X(1)若总体分布为若总体分布为 N( ,2), 则则 的精确分的精确分布为布为 N(, 2/n ) ;X(2)若总体分布未知或不是正态分布,若总体分布未知或不是正态分布,则则 的极限分布为的极限分布为 N(, 2/n ) ;X2. 样本方差与样本标准差样本方差与样本标准差

17、n222ii 11S( XX ) ,SSn1 n222ii 11S( XX )SSn 2nnnn2222iiiii 1i 1i 1i 11( xx )xXxnxn 定理定理 设总体设总体X具有二阶矩,具有二阶矩,EX=, DX=2 2 不难看到,当不难看到,当n充分大时,充分大时,t 分布近似分布近似N (0,1)分布。分布。 但对于较小的但对于较小的n,t分布与分布与N (0,1)分布相差很大。分布相差很大。3、F分布分布),(),(2212nYnX定义定义: 设设 X与与Y相互相互独立,则称统计量独立,则称统计量服从服从自由度为自由度为n1及及 n2 的的F分布分布,n1称为第称为第一自由

18、度,一自由度,n2称为第二自由度,记作称为第二自由度,记作 : F F ( n1 , n2 ) .12X nFY n 由定义可见,由定义可见,21Y n1FX n F ( n2, n1)若若XF(n1,n2), X的概率密度为的概率密度为 0001)()()()(),;(222221212112121212121xxxxnnxfnnnnnnnnnnnnnX的数学期望为的数学期望为:2)(22nnXE若若n22即它的数学期望并不依赖于第一自由度即它的数学期望并不依赖于第一自由度n1.分位点0.05z 1.6450.01z 2.3260.990.01zz -2.3260.025t(6 ) 2.44

19、690.9750.025t(6 )t(6 ) -2.446920.025(6 ) 14.44020.975(6 ) 1.2370.025F(6,4 ) 9.200.975F(6,4 )? 一般地,一般地,112211F(n ,n )F (n ,n ) 0.975F(6,4 ) 0.0251F(4,6 ) 16.23=0.1605四、几个重要的抽样分布定理四、几个重要的抽样分布定理 定理定理 1 (样本均值的分布样本均值的分布)设设X1, X2, , Xn 是取自正态总体是取自正态总体2N(,) 的样本,则有:的样本,则有:2X N(,)n X N(0,1)n nii 11E( X )E(X )

20、n 2nii 11D( X )D(X )nn n取不同值时样本均值取不同值时样本均值 的分布的分布X 定理定理 2 ( 样本方差的分布样本方差的分布 )设设X1, X2, , Xn 是取自正态总体是取自正态总体2N(,) 的样本的样本,2Xs和和分别为样本均值和样本方差分别为样本均值和样本方差,则有:则有:222s(n1)(1)(n1) 2(.X)s2和和相相互互独独立立n22ii 11S( XX )n1 22ni22i 1( XX )(n1)S 2ni2i 1( X) 2(n) 2(n-1) 说明:n取不同值时取不同值时 的分布的分布 22( n1 )S 定理定理 3 设设 X1,X2,Xn

21、 是取自正态总体是取自正态总体2N(,) 的样本的样本,2Xs和和分别为样本均值和样本方差分别为样本均值和样本方差,则有:则有:X t(n1)Sn X N(0,1)n 222(n1)S(n1) 22(n1)s/nnX(1) t(n1) XSn 证明:独立独立 定理定理 4 (两总体样本均值差的分布两总体样本均值差的分布) ,设),(),(2221NYNXYX和分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,1nX是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值均值,2212ss和和则有:则有:Y1,Y2,2nY

22、是是样本样本1212w12XY() t(nn2 )11Snn 221w12212(n1)S(n1)Sn2Sn 其中其中XY N(,) 12E( XY ) 12 2212D( XY )nn2212nn 1212)11nXY( N(0,1)n 1212)11nSXYtn( 证明:111212)11nnXY( t(Sn1) 121222)11nnXY( t(Sn1) 121w122)1XY1nn( t(nn2S) 定理定理 5 (两总体样本方差比的分布两总体样本方差比的分布) 221122X N(,),Y N(,),YX和分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1, X2,1nX

23、是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值,均值,2212ss和和则有:则有:Y1,Y2,2nY是是样本样本2211122222S F(n1,n1)S 证明:2211121(n1)S(n1) 2222222(n1)S(n1) 独立独立 211121222222(n1)S/(n1)(n1)S/(n1) 12F(n1 , n1)2211221222212222SSSS 2222221210102ii 11X N 10009940P X940?2N16SP1.664?3XXXXN00.3PX1.44?、设某厂生产的灯泡寿命(,),单位为小时,抽取一容量为 的样本,得到x,s=100,问、设在总体 ( ,)中抽取一个容量为 的样本, ,未知,求、设,为总体( , )的一个样本,求0.0522220.05222101022ii2i=1i 1X1 (1),(8)1.8595P X9400.056Sn-1SS2(1),(15)24.996P1.6640.05X3(10),PX1.440.: 1. 0 3t ntnn、利用得()、利用得、利用得解答

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁