《第三章应用数理统计抽样分布.pptx》由会员分享,可在线阅读,更多相关《第三章应用数理统计抽样分布.pptx(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章 抽样分布一、抽样二、随机抽样三、抽样分布3.1 抽样一、抽样的概念 如果所获得的数据是研究对象的全部,这组数据就构成一个总体 如果所获得的数据只是这一总体所构成的集合的某一个子集,它就是一个样本二、抽样的类别 判断性抽样:根据专家意见选择样本 随机抽样:概率抽样3.2 随机抽样一、基本概念1.总体:试验的全部可能的观测值2.个体:试验的每一个观测值称为个体3.总体的容量:总体中所包含的个体数4. 有限总体和无限总体:总体容量为有限的称有限总体,否则称为无限总体3.2 随机抽样一、基本概念对某个总体而言,个体的取值是按一定规律分布的,即总对应着一个随机变量X,对总体的研究实际上是对一个随
2、机变量X的研究一个总体就是一个具有确定概率分布的随机变量例:对某天生产的产品进行质量检验,以0表示正品,1表示次品。假设出现次品的概率为p(常数),则总体由0和1组成,这一总体对应一个参数为p的(0-1)分布的随机变量,即我们就将它看作是(0-1)分布总体,即总体中的观测值是(0-1)分布随机变量的可能取值。1 ,0,)1(1xppxXPxx3.2 随机抽样二、随机抽样的定义1. 抽样:从总体中抽取有限个个体对总体进行观测的过程2. 样本:从总体中抽取一部分个体,根据获得的数据对总体分布进行推断,被抽出的部分个体叫总体的一个样本3.2 随机抽样二、随机抽样的定义在相同的条件下我们对总体X进行n
3、次重复的、都独立的观测,将n次观测结果按试验的次序记为X1,X2,Xn,由于它们是对随机变量X观测的结果,且每次观测是在相同的条件下独立进行的,故可以认为X1,X2,Xn是相互独立的,且都是与总体X具有相同分布的随机变量。这样得到的X1,X2,Xn称为来自总体X的一个简单随机样本,n称为这个样本的容量。当n次观测结束后,我们得到一组实数x1,x2,xn,它们依次是随机变量X1,X2,Xn的观测值,称为样本值。3.2 随机抽样二、随机抽样的定义有限总体的简单随机抽样:假设总体容量为N(有限),样本容量为n(N),如果所有容量为n的样本都有相同的概率可以从总体中被抽取到,则称此方法为有限总体的简单
4、随机抽样常用做法:利用随机数表3.2 随机抽样二、随机抽样的定义系统抽样,分层抽样和整群抽样-近似随机抽样系统抽样:按一定原则或规律性进行抽样,如隔n天搜集一次数据等,适合于数据没有系统性或周期性变化的情况,在时间和费用上较节约分层抽样:将总体分成许多阶层,每个阶层都是一个团体,要求做到每个团体内的个体差异较小,而各阶层之间的差异较大。然后在每个阶层内进行随机抽样,其样本容量可以按各阶层占总体比例的大小而定整群抽样:总体分组后,从总体中随机抽取n组,这n组个体组成一个样本3.2 随机抽样二、随机抽样的定义一个样本中的每个个体必须取自同一个总体取得任一个体的概率都不影响取得另外一个个体的概率3.
5、3 抽样分布一、统计量设X1,X2,Xn是来自总体X的一个样本,g(X1,X2,Xn)是X1,X2,Xn的函数(如均值,方差),若函数g(X1,X2,Xn)不含有任何未知参数,则称g(X1,X2,Xn)是一个统计量。如果x1,x2,xn是相应于样本X1,X2,Xn的样本值,则称g( x1,x2,xn)是统计量g(X1,X2,Xn)的观测值统计量也是一个随机变量3.3 抽样分布最常用的统计量:样本矩阶中心矩称为样本的统计量阶原点矩,称为样本的统计量为样本标准差,称统计量为样本方差,称统计量为样本均值,称统计量是这一样本的观测值,的一个样本,是来自总体设kkXXnkkXnXXnSXXnXnxxxk
6、niiknikikniiniiniinn.3 , 2,)(1B,.3 , 2,1A)(11S)(11S1X,.,X,.XX,X112122121-21213.3 抽样分布这些统计量的观测值分别为:.3 , 2,)(1b,.3 , 2 , 1,1a)(11s)(11s1x112122121-kxxnkxnxxnsxxnxnkniiknikikniiniinii,抽样分布的形成 (sampling distribution)从抽样推断总体的依据大数定理 一般意义:在随机试验过程中,虽然每次观察的结果不同,但大量重复观察出现的结果的平均值却几乎总是接近某个确定值。 实质:一般的规律性表现在大量的事实
7、中。它依靠大量的观察,使个别的、偶然的差异性相互抵消,显现出总体的、必然的规律性,揭示了大量随机变量的平均趋势。 证明了抽样平均数将趋近于总体平均数,为抽样分析提供了科学依据。1. 在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2. 一种理论概率分布3. 推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布5 . 21NxNii25. 1)(122NxNii样本均值的抽样分布3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n = 2
8、的样本(共的样本(共16个)个)样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)样本均值的分布与总体分布的比较5 . 2x625. 02x几个常用的抽样分布正态分布卡方分布t分布F分布基于正态总体样本的均值与方差的分布正态分布密度函数:正态分布是一个连续分布,形状呈钟型,中心为,两边对称,两个参数和2分别表示它的均值与离散程度。.14159. 3, 0,)(21exp21)(2xxxf式中,dezZPzz222222221)()(
9、10NZ1(Z)0,E(Z)Z-XZXE(X)N:标准化正态变量的数值),(为为标准正态变量,简记称学期望和方差分别是:也是正态变量。它的数,则随机变量令)(,它的两个特征值是的正态分布。和方差)表示具有均值,(我们将用正态分布之曲线较陡峭大时,曲线较平缓,反轴为渐近线,当时,曲线以当处有拐点时对称,在处,曲线在点在在正态分布中,最大值xxxxx中心极限定理x5x50 x5 . 2x中心极限定理nxx中心极限定理抽样分布与总体分布的关系正态分布正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布0,)2(210,02222222212212122)()()(X.XX
10、)1 ,0(,.,XyeynynnynnyfnnnNXX分布的密度函数为:分布,记为的服从自由度为的样本,则称统计量是来自总体设分布2图3.2.1值的,附表可查不同分位点分布的上为的数,称满足等式,且对于给定的数分布的上分位点、)(分布的数学期望和方差、)(独立,则和,且设,设分布的可加性、分布的性质:)()45()()()()(1032)(,E2)()(1222)(2222222122221222122221221222nnnndyyfnPnDnnnnnn分布的性质2图3.2.2分布t图3.2.3tntnnnntfntntttnnYXtnYNn,)1 ()2()21();()()(YX),(
11、)1 ,0(X2122分布的密度函数为:分布,记为的服从自由度为独立,则称统计量与且设,设分布t图3.2.4表格可供查阅分位点分布的上称为的数,称满足等式:,且对于给定的数。布分布近似于标准正态分充分大时,即当可以证明,独立,则称统计量与且设,设)()();()(10) 1 , 0(21);(limYX),() 1 , 0(X)(222ntntdtntfnttPNtnentfnYNnttn分布F图3.2.50,)(1)2()2()(2(0,0212121212122122212121121212121),;(),(),(),(/U/FVU)(V),(Uynynnnynnnnynnnnnnyfn
12、nFnnFFFnnnVnnn分布的密度函数为:分布,记为的服从自由度为独立,则称随机变量与且设设分布F图3.2.6表格可供查阅要性质:分位点,该点有如下重分布的上称为的数,称满足等式:,且对于给定的数),(F1),(F),(),(),;(),(101221-12121),(212121nnnnnnFnnFdynnyfnnFFPnnF几种分布的特征一览分布随机变量样本空间参数均值方差形状标准正态Z无01对称nn2n右偏tn0对称Fn1,n2右偏2)(2n)(nt),(21nnF),(), 0( ),(), 0( 2,2222nnn2,2nnn2,) 4)(2() 2(222212122nnnnn
13、nn)1(S/),(,.,3)1()1(),(,.,2),(),(,.,12221222222212221ntnXSXNXXXnSnSXSXNXXXnNXXNXXXnnn均值和样本方差,则分别为样本,的样本,是来自正态总体、设独立,且与均值和样本方差,则分别为样本,的样本,是来自正态总体、设为样本均值,则的样本,是来自正态总体、设基于正态总体样本的均值与方差的分布22122221121212122221212221222121222211211211222211221121,2) 1) 1)2(11)()2() 1, 1F(n/1)(11,)(111,1),(),(,.,.,42121wwwwniiniiniiniinnSSnnSnSnSnntnnSYXnSSYYnSXXnSYnYXnXNNYYYXXX(其中,(时,当)则(方差,分别代表这两个样本的以均值,分别代表这两个样本的以相互独立。的样本,且这两个样本和是分别来自正态总体和、设基于正态总体样本的均值与方差的分布样本比例的抽样分布重复抽样下样本比例的抽样分布不重复抽样下样本比例的抽样分布由样本均值的抽样分布性质类推得出。见书表3.2.1今日作业3.24P90.2、3、4、5