《4-统计抽样和抽样分布.pptx》由会员分享,可在线阅读,更多相关《4-统计抽样和抽样分布.pptx(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 统计抽样统计抽样 与抽样分布与抽样分布为什么要进行抽样为什么要进行抽样? ?如何进行简单随机抽样?如何进行简单随机抽样?正态分布、正态分布、 分布、分布、F F分布、分布、t t分布的定分布的定义、图形分布形态如何?义、图形分布形态如何?中心极限定理的含义如何?中心极限定理的含义如何? 21/55第四章统计抽样与抽样分布第四章统计抽样与抽样分布4.1 4.1 关于抽样的基本概念关于抽样的基本概念 为什么要抽样为什么要抽样? ?为了收集必要的资料,对所研究对象(总体)的为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。全部元素逐一进行观测,往往不很现实。
2、抽抽样样原原因因元素多,搜集数据费元素多,搜集数据费时、费用大,不及时而时、费用大,不及时而使所得的数据无意义使所得的数据无意义总体庞大总体庞大, ,难以对总难以对总体的全部元素进行体的全部元素进行研究研究检查具有破坏性检查具有破坏性炮弹、灯管、砖等炮弹、灯管、砖等2第四章统计抽样与抽样分布第四章统计抽样与抽样分布简单随机抽样(简单随机抽样(x x1 1, x, x2 2, , x xn n): :简单随机抽样是指从总体中抽取样本容量为简单随机抽样是指从总体中抽取样本容量为n n 的的样本时,样本时,x x1 1, x, x2 2, , x xn n这这n n个随机变量必须具备以个随机变量必须
3、具备以下两个条件:下两个条件:这这n n个随机变量与总体个随机变量与总体X X具有相同的概率分布;具有相同的概率分布;它们之间相互独立。它们之间相互独立。4.1 4.1 关于抽样的基本概念关于抽样的基本概念 3第四章统计抽样与抽样分布第四章统计抽样与抽样分布甲乙丙丁四个生产商,其产品质量如下表所示:甲乙丙丁四个生产商,其产品质量如下表所示:如果仅从甲乙两个生产商的产品中进行抽样,抽样如果仅从甲乙两个生产商的产品中进行抽样,抽样质量就偏高;如果仅从丙丁两个生产商的产品中进行抽质量就偏高;如果仅从丙丁两个生产商的产品中进行抽样,抽样质量就偏低;样,抽样质量就偏低;因此采用简单随机抽样保证随机样本与
4、总体具有相因此采用简单随机抽样保证随机样本与总体具有相同的概率分布。同的概率分布。甲甲乙乙丙丙丁丁质量质量高高高高低低低低表表4-14-14.1 4.1 关于抽样的基本概念关于抽样的基本概念 4第四章统计抽样与抽样分布第四章统计抽样与抽样分布样本统计量与抽样分布样本统计量与抽样分布: :在简单随机抽样中,样本具有随机性,样本的参在简单随机抽样中,样本具有随机性,样本的参数数 ,s,s2 2等也会随着样本不同而不同,故它们是样本等也会随着样本不同而不同,故它们是样本的函数,记为的函数,记为g g(x x1 1, x, x2 2, , x xn n),称为样本统计量。),称为样本统计量。统计量的概
5、率分布称为抽样分布(统计量的概率分布称为抽样分布(Sample Sample distributiondistribution) x4.1 4.1 关于抽样的基本概念关于抽样的基本概念 5第四章统计抽样与抽样分布第四章统计抽样与抽样分布统计量定义定义: : 设设 为来自总体为来自总体 X X的一个样本,的一个样本, 为一个函为一个函数数,如果,如果 中不包含任何未知参数,则称中不包含任何未知参数,则称 为样本的一个为样本的一个统计量统计量。niiXnX11样本均值样本方差K阶样本矩niiniiXnXnXXnS122212)(11)(11, 2 , 1,11kXnAnikkinXXX,21),(
6、21nXXXg),(21nXXXg常见的常见的统计量统计量练习证明:练习证明:.)()(,)(22XVarSEEXXEg, 2 , 1,)(11kXXnBnikikK阶中心矩6第四章统计抽样与抽样分布第四章统计抽样与抽样分布几几种种概概率率分分布布正态分布正态分布 分布分布 F F分分布布 t t分布分布24.2 4.2 几种与正态分布有关的概率分布几种与正态分布有关的概率分布7第四章统计抽样与抽样分布第四章统计抽样与抽样分布若随机变量若随机变量X X的概率密度函数的概率密度函数,21)(222)(xexfx),(2NX记为记为 (1)(1)正态分布正态分布8第四章统计抽样与抽样分布第四章统计
7、抽样与抽样分布uttfuUPd)()(图图4-14-1一般正态分布一般正态分布(1)(1)正态分布正态分布9第四章统计抽样与抽样分布第四章统计抽样与抽样分布标准正态分布标准正态分布: : 当当 时,时, 记为记为UUN N(0 0,1 1)1, 022221)(tet图图4-24-2标准正态分布标准正态分布(1)(1)正态分布正态分布10第四章统计抽样与抽样分布第四章统计抽样与抽样分布非标准正态分布向标准正态分布的转化非标准正态分布向标准正态分布的转化若若标准化因子标准化因子 则则UNUN(0 0,1 1)),(2NXXU(1)(1)正态分布正态分布11第四章统计抽样与抽样分布第四章统计抽样与
8、抽样分布查表查表当当u u大于零时,可查正态分布表大于零时,可查正态分布表但如果但如果u0u0时,则可由式时,则可由式 求出求出(1)(1)正态分布正态分布)(1)(uu12第四章统计抽样与抽样分布第四章统计抽样与抽样分布13第四章统计抽样与抽样分布第四章统计抽样与抽样分布线性性质:线性性质: 如果如果 , ,且相互独立。且相互独立。对于常数对于常数 ,有下式成立:,有下式成立:), 2 , 1)(,(2niNXiii),(1211niiniiniiNX),(22iiiaaNaXa(1)(1)正态分布正态分布14第四章统计抽样与抽样分布第四章统计抽样与抽样分布相互独立且均为服从相互独立且均为服
9、从N N(0 0,1 1)分布的随机)分布的随机变量,则称随机变量变量,则称随机变量 所服从的分布是自由所服从的分布是自由度为度为n n的的 分布,且记分布,且记 。212x ,x ,xn221xnii)(22n2定义定义(2) (2) 分布分布15第四章统计抽样与抽样分布第四章统计抽样与抽样分布自由度是指独立随机变量的个数,自由度是指独立随机变量的个数, dfn2( )n分布的密度函数为分布的密度函数为 2 1221,022( ) 0, 0nynyeynf yy(1)!nn2分布分布 16第四章统计抽样与抽样分布第四章统计抽样与抽样分布图图4-34-32 2分布密度函数图形分布密度函数图形2
10、(2) (2) 分布分布0 1 3 5 7 9 11 13 15 17 x0.50.40.30.20.1n=1n=4n=10图图4-3f(x)其图形随自由度的其图形随自由度的不同而有所改变不同而有所改变. .17第四章统计抽样与抽样分布第四章统计抽样与抽样分布查表:查表:对于给定的对于给定的,0100.1n/N0.1时则时则 称式称式 为有限总体的修正系数为有限总体的修正系数 。1)(1)()(2NnNnXNnNnXDXE1NnN4.3 4.3 样本平均数的抽样分布样本平均数的抽样分布证明可以见 梁小筠p42一些复杂的展开,无技术含量(一网友留言) 34第四章统计抽样与抽样分布第四章统计抽样与
11、抽样分布从总体中抽取样本容量为从总体中抽取样本容量为n n的简单随机样本,当样的简单随机样本,当样本容量本容量 n n 30 30时,样本均值时,样本均值 的抽样分布可用正态的抽样分布可用正态概率分布近似。概率分布近似。X4.4 4.4 中心极限定理中心极限定理35第四章统计抽样与抽样分布第四章统计抽样与抽样分布图图4-64-64.4 4.4 中心极限定理中心极限定理36第四章统计抽样与抽样分布第四章统计抽样与抽样分布独立同分布的中心极限定理独立同分布的中心极限定理2122111112,(),()0(1,2,)()()( )1lim( )lim2niiniinnniiiiiinniintxnn
12、nnXXXE XD XkXXEXXnYnDXF xxF xP YxedtXnn定理设是相互独立,服从同一分布且具有数学期望和方差:,则随机变量之和的标准化变量的分布函数对任意实数 满足即当 充分大时,(0,1)N近似的37第四章统计抽样与抽样分布第四章统计抽样与抽样分布德莫佛德莫佛拉普拉斯定理拉普拉斯定理 xtnnndtexpnpnpPxppnn2221)1(lim)10(,), 2 , 1( ,有,有意意的二项分布,则对于任的二项分布,则对于任服从参数为服从参数为设随机变量设随机变量定理定理38第四章统计抽样与抽样分布第四章统计抽样与抽样分布德莫佛德莫佛拉普拉斯定理的证明拉普拉斯定理的证明二
13、项分布的极限分布。二项分布的极限分布。定理说明,正态分布是定理说明,正态分布是特殊情形。特殊情形。同分布中心极限定理的同分布中心极限定理的可见,上述定理是独立可见,上述定理是独立限定理知限定理知由独立同分布的中心极由独立同分布的中心极。分布,有分布,有服从服从其中其中的二项分布,则令的二项分布,则令服从参数为服从参数为由于由于定理定理 xtnnkkknkknndtexpnpnpPppXDpXEXXppnn21221)1(lim)1()(,)()10()10(,), 2 , 1( 39第四章统计抽样与抽样分布第四章统计抽样与抽样分布中心极限定理的意义中心极限定理的意义 我们知道,正态分布是现实生
14、活中使用最多、我们知道,正态分布是现实生活中使用最多、最广泛、最重要的一种分布。许多随机变量本身最广泛、最重要的一种分布。许多随机变量本身并不属于正态分布,但它们的极限分布是正态分并不属于正态分布,但它们的极限分布是正态分布。中心极限定理阐明了在什么条件下,原来不布。中心极限定理阐明了在什么条件下,原来不 属于正态分布的一些随机变量其总和分布渐近地属于正态分布的一些随机变量其总和分布渐近地服从正态分布。为我们利用正态分布来解决这类服从正态分布。为我们利用正态分布来解决这类随机变量的问题提供了理论依据。随机变量的问题提供了理论依据。40第四章统计抽样与抽样分布第四章统计抽样与抽样分布例例1.57
15、. 522)1(.5 .12,25),12(22 SXNX未止,但已知样本方差未止,但已知样本方差);(;(知知已已如果如果的概率的概率大于大于求样本均值求样本均值的样本的样本抽取容量为抽取容量为服从正态分布服从正态分布设总体设总体解解252125 .12252125 .12) 1 (XPXP1063. 0)25. 1(125. 14 . 012 XP 059. 1255 .1225125 .12)2( TPSSXPXP .15. 05 .12.15. 0059. 1,059. 1)24(,2415. 0 XPTPtt故故有有即即分分布布表表的的查查自自由由度度为为41第四章统计抽样与抽样分布
16、第四章统计抽样与抽样分布例例2.85. 2)(2;401.,)5 . 0 ,(101210121012 iiiiXXpXpXXN)未知,求概率)未知,求概率(,求概率,求概率)已知)已知(中抽取样本中抽取样本从正态总体从正态总体解解)10(5 . 01)1 , 0(5 . 00)1(2101222 iiiXYNX,则,则有有,由由 165 . 045 . 01421012221012 YpXpXpiiii42第四章统计抽样与抽样分布第四章统计抽样与抽样分布.10. 04.16)10(1012210. 0 iiXp由此可得由此可得查表求查表求)9()(5 . 015 . 092)2(221012
17、22 iiXXSZ,由题设及定理由题设及定理 10122210125 . 085. 2)(5 . 0185. 2)(iiiiXXpXXp 4 .112 ZP由此可求得由此可求得查表得查表得, 4 .11)9(225. 0 .25. 085. 2)(1012 iiXXp43第四章统计抽样与抽样分布第四章统计抽样与抽样分布例例3).()(),(2,1,)(211SEXDXEXXXXnn和和)计算)计算(的概率分布;的概率分布;)写出)写出(是一个样本:是一个样本:,设总体服从泊松分布设总体服从泊松分布 解解 0, 2 , 1 , 01 iixiixexxXPi)由于)由于(的概率分布为的概率分布为
18、因此样本因此样本nXX,1 niniixnixxeexniii11!1 niiixXP144第四章统计抽样与抽样分布第四章统计抽样与抽样分布例例4.)()(,6)1 , 0(226542321621分布分布服从服从,使随机变量,使随机变量试决定常数试决定常数设设,的样本的样本量为量为,从此总体中取一个容,从此总体中取一个容若总体若总体 CYCXXXXXXYXXXNXnnXDXDXEXEXDXE )()(,)()(,)()()2(则有则有由于,由于,niiXXnESE122)(11)(45第四章统计抽样与抽样分布第四章统计抽样与抽样分布)2(33312232123212 XXXXXXY分布的性质
19、可知分布的性质可知由由.31 C故故解解)1 , 0(3)3 , 0(321321NXXXNXXX 所以所以因为因为)1(322321 XXX从而从而)1(322654 XXX同理可知同理可知46第四章统计抽样与抽样分布第四章统计抽样与抽样分布五、课堂练习五、课堂练习 .10),min(;15),max(211.,5)4 ,12(1543215432151 XXXXXPXXXXXPXXN)求概率)求概率(的概率;的概率;值之差的绝对值大于值之差的绝对值大于)求样本均值与总体均)求样本均值与总体均(的样本的样本中随机抽一容量为中随机抽一容量为、在总体、在总体15122551152(1, ),.
20、,max,2 ,(), iiXbppXXXXXXXpXX 、设总体 服从两点分布,其中 是未知参数,是来自 的简单随机样本 试指出之中哪些是统计量 哪些不是统计量,为什么?47第四章统计抽样与抽样分布第四章统计抽样与抽样分布解解12628. 052225252152152125211112),54,12() 1 (XPXPNX有由 2923. 0)5 . 1(1)5 . 1(121215212115115,15,15,15,15115),max(115),max()2(5515151543215432154321 iiiiiXPXPXXXXXPXXXXXPXXXXXP48第四章统计抽样与抽样分
21、布第四章统计抽样与抽样分布 5785. 0)1(1)1(11212102121110110,10,10,10,10110),min(110),min()3(5515151543215432154321 iiiiiXPXPXXXXXPXXXXXPXXXXXP解解2.2)( ,max,52155121是是未未知知数数)不不是是统统计计量量(因因为为都都是是统统计计量量,但但ppXXXXXXii 49第四章统计抽样与抽样分布第四章统计抽样与抽样分布 例例4 设总体设总体XN(0,1), X1,X2,Xn为简单为简单随机样本,试问下列统计量各服从什么分布?随机样本,试问下列统计量各服从什么分布?223
22、43211212242(1)31(1);(2);(3).iinniiiinXXXnXXXXX 解解 (1)因为因为XiN(0,1),i=1, 2, , n.所以所以X1- -X2 N(0, 2),12(0,1),2XXN 22342(2),XX 故故223412XXXX 223412()22XXXX t(2).50第四章统计抽样与抽样分布第四章统计抽样与抽样分布 例例4 设总体设总体XN(0,1), X1,X2,Xn为简单为简单随机样本,试问下列统计量各服从什么分布?随机样本,试问下列统计量各服从什么分布?22343211212242(1)31(1);(2);(3).iinniiiinXXXn
23、XXXXX 续解续解 (2)因为因为X1N(0,1),故故t(n- -1).222(1)niiXn 1221niinXX 122(1)niiXXn 51第四章统计抽样与抽样分布第四章统计抽样与抽样分布 例例4 设总体设总体XN(0,1), X1,X2,Xn为简单为简单随机样本,试问下列统计量各服从什么分布?随机样本,试问下列统计量各服从什么分布?22343211212242(1)31(1);(2);(3).iinniiiinXXXnXXXXX 续解续解 (3) 因为因为所以所以F(3,n- -3).3221(3),iiX 224(3),niiXn 32124(1)3iiniinXX 32124
24、3(3)iiniiXXn 52第四章统计抽样与抽样分布第四章统计抽样与抽样分布例例5 若若Tt(n), 问问T2服从什么分布?服从什么分布?解解因为因为Tt(n), 可以认为可以认为,UTV n 其中其中UN(0,1), V 2(n), 22,UTV n U2 2(1),221UTV n F(1, n). 53第四章统计抽样与抽样分布第四章统计抽样与抽样分布例例6 设总体设总体XN( , 42), X1,X2,X10是是n=10简单随机样本,简单随机样本, S2为样本方差,已知为样本方差,已知PS2 =0.1,求求 .解解 因为因为n=10,n- -1=9, 2=42,所以所以2294S 2(9).又又PS2 =2229944SP =0.1,所以所以220.19(9)4 查表查表14.684.故故 14.684x16926.10554第四章统计抽样与抽样分布第四章统计抽样与抽样分布例例 7设设(X1,X2,Xn)为来自正态总体为来自正态总体 XN( , 2)的样本,则统计量的样本,则统计量 (1)XTt nSn 证证由于由于与与S 2相互独立,且相互独立,且 X(0,1),XUNn 222(1)(1)nSn 由定义得由定义得22 (1)(1)(1)XnXTt nSnnSn 55