《数理统计抽样分布幻灯片.ppt》由会员分享,可在线阅读,更多相关《数理统计抽样分布幻灯片.ppt(93页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数理统计抽样分布2023/1/7王玉顺:数理统计02_抽样分布1第1页,共93页,编辑于2022年,星期六n2.1 总体与样本n2.2 抽样分布n2.3 统计量分位数n2.4 抽样分布定理n2.5 中心极限定理本章内容2 抽样分布第2页,共93页,编辑于2022年,星期六2.3 统计量分位数Statistic Fractile2 抽样分布第3页,共93页,编辑于2022年,星期六2.3 统计量分位数(1)事件概率作统计量观察值的下标统计量X观察值x事件Xx观察值加下标x 概率P(Xx)=第4页,共93页,编辑于2022年,星期六(2)统计量观察值是事件概率的函数统计量观察值x表为x,意义之一是
2、建立了x与的一一对应函数关系,实现了统计量观察值x按概率的分割。2.3 统计量分位数第5页,共93页,编辑于2022年,星期六(3)统计量观察值表为x 便于应用解决两类问题:已知x 求事件Xx 的概率 已知概率 反求观察值x x蕴含统计量观察值x、随机事件Xx、事件概率三方面的信息2.3 统计量分位数第6页,共93页,编辑于2022年,星期六(4)分布函数F(x)与x 的关系x蕴含统计量观察值x、事件Xx、概率、事件Xx、分布函数F(x)等五方面的信息2.3 统计量分位数第7页,共93页,编辑于2022年,星期六(5)分位数定义若统计量X的观察值x与事件Xx、事件概率之间的关系由下式确定:则称
3、x为X的上侧分位数,简称分位数或分位点,称为尾概率(tail probability)。2.3 统计量分位数第8页,共93页,编辑于2022年,星期六2.3.1 Z统计量分位数Z-Statistic Fractile2.3 统计量分位数第9页,共93页,编辑于2022年,星期六(1)Z统计量分位数z设ZN(0,1)表征标准正态统计量,若Z的分位数记作z,则分位数z、事件Zz、尾概率、事件Zz、分布函数(z)五者满足下面的关系:2.3.1 Z统计量分位数第10页,共93页,编辑于2022年,星期六(1)Z统计量分位数z2.3.1 Z统计量分位数z蕴含统计量观察值z事件Zz概率事件Zz分布函数F(
4、z)五方面的信息第11页,共93页,编辑于2022年,星期六(3)分位数z的对称性2.3.1 Z统计量分位数第12页,共93页,编辑于2022年,星期六(4)查表确定分位数z查正态分布表计算下面的4个分位数:2.3.1 Z统计量分位数第13页,共93页,编辑于2022年,星期六2.3.2 2统计量分位数Chi-Square-Statistic Fractile2.3 统计量分位数第14页,共93页,编辑于2022年,星期六2.3.2 2统计量分位数(1)2统计量分位数2(n)设22(n),并2统计量分位数记作2(n)则分位数2(n)、事件22(n)、尾概率、事件22(n)、分布函数F2(n)五
5、者满足下面的关系:第15页,共93页,编辑于2022年,星期六2.3.2 2统计量分位数(1)2统计量分位数2(n)2(n)蕴含观察值2(n)事件22(n)概率事件22(n)分布函数F(2(n)五方面的信息第16页,共93页,编辑于2022年,星期六2.3.2 2统计量分位数(2)查表确定分位数2(n)查卡方分位数表确定下面4个分位数:第17页,共93页,编辑于2022年,星期六2.3.3 T统计量分位数T-Statistic Fractile2.3 统计量分位数第18页,共93页,编辑于2022年,星期六2.3.3 T统计量分位数(1)T统计量分位数t(n)设Tt(n),并T统计量分位数记作
6、t(n)则分位数t(n)、事件Tt(n)、尾概率、事件Tt(n)、分布函数Ft(n)等五者之间满足下面的关系:第19页,共93页,编辑于2022年,星期六2.3.3 T统计量分位数(1)T统计量分位数t(n)t(n)蕴含观察值t(n)事件Tt(n)概率事件Tt(n)分布函数Ft(n)五方面的信息第20页,共93页,编辑于2022年,星期六2.3.3 T统计量分位数(2)分位数t(n)的对称性第21页,共93页,编辑于2022年,星期六2.3.3 T统计量分位数(3)查表确定分位数t(n)查T分位数表确定下面4个分位数:第22页,共93页,编辑于2022年,星期六2.3.4 F统计量分位数F-S
7、tatistic Fractile2.3 统计量分位数第23页,共93页,编辑于2022年,星期六2.3.4 F统计量分位数(1)F统计量分位数F(n1,n2)设FF(n1,n2),F统计量分位数记作F(n1,n2)则分位数F(n1,n2)、事件FF(n1,n2)、尾概率、事件FF(n1,n2)、分布函数FF(n1,n2)等五者之间满足下面的关系:第24页,共93页,编辑于2022年,星期六2.3.4 F统计量分位数(1)F统计量分位数F(n1,n2)F(n1,n2)蕴含观察值F(n1,n2)事件FF(n1,n2)概率事件FF(n1,n2)函数FF(n1,n2)五方面的信息第25页,共93页,
8、编辑于2022年,星期六2.3.4 F统计量分位数(2)分位数F(n1,n2)的反对称性F统计量的分位数等于自由度对调后1-分位数的倒数两分位数下标之和等于1第26页,共93页,编辑于2022年,星期六2.3.4 F统计量分位数(2)分位数F(n1,n2)的反对称性第27页,共93页,编辑于2022年,星期六2.3.4 F统计量分位数(3)查表确定分位数F(n1,n2)查F分位数表确定下面4个分位数:第28页,共93页,编辑于2022年,星期六2.3.4 F统计量分位数(3)查表确定分位数F(n1,n2)第29页,共93页,编辑于2022年,星期六2.4 抽样分布定理Sample Distri
9、bution几个正态总体抽样统计量所服从的分布2 抽样分布第30页,共93页,编辑于2022年,星期六2.4 抽样分布定理设任意总体X的期望E(X)=和方差Var(X)=2设X1,X2,Xn是来自总体X的简单随机样本则样本均值的期望和方差为:(1)任意总体样本均值的期望和方差第31页,共93页,编辑于2022年,星期六(2)正态总体样本均值及分布定理一:设X1,X2,Xn是正态总体N(,2)的样本,则样本均值服从期望为方差为2/n的正态分布:2.4 抽样分布定理引用任意样本均值的期望为方差为2/n;再引用教材第3章第5节例1结论“正态随机变量之和仍然是正态分布”,定理得证。第32页,共93页,
10、编辑于2022年,星期六(2)正态总体样本均值及分布2.4 抽样分布定理与总体X的期望和方差2相比较,样本均值统计量的期望仍为,而方差却减小到2/n第33页,共93页,编辑于2022年,星期六(3)正态总体样本方差及分布2.4 抽样分布定理定理二:设X1,X2,Xn是正态总体N(,2)的样本,则对样本均值及方差有下述结论:(a)与S2独立(b)其中:定理二的证明详见教材P172的附录第34页,共93页,编辑于2022年,星期六(3)正态总体样本方差及分布2.4 抽样分布定理示例第35页,共93页,编辑于2022年,星期六(4)正态总体近似标准化样本均值及分布样本均值减去它的期望再除以它的标准误
11、称作样本均值的近似标准化变换定理三:设X1,X2,Xn是总体XN(,2)的样本,和S2分别是样本均值和样本方差,则2.4 抽样分布定理Standard Error第36页,共93页,编辑于2022年,星期六(4)正态总体近似标准化样本均值及分布2.4 抽样分布定理定理三的推证:第37页,共93页,编辑于2022年,星期六(4)正态总体近似标准化样本均值及分布2.4 抽样分布定理示例第38页,共93页,编辑于2022年,星期六(5)正态总体两独立样本均值差及分布定理四:设X1,X2,Xn1是总体XN(1,12)的样本;设Y1,Y2,Yn2是总体YN(2,22)的样本;两样本相互独立且有下述统计量
12、:2.4 抽样分布定理第39页,共93页,编辑于2022年,星期六则当12=22时,近似标准化样本均值差是T统计量,且服从自由度为n1+n2-2的t分布:其中复合方差(5)正态总体两独立样本均值差及分布2.4 抽样分布定理第40页,共93页,编辑于2022年,星期六(5)正态总体两独立样本均值差及分布2.4 抽样分布定理定理四的推证:引用任意样本均值的期望为方差为2/n;再引用教材第3章第5节例1结论“正态随机变量之和仍然是正态分布”,则:第41页,共93页,编辑于2022年,星期六因均值差为正态统计量,则它的标准化变换为Z统计量且服从N(0,1)分布:(5)正态总体两独立样本均值差及分布2.
13、4 抽样分布定理第42页,共93页,编辑于2022年,星期六依据卡方分布可加性可将两样本方差组合成2统计量并服从自由度n1+n2-2的2分布:根据t分布定义构建T统计量并得其分布:(5)正态总体两独立样本均值差及分布2.4 抽样分布定理第43页,共93页,编辑于2022年,星期六(5)正态总体两独立样本均值差及分布2.4 抽样分布定理展开T统计量并化简,得T统计量表达式:第44页,共93页,编辑于2022年,星期六(5)正态总体两独立样本均值差及分布2.4 抽样分布定理展开T统计量并化简,得T统计量表达式:其中:第45页,共93页,编辑于2022年,星期六(5)正态总体两独立样本均值差及分布2
14、.4 抽样分布定理示例第46页,共93页,编辑于2022年,星期六(6)正态总体两独立样本方差比及分布2.4 抽样分布定理定理五:设X1,X2,Xn1是总体XN(1,12)的样本;设Y1,Y2,Yn2是总体YN(2,22)的样本;两样本相互独立且有下述统计量:第47页,共93页,编辑于2022年,星期六则下面样本方差比除以总体方差比为F统计量,并服从F(n1-1,n2-1)分布:特别地当12=22=2时,样本方差比服从F(n1-1,n2-1)(6)正态总体两独立样本方差比及分布2.4 抽样分布定理第48页,共93页,编辑于2022年,星期六(6)正态总体两独立样本方差比及分布2.4 抽样分布定
15、理第49页,共93页,编辑于2022年,星期六(6)正态总体两独立样本方差比及分布2.4 抽样分布定理示例第50页,共93页,编辑于2022年,星期六2.5 中心极限定理Central Limit Theorem2 抽样分布第51页,共93页,编辑于2022年,星期六2.5 中心极限定理2.5.1独立同分布中心极限定理 Central Limit Theorem第52页,共93页,编辑于2022年,星期六2.5.1 独立同分布中心极限定理问题的提出案例案例:一批钢产品的强度服从期望为14、方差为4的未知分布,每箱容量为100件该产品,问:(1)每箱产品的平均强度超过14.5的概率有多少?(2)
16、每箱产品的平均强度超过期望14的概率有多少?问题分析问题分析:钢产品是随机装箱,若随意检验一箱产品的平均强度,则每箱产品可视为一个容量n=100的样本。抽样总体的分布不知道,怎样才能计算问题所述事件的概率?第53页,共93页,编辑于2022年,星期六问题的提出 独立同分布中心极限定理能解决独立同分布中心极限定理能解决这样一类问题:未知总体抽样,如何这样一类问题:未知总体抽样,如何计算抽样观测事件的概率?计算抽样观测事件的概率?2.5.1 独立同分布中心极限定理第54页,共93页,编辑于2022年,星期六(1)样本和样本和与标准化样本和标准化样本和设X1,X2,Xn是任意总体X的一个样本,每个样
17、本分量的期望E(Xi)=和方差Var(Xi)=2,则样样本和本和的期望和方差如下:2.5.1 独立同分布中心极限定理第55页,共93页,编辑于2022年,星期六独立同分布样本的标准化样本和标准化样本和及其观察值观察值如下:(1)样本和样本和与标准化样本和标准化样本和2.5.1 独立同分布中心极限定理第56页,共93页,编辑于2022年,星期六中心极限定理:n趋于无穷大时,独立同分布样本X1,X2,Xn的标准化样本和标准化样本和趋于标准正态分布N(0,1),且其分布函数极限为:(2)样本和样本和中心极限定理2.5.1 独立同分布中心极限定理第57页,共93页,编辑于2022年,星期六应用:只要n
18、充分大,对于独立同分布样本X1,X2,Xn,样本和样本和分布函数值可由标准正态分布函数近似计算:(2)样本和样本和中心极限定理2.5.1 独立同分布中心极限定理第58页,共93页,编辑于2022年,星期六(3)样本均值样本均值与标准化样本均值标准化样本均值设X1,X2,Xn是任意总体X的一个样本,每个样本分量的期望E(Xi)=和方差Var(Xi)=2,则样样本均值本均值的期望和方差如下:2.5.1 独立同分布中心极限定理第59页,共93页,编辑于2022年,星期六独立同分布样本的标准化样本标准化样本均值均值及其观察值观察值如下:(3)样本均值样本均值与标准化样本均值标准化样本均值2.5.1 独
19、立同分布中心极限定理第60页,共93页,编辑于2022年,星期六(4)样本均值样本均值中心极限定理2.5.1 独立同分布中心极限定理中心极限定理:n趋于无穷大时,独立同分布样本X1,X2,Xn的标准化样本均值标准化样本均值趋于标准正态分布N(0,1),且其分布函数极限为:第61页,共93页,编辑于2022年,星期六(4)样本均值样本均值中心极限定理2.5.1 独立同分布中心极限定理应用:只要n充分大,对于独立同分布样本X1,X2,Xn,样本均值样本均值分布函数值可由标准正态分布函数近似计算:第62页,共93页,编辑于2022年,星期六独立同分布中心极限定理要义:任意已知或未知总体的期望和方差存
20、在;简单随机抽样获得独立同分布样本;标准化样本和标准化样本和或标准化样本均值标准化样本均值的分布,在n趋于无限大时趋于标准正态分布N(0,1);只要n充分大,不论样本和样本和或样本均值样本均值原来服从什么分布,它们的分布函数值都可用标准正态分布函数近似计算。(5)独立同分布中心极限定理小结2.5.1 独立同分布中心极限定理第63页,共93页,编辑于2022年,星期六(6)中心极限定理应用举例例题例题:一批钢产品的强度服从期望为14、方差为4的未知分布,每箱容量为100件该产品,问:(1)每箱产品的平均强度超过14.5的概率有多少?(2)每箱产品的平均强度超过期望14的概率有多少?问题分析问题分
21、析:产品是随机装箱,故每箱产品视为一个样本,样本容量n=100则n足够大,故用中心极限定理求解。用Xi表每个产品的强度,用Y表每箱平均强度的标准化变换。2.5.1 独立同分布中心极限定理第64页,共93页,编辑于2022年,星期六(6)中心极限定理应用举例问题(1)可表为下述事件的概率:2.5.1 独立同分布中心极限定理第65页,共93页,编辑于2022年,星期六(6)中心极限定理应用举例问题(2)可表为下述事件的概率:2.5.1 独立同分布中心极限定理第66页,共93页,编辑于2022年,星期六分析结论:(1)每箱产品的平均强度超过14.5的概率为0.0062。(2)每箱产品的平均强度超过期
22、望14的概率为0.5。(6)中心极限定理应用举例2.5.1 独立同分布中心极限定理第67页,共93页,编辑于2022年,星期六2.5.2隶莫佛拉普拉斯 中心极限定理 Central Limit Theorem2.5 中心极限定理第68页,共93页,编辑于2022年,星期六问题的提出2.5.2 隶莫佛拉普拉斯中心极限定理案例案例:某公司200名员工参加一种资格证书考试,按往年经验考试通过率为0.8,试计算200名员工中至少150人通过考试的概率。问题分析问题分析:考试结果用X表示,事件X=1表通过考试,事件X=0表未通过考试,则X服从0-1分布,200名员工参加考试视作对0-1总体抽样200次。
23、若用二项分布计算问题所述事件的概率较麻烦,可根据中心极限定理采用更简便的近似算法。第69页,共93页,编辑于2022年,星期六问题的提出 隶莫佛拉普拉斯中心极限定理隶莫佛拉普拉斯中心极限定理能解决这样一类问题:能解决这样一类问题:0-1总体抽样,总体抽样,如何近似计算抽样观测事件的概率?如何近似计算抽样观测事件的概率?2.5.2 隶莫佛拉普拉斯中心极限定理第70页,共93页,编辑于2022年,星期六(1)0-1总体抽样的样本和样本和设X1,X2,Xn为0-1总体X的一个样本,每个分量的期望E(Xi)=p和方差Var(Xi)=p(1-p),则样本样本和和并它的期望及方差如下:2.5.2 隶莫佛拉
24、普拉斯中心极限定理第71页,共93页,编辑于2022年,星期六设X1,X2,Xn为0-1总体X的一个样本,每个分量的期望E(Xi)=p和方差Var(Xi)=p(1-p),则标准标准化样本和化样本和Y及其观察值观察值y如下:(1)0-1总体抽样的样本和样本和2.5.2 隶莫佛拉普拉斯中心极限定理第72页,共93页,编辑于2022年,星期六中心极限定理:n趋于无穷大时,0-1总体独立同分布样本X1,X2,Xn的标准化样本和标准化样本和趋于标准正态分布N(0,1),其分布函数的极限为:(2)样本和样本和中心极限定理2.5.2 隶莫佛拉普拉斯中心极限定理第73页,共93页,编辑于2022年,星期六应用
25、:只要n充分大,对于0-1总体抽样独立同分布样本X1,X2,Xn的样本和样本和,其分布函数值可由标准正态分布函数近似计算:(2)样本和样本和中心极限定理2.5.2 隶莫佛拉普拉斯中心极限定理第74页,共93页,编辑于2022年,星期六(3)0-1总体抽样的样本均值样本均值设X1,X2,Xn为0-1总体X的一个样本,每个分量的期望E(Xi)=p和方差Var(Xi)=p(1-p),则样本均值样本均值并它的期望及方差如下:2.5.2 隶莫佛拉普拉斯中心极限定理第75页,共93页,编辑于2022年,星期六(4)样本均值样本均值中心极限定理设X1,X2,Xn为0-1总体X的一个样本,每个分量的期望E(X
26、i)=p和方差Var(Xi)=p(1-p),则标准标准化样本均值化样本均值Y及其观察值观察值y如下:2.5.2 隶莫佛拉普拉斯中心极限定理第76页,共93页,编辑于2022年,星期六(4)样本均值样本均值中心极限定理中心极限定理:n趋于无穷大时,0-1总体独立同分布样本X1,X2,Xn的标准化样本均值标准化样本均值趋于标准正态分布N(0,1),其分布函数的极限为 2.5.2 隶莫佛拉普拉斯中心极限定理第77页,共93页,编辑于2022年,星期六(4)样本均值样本均值中心极限定理2.5.2 隶莫佛拉普拉斯中心极限定理应用:只要n充分大,对于0-1总体抽样独立同分布样本X1,X2,Xn的样本均值样
27、本均值,其分布函数值可由标准正态分布函数近似计算:第78页,共93页,编辑于2022年,星期六(5)中心极限定理小结隶莫佛拉普拉斯中心极限定理要义:0-1分布抽样总体有期望p和方差p(1-p);简单随机抽样获得独立同分布样本;n趋于无限大时,标准化样本和标准化样本和或标准化样本标准化样本均值均值的分布趋于标准正态分布N(0,1);只要n充分大,不论样本和样本和或样本均值样本均值原来服从什么分布,它们的分布函数值都可用标准正态分布函数近似计算。2.5.2 隶莫佛拉普拉斯中心极限定理第79页,共93页,编辑于2022年,星期六(6)中心极限定理应用举例例题例题:某公司200名员工参加一种资格证书考
28、试,按往年经验考试通过率为0.8,试计算200名员工中至少150人通过考试的概率。问题分析问题分析:考试是否通过可视作对0-1总体X抽样,事件X=1表通过考试,事件X=0表未通过考试。200名员工参加考试视作对0-1总体抽样200次,往年累计参加考试的人数肯定很多,按大数定律用频率代替概率,估计今年每个人通过考试的概率p=0.8。2.5.2 隶莫佛拉普拉斯中心极限定理第80页,共93页,编辑于2022年,星期六(6)中心极限定理应用举例考试通过人数是随机变量,等于0-1总体抽样200次的样本和TS:200名员工中至少150人通过考试的概率可表为下面事件的概率:2.5.2 隶莫佛拉普拉斯中心极限
29、定理第81页,共93页,编辑于2022年,星期六(6)中心极限定理应用举例样本和的期望和方差如下:2.5.2 隶莫佛拉普拉斯中心极限定理第82页,共93页,编辑于2022年,星期六(6)中心极限定理应用举例200名员工中至少150人通过考试的概率:2.5.2 隶莫佛拉普拉斯中心极限定理第83页,共93页,编辑于2022年,星期六 公司200名员工中至少150人通过考试的概率为0.9616。结论:(6)中心极限定理应用举例2.5.2 隶莫佛拉普拉斯中心极限定理第84页,共93页,编辑于2022年,星期六2.5.3中心极限定理小结 Summary2.5 中心极限定理第85页,共93页,编辑于202
30、2年,星期六2.5.3 中心极限定理小结(1)任意总体样本和样本和的分布函数样本和样本和分布函数的近似计算:第86页,共93页,编辑于2022年,星期六(2)任意总体样本均值样本均值的分布函数样本均值样本均值分布函数的近似计算:2.5.3 中心极限定理小结第87页,共93页,编辑于2022年,星期六(3)0-1总体样本和样本和的分布函数样本和样本和分布函数的近似计算:2.5.3 中心极限定理小结第88页,共93页,编辑于2022年,星期六(4)0-1总体样本均值样本均值的分布函数样本均值样本均值分布函数的近似计算:2.5.3 中心极限定理小结第89页,共93页,编辑于2022年,星期六(5)用
31、中心极限定理解决问题的步骤为指定的数值步骤步骤1:设总体为X及样本为X1,X2,Xn步骤步骤2:问题涉及的事件,表述为关于样本和样本和 或样本均值样本均值的事件步骤步骤3:求样本和样本和或样本均值样本均值的期望和方差2.5.3 中心极限定理小结第90页,共93页,编辑于2022年,星期六(5)用中心极限定理解决问题的步骤步骤步骤4:问题归结为求样本和样本和或样本均值样本均值事件 的概率为指定的数值2.5.3 中心极限定理小结第91页,共93页,编辑于2022年,星期六(5)用中心极限定理解决问题的步骤步骤步骤4:问题归结为求样本和样本和或样本均值样本均值事件 的概率为指定的数值2.5.3 中心极限定理小结第92页,共93页,编辑于2022年,星期六结束结束2 抽样分布第93页,共93页,编辑于2022年,星期六