《第五章-正态分布、常用统计分布和极限定理课件.ppt》由会员分享,可在线阅读,更多相关《第五章-正态分布、常用统计分布和极限定理课件.ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章第五章第五章第五章 正态分布、常用统计分布和极限定理正态分布、常用统计分布和极限定理正态分布、常用统计分布和极限定理正态分布、常用统计分布和极限定理常见的连续型随机变量的概率分布常见的连续型随机变量的概率分布t-分布分布连续型随机变连续型随机变量的概率分布量的概率分布2 2分布分布正态分布正态分布F-分布分布正正 态态 分分 布布正态分布的重要性正态分布的重要性1.由C.F.高斯(Carl Friedrich Gauss,17771855)作为描述误差相对频数分布的模型而提出2.描述连续型随机变量的最重要的分布3.可用于近似离散型随机变量的分布例如:二项分布4.统计推断的基础x x(x
2、x)概率密度函数概率密度函数(x)=随机变量 的密度函数 =方差 =均值=3.14159;e=2.71828x=随机变量的取值(-x )正态分布函数的性质正态分布函数的性质1.图形是关于x=对称的钟形曲线,且峰值在x=处,也是分布的中位数和众数2.正态分布是一个分布族,每一特定正态分布通过均值的标准差来确定。决定正态分布曲线的位置,决定曲线的平缓程度,即胖瘦。3.当X的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交4.正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1 和和 对对正态曲线的影响正态曲线的影响xf(x)CA
3、B =1/2=1/2 1 1 2 2=1 =1 正态分布的概率正态分布的概率概率是曲线下的概率是曲线下的面积面积!a ab bx x(x(x)正态分布曲线下面的面积正态分布曲线下面的面积变量取值在区间变量取值在区间-,+之间的概率:之间的概率:变量取值在区间变量取值在区间-2,+2 之间的概率:之间的概率:变量取值在区间变量取值在区间-3,+3 之间的概率之间的概率:+x x(x(x)68.27%95.45%99.73%-+2 2 2 2+3 3 3 3-2 2 2 2-3 3 3 3标准正态分布的重要性标准正态分布的重要性1.一般的正态分布取决于均值和标准差 2.计算概率时,每一个正态分布都
4、需要有自己的正态概率分布表,这种表格是无穷多的3.若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表4.Z分数(标准正态变量)标准正态分布标准正态分布1.标准正态分布的概率密度函数3.随机变量具有均值为0,标准差为1的正态分布2.标准正态分布的分布函数一般正态分布的表示一般正态分布的表示一般正态分布的表示一般正态分布的表示标准正态分布的表示标准正态分布的表示标准正态分布的表示标准正态分布的表示标准正态分布标准正态分布x 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布2 2 2 11Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布
5、 x 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布1 1 1标准化的例子标准化的例子 P P(5 X X 6.2)X=5=10一般正态分布一般正态分布一般正态分布6.2 =1=1Z Z标准正态分布标准正态分布标准正态分布 0 0 0.120.12.0478.0478.0478标准正态分布曲线下面的面积标准正态分布曲线下面的面积变量取值在区间变量取值在区间-1,+1 之间的概率:之间的概率:变量取值在区间变量取值在区间-2,+2 之间的概率:之间的概率:变量取值在区间变量取值在区间-3,+3 之间的概率:之间的概率:0 0 0 0+1+1+1+1Z Z(x(x)68.
6、27%95.45%99.73%-1-1-1-1+2+2+2+2+3+3+3+3-2-2-2-2-3-3-3-3标准正态分布与一般正态分布标准正态分布与一般正态分布+x x(x(x)68.27%95.45%99.73%-+2+2+2+2+3+3+3+3-2-2-2-2-3 3 3 30 0 0 0+1+1+1+1Z Z(x(x)68.27%95.45%99.73%-1-1-1-1+2+2+2+2+3+3+3+3-2-2-2-2-3-3-3-3标准正态分布表的使用标准正态分布表的使用1.将一个一般的转换为标准正态分布2.计算概率时,查标准正态概率分布表3.对于负的 x,可由(-x)x得到4.对于标
7、准正态分布,即N(0,1),有P(a b)b aP(|a)2 a 15.对于一般正态分布,即N(,),有标准化的例子标准化的例子P P(2.9(2.9 7.1)7.1)一般正态分布一般正态分布一般正态分布一般正态分布.1664.1664.1664.0832.0832.0832.0832标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布正态分布正态分布(实例)(实例)【例例例例】设N(0,1),求以下概率:(1)P(2);(3)P(-1 3);(4)P(|2)解解解解:(1)P(2)=1-P(2)=1-0.9973=0.0227 (3)P(-1 3)=P(3)-P(-1)=
8、(3)-(-1)=(3)1-(1)=0.9987-(1-0.8413)=0.8354 (4)P(|2)=P(-2|2)=(2)-(-2)=(2)-1-(2)=2(2)-1=0.9545正态分布正态分布(实例)(实例)【例例例例】设N(5,32),求以下概率 (1)P(10);(2)P(2 =30)时,样本均值的抽样分布近似服从均值为,方差为2/n的正态分布一个任意分布的总体x x中心极限定理中心极限定理 (central limit theorem)x x 的的分分布布趋趋于于正正态态分布的过程分布的过程抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布正态分布正态分布非正态分布
9、非正态分布大样本大样本小样本小样本样本均值样本均值正态分布正态分布样本均值正态分布样本均值样本均值非正态分布非正态分布 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布Xn n=16=16当总体服从正态分布N (,2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X 的数学期望为,方差为2/n。即XN(,2/n)T 统计量的分布统计量的分布 设X1,X2,Xn是来自正态总体N(,2)的一个样本,那么为统计量,它服从自由度为(n-1)的t 分布X Xt 分布与正态分布的比较分
10、布与正态分布的比较t-分布分布正态正态 分布分布t t不同自由度的不同自由度的t分布分布标准正态分布标准正态分布t(df=13)t(df=5)Z Z统计量的标准误统计量的标准误 (standard error)1.1.样样本本统统计计量量的的抽抽样样分分布布的的标标准准差差,称称为为统统计计量量的的标标准准误误,也也称称为为标标准准误差误差2.2.标标准准误误衡衡量量的的是是统统计计量量的的离离散散程程度度,在在参参数数估估计计和和假假设设检检验验中中,它它是是用于衡量样本统计量与总体参数之间差距的一个重要尺度。用于衡量样本统计量与总体参数之间差距的一个重要尺度。3.3.以以样样本本均均值值的
11、的抽抽样样分分布布为为例例,在在重重复复抽抽样样条条件件下下,样样本本均均值值的的标标准准误误为为 它它反反映映的的是是统统计计量量 围围绕绕 的的分分散散程程度度或或者者说说反反映映了了抽抽样样均均值值 与与 的的平均误差水平。平均误差水平。4.4.标标准准误误表表示示的的是是抽抽样样的的误误差差。因因为为从从一一个个总总体体中中可可以以抽抽取取出出无无数数多多种种样样本本,每每一一个个样样本本的的数数据据都都是是对对总总体体的的数数据据的的估估计计。标标准准误误代代表表的的就就是是当当前前的的样样本本对对总总体体数数据据的的估估计计,标标准准误误代代表表的的就就是是样样本本均均数数与与总总
12、体体均均数数的的相相对对误误差差。标标准准误误更更大大的的是是受受到到样样本本容容量量的的影影响响。样样本本容容量量越越大大,标标准准误误越越小小,那那么么抽抽样样误误差差就就越越小小,就就表表明明所所抽抽取取的的样样本本能能够够较较好好地地代表总体。代表总体。估计的标准误估计的标准误 (standard error of estimation)1.当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误差,由于在实际应用中,总体的总是未知的,所计算的标准误差实际上都是估计标准误差,因此估计标准误差就简称为标准误差。2.以样本均值的抽样分布为例,当总体标准差未知时,可
13、用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为例例1,随机抽取某大学的学生,随机抽取某大学的学生100名,平均体重名,平均体重v根根据据过过去去材材料料知知道道大大学学生生体体重重的的标标准准差为差为10kg,求抽样误差为多少?,求抽样误差为多少?v 解:已知解:已知n=100 30 =10。vv 例例例例2 2,某某某某学学学学院院院院10001000名名名名学学学学生生生生,其其其其平平平平均均均均身身身身高高高高是是是是168cm168cm,标标标标准准准准差差差差为为为为22.5cm22.5cm,现现现现从从从从学学学学生生生生中中中中随随随随机机机机抽抽抽抽10010
14、0名名名名,求求求求其其其其样样样样本本本本平平平平均均均均数数数数大大大大于于于于1.70m1.70m的概率的概率的概率的概率解解=168cm =168cm =22.5 ,n=100 =22.5 ,n=100 X=170cmX=170cmv v v v v p(xp(x170)=170)=v =v答:样本平均数大于答:样本平均数大于1.70m 1.70m 的概率为的概率为18.41%18.41%思考题和练习题思考题和练习题v一、思考题v1.正态分布有哪些特点?什么是标准正态分布?v2.解释中心极限定理的含义?v3.解释样本统计量的概率分布(抽样分布)v4.什么是统计量的标准误差?它有什么用途?二、练习题v1.已知随机变量满足正态分布N ,求P(61)=?和Pv2.已知Z满足标准正态分布N(0,1),求以下各a值情况下,P =a中的 值。(1)当a=0.1(2)当a=0.05(3)当a=0.01