《几种重要的分布.ppt》由会员分享,可在线阅读,更多相关《几种重要的分布.ppt(83页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、几种重要的分布几种重要的分布在第一章介绍过独立试验概型在第一章介绍过独立试验概型作作n次相互独立的试验次相互独立的试验,每次试验事件每次试验事件A出现出现的概率为的概率为p,不出现的概率为不出现的概率为q=1-p,n次试验次试验中事件中事件A出现的次数出现的次数x x为一离散型随机变量为一离散型随机变量,如假设第如假设第i次试验时事件次试验时事件A发生的次数为随发生的次数为随机变量机变量x xi,则则x xi服从服从0-1分布分布,Px xi=1=p,Px xi=0=q=1-p,(i=1,2,.,n)因此有因此有x x=x x1+x x2+.+x xn2 二项分布二项分布定义定义 4.1 如果
2、随机变量x有概率函数其中其中0p1,q=1-p,则称则称x x服从参数为服从参数为n,p的二项的二项分布分布.简记作简记作x xB(n,p).在这里在这里Px x=k的值恰好是二项式的值恰好是二项式(q+px)n展开式展开式中第中第k+1项项xk的系数的系数.如果如果x xB(n,p),则则x x可看作是由可看作是由n个取个取1概率为概率为p的相互独立的的相互独立的0-1分布的随机变量分布的随机变量x xi,i=1,2,.,n的的和和,x x=x x1+x x2+.+x xn3x的分布函数为4例1 某工厂每天用水量保持正常的概率为3/4,求最近6天内用水量正常的天数的分布.解 设最近6天内用水
3、量保持正常的天数为x,则xB(6,0.75),因此5其分布表如下表所示x0123456P0.0002 0.0044 0.033 0.1318 0.2966 0.3560.178分布图:6例2 10部机器各自独立工作,因修理调整的原因,每部机器停车的概率为0.2.求同时停车数目x的分布.解 xB(10,0.2),用贝努里公式计算pk如下表所示x012345678910P0.110.270.30.20.090.030.010.00.00.00.07概率分布图如下图所示8 二项分布的最可能值二项分布的最可能值使概率使概率Px x=k取最大值的取最大值的k0称为二项分布的最称为二项分布的最可能值可能值
4、,如图示意如图示意由上图可知P(x=k0)P(x=k0+1)且P(x=k0)P(x=k01)k0k0+1 k0+2k01k02.910所以二项分布的最可能值所以二项分布的最可能值11例例3 一批产品的废品率一批产品的废品率p=0.03,进行进行20次重次重复抽样复抽样(每次抽一个每次抽一个,观察后放回去再抽下观察后放回去再抽下一个一个),求出现废品的频率为求出现废品的频率为0.1的概率的概率.解解 令令x x表示表示20次重复抽取中废品出现的次次重复抽取中废品出现的次数数,x xB(20,0.03)12二项分布的期望和方差如xB(n,p),则x可看作n个相互独立的0-1分布的随机变量x1,x2
5、,.,xn之和,x=x1+x2+.+xn而且我们知道0-1分布的期望为p,方差为pq,因此易得Ex=Ex1+Ex2+.+Exn=npDx=Dx1+Dx2+.+Dxn=npq即13一些例子如果是反复地掷硬币试验掷了100次,则xB(100,0.5),最可能值是1000.5+0.5=50+0.5=50如果xB(1000,0.3),则最可能值是10000.3+0.3=300在实际应用中,np+p正好是整数的情况几乎不存在.14例4 某批产品有80%的一等品,对它们进行重复抽样检验,共取出4个样品,求其中一等品数x的最可能值k0,并用贝努里公式验证.解 xB(4,0.8),因np+p=40.8+0.8
6、=4是整数,所以k0=4和k0=3时Px=k为最大,即3和4为最可能值.x01234P0.00160.02560.15360.40960.409615一般说来,在n很大时,不等式16 超几何分布超几何分布例例1.某班有学生某班有学生23名名,其中有其中有5名女同学名女同学,今从班上任选今从班上任选4名学生去参观展览名学生去参观展览,被选到被选到的女同学数的女同学数x x是一个随机变量是一个随机变量,求求x x的分布的分布.解:解:x x可取可取0,1,2,3,4,5这这5个值个值,相应概率为相应概率为17概率分布表为x01234P0.2817 0.4696 0.2167 0.0310 0.03
7、10概率分布图为:18定义:设N个元素分为两类,有N1个元素属于第一类,N2个元素属于第二类(N1+N2=N).从中按不重复抽样取n个,令x表示这n个中第一(或二)类元素的个数,则x的分布称为超几何分布.其概率函数为:19根据概率分布的性质,必有20和二项分布相比,二项分布是放回抽样,而超几何分布是不放回抽样.当在不放回抽样时,超几何分布中的N1/N相当于二项分布中的参数p,N2/N相当于二项分布中的q=1p.超几何分布也可以和二项分布一样看作是n个0-1分布的随机变量xi的和,i=1,2,.,n,xi表示第i次抽样抽到第一类元素的事件的次数,根据抽签原理P(xi=1)=N1/N,但如果ij,
8、xi与xj相互之间是不独立的.21计算超几何分布的数学期望因为x可看作n个相互并不独立但仍然服从同样的0-1分布的随机变量x1,x2,.,xn的和,x=x1+x2+.+xn,其中可以认为超几何分布的数学期望与二项分布的一样22计算x的方差因xi服从0-1分布,则xi2也服从同样的0-1分布,则Exi2=N1/N,当ij时,xixj也服从0-1分布,23因此24 也可以直接用定义来计算Ex和Dx25 计算Dx必须要先计算Ex(x1)26 因此27 在实际应用中元素的个数N是相当大的,例如,从中国人民中任抽几千个人观察,从一个工厂的几十万件产品中任抽几千件观察,等等.而在N非常大的情况下,放回抽样
9、和不放回抽样的结果几乎是相同的.因此有,当N很大的时候,超几何分布可用二项分布来近似.或者换句话说,当N趋于无穷时,超几何分布的极限是二项分布.28 为证明这一点,首先给出一个近似公式29因此,如果x服从超几何分布,则当抽样数n保持不变且远小于样本数N即也小于N1和N2时这正是二项分布的概率函数表达式当N趋于无穷时,上面的约等于就成为等于30例3 一大批种子的发芽率为90%,今从中任取10粒,求播种后,(1)恰有8粒发芽的概率;(2)不少于8粒发芽的概率.解 设10粒种子中发芽的数目为x.因10粒种子是由一大批种子中抽取的,这是一个N很大,n相对于N很小的情况下的超几何分布问题,可用二项分布近
10、似计算.其中n=10,p=90%,q=10%,k=831 第第14次课次课:重要分布重要分布普哇松分布普哇松分布指数分布指数分布-分布分布熟记其数字特征熟记其数字特征用普哇松分布对二项分布进行近似计算,用普哇松分布对二项分布进行近似计算,完成课后作业习题四(完成课后作业习题四(14-18)。)。32 普哇松普哇松(Poisson)分布分布 普哇松分布常见于所谓稠密性的问题中普哇松分布常见于所谓稠密性的问题中,如一如一段时间内段时间内,电话用户对电话台的呼唤次数电话用户对电话台的呼唤次数,候车候车的旅客数的旅客数,原子放射粒子数原子放射粒子数,织机上断头的次数织机上断头的次数,以及零件铸造表面上
11、一定大小的面积内砂眼的以及零件铸造表面上一定大小的面积内砂眼的个数等等个数等等.33普哇松分布的数学期望34普哇松分布的方差35 通常在通常在n比较大比较大,p很小时很小时,用普哇松用普哇松分布近似代替二项分布的公式分布近似代替二项分布的公式,其中其中l l=np.普哇松分布的方便之处在于有现成的分普哇松分布的方便之处在于有现成的分布表可查布表可查(见附表见附表1)例例1 x x服从普哇松分布服从普哇松分布,Ex x=5,查表求查表求P(x x=2),P(x x=5),P(x x=20)解解 因普哇松分布的参数因普哇松分布的参数l l就是它的期望值就是它的期望值,故故l l=5,查书后附表一查
12、书后附表一,有有P5(2)=0.084224,P5(5)=0.175467,P5(20)=036例例2 一大批产品的废品率为一大批产品的废品率为p=0.015,求任取一箱求任取一箱(有有100个产品个产品),求箱中恰有一个废品的概率求箱中恰有一个废品的概率.解:解:所取一箱中的废品个数所取一箱中的废品个数x x服从超几何分布服从超几何分布,由于产品数量由于产品数量N很大很大,可按二项分布公式计算可按二项分布公式计算,其其中中n=100,p=0.015.但由于但由于n较大而较大而p很小很小,可用普哇松分布公式近似可用普哇松分布公式近似代替二项分布公式计算代替二项分布公式计算.其中其中l l=np
13、=1.5,查表得查表得:P1.5(1)=0.334695误差不超过误差不超过1%.37例3 检查了100个零件上的疵点数,结果如下表:疵点数0123456频数14272620733试用普哇松分布公式计算疵点数的分布,并与实际检查结果比较.解:38 计算出来的图表如下所示:疵点数0123456频数14272620733频率0.140.270.260.20 0.070.030.03概率0.135 0.271 0.271 0.18 0.09 0.036 0.0139 指数分布指数分布定义定义 如随机变量如随机变量x x的概率密度为的概率密度为xj(x)40 指数分布的分布函数41对任何实数a,b(0
14、a1000)=1P(x1000)=1F(1000)=e1各元件寿命相互独立,因此3个这样的元件使用1000小时都未损坏的概率为e3(约为0.05).43 G G-分布分布定义4.5 如果连续型随机变量x具有概率密度44 G-函数的一个重要性质是G(r+1)=rG(r),45 G-分布的数学期望46 G-分布的方差47当r=1时,这是指数分布,当r为正整数时,48当r=n/2(n是正整数),l=1/2时,这是具有n个自由度的2-分布(简记作2(n),它是数理统计中最重要的几个常用统计量的分布之一.如果xc2(n),则Ex=n,Dx=2n.49定理:如果定理:如果x x1,x x2,.,x xn相
15、互独立相互独立,且且x xiG G(l l,ri),(i=1,2,.,n),则则 x x1+x x2+.+x xnG G(l l,r1+r2+.+rn)推论推论(需要记住需要记住):如果:如果x x1,x x2,.,x xm相互独相互独立立,且且x xic c2 2(ni),(i=1,2,.,m),则则x x1+x x2+.+x xmc c2 2(n1+n2+.+nm)50第第15次课次课:重要分布重要分布 正态分布的实际背景和数学模型正态分布的实际背景和数学模型 正态分布的数字特征正态分布的数字特征 标准正态分布与正态分布的关系标准正态分布与正态分布的关系 正态分布与正态分布与-分布的关系。
16、分布的关系。完成课后作业习题四(完成课后作业习题四(20,22-28)51 引理:普阿松积分公式52 定义 如果连续型随机变量x的概率密度为其中s,m为常数,并且s0,则称x服从正态分布,简记作xN(m,s2).利用引理可以验证Ex=m,Dx=s2特别地,当m=0,s=1时,称其为标准正态分布,其概率密度记为j0(x),这时xN(0,1).53 验证Ex=m54 验证Dx=s255 j0(x)的图形xj0(x)01156j0(x)除一般概率密度的性质外,还有下列性质(1)j0(x)有各阶导数(2)j0(x)=j0(x),偶函数(3)在(,0)内严格上升,在(0,)严格下降.在x=0 处达到最大
17、值:(4)在x=1处有两个拐点;(5)x轴是j0(x)的水平渐近线57可用书后附表二查出j0(x)的各个值例1 xN(0,1),求j0(1.81),j0(1),j0(0.57),j0(6.4),j0(0).解 查书后附表二可得j0(1.81)=0.07754j0(1)=j0(1)=0.2420j0(0.57)=0.3391j0(6.4)=0j0(0)=0.398958一般正态分布与标准正态分布的关系定理4.2 如果xN(m,s2),hN(0,1),其概率密度分布记为j(x)和j0(x),分布函数分别记为F(x)及F0(x),则59证60定理 4.3 如果xN(m,s2),而h=(xm)/s,则
18、hN(0,1)证 为证明hN(0,1),只要证明h的概率密度为j0(x)或分布函数为F0(x)即可.Fh(x)=P(hx)=P(xm)/sx)=P(xsx+m)=F(sx+m)=F0(x)可以证明,服从正态分布的随机变量x,它的线性函数kx+b(k0)仍服从正态分布.61标准正态分布函数表如果xN(0,1),则对于大于零的实数x,F0(x)的值可以由附表三直接查到.而对于小于零的x则可通过对称性来求得.j0(x)0uF0(u)x62例2 xN(0,1),求P(x1.96),P(x1.96),P(|x|1.96),P(1x2),P(x5.9).解 P(x1.96)=0.975=F0(1.96)P
19、(x1.96)=P(x1.96)=1P(x1.96)=10.975=0.025=1F0(1.96)P(|x|1.96)=P(1.96x1.96)=F0(1.96)F0(1.96)=2F0(1.96)1=0.95P(1x2)=F0(2)F0(1)=F0(2)1F0(1)=0.81855P(x5.9)=F0(5.9)=163概括起来,如果xN(0,1),则64例3 xN(8,0.52),求P(|x8|1)及P(x10)解 因为xN(8,0.52),所以(x8)/0.5N(0,1)65例4 xN(m,s2),P(x5)=0.045,P(x3)=0.618,求m及s66 正态分布与G-分布的关系 定理
20、4.4 如xN(0,1),则x22(1)67推论推论:如果如果x x1,x x2,.,x xm相互独立相互独立,且且x xiN(0,1),(i=1,2,.,m),则则 x x12 2+x x22 2+.+x xm2 2c c2 2(m)事实上:推论推论(需要记住需要记住):如果:如果x x1,x x2,.,x xm相互独立相互独立,且且x xic c2 2(ni),(i=1,2,.,m),则则x x1+x x2+.+x xmc c2 2(n1+n2+.+nm)68定义 4.9 若连续型随机变量x的概率密度j(x)为69 1994年经济类研究生试题1x270711995年经济类研究生试题x111
21、7273 1997年经济类研究生试题74 1999年经济类研究生试题设随机变量X服从参数为l的泊松分布,且已知E(X1)(X2)=1,则l=_解 已知EX=DX=l,且EX2=(EX)2+DX=l2+l,而E(X1)(X2)=E(X23X+2)=EX23EX+2=1得l2+l3l+2=1,即l22l+1=0有l=175 1999年经济类研究生试题设随机变量Xij(i,j=1,2,.,n;n2)独立同分布,EXij=2,则行列式76解 因多个随机变量之和的数学期望是各个数学期望之和,而多个相互独立的随机变量之积的数学期望也是各个随机变量的数学期望之积,而行列式无非是各个随机变量相互乘积再相加得到的随机变量.因此有772000年经济类研究生考研题设随机变量X在区间1,2上服从均匀分布;随机变量12x78791998年经济类研究生试题设一次试验成功的概率为p,进行100次独立重复试验,当p=_时,成功次数的标准差的值最大,其最大值为_解 设成功次数为X,则XB(100,p),DX=100p(1p)=100p100p2,对p求导并令其为0,得100200p=0,得p=0.5时成功的标准差的值最大,其最大值为8029.xiN(0,1)(i=1,2,3),并且x1,x2,x3相互独立,81 因此82 30.(x,h)有联合概率密度83