《应用概率统计第二章.pptx》由会员分享,可在线阅读,更多相关《应用概率统计第二章.pptx(126页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第一节 随机变量第1页/共126页一、随机变量概念的产生 在实际问题中,随机试验的结果可以用数量来表示,由此就产生了随机变量的概念。(1)有些试验结果本身与数值有关(就是一个数)。例如:掷一颗骰子面上出现的点数;五月份北京的最高温度;每天进入上海站的旅客数;昆虫的产卵数;第2页/共126页(2)在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各种结果.也就是说,把试验结果数值化。例如:裁判员在运动场上不叫运动员的名字而叫号码,名字与号码之间建立了一种对应关系。第3页/共126页这种对应关系在数学上理解为定义了一种实值单值函数。e.X(e)R这种实值函数与在高等数学中大家
2、接触到的函数不一样!第4页/共126页(1)它随试验结果的不同而取不同的值,因而在试验之前只知道它可能取值的范围,而不能预先肯定它将取哪个值。(2)由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率。称这种定义在样本空间S上的实值单值函数X=X(e)为随量机变简记为 r.v.第5页/共126页 而表示随机变量所取的值时,一般采用小写字母 x,y,z,u,v,w 等。随机变量通常用大写字母X,Y,Z,U,V,W等表示第6页/共126页有了随机变量,随机试验中的各种事件,就可以通过随机变量的关系式表达出来。例如:单位时间内某电话交换台收到的呼叫次数用X表示
3、,它是一个随机变量。事件收到不少于1次呼叫没有收到呼叫 X 1X=0 二、引入随机变量概念的意义第7页/共126页随机变量非离散型随机变量离散型随机变量连续型随机变量混合型随机变量我们将研究两类随机变量:(1)离散型随机变量(2)连续型随机变量三、随机变量的分类第8页/共126页 对一均匀硬币抛一次,观察正反面情况。定义随机变量=样本空间例2.1第9页/共126页 测量某工厂一天生产灯泡的寿命。=样本空间定义随机变量例2.2可以考察 P100X150=?P1000X1500=?第10页/共126页 一报童卖报,每份0.15元,其成本为0.10元。报馆每天给报童1000份报,并规定他不得把卖不出
4、的报纸退回。设X为报童每天卖出的报纸份数,试将报童赔钱这一事件用随机变量的表达式表示。当 0.15 X1000 0.1时,报童赔钱 故 报童赔钱 X 666 解:分析报童赔钱 卖出的报纸钱不够成本例2.3第11页/共126页 第二节 离散型随机变 量及其分布第12页/共126页(2)取每个值的概率为:从中任取3 个球,取到的白球数X是一个随机变量。(1)X 可能取的值是0,1,2;看一个例子一、离散型随机变量分布律的定义定义2.1 若随机变量X的所有可能取值是有限多个或可列无限多个,这种随机变量称为离散型随机变量。第13页/共126页则称P(X=xk)=pk(k=1,2,)(公式法)为随机变量
5、X 的概率分布律,简称分布律。分布律可用概率分布表表示为:(列表法)定义2.2 设离散型随机变量X,其所有可能取值为x1,x2,xk,且取这些值的概率依次为p1,p2,pk,即P(X=xk)=pk,(k=1,2,)而且满足(1)P(X=xk)=pk0,(k=1,2,)(2)Xx1x2x3xkPp1p2p3pk第14页/共126页分布律也可用概率分布图表示:或写作:X第15页/共126页解 依据分布律的性质P(X=k)0,从中解得 a0,即设随机变量X的分布律为k=0,1,2,试确定常数a。例2.4第16页/共126页 某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数X的概率分布。解
6、X可取值为0,1,2;PX=0=(0.1)(0.1)=0.01 PX=1=2(0.9)(0.1)=0.18 PX=2=(0.9)(0.9)=0.81XX的分布律:例2.5第17页/共126页 一汽车沿一街道行驶,需要通过三个均设有红绿信号灯的路口,每个信号灯为红或绿与其它信号灯为红或绿相互独立,且红绿两种信号灯显示的时间相等。以X表示该汽车首次遇到红灯前已通过的路口的个数,求X的分布律。PX=0=P(A1)=1/2,解:依题意,X可取值0,1,2,3。Ai=第i个路口遇红灯,i=1,2,3设例2.6第18页/共126页 PX=2=P()=1/8X表示该汽车首次遇到红灯前已通过的路口的个数PX=
7、1=P()=1/4第19页/共126页=1/8同理,P(X=3)=P()即第20页/共126页解 X的所有可能取值为2,3,4,12,其分布律为 一骰子掷两次,用X表示所得点数之和,求X取可能值的概率。例2.7第21页/共126页(1)(01)分布如果随机变量X的分布律为则称X服从参数为p的(01)分布。即或(01)分布的分布律也可写成二、常用的离散型随机变量及其分布第22页/共126页注:服从(01)分布的随机变量很多,如果涉及的试验只有两个互斥的结果:,都可在样本空间上定义一个服从(01)分布的随机变量:第23页/共126页(2)二项分布)二项分布p伯努利(Bernoulli)模型 设随机
8、试验满足:1在相同条件下进行n次重复试验;2每次试验只有两种可能结果,A发生或A不发生;3在每次试验中,A发生的概率均一样,即P(A)=p;重复重复4各次试验是相互独立的,则称这种试验为贝努里概型或n重贝努里试验。计算公式为:在在n n重贝努里试验中,人们感兴趣的是事件重贝努里试验中,人们感兴趣的是事件A A发生的次数发生的次数第24页/共126页以随机变量X表示n次试验中A发生的次数,X可能取值为0,1,2,n。设每次试验中A发生的概率为p,A不发生的概率为1-p,(X=k)表示事件“n重贝努里试验中A出现k次”,即这里每一项表示k次试验中出现A,而另外n-k次试验中出现且每一项两两互不相容
9、,一共有Cnk项。由4独立性可知每一项的概率均为pk(1-p)1-k,因此第25页/共126页若随机变量X具有概率分布律 其中p+q=1,则称随机变量X服从以n,p为参数的二项分布,记为XB(n,p)(或称伯努利分布)。可以证明:特别地,当n=1时P(X=k)=pkq1-k(k=0,1)即为0-1分布。p 二项分布第26页/共126页 古典概型与伯努利概型不同,有何区别?请思考:伯努利概型对试验结果没有等可能的要求,但有下述要求:(1)每次试验条件相同;(2)每次试验只考虑两个互逆结果 且(3)各次试验相互独立。第27页/共126页 某人射击命中率为0.02,独立射击400次,试求至少击中2次
10、的概率?解 设X表示击中的次数,则所以分布律则所求概率例2.8第28页/共126页 不可忽视小概率事件;反过来看,如果一个人射击400次,击中竟不到两次,由于PX20,n是正整数,若npn=,则对任一固定的非负整数k,有 第31页/共126页(4)泊松分布设随机变量X所有可能取的值为0,1,2,且概率分布为:其中 0 是常数,则称 X 服从参数为 的泊松分布,记作X 。第32页/共126页 泊松定理表明,泊松分布是二项分布的极限分布,当n很大,p很小时,二项分布就可近似地看成是参数=np的泊松分布。第33页/共126页设商店在月底应进某种商品m件,求满足P X m 0.95 的最小的m。进货数
11、销售数解:设该商品每月销售数为X,X服从参数 =5的泊松分布。一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数 =5的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?PXm 0.05也即例2.10第34页/共126页查泊松分布表得于是得 m+1=10,m=9件。第35页/共126页所以分布律为解 由条件得:随机变量,已知求 的值,并写出X的分布律。例2.11第36页/共126页 某城市有1%色盲者,问从这个城市里选出多少人才能使里面至少有一位色盲患者的概率少于0.95?解 设选出n个人,n人中色盲患者为两边取对数所以得则例2
12、.12第37页/共126页 80台同类型设备,各台工作相互独立,发生故障的概率p=0.01,有两种配备维修工人的方法:4个人每人负责20台;3个人共同负责80台。问那种方案好?(比较发生故障而不能及时维修的概率)解:设X表示“第一个人维护的20台中同时发生故障的台数”,Ai表示“第i个人维护的20台中发生故障而不能及时维修”,i=1,2,3,4例2.13由题意可得 Xb(20,0.01)第38页/共126页4个人维护的80台中发生故障而不能及时维修的概率第一个人维护的20台中发生故障而不能及时维修的概率第39页/共126页 设Y表示“80台同时发生故障的台数”则3人维护的80台中发生故障而不能
13、及时维修的概率总之即第种方案的工作效率高。第40页/共126页 第三节 随机变量的 分布函数第41页/共126页p离散型随机变量,我们可用分布律来完整地描述。p对于非离散型随机变量,其取值不可能一个一个列举出来,而且取某个值的概率可能是零。p在测试灯泡的寿命时,可以认为寿命X的取值充满了区间0,+),事件X=x0表示灯泡的寿命正好是x0。p在实际中,即使测试数百万只灯泡的寿命,可能也不会有一只的寿命正好是x0,也就是说,事件(X=x0)发生的频率在零附近波动,认为P(X=x0)=0。p由于许多随机变量的概率分布情况不能以其取某个值的概率来表示,因此我们往往关心随机变量X取值落在某区间(a,b上
14、的概率(ab)。这就是我们下面要讨论的问题。第42页/共126页为X 的分布函数。设 X 是一个随机变量,x是任意实数,称函数定义2.4上的概率。分布函数F(x)的值就表示X 落在区间一、分布函数的概念一、分布函数的概念第43页/共126页对任意实数x1x2,用F(x)刻画随机点落在区间(x1,x2上的概率。则第44页/共126页 设一汽车在开往目的地的道路上需经过3盏信号灯。每盏信号灯以概率1/2允许汽车通过或禁止汽车通过。以X表示汽车首次停下时,它已通过的信号灯的盏数(各信号灯工作相互独立)。求X的分布律、分布函数以及概率解 设p为每盏信号灯禁止汽车通过的概率,则 P(X=k)=p(1-p
15、)k,k=0,1,2;P(X=3)=(1-p)3,故X的分布律为:X0123P1/21/41/81/8例2.14第45页/共126页X的分布函数:X0123P1/21/41/81/8所求概率为第46页/共126页第47页/共126页一般地,X是离散型随机变量,其概率分布律为P(X=xk)=pk,(k=1,2,)则X的分布函数F(x)为 F(x)的图像:非降,右连续,且在x1,x2,xk,处跳跃。第48页/共126页二二、分分 布布 函函 数数 的的 性性 质质 1.单调不减性:若x1x2,则F(x1)F(x2);2.归一 性:对任意实数x,0F(x)1,且 3.右连续性:对任意实数x,反之,具
16、有上述三个性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函数的充分必要性质。第49页/共126页 已知,求 A、B。解所以例2.15第50页/共126页试说明F(x)能否是某个r.v.的分布函数。设有函数 F(x)解:注意到函数 F(x)在 上下降,不满足性质(1),故F(x)不能是分布函数。不满足性质(2),可见F(x)也不能是r.v.的分布函数。或者例2.16第51页/共126页 已知已知 X 表示弹着点与靶心的距离,表示弹着点与靶心的距离,击中击中靶上任一同心圆盘上点的概率与该圆盘面积成正比;靶上任一同心圆盘上点的概率与该圆盘面积成正比;靶子半径是靶子半径是 2 米;米;每
17、次射击都中靶。求每次射击都中靶。求 X 的分布的分布函数函数 F(X)。解 因为例2.17当x0时,Xx不可能发生,F(x)=0。当0 x2时,F(x)=PX2时,F(x)=PXx=1此时称X为连续型随机变量。第53页/共126页对任意实数 x 有显然0第54页/共126页 第四节 连续型随机变 量及其分布第55页/共126页p测试灯泡的寿命,用X 表示灯泡的寿命;p测试上课迟到情况,用X 表示你到达教室的时间。特点:X 的取值充满一个区间a,b 或a,+)X 的取值无法一一列出;这类问题,人们关心的重点是什么?第56页/共126页比如,人们对产品的了解是,寿命不超过500小时的概率为0.71
18、,寿命在500到800小时之间的概率是0.22,在800到1000小时之间的概率为0.07。可画图示意,用矩形的面积表示相应的概率。o0.710.220.07500 800 1000O 200 400 600 800 1000为了更精确,无限细分下去,得到第57页/共126页f(x)x图中“曲边梯形”(阴影区域)的面积即为X 落在区间a,b上的概率。该曲线称为随机变量X 的分布密度曲线。曲线对应的函数称为随机变量X 的分布密度函数,记为f(x)。分布密度函数 f(x)完全描述了随机变量X 的规律。第58页/共126页定义2.5 X是随机变量,若存在非负可积函数f(x),(-x+),使对一切实数
19、a,b(ab),均有则称X为连续型随机变量,且称f(x)为随机变量X的概率密度函数,简称概率密度或密度函数。常记为X f(x),(-x 1000),所以p 不可能事件的概率为零,但概率为零的事件不一定是不可能事件。p 同样,必然事件的概率为1,但概率为1的事件不一定是必然事件。第62页/共126页 对于任意的数ab,有f(x)x连续型随机变量 X 落在某区间a,b上的概率=F(x)在该区间上的改变量=f(x)在该区间上的积分(与端点是否在内无关)第63页/共126页 概率密度f(x)在点x处连续,则有 f(x)在x0处连续,且h充分小时,有 f(x)称为概率密度的原由 第64页/共126页 要
20、注意的是,密度函数 f(x)在某点处a的高度,并不反映X取值的概率。但是,这个高度越大,则X取a附近的值的概率就越大。也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度。f(x)xoa第65页/共126页概率密度函数图形:称为山形函数第66页/共126页分布函数的图形第67页/共126页求下列函数是否为概率密度函数设连续性随机变量X的分布函数为试求X的密度函数。例2.18例2.19第68页/共126页解 设X 的分布函数为求例2.20第69页/共126页解:根据连续型随机变量的分布函数的积分表示得设随机变量X的概率密度函数为:求随机变量X的分布函数。例2.21第70页/共126页第7
21、1页/共126页分布函数离散型r.v的分布函数连续型r.v的分布函数分布函数的性质概率分布律与分布函数的关系概率密度与分布函数的关系第73页/共126页二二、几几种种常常用用的的连连续续型型随随机机变变量量1.均匀分布则称X在区间(a,b)上服从均匀分布,记作X U(a,b)若 r.v.X的概率密度为:若XUa,b,则X具有下述等可能性:X落在区间a,b中任意长度相同的子区间里的概率是相同的,即X落在子区间里的概率只依赖于子区间的长度,而与子区间的位置无关。第74页/共126页对任意实数c,d(acdb),l=d-c,都有X的分布函数 f(x),F(x)的图像分别为O a b xf(x)O a
22、 b xF(x)1第75页/共126页 公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等。均匀分布常见于下列情形:如在数值计算中,由于四舍五 入,小数点后某一位小数引入的误差;第76页/共126页解依题意,X U(0,30)以7:00为起点0,以分为单位 某公共汽车站从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30,7:45 等时刻有汽车到达此站,如果乘客到达此站时间 X 是7:00 到 7:30 之间的均匀随机变量,试求他候车时间少于5 分钟的概率.例2.22第77页/共126页 为使候车时间X少于 5 分钟,乘客必须在 7:10 到 7:15 之间,或
23、在7:25 到 7:30 之间到达车站。所求概率为:即乘客候车时间少于5 分钟的概率是1/3.从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30等时刻有汽车到达汽车站,第78页/共126页解因为当时,方程有实根,故所求概率为利用从而同理 设随机变量X 服从1,6上的均匀分布,求一元二次方程有实根的概率。练一练第79页/共126页指数分布。为常数,则称随机变量X服从参数为的其中2.指数分布若随机变量X 的概率密度为:概率密度的图形指数分布的分布函数为指数分布常用来描述元件的使用寿命,随机服务系统的服务时间等。第80页/共126页(2)已知该电子元件已使用了1.5年,求它还能使用两
24、 电子元件的寿命X(年)服从3的指数分布(1)求该电子元件寿命超过2年的概率。年的概率为多少?解例2.23第81页/共126页指数分布的特点是“无记忆性”,元件在使用t 时间后无损坏,用指数分布来计算,其寿命与新的时候相同。这与分布不同。以分布来描述使用寿命,则与使用时间有关。第82页/共126页 假设顾客在某银行窗口等待服务的时间(单位:分钟)X 服从指数为的指数分布。若等待时间超过10分钟,则他离开,假设他一个月内要来银行5次。以 Y表示一个月内他没有等到服务而离开窗口的次数,求Y的分布律及至少有一次没有等到服务的概率例2.24第83页/共126页现在 X 的概率密度为解Y是离散型,Yb(
25、5,p),其中Y的分布律为Y第84页/共126页正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。3.正态分布ABA,B间真实距离为,测量值为X。X的概率密度应该是什么形态?第85页/共126页p在大量重复试验中,得到一组数据,这组数据虽然有波动,但总是以某个常数为中心。偏离中心越近的数据越多;偏离中心越远的数据越少。取值呈“中间大、两头小”的格局,即取值具有对称性。此随机变量是一个服从正态分布的随机变量。p正态分布是概率论中最重要的分布:正态分布可以作为许多分布的近似分布。大量的随机现象都是服从或近似服从正态分布。正态分布有许多良好的性质。第86页
26、/共126页正态分布是应用最广泛的一种连续型分布。德莫佛高斯德莫佛最早发现了二项分布概率的一个近似公式,这一公式被认为是正态分布的首次露面。正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布。第87页/共126页定义2.6 设连续型随机变量的概率密度为的正态分布或高斯(Gauss)分布,记为其中为常数,则称 X 服从参数为第88页/共126页(2)单峰对称 密度曲线关于直线x=对称,即f(+x)=f(-x),x(-,+)正态分布密度函数f(x)的性质(3)x=时,f(x)取得最大值f()=;(4)x=处有拐点;第89页/共126页(5)的大小直接影响概率的分布,越大,曲线越平坦,越小,
27、曲线越陡峭。(如图)(6)曲线f(x)以x轴为渐近线。第91页/共126页 决定了图形的中心位置,决定了图形中峰的陡峭程度(为形状参数),正态分布由它的两个参数和 唯一确定,当 和不同时,是不同的正态分布。第92页/共126页正态分布N(,2)的分布函数第93页/共126页定义2.7若X 的概率密度为则称 X 服从标准正态分布,记为XN(0,1),X的分布函数为第94页/共126页的性质:事实上 ,第95页/共126页 标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。定理2.8 证明略。根据定理2.8,只要将标准正态分布的分布函数制成表,就可以解决一般正态
28、分布的概率计算问题。第96页/共126页 书附录有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表。正态分布表当 x 0 时,(x)的值。第97页/共126页若 XN(0,1),若N(0,1)则第98页/共126页由标准正态分布的查表计算可以求得,当XN(0,1)时,p这说明,X的取值几乎全部集中在-3,3区间内,超出这个范围的可能性仅占不到0.3%。P(|X|1)=2(1)-1=0.6826 P(|X|2)=2(2)-1=0.9544P(|X|3)=2(3)-1=0.9974 3 准则p将上述结论推广到一般的正态分布,可以认为,Y 的取值几乎全部集中在-3,+3区间内。这在
29、统计学上称作“3准则”。第99页/共126页标准正态分布的上 分位点则称点 为标准正态分布的上 分位点。设XN(0,1),若数 满足条件第100页/共126页P(X h)0.01或 P(X0.99因而 =2.33,即 h=170+13.98 184设计车门高度为184厘米时,可使男子与车门碰头机会不超过0.01。求满足P(X h)0.99的最小的 h。因为 XN(170,62),所以 。故 P(X h)=第102页/共126页解:设随机变量XN(0,1),试求例2.26第103页/共126页解设随机变量XN(2,9),试求:例2.27设XN(3,2)且P1X5。解 由图形可得例2.28PX5=
30、0.5-0.3=0.2第104页/共126页 第五节 随机变量函数 的分布第105页/共126页一、问 题 的 提 出求截面面积A=的分布。例如,已知圆轴截面直径 d 的分布,第106页/共126页已知t=t0 时刻噪声电压V 的分布,求功率 W=V2/R (R为电阻)的分布等。第107页/共126页随机变量的函数设X是一个随机变量,Y是X的函数,Y=g(X),则Y也是一个随机变量,当X取值x时,Y取值为y=g(x)。本节的任务已知随机变量X的分布,并且已知Y=g(X),求随机变量Y的分布(分布律或分布密度)。第108页/共126页二、离 散 型 随 机 变 量函 数 的 分 布解:当 X 取
31、值 1,2,5 时,Y 取对应值 5,7,13,而且X取某值与Y取其对应值是两个同时发生的事件,两者具有相同的概率。故设X,求 Y=2X+3 的概率函数。例2.29第109页/共126页如果g(xk)中有一些是相同的,把它们作适当并项即可。一般地,若X是离散型 r.v.,X 的分布律为X则 Y=g(X)第110页/共126页 设某工程队完成某项工程所需时间为X(天)近似服从参数为=500,2=52的正态分布,奖金方法规定,若在100天内完成,则得超产奖10000万元;若在若在100天至115天内完成,则得超产奖1000元;若完成时间超过115天,则罚款5000元。求该工程队在完成这项工程时,奖
32、金额Y的分布律。解 依题意XN(100,52)练一练第111页/共126页可见Y是X的函数,且是离散型随机变量。则Y的分布律为第112页/共126页.分布函数法(一般的函数都适用)先求Y=g(X)的分布函数FY(y),再利用Y=g(X)的分布函数与概率密度之间的关系求Y=g(X)的概率密度为三、连 续 型 随 机 变 量 函 数 的 分 布第113页/共126页 设 X 求 Y=2X+8 的概率密度。解 设Y的分布函数为 FY(y),FY(y)=P Yy =P(2X+8y)=P X =FX()于是Y 的密度函数例2.30第114页/共126页故注意到 0 x 4 时,即 8 y 0 时,注意到
33、 Y=X 20,故当 y0 时,。解 设Y 和 X 的分布函数分别为 和 ,例2.31第116页/共126页则 Y=X 2 的概率密度为:求导可得若第117页/共126页 从上述两例中可以看到,在求P(Yy)的过程中,关键的一步是设法从 g(X)y 中解出X,从而得到与 g(X)y 等价的X 的不等式。例如,用 代替 2X+8 y X 用 代替 X2 y 这样做是为了利用已知的 X的分布,从而求出相应的概率。这是求r.v.的函数的分布的一种常用方法。第118页/共126页解 当 0 y 1 时,设随机变量 X 的概率密度为求 Y=sinX 的概率密度。=P(0Xarcsiny)+P(-arcsinyX)例2.32第119页/共126页而求导得:第120页/共126页 下面给出一个定理,在满足定理条件时可直接用它求出随机变量函数的概率密度。第124页/共126页其中,x=h(y)是 y=g(x)的反函数。定理2.9 设 X是一个取值于区间a,b,具有概率密度 f(x)的连续型 r.v,又设y=g(x)处处可导,且对于任意x,恒有 或恒有 ,则Y=g(X)是一个连续型r.v,它的概率密度为此定理的证明与前面的解题思路类似.公式法(只适用于单调函数)第125页/共126页感谢您的观看!第126页/共126页