《概率论与数理统计(柴中林)第6讲.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计(柴中林)第6讲.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 概率论与数理统计概率论与数理统计第六讲第六讲主讲教师:主讲教师:柴中林副教授柴中林副教授中国计量学院理学院中国计量学院理学院 连续型随机变量连续型随机变量 X 所有可能取值充满若所有可能取值充满若干个区间。对这种随机变量,不能象离散型干个区间。对这种随机变量,不能象离散型随机变量那样随机变量那样,指出其取各个值的概率,指出其取各个值的概率,给给出概率分布。而是用出概率分布。而是用“概率密度函数概率密度函数”表示表示随机变量的概率分布。随机变量的概率分布。2.3 连续型随机变量连续型随机变量例例1:某工厂生产一种零件,由于生产过程中各某工厂生产一种零件,由于生产过程中各种随机因素的影响,零件长
2、度不尽相同。现测种随机因素的影响,零件长度不尽相同。现测得该厂生产的得该厂生产的100个零件长度个零件长度(单位单位:mm)如下如下:2.3.1 频率频率直方图直方图129,132,136,145,140,145,147,142,138,144,147,142,137,144,144,134,149,142,137,137,155,128,143,144,148,139,143,142,135,142,148,137,142,144,141,149,132,134,145,132,140,142,130,145,148,143,148,135,136,152,141,146,138,131,1
3、38,136,144,142,142,137,141,134,142,133,153,143,145,140,137,142,150,141,139,139,150,139,137,139,140,143,149,136,142,134,146,145,130,136,140,134,142,142,135,131,136,139,137,144,141,136.这100个数据中,最小值是128,最大值是155。128155作频率直方图的步骤作频率直方图的步骤(1).先确定作图区间先确定作图区间 a,b;a=最小数据最小数据-/2,b=最大数据最大数据+/2,是数据的精度。是数据的精度。本例中
4、本例中 =1,a=127.5,b=155.5。(2).确定数据分组数确定数据分组数 m=1.87(n1)2/5+1,组距组距 d=(b a)/m,子区间端点子区间端点 ti=a+i d,i=0,1,m;(3).计算落入各子区间内观测值频数计算落入各子区间内观测值频数 ni=#xj ti1,ti),j=1,2,n,频率频率 fi=ni/n,i=1,2,m;子区子区间间频频数数频频率率(127.5,131.5)(127.5,131.5)6 60.060.06(131.5,135.5)(131.5,135.5)12120.120.12(135.5,139.5)(135.5,139.5)24240.2
5、40.24(139.5,143.5)(139.5,143.5)28280.280.28(143.5,147.5)(143.5,147.5)18180.180.18(147.5,151.5)(147.5,151.5)8 80.080.08(151.5,155.5)(151.5,155.5)4 40.040.04(4).(4).以小区间以小区间 ti-1,ti 为底,为底,yi=fi/d (i=1,2,m)为高作一系列小矩形,组成了频为高作一系列小矩形,组成了频 率直方图,简称直方图。率直方图,简称直方图。由于概率可以由频率近似,由于概率可以由频率近似,因此这个直因此这个直方图可近似地刻画零件长度
6、的概率分布情况。方图可近似地刻画零件长度的概率分布情况。用用上上述述直直方方图图刻刻画画随随机机变变量量X的的概概率率分分布布情情况况是是比比较较粗粗糙糙的的。为为更更加加准准确确地地刻刻画画X的的概概率率分分布布情情况况,应应适适当当增增加加观观测测数数据据的的个个数数,同同时时将将数数据据分分得得更更细细一一些些。当当数数据据越越来来越越多多,分分组组越越来来越越细细时时,直直方方图图的的上上方方外外形形轮轮廓廓就就越越来来越越接接近近于于某某一一条条曲曲线线,这这条条曲曲线线称称为为随随机机变变量量X的的概概率率密密度度曲曲线线,可可用用来来准准确确地地刻刻画画X的的概概率分布情况。率分
7、布情况。2.3.2 概率密度函数概率密度函数 定义定义1:若存在非负可积函数若存在非负可积函数 f(x),使随机使随机变量变量X取值于任一区间取值于任一区间(a,b 的概率可表示成的概率可表示成则称则称 X为连续型随机变量,为连续型随机变量,f(x)为为 X 的概率密的概率密度函数,简称度函数,简称概率密度概率密度或或密度密度。这两条性质是判定函数这两条性质是判定函数 f(x)是否为某随机变量是否为某随机变量 X 的概率密度函数的充的概率密度函数的充要条件。要条件。密度函数的性质密度函数的性质f(x)与与 x 轴所围轴所围 面积等于面积等于1。若若x是是 f(x)的连续点,则的连续点,则=f(
8、x),(3).对对 f(x)的进一步理解:的进一步理解:故故,X的概率密度函数的概率密度函数f(x)在在 x 这一点的值这一点的值,恰恰好是好是X 落在区间落在区间 x,x+x上的概率与区间长上的概率与区间长度度x 之比的极限。之比的极限。这里这里,如果把概率理解为如果把概率理解为质量,质量,f(x)相当于物理学中的线密度。相当于物理学中的线密度。需要注意的是:需要注意的是:概率密度函数概率密度函数 f(x)在点在点 a 处处取值,不是事件取值,不是事件 X=a 的概率。但是,该值的概率。但是,该值越大,越大,X 在在 a 点附近取值的概率越大。点附近取值的概率越大。若不计高阶无穷小,有:若不
9、计高阶无穷小,有:表示随机变量表示随机变量 X 取值于取值于(x,x+x上的概率上的概率近似等于近似等于 f(x)x。f(x)x 在连续型随机变量中所起的作用在连续型随机变量中所起的作用与与 pk=PX=xk 在在离散型随机变量中所起的作离散型随机变量中所起的作用类似。用类似。(4).连续型随机变量取任意指定值的概率为连续型随机变量取任意指定值的概率为 0.即:即:a为任意给定值。为任意给定值。这是因为:这是因为:由此得由此得,对连续型对连续型 随机变量随机变量 X,有有 由由P(X=a)=0,可推出可推出而而 X=a 并非不可能事件并非不可能事件,可见:可见:由由P(A)=0,不能推出不能推
10、出 A=;并非必然事件。并非必然事件。由由 P(B)=1,不能推出不能推出 B=。2.3.3 随机变量的分布函数随机变量的分布函数 定义定义2:设设 X()是一个随机变量,称函数是一个随机变量,称函数 F(x)=PXx,-x 为随机变量为随机变量 X 的分布函数的分布函数。分布函数的性质分布函数的性质(1).(1).a b,总有总有F(a)F(b)()(单调非减性单调非减性);(2).(2).F(x)是一个右连续函数;是一个右连续函数;(3).(3).x R,总有,总有00F(x)1()1(有界性有界性),且,且证明:证明:仅证仅证(1)。因因 aa =Xb-Xa,而而 Xa Xb,所以,所以
11、 PaXb=PXb-PXa =F(b)-F(a).又又,因,因 PaXb0,故故 F(a)F(b).注意:注意:上述证明中我们得到一个重要公式上述证明中我们得到一个重要公式:P aXb=F(b)-F(a).它表明随机变量落在区间它表明随机变量落在区间(a,b 上的概率可以上的概率可以通过分布函数来计算。通过分布函数来计算。设离散型随机变量设离散型随机变量X 的概率分布为的概率分布为 pk=P X=xk ,k=1,2,X 的分布函数为的分布函数为离散型随机变量的分布函数离散型随机变量的分布函数所以,离散型随机变量的所以,离散型随机变量的分布函数分布函数 F(x)是一是一个右连续的函数,在个右连续
12、的函数,在 X=xk(k=1,2,)处有处有跳跃值跳跃值 pk=PX=xk,如下图所示。,如下图所示。P29P29,例中,例中X 的分布函数为的分布函数为连续型连续型随机变量随机变量的分布函数的分布函数即分布函数是密度函数的变上限积分。即分布函数是密度函数的变上限积分。由上式,得:由上式,得:在在 f(x)的连续点,有的连续点,有 若若X 是连续型随机变量,是连续型随机变量,f(x)是是X 的的密度密度函数,函数,F(F(x)是分布函数,则对任意是分布函数,则对任意xR,总有,总有例例4:设随机变量设随机变量 X 的密度函数为的密度函数为解:解:(1)根据密度函数的性质,有根据密度函数的性质,
13、有求:(求:(1)A的值,(的值,(2)X落在区间落在区间(0,1)内内的概率,(的概率,(3)F(x).解之得解之得 A=1/(2)根据密度函数性质,有)根据密度函数性质,有(3)由定义由定义求连续型随机变量的分布函数求连续型随机变量的分布函数例例4:设随机变量设随机变量 X 的密度函数的密度函数解:解:求求 F(x).对对 x 1,有有 F(x)=1.即即2.3.4 常见的连续型随机变量常见的连续型随机变量正态分布、均匀分布、指数分布正态分布、均匀分布、指数分布 正态分布是应用最广泛正态分布是应用最广泛的一种连续型分布。的一种连续型分布。正态分布是十九世纪初,由高斯正态分布是十九世纪初,由
14、高斯(Gauss)(Gauss)给出并推广的一种分布。故,也称给出并推广的一种分布。故,也称高斯分布高斯分布。1.正态分布正态分布这条红色曲线近似我们将要介绍的这条红色曲线近似我们将要介绍的正态分布正态分布的概率密度曲线。的概率密度曲线。I.正态分布的定义正态分布的定义 定义:定义:若随机变量若随机变量 X 的的概率密度函数为概率密度函数为记作记作 f(x)所确定的曲线叫作所确定的曲线叫作正态曲线正态曲线。(Normal)其中其中和和都是常数,都是常数,任意,任意,0,则称,则称X服从参数为服从参数为和和的正态分布。的正态分布。II.正态分布正态分布 的图形特点的图形特点特点特点“两头低,中间
15、高,左右对称两头低,中间高,左右对称”。正态分布的密度曲线是一条关于正态分布的密度曲线是一条关于X=对称对称的的钟形曲线钟形曲线。正态分布正态分布 的图形特点的图形特点 决决定了定了图图形的中心位置形的中心位置,决定了决定了图形形峰的陡峭程度。峰的陡峭程度。故故 f(x)以以 x=为对称轴,并在为对称轴,并在 x=处达到处达到最大值最大值:令令x1=+c,x2=-c(c0),分别代入分别代入 f(x),得得f(x1)=f(x2),且且 f(+c)f(),f(-c)f().这说明:曲线这说明:曲线 f(x)向左右伸展时,越来越贴向左右伸展时,越来越贴近近 x 轴。即轴。即 f(x)以以 x 轴为
16、渐近线。轴为渐近线。当当 x 时,时,f(x)0。用求导的方法可以证明:用求导的方法可以证明:为为f(x)的两个拐点的横坐标。的两个拐点的横坐标。x=总有总有P(XP(X)=P(X)=P(X0时,时,(x)的取值的取值;若若 XN(0,1),服从服从N(0,1)例例1:假设某地区成年男性的身高假设某地区成年男性的身高(单位单位:cm):cm)XN(170,7.,7.692),),求该地区成年男性的身高超求该地区成年男性的身高超过过 175cm175cm 的概率。的概率。解解:根据假设根据假设 XN(170,7.,7.692),知,知事件事件 X 175 的概率为的概率为此外:若XN(0,1),
17、则则P(X-1.24)=(-1.24)=1-(1.24)=1-0.8924=0.1076,P(0.3X2.58)=(2.58)-解解:设车门高度为设车门高度为 h,按设计要求按设计要求P(X h)0.01,或或 P(X h)0.99,下面我们来求满足上式的最小的下面我们来求满足上式的最小的 h。例例2 2:公共汽车车门的高度是按成年男性与车公共汽车车门的高度是按成年男性与车门顶头碰头机会在门顶头碰头机会在0.01以下来设计的。以下来设计的。设某地设某地区成年男性身高区成年男性身高(单位单位:cm)XN(170,7.692),问车门高度应如何确定问车门高度应如何确定?因为因为XN(170,7.,
18、7.692),),求满足求满足 P(X h)0.99 的最小的最小 h。故,当汽车门高度为故,当汽车门高度为188厘米时,可使男子与厘米时,可使男子与车门碰头机会不超过车门碰头机会不超过0.01。若若随机变量随机变量 X 的概率密度为:的概率密度为:则称则称 X 服从区间服从区间 a,b 上的均匀分布,记作:上的均匀分布,记作:X Ua,b2.均匀分布均匀分布(Uniform)(注注:有时也记作有时也记作 X U(a,b)。若若X Ua,b,则对于满足,则对于满足 acdb 的的c 和和 d,总有,总有容易知道,若容易知道,若XU(a,b),则,则 指数分布常用于可靠性统计研究中,如指数分布常
19、用于可靠性统计研究中,如元件的寿命服从指数分布。元件的寿命服从指数分布。定义:定义:若随机变量若随机变量 X 具有概率具有概率密度密度3.指数分布指数分布则称则称 X 服从参数为服从参数为 的指数分布的指数分布,记成,记成 X e()。例例3:设某电子管的使用寿命设某电子管的使用寿命X(单位:小时单位:小时)服从参数服从参数=0.0002的指数分布,求的指数分布,求电子管使电子管使用寿命超过用寿命超过3000小时的概率。小时的概率。解:解:容易知道,容易知道,若若Xe(),则,则 本讲首先介绍连续型随机变量、直方图、概本讲首先介绍连续型随机变量、直方图、概率密度函数及性质;然后介绍了三种常用的连续率密度函数及性质;然后介绍了三种常用的连续型随机变量:型随机变量:正态分布,均匀分布正态分布,均匀分布和和指数分布指数分布;最后介绍随机变量的分布函数。分别讨论了离散最后介绍随机变量的分布函数。分别讨论了离散型随机变量的概率分布和分布函数的关系,型随机变量的概率分布和分布函数的关系,连续连续型随机变量的概率密度和分布函数的关系等。型随机变量的概率密度和分布函数的关系等。小结小结