《(本科)第5章概率基础ppt课件.pptx》由会员分享,可在线阅读,更多相关《(本科)第5章概率基础ppt课件.pptx(87页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章第五章概率基础概率基础概率的基本概念概率的基本概念随机变量及其分布随机变量及其分布几种常见的概率分布几种常见的概率分布大数定律与中心极限定理大数定律与中心极限定理2(本科)第5章概率基础ppt课件第一节第一节概率的基本概念概率的基本概念随机试验与随机事件随机试验与随机事件概率概率3(本科)第5章概率基础ppt课件一、随机试验与随机事件一、随机试验与随机事件v在自然界和日常生活中存在着许多不确定现象,如每天的天气都可能不同,抛硬币的结果也不可预测,工厂领导者所做出的决策是否可以给工厂带来利润等等,即使在同样的条件下,也有可能出现不同的结果。就以抛硬币来说,在周围环境和条件不变的情况下,可能
2、会得到两种截然不同的情况,即是正面和反面。我们把这类在相同条件下重复同样的试验所得结果不确定的现象称为随机现象随机现象。曾经有许多学者作过这样的试验,最后发现,如果抛的次数足够多的话出现正面和反面的次数是差不多的。这说明了在不确定的表象下还是有其规律性的。于是我们利用随机试验来研究这种内在的规律性。4(本科)第5章概率基础ppt课件(一)样本空间(一)样本空间v从总体中随机抽取一个单位并把结果记录下来称为一次试试验验。举一个最简单的例子,从09这10个数字中随抽取出一个,并记录下所抽到的数字,即完成一次试验,抽到的数字可能是:0,1,2,3,4,5,6,7,8,9共10种情况,每种情况对应着一
3、个样本点,总体中共有十个样本点。以全部样本点为元素的集合称为样本空间,记为:S0,1,2,3,4,5,6,7,8,9v如果样本空间 中样本点的数目是有限的,则 是一个有限有限的样本空间的样本空间。如果 其中可能包括无限个样本点,则 是一个无限的样本空间无限的样本空间,如观察一小时中落在地球上某一区域的粒子数,则样本空间取为=0,1,2,。5(本科)第5章概率基础ppt课件v由此可见,随着问题的不同,样本空间可以复杂,也可以变得简单。应该指出,样本空间的界定会随着研究目的和样本设计不同而有差异,而不是一成不变的。如上面数字抽取的例子,我们所关心的是数字的出现,因此样本点有10种情况。如果我们关心
4、的仅是“出现的数字为质数”,则得到的样本点集合为1,2,5,7。又如,要求的是“6的倍数”,则得到的是6这样一个样本空间。而如果进行多次试验,则得到的结果会有不同的表示,可能要用多维的方式来表示。例如掷一次铜币结果可能面向上或背向上两种结果,如果连续掷两次铜币,则两次试验的联合结果形成样本空间为:S(面,面),(面,背),(背,面),(背,背)6(本科)第5章概率基础ppt课件(二)事件(二)事件v样本空间的特定子集A称为事件事件。在一个试验中,我们首先关心的是它所有可能出现的基本结果,它们是试验中最简单的随机事件,称为基本事件基本事件。基本事件是指对应样本空间S中一个样本点的事件,它是不可再
5、分的。例如数字抽取的例子中的 A 4和连续两次抛硬币中的 B(面,面)都是基本事件,因为它们都是所属样本空间的一个样本点,不可再分了。而复合事件复合事件是可以由若干个基本事件结合而成的。例如定义C为出现偶数的情况,C 0,2,4,6,8,则 C是样本空间 S0,1,2,3,4,5,6,7,8,9的一个复合事件。因为C是由样本点0、2、4、6、8点的简单事件构成的,当出现这些点时,称事件C发生。7(本科)第5章概率基础ppt课件v8(本科)第5章概率基础ppt课件(5)交)交()AB=AB =A和B同时发生v一般地,可以将此公式推广为:(6)并并()给定两个事件 A和B构成一个新的事件C=AB=
6、A和B至少发生一个,也可记为AB。v同样地可以将此公式推广为:(7)差差()A B=A发生且B不发生9(本科)第5章概率基础ppt课件【例【例5-1】v10(本科)第5章概率基础ppt课件二、概率二、概率(一)概率的定义(一)概率的定义v前面已经提到,一切随机现象都有其内存的规律性,一切事件的发生都有其可能性,而我们就用概率概率这个概念来衡量一个事件发生的可能性的大小。在公理化结构中,概率概率是针对事件定义的,即对应于事件域F中的每一个元素A有一个实数P(A)与之对应,一般把这种从集合到实数的映射称为集合函数。因此,概率是定义在事件域F上的一个集合函数。11(本科)第5章概率基础ppt课件v定
7、义定义5.1定义在事件域F上的一个集合函数P称为概率概率,如果它满足如下三个条件:()P(A),对一切 AF;()P()=1;()若AiF,i=1,2,且两两不相容,则(5.1)v这就是概率的可列可加性可列可加性或完全可加性完全可加性。12(本科)第5章概率基础ppt课件v利用概率的基本性质可以推出概率的另外一些重要性质。性质1不可能事件的概率为0,即P()=0(5.2)性质2必然事件的概率为1,即 P()=1(5.3)性质3概率具有有限可加性。即若Ai Aj=(ij),(5.4)13(本科)第5章概率基础ppt课件(二(二)概率)概率的基本运算的基本运算v14(本科)第5章概率基础ppt课件
8、【例【例5-2】v15(本科)第5章概率基础ppt课件(三)古典概型与几何概型(三)古典概型与几何概型1.古典概型古典概型v在我们所研究的随机现象中有一类最简单的随机现象,这种随机现象的全部可能结果只有有限个,这些事件是两两互不相容的,而且它们发生的概率都相等,我们就把这类随机现象的数学模型称为古典概型。v记这些事件为,若事件 包含的样本点的个数为 个,则其概率为 (5.10)v【例5-3】设袋中有a 个白球和 b个红球,现按无放回抽样,依次把球一个个取出来,求第 k次取出的球是红球的概率 。16(本科)第5章概率基础ppt课件v解:该实验是从a+b个球中,无放回地把球一个个取出来,相当于排队
9、,求第 k个位置排的是红球的概率。因为a+b 个球共有(a+b)!种排法,故样本点总数 n=(a+b)!。设 A第 k次取出的球是红球,则对事件 A包含的样本点的个数为:先从 b个红球中任取一个放在第k 个位置,然后把其余a+b-1 个球排在剩下的位置上,总共有 。v所以 v可以看到,最终得到的结果与k无关,这个实际上就是“抽签原理”,也就是抽签与顺序无关。17(本科)第5章概率基础ppt课件2.几何概型几何概型v古典概型所能计算的只是有限场合的情况,无限多结果的场合又如何呢?下面我们用几何方法来解决这个问题。(1)开往某市的汽车开车时间为每个正点一趟,某人到车站乘车,求他等车短于10分钟的概
10、率;(2)一片面积为S的树林中有一块面积为 的空地,由空中向空地投掷物品,求投中的概率。(3)在10毫升的自来水中有1个大肠杆菌,现在从中随机取出2毫升自来水在显微镜下观察,试求大肠杆菌的概率。v在上述问题中,样本空间分别是一、二、三维,分别用长度、面积和体积来衡量。则事件 A的概率P(A)与A的位置与形状均无关,而与其长度(或面积、体积)成正比,18(本科)第5章概率基础ppt课件v也就是v其中m()表示长度(或面积、体积)。【例5-4】两人相约于8时至9时之间在某地相见,并给定先到者等候另一人30分钟后就可离开,求两人能会面的概率。v解:设x,y 分别表示两人到达某地的时刻,因为两人到达的
11、时间是随机的,故x,y 都分别等可能地在0,60 上取值,那么点(x,y)就是平面区域v等可能的样本点。记事件A 为“两人能见面”,其区域为 ,其面积为 ,而 的面积为 ,于是两人能会面的概率为(5.11)19(本科)第5章概率基础ppt课件v(三)事件的独立性与条件概率(三)事件的独立性与条件概率1事件的独立性事件的独立性v若两个随机事件A、B的发生与否不会相互影响,则称它们相互独立相互独立,其定义如下:v定义5.2对于任意两个事件A、B,如果等式vP(AB)=P(A)P(B)(5.12)v成立,则称事件A和B相互独立。2条件概率条件概率v条件概率条件概率研究的是在某一事件发生的条件下,另一
12、事件发生是否会受到影响,影响有多大呢?这实际上也就是将原有的概率空间缩小。20(本科)第5章概率基础ppt课件v定义定义5.3给定一个随机试验,是它的样本空间,对于任意两个事件A、B,其中P(B)0,称为在已知事件B发生的条件下事件A的条件概率。3两个重要公式两个重要公式全概率公式全概率公式(5.14)贝叶斯公式贝叶斯公式(5.15)(5.13)21(本科)第5章概率基础ppt课件v【例例5-5】设有来自三个地区的各10名、15名、25名考生的报名表,其中女生的报名表分别为3份、7份和5份。随机抽取一个地区的报名表,从中先后抽出两份。若已知后抽到的一份是男生表,求先抽到的一份是女生表的概率。v
13、解:记 表示“报名表是第I区考生的”,表示“第j次抽到的报名表是男生表”,则先抽到的一份是女生表的概率是:22(本科)第5章概率基础ppt课件v根据全概率公式(5.1.14),有v因此,23(本科)第5章概率基础ppt课件第二节随机变量及其分布第二节随机变量及其分布随机变量与随机分布的概念随机变量与随机分布的概念概率分布的类型概率分布的类型随机变量的数字特征随机变量的数字特征24(本科)第5章概率基础ppt课件第二节随机变量及其分布第二节随机变量及其分布一、随机变量与随机分布的概念一、随机变量与随机分布的概念v随机现象中有很大一部分问题与数值发生关系,例如在产品检验抽样中出现的废品数;在电话问
14、题中关心的是某段时间中的话务量,它与呼叫次数及每次呼叫占用时间有关。v上一节中我们给出了随机试验与概率的概念,而试验的目的是为了研究随机现象的规律,了解这一随机现象中所有可能出现的结果及每个结果的概率。为了更好地描述这一问题,最直接明了的方法就是用数量来与结果对应。例如,买彩票时,用0表示“未中奖”,用1表示“中一等奖”,2表示“中二等奖”,3表示“中三等奖”。v将每个结果对应于一个数,也就等价于在样本空间上定义了一个“函数”,对于试验的每一个结果,都可以用一个实数X()来表示。这个量就称为随机变量随机变量(random variable)。25(本科)第5章概率基础ppt课件v本书中将用大写
15、字母X,Y,Z来表示随机变量。正如对随机事件一样,我们所关心的不仅是试验会出现什么结果,更重要的是要知道这些结果将以怎样的概率出现,也即对随机变量,不但要知道它取什么数值,而且要知道它取这些数值的概率。这样,了解随机现象的规律就变成了解随机变量的所有可能取值及随机变量取值的概率。而这两个特征就可以通过随机变量分布来表现出来。26(本科)第5章概率基础ppt课件二、概率分布的类型二、概率分布的类型v从随机变量的可能出现的结果来看,随机变量至少有两种不同的类型。一种是试验结果X所可能取的值为有限个或至多可列个,能够一一列举出来,这种类型的随机变量称为离散型随机变量离散型随机变量。在日常生活中经常碰
16、到离散型随机变量,例如废品数、电话呼叫数、人口调查等等。其随机变量分布就称为离散型随机变量分布离散型随机变量分布。v如果随机变量X的取值可以一一列出,记为 ,而相对于 所取的概率为 ,即 ,称为随机变量X 的概率分布概率分布,它应满足下面关系:(5.16)(5.17)27(本科)第5章概率基础ppt课件v则当 和 已知时,这两组值就完全描述了随机变量的规律,此时把如下的表示方法称为该随机变量的分布列:(5.18)对于集合 中任何一个子集A,事件“X在A中取值”即“X A”的概率为 前面提到的抽数字的例子,就是一个离散型随机变量的例子,其样本点的取值就是09这10个数字,而取到每个(5.19)2
17、8(本科)第5章概率基础ppt课件v数字的概率都相等,也就是10%,它的概率分布可表示为:v或者用如下的分布列来表示:v与离散型随机变量有所不同,一些随机现象所出现的试验结果的取值不可列。例如测量误差、分子运动速度、候车时的等待时间、降水量、风速、洪峰值等等皆是。这时用来描述试验结果的随机变量还是样本点的函数:严格写应是X(),其中。但是这个随机变量能取某个区间c,d或(-,+)的一切取值。29(本科)第5章概率基础ppt课件v假如想用描述离散型随机变量的方法(简单地罗列所取的值及相应的概率)来描述这后一类随机变量,则会碰到很大的困难。一来是这类随机变量所取值不能一一列出;二来是我们下面将会看
18、到,取连续值的随机变量,它取某个特定值的概率常常是0,因此用这种描述方法根本不行。v对于取连续值的随机变量我们所关心的也并不是它取某个特定值的概率。例如在测量误差中,我们感兴趣的是测量误差小于某个数的概率;在降雨问题中,我们重视的是雨量在某一个量级,例如在100毫米到120毫米之间的概率。总之,对于取连续值的随机变量X(),我们感兴趣的是X()取值于某个区间(a,b)的概率,或取值于若干个这种区间的概率。30(本科)第5章概率基础ppt课件 因此应当要求a X()b或 X()b或一般地 X()A(其中A是由区间经并、交等运算而得到的直线上的某一个点集)有概率可言,既然只对概率空间(,F,P)的
19、事件域F中的集合才定义概率,因此我们自然要求上述集合属于F,即都是事件。为此引进如下定义:v定义定义5.4 X()是定义于概率空间(,F,P)上的单值实函数,如果对于直线上任一点集B,有:X()BF 则称X()为随机变量,而P:X()B 称为随机变量X()的概率分布。31(本科)第5章概率基础ppt课件定义定义5.5对于随机变量,如果存在一个非负可积函数(x),-X ,使对于任意两个实数a,b(ab)都有 ,则称X为连续型随机变量,(x)就称为随机变量X的密度函数,满足性质:(1)(x)0 x(-,+)(5.20)(2)(5.21)v【例5-6】已知连续型随机变量X密度函数为 且P1X1.53
20、2(本科)第5章概率基础ppt课件v解:解:由概率密度的性质及其定义,有 即得到联立方程为 得到 33(本科)第5章概率基础ppt课件从而从而那么那么(三)一般场合的分布函数(三)一般场合的分布函数v随机变量是样本点的函数,因此在试验前我们只能知道它可能取哪些值,而不能确切知道它将取何值,这就是随机随机性性。但是到了试验之后,它的取值也就明确了。为了计算概率,必须要求随机变量具有可测性可测性,而分布函数则把对于随机变量的概率计算化为对分布函数的数值运算。这样一来,我们已经给随机变量予严格的定义,同时又为对它的研究准备了方便的分析工具。34(本科)第5章概率基础ppt课件v但是,除了前面得到的离
21、散型和连续型的随机变量外,还存在其他类型的随机变量,就不能用离散型随机变量的分布列或者连续型随机变量的密度函数来描述,于是引入分布函数的概念。这是概率论中重要的研究工具,可以用于描述包括离散型和连续型在内的一切类型随机变量。v定义定义5.6设x 是一个随机变量,(x)是它的分布密度函数,则称函数 (5.22)为随机变量X的分布函数。v根据定义,F(X)具有如下性质:1.(5.23)35(本科)第5章概率基础ppt课件v针对连续型的随机变量有 2.,3.F(X)是关于x的单调非减函数 4.(5.24)5.左连续性:6.,(5.25)36(本科)第5章概率基础ppt课件【例例5-7】已知随机变量
22、的密度函数为 求相应的分布函数F(X)。解:根据分布函数的定义知,所以当所以当时,时,当当时,时,当当时,时,37(本科)第5章概率基础ppt课件当当时,时,综上可得随机变量 X的分布函数为38(本科)第5章概率基础ppt课件三、随机变量的数字特征三、随机变量的数字特征v一个随机变量的分布包括了关于这个随机变量的全部信息,是对此随机变量最完整的刻画。但它并没有使我们对随机变量有一种概括性的认识。在很多情况下,为了突出随机变量在某个侧面的重点,我们常用由这个随机变量的分布所决定的一些常数,对该随机变量给出简单明了的特征刻画,这些常数被称为随机变量的“数字特征”。随机变量的数字特征是指能集中反映随
23、机变量概率分布基本特点的数字。常用的随机变量数字特征有数学期望和方差两种。39(本科)第5章概率基础ppt课件(一)数学期望(一)数学期望 1.离散型场合v现有A、B两个选手比赛投篮,他们的投球技术用下表表出:A选手B选手v试问哪一个选手的投篮技术较好?v这个问题的答案不是一眼看的出来。这说明分布列虽然完整地描述了随机变量,但是却不够“集中”地反映出它的变化情况。因此我们有必要找出一个新的指标来更集中、更概括地描述随机变量,这就是数学期望。投中分数123投中分数123概率0.30.30.4概率0.20.50.340(本科)第5章概率基础ppt课件v那么要如何来计算数学期望呢?v求平均值是大家都
24、很熟悉的一种运算。例如,一堆西瓜中有2个4公斤重,3个2公斤重,4个6公斤重,那这些西瓜的平均重量为 (公斤)v注意到上式的计算公式是:瓜的各种重量乘以其所占的百分比然后求和。v同样以随机变量的各个取值为权数计算加权平均数作为该变量的数学期望。41(本科)第5章概率基础ppt课件定义定义5.7设离散型随机变量X的分布为 记X的数学期望为E(X),则 (5.26)就如在上面的问题中,若使两个选手各投N次,则他们投中分数的期望值大约是:甲:10.3N+20.3N+30.4N=2.1N 乙:10.2N+20.5N+30.3N=2.1N 平均起来甲每球投中2.1分,乙投中2.1分,这就看出,虽然选手A
25、和B。投中各个分数的球的概率不相同,但最后两者的平均水平却是一样的。42(本科)第5章概率基础ppt课件v那当变量取值为可列个时,其数学期望定义如下:定义5.8设离散型随机变量X的分布为 若级数 绝对收敛,则将其称为X的数学期望数学期望,简称 为期望或均值均值,记为E(X)。【例5-8】(彩票问题)彩票的中奖额巨大,对于购买者而言,实质收益如何呢?请看一则实例:发行彩票10万张,每张1元。设头奖1个,奖金1万元;二等奖2个,奖金各5仟元;三等奖10个,奖金各1仟元;四等奖100个,奖金各1佰元;五等奖1000个,奖金各10元。43(本科)第5章概率基础ppt课件v解:这里的分布列为 由此可以算
26、出其获奖金额的期望值为 即平均来看,购买彩票这大约只能能收回一半的购彩票款。44(本科)第5章概率基础ppt课件v【例例5-9】(投资之决策)投资总具有一定风险,因此在选择投资方向时,计算其期望收益常是可代考虑的决策方法之一。现某人有10万元现金,想投资于某项目,预估 成功的机会为30%,可得利润8万元,失败的机会为70%,将损失2万元。若存入银行,同期间的利率为5%,问是否应作此项投资?v以以X记投资利润,则记投资利润,则E(X)=8 0.3-2 0.7=1(万元)(万元)v而存入银行的利息为而存入银行的利息为105%0.5(万元),因此从期望收(万元),因此从期望收益的角度看,应选择投资,
27、当然这里要冒一定的风险。益的角度看,应选择投资,当然这里要冒一定的风险。v定义定义5.9设连续型随机变量设连续型随机变量X的密度函数为的密度函数为(x),当积分,当积分绝对收敛时,就称它为绝对收敛时,就称它为X的数学期望(或均值)的数学期望(或均值),记作,记作E(X),即,即(5.27)45(本科)第5章概率基础ppt课件v【例5-10】已知连续型随机变量X的密度函数为 求随机变量X的数学期望。v解:根据数学期望的定义,可以得到 令 ,则 46(本科)第5章概率基础ppt课件3.数学期望的基本性质数学期望的基本性质v设如下各变量的数学期望存在,c为常数,可以得到关于数学期望的性质:(1)(5
28、.28)(2)(5.29)(3)(5.30)(4)若 相互独立,则 (5.31)47(本科)第5章概率基础ppt课件(二)方差(二)方差v前面我们所讨论的数学期望是随机变量的一个前面我们所讨论的数学期望是随机变量的一个重要数学特征,它表示了随机变量取值的平均水重要数学特征,它表示了随机变量取值的平均水平,但是有些情况下,两个变量虽然具有相同的平,但是有些情况下,两个变量虽然具有相同的期望值,但实际上却有着很大的差别。就以前面期望值,但实际上却有着很大的差别。就以前面投球的例子来说,两个选手的技术从各个分数的投球的例子来说,两个选手的技术从各个分数的投中率来说是不一样的,但是他们的平均分数是投中
29、率来说是不一样的,但是他们的平均分数是相同的,那要怎么样才能区分这两位选手的技术相同的,那要怎么样才能区分这两位选手的技术水平呢?这就用了方差这个概念,它描述的是随水平呢?这就用了方差这个概念,它描述的是随机变量的取值机变量的取值48(本科)第5章概率基础ppt课件v相对于它的期望的平均偏离程度。相对于它的期望的平均偏离程度。v定义定义5.10设随机变量设随机变量X的数学期望为的数学期望为E(X),称,称为为X的方差,记作的方差,记作D(X),即,即(5.32)称称为为X的标准差(或标准偏差)。的标准差(或标准偏差)。v根据期望的性质,可以得到方差的另一个定义式。根据期望的性质,可以得到方差的
30、另一个定义式。v(5.33)49(本科)第5章概率基础ppt课件v因此也可以得到方差的几个基本性质:因此也可以得到方差的几个基本性质:(1),其中其中c为常数(为常数(5.34)(2)(5.35)(3)(5.36)(4)n个独立随机变量平均值的方差等于各个变量方差平个独立随机变量平均值的方差等于各个变量方差平均值的均值的1/n,即,即(5.37)v采用这个计算公式,我们可以看到,上面那个问题中,选采用这个计算公式,我们可以看到,上面那个问题中,选手手A射中分数的方差为射中分数的方差为50(本科)第5章概率基础ppt课件v同理,可以算出选手同理,可以算出选手B投中分数的方差为投中分数的方差为0.
31、49,比选手,比选手A的的方差小,可以看出方差小,可以看出A的投中分数分散度较大,可见技术不的投中分数分散度较大,可见技术不如如B来得稳定。这样就把两者的技术区分开来了。来得稳定。这样就把两者的技术区分开来了。v解:依题意,十只元件中有两只废品,所以解:依题意,十只元件中有两只废品,所以X的可能取值的可能取值为为0,1,2。X=0表示表示“第一次抽到的就是正品第一次抽到的就是正品”X=1表示表示“第一次取到的是废品,第二次取到的是正品第一次取到的是废品,第二次取到的是正品”X=2表示表示“第一次和第二次抽到的都是废品,而第三次第一次和第二次抽到的都是废品,而第三次取到的是正品取到的是正品”于是
32、可以计算于是可以计算51(本科)第5章概率基础ppt课件v那么得到那么得到X的概率分布为的概率分布为v所以所以v则则52(本科)第5章概率基础ppt课件(三)协方差与相关系数(三)协方差与相关系数v前面我们所讨论的都是一个随机变量的数字特征,下面就要转到多维随机变量之间的关系来了。两个随机变量的相关性是概率论和数理统计的重要概念,是统计相关性最简单的形式之一,在二维随机变量之间一个重要的特征就是相关系数。随机变量相关性的分析,也就是相关分析,在经济问题中有重要的应用。v定义定义5.11设两个随机变量X和Y的期望和方差都存在,则称 (5.38)为X和Y的协方差协方差。v下面是协方差的一些性质(假
33、设下面各随机变量的协方差存在,且为常数)53(本科)第5章概率基础ppt课件(1)cov(X,Y)与与X,Y的顺序无关,即的顺序无关,即cov(X,Y)=cov(Y,X)(2)若)若X和和Y独立,则独立,则cov(X,Y)=0v证明:由于证明:由于如果如果X和和Y独立,独立,则则于是有于是有cov(X,Y)=0(3)(4)(5)54(本科)第5章概率基础ppt课件v定义定义5.12设随机变量X和Y的方差都存在,且都不为0,则称v (5.39)v为X和Y的相关系数相关系数。v同样我们可以列出相关系数的一些性质:(1)(2)的充要条件是 为常数。v关于相关系数的内容,我们在后面的章节中还要详细介绍
34、。55(本科)第5章概率基础ppt课件第三节第三节几种常见的概率分布几种常见的概率分布离散型分布离散型分布连续型分布连续型分布56(本科)第5章概率基础ppt课件第三节第三节几种常见的概率分布几种常见的概率分布一、离散型分布一、离散型分布v下面介绍几个常用的离散型随机变量及其概率分布。(一)两点分布(一)两点分布v在生活中有一些简单的试验,其结果只有两个,例如,掷一枚硬币(正面与反面)、检查一个产品(合格与不合格)、买一张彩票(中与不中)等等。我们就把这样的试验称为伯努利试验伯努利试验。v在一次试验中,事件A出现的概率为P,不出现的概率为q=1-p,若以X记事件A出现的次数,则X仅取0,1两个
35、值,相应的概率分布为 ,这个分布称为两点分布,也称为伯努利分布。57(本科)第5章概率基础ppt课件 两点分布的数学期望为 (5.40)由于 则其方差为 (5.41)58(本科)第5章概率基础ppt课件(二)二项分布(二)二项分布v二项分布是离散型分布中较为重要的一种,是上述伯努利试验重复进行的结果。在 重独立的伯努利试验中,重复进行n次试验,若记事件A为“试验成功”,其概率为p,以X记事件A出现的次数,则它是一个随机变量,X可能取的值为0,1,2,n,其对应的二项分布给出:(5.42)简记作简记作。59(本科)第5章概率基础ppt课件v可以看出,前面所提到的伯努利分布就是n=1情况下的二项分
36、布,也就相当于一次实验的结果。v利用二项式的展开式及方差的性质可以计算出分布的期望值及方差如下:令 则上式可以化为60(本科)第5章概率基础ppt课件v这样可知v由于v61(本科)第5章概率基础ppt课件v从而v【例例5-12】一名射手打靶,命中率为0.9。在6次打靶中他命中靶的次数X是一个服从二项分布B(6,0.9)的随机变量。求该射手至少命中5次的概率。v解:依题意得,X的概率分布为v则该射手至少命中5次的概率为62(本科)第5章概率基础ppt课件(三)超几何分布(三)超几何分布v在统计检验中常常用到的方法就是抽样,例如产品的抽样检查就是经常遇到的一类实际问题,要对N件产品进行无放回抽样检
37、查,若这批产品中有M件次品,现从整批产品中随机抽出n件产品,则在这n件产品中出现的次品数X是随机变量,它取值0,1,2n,其概率分布为超几何分布。v这种抽样的方法就相当于抽样检查中的无放回抽样,而当我们采取有放回抽样时,就等价于n重伯努利试验,即n件(5.43)63(本科)第5章概率基础ppt课件 被检查产品中不合格品数 ,其中 。可以得到如下几何分布与二项分布的关系:对于固定的 n,当 时 ,有v 在实际应用中,只要N 10n,就可以用二项分布近似地 描述产品抽样的不合格品数。v【例5-13】从积累的资料看,某工厂生产的产品中,一级品率为85%,现在从某天生产的1000件产品中,随机地抽取2
38、0件作检验,试求:(5.44)64(本科)第5章概率基础ppt课件恰有18件一级品的概率 一级品不超过18件的概率v解:设X表示“1000件产品中一级品的个数”,由于,1000 1020,因此可以近似地认为 则则而而65(本科)第5章概率基础ppt课件(四)泊松分布(四)泊松分布v泊松实验具有两个重要的特征:第一,所考察的事件在任意两个长度相等的区间里发生一次的机会均等。第二,所考察的事件在任何一个区间里发生与否和在其他区间里发生与否没有相互影响,即是独立的。v针对任何符合上述条件的泊松试验,可以定义一个只取非负整数的随机变量X,它表示“一定时间段或一定空间区域或其他特定单位内某一事件出现的次
39、数”。如一定时间段内,某个航空公司接到的订票电话数;一匹布上发现的疵点数;一定页数的书刊上出现的错别字个数等等。诸如这样只取非负整数的随机变量服从的概率分布为泊松分布泊松分布。66(本科)第5章概率基础ppt课件v定义定义5.13若随机变量 可取一切非负整数值,且 其中 ,则称X服从泊松分布。简记作 。可以证明,是一定区间单位内随机变量X的数学期望或均值 e=2.71828。(5.45)67(本科)第5章概率基础ppt课件【例【例5-14】实验器皿中产生A、B两类细菌的机会是相等的,且产生的细菌X服从参数为的泊松分布。试求产生了B类细菌但没有产生A类细菌的概率。v解:依题意知X的分布律为 而这
40、k个细菌全是B类细菌的概率为 ,所以所求的概率为:68(本科)第5章概率基础ppt课件二、连续型分布二、连续型分布v由于密度函数刻画了一个连续型随机变量取值的统计规律性,因此随机变量按其密度不同可以是多种多样的。下面举一些常见的连续型分布的例子。(一)均匀分布(一)均匀分布v对于只在区间a,b 内取值的随机变量,其密度函数常用均匀分布来描述。v定义5.14如果随机变量X具有如下的密度函数:v则称X服从区间a,b上的均匀分布,记为XUa,b。(5.46)69(本科)第5章概率基础ppt课件【例【例5-15】已知随机变量 服从0,b 上的均匀分布,且 ,试确定常数b及求出概率 。v解:依题意得,X
41、的密度函数为v v根据密度函数的定义,可以得:70(本科)第5章概率基础ppt课件 所以 于是 则该分布的期望及方差如下:71(本科)第5章概率基础ppt课件(二)正态分布(二)正态分布v正态分布是连续型分布中十分重要的一个。大量实践经验和理论分析表明,测量误差及很多产品的物理指标,如某种产品的长度、强度、强力等,都可以看作服从或近似服从正态分布,因此正态分布在概率论与数理统计乃至随机过程的理论及应用中,都占有特别重要的地位。下面我们就来看看它的定义。v定义定义5.15若随机变量X的密度函数为:v其中 0,与 均为常数,称随机变量X服从参数为 的正态分布正态分布(normal distribu
42、tion)简记为 。(5.5.4747)72(本科)第5章概率基础ppt课件v我们在例5-10给出来关于正态分布的期望,即 。正态分布的方差为 (5.48)v这样我们知道,随机变量 ,其随机变量的标准差为。73(本科)第5章概率基础ppt课件v由上述的理论可以看出,不同的 值和不同的值,对应不同的正态分布。正态分布密度函数的图形如图5-1所示。(1)正态曲线的图形是关于x=的对称钟形曲线,且峰值在x=处。(2)正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就惟一确定,不同参数取值的正态分布构成一个完整的正态分布族。74(本科)第5章概率基础ppt课件v(3)正态分布的均值可以是实
43、数轴上的任意数值,它决定正态曲线的具体位置,标准差相同而均值不同的正态曲线在坐标轴上体现为水平位置。v(4)正态分布的标准差为大于零的实数,它决定正态曲线的“陡峭”或“扁平”程度。越大,正态曲线越扁平;越小,正态曲线越陡峭。v(5)当X的取值向横轴左右无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相交。v(6)与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。75(本科)第5章概率基础ppt课件v特别地,当=0,=1时,分布称为标准正态分布,记为N(0,1),相应的密度函数和分布函数分别记为(x)和(x)。v
44、服从标准正态分布的随机变量在某一区间上取值的概率可以通过书后所附的标准正态分布概率表查得。v有了标准正态分布后,就可以将任意一个服从一般正态分布的随机变量XN(,)转化成标准正态分布N(0,1),转换公式为 Z是一个标准正态分布的随机变量,即 Z N(0,1)。(5.49)(5.50)(5.51)76(本科)第5章概率基础ppt课件v一般地,对于服从标准正态分布的随机变量 Z,其变量在任何一个区间上的概率可以表示为v对于负的Z,可以由下式得到:v同样,对于服从一般正态分布的随机变量X,取值在某一个区间上的概率都可以通过标准正态分布求得。(5.52)(5.53)(5.55)(5.56)77(本科
45、)第5章概率基础ppt课件v【例例5-16】设设,求以下概率。,求以下概率。(1)(2)(3)(4)(1)(2)(3)(4)78(本科)第5章概率基础ppt课件v【例例5-17】设设,求以下概率。,求以下概率。(1)(2)解:由于解:由于,那么,那么(1)(2)79(本科)第5章概率基础ppt课件v【例例5-18】某种零件的长度服从正态分布,平均长度为10毫米,标准差为0.2毫米。试问 (1)这从该批零件中随机抽取一件,其长度不到9.4毫米的概率;(2)为了保证产品质量,要求以95的概率保证该零件的长度在9.5 10.5毫米之间,这一要求能否得到保证?v解:已知 (1)(2)即可以用98.76
46、%的概率保证该批零件的长度在9.5 10.5毫米之间,也就是说该批零件的质量要求可以得到保证。80(本科)第5章概率基础ppt课件第四节大数定律与中心极限定理第四节大数定律与中心极限定理大数定律大数定律中心极限定理中心极限定理81(本科)第5章概率基础ppt课件第四节大数定律与中心极限定理第四节大数定律与中心极限定理一、大数定律一、大数定律v人们在长期实践中发现,事件发生的频率具有稳定性,也就是说,随着试验次数的增多,事件发生的频率将稳定于一个确定的常数。另外,人们还从实践中认识到大量测量值的算术平均值也具有稳定性,即平均结果的稳定性。它表明无论随机现象的个别结果如何,或者它们在进行过程中的个
47、别特征如何,大量随机现象的平均结果实际上不受随机现象个别结果的影响,并且几乎不再是随机的,大数定律以数学形式表达并证明了,在一定条件下的、大量重复出现的随机现象的统计规律性,即频率的稳定性与平均结果的稳定性,这就是大数定律的意义。82(本科)第5章概率基础ppt课件v大数定律大数定律:设 为独立同分布的随机变量,其期望为,方差为,即 。则对任意的正数 0,有v大数定律说明,当n充分大时,独立同分布的一系列随机变量,其平均数与它们共同的期望值之间的偏差,可以有很大的把握被控制在任意给定的范围之内。这里需要特别强调的是,由于从总体中抽出的样本是独立且与总体同分布的,因此,当样本容量n很大时,样本平
48、均数与总体平均数之间的误差可以有很大的把握被控制在任意给定的要求之内,这就是人们用样本平均估计总体平均的理论依据。(5.57)83(本科)第5章概率基础ppt课件v如果我们对一个随机变量重复独立地观测n次(例如对某个物体的未知重量作n次测量),则其频率的稳定也可以由大数定律来描述,即设m是n次伯努利试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则对任意 0,都有v该结论称为伯努利大数定律伯努利大数定律,它提供了用频率代替概率的理论依据。这里可以明确大数定律的重要意义。在随机试验中,观察现象是连同一切个别的特性来观察的,这些个别的特性往往蒙蔽了事物的规律性。但是大量的观察中个别因素
49、的影响将相互抵消而使总体稳定。这种规律性正是通过大数来表现出来的。(5.58)84(本科)第5章概率基础ppt课件v同时,在现实生活中,人们所累积的经验表明,概率很接近于1的事件在一次实验中几乎一定要发生,而概率接近于0的事件几乎不可能发生。因此这类事件具有很重要的意义。大数定律就是要建立关于这类事件,尤其是大量独立试验中的事件发生之概率的规律性。伯努利大数定律就是建立了其概率的稳定性,从而使概率的概念有了客观的意义。而且可以通过这一定律做试验确定某事件发生的频率并把它作为相应概率的估计。这类方法就是参数估计,它是统计中的重要方法之一。85(本科)第5章概率基础ppt课件二、中心极限定理二、中
50、心极限定理v正态分布在概率论中处于中心位置,具有很重要的地位和作用,在自然现象和社会现象中有很多随机变量都服从或近似服从正态分布。那前面所研究的大量独立随机变量之和有什么条件下会服从或近似服从正态分布呢?下面我们所要讨论的中心极限定理就是研究这一问题的。v中心极限定理中心极限定理:设随机变量序列 相互独立且同分布,该分布存在有限的期望和方差即 。则当n趋于无穷大时,近似服从正态分布,即 。v从以上的结论,我们可以得到这样的推论,即设随机变量 ,当n 趋于无穷大时,则X近似服从 。这样在大样本下,服从二项分布的随机变量,可以借助正态分布的有关理论来解决。86(本科)第5章概率基础ppt课件v【例