第10章 概率与概率分布.ppt

上传人:s****8 文档编号:68600384 上传时间:2022-12-29 格式:PPT 页数:40 大小:726KB
返回 下载 相关 举报
第10章 概率与概率分布.ppt_第1页
第1页 / 共40页
第10章 概率与概率分布.ppt_第2页
第2页 / 共40页
点击查看更多>>
资源描述

《第10章 概率与概率分布.ppt》由会员分享,可在线阅读,更多相关《第10章 概率与概率分布.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2130011 0010 1010 1101 0001 0100 1011第第10章章 概率与概率分布概率与概率分布 本章主要阐述概率的种类、基本计算、概率分布的种类,常用的离散型随机变量概率分布和连续型随机变量概率分布,为后几章的统计推断打下基础。同时,本章主要从应用的角度研究概率与概率分布,而不参与概率的某些定律的数理推导。10101 1 概率的概念与种类概率的概念与种类 10102 2 概率运算法则概率运算法则10.4 10.4 离散型随机变量概率分布离散型随机变量概率分布 10.3 10.3 概率分布的类型概率分布的类型 10.5 10.5 连续型随机变量概率分布连续型随机变量概率分布

2、 湖南商学院信息系 龚曙明2130011 0010 1010 1101 0001 0100 1011应用统计学10101 1 概率的概念与种类概率的概念与种类 10.1.110.1.1 概率的概念 概率简单地说,就是一个随机事件在某一特定场合下出现的稳定的频率。所谓随机事件,就是在一次观察或一组实验中,每次出现的结果可能是这样,也可能是那样的一种现象,又称偶然事件,不肯定事件或不确定事件.而把对随机事件取值的名称,称为随机变量。概率是用以测定随机事件中某一结果发生的可能性大小程度的相对指标。设A为随机事件中的某一结果,P(A)为A结果出现的概率,m为A结果出现的次数,n代表随机2 2 2 22

3、130011 0010 1010 1101 0001 0100 1011应用统计学事件中所有结果的次数,则:概率是一个介于0与1之间的比率,可用系数或百分数表示。当事件不可能发生时,概率为0;当事件必然要发生时,概率为l。10.1.2 10.1.2 概率的计算方法概率依其计算方法不同,可分为古典概率、试验概率和主观概率。1.古典概率是指当随机事件中各种可能发生的结果及其出现的次数都可以由演绎或外推法得知,而无需经过任何统计试验即可计算各种可能发生结果的概率。3 3 3 32130011 0010 1010 1101 0001 0100 1011应用统计学古典概率的基本特征是:(1)可知性,可由

4、演绎或外推法得知随机事件所有可能发生的结果及其发生的次数;(2)无需试验,即不必做统计试验即可计算各种可能发生结果的概率;(3)准确性,即按古典概率方法计算的概率是没有误差的。2试验概率。根据大量的,重复的统计试验结果计算随机事件各种可能发生结果的概率,称为试验概率或频率概率试验概率的基本特征是:(1)试验性,即必须通过统计试验结果才能计算出各种结果的频率,即试验频率;4 4 4 42130011 0010 1010 1101 0001 0100 1011应用统计学(2)大量重复性,即试验次数必须足够大,重复进行多次试验的条件和程序必须相同;(3)误差性,即频率只是概率的估计值,因而存在误差。

5、因而,概率是一个总体意义上的确定的频率值,当被研究对象是总体的全部单位时,频率就是概率;当被研究对象是总体的部分单位(样本)时,频率只是概率的估计值。当试验次数或抽样次数不断增大时,频率逼近概率。3主观概率。主观概率是依据个人对随机事件的认识、主观地确定随机事件中各种可能发生结果的概率,主观概率是人们对某一事件A发生的信任程度大小的主观评价,即:P(A)=对A发生的信用度 5 5 5 52130011 0010 1010 1101 0001 0100 1011应用统计学4概率的公理。20世纪30年代,苏联数学家柯尔莫哥洛夫提出了概率论的三条公理,从而为概率论理论研究打下了坚实的基础。由这三条公

6、理可推得概率运算的基本法则,进而可导出概率论的整个体系。概率的三条公理是:公理1:事件A发生的概率P(A)为实数,且0P(A)1。公理2:令S为所有的事件的集合,则P(S)=1。公理3:设A1,A2,为各互斥事件,则P(A1+A2+)=P(A1)十P(A2)+6 6 6 62130011 0010 1010 1101 0001 0100 1011应用统计学10102 2 概率运算法则概率运算法则 概率运算法则又称概率运算定理,主要有加法定理和乘法定理。10102 21 1 加法定理1.加法的特殊定理。如果事件(A、B、C)之间是互相排斥互不相容的,即各种可能出现的结果不可能重复出现,则各种事件

7、的概率之和等于它们的个别概率之和。P(A+B+C)=P(A)+P(B)+P(C)2.补偿定理。如果事件之间是相互排斥的,但事件A出现时,其他事件(记作 )不出现时,则称A、为互逆事件,它们的概率总和为:7 7 7 72130011 0010 1010 1101 0001 0100 1011应用统计学 P(A+)=P(A)+P()=1则有:P(A)=1P()P()=1P(A)3加法的一般定理。又称广义的概率加法公式。如果事件A和事件B不是相互排斥的,而是重迭出现的复合事件(积事件),如从一副标准的纸牌中随机抽取l张,出现既是K又是红心(即心K)的事件,就属于复合事件,出现这种情况的概率叫做A和B

8、的联合概率。加法的一般定理是:P(A+B)+P(A)+P(B)P(AB)8 8 8 82130011 0010 1010 1101 0001 0100 1011应用统计学 10.2.2 10.2.2 乘法定理 1乘法的特殊定理。如果一个事件的出现不影响另一个事件的出现,这样出现的事件叫做独立事件。当两个事件独立时,A发生对B发生的概率没有影响,B发生对A发生的概率也没有影响,此时,事件A和事件B同时出现的概率为:P(AB)=P(A)P(B)2乘法的一般定理。乘法的一般定理的应用是有条件的,即事件之间是不独立的,或者说是不重复抽样的。设A、B是两个事件,在已知A发生的条件下,B发生的概率称为B对

9、于A的条件概率,用P(B/A)表示。此时A、B两个事件均发生的概率为:P(AB)=P(A)P(B/A)9 9 9 92130011 0010 1010 1101 0001 0100 1011应用统计学3全概率定理。全概率定理应用的前提条件是:事件A1,A2,An为一完备事件组(即随机事件中,各种可能出现的结果齐备);并且A1,A2,An两两相互排斥,则对任一事件B都有:101010102130011 0010 1010 1101 0001 0100 1011应用统计学10.2.3 10.2.3 贝叶斯定理贝叶斯定理又称逆概定理,是十八世纪四十年代英国数学家T贝叶斯提出的一个对决策非常有用的定理

10、,也是一个计算条件概率的公式。即如果事件A1,A2,An为一完备事件组,则对任一事件有:111111112130011 0010 1010 1101 0001 0100 1011应用统计学10.3 10.3 概率分布的类型概率分布的类型 10.3.1 10.3.1 概率分布的概念概率分布是由随机变量的所有可能取值(xi)及相应的概率P(xi)所组成的分布数列,反映随机变量的分布状况和特征。任何概率分布都具有两个性质:(1)0P(xi)1(2)P(xi)=1概率分布有表列法、函数法、图示法三种表示方式。121212122130011 0010 1010 1101 0001 0100 1011应用

11、统计学10.3.2 10.3.2 概率分布的类型按随机变量的性质不同,概率分布的类型有:概率分布概率分布品质型品质型数量型数量型离散型离散型连续型连续型1品质型随机变量概率分布。由品质型随机变量的所有可能结果(xi)及相应的概率P(xi)组成的分布数列。2数量型随机变量概率分布。由数量型随机变量的取值(xi)及其相应的概率P(xi)组成的分布数列。如例10.13中的骰子点数是个数量型随机变量,因而骰子点数的概率分布属于数量型概率分布。131313132130011 0010 1010 1101 0001 0100 1011应用统计学(1)离散型随机变量概率分布。由离散型随机变量的取值xi及相应

12、的概率P(xi)组成的分布数列,离散型随机变量概率密度函数具有两个性质:10P(xi)1 2P(xi)=1(2)连续型随机变量概率分布。由连续型随机变量(x)的取值区间及相应的概率组成分布数列,在这种概率分布下,由于连续随机变量的取值是一个区间。因此,必须以面积来表示x取某段区间值的概率。根据概率分布的两个要求,若设x的全部取值范围在a和b之间,即oxb,则连续型随机变量概率密度函数必须满足:141414142130011 0010 1010 1101 0001 0100 1011应用统计学v概率密度曲线位于x 轴上方,即非负性:f(x)0v概念密度曲线以下的面积(积分)等于1,即:15151

13、5152130011 0010 1010 1101 0001 0100 1011应用统计学10.3.3 10.3.3 概率分布的特征值概率分布又称概率模型或理论分布。由于概率分布是指随机变量的所有可能取值与其对应的概率所组成的分布数列,故概率分布又是总体分布。有关概率分布的特征值均可使用总体分布的符号。概率分布的重要特征值有:期望值或总体平均数,方差 ,偏态系数 ,峰态系数 等。各种常用的概率分布的特征值将在以下分别介绍。161616162130011 0010 1010 1101 0001 0100 1011应用统计学10.4 10.4 离散型随机变量概率分布离散型随机变量概率分布 10.4

14、.1 10.4.1 分立均等分布分立均等分布称离散型等概率分布,其定义为:若离散型随机变量的分布具有下列概率函数:则称其为分立均等分布。式中N为正整数,是此分布的总体参数。分立均等分布的两个重要特征值分别为:(x=1,2,N)171717172130011 0010 1010 1101 0001 0100 1011应用统计学由这两个特征可知,某一分立均等分布的总体参数N确定后,则该分布的两个特征值也就确定了。10.4.2 10.4.2 二点分布二点分布 二点分布又称点二项分布,若互相独立的重复试验只有“成功”和“失败”两种结果,这种试验称为贝努里试验,可取:181818182130011 00

15、10 1010 1101 0001 0100 1011应用统计学如掷硬币,产品质量(合格品和次品)检验、孕妇未出生的婴儿性别判断等问题都属于贝努里实验。贝努里实验的特征为:1实验的现象只有两种互斥结果,即“成功”与“失败”。2成功事件发生的概率为p,失败的概率为q,且p+q=1。3贝努力实验为独立实验。二点分布的概率函数可表达为:x=1 191919192130011 0010 1010 1101 0001 0100 1011应用统计学二点分布的重要特征值为:1期望值 E(x)=P2方 差 V(x)=pq其中p为总体参数,当二点分布的总体参数p确定后,该分布的期望值和方差也就确定了。二点分布的

16、图形只有两点,因而其概率函数为二项分布的概率函数:x=0,1,2,n n=1时的特例,故二点分布又称为点二项分布。202020202130011 0010 1010 1101 0001 0100 1011应用统计学 10.4.3 10.4.3 超几何分布超几何分布是离散型随机变量概率分布的一种,它是建立在超几何实验基础之上的,若并非独立的不重复试验中,总体N中有“成功”类者为K个,失败类者为NK个,从总体中抽取n个作为样本时,称为超几何实验(参图101)图5 超几何实验212121212130011 0010 1010 1101 0001 0100 1011应用统计学超几何实验具有下列性质:1

17、从一个含有N个个体的总体中,以不重复方式随机抽取n个作为样本,各次试验(抽样)并非独立的。2总体N中成功类者为K个,失败类者为NK个。3样本中抽自成功类者为x个,抽自失败类者为nx个。4由于不重复试验(抽样),每次试验成功的概率受其前次试验结果的影响,故成功的概率不能维持不变。222222222130011 0010 1010 1101 0001 0100 1011应用统计学超几何分布的定义为:若离散型随机变量的分布具有下列概率函数:则称为超几何分布。式中N、K、n都为正整数,是此分布的三个参数,且NKn,或NKn。超几何分布的两个重要特征值为:期望值:方 差:232323232130011

18、0010 1010 1101 0001 0100 1011应用统计学其中称为有限总体较正因子,当采用不重复随机抽样时才须考虑,因而又称不重复抽样较正因子。10.4.4 10.4.4 二项分布二项分布是一种重要的离散型随机变量概率分布,它是建立在重复进行n次贝努里实验(二项实验)基础上的。二项实验的性质为:1一个简单的贝努里实验重复独立试行n次,共有n+1个可能发生的结果,即x=0,1,2,n。2每次试验的结果只有“成功”或“失败”两种互斥的结果。3每次试验关心的是概率p保持不变。4每次试验关心的是成功事件是否出现。242424242130011 0010 1010 1101 0001 0100

19、 1011应用统计学二项分布定义为:若离散型随机变量分布具有下列概率函数:则称其为二项分布。式中q=1-p,0p1;n为正整数。n和p为二项分布的两个重要参数。二项分布的重要特征值为:252525252130011 0010 1010 1101 0001 0100 1011应用统计学偏态系数:峰态系数:由偏态系数 可知二项分布的偏态:(1)当p=1/2,=0,二项分布为对称分布。(2)当p1/2,0,二项分布为右偏分布。(3)当p1/2,0,二项分布为左偏分布。262626262130011 0010 1010 1101 0001 0100 1011应用统计学由峰态系数 可知二项分布的峰态:(

20、1)当pq=1/6,=3,二项分布具有常态峰。(2)当pq1/6,3,二项分布具有低阔峰。(3)当pq1/6,3,二项分布具有高狭峰。272727272130011 0010 1010 1101 0001 0100 1011应用统计学10.4.5 10.4.5 普哇松分布普哇松分布也是一种重要的离散型随机变量概率分布,它适于描述某些稀有事件的状态或出现机会非常小的一些事件(如特大洪水、火山爆发、民航飞机失事、核反应堆逸漏事件等),它是由普阿松于1837年提出的。设随机变量x表示一实验的“成功”次数,即在一段时间或一定区域内,该实验中某一特定事件发生的次数,则普哇松实验具有以下性质:1发生在一定

21、时间或特定区域内的成功次数x的期望值E(x)=为已知,或E(x)=np为已知。2不管时间或区域的始点,某一特定事件在某一段时间或特定区域内发生的概率相同。282828282130011 0010 1010 1101 0001 0100 1011应用统计学3在极短时间或极小区域内,某一特定事件发生超过一次的概率略而不计。4某一特定事件在各段时间或特定区域上出现是相互独立的。5特定事件的成功次数的期望值与所选择的时间或区域的大小 t 成正比,其关系为 。普哇松分布的定义为:若离散型随机变量x的分布具有下列概率函数:292929292130011 0010 1010 1101 0001 0100 1

22、011应用统计学称为普哇松分布。其中为此分布的参数,e=2.71828。其分布的重要特征值为:期 望 值:E(x)=方 差:V(x)=偏态系数:峰态系数:期望值与方差均为是普哇松布的一大特性。当 ,时,普哇松分布为具有高狭峰的右偏分布;当 随增加而趋向于0时,其偏斜程度则随的增加而逐渐减小,最终成对称分布;随增加而趋向3时,则高狭程度的峰态会随的增加而逐渐减慢,最终成为常态峰。303030302130011 0010 1010 1101 0001 0100 1011应用统计学10.5 10.5 连续型随机变量概率分布连续型随机变量概率分布 10.5.1 10.5.1 正态分布 正态分布又称常态

23、分布或高斯分布,是一种非常重要的连续型随机变量的概率分布。其定义为:若连续型随机变量x的分布具有下列概率密度函数:则称为正态分布。式中和为此分布的参数。(为总体均值,为总体标准差),e=2.71828,=3.1416。313131312130011 0010 1010 1101 0001 0100 1011应用统计学正态分布的重要特征值为:(1)期望值:E(x)=,且=Me=M0(2)方 差:(3)偏态系数:(4)峰态系数:正态分布具有下列重要性质:1正态分布具有常态峰,即以为中心的左右对称分布,左右二者面积相等,均为1/2。2正态分布曲线左右两尾与横轴渐近,但不与横轴相交,即-x。32323

24、2322130011 0010 1010 1101 0001 0100 1011应用统计学3当x=值时,正态分布的概率密度函数值最大,当x时,f(x)的值随x的值递增而递减。4正态分布曲线有两个拐点,分别在横轴-与+所对应的曲线上。5正态分布曲线下的面积(区间概率)是固定的。333333332130011 0010 1010 1101 0001 0100 1011应用统计学图图9 9 正态分布正态分布x x的取值区间及概率的取值区间及概率343434342130011 0010 1010 1101 0001 0100 1011应用统计学在实践中,由于不同现象的随机变量有不同的参数和,且不同随机

25、变量的计量单位也不同,因而有不同的正态分布形状,从而给正态分布的应用带来了不便之处。为此,可令正态分布概率密度中的,则有:因此,新的随机变量z仍服从正态分布,且该正态分布的参数=0,=1。同时,无论x的计量单位如何,新变量以为计量单位,则称 z 为标准正态随机变量,称 z 的分布为标准正态分布。其重要的特征值为:353535352130011 0010 1010 1101 0001 0100 1011应用统计学 期 望 值:E(z)=0方 差:V(z)=l偏态系数:峰态系数:最高纵轴:363636362130011 0010 1010 1101 0001 0100 1011应用统计学由于任何正

26、态分布都可以通过 的变量转换化为标准正态分布(z分布),因此,只要计算出正态随机变量z的取值区间-,z,就可求出相应的区间概率P(zzi),并将其编成z分布表,从而利用z分布表就可求出任何正态随机变量x的取值区间x1,x2的概率。即:373737372130011 0010 1010 1101 0001 0100 1011应用统计学正态分布在统计方法应用或统计推断的抉择上,占有非常重要的地位;1许多客观现象的分布大多为正态分布,如成年人的身高、机械零件的长度、学童的智力、误差分布等等。2正态分布可作为一些离散型随机变量的概率分布的近似,例如二项分布、普哇松分布、超几何分布等,当n增大时,均可转

27、换为正态分布。3在统计标准中,许多问题均可在正态分布的假设下获得解决。例如,小样本抽样分布(卡方分布、t分布、F分布等)常假设总体呈正态分布。4许多大样本的抽样分布通常将正态分布视为极限,以便进行统计推断。383838382130011 0010 1010 1101 0001 0100 1011应用统计学10.5.2 10.5.2 指数分布指数分布主要应用于产品寿命的分析,是一种连续型随机变量的概率分布。其定义为:若连续型随机变量x的分布具有下列概率函数:则称为指数分布。式中0,为此分布的参数。指数分布的重要特征值为:期望值:方 差:众 数:M0=0393939392130011 0010 1010 1101 0001 0100 1011应用统计学10.5.3 10.5.3 均匀分布均匀分布是连续型随机变量z在有限区间(a,b)内取值较为均匀的概率分布。其定义为:若随机变量x在有限区间(a,b)内取值满足下列概率函数:axb 其它其它 则称x在区间(a,b)上服从均匀分布。式中a,b为此分布的参数。均匀分布的两个重要特征是:期望值:方 差:40404040

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁