《复习-概率论与概率统计-精品文档资料整理.ppt》由会员分享,可在线阅读,更多相关《复习-概率论与概率统计-精品文档资料整理.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率论与数理统计概率论与数理统计(复习复习)概率论和概率分布概率论和概率分布数理统计数理统计概率论和概率分布主要内容概率的定义概率的定义概率的重要公式概率的重要公式随机变量随机变量离散型随机变量离散型随机变量连续型随机变量连续型随机变量多维随机变量多维随机变量大数定律和中心极限定理大数定律和中心极限定理概率论概率论研究和揭示随机现象的统计规律性研究和揭示随机现象的统计规律性 的科学。的科学。概率与频率概率与频率频率频率n 事件发生事件发生频繁程度频繁程度的变量的变量n 频率是随着试验的变化而变化频率是随着试验的变化而变化概率概率n 事件在试验中出现事件在试验中出现可能性大小可能性大小的数值度量
2、,的数值度量,取取 值范围为值范围为0到到1之间。之间。n 概率是唯一的、客观存在的概率是唯一的、客观存在的n 随着试验次数的无限增大,频率越来越接近随着试验次数的无限增大,频率越来越接近于于 概率概率抛硬币试验抛硬币试验实验者实验者掷硬币的次数掷硬币的次数正面出现次数正面出现次数正面出现频率正面出现频率BuffonBuffon40404040204820480.50690.5069PearsonPearson1270012700601960190.50160.5016PearsonPearson240002400012012120120.50050.5005概率的定义概率的定义古典概率古典概
3、率l样本空间包含有限个样本点样本空间包含有限个样本点l每个样本点(基本事件)出现的可能性相同每个样本点(基本事件)出现的可能性相同统计概率统计概率l当实验次数无穷大时,频率趋于概率当实验次数无穷大时,频率趋于概率主观概率主观概率概率的几个重要公式概率的几个重要公式1、逆事件概率、逆事件概率2、条件概率、条件概率 P(A B)=P(AB)/P(B)3、加法公式、加法公式 P(AB)=P(A)+P(B)-P(AB)l当当A、B互斥即互斥即AB=时,时,P(AB)=P(A)+P(B)4、乘法公式、乘法公式P(AB)=P(B)P(AB)=P(A)P(BA)l当当A、B独立即独立即P(A B)=P(A)
4、时,时,P(AB)=P(A)P(B)5、全概率公式、全概率公式6、逆概率公式(、逆概率公式(Bayes公式)公式)定义定义 事件组事件组A1,A2,An(n可为可为),称为样本空间,称为样本空间的的一个划分,若满足:一个划分,若满足:定理定理定理定理 设设设设A A1 1,,A,An n是是是是的一个划分,且的一个划分,且的一个划分,且的一个划分,且P(AP(Ai i)0)0,(i i1 1,n)n),则对任何事件,则对任何事件,则对任何事件,则对任何事件B B 有有有有 全概率解决的问题:原因全概率解决的问题:原因全概率解决的问题:原因全概率解决的问题:原因结果结果结果结果全概率公式全概率公
5、式全概率公式全概率公式全概率公式全概率公式全概率公式全概率公式-例题分析例题分析 市场上有甲、乙、丙三家工厂生产的同一品牌产品,已知三家工市场上有甲、乙、丙三家工厂生产的同一品牌产品,已知三家工厂的市场占有率分别为厂的市场占有率分别为2525、3535 、4040 ,且三家工厂的次品,且三家工厂的次品率分别为率分别为 5 5、4 4、3 3,试求市场上该品牌产品的次品率。,试求市场上该品牌产品的次品率。若从市场得到一件产品是次品,问三个厂家谁生产了这个次若从市场得到一件产品是次品,问三个厂家谁生产了这个次品的可能性最大?品的可能性最大?问题:求问题:求P(AiB),),i1,2,3解:由条件概
6、率定义和乘法公式,得解:由条件概率定义和乘法公式,得乙厂家生产这个次品的可能性最大。乙厂家生产这个次品的可能性最大。乙厂家生产这个次品的可能性最大。乙厂家生产这个次品的可能性最大。贝叶斯公式贝叶斯公式定理定理 设设A1,,An是是的一个划分,且的一个划分,且P(Ai)0,(i1,n),则对任何事件,则对任何事件B 有有 贝叶斯公式贝叶斯公式贝叶斯公式贝叶斯公式先验概率先验概率先验概率先验概率:概率:概率:概率:概率P P(A Ai i)称为事件)称为事件)称为事件)称为事件A Ai i 的先验概率,对事件的先验概率,对事件的先验概率,对事件的先验概率,对事件A Ai i发生发生发生发生 概率的
7、主观臆断。概率的主观臆断。概率的主观臆断。概率的主观臆断。后验概率后验概率后验概率后验概率:概率:概率:概率:概率P P(A Ai iB B)称为事件)称为事件)称为事件)称为事件A Ai i的后验概率,反映的是的后验概率,反映的是的后验概率,反映的是的后验概率,反映的是 在获得了更多信息的条件下,对主观臆断的修正。在获得了更多信息的条件下,对主观臆断的修正。在获得了更多信息的条件下,对主观臆断的修正。在获得了更多信息的条件下,对主观臆断的修正。贝叶斯解决的问题:结果贝叶斯解决的问题:结果原因原因通讯中,通讯中,通讯中,通讯中,B B表示接受信号,而表示接受信号,而表示接受信号,而表示接受信号
8、,而A Ai i(i=1,2,(i=1,2,)表示发送信号;表示发送信号;表示发送信号;表示发送信号;产品验收,产品验收,产品验收,产品验收,B B 表示产品的等级,而表示产品的等级,而表示产品的等级,而表示产品的等级,而A Ai i表示生产厂家;表示生产厂家;表示生产厂家;表示生产厂家;刑事案件侦察,刑事案件侦察,刑事案件侦察,刑事案件侦察,B B表示发生一起刑事案件,而表示发生一起刑事案件,而表示发生一起刑事案件,而表示发生一起刑事案件,而A Ai i表示犯罪嫌疑人表示犯罪嫌疑人表示犯罪嫌疑人表示犯罪嫌疑人 。贝叶斯公式体现了贝叶斯公式体现了“认识认识(先验概率先验概率)”-“实践实践(样
9、本信息样本信息)”-“再认识再认识(后验概率后验概率)”-“再实践再实践”-不断深入的认识过程不断深入的认识过程概率之间关系概率之间关系随机事件与随机变量随机事件与随机变量随机变量的引入是对随机事件的抽象随机变量的引入是对随机事件的抽象对随机事件的研究可以转化为对随机变量的研究,对随机事件的研究可以转化为对随机变量的研究,可以借助于高等数学的知识研究随机现象规律可以借助于高等数学的知识研究随机现象规律按照随机变量的取值,随机变量分为离散型和连按照随机变量的取值,随机变量分为离散型和连续型,二者续型,二者的数学处理方法实质上是一致的的数学处理方法实质上是一致的随机变量随机变量是取值带随机性的变量
10、,即在随机试验中被测量的量是取值带随机性的变量,即在随机试验中被测量的量 。是定义在样本空间上的是定义在样本空间上的函数函数,即对于随机试验的每一个可能的,即对于随机试验的每一个可能的结果结果W,W,都有一个函数都有一个函数X(W)X(W)与它对应。与它对应。习惯上,常用最后面几个大写英文字母习惯上,常用最后面几个大写英文字母X X、Y Y、,U,U、V V、W W,表示随机变量。表示随机变量。随机事件可以表示为随机变量在某一范围内的取值。随机事件可以表示为随机变量在某一范围内的取值。C=C=掷一枚骰子,出现的点数为掷一枚骰子,出现的点数为1 1=X X1 1D=D=掷一枚骰子,出现的点数小于
11、掷一枚骰子,出现的点数小于3 3 X X3 3F=F=接到至多接到至多4 4次呼唤次呼唤=0 0X4X4抛硬币的试验中出现正面的事件可以表示为:抛硬币的试验中出现正面的事件可以表示为:出现正面出现正面出现反面出现反面随机变量及其分布随机变量及其分布随机变量与分布的研究类似于高等随机变量与分布的研究类似于高等数学中变量与函数的研究数学中变量与函数的研究函数的研究着重讨论六大类基本初函数的研究着重讨论六大类基本初等函数,随机分布的研究则讨论其等函数,随机分布的研究则讨论其常用分布常用分布理论分布与统计分布理论分布与统计分布理论分布也称为概率分布理论分布也称为概率分布统计分布也称为频率分布统计分布也
12、称为频率分布由概率与频率的关系,得知:由概率与频率的关系,得知:理论分布是客观存在的,反映了随机事件理论分布是客观存在的,反映了随机事件发生的概率的一般规律;频率分布是现实发生的概率的一般规律;频率分布是现实的反映,随着试验的变化而变化的反映,随着试验的变化而变化统计的任务就是由统计分布研究理论分布统计的任务就是由统计分布研究理论分布随机变量的理论分布随机变量的理论分布离散随机变量离散随机变量n概率分布、分布函数概率分布、分布函数连续随机变量连续随机变量n概率密度、分布函数概率密度、分布函数随机变量的数字特征随机变量的数字特征数学期望(均值)数学期望(均值)n离散随机变量离散随机变量n连续随机
13、变量连续随机变量方差(随机变量取值离散程度的度量)方差(随机变量取值离散程度的度量)n离散随机变量离散随机变量n连续随机变量连续随机变量lDX小小随机变量随机变量X的分布比较集中的分布比较集中波动小,稳定波动小,稳定lDX大大随机变量随机变量X的分布比较教散的分布比较教散波动大,不稳定波动大,不稳定样本的数字特征样本的数字特征样本均值样本均值样本方差样本方差样本均值与样本方差是统计中的两大类样本均值与样本方差是统计中的两大类指标指标常用离散型随机变量分布常用离散型随机变量分布1 1 1 1、两点分布或(、两点分布或(、两点分布或(、两点分布或(0 0 0 01 1 1 1)分布)分布)分布)分
14、布l若以随机变量若以随机变量X表示进行一次试验事件表示进行一次试验事件A发生的次数,则发生的次数,则称称X服从服从(01)分布分布(两点分布两点分布),亦称伯努利分布。,亦称伯努利分布。2 2 2 2、二项分布、二项分布、二项分布、二项分布l 若以随机变量若以随机变量X表示表示n 重伯努里试验事件重伯努里试验事件A发生的次数,发生的次数,则称则称X服从参数为服从参数为n,p 的二项分布,记作的二项分布,记作XB(n,p)l统计中有重要用途:对应于统计中的统计中有重要用途:对应于统计中的重复抽样重复抽样(有放回抽有放回抽样样),即每次抽样中,每个单位被抽中的可能性一样大,),即每次抽样中,每个单
15、位被抽中的可能性一样大,且相互独立。且相互独立。l特征:独立性、等可能性特征:独立性、等可能性3 3 3 3、泊松分布、泊松分布、泊松分布、泊松分布l泊松分布是二项分布的极限分布,当泊松分布是二项分布的极限分布,当n很大,很大,p 很小时,二项分很小时,二项分布就可近似地看成是参数布就可近似地看成是参数=np 的泊松分布,记作的泊松分布,记作XP()。l特征特征考察的事件在任意两个长度相等的区间里发生一次的机会相等考察的事件在任意两个长度相等的区间里发生一次的机会相等所考察的事件在任意一个区间里发生与否和在其他时间里发生与否所考察的事件在任意一个区间里发生与否和在其他时间里发生与否相互独立。相
16、互独立。l例如例如一定时间到汽车站等候公共汽车的人数一定时间到汽车站等候公共汽车的人数一定页数的书刊上出现的错别字个数一定页数的书刊上出现的错别字个数 l采采用用不不重重复复抽抽样样(不不放放回回抽抽样样),各各次次试试验验并并不不独独立立,成功的概率也互不相等成功的概率也互不相等l总总体体元元素素的的数数目目N很很小小,或或样样本本容容量量n相相对对于于N来来说说较较大时,样本中大时,样本中“成功成功”的次数则服从超几何分布的次数则服从超几何分布l概率分布为概率分布为4 4 4 4、超几何分布、超几何分布、超几何分布、超几何分布【例例】假假定定有有10支支股股票票,其其中中有有3支支购购买买
17、后后可可以以获获利利,另另外外7支支购购买买后后将将会会亏亏损损。如如果果你你打打算算从从10支支股股票票中中选选择择4支支购购买买,但你并不知道哪但你并不知道哪3支是获利的,哪支是获利的,哪7支是亏损的。求支是亏损的。求 (1)有有3支能获利的股票都被你选中的概率有多大?支能获利的股票都被你选中的概率有多大?(2)3支可获利的股票中有支可获利的股票中有2支被你选中的概率有多大?支被你选中的概率有多大?解:解:解:解:设设N N=1010,MM=3=3,n n=4=4连续型随机变量连续型随机变量自动包装白糖的机器包装出来的净重在自动包装白糖的机器包装出来的净重在0.980.98到到1.021.
18、02公斤之公斤之间的概率间的概率某地区明天的降雨量在某地区明天的降雨量在1515到到3535毫米之间的概率毫米之间的概率对于连续随机变量,所求概率往往为某一范围取值的概率对于连续随机变量,所求概率往往为某一范围取值的概率(对于某一点取值的概率为零)(对于某一点取值的概率为零)1 1、概率密度函数、概率密度函数随机变量随机变量随机变量随机变量X X落在区间落在区间落在区间落在区间 的概率(面积)的概率(面积)的概率(面积)的概率(面积)为为为为X X的概率分布密度函数,简称概率密度,可以说随机变量的概率分布密度函数,简称概率密度,可以说随机变量的概率分布密度函数,简称概率密度,可以说随机变量的概
19、率分布密度函数,简称概率密度,可以说随机变量X X服从概服从概服从概服从概率密度为率密度为率密度为率密度为 的分布,其性质:的分布,其性质:的分布,其性质:的分布,其性质:(1 1 1 1)非负性)非负性)非负性)非负性(2 2 2 2)归一性)归一性)归一性)归一性2 2、分布函数、分布函数 设设X是随机变量,对任意实数是随机变量,对任意实数x,事件,事件 的概率的概率 称为随机变量称为随机变量X X的分布函数;分布函数可以描述随机变量的概率的分布函数;分布函数可以描述随机变量的概率分布。记为分布。记为F(x),即,即随机变量随机变量随机变量随机变量X X在区间在区间在区间在区间 内的概率内
20、的概率内的概率内的概率1 1、正态分布、正态分布2 2、均匀分布、均匀分布3 3、指数分布、指数分布常用连续型随机变量分布常用连续型随机变量分布如果随机变量如果随机变量如果随机变量如果随机变量X X的的的的概率密度函数概率密度函数概率密度函数概率密度函数为:为:为:为:式中式中式中式中 和和和和 2 2为常数,则称为常数,则称为常数,则称为常数,则称X X服从参数为服从参数为服从参数为服从参数为 和和和和 2 2的正态分布,记为的正态分布,记为的正态分布,记为的正态分布,记为正态分布正态分布正态随机变量正态随机变量正态随机变量正态随机变量X X的期望(均值):的期望(均值):的期望(均值):的
21、期望(均值):正态随机变量正态随机变量正态随机变量正态随机变量X X的方差:的方差:的方差:的方差:若若若若 ,则正态随机变量,则正态随机变量,则正态随机变量,则正态随机变量X X分布函数分布函数分布函数分布函数为:为:为:为:不同的不同的 值和值和 值值不同的正态分布不同的正态分布正态概率密度函数的特点:正态概率密度函数的特点:以直线以直线以直线以直线 x x=为对称轴;为对称轴;为对称轴;为对称轴;在在在在 x x=处有最大值处有最大值处有最大值处有最大值 ;固定固定固定固定 ,变动,变动,变动,变动 图形沿图形沿图形沿图形沿x x轴平行移动轴平行移动轴平行移动轴平行移动固定固定固定固定
22、,变大变大变大变大图形高度下降,平坦图形高度下降,平坦图形高度下降,平坦图形高度下降,平坦固定固定固定固定 ,变小变小变小变小图形高度上升,陡峭图形高度上升,陡峭图形高度上升,陡峭图形高度上升,陡峭标准正态分布标准正态分布 参数参数=0,2=1 的正态分布称为的正态分布称为标准正态分布标准正态分布,记作,记作XN(0,1)。l l标准正态概率密度函数标准正态概率密度函数标准正态概率密度函数标准正态概率密度函数 为:为:l l标准正态分布函数标准正态分布函数标准正态分布函数标准正态分布函数 为:为:l l标准正态分布性质:标准正态分布性质:标准正态分布性质:标准正态分布性质:若若若若 ,则,则,
23、则,则 标准化变换标准化变换标准化变换标准化变换 一般的概率统计教科书均附有一般的概率统计教科书均附有标准正态分布表标准正态分布表供读者查阅供读者查阅(x)的值。的值。标准正态分布表如下:标准正态分布表如下:某零件的寿命服从均值为某零件的寿命服从均值为12001200小时,标准差为小时,标准差为250250小时的正态分小时的正态分布,随机地抽取一只零件,求:布,随机地抽取一只零件,求:(1)(1)它的寿命不低于它的寿命不低于13001300小时的概率;小时的概率;(2)(2)它的寿命在它的寿命在11001100到到13001300小时之间的概率。小时之间的概率。设零件的寿命为设零件的寿命为设零
24、件的寿命为设零件的寿命为X X,则,则,则,则 均匀分布均匀分布则称则称则称则称X X在区间在区间在区间在区间(a a,b b)内服从均匀分布,记作内服从均匀分布,记作内服从均匀分布,记作内服从均匀分布,记作对任意实数对任意实数 ,都有都有指数分布指数分布则称则称X服从参数为服从参数为 0的的指数分布,记作指数分布,记作 。其分布函数为:其分布函数为:例如,某产品的寿命,银行客户等待服务的时间等,都可以例如,某产品的寿命,银行客户等待服务的时间等,都可以认为服从指数分布认为服从指数分布常用离散型随机变量分布及其数学期望与方差常用离散型随机变量分布及其数学期望与方差常用离散型随机变量分布及其数学
25、期望与方差常用离散型随机变量分布及其数学期望与方差名称及记号名称及记号概率分布概率分布数学期望数学期望方差方差“0-10-1”分布分布X=0,1(0X=0,1(0p p1)1)p pp qp q二项分布二项分布B(n,p)B(n,p)X=0,1,X=0,1,n(0,n(0p p1)1)n pn pn p qn p q超几何分布超几何分布H(n,M,N)H(n,M,N)X=0,1,X=0,1,min(n,M)min(n,M)(0MN,0nN)(0MN,0nN)泊松分布泊松分布P()P()X=0,1,X=0,1,(0)0)几何分布几何分布G(p)G(p)X=1,2X=1,2(0(0p p1)1)常
26、用连续型随机变量分布及其数学期望与方差常用连续型随机变量分布及其数学期望与方差常用连续型随机变量分布及其数学期望与方差常用连续型随机变量分布及其数学期望与方差名称及记号名称及记号概率密度概率密度数学期望数学期望方差方差均匀分布均匀分布U(0,1)U(0,1)axb axb x xa a或或x xb b正态分布正态分布N(,)N(,)-x x+2 2指数分布指数分布e()e()x x0 0 x0 x0(0)0)多维随机变量多维随机变量联合分布(讨论多个随机变量的共同分布)联合分布(讨论多个随机变量的共同分布)边缘概率边缘概率(分布分布)(讨论单个随机变量的分布)(讨论单个随机变量的分布)条件概率
27、条件概率(分布分布)(讨论在已知某个随机变量的前(讨论在已知某个随机变量的前提下其他随机变量的分布)提下其他随机变量的分布)随机变量的独立性(讨论随机变量之间的联系)随机变量的独立性(讨论随机变量之间的联系)多维随机变量的数字特征多维随机变量的数字特征数学期望数学期望方差方差相关系数相关系数大数定律与中心极限定理大数定律与中心极限定理 大数定律:大数定律:观测值的算术平均值的稳定性观测值的算术平均值的稳定性 频率的稳定性频率的稳定性概率概率 小概率事件实际不可能性原理小概率事件实际不可能性原理中心极限定理:样本均值的极限分布是正态分布中心极限定理:样本均值的极限分布是正态分布Excel中的统计
28、函数lBINOMDIST计算二项分布的概率计算二项分布的概率lPOISSON计算泊松分布的概率计算泊松分布的概率lHYPGEOMDIST计算超几何分布的概率计算超几何分布的概率lNORMDIST计算正态分布的概率计算正态分布的概率lNORMINV计算正态分布的区间点计算正态分布的区间点(临界值临界值)lNORMSDIST 计算标准正态分布的概率计算标准正态分布的概率lNORMSINV计算标准正态分布的区间点计算标准正态分布的区间点(分位数分位数)lCHIDIST计算计算c c2分布的右尾概率分布的右尾概率lCHIINV计算给定计算给定c c2分布的右尾概率的临界值分布的右尾概率的临界值lFDIST 计算计算F分布的右尾概率分布的右尾概率lFINV 计算给定计算给定F右尾概率的临界右尾概率的临界lTDIST计算给定计算给定t值的分布概率值的分布概率lTINV计算给定概率的计算给定概率的t值值