《概率与理论分布精选课件.ppt》由会员分享,可在线阅读,更多相关《概率与理论分布精选课件.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于概率与理论分布关于概率与理论分布第一页,本课件共有36页第一节第一节 事件、概率和随机变量事件、概率和随机变量 事件和事件发生的概率 事件之间的关系 计算概率的法则 随机变量 第四章第二页,本课件共有36页一、事件和事件发生的概率一、事件和事件发生的概率事件:事件:每种可能出现的情况称为事件。它是指事物发生某种情况或每种可能出现的情况称为事件。它是指事物发生某种情况或试验中获得某种结果。试验中获得某种结果。概率:概率:就是用来度量每一事件出现的可能性大小的数字特征。就是用来度量每一事件出现的可能性大小的数字特征。频率:频率:在在n n次试验中,事件出现的次数次试验中,事件出现的次数 叫做在
2、这叫做在这n n次次试验中的频数,而的频数与试验次数的比叫事件在试验中的频数,而的频数与试验次数的比叫事件在n n次试验中出现的频率记为次试验中出现的频率记为第三页,本课件共有36页 频率和概率是不相同的,只有当试验次数无限增大时,任一事频率和概率是不相同的,只有当试验次数无限增大时,任一事件的频率趋于稳定,这时频率又称统计概率这时的频率和概率才件的频率趋于稳定,这时频率又称统计概率这时的频率和概率才是一样的是一样的调查株数调查株数(n n)受害株数受害株数(a a)植株受害频率植株受害频率(a/na/n)0.400.400.480.480.300.300.330.330.360.360.35
3、40.3540.3510.3510.3500.3500.3520.352第四页,本课件共有36页 随机事件:指在同一组条件下,可能发生也可能不发生的事件。也就是说,在某一特定的条件下,可能这样出现也可能那样出现,可能发生的只是其中的几种情况,这种事件称为随机事件。第五页,本课件共有36页二、事件之间的关系二、事件之间的关系和事件:事件A和事件B至少有一个发生构成的新事件称事件A和事件B的和事件。记作A+B。积事件:事件A和事件B同时发生构成的新事件,又叫变事件,记作AB 互斥事件:A和B不可能同时存在(或发生)即AB为不可能事件,那么称事件A和事件B是互斥事件。对立事件:事件A和B不可能同时发
4、生,但必须发生其一,即A+B为必然事件,AB为不可能事件,这样A、B互为对立事件 B是A的对立,记为第六页,本课件共有36页完全事件系:n个事件两两互斥,且每次试验必有其一出现。则这n个事件构成完全事件系。事件的独立性(独立事件):事件A发生与否不影响事件B发生的可能性,反之亦然,那么就称事件A对于事件B是独立的。简称独立事件。第七页,本课件共有36页三、计算概率的法则三、计算概率的法则法法法法则则则则1 1:互互斥斥事事件件的的加加法法:假假定定两两互互斥斥事事件件的的概概率率分分别别为为P P(A A)和和P P(B B)。则则事事件件A A与与B B的的和和事事件件的的概概率率等等于于事
5、事件件A A的的概概率率与与事事件件B B的的概概率率之之和和,即即 P(A+B)=P(A)+P(B)P(A+B)=P(A)+P(B)。加加法法定定理理对对于于多多个个两两互斥的事件也成立。两两互斥的事件也成立。P(A+B+P(A+B+N)=P(A)+P(B)+P(N)+N)=P(A)+P(B)+P(N)。推理推理推理推理1 1:完全事件系的概率:完全事件系的和事件概率完全事件系的概率:完全事件系的和事件概率 等于等于1 1。P(A+B+P(A+B+N)=P(A)+P(B)+P(N)=1N)=P(A)+P(B)+P(N)=1。推理推理推理推理2 2:对立事件的概率:对立事件的概率互补。若事件对
6、立事件的概率:对立事件的概率互补。若事件A A的的概率为概率为P P(A A),那么其对立事件的概率为),那么其对立事件的概率为 因为第八页,本课件共有36页法则法则法则法则2 2:独立事件的乘法:假定独立事件的乘法:假定P P(A A)和)和P P(B B)是两个独立事件)是两个独立事件A A与与B B 各自出现的概率,则事件各自出现的概率,则事件A A与与B B同时出现的概率就等于两同时出现的概率就等于两独立事件出现概率的乘积,即独立事件出现概率的乘积,即 ,乘法,乘法定理对于定理对于n n个相互独立的事件也成立,即个相互独立的事件也成立,即 推理推理推理推理1 1:若若n n个事件个事件
7、A A、B B、NN彼此独立,且当彼此独立,且当P(A)=P(B)=P(N)P(A)=P(B)=P(N)时,则时,则P(ABN)=P(A)P(ABN)=P(A)n n。推理推理推理推理2 2:非独立事件的乘法:如果事件非独立事件的乘法:如果事件A A和和B B是非独立的,那么事件是非独立的,那么事件A A与与B B同时发生的概率为事件同时发生的概率为事件A A的概率的概率P P(A A)乘以事件)乘以事件A A发生的发生的情况下事件情况下事件B B发生的概率发生的概率P P(B/AB/A),即),即()()()()()()第九页,本课件共有36页四、随四、随 机机 变变 量量 随机变量:随机变
8、量:是指从随机变数中所取得的某一实数值。是指从随机变数中所取得的某一实数值。随机变量离散型随机变量连续型随机变量第十页,本课件共有36页离散型随机变量:离散型随机变量:试验只有几个确定的结果,并可一一列出,变量y的取值可用实数表示,且y取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。将这种变量所有可能取值及其对应概率一一列出所形成的分布称离散型随机变量的概率分布,也可用函数f(y)表示,称为概率函数。连续型随机变量:连续型随机变量:变量y的取值仅是一个范围,且y在该范围内取值时,其概率是确定的。这时取y为一固定值是无意义的,因为在连续尺度上一点的概率几乎为0。这种类型的变量称为连
9、续型随机变量。第十一页,本课件共有36页对于随机变量,若存在非负可积函数对任意a和b(ab)都有则称y为连续型随机变量,f(y)称为y的概率密度函数或分布密度。因此,它的分布由密度函数所确定。若已知密度函数,则通过定积分可求得连续型随机变量在某一区间的概率。第十二页,本课件共有36页第二节第二节 二二 项项 式式 分分 布布二项总体、二项式分布二项式分布的概率的计算方法二项式分布的形状和参数 第四章第十三页,本课件共有36页一、二项总体、二项式分布一、二项总体、二项式分布二项总体:二项总体:二项总体:二项总体:这种由这种由“非此即彼非此即彼”的事件构成的总体,的事件构成的总体,叫做二项总体。为
10、便于研究,通常将二项总体中的叫做二项总体。为便于研究,通常将二项总体中的“此此”事件以变量事件以变量“1”1”表示,记为概率表示,记为概率p p;将;将“彼彼”事件以变量事件以变量“0”0”表示,具概率表示,具概率q q。因此二项总体又称为。因此二项总体又称为“0 0、1”1”总体,总体,其概率为其概率为p+q=1p+q=1或或q=1-pq=1-p。第四章第十四页,本课件共有36页二项式分布:二项式分布:二项式分布:二项式分布:如果从二项总体抽取如果从二项总体抽取n n个个体,可能得到个个体,可能得到y y个个体属于个个体属于“此此”,那么属于,那么属于“彼彼”的个体为的个体为n-yn-y。由
11、于是。由于是随机独立地从总体中抽取个体的,每项一次抽取的个体均有可随机独立地从总体中抽取个体的,每项一次抽取的个体均有可能属于能属于“此此”,也有可能属于,也有可能属于“彼彼”,那么得到的,那么得到的y y个个“此此”个体的数目可能为个体的数目可能为0 0、1 1、2 2、nn个。此处将个。此处将y y作为间断性资料作为间断性资料的变量,则的变量,则y y共有共有n+1n+1种取值,这种取值,这n+1n+1种取值又各有其概率,因种取值又各有其概率,因而由变量及其概率就构成了一个分布,这个分布叫做二项式概而由变量及其概率就构成了一个分布,这个分布叫做二项式概率分布,简称二项式分布或二项分布。率分
12、布,简称二项式分布或二项分布。第十五页,本课件共有36页二、二项式分布概率的计算方法二、二项式分布概率的计算方法 举例说明:大豆子叶颜色由举例说明:大豆子叶颜色由2 2对隐性重叠基因控制,在其对隐性重叠基因控制,在其F F2 2代黄子叶代黄子叶表现为显性,黄和青以表现为显性,黄和青以3:13:1比例分离。(以二粒荚为例来说明)比例分离。(以二粒荚为例来说明)。全部可能的结果有四种:全部可能的结果有四种:两粒都是黄的(两粒都是黄的(YYYY)3/43/4=9/163/43/4=9/16 第一次是青的第二次是黄的(第一次是青的第二次是黄的(GYGY)1/43/4=3/161/43/4=3/16 第
13、一次是黄的第二次是青的(第一次是黄的第二次是青的(YGYG)3/41/4=3/163/41/4=3/16 两粒都是青的(两粒都是青的(GGGG)1/41/4=1/161/41/4=1/16假设假设y(y(黄子叶粒数)为变量,黄色子叶的概率为黄子叶粒数)为变量,黄色子叶的概率为0.750.75,青色子叶,青色子叶的概率为的概率为0.250.25。那么其概率分别为(见上面)。那么其概率分别为(见上面)。第十六页,本课件共有36页 如果一粒豆荚中有三粒种子,那么就有如果一粒豆荚中有三粒种子,那么就有8 8种可能的情况。种可能的情况。全部是青子叶全部是青子叶 (GGGGGG)1/641/64 仅有一粒
14、黄子叶种子(仅有一粒黄子叶种子(GGYGGY、GYGGYG、YGGYGG)9/649/64 具有两粒黄了叶种子(具有两粒黄了叶种子(YYGYYG、YGYYGY、GYYGYY)27/6427/64 全部是黄子叶种子全部是黄子叶种子 (YYYYYY)27/6427/64数学上的组合公式为数学上的组合公式为n n相当于豆荚内种子数,相当于豆荚内种子数,y y相当于黄子叶种子数。因此相当于黄子叶种子数。因此由此可以推知二项分布的概率函数为:由此可以推知二项分布的概率函数为:第十七页,本课件共有36页 例如:某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽样10
15、头为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头以及全部愈好的概率为多少?按照上面的公式进行计算:7头愈好,3头死去的概率为:8头愈好,2头死去的概率为:9头愈好,1头死去的概率为:10头全部愈好的概率为:第十八页,本课件共有36页受害株数概率函数P(y)P(y)F(y)nP(y)P(0)0.11600.116046.40P(1)0.31240.4284124.96P(2)0.33640.7648134.56P(3)0.18110.954972.44P(4)0.04880.994719.52P(5)0.00531.00002.12如果每次抽5个单株,抽n=400次,则理论上我们能
16、够得到y=2的次数应为:理论次数=400P(2)=4000.3364=134.56(次)对于任意y,其理论次数为:理论次数=nP(y)。第十九页,本课件共有36页三、二项式分布的形状和参数三、二项式分布的形状和参数 对于一个二项式总体,如果p=qp=q,二项式分布呈对称形状,如果p p q,二项式分布则表现偏斜,二项式分布则表现偏斜形状。但如果形状。但如果n n时,即使p p q q,二项式总体分布,二项式总体分布的情况也趋于对称形状,所以二项分布的形状是由的情况也趋于对称形状,所以二项分布的形状是由n n和和p两个参数决定的。两个参数决定的。二项总体的平均数、方差、方差 2 2和标准差和标准
17、差 的公的公式为:式为:=np,2 2=npq=npq,。例如上述棉田受害调。例如上述棉田受害调查结果,查结果,n=5,p=0.35n=5,p=0.35,所以可求得总体参数为:=np=50.35=1.75=np=50.35=1.75株,株,株。株。第二十页,本课件共有36页第二十一页,本课件共有36页第三节第三节 普松分布普松分布 普松分布的平均数、方差和标准差为:普松分布的平均数、方差和标准差为:=m,=m,2 2=m,=m,,这一分布包括一个参数m(m=npm=np),而且其分),而且其分布的的形状与布的的形状与mm的大小有关,的大小有关,m值越小分布越偏斜,当mm值适当大时,则分布趋于对
18、称形状。值适当大时,则分布趋于对称形状。普松分布的概率函数为普松分布的概率函数为:第四章第二十二页,本课件共有36页第四节第四节 正态分布正态分布 正态分布的研究意义正态分布的研究意义 二项式分布的极限二项式分布的极限正态分布正态分布 正态分布曲线的特性正态分布曲线的特性 计算正态分布曲线区间面积或概率的方法计算正态分布曲线区间面积或概率的方法 第四章第二十三页,本课件共有36页一、正态分布的研究意义一、正态分布的研究意义 自然界许多现象趋于正态分布 许多其他非正态分布的资料在一定条件下许多其他非正态分布的资料在一定条件下 也接近正也接近正态分布态分布 绝少部分资料的抽样分布,当绝少部分资料的
19、抽样分布,当n n适当大时,接近正态适当大时,接近正态分布分布 第二十四页,本课件共有36页二、二项式分布的极限二、二项式分布的极限正态分布正态分布 因为正态分布是二项分布的极限,所以可以由二项因为正态分布是二项分布的极限,所以可以由二项分布导出正态分布。对于二项分布,当分布导出正态分布。对于二项分布,当p=q=0.5时,时,无论无论n n值大小,二项分布的多边形都必定是对称的;如p p q q,而,而n n又很大时,这一多边仍然是对称的。当n n时,则可进一步推导出一个表示观察值y y出出现的概率函数方程:现的概率函数方程:第二十五页,本课件共有36页三、正态分布曲线的特性三、正态分布曲线的
20、特性 它是一条对称分布的曲线,且对称轴为它是一条对称分布的曲线,且对称轴为y=y=,即以平均数为对,即以平均数为对称轴。称轴。随着随着 和和 的不同,呈现一系列曲线而并不是一条曲线。的不同,呈现一系列曲线而并不是一条曲线。确定它确定它在在y y轴上的位置,轴上的位置,确定它的变异度。不同确定它的变异度。不同 和和 的总体具有不的总体具有不同的曲线位置和变异度,所以任何一个正态分布曲线,必同的曲线位置和变异度,所以任何一个正态分布曲线,必须在确定了须在确定了 和和 后,才能确定曲线位置和形状。后,才能确定曲线位置和形状。从原点所竖立的纵轴是从原点所竖立的纵轴是F FN N(y)(y)的最大值的最
21、大值y y0 0,所以正态分布曲线,所以正态分布曲线的算术平均数、中数、众数三者是相等的,都合于的算术平均数、中数、众数三者是相等的,都合于 点上。且点上。且多数次数分布在平均数附近。多数次数分布在平均数附近。第四章第二十六页,本课件共有36页 正态分布曲线在正态分布曲线在-=1=1 处有拐点,曲线两尾向左右延伸,永处有拐点,曲线两尾向左右延伸,永不接触,所以不接触,所以y y时,分布曲线以时,分布曲线以y y轴为渐近线。轴为渐近线。正态分布曲线与正态分布曲线与 轴之间的总面积等于轴之间的总面积等于1 1。正态曲线的任何两个正态曲线的任何两个y y的定值间的面积或概率完全以曲线的定值间的面积或
22、概率完全以曲线 和和 而而确定。确定。第二十七页,本课件共有36页下面为几对常见的区间与其相对应的面积或概率的数字:下面为几对常见的区间与其相对应的面积或概率的数字:下面为几对常见的区间与其相对应的面积或概率的数字:下面为几对常见的区间与其相对应的面积或概率的数字:区间 1 面积或概率=0.6827 2 0.9545 3 0.9973 1.960 0.9500 2.576 0.9900 第二十八页,本课件共有36页四、计算正态分布曲线区间面积或概率的方法四、计算正态分布曲线区间面积或概率的方法四、计算正态分布曲线区间面积或概率的方法四、计算正态分布曲线区间面积或概率的方法 如果变数如果变数y
23、y取值介于取值介于a a、b b之间,且之间,且a a b b P(a P(a y y b)b)或者简写为或者简写为P(aP(a y y b)b)可可以以通通过过正正态态分分布布曲曲线线下下区区间间的的面面积积来来表表示示其其概概率率。我我们们知知道求曲线下区间的面积,数学上通常用定积分来表示道求曲线下区间的面积,数学上通常用定积分来表示第二十九页,本课件共有36页先将先将y y转换为转换为u u,转化的公式为:转化的公式为:例 题假定假定假定假定y y是一随机变数,具有正态分布,平均数是一随机变数,具有正态分布,平均数是一随机变数,具有正态分布,平均数是一随机变数,具有正态分布,平均数 =3
24、0=30,标准差,标准差,标准差,标准差 =5=5,试计算小于,试计算小于,试计算小于,试计算小于2626,小于,小于,小于,小于4040的概率,或者介于的概率,或者介于的概率,或者介于的概率,或者介于2626和和和和4040之间的之间的之间的之间的概率以及大于概率以及大于概率以及大于概率以及大于4040的概率。的概率。的概率。的概率。第三十页,本课件共有36页查附表2,当=-0.8时,FN(26)=0.2119,说明这一分布从-到26范围内的变量占全部变量数的21.19%,或者说y26的概率为0.2119。同样计算(40)查附表2,当=+2时,FN(40)=0.9773,这指出从-到40范围
25、内的变量数占全部变量数的97.73%,或者说,y40的概率为0.9773。第三十一页,本课件共有36页计算P(26y40)=FN(40)-FN(26)=0.9773-0.2119=0.7654第三十二页,本课件共有36页第五节第五节 抽抽 样样 分分 布布 样本平均数的抽样及其分布参数 样本总和数的抽样及分布参数 两个独立随机样本平均数差数的抽样分布参数第三十三页,本课件共有36页样本平均数的抽样及其分布参数样本平均数的抽样及其分布参数数理统计的推导表明新总体与母总体之间在特征参数上存在函数关系。以平均数数理统计的推导表明新总体与母总体之间在特征参数上存在函数关系。以平均数抽样分布为例,这种关系可以表示为两个方面:抽样分布为例,这种关系可以表示为两个方面:1 1 该抽样分布的平均数与母总体的平均数相等。该抽样分布的平均数与母总体的平均数相等。0 0=该抽样分布的方差与母总体的方差之间存在以下关系该抽样分布的方差与母总体的方差之间存在以下关系 相应地相应地第三十四页,本课件共有36页样本总和数的抽样及分布参数样本总和数的抽样及分布参数该抽样分布的平均数与母总体平均数间的关系:该抽样分布的平均数与母总体平均数间的关系:该抽样分布的方差与母总体方差间存在以下关系第三十五页,本课件共有36页感感谢谢大大家家观观看看第三十六页,本课件共有36页