《统计学第3章 概率与概率分布幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学第3章 概率与概率分布幻灯片.ppt(88页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第统计学第3章章 概率与概率分概率与概率分布布第1页,共88页,编辑于2022年,星期二1学习目标学习目标1.理解随机事件的概念、了解事件之间的关系理解随机事件的概念、了解事件之间的关系2.理解概率的三种定义,掌握概率运算的法则理解概率的三种定义,掌握概率运算的法则3.理解随机变量及其概率分布的概念理解随机变量及其概率分布的概念4.掌握二项分布、泊松分布和超几何分布的背景、均掌握二项分布、泊松分布和超几何分布的背景、均值和方差及其应用值和方差及其应用5.掌握正态分布的主要特征和应用,了解均匀分掌握正态分布的主要特征和应用,了解均匀分布的应用布的应用6.理解大数定律和中心极限定理的重要意义
2、理解大数定律和中心极限定理的重要意义第2页,共88页,编辑于2022年,星期二23.1 随机事件及其概率随机事件及其概率 一、随机试验与随机事件一、随机试验与随机事件一、随机试验与随机事件一、随机试验与随机事件 二、随机事件的概率二、随机事件的概率二、随机事件的概率二、随机事件的概率 三、概率的运算法则三、概率的运算法则三、概率的运算法则三、概率的运算法则第3页,共88页,编辑于2022年,星期二3一、随机试验与随机事件一、随机试验与随机事件3.1 随机事件及其概率第4页,共88页,编辑于2022年,星期二4必然现象与随机现象必然现象与随机现象必然现象(确定性现象)必然现象(确定性现象)变化结
3、果是事先可以确定的,一定的条件必然导致某一结变化结果是事先可以确定的,一定的条件必然导致某一结果果这种关系通常可以用公式或定律来表示这种关系通常可以用公式或定律来表示随机现象(偶然现象、不确定现象)随机现象(偶然现象、不确定现象)在一定条件下可能发生也可能不发生的现象在一定条件下可能发生也可能不发生的现象个别观察的结果完全是偶然的、随机会而定个别观察的结果完全是偶然的、随机会而定大量观察的结果会呈现出某种规律性大量观察的结果会呈现出某种规律性 (随机性中寓含着规律性)(随机性中寓含着规律性)统计规律性统计规律性十五的夜晚能看见月亮?十五的月亮比初十圆!第5页,共88页,编辑于2022年,星期二
4、5随机试验随机试验严格意义上的随机试验满足三个条件:严格意义上的随机试验满足三个条件:试验可以在系统条件下重复进行;试验可以在系统条件下重复进行;试验的所有可能结果是明确可知的;试验的所有可能结果是明确可知的;每次试验前不能肯定哪一个结果会出现。每次试验前不能肯定哪一个结果会出现。广义的随机试验是指对随机现象的观察广义的随机试验是指对随机现象的观察(或实验)。(或实验)。实际应用中多数试验不能同时满足上述条件,实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。常常从广义角度来理解。第6页,共88页,编辑于2022年,星期二6随机事件(事件)随机事件(事件)随机事件(简称事件)随机事
5、件(简称事件)随机试验的每一个可能结果随机试验的每一个可能结果常用大写英文字母常用大写英文字母A、B、来表示、来表示基本事件(样本点)基本事件(样本点)不可能再分成为两个或更多事件的事件不可能再分成为两个或更多事件的事件样本空间(样本空间()基本事件的全体(全集)基本事件的全体(全集)第7页,共88页,编辑于2022年,星期二7随机事件(续)随机事件(续)复合事件复合事件由某些基本事件组合而成的事件由某些基本事件组合而成的事件样本空间中的子集样本空间中的子集随机事件的两种特例随机事件的两种特例必然事件必然事件在一定条件下,每次试验都必然发生的事件在一定条件下,每次试验都必然发生的事件只有样本空
6、间只有样本空间 才是必然事件才是必然事件 不可能事件不可能事件在一定条件下,每次试验都必然不会发生的事件在一定条件下,每次试验都必然不会发生的事件不可能事件是一个空集(不可能事件是一个空集()第8页,共88页,编辑于2022年,星期二8二、随机事件的概率二、随机事件的概率3.1 随机事件及其概率 1.1.古典概率古典概率古典概率古典概率 2.2.统计概率统计概率统计概率统计概率 3.3.主观概率主观概率主观概率主观概率 4.4.概率的基本性质概率的基本性质概率的基本性质概率的基本性质 第9页,共88页,编辑于2022年,星期二9随机事件的概率随机事件的概率概率概率用来度量随机事件发生的可能性大
7、小的数值用来度量随机事件发生的可能性大小的数值必然事件的概率为必然事件的概率为1,表示为,表示为P()=1不可能事件发生的可能性是零,不可能事件发生的可能性是零,P()=0随机事件随机事件A的概率介于的概率介于0和和1之间,之间,0P(A)1,显然显然P(AB)P(A)P(B)因为因为A和和B存在共同部分存在共同部分AB5,7,9,P(AB)3/10。在。在P(A)+P(B)中中P(AB)被重复计算了。被重复计算了。正确计算是:正确计算是:P(AB)5/106/103/108/100.8第25页,共88页,编辑于2022年,星期二252.乘法公式乘法公式用于计算两个事件同时发生的概率。用于计算
8、两个事件同时发生的概率。也即也即“A发生且发生且B发生发生”的概率的概率 P(AB)先关注事件是否相互独立先关注事件是否相互独立 第26页,共88页,编辑于2022年,星期二26(1)条件概率)条件概率条件概率条件概率在某些附加条件下计算的概率在某些附加条件下计算的概率在已知事件在已知事件B已经发生的条件下已经发生的条件下A发生的条发生的条件概率件概率P(A|B)条件概率的一般公式:条件概率的一般公式:其中 P(B)0 第27页,共88页,编辑于2022年,星期二27【例【例3-5】某公司甲乙两厂生产同种产品。甲厂生产某公司甲乙两厂生产同种产品。甲厂生产400件,其中一级品为件,其中一级品为2
9、80件;乙厂生产件;乙厂生产600件,其中一级品有件,其中一级品有360件。若要从该厂的全件。若要从该厂的全部产品中任意抽取一件,试求:部产品中任意抽取一件,试求:已知抽出产品为一级品的条件已知抽出产品为一级品的条件下该产品出自甲厂的概率;下该产品出自甲厂的概率;已知抽出产品出自甲厂的条件下该已知抽出产品出自甲厂的条件下该产品为一级品的概率。产品为一级品的概率。解:设解:设A“甲厂产品甲厂产品”,B“一级品一级品”,则:,则:P(A)0.4,P(B)0.64,P(AB)0.28 所求概率为事件所求概率为事件B发生条件下发生条件下A发生的条件概率发生的条件概率 P(A|B)0.28/0.64所求
10、概率为事件所求概率为事件A发生条件下发生条件下B发生的条件概率发生的条件概率 P(B|A)0.28/0.4第28页,共88页,编辑于2022年,星期二28P(A|B)在在B发生的所有可能结果中发生的所有可能结果中AB发生发生的概率的概率即在样本空间即在样本空间中考虑的条件概率中考虑的条件概率P(A|B),就变成在新的样本空间就变成在新的样本空间B中计算事件中计算事件AB的概的概率问题了率问题了(1)条件概率(续)条件概率(续)一旦事件B已发生ABABBAB第29页,共88页,编辑于2022年,星期二29乘法公式的一般形式:乘法公式的一般形式:P(AB)P(A)P(B|A)或或 P(AB)P(B
11、)P(A|B)【例【例3-6】对例】对例3-1中的问题(从这中的问题(从这50件中任取件中任取2件产品,件产品,可以看成是分两次抽取,每次只抽取一件,不放回抽可以看成是分两次抽取,每次只抽取一件,不放回抽样)样)解:解:A1第一次抽到合格品,第一次抽到合格品,A2第二次抽到合格第二次抽到合格品,品,A1A2抽到两件产品均为合格品抽到两件产品均为合格品P(A1 A2)P(A1)P(A2|A1)第30页,共88页,编辑于2022年,星期二30事件的独立性事件的独立性两个事件独立两个事件独立一个事件的发生与否并不影响另一个事件一个事件的发生与否并不影响另一个事件发生的概率发生的概率P(A|B)P(A
12、),或,或 P(B|A)P(B)独立事件的乘法公式:独立事件的乘法公式:P(AB)P(A)P(B)推广到推广到n n 个独立事件,有:个独立事件,有:P P(A A A A1 1A A A An n)P P(A A A A1 1)P P P P(A A2 2)P P(A An n)第31页,共88页,编辑于2022年,星期二313.全概率公式全概率公式完备事件组完备事件组事件事件A1、A2、An互不相容,互不相容,AA2An且且P(Ai)0(i=1、2、.、n)对任一事件对任一事件B,它总是与完备事件组,它总是与完备事件组A1、A2、An之一同时发生,则有求之一同时发生,则有求P(B)的的全概
13、率公式全概率公式:第32页,共88页,编辑于2022年,星期二32例例3-7假设有一道四选一的选择题,某学生知道正假设有一道四选一的选择题,某学生知道正确答案的可能性为确答案的可能性为2/3,他不知道正确答案,他不知道正确答案时猜对的概率是时猜对的概率是1/4。试问该生作出作答的。试问该生作出作答的概率?概率?解:解:设设 A知道正确答案,知道正确答案,B选择正确。选择正确。“选择正确选择正确”包括:包括:“知道正确答案而选择正确知道正确答案而选择正确”(即(即AB)“不知道正确答案但选择正确不知道正确答案但选择正确”(即(即 )P(B)(2/3)1(1/3)(1/4)3/4第33页,共88页
14、,编辑于2022年,星期二33全概率公式全概率公式贝叶斯公式贝叶斯公式全概率公式的直观意义:全概率公式的直观意义:每一个每一个Ai的发生都可能导致的发生都可能导致B出现,每一个出现,每一个Ai 导致导致B发生的概率为,因此作为结果的事件发生的概率为,因此作为结果的事件B发发生的概率是各个生的概率是各个“原因原因”Ai 引发的概率的总和引发的概率的总和 相反,在观察到事件相反,在观察到事件B已经发生的条件下,已经发生的条件下,确定导致确定导致B发生的各个原因发生的各个原因Ai的概率的概率贝叶斯公式贝叶斯公式(逆概率公式)(逆概率公式)(后验概率公式)(后验概率公式)第34页,共88页,编辑于20
15、22年,星期二34贝叶斯公式贝叶斯公式若若A1、A2、An为完备事件组,则对为完备事件组,则对于任意随机事件于任意随机事件B,有:,有:计算事件计算事件Ai在给定在给定B条件下的条件概率公式。条件下的条件概率公式。公式中,公式中,P(Ai)称为事件称为事件Ai的先验概率的先验概率P(Ai|B)称为事件称为事件Ai的后验概率的后验概率 第35页,共88页,编辑于2022年,星期二353.2 随机变量及其概率分布随机变量及其概率分布 一、随机变量的概念一、随机变量的概念一、随机变量的概念一、随机变量的概念 二、随机变量的概率分布二、随机变量的概率分布二、随机变量的概率分布二、随机变量的概率分布 三
16、、随机变量的数字特征三、随机变量的数字特征三、随机变量的数字特征三、随机变量的数字特征 四、常见的离散型概率分布四、常见的离散型概率分布四、常见的离散型概率分布四、常见的离散型概率分布 五、常见的连续型概率分布五、常见的连续型概率分布五、常见的连续型概率分布五、常见的连续型概率分布第36页,共88页,编辑于2022年,星期二36一、随机变量的概念一、随机变量的概念3.2 随机变量及其概率分布第37页,共88页,编辑于2022年,星期二37一、随机变量的概念一、随机变量的概念随机变量随机变量表示随机试验结果的变量表示随机试验结果的变量取值是随机的,事先不能确定取哪一个值取值是随机的,事先不能确定
17、取哪一个值 一个取值对应随机试验的一个可能结果一个取值对应随机试验的一个可能结果用大写字母如用大写字母如X、Y、Z.来表示,具体取值来表示,具体取值则用相应的小写字母如则用相应的小写字母如x、y、z来表示来表示 根据取值特点的不同,可分为根据取值特点的不同,可分为:离散型离散型随机变量随机变量取值可以一一列举取值可以一一列举连续型连续型随机变量随机变量取值不能一一列举取值不能一一列举第38页,共88页,编辑于2022年,星期二38二、随机变量的概率分布二、随机变量的概率分布3.2 随机变量及其概率分布 1.1.离散型随机变量的概率分布离散型随机变量的概率分布离散型随机变量的概率分布离散型随机变
18、量的概率分布 2.2.连续型随机变量的概率密度连续型随机变量的概率密度连续型随机变量的概率密度连续型随机变量的概率密度 3.3.分布函数分布函数分布函数分布函数第39页,共88页,编辑于2022年,星期二391.离散型随机变量的概率分布离散型随机变量的概率分布X的的概率分布概率分布X的有限个可能取值为的有限个可能取值为xi与其概率与其概率 pi(i=1,2,3,n)之间)之间的对应关系。的对应关系。概率分布具有如下两个基本性质概率分布具有如下两个基本性质:(1)pi0,i=1,2,n;(2)第40页,共88页,编辑于2022年,星期二40离散型离散型概率分布的表示:概率分布的表示:概率函数:概
19、率函数:P(X=xi)=pi分布列:分布列:分布图分布图X=xix1x2xnP(X=xi)=pip1p2pn0.60.300 1 2 xP(x)图图3-5 例例3-9的概率分布的概率分布第41页,共88页,编辑于2022年,星期二412.连续型随机变量的概率密度连续型随机变量的概率密度 连续型随机变量的概率分布只能表示为:连续型随机变量的概率分布只能表示为:数学函数数学函数概率密度函数概率密度函数f(x)和分布函数和分布函数F(x)图图 形形概率密度曲线和分布函数曲线概率密度曲线和分布函数曲线概率密度函数概率密度函数f(x)的函数值不是概率。的函数值不是概率。连续型随机变量取某个特定值的概率等
20、于连续型随机变量取某个特定值的概率等于0只能计算随机变量落在一定区间内的概率只能计算随机变量落在一定区间内的概率由由x轴以上、概率密度曲线下方面积来表示轴以上、概率密度曲线下方面积来表示第42页,共88页,编辑于2022年,星期二42概率密度概率密度f(x)的性质的性质(1)f(x)0。概率密度是非负函数。概率密度是非负函数。(2)所有区域上取值的概率总和为所有区域上取值的概率总和为1。随机随机变变量量X在一定区在一定区间间(a,b)上的概率:)上的概率:f(x)xab第43页,共88页,编辑于2022年,星期二433.分布函数分布函数适用于两类随机变量概率分布的描述适用于两类随机变量概率分布
21、的描述分布函数的定义:分布函数的定义:F(x)PXx连续型随机变量的分布函数连续型随机变量的分布函数离散型随机变量的分布函数离散型随机变量的分布函数 F(x)f(x)xx0F F(x x0 0 )分布函数分布函数与与概率密度概率密度第44页,共88页,编辑于2022年,星期二44三、随机变量的数字特征三、随机变量的数字特征3.2 随机变量及其概率分布 1.1.随机变量的数学期望随机变量的数学期望随机变量的数学期望随机变量的数学期望 2.2.随机变量的方差和标准差随机变量的方差和标准差随机变量的方差和标准差随机变量的方差和标准差 3.3.两个随机变量的协方差和相关系数两个随机变量的协方差和相关系
22、数两个随机变量的协方差和相关系数两个随机变量的协方差和相关系数第45页,共88页,编辑于2022年,星期二451.随机变量的数学期望随机变量的数学期望又称均值又称均值描述一个随机变量的概率分布的中心位置描述一个随机变量的概率分布的中心位置离散型随机变量离散型随机变量 X的数学期望的数学期望:相当于所有可能取值以概率为权数的平均值相当于所有可能取值以概率为权数的平均值连续型随机变量连续型随机变量X 的数学期望:的数学期望:第46页,共88页,编辑于2022年,星期二46数学期望的主要数学性质数学期望的主要数学性质若若k是一常数,则是一常数,则 E(k X)k E(X)对于任意两个随机变量对于任意
23、两个随机变量X、Y,有,有 E(X+Y)E(X)E(Y)若两个随机变量若两个随机变量X、Y相互独立,则相互独立,则 E(XY)E(X)E(Y)第47页,共88页,编辑于2022年,星期二472.随机变量的方差随机变量的方差方差是它的各个可能取值偏离其均值的方差是它的各个可能取值偏离其均值的离差平方的均值,记为离差平方的均值,记为D(x)或或2公式:公式:离散型随机变量的方差:离散型随机变量的方差:连续型随机变量的方差:连续型随机变量的方差:第48页,共88页,编辑于2022年,星期二48方差和标准差方差和标准差(续)(续)标准差标准差方差的平方根方差的平方根方差和标准差都反映随机变量取值的分散
24、方差和标准差都反映随机变量取值的分散程度。程度。它们的值越大,说明离散程度越大,其概率它们的值越大,说明离散程度越大,其概率分布曲线越扁平。分布曲线越扁平。方差的主要数学性质:方差的主要数学性质:若若k是一常数,则是一常数,则 D(k)0;D(kX)k2 D(X)若两个随机变量若两个随机变量X、Y相互独立,则相互独立,则 D(X+Y)D(X)D(Y)第49页,共88页,编辑于2022年,星期二49【例【例3-10】试求优质品件数的数学期望、方差和标试求优质品件数的数学期望、方差和标准差。准差。解:解:0.6xi012pi0.10.60.3第50页,共88页,编辑于2022年,星期二503.两个
25、随机变量的协方差和相关系数两个随机变量的协方差和相关系数协方差的定义协方差的定义 如果如果X,Y独立(不相关),则独立(不相关),则 Cov(X,Y)0 即即 E(XY)E(X)E(Y)协方差在一定程度上反映了协方差在一定程度上反映了X、Y之间的相关性之间的相关性协方差受两个变量本身量纲的影响。协方差受两个变量本身量纲的影响。第51页,共88页,编辑于2022年,星期二51相关系数相关系数相关系数相关系数具有如下的性质:具有如下的性质:相关系数相关系数是一个无量纲的值是一个无量纲的值 0|0当当=0,两个变量不相关,两个变量不相关(不存在线性(不存在线性相关)相关)当当|=1,两个变量完全线性
26、相关,两个变量完全线性相关 第52页,共88页,编辑于2022年,星期二52 四、常见离散型随机变量的四、常见离散型随机变量的概率分布概率分布3.2 随机变量及其概率分布 1.1.二项分布二项分布二项分布二项分布 2.2.泊松分布泊松分布泊松分布泊松分布 3.3.超几何分布超几何分布超几何分布超几何分布第53页,共88页,编辑于2022年,星期二531.二项分布二项分布(背景)(背景)(背景)(背景)n重贝努里试验:重贝努里试验:一次试验只有两种可能结果一次试验只有两种可能结果用用“成功成功”代表所关心的结果,相反代表所关心的结果,相反的结果为的结果为“失败失败”每次试验中每次试验中“成功成功
27、”的概率都是的概率都是 p n 次试验相互独立。次试验相互独立。第54页,共88页,编辑于2022年,星期二541.二项分布二项分布在在n重贝努里试验中,重贝努里试验中,“成功成功”的次数的次数X服从参数为服从参数为n、p的二项分布,的二项分布,记为记为 X B(n,p)二项分布的概率函数:二项分布的概率函数:二项分布的数学期望和方差:二项分布的数学期望和方差:n1时,二项分布就成了二点分布(时,二项分布就成了二点分布(0-1分布)分布)第55页,共88页,编辑于2022年,星期二55二项分布图形二项分布图形p0.5时,二项分布是以均值为中心对称时,二项分布是以均值为中心对称p0.5时,二项分
28、布总是非对称的时,二项分布总是非对称的p0.5时峰值在中心的右侧时峰值在中心的右侧随着随着n无限增大,二项分布趋近于正态分布无限增大,二项分布趋近于正态分布p=0.3p=0.5p=0.7二项分布图示二项分布图示第56页,共88页,编辑于2022年,星期二56【例【例3-11】某单位有某单位有4辆汽车,假设每辆车在一年中至多辆汽车,假设每辆车在一年中至多只发生一次损失且损失的概率为只发生一次损失且损失的概率为0.1。试求在。试求在一年内该单位:(一年内该单位:(1)没有汽车发生损失的概)没有汽车发生损失的概率;(率;(2)有)有1辆汽车发生损失的概率;辆汽车发生损失的概率;(3)发生损失的汽车不
29、超过)发生损失的汽车不超过2辆的概率。辆的概率。解:解:每辆汽车是否发生损失相互独立的,且每辆汽车是否发生损失相互独立的,且损失的概率相同,因此,据题意,在损失的概率相同,因此,据题意,在4辆汽车辆汽车中发生损失的汽车数中发生损失的汽车数X B(4,0.1)。第57页,共88页,编辑于2022年,星期二57利用利用Excel计算二项分布概率计算二项分布概率进入进入Excel表格界面,点击任一空白单元格(作为输表格界面,点击任一空白单元格(作为输出单元格)出单元格)点击表格界面上的点击表格界面上的 fx 命令命令 在在“选择类别选择类别”中点击中点击“统计统计”,在,在“选择函数选择函数”中点击
30、中点击“BINOMDIST”在在Number_s后填入试验成功次数后填入试验成功次数 x(本例为本例为2);在在Trials后填入总试验次数后填入总试验次数 n(本例为本例为4);在在Probability_s后填入成功概率后填入成功概率 p(本例为本例为0.1);在在Cumulative后填入后填入0(或或FALSE),表示计算成功次数等于,表示计算成功次数等于指定值的概率指定值的概率“BINOMDIST(2,4,0.1,0)”用用EXCEL计算二项计算二项分布的概率分布的概率第58页,共88页,编辑于2022年,星期二582.泊松分布泊松分布 X 服从泊松分布,记为服从泊松分布,记为XP(
31、):E(X)=D(X)=当当 很小时,泊松分布呈偏态,并随着很小时,泊松分布呈偏态,并随着增大增大而趋于对称而趋于对称当当为整数时,为整数时,和(和(-1)是最可能值)是最可能值第59页,共88页,编辑于2022年,星期二59泊松分布(应用背景)泊松分布(应用背景)通常是作为稀有事件发生次数通常是作为稀有事件发生次数X的概率分布模型。的概率分布模型。一段时间内某繁忙十字路口发生交通事故的次数一段时间内某繁忙十字路口发生交通事故的次数一定时间段内某电话交换台接到的电话呼叫次数一定时间段内某电话交换台接到的电话呼叫次数服从泊松分布的现象的共同特征服从泊松分布的现象的共同特征在任意两个很小的时间或空
32、间区间内事件发生次数是相互独在任意两个很小的时间或空间区间内事件发生次数是相互独立的;立的;各区间内事件发生次数只与区间长度成比例,与区间起点各区间内事件发生次数只与区间长度成比例,与区间起点无关;无关;在一段充分小的区间内事件发生两次或两次以上的概率在一段充分小的区间内事件发生两次或两次以上的概率可以忽略不计可以忽略不计第60页,共88页,编辑于2022年,星期二60【例【例3-12】设某种报刊的每版上错别字个数服从设某种报刊的每版上错别字个数服从 =2的泊松分布。随机翻看一版,求:的泊松分布。随机翻看一版,求:(1)没有错别字的概率;)没有错别字的概率;(2)至多有)至多有5个错别字的概率
33、。个错别字的概率。解:解:设设X每版上错别字个数,则所求概每版上错别字个数,则所求概率为:率为:利用利用EXCEL计算泊松分布的概率计算泊松分布的概率第61页,共88页,编辑于2022年,星期二61二项分布的泊松近似二项分布的泊松近似【前提前提】当当n很大而很大而 p又很小时,二项分布可用参又很小时,二项分布可用参数数np 的泊松分布近似的泊松分布近似【例例3-13】一工厂有某种设备一工厂有某种设备80台,配备了台,配备了3个维个维修工。假设每台设备的维修只需要一个维修工,修工。假设每台设备的维修只需要一个维修工,设备发生故障是相互独立的,且每台设备发生故设备发生故障是相互独立的,且每台设备发
34、生故障的概率都是障的概率都是0.01。求设备发生故障而不能及时维修。求设备发生故障而不能及时维修的概率是多少?的概率是多少?解:解:XB(n=80,p=0.01),由于,由于np=0.8很小,可以很小,可以用用0.8的泊松分布来近似计算其概率的泊松分布来近似计算其概率:第62页,共88页,编辑于2022年,星期二623.超几何分布超几何分布 N个单位的有限总体中有个单位的有限总体中有M个单位具有某特个单位具有某特征。用不重复抽样方法从总体中抽取征。用不重复抽样方法从总体中抽取n个单个单位,样本中具有某种特征的单位数位,样本中具有某种特征的单位数X服从超服从超几何分布,记为几何分布,记为XH(n
35、,N,M)数学期望和方差数学期望和方差:N很大而很大而n相对很小时,趋于二项分布相对很小时,趋于二项分布(p=M/N)第63页,共88页,编辑于2022年,星期二63五、常见的连续型概率分布五、常见的连续型概率分布1.均匀分布均匀分布X只在一有限区间只在一有限区间 a,b 上取值上取值且概率密度是一个常数且概率密度是一个常数其概率密度为:其概率密度为:X 落在子区间落在子区间 c,d 内的概内的概率与该子区间的长度成正比,率与该子区间的长度成正比,与具体位置无关与具体位置无关f(x)a c d b xP(cXd)第64页,共88页,编辑于2022年,星期二642.正态分布正态分布XN(、2),
36、其概率密度为:,其概率密度为:正态分布的均值和标准差正态分布的均值和标准差 均值均值 E(X)=方差方差 D(X)=2 -x 3 的概率很小,因此可认为正的概率很小,因此可认为正态随机变量的取值几乎全部集中在态随机变量的取值几乎全部集中在-3,+3 区间内区间内广泛应用广泛应用:产品质量控制产品质量控制判断异常情况判断异常情况图图3-12 常用的正态概率值常用的正态概率值(在一般正态分布及标准正态分布中)(在一般正态分布及标准正态分布中)-3 -2 -1 0 +1 +2+3 z -3 -2 -+2+3 x99.73%95.45%68.27%第70页,共88页,编辑于2022年,星期二70正态分
37、布最常用、最重要正态分布最常用、最重要大千世界中许多常见的随机现象服从或近似服从正态分大千世界中许多常见的随机现象服从或近似服从正态分布布例如,测量误差,同龄人的身高、体重,一批棉纱的抗拉强度,例如,测量误差,同龄人的身高、体重,一批棉纱的抗拉强度,一种设备的使用寿命,农作物的产量一种设备的使用寿命,农作物的产量特点是特点是“中间多两头少中间多两头少”由于正态分布特有的数学性质,正态分布在很多统计理由于正态分布特有的数学性质,正态分布在很多统计理论中都占有十分重要的地位论中都占有十分重要的地位正态分布是许多概率分布的极限分布正态分布是许多概率分布的极限分布统计推断中许多重要的分布(如统计推断中
38、许多重要的分布(如2分布、分布、t分布、分布、F分布)都是分布)都是在正态分布的基础上推导出来的。在正态分布的基础上推导出来的。第71页,共88页,编辑于2022年,星期二71用正态分布近似二项分布用正态分布近似二项分布XB(n,p),当,当n充分大时,充分大时,XN(n p,np(1-p)【例例3-15】假设有一批种子的发芽率为假设有一批种子的发芽率为0.7。现有这种。现有这种种子种子1000颗,试求其中有颗,试求其中有720颗以上发芽的概率。颗以上发芽的概率。解:解:设设X发芽种子颗数,发芽种子颗数,XB(1000,0.7)。近似地。近似地 XN(700,210)。P(X720)P(Z1.
39、38)1P(Z1.38)10.91620.0838 第72页,共88页,编辑于2022年,星期二72用正态分布近似二项分布用正态分布近似二项分布用正态分布近似二项分布的用正态分布近似二项分布的前提前提n很大,很大,p不能太接近不能太接近 0 或或 1(否则二项分布太偏)(否则二项分布太偏)一般要求一般要求np和和np(1-p)都要大于都要大于5如果如果np或或np(1-p)小于小于5,二项分布可以用,二项分布可以用泊松分布来近似泊松分布来近似 第73页,共88页,编辑于2022年,星期二73计算正态分布的概率值计算正态分布的概率值方法一:方法一:先标准化先标准化查标准正态分布函数值表查标准正态
40、分布函数值表方法二:利用方法二:利用Excel来计算(不必标准化)来计算(不必标准化)插入函数插入函数fx选择选择“统计统计”“NORMDIST”,进入进入“函数参数函数参数”对话框中,对话框中,在在X后填入正态随机变量的取值区间点;后填入正态随机变量的取值区间点;在在Mean后填入正态分布的均值;后填入正态分布的均值;在在Standard_dev后填入正态分布的标准差;后填入正态分布的标准差;在在Cumulative后填入后填入1(或或TRUE),表示计算随,表示计算随机变量取值小于等于指定值机变量取值小于等于指定值x的累积概率值。的累积概率值。第74页,共88页,编辑于2022年,星期二7
41、4也可在选定的输出单元格中,顺次输入也可在选定的输出单元格中,顺次输入函数名和参数值即可函数名和参数值即可如输入如输入“=NORMDIST(500,1050,200,1)”,确定后即可得到所求概率值确定后即可得到所求概率值0.0029798。根据概率值根据概率值F(Xx)求随机变量取值的区求随机变量取值的区间点间点 x,选择函数,选择函数“NORMINV”。如输入如输入“=NORMINV(0.0029798,1050,200)”,显示显示计算结果为计算结果为500。计算正态分布的概率值计算正态分布的概率值第75页,共88页,编辑于2022年,星期二753.3 大数定律与中心极限定理大数定律与中
42、心极限定理 一、大数定律一、大数定律一、大数定律一、大数定律 二、中心极限定理二、中心极限定理二、中心极限定理二、中心极限定理第76页,共88页,编辑于2022年,星期二76一、大数定律一、大数定律3.3 大数定律与中心极限定理 1.1.独立同分布大数定律独立同分布大数定律独立同分布大数定律独立同分布大数定律 2.2.贝努里大数定律贝努里大数定律贝努里大数定律贝努里大数定律 第77页,共88页,编辑于2022年,星期二77独立同分布大数定律独立同分布大数定律大数定律是阐述大量同类随机现象的平均大数定律是阐述大量同类随机现象的平均结果的稳定性的一系列定理的总称。结果的稳定性的一系列定理的总称。独
43、立同分布大数定律独立同分布大数定律设设X1,X2,是独是独立同分布的随机立同分布的随机变变量序列,且存在有限的量序列,且存在有限的数学期望数学期望E(Xi)和方差和方差D(Xi)2(i=1,2,),),则对则对任意小的正数任意小的正数,有:有:第78页,共88页,编辑于2022年,星期二78大数定律(续)大数定律(续)该大数定律表明:当该大数定律表明:当n充分大时,相互独充分大时,相互独立且服从同一分布的一系列随机变量取立且服从同一分布的一系列随机变量取值的算术平均数,与其数学期望值的算术平均数,与其数学期望的偏差的偏差任意小的概率接近于任意小的概率接近于1。该定理给出了平均值具有稳定性的科学
44、该定理给出了平均值具有稳定性的科学描述,从而为使用样本均值去估计总体描述,从而为使用样本均值去估计总体均值(数学期望)提供了理论依据。均值(数学期望)提供了理论依据。第79页,共88页,编辑于2022年,星期二79贝努里大数定律贝努里大数定律设设m是是n次独立重复试验中事件次独立重复试验中事件A发生的次发生的次数,数,p是每次试验中事件是每次试验中事件A发生的概率,则发生的概率,则对任意的对任意的 0,有:,有:它表明,当重复试验次数它表明,当重复试验次数n充分大时,事件充分大时,事件A发发生的频率生的频率m/n依概率收敛于事件依概率收敛于事件A发生的概率发生的概率阐明了频率具有稳定性,提供了
45、用频率估计概率阐明了频率具有稳定性,提供了用频率估计概率的理论依据。的理论依据。第80页,共88页,编辑于2022年,星期二80二、中心极限定理二、中心极限定理3.3 大数定律与中心极限定理 1.1.独立同分布大数定律独立同分布大数定律独立同分布大数定律独立同分布大数定律 2.2.棣莫佛拉普拉斯中心极限定理棣莫佛拉普拉斯中心极限定理棣莫佛拉普拉斯中心极限定理棣莫佛拉普拉斯中心极限定理 第81页,共88页,编辑于2022年,星期二81独立同分布的中心极限定理独立同分布的中心极限定理(也称列维一林德伯格定理)(也称列维一林德伯格定理)设设X1,X2,是独立同分布的随机变量序列是独立同分布的随机变量
46、序列,且存在有限的且存在有限的和方差和方差2(i=1,2,),当),当n 时,时,或或就趋于正态分布。第82页,共88页,编辑于2022年,星期二82上述定理表明上述定理表明独立同分布的随机变量序列不管服从什么分独立同分布的随机变量序列不管服从什么分布,其布,其n项总和的分布趋近于正态分布。项总和的分布趋近于正态分布。可得出如下可得出如下结论结论:不论总体服从何种分布,只要其数学期望和不论总体服从何种分布,只要其数学期望和方差存在,对这一总体进行重复抽样时,当方差存在,对这一总体进行重复抽样时,当样本量样本量n充分大,就趋于正态分布。充分大,就趋于正态分布。该定理为均值的抽样推断奠定了理论基础
47、。该定理为均值的抽样推断奠定了理论基础。第83页,共88页,编辑于2022年,星期二83【例【例3-16】有有一一测测绘绘小小组组对对甲甲乙乙两两地地之之间间的的距距离离采采用用分分段段测测量量的的方方法法进进行行了了测测量量,将将甲甲乙乙之之间间的的距距离离分分成成为为100段段。设设每每段段测测量量值值的的误误差差(单单位位:cm)服服从从区区间间(1,1)上上的的均均匀匀分分布布。试试问问:对对甲甲乙乙两两地地之之间间距距离离的的测测量量值值的的总总误误差差绝绝对对值值超超过过10cm的的概概率率是是多多少?少?解:解:设设 Xi第第i段段测测量量误误差(差(i=1,2,),由于),由于
48、Xi服服从均匀分布,从均匀分布,E(Xi)0,D(Xi)21(1)2/12=1/3。根据上述中心极限定理,可得,。根据上述中心极限定理,可得,总误总误差差YXiN(0,100/3)。第84页,共88页,编辑于2022年,星期二84棣莫佛拉普拉斯中心极限定理棣莫佛拉普拉斯中心极限定理设随机变量设随机变量X服从二项分布服从二项分布B(n,p)的,那的,那么当么当n 时,时,X服从均值为服从均值为np、方差为、方差为 np(1-p)的正态分布,即:的正态分布,即:或:或:上述定理表明:上述定理表明:n很大,很大,np 和和 np(1p)也都不太小时,二项分布也都不太小时,二项分布可以用正态分布去近似
49、。可以用正态分布去近似。第85页,共88页,编辑于2022年,星期二85为什么很多随机现象呈正态分布为什么很多随机现象呈正态分布自然界和社会经济现象中,这类现象很普遍,许自然界和社会经济现象中,这类现象很普遍,许许多多的随机变量都可以视为众多独立随机变量许多多的随机变量都可以视为众多独立随机变量之总和。例如:之总和。例如:一个城市的居民生活用电总量是大量相互独立居民户用电一个城市的居民生活用电总量是大量相互独立居民户用电量的总和;量的总和;炮弹射击的误差,也可以看作是很多因素引起的小误差炮弹射击的误差,也可以看作是很多因素引起的小误差之总和。之总和。由中心极限定理可知由中心极限定理可知,即使各
50、单个随机变量的分布并,即使各单个随机变量的分布并不明确,但只要它们存在有限均值和方差,这个众多不明确,但只要它们存在有限均值和方差,这个众多独立的随机变量之总和的分布就趋近于正态分布。独立的随机变量之总和的分布就趋近于正态分布。正态分布也称为常态分布正态分布也称为常态分布第86页,共88页,编辑于2022年,星期二86本章小结本章小结随机现象、随机试验、事件的概念随机现象、随机试验、事件的概念概率的定义、基本性质和运算法则概率的定义、基本性质和运算法则随机变量的概念、概率分布的表示随机变量的概念、概率分布的表示随机变量的主要数字特征随机变量的主要数字特征三种常见的离散型概率分布三种常见的离散型