《统计学概率及概率分布ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学概率及概率分布ppt课件.ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 概率与概率分布概率与概率分布4 概率与概率分布概率与概率分布 掌握随机变量及其概率分布的含义,为掌握随机变量及其概率分布的含义,为推断统计的学习作准备推断统计的学习作准备学习目标在概率部分,复习样本空间与事件的概念、事件的概率及计算概率及计算在概率分布部分,复习随机变量的定义、离散型和连续型随机变量的概率分布、概率分布的数量特征,几种典型的概率分布如0-1分布、二项分布、正态分布等,以及典典型型概概率率分布的应用分布的应用4.1 概率基础知识概率基础知识 随机事件随机事件 随机事件的概率随机事件的概率随机事件的几个基本概念随机事件的几个基本概念事件的概念事件事件:随机试验的每一个
2、可能结果l例如:掷一枚骰子出现的点数为3(任何样本点集合)随机事件随机事件:每次试验可能出现也可能不出现的事件l例如:掷一枚骰子可能出现的点数必然事件必然事件:每次试验一定出现的事件,用表示l例如:掷一枚骰子出现的点数小于7不可能事件不可能事件:每次试验一定不出现的事件,用表示l例如:掷一枚骰子出现的点数大于6事件与样本空间基本事件l一个不可能再分的随机事件l例如:掷一枚骰子出现的点数样本空间l一个试验中所有基本事件的集合,用表示l例如:在掷枚骰子的试验中,1,2,3,4,5,6l在投掷硬币的试验中,正面,反面事件的概率事件A的概率是对事件A在试验中出现的可能性大小的一种度量表示事件A出现可能
3、性大小的数值事件A的概率表示为P(A)概率的定义有:古典定义、统计定义和主观概率定义概率的古典定义 如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值,记为概率的古典定义-实例 【例例4.1】某钢铁公司所属三个工厂的职工人数如下表。从 该公司中随机抽取1人,问:(1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率表表4-1 某钢铁公司所属企业职工人数某钢铁公司所属企业职工人数工厂工厂男职工男职工女职工女职工合计合计炼铁厂炼铁厂炼钢厂炼钢厂轧钢厂轧钢厂4400320090018
4、001600600620048001500合计合计8500400012500概率的统计定义 在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为事件的概率 例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数 n 的增大,出现正面和反面的频率稳定在1/2左右试验的次数正面/试验次数1.000.000.250.500.750 0255075100125概率的统计定义-实例【例例4.2】某工厂为节约用电,规定每天的用电量指标为1000度。按照上个
5、月的用电记录,30天中有12天的用电量超过规定指标,若第二个月仍没有具体的节电措施,试问该厂第一天用电量超过指标的概率。l 解解:上个月30天的记录可以看作是重复进行了30次试验,试验A表示用电超过指标出现了12次。根据概率的统计定义有(三)概率的公理化定义及性质(三)概率的公理化定义及性质 在随机试验样本空间在随机试验样本空间 上对每个时间上对每个时间A都有对应的实数都有对应的实数P(A),),如果这样的如果这样的P(A)满足:满足:1、对于任何事件、对于任何事件A,有,有0P(A)1;(;(P(A)0)2、必然事件的概率为、必然事件的概率为1,即,即P()=1;3、不可能事件的概率为、不可
6、能事件的概率为0,即,即P()=0。(。(-)4、A1,A2,Ai为互斥事件,则为互斥事件,则P(A1+A2+Ai)=P(A1)+P(A2)+P(Ai)则称则称P(A)为事件为事件A的概率的概率全概率公式和贝叶斯公式4.2 随机变量及其概率分布随机变量及其概率分布 随机变量的概念随机变量的概念 随机变量的概率分布随机变量的概率分布4.2.1 随机变量的概念一次试验的结果的数值性描述一般用 X、Y、Z 来表示例如:投掷两枚硬币出现正面的数量根据取值情况的不同分为离散型随机变量和连续型随机变量离散型随机变量随机变量 X 取有限个值或所有取值都可以逐个列举出来 X1,X2,以确定的概率取这些不同的值
7、离散型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽抽查查100个个产品产品一家餐馆营业一天一家餐馆营业一天电脑公司一个月的销售电脑公司一个月的销售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾顾客数客数销销售量售量顾顾客性客性别别0,1,2,1000,1,2,0,1,2,男性男性为为0,女性女性为为1连续型随机变量随机变量 X 取无限个值所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点连续型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽抽查查一批一批电电子元件子元件新建一座住宅楼新建一座住宅楼测量一个产品的测量一个产品的长长度度使用寿
8、命使用寿命(小小时时)半年后工程完成的百分比半年后工程完成的百分比测测量量误误差差(cm)X 00 X 100X 04.2.2 随机变量的概率分布随机变量的概率分布 随机变量可能的取值范围和取这些值相应 的概率称为随机变量的概率分布 离散型随机变量的概率分布 连续型随机变量的概率分布离散型随机变量的概率分布列出离散型随机变量X的所有可能取值列出随机变量取这些值的概率通常用下面的表格来表示X=xix1,x2,xnP(X=xi)=pip1,p2,pn P P(X X=x xi i)=)=p pi i称为离散型随机变量的概率函数称为离散型随机变量的概率函数p pi i 0 0连续型随机变量的概率分布
9、连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率通常研究它取某一区间值的概率用数学函数的形式和分布函数的形式来描述概率密度函数设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件 f(x)不是概率概率密度函数 在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1 x2,P(x1 X x2)是该曲线下从x1 到 x2的面积f(x)xab概率是曲线下的面积概率是曲线下的面积 4.2.3 随机变量分布的数字特征随机变量分布的数字特征在实际问题中概率分布较难确定,而反映随机变量某些方面特征的数值,即
10、随机变量的数字特征相对较容易估算出来,并且许多问题的解决往往只需知道某些数字特征在这些数字特征中,最重要的是期望和方差离散型随机变量的数学期望描述离散型随机变量取值的集中程度计算公式为离散型随机变量的方差描述离散型随机变量取值的分散程度计算公式为离散型随机变量的方差-实例【例例例例4.44.4】投投掷掷一一枚枚骰骰子子,出出现现的的点点数数是是个个离离散散型型随随机变量,概率分布为如下。计算数学期望和方差。机变量,概率分布为如下。计算数学期望和方差。X=xi1 2 3 4 5 6P(X=xi)=pi1/6 1/6 1/6 1/6 1/6 1/6解:解:解:解:数学期望为数学期望为:方差为:方差
11、为:连续型随机变量的期望和方差连续型随机变量的数学期望为方差为4.2.4 几种重要的随机变量概率分布几种重要的随机变量概率分布离散型 0-1分布 超几何分布 二项分布 泊松分布连续型 正态分布 t分布 F分布 2(卡方)分布0-1分布一个离散型随机变量X只取两个可能的值l例如,男性用 1表示,女性用0表示;合格品用 1 表示,不合格品用0表示列出随机变量取这两个值的概率超几何分布 设一批同类产品共N个,其中M个次品,现从中任取n个,则这n个产品中所含次品数X是一个离散型随机变量二项试验-贝努利试验二项分布与贝努利试验有关贝努利试验具有如下属性l每次试验只有两个可能的结果,即成功和失败l重复n次
12、二项分布设X为 n 次重复试验中事件A出现的次数,X 取 x 的概率为二项分布-实例例:从一批零件中随机抽取5件进行检验,每次取一件且检验后放回。假设在零件的加工过程中,出现次品的概率为0.05,求5件零件中恰好有x件次品的概率(x=0,1,2,3,4,5)。解 可以把抽取5个零件看成是5次独立试验。设抽到次品数为X,则X服从参数n=5、p=0.05的二项分布。其概率分布为泊松分布用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布泊松分布的例子l一个城市在一个月内发生的交通事故次数 l消费者协会一个星期内收到的消费者投诉 次数l人寿保险公司每天收到的死亡声明的人数泊
13、松概率分布函数 给定的时间间隔、长度、面积、体积内“成功”的平均数e=2.71828 x 给定的时间间隔、长度、面积、体积内“成功”的次数正态分布的重要性描述连续型随机变量的最重要的分布可用于近似离散型随机变量的分布例如:二项分布经典统计推断的基础x xf f(x x)概率密度函数 f(x)=随机变量 X 的频数 =总体方差 =3.14159;e=2.71828 x=随机变量的取值(-x )=总体均值 和 对正态曲线的影响xf(x)CAB正态分布的概率概率是曲线下的概率是曲线下的面积面积!a ab bx xf f(x x)标准正态分布的重要性一般的正态分布取决于均值和标准差 计算概率时,每一个
14、正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表标准正态分布函数 标准正态分布的概率密度函数任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布 标准正态分布的分布函数标准正态分布x 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布 1 1Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 标准正态分布表的使用对于一般正态分布,即XN(,),有标准化的例子 P(5 X 6.2)x 55 11一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布6.
15、2 1 1Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 0.12.0478.0478.0478t.售机票的学问资料资料 泛美航空公司新开设了一条每日往返于芝加哥和爱达荷州首府博伊西之间的航线。在最初的20个航班中,每个航班的75个座位都被全部预订出去了。在飞机起飞之前,每个航班都发现有个别乘客没来乘机。显然,坐不满的飞机会给航空公司带来经济损失。经过对最初20个航班资料的整理,得到如下空座位的频数分布:售机票的学问(续)空座位的个数航班次数2134405462758191100112合计 20售机票的学问(续)如果每个航班只售75张机票,则航空公司面临着乘客没有乘
16、机的风险(noshows)。当然,航空公司也可以在售票时多售一些,但这样又面临着超过75个人来登机的风险(overbooking)。为了减少风险,制定出更合理的方案,航空公司需要掌握已经预订了机票的乘客中有多大比例不来乘机。据悉,每张机票200美元,若来登机的乘客人数少于75人,每空一个座位就损失200美元;反之,若登机人数超过75人,则按照一般惯例,无法登机的乘客可以得到400美元,即除退还200美元机票费用,还得到同样数目的损失赔偿。讨论大纲对于任意一位乘客,能否计算出他预订了机票却不来乘机的概率?如果可以,是多少?它的分布情况如何?预订机票数目超过75或不足75都会给航空公司带来经济损失,试计算这一数目为多少时机会损失最小。伪随机数Excel的应用利用“函数”-“统计”中的有关函数“正态 二项 泊松”等计算概率或已知概率返回随机变量.利用“数据分析”-“分析工具”-“随机数发生器”生成随机数。