概率和概率分布-课件.ppt

上传人:飞****2 文档编号:91540726 上传时间:2023-05-27 格式:PPT 页数:110 大小:3.08MB
返回 下载 相关 举报
概率和概率分布-课件.ppt_第1页
第1页 / 共110页
概率和概率分布-课件.ppt_第2页
第2页 / 共110页
点击查看更多>>
资源描述

《概率和概率分布-课件.ppt》由会员分享,可在线阅读,更多相关《概率和概率分布-课件.ppt(110页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第三章概率与概率分布一、概率的概念二、概率的计算三、概率的分布四、大数定律第一节 概率基础知识一、概率的概念(一)事件 必然事件(U):一定条件下必然出现。不可能事件(V):一定条件下必然不出现。随机事件(A):一定条件下可能出现。生物统计学只讨论随机事件。(二)频率 设事件A在n次重复试验中发生了m次,其比值m/n称为事件A发生的频率(frequency),记为:W(A)=m/n(三)概率(probability,P)事件A在n次重复试验中,发生了m次,当试验次数n不断增大时,事件A发生的频率W(A)就越来越接近某一确定值p,于是定义p为事件发生的概率(probability)。记为:P(A

2、)=p 只有当试验次数无限增大时,任一事件的频率趋于稳定,这时频率又称统计概率这时的频率和概率才是一样的调查株数(n)受害株数(a)植株受害频率(a/n)0.40 0.48 0.30 0.33 0.36 0.354 0.351 0.350 0.352 例:表3.1 棉田发生盲椿象的为害情况 表3.2 抛掷一枚硬币发生正面朝上的试验记录概率的三个性质:(1)任何事件概率均满足 0P(A)1(2)必然事件的概率为1(3)不可能事件的概率为0,即P(V)00P(A)1 P(U)=1 P(V)0 二、概率的计算(一)事件的相互关系和事件积事件互斥事件对立事件独立事件完全事件系 事件A和事件B中至少有一

3、个发生而构成的新事件称为事件A和事件B的和事件,记作A+B。n个事件的和,可表示为A1+A2+An。和事件ABAB 事件A和事件B中同时发生而构成的新事件称为事件A和事件B的积事件,记作AB。n个事件的积,可表示为A1A2An。积事件ABABA B互斥事件 事件A和事件B不能同时发生,则称这两个事件A和B互不相容或互斥。n个事件两两互不相容,则称这n个事件互斥。事件A和事件B必有一个发生,但二者不能同时发生,且A和B的和事件组成整个样本空间。即A+B=U,AB=V。则事件B为事件A的对立事件。B=A对立事件互斥事件对立事件 事件A和事件B的发生无关,事件B的发生与事件A的发生无关,则事件A和事

4、件B为独立事件。独立事件完全事件系 如果多个事件A1、A2、A3、An两两互斥,且每次试验结果必然发生其一,则称事件A1、A2、A3、An为完全事件系。(二)概率的计算法则1 互斥事件加法定理若事件A与B互斥,则 P(A+B)=P(A)+P(B)推理1 P(A1+A2+An)=P(A1)+P(A2)+P(An)推理2 P(A)=1-P(A)推理3 完全事件系的和事件的概率为1。2 独立事件乘法定理事件A和事件B为独立事件,则事件A与事件B同时发生的概率为各自概率的积。P(AB)=P(A)P(B)推理:A1、A2、An彼此独立,则P(A1A2A3An)=P(A1)P(A2)P(A3)P(An)播

5、种玉米时,每穴播两粒种子,种子的发芽率为90%,则:A:第一粒种子发芽B:第二粒种子发芽C:两粒种子均发芽D:只有一粒种子发芽E:两粒种子均不发芽(一)离散型变量的概率分布 要了解离散型随机变量x 的统计规律,必须知道它的一切可能值xi及取每种可能值的概率pi。三、概率分布1.列出离散型随机变量X的所有可能取值.2.列出随机变量取这些值的概率.3.通常用下面的表格来表示:表3.3 离散型变量的概率分布变量(x)x1 x2 x3 x4.xn概率(P)p1 p2 p3 p4.pn 设离散型变量x的一切可能值为xi(i=1,2,3),取相应值的概率为pi,则pi称为离散型随机变量x的概率函数。表3.

6、4某鱼群的年龄组成年龄(x)1 2 3 4 5 6 7频率(W)0.4597 0.3335 0.1254 0.0507 0.0215 0.0080 0.0012例,鱼群年龄的概率分布o 例:掷一次骰子所得点数的概率函数概率分布列例:掷二次骰子所得点数之和的概率分布概率分布图(二)连续型变量的概率分布 整理成频率分布表,n 增加、分组多,组距减少、直方条增加阶梯形曲线趋于光滑 当n无限大时,频率转化为概率,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率分布就转化为概率分布了,此曲线为总体的概率密度曲线。曲线函数用f(x)表示。连续型随机变量不能列出每一个值及其相应的概率,在某一区间内可以有无限

7、种可能的值,定义其取某特定值的概率没有意义,只能定义它在某区间内取值的概率。概率密度函数f(x)与x轴所围成的面积为1。连续型随机变量x在某一区间的概率:值 值(值 值,频数 频数)频数 频数ff(xx)aabbxx概率密度函数f(x)ff(xx)不是概率不是概率 概率函数(probability function)随机变量所取的值x的概率写成x的函数(离散型随机变量)概率密度函数(probability density function)随机变量取某一特定值x的概率密度的函数(连续型随机变量)概率分布函数或概率累积函数(probability distribution function)随机

8、变量取值小于或等于某特定值的概率。频率W(A)概率P(A)n 值大统计数参 数四、大数定律大数定律:概率论中用来阐述大量随机现象平均结果稳定性的 一系列定律的总称。设m是n次独立试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则对于任意小的正数11、贝努、贝努利大数定律(大数定律(Bernoulli theoremBernoulli theorem)Jocob Bernoulli(1654-1705年):瑞士数学家 当实验次数足够多时,某一事件出现的频率与概率有较大偏差的可能性很小 设x1,x2,x3,xn是来自同一总体的变量,对于任意小的正数。22、辛钦大数定律(、辛钦大数定律(

9、Khinchine theoremKhinchine theorem)Khinchine Khinchine(18941959)苏联数学家 只要从总体中抽取 的随机变量相当多,就可以用样本的统计数来估计总体的参数。参数 统计数样本容量越大,样本统计数与总体参数之差越小。随机变量的分布可用分布函数来表述概率 离散型变量(discrete random variable)连续型变量(continuous random variable)二项分布泊松分布正态分布变量第二节 几种常见的理论分布动物种子穗子生物个体雄性雌性 发芽不发芽有芒 无芒成活死亡对立事件一、二项分布贝努利分布二项总体二项分布“非此

10、即彼”事件所构成的总体概率分布二项总体特点1、试验只有两个对立结果,概率分别为p与q(q=1-p)2、重复性3、独立性(一)二项分布的概率函数试验的条件不变,即在每次试验中事件A出现的概率皆为p。任何一次试验中,事件A的出现与其余各次试验中出现的结果无关。从雌雄各半的100只动物中,做一抽样试验。第一次从这100只动物中随机抽取1只,记下性别后放回,再做第二次抽样。不论第一次抽样结果,第二次抽样中,得到雌性或雄性的概率仍是50100。这两次试验是独立的第一次抽样后不放回,再做第二次抽样。这两次试验是非独立的雄性动物抽到雄性的概率是4999抽到雌性的概率是5099雌性动物抽到雄性的概率是5099

11、抽到雌性的概率是4999放回式抽样非放回式抽样二项分布超几何分布x表示在n次试验中事件A出现的次数,其概率分布函数为:P(x)为随机变量x的二项分布,记作 B(n,p)p(x)=1o 二项分布的概率函数【例 例】已知一批产品的次品率为 已知一批产品的次品率为4%4%,从中任意有放回地,从中任意有放回地 抽取 抽取5 5个。求 个。求5 5个产品中:个产品中:(1)(1)没有次品的概率是多少?没有次品的概率是多少?(2)(2)恰好有 恰好有1 1个次品的概率是多少?个次品的概率是多少?(3)(3)有 有3 3个以下次品的概率是多少?个以下次品的概率是多少?(1)当p值较小且n不大时,分布是偏倚的

12、。随n的增大,分布趋于对称;(2)对于固定的n和p,当x增加时,P(x)先随之增加并达到极大值,以后又下降。(3)当p值趋于0.5时,分布趋于对称。二项分布的形状二项分布B(n,p)的参数二项成数分布:p p 应用二项分布时,当试验的次数 n 很大,成功的概率 p 很小时,这时二项分布就变成泊松分布,为二项分布的一种特殊类型。例:一匹布上发现的疵点个数一定页数的书刊上出现的错别字个数 抽检大量产品中出现次品的件数田间小区内出现变异植株的计数二、泊松分布(Poisson distribution)(Simeon-Denis Poisson,1781-1840)法国数学家 n 很大,p值很小。用来

13、描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布。为参数,np e=2.71828 泊松分布概率函数P()的形状由确定 较小时,泊松分布偏倚。增大时,泊松分布趋于对称。无限增大时,泊松分布接近正态分布。泊松分布形状对于小概率事件,可用泊松分布描述其概率分布。二项分布当p0.1和np5时,可用泊松分布来近似。21泊松分布应用【例 例】假 假定 定某 某航 航空 空公 公司 司预 预订 订票 票处 处平 平均 均每 每小 小时 时接 接到 到42 42次 次订 订票 票电话,那么 电话,那么10 10分钟内恰好接到 分钟内恰好接到6 6次电话的概率是多少?次电话的概率是多少?解 解:设

14、设X X为 为10 10分钟内航空公司预订票处接到的电话次数 分钟内航空公司预订票处接到的电话次数 围绕在平均值左右,由平均值到分布的两侧,变量数减少,即两头少,中间多,两侧对称。特点Gauss,1777-1855 三、正态分布(normal distribution)N非常大p与q接近大二项分布泊松分布正态分布p0.1,(np)5(一)正态分布的概率函数总体平均数总体标准差圆周率,3.14159 e为自然对数底,2.71828记为:N(,2)x=时,f(x)值最大,正态分布曲线是以平均数处为峰值的曲线。x-的绝对值相等时,f(x)值也相等,正态分布以为中心向左右两侧对称。f(x)是非负函数,

15、以x轴为渐近线,x的取值区间为(-,+)。12(二)正态分布的特征3正态分布曲线由参数,决定,确定正态分布曲线在x轴上的中心位置,减小,曲线左移,增大,曲线右移;确定正态分布的展开程度,大,曲线展开度越大,数据分散。小,曲线展开度小,数据集中。4的影响的影响 决定曲线在x 轴上的位置 决定曲线的形状正态分布曲线在x=处各有一个拐点,曲线通过拐点时改变弯曲度。5曲线与x轴围成的全部面积为16aabbxxff(xx)若一个连续型随机变量x取值于区间(a,b),其概率为:(三)标准正态分布 正态分布是依赖于参数(,2)的一个曲线系,正态曲线的位置及形态随(,2)的不同而不同,需将其标准化。标准正态分

16、布:随机变量具有均值为0,方差 为1的 正态分布(u分布),记作N(0,1)。2标准正态分布方程:u表示标准正态离差,它表示离开平均数有几个标准差。任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布:令 正态分布标准化实质上做出了座标轴的平移和尺度转换,使正态分布具有平均数为0,标准差为1。标准正态分布u落在区间(a,b)的概率:a b 标准正态分布的概率累积函数记作F(u):它是变量u小于某一定值ui的概率,这需要计算从-到ui的定积分:原始数值 原始数值 70 80 90 100 110 120 130 70 80 90 100 110 120 130(均值 均值)xxff(x

17、x)标准化 标准化-3-2-1 0 1 2 3-3-2-1 0 1 2 3 概率值独立于实际 概率值独立于实际的均值和标准差,只与原 的均值和标准差,只与原始数值相对于均值的位置 始数值相对于均值的位置有关 有关(四)正态分布的概率计算N N(0 0,1 1)N N(100 100,100 100)1、标准正态分布表的使用 对于标准正态分布,即N(0,1),有n P(ub)F u=b F b n P(ua)1-F u=a=1-F a n P(a ub)F b F an P(|u|a)2F-a n P(|u|a)2F a 1n P(0ua)F(a)-0.5 计算:已知 已知u u N(0 N(0

18、,1)1),试求:,试求:P(0u1);P(u1.1);P(u0.9);P(X2.5)2)查附表11)先标准化将正态分布的随机变量x取值区间的上下限按照转换成u值取值区间单位上下限2、计算一般正态分布的概率 例:假定x是一随机变数具有正态分布,平均数=30,标准差=5,试计算小于26,小于40的概率,介于26和40区间的概率以及大于40的概率。o 1:P(x 26)=F(26)先将x转换成u值 u=(x-)/=(26-30)/5=0.8查附表2,当u=0.8时 F(26)=0.2119o 2:P(x 40)=F(40)u=(x-)/=(40-30)/5=2.0 查附表2,当u=2.0时 F(4

19、0)=0.9773o 3:P(2640)=1-P(x 40)=1-0.973=0.0227【例 例】假 假定 定某 某公 公司 司职 职员 员每 每周 周的 的加 加班 班津 津贴 贴服 服从 从均 均值 值为 为50 50元 元、标 标准 准差 差为 为10 10元 元的 的正 正态 态分 分布 布,那 那么 么全 全公 公司 司中 中有 有多 多少 少比 比例 例的 的职 职员 员每 每周 周的 的加 加班 班津 津贴 贴会 会超 超过 过70 70元,又有多少比例的职员每周的加班津贴在 元,又有多少比例的职员每周的加班津贴在40 40元到 元到60 60元之间呢?元之间呢?解:解:设 设

20、=50=50,=10=10,X X N N(50,10(50,102 2)正态曲线下面积分布规律o 1.65:占全部曲线下面积的90%o 1.96:占全部曲线下面积的95.00%o 2.58:占全部曲线下面积的99.00%-3-2-+2+3 x68.3%95.5%99.7%P(-x+)P(-2x+2)P(-3x+3)=P(-1u1)=0.6826=P(-2u2)=0.9545=P(-3u3)=0.9973=P(-1.96u1.96)=0.95=P(-2.58u2.58)=0.99P(-1.96x+1.96)P(-2.58x+2.58)P(x+1.96,x-1.96)=P(|x-u|1.96=0

21、.05P(x+2.58,x-2.58)=P(|x-u|2.58=0.01关于正态分布,以下几种概率应当熟 附表2列出了两尾概率取某一值时的临界u值(正态离差u值),可供直接查用。例,查:P=0.01时,u=2.5758 表示:P(|u|2.5758)=P(x 2.5758)+P(x-2.5758)=0.01 查:P=0.05时,u=1.9599 表示:P(|u|1.9599)=P(x 1.9599)+P(x-1.9599)=0.05即:查 P=时,u=d 时表示:P(|u|d)=P(x d)+P(x-d)=a/2+a/2=五,正态离差u值表(正态分布临界值表)的使用o 对于给定的两尾概率求标准

22、正态分布在x轴上的分位点/2/2用2 查附表2,可得一尾概率为 时的分位点uo 给定的一尾概率求标准正态分布在x轴上的分位点l 如果是双尾概率u值表,计算单尾概率的u值时,概率值乘以2,再查相应的u值;如:双尾概率a=0.05时 u=1.96。单尾概率a=0.05 的u值为2a=0.1时的对应值(u=1.645)。l如果是单尾概率u值表,计算双尾概率的u值时,概率值除以2,再查相应的u值;如:单尾概率a=0.05(u=1.645),双尾概率a=0.05的u值为a/2=0.025时的对应值(u=1.960).当概率一定时,两尾概率的|u|总是大于单尾概率|u|。几个常用的分位数:o 双尾概率a为

23、0.05时,u=o 双尾概率a为0.01时,u=o 左(右)尾概率a为0.05时,u=o 左(右)尾概率a为0.01时,u=W.Gosset于1908年以“Student”笔名将“t-检验”发表于Biometrika上,文章说:“任何实验可以认为是许多相同条件下作出的实验的总体中的一个个体,一系列的实验则是从这个总体所抽得的一个样本。”第三节 统计数的分布总体样本1x1样本2x2样本3x3样本nxn复置抽样:指将抽得的个体放回总体后再继续抽样不复置抽样:指将抽得的个体不放回总体而继续进行抽样抽样 一、抽样试验与无偏估计原总体样本1 样本2 样本n新总体n 统计量 抽样分布(sampling d

24、istribution)样本统计量的理论分布(概率分布)称为抽样分布。这时样本统计量是随机变量.无偏估计值:如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。例:见教材表3-6.样本平均数是总体平均数的无偏估计值。样本方差是总体方差的无偏估计值。抽样分布的概念样本标准差不是总体标准差的无偏估计值.【例 例】设 设一 一个 个总 总体 体,含 含有 有4 4个 个个 个体 体,分 分别 别为 为x x1 1=1=1,x x2 2=2=2,x x3 3=3=3,x x4 4=4=4。即 即总 总体 体单 单位 位数 数N N=4=4。总 总体 体的 的

25、均 均值 值、方 方差 差及 及分 分布如下 布如下.总体分布总体分布1 1 4 4 2 2 3 30 0.1.1.2.2.3.3均值和方差均值和方差二、样本平均数的分布 现 现从 从总 总体 体中 中抽 抽取 取n n 2 2的 的简 简单 单随 随机 机样 样本 本,在 在重 重复 复抽 抽样 样条 条件 件下 下,共有 共有4 42 2=16=16个样本。所有样本的结果为下表:个样本。所有样本的结果为下表:3,4 3,3 3,2 3,1 32,4 2,3 2,2 2,1 24,4 4,3 4,2 4,1 41,441,33 2 11,2 1,1 1第二个观察值第一个观察值所有可能的 n=

26、2 的样本(共16个)计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值值的抽样分布的抽样分布 3.5 3.0 2.5 2.0 3 3.0 2.5 2.0 1.5 2 4.0 3.5 3.0 2.5 4 2.5 4 2.0 3 2 1 1.5 1.0 1第二个观察值第一个观察值 16个样本的均值(x)x x样本均值的抽样分布 样本均值的抽样分布1.0 1.00 00.1 0.10.2 0.20.3 0.3P P(x x)1.5 1.5 3.0 3.0 4.0 4.0 3.5 3.5 2.0 2.0 2.5 2.5=2.5 2=1.25总体分布总体分布1 1 4 4 2 2 3 30 0.1.1.2.2.3.3抽样分布抽样分布P P(x x)1.0 1.00 0.1.1.2.2.3.31.5 1.5 3.0 3.0 4.0 4.0 3.5 3.5 2.0 2.0 2.5 2.5x x样本均值的分布与总体分布的比较

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁