概率统计第二讲2011.pdf

上传人:asd****56 文档编号:74065295 上传时间:2023-02-24 格式:PDF 页数:43 大小:435.34KB
返回 下载 相关 举报
概率统计第二讲2011.pdf_第1页
第1页 / 共43页
概率统计第二讲2011.pdf_第2页
第2页 / 共43页
点击查看更多>>
资源描述

《概率统计第二讲2011.pdf》由会员分享,可在线阅读,更多相关《概率统计第二讲2011.pdf(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 1 第二讲第二讲 随机变量随机变量与概率与概率分布分布 一、随机变量及分布的概念 上一讲,我们研究了随机事件及其概率,在某些例子中,随机事件和实数之间存在着某种客观的联系。比如,在一个盒子中有 4件产品,其中 3 件正品,1 件次品,从中任取 2 件,观察取出的产品中含正品的件数。如果令=取出的 2 件产品中含正品的件数 则取值为 1,2,具体取哪个取决于试验结果,也就是与样本点有关,而又随试验次数而变化,因而叫随机变量。“取出的 2 件产品全

2、是正品”这一事件就可以简单地用(=2)表示。有些情况随机量虽然与实数之间没有上述那种“自然”的联系,但总可以人为地建立起一个对应关系。例如抛一枚硬币,可能出现正面,也可能出现反面,现在约定 若试验结果出现正面,令=1,若试验结果出现反面,令=0,这样,事件“试验结果出现正面”可用(=1)表示;事件“试验结果出现反面”可用(=0)表示。对于变量和,它们取什么值,在每次试验之前是不能确定的,因为它们的取值依赖于试验的结果,也就是说它们的取值是随机的。因此称这种变量为随机变量。一方面,试验的每一个结果都对应随机变量的一个确定的值,于是随机变量可看作样本空间上的一个“函数”,故可记为=),(,对每种可

3、能的实验结果即样本点都对应着一个实数)(,而)(又是随暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 2 试验结果不同而变化的一个变量;另一方面,对于任意的实数:,xx表示事件,如5.2,1分别表示“取出的 2 件产品中至多有一件正品”和“取出的 2 件产品中至多有两件正品”这两个事件。下面给出随机变量的定义。随机变量的直观描述:一个取值依赖于一定条件实现下的结果的数量 X,而且对任何给定实数c事件“X 取值不超过c”是有概率的,则称 X 为随机变量。定义 设是样本空间,即一定条件实现下所有

4、可能结果的集合,)(=是定义在上的实值函数,如果对任意实数)(|,xx是事件,即该事件有概率,则称)(=为随机变量。教材 6971,例 1.1,1.2,1.3,1.4,1.5,1.6,1.7 例 观察电话交换台在单位时间内收到的呼叫次数。该试验的样本空间为:,3,2,1,0=其中=k“在单位时间内收到k次呼叫”,,3,2,1,0=k定义上的一个函数=kkk,)(。由试验的实际意义可知,对任意的实数,xx显然是一事件,因而是随机变量。例 1 试验:从装有三个白球(记为 1,2,3 号)与两个黑球(记为 4,5 号)的袋中任取两个球,则样本空间可以表示为:5,4,5,3,4,3,5,2,4,2,3

5、,2,5,1,4,1,3,1,2,1=(注:(白,白),(白,黑),(黑,黑)或,110100严格讲暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 3 不是样本空间。)用表示取出的两个球中白球的个数,即 0)5,4(,1)5,3(,1)4,3(,1)5,2(,1)4,2(,2)3,2(,1)5,1(,1)4,1(,2)3,1(,2)2,1(=则是随机变量。随机变量是我们今后研究的主要对象。有了随机变量,对事件的研究变成对随机变量的研究。今后,我们主要研究离散型随机变量和连续性随机变量。离散型

6、随机变量:一种试验结果所可能取的值为有限个或至多可列个,我们能把其可能结果一一列举出来,这种类型的随机变量称为离散型随机变量。非离散型随机变量:不是离散型随机变量的随机变量。常遇到的非离散型随机变量是连续性随机变量:可取某个区间内的任何值的随机变量。要研究随机变量,首先要掌握其在各个范围的概率。为此,下面给出分布函数的概念。定义 设是一个随机变量,称函数),(,)(+=xxPxF 为随机变量的分布函数,或的分布。随机变量的分布函数)(xF具有如下性质:1)(xF是x的不减函数:若21xx,则)()(21xFxF 2 1)(0 xF,特别,0)(lim)(,1)(lim)(=+xFFxFFxx

7、暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 4 3)(xF在任一点x处左连续:)()0(),()(limxFxFxFyFxy=反之,若一个函数 F(x)具有上述性质(1)(3)则它可作为某个随机变量的分布函数。二、离散型随机变量及其概率分布 离散型随机变量是最简单的一种随机变量,许多随机试验都可用这种类型的随机变量来描述。定义 如果随机变量取值是有限或无限可列多个,则称为离散型随机变量。上段前几个例子中的随机变量显然是离散型随机变量。一般地,设是一离散型随机变量,它的全部取值为,21nx

8、xx,则称,3,2,1),(kkxPpkk=为随机变量的分布列,也称为的分布。由概率的定义,kp满足下面两条性质:1,2,1,0=kpk 211=kkp 反之,凡具有上面性质(1)、(2)的数列kp,都可作为某个随机变量的分布列或分布表。的分布列可以表示成下面的形式:kkppppxxxx321321 分布列完全描述了离散型随机变量的取值及取值的概率分布情况,也称为概率分布或理论分布。离散型随机变量的分布函数为 暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 5 =kxkpxPxF)()(例

9、从 1,2,3,4 四个数字中,等可能地取出两数,求两数之和的分布列。解:取出的两数之和可用随机变量来表示,所取的全部可能值为 3,4,5,6,7,取各个值的概率分别为 611)4()3(24=CPP,312)5(24=CP,611)7()6(24=CPP 其分布列为:616131616176543 对应分布函数如下:=xxxxxxxPxF717665544330)()(65323161 例 若离散随机变量的分布列为:21151151615131012 则 30131516151)0()1()2()()0(0=+=+=+=PPPkPPk 301721151)3()1()()5.31(5.31=

10、+=+=PkPPk 暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 6 频率分布(或统计分布或经验分布)表:)()()()(2121lnnninlxfxfxfxfxxxx 其中)(inxf表示随机变量x的观测值ix出现的频率,n为观测总次数,设im为观测值ix出现的次数(或频数),则=liimn1,nmxfiin=)(。下面介绍几种常见的离散型随机变量的概率分布。1、“0-1”分布(二点分布或伯努利分布)如果随机变量只能取两个值:0 和 1,而且 10,1)0(,)1(=pqpPpP 即的分

11、布列为:qp01,则称随机变量服从参数为p的“0-1”分布或二点分布。二点分布 如果随机变量只能取两个值:21,xx,而且 10,1)(,)(12211=pqppxPppxP 即的分布列为:qpxx21,则称随机变量服从参数为p的二点分布。例如,抛一枚均匀的硬币,若试验结果出现正面,令1=,若试验结果出现反面,令0=。则服从参数为5.0=p的“0-1”分布,它的分布列为:5.05.010。教材 7374,例 2.1,2.2 2、二项分布 如果随机变量的分布列为:暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读

12、使用,请勿做他用 7 nkppCkPknkkn,2,1,0,)1()(=,10 p 则称随机变量服从参数为pn,的二项分布,记为),(pnB,其概率函数记为:),;(pnxp。0246810121416182000.050.10.150.20.250.30.35kp(k,n,p)p1=0.1p2=0.2p3=0.3p4=0.5p5=0.6 一般地,n 重贝努里试验中某事件出现的次数均服从二项分布。所谓的 n 重贝努里试验是指:如果试验 E 只有两个可能的结果A和A,并且有pAP=)(,pAP=1)(,10=kekkPpkk为常数,称随机变量服从参数为的泊松分布,且记为)(P,概率函数记为);(

13、kp。在实际问题中,如在单位时间内电话交换台收到电话呼叫的次数,来到公共汽车站的乘客人数,布上的疵点数,每一个骑兵队中一年里被马踢死的人数等等,在一定的条件下,它们都服从或近似服从泊松分布。虽然二项分布和泊松分布形式上有着很大差别,但二者之间存在着密切的关系,即泊松分布是二项分布的极限分布。定理(泊松定理),3,2,1),(=npnbXn,如果当n时,nnp,np为相应事件A在一次试验中出现的概率(与试验的次数 n暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 9 有关),则当n时,有=ek

14、kppnkbkn!);(),;(。泊松分布的最可能值,即当)(P时,k为何值时,概率)(kP=最大?定 理2.2 如 果)(P,=其它为整数或10k,则,1,0|)(max)(0=kkPkP。例子,教材 76,例 2.3 例 设某商店每月销售某种商品的数量服从参数为 7 的普蛙松分布,问在月初进货时至少库存此种商品多少件,才能保证当月不脱销的概率不小于 0.999。解:设表示该商店每月销售该种商品的数量,n为月初进货时库存商品的件数,题意就是求n,使 999.0!7)(70=eknPnkk,计算可得,16n,即至少需 要库存 16 件商品。4、超几何分布 如果随机变量的可能取值是r,3,2,1

15、,0,而且概率分布为 rkCCCkPnNknMNkM,2,1,0,)(=其中NMn,都是正整数,为三个参数,且),min(,MnrNMNn=(约定当0时,0=xnC),则称这种分布为超几何分布,记为),(NMnH,其概率函数记为:),;(NMnxp。暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 10 注:如果一批产品共N个,其中有M个次品,从这批产品中任意取出n个产品中的次品数服从超几何分布),(NMnH。1234500.10.20.30.4n,M,N=5,10,100024681000.

16、10.20.30.40.5n,M,N=10,10,1000510152000.10.20.30.4n,M,N=20,10,1000102030405000.050.10.150.2n,M,N=50,80,100 1234567891000.050.10.150.20.250.30.35H(10,80,100),B(10,0.8000000000000)比 较 图H(n,M,N)B(n,p)暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 11 定理定理 如果如果10,)(),(),(lim=p

17、pNNMNMMNMnHN,则当N时,近似地服从参数为pn,的二项分布,即1),;(),;(lim=pnkpNMnkpN,nNknMNkMknkknCCCNMnkpppCpnkp=),;()1(),;(。例子,教材 79,例 2.4 5、离散型均匀分布 如果随机变量等可能地取n个两两互异的值jixxxxxjin,21,即的分布列为nknxPpkk,2,1,0,1)(=,称随机变量服从离散型均匀分布,且记为),(21nxxxU,概率函数记为nnkp1);(=。6、几何分布 如 果 随 机 变 量可 能 取 全 体 自 然 数,且的 分 布 列 为,2,1,)1()(1=kppkPpkk其中10 p

18、为参数,称随机变量服从 参 数 为p的 几 何 分 布,且 记 为)(pG,概 率 函 数 记 为pppkpk 1)1();(=。7、负二项分布 给 定 自 然 数r和10 p,如 果 随 机 变 量的 可 能 取 值 是,3,2,1,+rrrr,而且概率分布为 ,2,1,)1()(11+=rrrkppCkPrkrrk 则称这种分布为负二项分布,记为),(prNB,其概率函数记为:),;(prxp。暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 12 例子,教材 80,例 2.5 三、连续型

19、随机变量及其概率分布 在许多随机现象中出现的变量,如“测量某地的气温”、“显像管的寿命”、“某省参加高考学生的身高、体重”等等。它们的取值并非有限个或可列个,而是取自全体实数或是数轴上的某一区间。如同离散型随机变量,这些变量的结果随着试验结果的变化而变化。下面要讨论的连续性随机变量就是这类随机变量里一类特殊的随机变量。(一)、连续型随机变量的统计分布的直方图表示 如果连续随机变量的取值区间为,0naa,则 先取分点:naaaa210 再在坐标轴上截取各个区间:nkaaIaaIkkk,2,(,1101=接着计算随机试验中随机变量落入区间kI的统计频率:nnfkk=,其中n为试验总次数,kn为在n

20、次随机试验中随机变量落入区间kI的总次数,nk,2,1=。计算小矩形高:nkaafhkkkk,2,1,1=在坐标系中画出以,1kkaa为底、kh为高的矩形,nk,2,1=,这些矩形全体组成的图形称为该随机试验中随机变量关于分划naaaa210的直方图。例如,随机从一批零件中抽取 250 个零件,测得零件尺寸与规定尺寸的偏差频数如下:暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 13 零件尺寸偏差区间 频数 25,30(2 20,25(6 15,20(11 10,15(23 5,10(35

21、0,5(47 5,0(45 10,5(36 15,10(26 20,15(13 25,20(5 30,25(1 总计 250 暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 14 其对应的直方图如下:-30-20-10010203000.0050.010.0150.020.0250.030.0350.04直 方 图afk/(ak+1-ak)显然以,1kkaa为底、kh为高的矩形的面积 kkkkkfaahS=)(1,nk,2,1=,从而所有小矩形的面积和为 1:11=nkkS(二)连续型随机变

22、量的上限函数表示 定义 设)(xF是随机变量的分布函数,如果有非负可积函数)(x,使得+=xxduuxF,)()(,则称随机变量为连续型随机变量。非负函数)(x称为随机变量的概率密度函数,简称密度函数或分布密度。任一连续型随机变量的密度函数)(x具有下述性质:(1)0)(),(+xx;暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 15 (2)1)(=+dxx。反之,对于定义在实数域上的可积函数)(x,若它满足上述性质,则它是某个随机变量的密度函数。若连续型随机变量的分布函数和密度函数分别为

23、)(xF和)(x,则有如下性质:1)(xF是连续函数;2在)(x的连续点x,有)()(xxF=;3对任意点x,0)(=xP。由分布函数的定义,对任意的21xx,有=21)()()()(1221xxdxxxFxFxxP;=21)()()()(1221xxdxxxFxFxxP;=bxaxbaxabxp或0,1)(其中ba 为常数,则称随机变量在a,b上服从均匀分布,记为),(baU,)(xp的图形如下所示:暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 16 1.522.533.54-1-0.5

24、00.511.5参 数 a=1.68,b=3.98均 匀 分 布 图xp(x)显然,对于在a,b上均匀分布的随机变量,它取值小于 a 的概率为 0,取值大于 a 的概率为 1,在a,b的任一子区间c,d上取值的概率为abcd,它表明此概率与区间的长度成正比,而与在 a,b中的位置无关。在a,b上均匀分布的随机变量的分布函数如下:=bxbxaabaxaxxF10)(2、指数分布 如果随机变量的密度函数为=000)(xxexpx 或分布函数为 暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 17

25、 =+恒成立的充要条件是X服从指数分布。3、一元正态分布 如果随机变量的密度函数为+=xexpx,21)(222)(,则称随机变量服从参数为(正数)和的正态分布,简记为),(2N。暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 18 如果一个随机变量服从正态分布,也称它是一个正态随机变量。特别,当参数1=,0=时,即)1,0(N时,称服从标准正态分布,其密度函数+=xexx,21)(22通常用)(x表示,相应的分布函数为)(x。正态分布是概率论中最重要的分布之一,经验表明许多实际问题中的随机

26、变量,如测量误差(高斯发现,也称高斯分布)、砖的抗压强度、热力学中理想气体的分子速度、射击实弹着点与靶心的距离、学生的考试成绩、鸟蛋直径等等,一般都服从或近似服从正态分布。正态分布密度函数)(xp的图形如下所示:从上图可以看出,)(xp关于=x对称,在=x处达到最大值,当固定时,的值愈小,)(xp的图形就愈尖耸,的值愈大,)(xp的图形就愈平缓。暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 19 在教材的附录 563 页中给出了标准正态分布的分布函数)(x的数值表,当0 x时,)(x的值直

27、接由附表查到,当0=xxx 例如 设)1,0(N,则=8413.097725.0)1()2()21(P0.13595 81855.018413.097725.01)2()1()1(1()2()1()2()21(=+=+=+kkkkkPkak=18413.021)1(2)|(|P0.6826=19772.021)2(2)2|(|P0.9544=199865.021)3(2)3|(|P0.9973-3法则=1999968.021)4(2)4|(|P0.9999=19999997.021)5(2)5|(|P1 定 理:如 果),(2N,bk,0为 常 数,则+=0),(0),(kkkbNkkkbNb

28、k。教材 86 页:例 3.1、3.2。暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 20 4、威布尔(Weibull)分布 给定两个正数,m,如果随机变量的密度函数为()=000)(1xxexmxpmxmm 则称随机变量服从参数为,m的威布尔(Weibull)分布,记为:),(mW,m叫形状参数,叫刻度参数。威布尔(Weibull)分布由瑞典物理学家 Weibull 于 1939 年研究物质材料的强度时提出,一些产品如轴承的使用寿命服从威布尔(Weibull)分布。5、-分布 如 果 随

29、 机 变 量的 密 度 函 数 为=000)()(1xxexrxpxrr,其 中dxexrrxr+=01)(,0,0分别为给定常数和对应函数值(因+x时,01rx,而dxex+0收 敛,由 狄 里 克 雷 判 别 法 知 道:dxexrrxr+=01)(,0收敛),则称随机变量服从参数为和r的-分布,简记为),(r。-函数的性质:(1));()1(rrr=+(2)当r为正整数时,;)!1()(=rr(3)=)(21。特别,当参数1=r时,相应的-分布就是参数为的指数分布。当参数2nr=(n为正整数)、21=时,相应的-分布称为r阶爱尔暨南大学数学系张传林 2010-2011-2 数学与应用数学

30、、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 21 朗分布,其分布密度函数如下:=000)(21)(212212xxexxpxnnn 这就是n个自由度的2-分布,记为)(2n。定 理 如 果n,21是 相 互 独 立 的 随 机 变 量,且nirii,2,1),(=,则n+21),(21nrrr+。定理 如果)1,0(N,则)1(),(221212=。6、-分布 如果随机变量的密度函数为,则称随机变量服从参数为a和b的-分布,简记为),(ba。-函数dxxxbaba1101)1(),(=的性质:(1));,(),(abba=(2))()()(),(

31、bababa+=。许多随机变量用-分布描述较为恰当,例如,不合格品率、机器的维修率、打靶的命中率、市场的占有率等可以选择适当参数的-分布。大规模的集成电路的成品率不很稳定,它有 150 道工序,从材料到工人的情绪等诸多因素对成品质量均有影响,这时用参数大于 1 的-分布描述较为适当,而股票买卖的成功率用参数小于 1 的-分布描述较为适当。例 某两个城市之间的公路分为很多段,设在 1 年中需要维修的公路暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 22 段的比率服从-分布)2,3(,计算 1

32、 年中有一半以上共路段需要维修的概率。解:-分布)2,3(的密度函数为dxxxP 7、t-分布 如果随机变量的密度函数为212)1()()()(221+=nnxnnnxp,其中n为自然数,则称随机变量服从具有n个自由度的t-分布,简记为)(nt。注:具有 1 个自由度的t-分布也称为柯西分布。8、F-分布 如果随机变量的密度函数为()x,如果随机变量的密度函数为,如果正随机变量的密度函数为 0),2)(lgexp(21)(22=xxxxp 则称正随机变量服从参数为,的对数正态分布。四、随机变量的严格定义与分布函数 在条件 S 下的概率空间),(PF,是 S 下所有可能的不同结果组成的集合,F是

33、域即在 S 下“有概率的事件”的全体,P是概率测度,则随机变量可以定义为:如果),(PF是条件 S 下的概率空间,R:是上的实值函数,而且对FxRx)(|,,即)(|,xRx有概率,则称R:是),(PF上的随机变量随机变量。定理 4.1 设R:是),(PF上的随机变量,B是实直线上的波雷尔集,则FB)(|,即事件)(|B有概率。设R:是),(PF上的随机变量,函数)()(|()(,1,0:xPxPxFRxRF=称为随机变量的分布函数,也记为)(xF。定理 4.2 分布函数)()(xPxF=具有下述性质:(1)单调性:单调不减,)()(,bFaFbaRba;(2)0)(lim=xFx,1)(li

34、m=+xFx;(3)右连续性:)()0()(,lim0 xFxFxFRx=+=+;暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 24 (4))()0()(,lim0=+aFaFaPRa;(5))0()()(),()()(,=aFbFbaPaFbFbaPbaRba;(6))()0()(,aFbFbaPbaRba=。离散随机变量的分布函数有间断点。若是连续型随机变量,其概率密度函数是)(xp,则其分布函数=xduupxF)()(,而且在)(xp的连续点x处有)()(xpxF=。定理 4.3 设

35、R:是),(PF上的随机变量,)(xF是的分布函数,如果)(xF处处存在,则是连续型随机变量且)(xF就是的密度函数。定理 4.4 设R:是),(PF上的随机变量,kccc21,)(xF是的分布函数,如果)(xF连续,)(xF除有限个点kccc,21外处处存在且连续,则是连续型随机变量且对任意选取的一组非负数kaaa,21,函数=kicxacccxxFxpiik,2,1,)()(21是的密度函数。注 1:存在既非离散型也非连续型随机变量。教材 92 页例 4.1 中的随机变量为既非离散型也非连续型随机变量。注 2:存在非连续型随机变量使其分布函数连续。(例子可参考:周民强,实变函数,北京大学出

36、版社,1985,47-48 页)四、随机变量函数及其分布 如果实函数RRg:满足:)(|,cxgRxRc是波雷尔集,则称实函数RRg:为波雷尔函数。定理5.1 设R:是),(PF上的随机变量,RRg:为波雷尔函数,暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 25 则Rf=:)(为随机变量。在实际问题中,常常会遇到这样的情形:已知随机变量的概率分布,对于随机变量的函数)(g=,的分布如何?对这个问题分两种情况加以讨论。(一)、离散型随机变量函数的分布 在)(g=中,如果是一个离散型随机变量

37、,也是一个离散型随机变量。的分布可由的分布直接得到。设的 分 布 列 为)()()()(2121llxfxfxfxfxxxx,则 当 记)(|,21kikkyxgikyyyk=使时,的分布列为 其中)()()(=klyxglkxfyp 例 已知的分布列为05.031.022.03.02.01.005.010123,则2=的分布列为1.02.04.03.09410。(二)、连续型随机变量函数的分布 教材 94-96 页,例 5.1,5.2,5.3,5.4 在)(g=中,如果是连续型随机变量,由的分布密度)(xp求出)(g=的分布密度是非常困难的,这里只讨论一类特殊的函数。定理 设 是一个连续型随

38、机变量,其密度函数为)(xp,又函数)(xgy=严格单调,其反函数)(yh连续可微,则)(g=也是一个连续)()()()(2121llypypypypyyyy暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 26 型随机变量,且其密度函数为=yyyyhyhpy或0|)(|)()(,其中)(lim)(),(lim)(),(),(max),(),(minxggxggggggxx+=+=+=+=一般而言,可以先求分布函数=yxgYdxxpygPyPyF)()()()()(,然后求其导数就得密度函数。

39、例 1 设1)(2+=xxg ,若在区间0,2上服从均匀分布,试求)(g=的分布密度。解:已知的分布密度为=2,002,0)(21xxxp,则=yxgYdxxpygPyPyF)()()()()(=+51511)(1011021212yyydxdxxpyyxy 从而)(g=密度函数=000)()(2yydxxpdxxpyxyy 所以2=的分布密度为+=000)()()()(21yyypypyFyfyy 例 3 设为标准正态变量,试求2=的分布密度。解:由例 2 得:暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅

40、读使用,请勿做他用 27 2=的分布密度=+=000)()()()(22121yyeypypyFyfyyyy 广义反函数:设)(xF是分布函数,)1,0(p,定义)(|min)(1pxFRxpF=,则称1F是)(xF的广义反函数。引理 5.1 设广义反函数1F具有下述性质:(1)1F是增函数;(2)ppFFp)(),1,0(1且在)(xF在)(1pFxp=处连续时有ppFF=)(1成立;(3))()(,),1,0(1xFpxpFRxp。定理 5.3 设R:是),(PF上的随机变量,)(xF是其分布函数且连续,则RF=:)(为随机变量,而且服从 1,0上的均匀分布。注:设R:是),(PF上的随机

41、变量,)(xF是其分布函数且不是连续函数,则RF=:)(为随机变量,而且一定不服从 1,0上的均匀分布。定理 5.4 设R:是),(PF上的随机变量,)(xF是其分布函数,U服从 1,0上的均匀分布,则RUF=:)(1为随机变量,而且具有分布函数)(xF。五、随机变量的数学期望和方差 分布函数和密度函数决定了随机变量在某一点或不同区间的概率,从而随机变量的概率性质得以完整描述,但在实际当中,求出分布函数或密度函数通常很困难,况且许多问题并不需要知道随机变量的一切概率性质,而是希望知道随机变量的某些特征(如随机变量取暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业

42、概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 28 值的平均值、随机变量取值偏离其平均值的程度等)就足够了。因此,我们引入一些与随机变量有关的数值,这些数值能够描述随机变量在某些方面的特征,称这些数值为随机变量的数字特征,下面先看数学期望。(一)、离散型随机变量的数学期望 在实践中,我们会遇到这样的问题:如果要比较两个班级的学习成绩,通常是比较这两个班的平均成绩;要比较不同小麦品种的产量的高低也是比较平均亩产量的高低,而不是“全面”比较。用概率语言来说就是有两个随机变量和,要比较它们的大小,该如何比较呢?由于一个随机变量的所有取值有的大、有的小,参差不齐。如果把两个随

43、机变量各自取的值逐个进行比较,是无法比较出大小的。如能用一个数值从总体上刻画一个随机变量全部取值的平均大小,这个数值称为随机变量的“平均值”。若能这样,要比较两个随机变量的大小,只需比较两个随机变量的“平均值”的大小。例 某射击运动员进行射击训练,每天射击 50 发子弹。其射击命中的环数可用随机变量表示,显然,取的全部可能值为 0,1,2,10。如果某一天我们对该运动员进行一次观察,则这一天该运动员射击的平均环数为=+1001001043215050103210kkkkkfnknnnnn 上式中kn是击中k环的次数,)10,2,1,0(50=knfkk为射击k环的频率,于是 暨南大学数学系张传

44、林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 29 平均环数=100kkkf。如果再进行一次观察,就得到一组不同的频率,也就有不同的平均环数。由概率的统计定义,当观察天数越来越多时,频率kf稳定于概率kp,用概率值代替频率值得到的平均环数才是理论上的平均值。这个平均值叫做数学期望或简称为期望(或均值)。定义 设是一个离散型随机变量,它的分布列为 kkppppxxxx321321 若级数kkkpx+=1|收敛,则称级数和kkkpx+=1为随机变量的数学期望,简称为期望,记作E。如果kkkpx+=1|发散,则称

45、的数学期望不存在。例 如果),(pnB,即服从参数为pn,二项分布,则 的分布列为nkppCkPpknkknk,2,1,0,)1()(=,于是的数学期望:)1()1(11)!1()1()!1()!1(1)!(!0)1()1(=knknkknknknknkknknnkkppnpppkkpE npppnpppCnpnrnrnrrn=+=11101)1()1(例 若)(P,即服从参数为的泊松分布,则 的分布列为 0,2,1,0,!)(=kekkPpkk,于是的数学期望:=+=+=+=eeeekkpEkkkkkkkk1)!1(0!01。由数学期望的定义,求一个随机变量的数学期望先要求出该随机暨南大学数

46、学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 30 变量的分布列。但在求随机变量函数的数学期望时,可以不必求出其分布列,而是直接利用原随机变量的分布列就可以了。定理 若离散型随机变量的分布列为kkppppxxxx321321,对于随机变量的函数)(f=,如果+=kkkpxf1|)(|,则)(f=的数学期望存在,并且kkkpxfE+=1)(。例 离散型随机变量的分布列为818183818181321012,则2=的数学期望为858128128328181281223210)1()2(=+=E 一个随机

47、变量的数学期望刻画了它取值的平均大小,但在许多问题中,仅仅知道数学期望是不够的,还需要知道随机变量取值偏离它的均值的程度。例如,甲、乙两名射击运动员射击的环数可用随机变量和表示,和的分布列分别如下:412141678:8141838181567810:则7678412141=+=E,75678108141838181=+=E 可见EE=。从数学期望的角度二者并无差别,但直观上可以看出,甲运动员要比乙运动员更加稳定,因为其射击的结果与均值的偏离程度要比乙小。衡量一个随机变量取值偏离其均值的程度用方差表示。定义 设是一个离散型随机变量,数学期望E存在,如果2)(EE也存在,则称2)(EE为随机变量

48、的方差,并记作D 或var。方差的平方根D称为标准差或均方差,记作D=)(。暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 31 如果随机变量的分布列为kkppppxxxx321321,则 2222212112212)()()(2)(2)()(EEEEEpEpxEpxpExEEDkkkkkkkkkkk=+=+=+=+=+=+=22)(EED=这是常用的计算方差的公式,利用该式可以计算出前述例子中射击环数变量和的方差分别是2,5.0=DD,故甲比乙射击技术更稳定。例 若服从参数为的泊松分布,则

49、+=+=+=+=+=+=+=21)!1(2)!2(1)!1(!122,111eeeekeekEEkkkkkkkkkkkk =+=2222)(EED 例 如果),(pnB,即服从参数为pn,二项分布,则 的分布列为nkppCkPpknkknk,2,1,0,)1()(=,于是2的数学期望:=+=)1()1(11)!1()1()!1()!1(1)1(1)!(!2022)1()1(knknkknknkknknkknknnkkppnpppkpkE)1()1(112)2()2(22)1()!1()1()!1()!1()1()!2()2()!2()!2()1()1(=+=knnkknkknkppknknnp

50、ppknknpnpnn nppnnppnppppnnppCnpppCpnnnnrnrnrrnrnrnrrn+=+=+=2122110122022)1()1()1()1()1()1()1(又由前面的例子知道,npE=,从而)1()1()(22222pnppnnppnnEED=+=暨南大学数学系张传林 2010-2011-2 数学与应用数学、信息与计算科学专业概率统计课程讲议 版权申明:仅供作者本人和学生学习阅读使用,请勿做他用 32 一些常见的离散型随机变量的数学期望和方差:1、“0-1”分布(二点分布)的期望及方差 如果的分布列为:qp01,即随机变量为服从参数为p的“0-1”分布或二点分布的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁