《数理统计第一讲.ppt》由会员分享,可在线阅读,更多相关《数理统计第一讲.ppt(79页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数理统计第一讲 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望 为了更方便地从数量方面研究随机现象为了更方便地从数量方面研究随机现象的统计规律,引入随机变量的概念,即将随的统计规律,引入随机变量的概念,即将随机试验的结果与实数对应起来,机试验的结果与实数对应起来,将随机试验将随机试验的结果数量化。的结果数量化。1.3.1 一维随机变量及其分布一维随机变量及其分布 定义定义 设随机试验的样本空间设随机试验的样本空间一、随机变量的定义一、随机变量的定义称称 为为随机变
2、量随机变量。上的上的实值单值函数实值单值函数,是定义在样本空间是定义在样本空间2 2)随机变量函数的取值在试验之前无法确定随机变量函数的取值在试验之前无法确定,且且取值有一定的概率取值有一定的概率;而普通函数却没有。;而普通函数却没有。随机变量和普通函数的区别随机变量和普通函数的区别1 1)定义域不同定义域不同也可以不是数;而普通函数是定义在实数域上。也可以不是数;而普通函数是定义在实数域上。随机变量定义在样本空间随机变量定义在样本空间 上上,定义域可以是数定义域可以是数随机变量的分类随机变量的分类 例如:例如:“抽验一批产品中次品的个数抽验一批产品中次品的个数”,“电话交换台在一定时间内收到
3、的呼叫次数电话交换台在一定时间内收到的呼叫次数”等等1 1)离散型随机变量)离散型随机变量2 2)连续型随机变量)连续型随机变量所有取值可以逐个一一列举所有取值可以逐个一一列举例如:例如:“电视机的寿命电视机的寿命”,实际中常遇到的实际中常遇到的“测量误差测量误差”等等.全部可能取值有无穷多,全部可能取值有无穷多,充满一个或几个区间充满一个或几个区间二、分布函数的概念二、分布函数的概念定义定义1 1设设 是一个随机变量,是一个随机变量,是任意实数是任意实数,称函数称函数为为 的的分布函数分布函数。上的概率上的概率.分布函数分布函数的值就表示的值就表示 落在区间落在区间 分布函数的性质分布函数的
4、性质分布函数的性质分布函数的性质 单调不减性单调不减性:右右连续性连续性:,且,则,则上述三条性质,也可以理解为判别函数是否是分布上述三条性质,也可以理解为判别函数是否是分布函数的充要条件。函数的充要条件。定义定义 若随机变量X 的全部可能取值是有限个有限个或可列无限多个可列无限多个,则称此随机变量是离散型随机变量离散型随机变量。三、离散型随机变量及其分布、离散型随机变量及其分布定义定义 设随机变量设随机变量X的所有可能取值为的所有可能取值为满足满足kp判断分布律判断分布律的条件的条件则称则称pk为离散型随机变量为离散型随机变量X的的概率分布概率分布或或分布律分布律。分布律分布律也可用如下也可
5、用如下表格表格的形式表示的形式表示常用的离散型随机变量常用的离散型随机变量1.1.(01)(01)分布分布定义定义 若随机变量若随机变量X 的分布律为的分布律为(0101)分布的分布律也可写成)分布的分布律也可写成注意注意 服从服从(0-1)(0-1)分布的随机变量很多。如果涉及的分布的随机变量很多。如果涉及的试验只有两个互斥的结果:试验只有两个互斥的结果:都可在样本空间上都可在样本空间上定义一个服从定义一个服从(0-1)(0-1)分布的随机变量:分布的随机变量:例如例如 检查某产品的质量是否合格;检查某产品的质量是否合格;抛一枚硬币观察其正反面;抛一枚硬币观察其正反面;一次试验是否成功。一次
6、试验是否成功。容易验证容易验证由二项式定理由二项式定理2 2 二项分布二项分布二项分布描述的是二项分布描述的是 n 重贝努里试验中出现重贝努里试验中出现“成功成功”次数次数X 的概率分布的概率分布.3.3.3.3.泊松分布泊松分布泊松分布泊松分布称称服从参数为服从参数为的的泊松分布泊松分布,记为记为其中其中 是常数是常数,若随机变量若随机变量 的分布律的分布律泊泊松松分分布布在在管管理理科科学学、运运筹筹学学以以及及自自然然科科学学的的某某些些问题中都占有重要的地位。问题中都占有重要的地位。泊松分布的应用泊松分布的应用 排队问题排队问题:在一段时间内窗口等待服务的:在一段时间内窗口等待服务的顾
7、客人数顾客人数 生物存活的个数生物存活的个数 放射的粒子数放射的粒子数 连续型随机变量及其分布连续型随机变量及其分布一、定义一、定义其中被积函数其中被积函数 ,称称 为为概率密度函数概率密度函数 或或 概率密度概率密度。如果随机变量如果随机变量 的分布函数为的分布函数为则称则称 为连续型随机变量为连续型随机变量二二.概率密度的性质概率密度的性质1.1.2.2.面积为面积为1 1o o3.3.4.4.在在 的连续点的连续点 处,则处,则 对连续型对连续型 r.v X,有有几种常见的分布几种常见的分布一、均匀分布一、均匀分布分布函数为分布函数为:1.1.若若X的概率密度为的概率密度为 则称则称 服
8、从服从(a,b)上的上的均匀分布均匀分布,记作,记作二、指数分布二、指数分布二、指数分布二、指数分布若若 随机变量随机变量 具有概率密度具有概率密度则称则称 服从参数为服从参数为 的指数分布的指数分布.记为记为 的分布函数的分布函数三、正态分布三、正态分布三、正态分布三、正态分布的的正态分布正态分布,或或高斯分布高斯分布.所确定的曲线称为所确定的曲线称为正态曲线正态曲线若若X具有概率密度具有概率密度 则称则称 服从参数为服从参数为记为记为条关于条关于 对称的钟形曲线对称的钟形曲线.特点是特点是:正态分布的密度曲线是一正态分布的密度曲线是一正态分布的图形特点正态分布的图形特点正态分布的图形特点正
9、态分布的图形特点决决定定了了图图形形决决定定了了图图形形中中峰峰的的陡陡峭峭程程度度的的中中心心位位置置“两头小两头小,中间大中间大,左右对称左右对称”正态分布的分布函数正态分布的分布函数正态分布的分布函数正态分布的分布函数 标准正态分布标准正态分布的正态分布称为的正态分布称为标准正态分布标准正态分布.其密度函数和分布函数常用其密度函数和分布函数常用 和和 表示表示 的分布函数是的分布函数是若若 ,则则 N(0,1)设设 ,定理定理定理定理 若若1.3.2 随机向量及其分布随机向量及其分布 有些随机实验的结果同时涉及若干个随机变量,有些随机实验的结果同时涉及若干个随机变量,我们不但要考虑其中各
10、个随机变量的性质,我们不但要考虑其中各个随机变量的性质,还要研究它们之间的联系,即要研究随机向量及其还要研究它们之间的联系,即要研究随机向量及其分布。分布。定义定义1 1设设是二维随机变量是二维随机变量,对于任意实数对于任意实数 ,称称为为 的的分布函数分布函数。分布函数的几何意义分布函数的几何意义分布函数的几何意义分布函数的几何意义 将二维随机变量将二维随机变量看成平面上随机点的坐标看成平面上随机点的坐标落在矩形区域落在矩形区域中的概率为中的概率为分布函数的性质分布函数的性质 当当 时时,对于任意固定的对于任意固定的 ,对于任意固定的对于任意固定的 ,1.1.关于关于x 和和y 单调单调不减
11、不减当当 时时,2.2.3.即即关于关于x右连续右连续关于关于y右连续右连续即即二维离散型随机变量二维离散型随机变量设设 所有可能取值为所有可能取值为 ,则,则称称定义定义5 5定义定义4 4是是有限多对或可列无限多对有限多对或可列无限多对,则称则称 为二维为二维离散型随机变量离散型随机变量.为随机变量为随机变量 的的分布律分布律。性质性质:若二维随机变量若二维随机变量的所有可能取值的所有可能取值),(YX分布律的分布律的表格表示表格表示 Y X 1y 2y jy 1x 11p 12p jp1 2x 21p 22p jp2 M ix 1 ip 2ip ijp M 离散型随机变量离散型随机变量
12、的分布函数具有形式的分布函数具有形式其中和式是对一切满足其中和式是对一切满足 的的 求和求和 二维连续型随机变量二维连续型随机变量对于任意的对于任意的 ,有,有 定义定义 设二维随机变量设二维随机变量的分布函数的分布函数若存在若存在非负函数非负函数 ,则称则称 f(x,y)为为(X,Y)的的概率密度概率密度。2)2)3)3)3)3)若若在点在点处连续处连续,则有则有概率密度的性质概率密度的性质1)1)4)4)设设 是是 平面上的任意一个区域,则有平面上的任意一个区域,则有 (表示以表示以 为底,以曲面为底,以曲面 为顶面的曲顶柱体的体积为顶面的曲顶柱体的体积)两个重要分布(1 1)设平面区域设
13、平面区域D的面积为的面积为A ,若随机向量,若随机向量(X,Y)的概率密度为的概率密度为则称随机向量则称随机向量(X,Y)在区域在区域D上服从均匀分布。上服从均匀分布。1 1、均匀分布、均匀分布 向向平平面面上上有有界界区区域域D上上任任投投一一质质点点,若若质质点点落落在在D内内任任一一小小区区域域D1的的概概率率与与小小区区域域的的面面积积成成正正比比,而而与与D1的的形形状状及及位位置置无无关关.则则质质点点的的坐坐标标 (X,Y)在在D上服从均匀分布上服从均匀分布.(2 2)若区域)若区域D内任一部分区域内任一部分区域D1,其面积为,其面积为A1,则有,则有 的二维正态分布,记为的二维
14、正态分布,记为 若二维随机变量若二维随机变量的概率密度为的概率密度为其中其中都是常数都是常数,且且则称则称服从参数为服从参数为2 2、二维正态分布、二维正态分布边缘分布边缘分布(一)(一)定义定义设设是二维随机变量是二维随机变量,同理可得同理可得几何几何表示表示:称为称为关于关于 的的边缘分布函数边缘分布函数。(二)边缘分布律(离散型)设设的分布律为的分布律为记为记为 则则 关于关于 的的边缘分布律边缘分布律为为则有则有:则有则有:称为称为 关于关于 的的边缘分布律边缘分布律 记为记为 同理同理通常用以下表格表示通常用以下表格表示的分布律和边缘分布律的分布律和边缘分布律(三)边缘概率密度(连续
15、型)若若是二维连续型随机变量,是二维连续型随机变量,其概率密度为其概率密度为则则同理同理的边缘概率密度的边缘概率密度例例 设二维随机变量设二维随机变量试求试求的边缘概率密度的边缘概率密度.解解令令即即同理,同理,Y 的边缘概率密度为的边缘概率密度为即即故二维正态分布的两个边际分布都是一维正态分布,故二维正态分布的两个边际分布都是一维正态分布,这是一个重要的结论。这是一个重要的结论。结结结结 论论论论 (一)(一)(一)(一)结结结结 论论论论 (二)(二)(二)(二)结结结结 论论论论 (三)(三)(三)(三)成立,则称随机变量成立,则称随机变量 与与 是是相互独立相互独立的。的。二维随机变量
16、的相互独立性二维随机变量的相互独立性定义定义 若二维随机变量若二维随机变量(X,Y)对对任意实数任意实数x,y,都都有有即即2)2)对于连续型的随机变量对于连续型的随机变量几乎处处成立几乎处处成立1)1)对于离散型随机变量对于离散型随机变量可直接推广至两个以上随机变量的相互独立性可直接推广至两个以上随机变量的相互独立性例例例例 3 3 3 3(正态随机变量的独立性)(正态随机变量的独立性)(正态随机变量的独立性)(正态随机变量的独立性)n维随机变量的独立性维随机变量的独立性定义定义 下面分别给出离散型随机变量和连续型随机下面分别给出离散型随机变量和连续型随机变量相互独立的充要条件变量相互独立的
17、充要条件定理定理1定理定理2分别为其联合概率密度函数和边缘密度函数。还可以证明:还可以证明:1.3.3 条件概率分布条件概率分布 第三章 二、连续型随机变量的条件分布二、连续型随机变量的条件分布一一、离散型随机变量的条件分布、离散型随机变量的条件分布 对二维随机变量对二维随机变量 ,在一个随机变量取固定值的条在一个随机变量取固定值的条 件下件下,另一随机变量的概率分布另一随机变量的概率分布,称为条件概率分布称为条件概率分布(简称简称2、二维离散型随机变量的条件分布、二维离散型随机变量的条件分布 设二维离散型随机变量设二维离散型随机变量 的联合分布律为的联合分布律为则关于则关于X的边缘分布律为的
18、边缘分布律为关于关于Y 的边缘分布律为的边缘分布律为条件分布条件分布)若若 ,则由条件概率的定义知,则由条件概率的定义知称之为在称之为在 条件下条件下X 的的条件分布律条件分布律。类似地,当类似地,当 时,在时,在 条件下条件下Y 的的条件分布律条件分布律为为例例1 已知已知10件产品中有件产品中有3件一等品件一等品,5件二等品件二等品,2件三等品件三等品,现现从这批产品中任意抽出从这批产品中任意抽出4 件件,求其中一等品件数求其中一等品件数 及二等品件及二等品件数的联合分布列数的联合分布列.01234012300000000010/210 20/2105/21015/210 60/210 3
19、0/2103/2102/2105/21030/2105/21050/21030/210100/210 50/2105/21035/210105/21063/2107/2101求随机变量求随机变量 (或或 )的分布列的分布列.01234012300000000010/210 20/2105/21015/210 60/210 30/2103/2102/2105/21030/2105/21050/21030/210100/210 50/2105/21035/210105/21063/2107/2101(1)已知抽取的已知抽取的4件产品中有件产品中有2件二等品件二等品,求一等品件数的概率分布求一等品件
20、数的概率分布.(2)已知抽取的已知抽取的4件产品中有件产品中有1件一等品件一等品,求二等品件数的概率分布求二等品件数的概率分布.解解:(1)所求概率分布律为所求概率分布律为于是于是同理同理01234012300000000010/210 20/2105/21015/210 60/210 30/2103/2102/2105/21030/2105/21050/21030/210100/210 50/2105/21035/210105/21063/2107/2101(1)已知抽取的已知抽取的4件产品中有件产品中有2件二等品件二等品,求一等品件数的概率分布求一等品件数的概率分布.(2)已知抽取的已知抽
21、取的4件产品中有件产品中有1件一等品件一等品,求二等品件数的概率分布求二等品件数的概率分布.01234012300000000010/210 20/2105/21015/210 60/210 30/2103/2102/2105/21030/2105/21050/21030/210100/210 50/2105/21035/210105/21063/2107/2101解解:(1)所求概率分布律为所求概率分布律为(1)已知抽取的已知抽取的4件产品中有件产品中有2件二等品件二等品,求一等品件数的概率分布求一等品件数的概率分布.(2)已知抽取的已知抽取的4件产品中有件产品中有1件一等品件一等品,求二等
22、品件数的概率分布求二等品件数的概率分布.01234012300000000010/210 20/2105/21015/210 60/210 30/2103/2102/2105/21030/2105/21050/21030/210100/210 50/2105/21035/210105/21063/2107/2101解解:(2)所求概率分布律为所求概率分布律为(1)已知抽取的已知抽取的4件产品中有件产品中有2件二等品件二等品,求一等品件数的概率分布求一等品件数的概率分布.(2)已知抽取的已知抽取的4件产品中有件产品中有1件一等品件一等品,求二等品件数的概率分布求二等品件数的概率分布.3、二维连续
23、型随机变量的条件分布、二维连续型随机变量的条件分布 对于二维连续型随机变量,由于对任一特定值对于二维连续型随机变量,由于对任一特定值x或或y,均有,均有及及,故对二维连续型随机变量,不能,故对二维连续型随机变量,不能直接套用条件概率来定义条件概率分布。直接套用条件概率来定义条件概率分布。下面我们利用下面我们利用极限极限来定义二维连续型随机变量的条件分布:来定义二维连续型随机变量的条件分布:设设(X,Y)的联合分布函数为的联合分布函数为 ,边缘密度边缘密度连续型随机变量连续型随机变量 X 的条件分布函数定义为的条件分布函数定义为:在条件在条件Y=y下下,若若 连续连续,则对使则对使 的点的点y
24、,(利用积分中值定理利用积分中值定理)条件分布函数记为条件分布函数记为即即在条件在条件 下下,连续型随机变量连续型随机变量 X 的条件分布函数为的条件分布函数为:条件概率密度函数为条件概率密度函数为条件概率密度函数为条件概率密度函数为在条件在条件 X=x 下下,连续型随机变量连续型随机变量Y 的条件分布函数为的条件分布函数为:同理同理,例例4 已知二维随机变量已知二维随机变量(X,Y)的密度为的密度为试求试求 及及解:解:由由例例1知知于是,对于是,对 有有的条件的条件例例5 5 设设X 在区间在区间 上服从均匀分布,在上服从均匀分布,在(2)Y 的概率密度;的概率密度;(3)概率概率(1)随
25、机变量随机变量X 和和Y 的联合概率密度;的联合概率密度;下,随机变量下,随机变量Y 在区间在区间 服从均匀分布,求服从均匀分布,求解:解:(1)随机变量随机变量X 的概率密度函数为的概率密度函数为在在 的条件下,的条件下,Y 的条件概率密度函数为的条件概率密度函数为当当 时,时,X 和和Y 的联合概率密度函数为的联合概率密度函数为在其它点在其它点 处,有处,有(2004)从而从而(2)当当 时,时,当当 或或 时,时,因此因此的条件的条件例例6 6 设设X 在区间在区间 上服从均匀分布,在上服从均匀分布,在(2)Y 的概率密度;的概率密度;(3)概率概率(1)随机变量随机变量X 和和Y 的联
26、合概率密度;的联合概率密度;下,随机变量下,随机变量Y 在区间在区间 服从均匀分布,求服从均匀分布,求(2004)从而从而(3)的条件的条件例例6 6 设设X 在区间在区间 上服从均匀分布,在上服从均匀分布,在(2)Y 的概率密度;的概率密度;(3)概率概率(1)随机变量随机变量X 和和Y 的联合概率密度;的联合概率密度;下,随机变量下,随机变量Y 在区间在区间 服从均匀分布,求服从均匀分布,求(2004)例例7 7 设设 的联合分布密度为的联合分布密度为 解解 关于关于 的边缘密度为的边缘密度为 于是于是注注 下列解法是常见的错误:下列解法是常见的错误:所以上式无意义。所以上式无意义。错误的原因是直接用事件的条件概率公式计算。错误的原因是直接用事件的条件概率公式计算。