多元统计分析课件随机向量.ppt

上传人:豆**** 文档编号:77765803 上传时间:2023-03-16 格式:PPT 页数:40 大小:1.26MB
返回 下载 相关 举报
多元统计分析课件随机向量.ppt_第1页
第1页 / 共40页
多元统计分析课件随机向量.ppt_第2页
第2页 / 共40页
点击查看更多>>
资源描述

《多元统计分析课件随机向量.ppt》由会员分享,可在线阅读,更多相关《多元统计分析课件随机向量.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、附2 随机向量2.1一元分布一元分布2.2多元分布多元分布2.3数字特征数字特征2.4欧氏距离和马氏距离欧氏距离和马氏距离2.5随机向量的变换随机向量的变换2.6特征函数(不讲)特征函数(不讲)2.2 多元分布一、多元概率分布一、多元概率分布二、多元概率密度函数二、多元概率密度函数三、边缘分布三、边缘分布四、条件分布四、条件分布五、独立性五、独立性一、多元概率分布随机向量随机向量:元素为元素为随机变量随机变量的向量的向量。随机矩随机矩阵阵:元素为随机变量的矩阵。:元素为随机变量的矩阵。随机变量随机变量X的的分布函数分布函数:随机向量随机向量 的的分布函数分布函数:二、多元概率密度函数一元的情形

2、:一元的情形:多元的情形:多元的情形:多元概率密度函数多元概率密度函数f(x1,xp):三、边缘分布 设设X是是p维随机向量,由它的维随机向量,由它的q(0。(2)设)设A为常数矩阵,为常数矩阵,b为常数向量,则为常数向量,则 当当p=1时,上述等式就是我们熟知的如下等式:时,上述等式就是我们熟知的如下等式:(3)设)设A和和B为常数矩阵,则为常数矩阵,则例例2 的各分量间存在线性关系(依概率的各分量间存在线性关系(依概率1 1)。)。协差阵的性质(4)设)设 为常数矩阵,则为常数矩阵,则推推论论 证证明明协差阵的性质(5)设)设k1,k2,kn是是n个常数,个常数,X1,X2,Xn是是n个相

3、互独立个相互独立的的p维随机向量,则维随机向量,则 证证明明由独立性可得,由独立性可得,协差阵的性质例例3 设设随机向量随机向量 的数学期望和的数学期望和协协方差矩方差矩阵阵分分别为别为令令y1=2x1x2+4x3,y2=x2x3,y3=x1+3x22x3,试试求求y=(y1,y2,y3)的的数学期望和数学期望和协协方差矩方差矩阵阵。三、相关矩阵随机变量随机变量X和和Y的的相关系数相关系数定义为定义为:的的相关阵相关阵定定义为义为:若若(X,Y)=0,则表明,则表明X和和Y不相关。不相关。X=Y时的相关阵时的相关阵(X,X)称为称为X的的相关阵相关阵,记作,记作R=(ij),这里这里ij=(X

4、i,Xj),ii=1。即。即 R=(ij)和和=(ij)之间有关系式:之间有关系式:R=D1D1 其中其中 。R和和的相应元素之间的关系式的相应元素之间的关系式为为:前述关系式即为前述关系式即为:标准化变换在数据处理时,常常因各变量的单位不完全相同而需要对在数据处理时,常常因各变量的单位不完全相同而需要对每个变量作标准化变换,最常用的每个变量作标准化变换,最常用的标准化变换标准化变换是令是令记记 ,于是,于是即标准化后的协差阵正好是原始向量的相关阵。可见,相即标准化后的协差阵正好是原始向量的相关阵。可见,相关阵关阵R也是一个非负定阵。也是一个非负定阵。2.4 欧氏距离和马氏距离一、欧氏距离一、

5、欧氏距离二、马氏距离二、马氏距离一、欧氏距离 之间的之间的欧氏距离欧氏距离为为:平方欧氏距离为平方欧氏距离为:到总体到总体的平方欧氏距离定义为的平方欧氏距离定义为:平均平均大小大小等于等于一、欧氏距离不适合直接使用欧氏距离的例子下面是各国家和地区男子径赛记录的数据(下面是各国家和地区男子径赛记录的数据(19841984年):年):国家和地区100米(秒)200米(秒)400米(秒)800米(分)1500米(分)5000米(分)10000米(分)马拉松(分)阿根廷10.3920.8146.841.813.714.0429.36137.72澳大利亚10.3120.0644.841.743.5713

6、.2827.66128.3奥地利10.4420.8146.821.793.613.2627.72135.9比利时10.3420.6845.041.733.613.2227.45129.95百慕大10.2820.5845.911.83.7514.6830.55146.62巴西10.2220.4345.211.733.6613.6228.62133.13缅甸10.6421.5248.31.83.8514.4530.28139.95加拿大10.1720.2245.681.763.6313.5528.09130.15智利10.3420.846.21.793.7113.6129.3134.03中国10.

7、5121.0447.31.813.7313.929.13133.53哥伦比亚10.4321.0546.11.823.7413.4927.88131.35一、欧氏距离 向量的各分量如果单位不全相同,则上述欧氏距离一向量的各分量如果单位不全相同,则上述欧氏距离一般就没有意义。即使单位全相同,但如果各分量的变异性般就没有意义。即使单位全相同,但如果各分量的变异性差异很大,则变异性大的分量在欧氏距离的平方和中起着差异很大,则变异性大的分量在欧氏距离的平方和中起着决定性的作用,而变异性小的分量却几乎不起什么作用。决定性的作用,而变异性小的分量却几乎不起什么作用。在实际应用中,为了消除单位的影响和均等地对

8、待每在实际应用中,为了消除单位的影响和均等地对待每一分量,我们常须先对各分量作标准化变换,然后再计算一分量,我们常须先对各分量作标准化变换,然后再计算欧氏距离。欧氏距离。令令 ,则,则 由于由于 ,故故平平方方和和 中中各各项项的的平平均均取取值值均均为为1 1,从而各分量所起的平均作用都一样。,从而各分量所起的平均作用都一样。欧欧氏氏距距离离经经变变量量的的标标准准化化之之后后能能够够消消除除各各变变量量的的单单位位或或方方差差差差异异的的影影响响,但但不不能能消消除除变变量量之之间间相相关关性性的的影影响响,以以致致有有时时用用欧欧氏氏距距离离显显得得不不太太合合适适。为为此此,我我们们引

9、引入入一一个个由由印印度度著著名名统统计计学学家家马马哈哈拉拉诺诺比比斯斯(MahalanobisMahalanobis,19361936年)提出的年)提出的“马氏距离马氏距离”的概念。的概念。一、欧氏距离二、马氏距离 之间的平方之间的平方马氏马氏距离距离定义为定义为:到总体到总体的平方的平方马氏距离马氏距离定义为定义为:比例单位变换如如X的分量是长度、重量、速度、费用和用时等,则变的分量是长度、重量、速度、费用和用时等,则变量的单位变换可表达为量的单位变换可表达为:其中其中 。带有常数项的单位变换例子例子 摄氏温度与华氏温度的换算公式:摄氏温度与华氏温度的换算公式:F(C95)32,C(F3

10、2)59 式中式中F华氏温度,华氏温度,C摄氏温度。摄氏温度。特点特点1.马氏距离不受变量单位的影响,是一个无单位的马氏距离不受变量单位的影响,是一个无单位的数值数值。证明证明 X1,X2经单位变换后为经单位变换后为Y1,Y2,即有,即有特点特点2.马氏距离是马氏距离是X和和Y经经“标准化标准化”之后的欧氏距离,之后的欧氏距离,即即其中其中 ,它们的均值,它们的均值皆为皆为0,协差阵皆为单位阵,协差阵皆为单位阵I。特点特点3.若若 ,则,则即当各分量不相关时马氏距离即为各分量经标准化后即当各分量不相关时马氏距离即为各分量经标准化后的欧氏距离。的欧氏距离。1.马氏距离的计算是建立在总体样本的基础

11、上的,也就是说,马氏距离的计算是建立在总体样本的基础上的,也就是说,如果拿同样的两个样本,放入两个不同的总体中,最后计算得如果拿同样的两个样本,放入两个不同的总体中,最后计算得出的两个样本间的马氏距离通常是不相同的,除非这两个总体出的两个样本间的马氏距离通常是不相同的,除非这两个总体的协方差矩阵碰巧相同。的协方差矩阵碰巧相同。2.在计算马氏距离过程中,要求总体样本数大于样本的维数,在计算马氏距离过程中,要求总体样本数大于样本的维数,否则得到的总体样本协方差矩阵逆矩阵不存在,这种情况下,否则得到的总体样本协方差矩阵逆矩阵不存在,这种情况下,用欧式距离计算即可。用欧式距离计算即可。3.协方差矩阵的

12、逆矩阵不存在,比如三个样本点协方差矩阵的逆矩阵不存在,比如三个样本点(3,4),(5,6)和和(7,8)这种情况是因为这三个样本在其所处的二维空间平面内共这种情况是因为这三个样本在其所处的二维空间平面内共线。这种情况下,也采用欧式距离计算。线。这种情况下,也采用欧式距离计算。4.在实际应用中,绝大多数情况下马氏距离是可以顺利计算的,在实际应用中,绝大多数情况下马氏距离是可以顺利计算的,但是马氏距离的计算是不稳定的,不稳定的来源是协方差矩阵,但是马氏距离的计算是不稳定的,不稳定的来源是协方差矩阵,这也是马氏距离与欧式距离的最大差异之处。这也是马氏距离与欧式距离的最大差异之处。马氏距离的优缺点优点

13、:优点:它不受量纲的影响,两点之间的马氏距离与原始它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;由标准化数据和中心化数据数据的测量单位无关;由标准化数据和中心化数据(即原即原始数据与均值之差)计算出的二点之间的马氏距离相同。始数据与均值之差)计算出的二点之间的马氏距离相同。马氏距离还可以排除变量之间的相关性的干扰。马氏距离还可以排除变量之间的相关性的干扰。缺点:缺点:夸大了变化微小的变量的作用。夸大了变化微小的变量的作用。2.5 随机向量的变换设设在区间在区间 I 以外恒为以外恒为0 0(I 有限或无限有限或无限);在区间在区间 I 上的值域为上的值域为 在区间在区间 I 上上单调单调可导;可导;其反函数记为其反函数记为 则则的密度为:的密度为:2.5 随机向量的变换将上述结果推广到随机向量,将上述结果推广到随机向量,则则2.5 随机向量的变换例例4 设设y=Ax+b,其中其中A为为p阶阶常数矩常数矩阵阵,b为为p维维常数向量,常数向量,则则EXERCISES2.24;2.25;2.30;2.40;2.41试证:马氏距离对下列形式的试证:马氏距离对下列形式的p维向量维向量x单位的改变具单位的改变具有不变性:有不变性:y=Cx+b其中其中C为为pp阶的非退化常数矩阵,阶的非退化常数矩阵,b为为p维常数向量。维常数向量。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 家庭教育

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁