《第三节协方差与相关系数.ppt》由会员分享,可在线阅读,更多相关《第三节协方差与相关系数.ppt(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三节协方差与相关第三节协方差与相关系数系数现在学习的是第1页,共17页注:注:一一.协方差协方差1.定义定义1.量量称为随机变量称为随机变量X 与与 Y 的的协方差协方差,记为:记为:即:即:协方差中当协方差中当 X=Y 时即为方差的定义,即:时即为方差的定义,即:故故方差是协方差的方差是协方差的特例特例。2.协方差的简单性质协方差的简单性质是常数是常数现在学习的是第2页,共17页显然显然,若,若 X 与与 Y 相互独立则:相互独立则:Cov(X,Y)=0 3.计算协方差的一个简单公式计算协方差的一个简单公式由协方差的定义及期望的性质,可得:由协方差的定义及期望的性质,可得:证明:证明:注:
2、注:4.随机变量随机变量和和的方差与协方差的关系的方差与协方差的关系现在学习的是第3页,共17页 若若 X1,X2,Xn 两两独立两两独立,上式化为:,上式化为:协方差的大小在一定程度上反映了协方差的大小在一定程度上反映了X 和和 Y 相互间的关系,相互间的关系,但它还受但它还受 X与与Y 本身度量单位的影响本身度量单位的影响.为了克服这一缺点,对协方差进行为了克服这一缺点,对协方差进行标准化标准化,这就引入,这就引入了了相关系数的概念。相关系数的概念。.问题:问题:例如:例如:现在学习的是第4页,共17页称为随机变量称为随机变量 二二.相关系数相关系数1.定义定义2.量量(无量纲无量纲)X,
3、Y 的的相关系数相关系数,记为:,记为:即:即:2.相关系数的简单性质相关系数的简单性质存在常数存在常数使得:使得:X 和 Y 以概率 1 线性相关现在学习的是第5页,共17页由方差的性质和协方差的定义知,对任意实数由方差的性质和协方差的定义知,对任意实数令令,则上式为:,则上式为:证明:证明:有:有:由于方差由于方差D(Y)是正的,故必有:是正的,故必有:所以证得:所以证得:现在学习的是第6页,共17页由方差与协方差协关系有:由方差与协方差协关系有:因此有因此有:证明:证明:存在常数存在常数使得:使得:与与是标准化随机变量,是标准化随机变量,故其均值为故其均值为 0,方差,方差为为 1现在学
4、习的是第7页,共17页由方差的性质,可知由方差的性质,可知:整理得整理得:当当时有时有:为常数为常数其中其中:现在学习的是第8页,共17页同理同理,当,当 时也可推出此结论。因此得证。时也可推出此结论。因此得证。又又 所以:所以:现在学习的是第9页,共17页 于是得:于是得:所以:所以:即:即:注:注:X 和和 Y 独立时,独立时,但其逆不真但其逆不真.由于当由于当 X 和和Y 独立时,独立时,Cov(X,Y)=0,故,故但但并不一定能推出并不一定能推出X 和和 Y 独立。独立。现在学习的是第10页,共17页例例1.设设 在在 上服从均匀分布,即:上服从均匀分布,即:验证验证:与与 是不相关的
5、,但不是相互独立的。是不相关的,但不是相互独立的。证明:证明:由已知,由已知,X,Y 的边缘概率密度为的边缘概率密度为:与与现在学习的是第11页,共17页又因为又因为:显然显然,所以:所以:与与是不独立的是不独立的所以所以:从而有从而有:于是得于是得:故得:故得:是不相关的。是不相关的。奇函数在对称区间上的积分为 0现在学习的是第12页,共17页当当 时,时,称称 X与与 Y不相关。不相关。一般:一般:故有故有:若若 X 与与 Y 相互独立,则相互独立,则 X与与 Y不相关;但反之不真。不相关;但反之不真。但对下述情形,独立与不相关但对下述情形,独立与不相关等价等价若若(X,Y)服从服从二维正
6、态分布二维正态分布,则,则X 与与 Y 相互独立相互独立X 与与 Y 不相关不相关1.2.注注:相关系数刻划了相关系数刻划了X 和和 Y 间间“线性相关线性相关”的程度的程度.若若考虑以考虑以 X 的线性函数的线性函数 a+bX 来近似表示来近似表示 Y,以均方误差以均方误差来衡量以来衡量以 a+bX 近似表示近似表示 Y 的好坏程度。的好坏程度。现在学习的是第13页,共17页则:则:e 值越小表示值越小表示 a+bX 与与 Y 的近似程度越好的近似程度越好.现用微积分中求极值的方法,求出使现用微积分中求极值的方法,求出使 e 达到最小达到最小时的时的 a,b:e=E Y-(a+bX)2 =E
7、(Y 2)+b 2 E(X 2)+a 2-2b E(XY)+2ab E(X)-2a E(Y)令:令:现在学习的是第14页,共17页 解得:解得:这样求出的最佳逼近为:L(X)=a0+b0X这一逼近的这一逼近的剩余剩余是:是:则则 Y 与与 X 有有严格线性关系严格线性关系;可见:可见:则则 Y 与与 X 无无线性关系线性关系;的值越接近于的值越接近于1,Y 与与 X 的线性相关程度的线性相关程度越高越高;若若若若若若则当:则当:的值越接近于的值越接近于0,Y 与与 X 的线性相关程度的线性相关程度越弱越弱.现在学习的是第15页,共17页例例2.设设(X,Y)服从服从二维正态分布二维正态分布,它
8、的概率密度为:,它的概率密度为:求求:X 与与 Y 的相关系数的相关系数 解解:由已知,由已知,X,Y 的边缘概率密度为的边缘概率密度为:其数学期望与方差分别为:其数学期望与方差分别为:现在学习的是第16页,共17页而:而:于是:于是:结论:结论:其积分过程见教材P132P133二维正态分布的概率密度函数中的五个参二维正态分布的概率密度函数中的五个参数的数的意义意义分别为:分别为:X 的数学期望与方差;的数学期望与方差;Y 的数学期望与方差;的数学期望与方差;X 与与Y 的相关系数。的相关系数。二维正态分布完全由这五个参数所确定。二维正态分布完全由这五个参数所确定。现在学习的是第17页,共17页