《第三节协方差及相关系数课件.ppt》由会员分享,可在线阅读,更多相关《第三节协方差及相关系数课件.ppt(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三节协方差及相关系数第1页,此课件共20页哦问题的引入问题的引入:X与与Y独立时独立时,D(X+Y)=D(X)+D(Y)X与与Y不独立时不独立时,D(X+Y)=D(X)+D(Y)+2EX-E(X)Y-E(Y)=D(X)+D(Y)+2 E(XY)-E(X)E(Y)第2页,此课件共20页哦E X-E(X)Y-E(Y)称为随机变量称为随机变量X和和Y的协方差的协方差,记为记为Cov(X,Y),即即 Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)Cov(X,Y)=Cov(Y,X)一、协方差:一、协方差:2.简单性质简单性质 Cov(aX,bY)=ab Cov(X,Y)a,b 是常数
2、是常数Cov(X,Y)=E X-E(X)Y-E(Y)1.定义定义第3页,此课件共20页哦 Cov(X,Y)=E(XY)-E(X)E(Y)可见,若可见,若X 与与 Y 独立独立,Cov(X,Y)=0.3.计算协方差的公式计算协方差的公式:由协方差的定义及期望的性质,可得由协方差的定义及期望的性质,可得一个简单计算公式:一个简单计算公式:第4页,此课件共20页哦D(X+Y)=D(X)+D(Y)+2Cov(X,Y)4.随机变量和的方差与协方差的关系随机变量和的方差与协方差的关系PiXY-2-112Pj14 例例1 1:设:设(X,Y)(X,Y)的分布律为:的分布律为:第5页,此课件共20页哦 协方差
3、的大小在一定程度上反映了协方差的大小在一定程度上反映了X和和Y相互间的关系,但它还受相互间的关系,但它还受X与与Y本身本身度量单位的影响度量单位的影响.例如:例如:Cov(kX,kY)=k2Cov(X,Y)为了克服这一缺点,对协方差进行标准化,这就引入了为了克服这一缺点,对协方差进行标准化,这就引入了相关系数相关系数.第6页,此课件共20页哦二、相关系数:二、相关系数:为随机变量为随机变量 X 和和 Y 的相关系数的相关系数.1、定义、定义:设设D(X)0,D(Y)0,称称在不致引起混淆时在不致引起混淆时,记记 为为 .2、计算、计算:设设D(X)0,D(Y)0,第7页,此课件共20页哦3、相
4、关系数的性质:、相关系数的性质:证证:由方差的性质和协方差的定义知由方差的性质和协方差的定义知,对任意实数对任意实数 b,有有0D(Y-bX)=b2D(X)+D(Y)-2b Cov(X,Y)令令,则上式为,则上式为 D(Y-bX)=由于方差由于方差D(Y)是正的是正的,故必有故必有 1-0,所以所以|1。第8页,此课件共20页哦2.X和和Y独立时,独立时,=0(称称X和和Y不相关不相关),但其逆不真,但其逆不真.由于当由于当X和和Y独立时,独立时,Cov(X,Y)=0.故故=0但由但由并不一定能推出并不一定能推出X和和Y 独立独立.请看下例请看下例.第9页,此课件共20页哦,Cov(X,Y)=
5、?事实上,事实上,X的密度函数的密度函数例例2 2 设设X服从服从(-1/2,1/2)内的均匀分布内的均匀分布,而而Y=cos X,求求第10页,此课件共20页哦存在常数存在常数 a,b(b0),使使 PY=a+b X=1,即即 X 和和 Y 以概率以概率 1 线性相关线性相关.因而因而 =0,即即X和和Y不相关不相关.但但Y与与X有严格的函数关系,有严格的函数关系,即即X和和Y不独立不独立.第11页,此课件共20页哦考虑以考虑以X的线性函数的线性函数a+bX来近似表示来近似表示Y,以均方误差以均方误差e=EY-(a+bX)2来衡量以来衡量以 a+b X 近似表示近似表示Y 的好坏程度的好坏程
6、度:e 值越小表示值越小表示 a+b X 与与 Y 的近似程度越好的近似程度越好.用微积分中求极值的方法,求出使用微积分中求极值的方法,求出使e 达到最小时的达到最小时的 a,b相关系数刻划了相关系数刻划了X和和Y间间“线性相关线性相关”的程度的程度.第12页,此课件共20页哦 =E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y)e=EY-(a+bX)2 解得解得这样求出的这样求出的最佳逼近为最佳逼近为L(X)=a0+b0X第13页,此课件共20页哦 这样求出的最佳逼近为这样求出的最佳逼近为L(X)=a0+b0X这一逼近的剩余是这一逼近的剩余是若若 =0,Y 与与
7、X 无线性关系无线性关系;Y与与X有严格线性关系有严格线性关系;若若可见可见,若若0|1,|的值越接近于的值越接近于1,Y 与与 X 的线性相关程度越高的线性相关程度越高;|的值越接近于的值越接近于0,Y与与X的线性相关程度越弱的线性相关程度越弱.E(Y-L(X)2=D(Y)(1-)第14页,此课件共20页哦4、不相关(、不相关()的等价定义:)的等价定义:若若 X 与与 Y 独立独立(Cov(X,Y)=0),则,则X与与Y不相关不相关(=0)但由但由X与与Y不相关,不一定能推出不相关,不一定能推出X与与Y独立独立.(P141-24,25)第15页,此课件共20页哦但对下述情形,独立与不相关等
8、价(见但对下述情形,独立与不相关等价(见P132-例例2)若若(X,Y)服从二维正态分布,则服从二维正态分布,则X与与Y独立独立X与与Y不相关不相关第16页,此课件共20页哦三、课堂练习三、课堂练习1、2、第17页,此课件共20页哦1、解、解2、解、解第18页,此课件共20页哦四、小结四、小结 这一节我们介绍了协方差、相关系数、这一节我们介绍了协方差、相关系数、相关系数是刻划两个变量间相关系数是刻划两个变量间线性相关程度线性相关程度的一个重要的数字特征的一个重要的数字特征.注意独立与不相关并不是等价的注意独立与不相关并不是等价的.当当(X,Y)服从二维正态分布时,有服从二维正态分布时,有X 与与 Y 独立独立X 与与 Y 不相关不相关第19页,此课件共20页哦五、五、布置作业布置作业概率论与数理统计概率论与数理统计概率论与数理统计概率论与数理统计作业(四)作业(四)作业(四)作业(四)第20页,此课件共20页哦