《第4章随机变量的数字特征课件.ppt》由会员分享,可在线阅读,更多相关《第4章随机变量的数字特征课件.ppt(102页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第4章随机变量的数字特征第1页,此课件共102页哦 (3)(3)在检查一批棉花的质量时,既要注意纤维的在检查一批棉花的质量时,既要注意纤维的平均长度,又要注意纤维长度与平均长平均长度,又要注意纤维长度与平均长 度的偏离程度的偏离程度,平均长度较大、偏离程度较小,质量就较好。度,平均长度较大、偏离程度较小,质量就较好。从上面的例子看到,与随机变量有关的某些数从上面的例子看到,与随机变量有关的某些数值,虽然不能完整地描述随机变量,但能描述随机值,虽然不能完整地描述随机变量,但能描述随机变量在某些方面的重要特征。这些数字特征在理论变量在某些方面的重要特征。这些数字特征在理论和实践上都具有重要的意义。
2、和实践上都具有重要的意义。第2页,此课件共102页哦第四章第四章 随机变量的数字特征随机变量的数字特征4.1 4.1 随机变量的数学期望随机变量的数学期望 (一)(一)4.2 4.2 随机变量的数学期望随机变量的数学期望 (二)(二)4.3 4.3 随机变量的方差(一)随机变量的方差(一)4.4 4.4 随机变量的方差(二)随机变量的方差(二)4.5 4.5 协方差与相关系数协方差与相关系数4.6 4.6 其它特征数其它特征数第3页,此课件共102页哦4.14.1随机变量的数学期望(一)随机变量的数学期望(一)(Mathematical expectation of random variab
3、le)4.1.14.1.1数学期望的概念数学期望的概念 “期望期望”在我们日常生活中常指有根据的希望,在在我们日常生活中常指有根据的希望,在概率论中,它源于历史上一个著名的分赌本问题:概率论中,它源于历史上一个著名的分赌本问题:例例4.1.14.1.1(分赌本问题)(分赌本问题)1717世纪中叶,一位赌徒向世纪中叶,一位赌徒向法国数学家帕斯卡(法国数学家帕斯卡(1623-16621623-1662)提出一个使他苦恼很)提出一个使他苦恼很久的分赌本问题:甲、乙两赌徒赌技相同,各出赌注久的分赌本问题:甲、乙两赌徒赌技相同,各出赌注5050法郎,每局中无平局法郎,每局中无平局.他们约定,谁先赢三局则
4、得到全他们约定,谁先赢三局则得到全部部100100法郎的赌本法郎的赌本.当甲赢了两局,乙赢了一局时,因故当甲赢了两局,乙赢了一局时,因故要中止赌博,现问这要中止赌博,现问这100100法郎如何分才算公平?法郎如何分才算公平?第4页,此课件共102页哦分析分析 第一种分法:甲得第一种分法:甲得 100100 1/2=50(1/2=50(法郎法郎)乙得乙得 100100 1/2=50(1/2=50(法郎法郎)第二种分法第二种分法:甲得甲得 100100 2/32/36 67(7(法郎法郎)乙得乙得 100100 1/31/333(33(法郎法郎)这两种方法都没有考虑到如果继续比下去会出现什这两种方
5、法都没有考虑到如果继续比下去会出现什么样的结果,没有照顾到两人在现有基础下对比赛结果么样的结果,没有照顾到两人在现有基础下对比赛结果的一种期待,双方均不满意的一种期待,双方均不满意.首席数学家帕斯卡,帕斯卡认为甲的最终所得可能为:首席数学家帕斯卡,帕斯卡认为甲的最终所得可能为:0 0 或或 100 100 再赌两局比赛必定结束,其结果不外乎以下四种:再赌两局比赛必定结束,其结果不外乎以下四种:(甲赢甲赢 甲赢甲赢)()(甲赢甲赢 乙赢乙赢)()(乙赢乙赢 甲赢甲赢)()(乙赢乙赢 乙赢乙赢)于是,他们去求助法国的于是,他们去求助法国的第5页,此课件共102页哦于是甲赢得法郎数于是甲赢得法郎数X
6、的分布列为的分布列为帕斯卡认为甲的帕斯卡认为甲的“期望期望”所得应为所得应为 0 0 1/41/4+100100 3/4=75(3/4=75(法郎法郎)乙的乙的“期望期望”所得应为所得应为100-75=25 100-75=25 法郎法郎.这种方法照顾到了已赌局数,又包括了再赌下去的这种方法照顾到了已赌局数,又包括了再赌下去的一种一种“期望期望”,它比前两种方法都更为合理,它比前两种方法都更为合理.这就是数这就是数学期望这个名称的由来,其实这个名称称为学期望这个名称的由来,其实这个名称称为“均值均值”更更形象易懂一些,对上例而言,也就是再赌下去的话,甲形象易懂一些,对上例而言,也就是再赌下去的话
7、,甲“平均平均”可以赢可以赢7575法郎法郎.X0100P1/43/4第6页,此课件共102页哦 引例(射击问题)引例(射击问题)设某射击手在同样的条件下设某射击手在同样的条件下,相继射击相继射击9090了次,击中情况如下了次,击中情况如下(命中的环数是一个随机变量命中的环数是一个随机变量).试问试问:该射手每次射击平均命中靶多少环该射手每次射击平均命中靶多少环?命中环数 k 命中次数 nk 0 1 2 3 4 5 2 13 15 10 20 30 第7页,此课件共102页哦解解 平均击中环数平均击中环数第8页,此课件共102页哦 平均击中环数平均击中环数 频率随机波动频率随机波动 随机波动随
8、机波动 随机波动随机波动 稳定值稳定值 “平均射中环数平均射中环数”的稳定值的稳定值 “平均平均击中击中环数环数”趋向于趋向于 “击中击中环数的可能值与其概率之积的累加环数的可能值与其概率之积的累加”第9页,此课件共102页哦 定义定义4.1.14.1.1 设离散随机变量设离散随机变量X的分布列为的分布列为如果如果那么称那么称为随机变量为随机变量X的数学期望的数学期望(mathematical expectation)或该分布的数学期望,简称或该分布的数学期望,简称期望期望或或均值均值.若级数若级数 不收敛不收敛,则称则称X的期望不存在的期望不存在.第10页,此课件共102页哦 定义定义4.1
9、.24.1.2 设连续随机变量设连续随机变量X的密度函数为的密度函数为 f(x),如果如果则称为则称为X的数学期望的数学期望,或该分布的数学期望,简称,或该分布的数学期望,简称期望期望或或均值均值.若若 不收敛,则称不收敛,则称X的期望不存在的期望不存在.第11页,此课件共102页哦 例例4.1.24.1.2 某车站每天某车站每天8:009:00,9:0010:00都都恰好有一辆客车到站,但到站的时刻是随机的,且恰好有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立两者到站的时间相互独立.其规律是其规律是一旅客一旅客8:20到车站,求他的平均候车时间到车站,求他的平均候车时间.1/
10、6 1/6 3/63/6 2/62/68:10 8:30 8:508:10 8:30 8:509:10 9:30 9:509:10 9:30 9:50概率概率到站时刻到站时刻第12页,此课件共102页哦 解解 设设X=“=“该旅客的候车时间该旅客的候车时间”(以分钟计以分钟计)则则于是该旅客的平均候车时间为于是该旅客的平均候车时间为 1/6 1/6 3/63/6 2/62/68:10 8:30 8:508:10 8:30 8:509:10 9:30 9:509:10 9:30 9:50概率概率到站时刻到站时刻 10 30 50 70 90 XP第13页,此课件共102页哦 例例4.1.34.1
11、.3 若若Xb(n,p),则,则E(X)=np.证明证明 因为因为Xb(n,p),所以,所以于是于是第14页,此课件共102页哦第15页,此课件共102页哦 例例4.1.4 4.1.4 若若XP(),则,则E(X)=.证明证明 因为因为XP(),所以,所以于是于是第16页,此课件共102页哦 例例4.1.54.1.5 在一个人数为在一个人数为N的人群中普查某种疾病,的人群中普查某种疾病,为此要抽验为此要抽验N个人的血。如果将每个人的血分别检验,个人的血。如果将每个人的血分别检验,则共需检验则共需检验N次,为了能减少工作量,一位统计学家提次,为了能减少工作量,一位统计学家提出一种方法:按出一种方
12、法:按k个人一组进行分组,把同组人的血样个人一组进行分组,把同组人的血样混合后检验,如果这种混合血样呈现阴性反应,说明这混合后检验,如果这种混合血样呈现阴性反应,说明这k个人只需要检验一次就够了;如果这种混合血样呈现个人只需要检验一次就够了;如果这种混合血样呈现阳性反应,说明这阳性反应,说明这k个人中至少有一个人的血呈现阳性个人中至少有一个人的血呈现阳性反应,则再对此反应,则再对此k个分别进行检验个分别进行检验.假设该疾病的的发病假设该疾病的的发病率为率为p,且每人是否得此疾病相互独立,且每人是否得此疾病相互独立.试问这种方法能试问这种方法能否实现减少平均检验次数?否实现减少平均检验次数?第1
13、7页,此课件共102页哦 解解 令令X=“该人群中每个人需要验血的次数该人群中每个人需要验血的次数”,则,则所以每人的平均验血次数为所以每人的平均验血次数为X1/k1+1/kP(1-p)k1-(1-p)k第18页,此课件共102页哦 只要只要适当选择适当选择k,就可使验血次数达到最小就可使验血次数达到最小.譬如,譬如,当当p=0.1时,有时,有对不同的发病率对不同的发病率p,计算出最佳得分组人数计算出最佳得分组人数k,见下表,见下表0.690 0.604 0.690 0.604 0.5940.594 0.610 0.695 0.751 0.991 0.994 0.610 0.695 0.751
14、 0.991 0.994 1.00161.0016 2 3 2 3 4 4 5 8 10 30 33 5 8 10 30 33 34 340.697 0.594 0.534 0.466 0.384 0.274 0.2050.697 0.594 0.534 0.466 0.384 0.274 0.2053 4 4 5 6 8 113 4 4 5 6 8 110.14 0.10 0.08 0.06 0.04 0.02 0.010.14 0.10 0.08 0.06 0.04 0.02 0.01第19页,此课件共102页哦 例例4.1.64.1.6 有两个相互独立工作的电子装置,它们有两个相互独立工
15、作的电子装置,它们的寿命的寿命X1,X2服从同一指数分布,其密度函数如下服从同一指数分布,其密度函数如下 若将这两个电子装置串联组成一个整机,求整机寿命若将这两个电子装置串联组成一个整机,求整机寿命Y的数学期望的数学期望.第20页,此课件共102页哦解解 因为因为XiExp()(i=1,2),所以所以Xi的分布函数为的分布函数为于是于是Y=minX1,X2的分布函数为的分布函数为故故Y=minX1,X2的密度函数为的密度函数为第21页,此课件共102页哦所以所以第22页,此课件共102页哦作作 业业第23页,此课件共102页哦4.2 4.2 随机变量的数学期望(二)随机变量的数学期望(二)例例
16、4.2.14.2.1 设设XU(a,b),求,求E(X).解解 因为因为XU(a,b),所以,所以第24页,此课件共102页哦 例例4.2.24.2.2 设设XN(,2),则,则E(X)=.证明证明 因为因为XN(,2),所以,所以第25页,此课件共102页哦 例例4.2.34.2.3 设设X(,),则,则E(X)=/.证明证明 因为因为X(,),所以于是,所以于是第26页,此课件共102页哦 定理定理4.2.14.2.1 若随机变量若随机变量X的分布用分布列的分布用分布列p(xi)或用密度函数或用密度函数f(x)表示,则表示,则X的某一函数的某一函数g(X)的数学的数学期望为期望为推广推广:
17、第27页,此课件共102页哦 例例4.2.44.2.4 已知随机变量的分布列如下已知随机变量的分布列如下求求Y=X2的数学期望的数学期望.解解 Y=X2的分布列为的分布列为X-2-1012P0.20.10.10.30.3X-2-1012Y=X241014P0.20.10.10.30.3第28页,此课件共102页哦对相同的值合并,并把对应的概率相加,可得对相同的值合并,并把对应的概率相加,可得所以所以 E(Y)=E(X2)=00.1+10.4+40.5=2.4或 E(Y)=E(X2)=(-2)20.2+(-1)2 0.1+02 0.1+12 0.3+22 0.3=2.4Y014P0.10.40.
18、5第29页,此课件共102页哦数学期望的常用性质数学期望的常用性质(1 1)若)若c是常数,则是常数,则E(c)=c;(2 2)对任意的常数)对任意的常数a,有,有E(aX)=aE(X);(3 3)对任意的两个变量)对任意的两个变量X,Y,有,有 E(XY)=E(X)E(Y)推广:对任意的随机变量推广:对任意的随机变量X,Y,有,有Eg1(X)g2(Y)=Eg1(X)Eg2(Y)(4 4)若随机变量)若随机变量X,Y相互独立,则相互独立,则E(XY)=E(X)E(Y)第30页,此课件共102页哦 例例4.2.54.2.5 某公司经销某种原料,历史资料表明:该某公司经销某种原料,历史资料表明:该
19、原料的市场需求量原料的市场需求量X(单位单位:吨吨)服从服从(300,500)上的均匀分上的均匀分布布.每出售一顿该原料,公司可获利润每出售一顿该原料,公司可获利润1.5(1.5(万元万元);若积;若积压压1 1吨,则公司损失吨,则公司损失0.5(0.5(万元万元).).问公司应该组织多少货问公司应该组织多少货源,可使平均收益最大?源,可使平均收益最大?一、模型假设:一、模型假设:市场需求量市场需求量XU(300,500).二、模型建立:二、模型建立:公司收益公司收益Y(万元万元)与市场需求量与市场需求量X和和组织的货源组织的货源a吨有关,即吨有关,即第31页,此课件共102页哦公司收益公司收
20、益Y=g(X)也是随机变量,其数学期望为也是随机变量,其数学期望为则则故公司组织故公司组织450450吨货源,可使平均收益最大吨货源,可使平均收益最大.令令 f(a)三、模型求解:三、模型求解:第32页,此课件共102页哦 例例4.2.64.2.6 一民航客车载有一民航客车载有2020位旅客自机场开出旅客位旅客自机场开出旅客有有1010车站可以下车,如到达一个车站没有旅客下车就不车站可以下车,如到达一个车站没有旅客下车就不停车停车.以以X表示停车的次数,求该客车的平均停车次数表示停车的次数,求该客车的平均停车次数.(假设每位旅客在各个车站下车是等可能的,并设各旅(假设每位旅客在各个车站下车是等
21、可能的,并设各旅客是否下车相互独立)客是否下车相互独立)解解 令令Xi=“=“第第i个车站停车的次数个车站停车的次数”,i=1,2,10.则则 Xi b(1,1-0.920),(i=1,2,10),且,且 X=X1+X2+X10.于是于是 E(X)=E(X1+X2+X10)=E(X1)+E(X2)+E(X10)=(1-0.920)+(1-0.920)+(1-0.920)=10(1-0.920)8.784第33页,此课件共102页哦作作 业业第34页,此课件共102页哦4.34.3随机变量的方差(一)随机变量的方差(一)随机变量随机变量X的数学期望的数学期望E(X)是一种位置特征数,它是一种位置
22、特征数,它反应了反应了X取值的集中位置,但它无法反映出取值的集中位置,但它无法反映出X取值的取值的“波波动动”程度程度.譬如,已知譬如,已知X与与Y的分布列分别为的分布列分别为则则 E(X)=0=E(Y).但显然但显然Y的取值要比的取值要比X的取值波动大。为了用数值的取值波动大。为了用数值来反映出随机变量取值的来反映出随机变量取值的“波动波动”大小,引入了大小,引入了方差与标准差这两个特征数。方差与标准差这两个特征数。X-101P1/31/31/3Y-1000100P1/31/31/3第35页,此课件共102页哦 定义定义4.3.14.3.1 设设X为随机变量,若为随机变量,若EX-E(X)2
23、存在,则存在,则称其随机变量称其随机变量X的的方差方差(Variance)或该分布的方差,记为或该分布的方差,记为D(X)或或Var(X).即即称称 为为X的的标准差标准差,记为,记为(X)或或X.方差和标准差的取值都是非负数,它们都是用来方差和标准差的取值都是非负数,它们都是用来描描述随机变量取值集中(或分散)程度的特征数述随机变量取值集中(或分散)程度的特征数.由于标由于标准差与所讨论的随机变量、数学期望有相同的量纲,所准差与所讨论的随机变量、数学期望有相同的量纲,所以在实际中,人们比较乐意选用标准差以在实际中,人们比较乐意选用标准差.第36页,此课件共102页哦 例例4.3.14.3.1
24、 某人有一笔资金,可投入房地产和商业,某人有一笔资金,可投入房地产和商业,其收益都与市场状态有关其收益都与市场状态有关.若把未来市场分为好、中、差若把未来市场分为好、中、差三个等级,其发生的概率分别为三个等级,其发生的概率分别为0.2,0.7,0.1.0.2,0.7,0.1.通过调查通过调查该投资者认为投资于房地产的收益该投资者认为投资于房地产的收益X(万元万元)和投资于商业和投资于商业的收益的收益Y(万元万元)的分布分别为的分布分别为试问该投资者投资哪个项目为好?试问该投资者投资哪个项目为好?X113-3P0.20.70.1Y64-1P0.20.70.1第37页,此课件共102页哦解解 E(
25、X)=110.2+30.7+(-3)0.1=4.0(万元)E(Y)=60.2+40.7+(-1)0.1=3.9(万元)从平均收益看,投资房地产比投资商业更划算从平均收益看,投资房地产比投资商业更划算.所以所以 因为标准差越大收益的波动就越大,从而风险也因为标准差越大收益的波动就越大,从而风险也越大越大.若综合权衡收益和风险,选择投资房地产的平均若综合权衡收益和风险,选择投资房地产的平均收益相对投资商业多了收益相对投资商业多了0.10.1万元,仅仅多出万元,仅仅多出1/391/39,但风,但风险却提高了一倍还多,故投资商业比较划算险却提高了一倍还多,故投资商业比较划算.由于由于第38页,此课件共
26、102页哦方差的常用性质方差的常用性质(1 1)D(X)=E(X2)-E2(X);(2 2)对任意的常数)对任意的常数c,有,有D(c)=0;(3 3)若)若a,b为常数,则为常数,则D(aX+b)=a2D(X);(4 4)若随机变量)若随机变量X,Y相互独立,则相互独立,则 D(X+Y)=D(X)+D(Y)(5 5)D(X)=0 P(X=c)=1.第39页,此课件共102页哦随机变量的标准化随机变量的标准化 例例4.3.24.3.2 设随机变量设随机变量X具有数学期望具有数学期望E(X)=,方方差差D(X)=20,令,令则则于是称于是称X*为为X的标准化随机变量的标准化随机变量.第40页,此
27、课件共102页哦常见分布的方差常见分布的方差 (1)(1)两点分布两点分布 设设Xb(1,p),则,则 E(X)=p,D(X)=pq=p(1-p).证明证明 因为因为Xb(1,p),所以,所以P(X=1)=p,P(X=0)=1-p=q.故故 E(X)=p E(X2)=12p+02q=p所以所以 D(X)=E(X2)-E2(X)=p-p2=p(1-p)=pq.第41页,此课件共102页哦 (2)(2)二项分布二项分布 若若Xb(n,p),则,则 E(X)=np,D(X)=npq.证明证明 令令Xib(1,p)(i=1,2,n),且相互独立,且相互独立.则则 D(Xi)=pq (i=1,2,n),
28、X=X1+X2+Xn.所以所以第42页,此课件共102页哦 (3)(3)泊松分布泊松分布 若若XP(),则,则 E(X)=,D(X)=.证明证明 因为因为XP(),所以,所以故故 D(X)=E(X2)-E2(X)=2+-2=.第43页,此课件共102页哦 (4 4)几何分布)几何分布(Geometry distribution)若若XGe(p),则,则 E(X)=1/p,D(X)=q/p2.证明证明 略略 (5 5)超几何分布)超几何分布 若若Xh(n,N,M),则,则证明证明 略略 (6)(6)巴斯卡巴斯卡(Pascal)分布分布 若若XNb(r,p),则,则 E(X)=r/p,D(X)=r
29、q/p2.证明证明 略略第44页,此课件共102页哦 (1)(1)均匀分布均匀分布 若若XU(a,b),则,则 证明证明 因为因为XU(a,b),所以,所以故故 D(X)=E(X2)-E2(X)第45页,此课件共102页哦 (2)(2)伽玛分布伽玛分布 若若X(,),则,则 E(X)=/,D(X)=/2.证明证明 因为因为X(,),所以,所以于是于是 D(X)=E(X2)-E2(X)第46页,此课件共102页哦 (3)(3)正态分布正态分布 若若XN(,2),则,则 E(X)=,D(X)=2.证明证明 因为因为XN(,2),所以,所以第47页,此课件共102页哦推推 广广若若XiN(i,i2)
30、,i=1,2,n,且相互独立,且相互独立,则存在不全为则存在不全为零的常数零的常数k1,k2,kn,使得,使得常用分布表常用分布表第48页,此课件共102页哦 例例4.4.14.4.1 若若XN(1,3),YN(2,4),且,且X,Y相互独立相互独立求证求证Z=2X-3YN(-4,48).证明证明 因为因为XN(1,3),YN(2,4),且且X,Y相互独立相互独立所以所以Z=2X-3Y服从正态分布服从正态分布,且且E(X)=1,D(X)=3,E(Y)=2,D(Y)=4于是于是 E(Z)=E(2X-3Y)=2E(X)-3E(Y)=21-32=-4 D(Z)=D(2X-3Y)=4D(X)+9D(Y
31、)=43+94=48故故Z=2X-3YN(-4,48).第49页,此课件共102页哦 例例4.4.24.4.2 设活塞的直径设活塞的直径XN(22.4,0.032),气缸的气缸的直径直径YN(22.5,0.042),且且X,Y相互独立,任取一只活相互独立,任取一只活塞,一只气缸,求活塞能装入气缸的概率塞,一只气缸,求活塞能装入气缸的概率.解解 因为因为XN(22.4,0.032),YN(22.5,0.042)且且X,Y相互独立相互独立.所以所以 X-YN(-0.1,0.0025)故故第50页,此课件共102页哦 定理定理4.4.1(4.4.1(Chebyshev不等式不等式)设随机变量设随机变
32、量X满足满足E(X)=,方差方差D(X)=2,则对于任意正数,则对于任意正数,有,有证明证明 (1 1)因为)因为E(X)=,D(X)=2,所以,所以第51页,此课件共102页哦(2 2)因为)因为E(X)=,D(X)=2,所以,所以第52页,此课件共102页哦作作 业业第53页,此课件共102页哦4.5 4.5 协方差与相关系数协方差与相关系数 二维联合分布中除含有各分量的边际分布外,二维联合分布中除含有各分量的边际分布外,还含有两个分量间相互关联的信息,协方差就是描还含有两个分量间相互关联的信息,协方差就是描述这种关联程度的一个特征数,其定义如下述这种关联程度的一个特征数,其定义如下:定义
33、定义4.5.14.5.1 设设(X,Y)是二维随机变量,如果数学是二维随机变量,如果数学期望期望EX-E(X)Y-E(Y)存在,则称此期望为存在,则称此期望为X与与Y的的协协方差方差(Covariance),记为,记为Cov(X,Y),即,即 特别地,特别地,Cov(X,X)=D(X).第54页,此课件共102页哦从协方差的定义可以看出,它是从协方差的定义可以看出,它是X的偏差的偏差X-E(X)与与Y的偏差的偏差Y-E(Y)乘积的数学期望乘积的数学期望.由于偏差可正可负由于偏差可正可负也可以为零,故协方差可正可负,也可以为零,其也可以为零,故协方差可正可负,也可以为零,其具体表现如下:具体表现
34、如下:(1)(1)当当Cov(X,Y)0时,称时,称X与与Y正相关正相关.此时两个此时两个偏差偏差X-E(X)与与Y-E(Y)同时增大或减小,而两个数同时增大或减小,而两个数学期望学期望E(X)与与E(Y)都是常数,所以都是常数,所以X与与Y同时增加或同时增加或同时减少同时减少.第55页,此课件共102页哦 (2)(2)当当Cov(X,Y)0时,称时,称X与与Y负相关负相关.此时两个此时两个偏差偏差X-E(X)与与Y-E(Y)一个增大,另一个减小;而一个增大,另一个减小;而两个数学期望两个数学期望E(X)与与E(Y)都是常数,所以都是常数,所以X与与Y一个一个增大,另一个减小增大,另一个减小.
35、(3)(3)当当Cov(X,Y)=0时,称时,称X与与Y不不(线性线性)相关相关.第56页,此课件共102页哦协方差的性质协方差的性质(1)(1)Cov(X,Y)=E(XY)-E(X)E(Y).(2)(2)对任意的常数对任意的常数c,有,有Cov(X,c)=0.(3)(3)若有若有X,Y相互独立,则相互独立,则Cov(X,Y)=0;反之不然反之不然.(4)(4)Cov(X,Y)=Cov(Y,X).(5)(5)a,bR,有,有Cov(aX,bY)=abCov(X,Y).(6)(6)Cov(X Y,Z)=Cov(X,Z)Cov(Y,Z).(7)(7)a,b,c,dR,有,有Cov(aX+b,cY+
36、d)=acCov(X,Y).(8)(8)D(XY)=D(X)D(Y)2Cov(X,Y).第57页,此课件共102页哦相关系数相关系数(Correlation)协方差协方差Cov(X,Y)是有量纲的量,譬如是有量纲的量,譬如X表示表示人的身高,单位是米人的身高,单位是米(m),Y表示人的体重,单位表示人的体重,单位是公斤是公斤(kg),则协方差,则协方差Cov(X,Y)带有量纲带有量纲(mkg).为了消除量纲的影响,现对协方差除以相同量纲为了消除量纲的影响,现对协方差除以相同量纲的量,就得到一个新的概念的量,就得到一个新的概念相关系数相关系数.定义定义3.4.23.4.2 设设(X,Y)是二维随
37、机变量,且是二维随机变量,且D(X)0 D(Y)0,则称,则称为为X与与Y的的(线性线性)相关系数相关系数(Correlation).).第58页,此课件共102页哦(1 1)X与与Y的相关系数的相关系数(X,Y)是个无量纲的量是个无量纲的量.(2 2)Cov(X,Y)与与(X,Y)同符号,故从它的取值也可反同符号,故从它的取值也可反 应出应出X与与Y的的正相关,负相关正相关,负相关和和不相关不相关.(3 3)相关系数)相关系数(X,Y)的另一个解释是:它是的另一个解释是:它是X与与Y相相 应标准化变量应标准化变量X*与与Y*的协方差的协方差Cov(X*,Y*).第59页,此课件共102页哦定
38、理定理4.5.1(4.5.1(相关系数的性质相关系数的性质)(1 1)|XY|1 1;(2 2)|XY|=1=1常数常数a,b,使得,使得 P(Y=aX+b)=1.X,Y几乎处处线性相关几乎处处线性相关.第60页,此课件共102页哦说说 明明(1)若)若XY=0,称,称X与与Y不(线性)相关,但它们之间可能有不(线性)相关,但它们之间可能有 其他的关系其他的关系.譬如譬如:平方关系,对数关系等平方关系,对数关系等.(2)若)若XY=1,则称,则称X与与Y完全正相关;完全正相关;若若XY=-1,则称,则称X与与Y 完全负相关完全负相关.(3 3)若)若0|XY|1,则称,则称X与与Y有有“一定程
39、度一定程度”的线性关系的线性关系|XY|越接近于越接近于1 1,则,则X与与Y的线性相关程度越高;的线性相关程度越高;|XY|越接近于越接近于0 0,X与与Y的线性相关程度越低的线性相关程度越低.但协方差看不出这一点但协方差看不出这一点.若协方差很小,而其两个标若协方差很小,而其两个标准差准差X,Y也很小,则其比值就不一定很小也很小,则其比值就不一定很小.第61页,此课件共102页哦 例例4.5.14.5.1 设设(X,Y)的联合密度函数为的联合密度函数为试求试求X与与Y的相关系数的相关系数XY.第62页,此课件共102页哦解解第63页,此课件共102页哦于是于是第64页,此课件共102页哦
40、本题的协方差很小,可是相关系数并不小本题的协方差很小,可是相关系数并不小.从相从相关系数关系数XY=0.8243看,看,X与与Y有相当程度的正相关;有相当程度的正相关;当从相应的协方差当从相应的协方差Cov(X,Y)=0.0471看,看,X与与Y的相关的相关性很微弱,几乎可以忽略不计性很微弱,几乎可以忽略不计.造成这种错觉的原因造成这种错觉的原因在于是没有考虑标准差在于是没有考虑标准差.若两个标准差都很小,即使是协方差小一些,若两个标准差都很小,即使是协方差小一些,相关系数也能显示一定程度的相关性相关系数也能显示一定程度的相关性.由此可见,在由此可见,在协方差的基础上加工形成的相关系数是更为重
41、要的协方差的基础上加工形成的相关系数是更为重要的相关性的特征数相关性的特征数.第65页,此课件共102页哦例例4.5.24.5.2 若若(X,Y)N(1,2,12,22,),求证,求证XY=.证明一证明一 第66页,此课件共102页哦故故第67页,此课件共102页哦证明二证明二令令 第68页,此课件共102页哦则则于是于是故故第69页,此课件共102页哦 一般场合,独立必然导致不相关,不相关推不出独一般场合,独立必然导致不相关,不相关推不出独立立.但也有例外,如下面的例子但也有例外,如下面的例子.定理定理4.5.14.5.1 若若(X,Y)N(1,12,2,22,),则,则X与与Y相互独立相互
42、独立 X与与Y不相关不相关 =0.证明证明 由以前的结论知由以前的结论知XY=,故只需证明,故只需证明X与与Y不相关不相关=0(1 1)必要性)必要性 因为因为XN(1,12,2,22,0),所以,所以第70页,此课件共102页哦且且XN(1,12),XN(2,22),于是于是故故所以所以X与与Y相互独立相互独立.第71页,此课件共102页哦(2 2)充分性)充分性 因为因为X与与Y相互独立,所以相互独立,所以f(x,y)=fX(x)fY(y)即即所以所以=0.第72页,此课件共102页哦作作 业业第73页,此课件共102页哦4.6 4.6 分布的其它特征数分布的其它特征数(Figure Ch
43、aracteristic)数学期望和方差是随机变量最重要的两个特征数学期望和方差是随机变量最重要的两个特征数,此外,随机变量还有一些其他的特征数。数,此外,随机变量还有一些其他的特征数。4.6.1 4.6.1 K阶矩阶矩 设设X为随机变量,为随机变量,k为正整数为正整数.如果以下的数学如果以下的数学期望都成存在,则期望都成存在,则(1)(1)X的的k阶原点矩阶原点矩:(2)(2)X的的k阶中心矩阶中心矩:第74页,此课件共102页哦(3)(3)X与与Y的的k+l 阶混合原点矩阶混合原点矩:(4)(4)X与与Y的的k+l 阶混合中心矩阶混合中心矩:由于由于|X|k-1|X|k+1,所以若,所以若
44、X的的k阶矩存在,则阶矩存在,则X的的k-1阶矩也存在,进而低于阶矩也存在,进而低于k阶的各阶矩都存在阶的各阶矩都存在.第75页,此课件共102页哦 4.6.3 4.6.3 协方差矩阵协方差矩阵 二维随机变量二维随机变量(X1,X2)有四个二阶中心矩有四个二阶中心矩(假设它假设它们都存在们都存在),它们分别为,它们分别为于是于是(X1,X2)的的协方差矩阵协方差矩阵为为第76页,此课件共102页哦 设设(X1,X2,Xn)的二阶混合中心矩都存在,令的二阶混合中心矩都存在,令则则(X1,X2,Xn)的协方差矩阵为的协方差矩阵为因而上述矩阵是一个因而上述矩阵是一个对称矩阵对称矩阵.第77页,此课件
45、共102页哦 n维正态随机变量具有四条重要性质:维正态随机变量具有四条重要性质:(1)(1)n维正态随机变量维正态随机变量(X1,X2,Xn)的每一个分量都是的每一个分量都是 正态变量正态变量;反之反之,若若(X1,X2,Xn)的每一个分量都的每一个分量都 是正态随机变量,是正态随机变量,且相互独立且相互独立,则是则是(X1,X2,Xn)n维正态随机变量。维正态随机变量。(2)(2)n随机变量随机变量(X1,X2,Xn)是正态分布的充要条件是是正态分布的充要条件是 它的任意线性组合:它的任意线性组合:a1X1+a2X2+anXn+a0(其中,a12+a22+an20)都服从一维正态分布都服从一
46、维正态分布.第78页,此课件共102页哦(3 3)若)若(X1,X2,Xn)服从服从n维正态分布,维正态分布,Y1,Y2,Ym是是X1,X2,Xn的线性函数,则的线性函数,则(Y1,Y2,Ym)也服从正态分也服从正态分布布.上述性质称为上述性质称为正态变量的线性变换不变性正态变量的线性变换不变性.(4 4)设)设(X1,X2,Xn)服从服从n维正态分布,则维正态分布,则“X1,X2,Xn相互独立相互独立”“X1,X2,Xn两两不相关两两不相关”.第79页,此课件共102页哦作作 业业没 有第80页,此课件共102页哦证明证明 返回返回第81页,此课件共102页哦证明证明 返回返回第82页,此课
47、件共102页哦证明证明第83页,此课件共102页哦(2)D(C)=0,其中其中c为常数为常数.证明证明第84页,此课件共102页哦(3 3)若)若a,b为常数,则为常数,则D(aX+b)=a2D(X)证明证明第85页,此课件共102页哦4 4)若随机变量)若随机变量X,Y相互独立,则相互独立,则 D(X+Y)=D(X)+D(Y)证明证明第86页,此课件共102页哦 证明证明 充分性是显然的,下证必要性充分性是显然的,下证必要性.若若D(X)=0,则,则E(X)一定存在一定存在.因为因为所以有所以有第87页,此课件共102页哦几何分布的期望和方差几何分布的期望和方差 若若XGe(p),则,则D(
48、X)=(1-p)/p2=q/p2.证明证明 因为因为XGe(p),所以,所以P(X=k)=(1-p)k-1p (k=1,2,).故故令令则则第88页,此课件共102页哦所以所以令令第89页,此课件共102页哦则则所以所以 返回返回第90页,此课件共102页哦超几何分布的期望和方差超几何分布的期望和方差 若若Xh(n,N,M),则,则证明证明 因为因为XGe(n,N,M),所以,所以于是于是第91页,此课件共102页哦第92页,此课件共102页哦 返回第93页,此课件共102页哦巴斯卡巴斯卡(Pascal)分布分布 (6 6)巴斯卡)巴斯卡(Pascal)分布分布 若若XNb(r,p),则,则E
49、(X)=r/p,D(X)=(1-p)/p2=rq/p2.证明证明 因为因为XNb(r,p),所以,所以所以所以第94页,此课件共102页哦 第95页,此课件共102页哦 返回第96页,此课件共102页哦令令则则第97页,此课件共102页哦所以所以故故 返回返回第98页,此课件共102页哦证明证明 返回返回第99页,此课件共102页哦(3)(3)若有若有X,Y相互独立,则相互独立,则Cov(X,Y)=0;反之不然反之不然.证明证明 因为因为X,Y相互独立,所以相互独立,所以 Cov(X,Y)=E(XY)-E(X)E(Y)=E(X)E(Y)-E(X)E(Y)=0 0 反之,如反之,如X2+Y2=1,虽然,虽然X,Y没有线性关系,却没有线性关系,却也不独立也不独立.返回返回第100页,此课件共102页哦 该性质可以推广到更多个随机变量场合,即该性质可以推广到更多个随机变量场合,即对任意对任意n个随机变量个随机变量X1,X2,Xn,有,有 返回返回第101页,此课件共102页哦(5)(5)a,bR,有,有Cov(aX,bY)=abCov(Y,X).证明证明 返回返回第102页,此课件共102页哦