最新应用多元统计分析课后习题答案高惠璇PPT课件.ppt

上传人:豆**** 文档编号:77612811 上传时间:2023-03-15 格式:PPT 页数:174 大小:2.87MB
返回 下载 相关 举报
最新应用多元统计分析课后习题答案高惠璇PPT课件.ppt_第1页
第1页 / 共174页
最新应用多元统计分析课后习题答案高惠璇PPT课件.ppt_第2页
第2页 / 共174页
点击查看更多>>
资源描述

《最新应用多元统计分析课后习题答案高惠璇PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新应用多元统计分析课后习题答案高惠璇PPT课件.ppt(174页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、应用多元统计分析课后习题答应用多元统计分析课后习题答案高惠璇案高惠璇 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计 2-1 设设3维随机向量维随机向量XN3(,2I3),已知,已知试求试求Y=AX+d的分布的分布.解解:利用性质利用性质2,即得二维随机向量即得二维随机向量YN2(y,y),其中:其中:2 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计2-11 已知已知X=(X1,X2)的密度函数为的密度函数为试求试求X的均值和协方差阵的均值和协方差阵.解一解一:求边缘分布及求边缘分布及Cov(X1,X2)=129 第二章第二章 多元正态分布及参数的估计多元正态

2、分布及参数的估计类似地有类似地有10 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计011 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计所以所以故故X=(X1,X2)为二元正态分布为二元正态分布.12 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计解二解二:比较系数法比较系数法 设设比较上下式相应的系数比较上下式相应的系数,可得可得:13 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计故故X=(X1,X2)为二元正态随机向量为二元正态随机向量.且且解三解三:两次配方法两次配方法 14 第二章第二章 多元正态分布及参数的估计多元正

3、态分布及参数的估计即即设函数设函数 是随机向量是随机向量Y的密度函数的密度函数.15 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计 (4)由于由于故故(3)随机向量随机向量16 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计2-12 设设X1 N(0,1),令令(1)证明证明X2 N(0,1);(2)证明证明(X1,X2)不是二元正态分布不是二元正态分布.证明证明(1):任给任给x,当当x-1时时当当x1时时,17 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计当当-1x1时时,(2)考虑随机变量考虑随机变量Y=X1-X2,显然有显然有18 第

4、二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计 若若(X1,X2)是二元正态分布是二元正态分布,则由性质则由性质4可知可知,它的任意线性组合必为一元正态它的任意线性组合必为一元正态.但但Y=X1-X2 不是正态分布不是正态分布,故故(X1,X2)不是二元正态分布不是二元正态分布.19 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计2-17 2-17 设设XNp(,),(,),0,0,X的密度函数记为的密度函数记为f(x;,).(1);,).(1)任给任给a0,0,试证明概率密度等高面试证明概率密度等高面 f(x;,)=;,)=a是一个椭球面是一个椭球面.(2)(2

5、)当当p=2=2且且 (0)0)时,时,概率密度等高面就是平面上的一个椭圆,试求该椭圆概率密度等高面就是平面上的一个椭圆,试求该椭圆的方程式,长轴和短轴的方程式,长轴和短轴.证明证明(1):任给任给a0,0,记记20 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计令令 ,则概率密度等高面为则概率密度等高面为(见附录见附录5 P390)21 第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计故概率密度等高面故概率密度等高面 f(x;,)=a是一个椭球面是一个椭球面.(2)当当p=2=2且且 (0)0)时时,由由可得可得的特征值的特征值22 第二章第二章 多元正态分布及

6、参数的估计多元正态分布及参数的估计i(i=1,2)对应的特征向量为对应的特征向量为由由(1)可得椭圆方程为可得椭圆方程为长轴半径为长轴半径为 方向沿着方向沿着l1方向方向(b0);短轴半径为短轴半径为 方向沿着方向沿着l2方向方向.23第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计 2-19 为了了解某种橡胶的性能,今抽了十个样品,每为了了解某种橡胶的性能,今抽了十个样品,每个测量了三项指标:个测量了三项指标:硬度、变形和弹性,其数据见表。硬度、变形和弹性,其数据见表。试计算样本均值,样本离差阵,样本协差阵和样本相试计算样本均值,样本离差阵,样本协差阵和样本相关阵关阵.解:解:

7、24第二章第二章 多元正态分布及参数的估计多元正态分布及参数的估计25应用多元统计分析应用多元统计分析第三章习题解答第三章习题解答26第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验 3-1 3-1 设设XNn(,2 2In),),A为对称幂等为对称幂等阵阵,且且rk(rk(A)=)=r(rn),证明证明 证明证明 因因A为对称幂等阵,而对称幂等阵的特为对称幂等阵,而对称幂等阵的特征值非征值非0 0即即1,1,且只有且只有r个非个非0 0特征值,即存在正交特征值,即存在正交阵阵(其列向量其列向量ri为相应特征向量为相应特征向量),使,使27第三章第三章 多元正态总体参数的检验

8、多元正态总体参数的检验28其中非中心参数为其中非中心参数为第三章第三章 多元正态总体参数的检验多元正态总体参数的检验293-2 3-2 设设XN Nn n(,2In),),A,B为为n阶对称阶对称阵阵.若若AB 0 0,证明证明XAX与与XBX相互独立相互独立.证明的思路:证明的思路:记记rk(rk(A)=)=r.因因A为为n阶对称阵阶对称阵,存在正交阵存在正交阵,使得使得 A=diag(diag(1,1,r 0,.,0)0,.,0)令令YX,则则YNn(,2In),),第三章第三章 多元正态总体参数的检验多元正态总体参数的检验且且30 又因为又因为 XBX=YBY=YHY其中其中H=B。如果

9、能够证明。如果能够证明XBX可表示为可表示为Yr+1+1,,Yn的函数,即的函数,即H只是右只是右下子块为非下子块为非0的矩阵。的矩阵。则则XAX 与与XBX相互独立。相互独立。第三章第三章 多元正态总体参数的检验多元正态总体参数的检验31 证明证明 记记rk(rk(A)=)=r.若若r=n,由由ABO,知知B Onn,于是于是XAX与与XBX独立;独立;若若r=0=0时时,则则A0,0,则两个二次型也是独则两个二次型也是独立的立的.以下设以下设0 0rn.因因A为为n阶对称阵阶对称阵,存在正存在正交阵交阵,使得使得第三章第三章 多元正态总体参数的检验多元正态总体参数的检验32 其中其中i00

10、为为A的特征值的特征值(i=1,=1,r).).于是于是令令r第三章第三章 多元正态总体参数的检验多元正态总体参数的检验 由由ABO可得可得DrH1111O ,DrH1212O.因因Dr为满秩阵为满秩阵,故有故有H1111Orr,H1212Or(n-r).由于由于H为对称阵,所以为对称阵,所以H2121O(n-r)r.于是于是33 由于由于Y1 1,,Yr,Yr+1,Yn相互独立,故相互独立,故XAX与与XBX相互独立相互独立.第三章第三章 多元正态总体参数的检验多元正态总体参数的检验令令YX,则则Y N Nn(,2In),),且且34 设设XN Np(,),0,0,A和和B为为p阶对称阵阶对

11、称阵,试证明试证明 (X-)A(X-)与与(X-)B(X-)相互相互独立独立 AB0 0pp.第三章第三章 多元正态总体参数的检验多元正态总体参数的检验3-335由由“1.“1.结论结论6”6”知知与与相互独立相互独立 第三章第三章 多元正态总体参数的检验多元正态总体参数的检验36 性质性质4 4 分块分块Wishart矩阵的分布矩阵的分布:设设X()Np(0,)(1,n)相互独立,其中相互独立,其中又已知随机矩阵又已知随机矩阵则则第三章第三章 多元正态总体参数的检验多元正态总体参数的检验试证明试证明Wishart分布的性质分布的性质(4)和和T2分布的性质分布的性质(5).3-437第三章第

12、三章 多元正态总体参数的检验多元正态总体参数的检验证明证明:设设记记,则则即即38第三章第三章 多元正态总体参数的检验多元正态总体参数的检验当当12=O 时时,对对1,2,n,相互相互 独立独立.故有故有W11与与W22相互独立相互独立.由定义由定义3.1.4可知可知39 性质性质5 在非退化的线性变换下在非退化的线性变换下,T2统计量保持不统计量保持不变变.证明证明:设设X()(1,n)是来自是来自p元总体元总体Np(,)的随机样本的随机样本,X和和Ax分别表示正态总体分别表示正态总体X的样本均值向量和离差阵的样本均值向量和离差阵,则由性质则由性质1有有第三章第三章 多元正态总体参数的检验多

13、元正态总体参数的检验令令其中其中C是是p p非退化常数矩阵,非退化常数矩阵,d是是p 1常向量。常向量。则则40第三章第三章 多元正态总体参数的检验多元正态总体参数的检验所以所以41第三章第三章 多元正态总体参数的检验多元正态总体参数的检验3-5 对单个p维正态总体Np(,)均值向量的检验问题,试用似然比原理导出检验H0:=0(=0已知)的似然比统计量及分布.解解:总体总体XN Np p(,(,0 0)()(0 00),0),设设X()(=1,(=1,n)(np)为来自为来自p维正态总体维正态总体X的样本的样本.似然比统计量为似然比统计量为P66当当=0已知已知的检验的检验42第三章第三章 多

14、元正态总体参数的检验多元正态总体参数的检验43第三章第三章 多元正态总体参数的检验多元正态总体参数的检验44第三章第三章 多元正态总体参数的检验多元正态总体参数的检验因因所以由所以由3“一一 2.的结论的结论1”可知可知45第三章第三章 多元正态总体参数的检验多元正态总体参数的检验 3-6 (均值向量各分量间结构关系的检验均值向量各分量间结构关系的检验)设总体设总体XN Np p(,)(,)(0),0),X()(1,1,n)()(np)为来自为来自p维正态总体维正态总体X X的样本,记的样本,记(1 1,p).).C为为kp常常数数(k p),rank(),rank(C)=)=k,r为已知为已

15、知k维向量维向量.试给出检验试给出检验H H0 0:C:Cr的检验统计量及分布的检验统计量及分布.解:解:令令则则Y()(1,1,n)为来自为来自k维正态总体维正态总体Y的样本,且的样本,且46第三章第三章 多元正态总体参数的检验多元正态总体参数的检验检验检验这是单个这是单个k维正态总体均值向量的检验问维正态总体均值向量的检验问题题.利用利用3.2当当y=CC未知未知时时均均值值向量向量的的检验给检验给出的出的结论结论,取取检验统计检验统计量量:47第三章第三章 多元正态总体参数的检验多元正态总体参数的检验 3-7 设总体设总体XNp(,)(0),X()(1,n)(np)为来自为来自p维正态总

16、体维正态总体X的样本,样本均值为的样本,样本均值为X,样本离差阵为,样本离差阵为A.记记(1 1,p p).为检验为检验H0 0:1 1=2 2=p p ,H1 1:1 1,2 2,p p至少有一对不至少有一对不相等相等.令令则上面的假设等价于则上面的假设等价于H0 0:C=0p-1,H1 1:C 0p-1试求检验试求检验H0 的似然比统计量和分布的似然比统计量和分布.解:解:至少有一对不相等至少有一对不相等.48第三章第三章 多元正态总体参数的检验多元正态总体参数的检验利用利用3-6的结果知,检验的结果知,检验H0的似然比统计量及分的似然比统计量及分布为:布为:其中其中(注意注意:3-6中的

17、中的k在这里为在这里为p-1)49第三章第三章 多元正态总体参数的检验多元正态总体参数的检验 3-8 假定人体尺寸有这样的一般规律假定人体尺寸有这样的一般规律:身高身高(X1),胸围胸围(X2)和上半臂围和上半臂围(X3)的平均尺寸比例是的平均尺寸比例是6 4 1.假设假设X()(1,n)为来自总体为来自总体X=(X1,X2,X3)的随机样本的随机样本.并并设设XN3(,),试利用表,试利用表3.5中男婴这一组数据检验三中男婴这一组数据检验三个尺寸个尺寸(变量变量)是否符合这一规律是否符合这一规律(写出假设写出假设H0,并导出检并导出检验统计量验统计量).解:解:检验三个尺寸检验三个尺寸(变量

18、变量)是否符合这一规律的问题是否符合这一规律的问题可提成假设检验问题可提成假设检验问题.因为因为其中其中注意注意:50第三章第三章 多元正态总体参数的检验多元正态总体参数的检验检验的假设检验的假设H0为为 利用利用3-6的结论,取检验统计量为:的结论,取检验统计量为:由男婴测量数据由男婴测量数据(p=3,n=6)计算可得计算可得 T2=47.1434,F=18.8574,p值值=0.0091950未知未知.检验检验H0似然比统似然比统计量为计量为记记其中其中55第三章第三章 多元正态总体参数的检验多元正态总体参数的检验其中其中 A=A1+A2称为组内离差阵称为组内离差阵.B称为组间离差阵称为组

19、间离差阵.56第三章第三章 多元正态总体参数的检验多元正态总体参数的检验因为因为似然比统计量似然比统计量57第三章第三章 多元正态总体参数的检验多元正态总体参数的检验所以所以58第三章第三章 多元正态总体参数的检验多元正态总体参数的检验由定义由定义3.1.5可知可知由由或或由于由于59第三章第三章 多元正态总体参数的检验多元正态总体参数的检验可取检验统计量为可取检验统计量为检验假设检验假设H0的否定域为的否定域为60第三章第三章 多元正态总体参数的检验多元正态总体参数的检验3-11 表表3.5给出给出15名名2周岁婴儿的身高周岁婴儿的身高(X1),胸围,胸围(X2)和上半臂围和上半臂围(X3)

20、的测量数据的测量数据.假设男婴的测量数据假设男婴的测量数据X()(1,6)为来自总体为来自总体N3(1),)的随机样本的随机样本.女婴的测女婴的测量数据量数据Y()(1,9)为来自总体为来自总体N3(2),)的随机样的随机样本本.试利用表试利用表3.5中的数据检验中的数据检验H0:(1)=(2)(=0.05).解解:这是两总体均值向量的检验问题这是两总体均值向量的检验问题.检验统检验统计量取为计量取为(p=3,n=6,m=9):61第三章第三章 多元正态总体参数的检验多元正态总体参数的检验其中其中故检验统计量为故检验统计量为用观测数据代入计算可得用观测数据代入计算可得:故故H0相容相容.显著性

21、概率值显著性概率值62 第三章第三章 多元正态总体参数的检验多元正态总体参数的检验 3-12 3-12 在地质勘探中,在在地质勘探中,在A A、B B、C C三个地区采集了一些岩石,三个地区采集了一些岩石,测其部分化学成分见表测其部分化学成分见表3.6.3.6.假定这三个地区岩石的成分遵从假定这三个地区岩石的成分遵从N N3 3(i i),i i)()(i1 1,2 2,3)(=0.05).3)(=0.05).(1)(1)检验检验H0H0:1 12 23 3;H1H1:1 1,2 2,3 3不全等不全等;(2)(2)检验检验H0H0:(1)(1)(2)(2),H1,H1:(1)(1)(2)(2

22、);(3)(3)检验检验H0:H0:(1)(1)(2)(2)(3)(3),H1:,H1:存在存在ij,ij,使使(i)(i)(j)(j);(4)(4)检验三种化学成分相互独立检验三种化学成分相互独立.解解:(4):(4)设来自三个总体的样本为设来自三个总体的样本为(p=3,=3,k=3)=3)检验检验H0的似然比统计量为的似然比统计量为63第三章第三章 多元正态总体参数的检验多元正态总体参数的检验似然比统计量的分子为似然比统计量的分子为64第三章第三章 多元正态总体参数的检验多元正态总体参数的检验称为合并组内离差阵称为合并组内离差阵.65第三章第三章 多元正态总体参数的检验多元正态总体参数的检

23、验66第三章第三章 多元正态总体参数的检验多元正态总体参数的检验似然比统计量的分母为似然比统计量的分母为67第三章第三章 多元正态总体参数的检验多元正态总体参数的检验检验检验H0的似然比统计量可化为的似然比统计量可化为:68第三章第三章 多元正态总体参数的检验多元正态总体参数的检验 Box证明了,在证明了,在H0成立下当成立下当n时,时,=-blnV2(f),其中其中 V=0.7253,=-blnV=3.2650,因因 p=0.35250.05.故故H0相容,即随机向量的三个分量相容,即随机向量的三个分量(三种三种化学成分化学成分)相互独立相互独立.69第三章第三章 多元正态总体参数的检验多元

24、正态总体参数的检验 或者利用定理或者利用定理3.2.1,当当n充分大时,充分大时,=-2ln2(f),其中其中 f=p+p(p+1)/2-(p+p)=3,V=0.7253,=0.1240,=-2ln=-nlnV=4.1750,因因 p=0.24320.05.故故H0相容,即随机向量的三个分量相容,即随机向量的三个分量(三种三种化学成分化学成分)相互独立相互独立.70第三章第三章 多元正态总体参数的检验多元正态总体参数的检验3-13 对表对表3.3给出的三组观测数据分别检验是给出的三组观测数据分别检验是否来自否来自4维正态分布维正态分布.(1)对每个分量检验是否一维正态对每个分量检验是否一维正态

25、?(2)利用利用2图检验法对三组观测数据分别检验图检验法对三组观测数据分别检验是否来自是否来自4维正态分布维正态分布.71应用多元统计分析应用多元统计分析第四章部分习题解答第四章部分习题解答72 第四章第四章 回归分析回归分析4-1 设设(1)试求参数试求参数a,b的最小二乘估计;的最小二乘估计;解解:用矩阵表示以上模型用矩阵表示以上模型:则则73 第四章第四章 回归分析回归分析(2)试导出检验试导出检验H0:a=b的似然比统计量,并指出当假的似然比统计量,并指出当假设成立时,这个统计量的分布是什么设成立时,这个统计量的分布是什么?解解:样本的似然函数为样本的似然函数为74 第四章第四章 回归

26、分析回归分析令令可得可得似然比统计量的分母为似然比统计量的分母为当当H0:a=b=a0成立时成立时,样本的似然函数为样本的似然函数为75 第四章第四章 回归分析回归分析令令可得可得令令可得可得似然比统计量的分子为似然比统计量的分子为76 第四章第四章 回归分析回归分析似然比统计量为似然比统计量为以下来讨论与以下来讨论与V等价的统计量分布等价的统计量分布:77 第四章第四章 回归分析回归分析因因当当H0:a=b=a0成立时成立时,回归模型回归模型为为78 第四章第四章 回归分析回归分析考虑考虑经验证经验证:B-A是对称幂等阵是对称幂等阵;rank(B-A)=tr(B-A)=2-1=1;79 第四

27、章第四章 回归分析回归分析 A(B-A)=O33 .由第三章由第三章3.1的结论的结论6知知由第三章由第三章3.1的结论的结论4知知(H0:a=b成立时成立时)80 第四章第四章 回归分析回归分析所以所以否定域为否定域为81 第四章第四章 回归分析回归分析4-2 在多元线性回归模型在多元线性回归模型(4.1.3)中中(p=1),试求出参数,试求出参数向量向量和和2的最大似然估计的最大似然估计.解解:模型模型(4.1.3)为为样本的似然函数为样本的似然函数为82 第四章第四章 回归分析回归分析令令可得参数向量可得参数向量和和2的最大似然估计为的最大似然估计为:83 第四章第四章 回归分析回归分析

28、4-6 称观测向量称观测向量Y和估计向量和估计向量Y的相关系数的相关系数R为为全相关系数全相关系数.即即试证明:试证明:84 第四章第四章 回归分析回归分析证明证明:(1)估计向量为估计向量为(2)因因85 第四章第四章 回归分析回归分析上式第一项为上式第一项为:86 第四章第四章 回归分析回归分析所以所以(3)残差平方和残差平方和Q为为87 第四章第四章 回归分析回归分析 4-74-7 在多对多的多元线性回归模型中,给定在多对多的多元线性回归模型中,给定Ynp,Xnm,且且rank(rank(X)=)=m,C=(1,C=(1n|X).).则则 其中其中(CC)-1CY.证明证明:故交叉项故交

29、叉项=O.88 第四章第四章 回归分析回归分析 4-84-8 在多对多的回归模型中,令在多对多的回归模型中,令 Q()=(Y-C)(Y-C).试证明试证明(CC)-1CY是在下列四种意义下达最小:是在下列四种意义下达最小:(1)tr(1)trQ()tr)trQ();(2)(2)Q()Q();(3)|(3)|Q()|)|Q()|)|;(4)(4)chch1 1(Q()chch1 1(Q(),其中,其中chch1 1(A)表示表示A的最大特征值的最大特征值.以上以上是是(m+1)+1)p的任意矩阵的任意矩阵.89第四章第四章 回归分析回归分析90第四章第四章 回归分析回归分析等号成立等号成立91第

30、四章第四章 回归分析回归分析92第四章第四章 回归分析回归分析93第四章第四章 回归分析回归分析见附录见附录P394定理定理7.2(7.5)式式94应用多元统计分析应用多元统计分析第五章部分习题解答第五章部分习题解答95第五章第五章 判别分析判别分析5-1 已知总体已知总体Gi(m=1)的分布为的分布为:(i=1,2),按按距离判别准则为距离判别准则为(不妨设不妨设(1)(1)(2)(2),12)其中其中 试求错判概率试求错判概率P(2|1)和和P(1|2).解解:96第五章第五章 判别分析判别分析记记97第五章第五章 判别分析判别分析98第五章第五章 判别分析判别分析5-2 设三个总体的分布

31、分别为设三个总体的分布分别为:G1为为N(2,0.52),G2为为N(0,22),G3为为N(3,12).试问样品试问样品x=2.5应判归哪一类应判归哪一类?(1)按距离准则;按距离准则;(2)按按Bayes准则准则 解解:(1)按距离准则按距离准则,当样品当样品x=2.5时时,因因0.2510.11740.0304,所以样品所以样品x=2.5判归判归G1.101第五章第五章 判别分析判别分析 解三解三:后验概率判别法后验概率判别法,计算样品计算样品x已知已知,属属Gt的后验概率的后验概率:当样品当样品x=2.5时时,经计算可得经计算可得因因0.52180.37980.0984,所以样品所以样

32、品x=2.5判归判归G1.102 第五章第五章 判别分析判别分析103 第五章第五章 判别分析判别分析由此题的结论可得出判别法由此题的结论可得出判别法:104 第五章第五章 判别分析判别分析5-4 设有两个正态总体设有两个正态总体G1和和G2,已知已知(m=2)105第五章第五章 判别分析判别分析类似于例类似于例5.3.1的解法的解法,A-1B的特征根就等于的特征根就等于106第五章第五章 判别分析判别分析107第五章第五章 判别分析判别分析108第五章第五章 判别分析判别分析109第五章第五章 判别分析判别分析110第五章第五章 判别分析判别分析111第五章第五章 判别分析判别分析112第五

33、章第五章 判别分析判别分析113 第五章第五章 判别分析判别分析114 第五章第五章 判别分析判别分析115 第五章第五章 判别分析判别分析116应用多元统计分析应用多元统计分析第六章部分习题解答第六章部分习题解答117 第六章第六章 聚类分析聚类分析 6-1 证明下列结论证明下列结论:(1)(1)两个距离的和所组成的函数仍是距离两个距离的和所组成的函数仍是距离;(2)(2)一个正常数乘上一个距离所组成的函数一个正常数乘上一个距离所组成的函数仍是距离仍是距离;(3)(3)设设d为一个距离为一个距离,c0 0为常数为常数,则则仍是一个距离仍是一个距离;(4)(4)两个距离的乘积所组成的函数不一定

34、是两个距离的乘积所组成的函数不一定是距离距离;118第六章第六章 聚类分析聚类分析(2)设设d是是距离距离,a 0为为正常数正常数.令令d*=ad,显然有显然有119第六章第六章 聚类分析聚类分析故故d*=ad是一个距离是一个距离.(3)设设d为一个距离为一个距离,c0 0为常数为常数,显然有显然有120第六章第六章 聚类分析聚类分析故故d*是一个距离是一个距离.121第六章第六章 聚类分析聚类分析122第六章第六章 聚类分析聚类分析6-2 试证明二值变量的相关系数为试证明二值变量的相关系数为(6.2.2)式,夹角余式,夹角余弦为弦为(6.2.3)式式.证明:证明:设变量设变量Xi和和Xj是二

35、值变量,它们的是二值变量,它们的n次观测值记次观测值记为为xti,xtj(t=1,n).xti,xtj 的值或为的值或为0,或为,或为1.由二值变由二值变量的列联表(表量的列联表(表6.5)可知:变量)可知:变量Xi取值取值1的观测次数的观测次数为为a+b,取值取值0的观测次数为的观测次数为c+d;变量变量Xi和和Xj取值均为取值均为1的的观测次数为观测次数为a,取值均为取值均为0的观测次数为的观测次数为d 等等。利用两等等。利用两定量变量相关系数的公式:定量变量相关系数的公式:123第六章第六章 聚类分析聚类分析124第六章第六章 聚类分析聚类分析故二值变量的相关系数为:故二值变量的相关系数

36、为:(6.2.2)125第六章第六章 聚类分析聚类分析利用两定量变量夹角余弦的公式:利用两定量变量夹角余弦的公式:其中其中故有故有126第六章第六章 聚类分析聚类分析6-3 下面是下面是5个样品两两间的距离阵个样品两两间的距离阵试用最长距离法、类平均法作系统聚类,并画出谱系试用最长距离法、类平均法作系统聚类,并画出谱系聚类图聚类图.解解:用最长距离法用最长距离法:合并合并X(1),X(4)=CL4,并类距离并类距离 D1=1.127第六章第六章 聚类分析聚类分析 合并合并X(2),X(5)=CL3,并类距离并类距离 D2=3.合并合并CL3,CL4=CL2,并类距离并类距离 D3=8.所有样品

37、合并为一类所有样品合并为一类CL1,并类距离并类距离 D4=10.128第六章第六章 聚类分析聚类分析最长距离法的谱系聚类图如下最长距离法的谱系聚类图如下:129第六章第六章 聚类分析聚类分析 合并合并X(1),X(4)=CL4,并类距离并类距离 D1=1.用类平均法用类平均法:130第六章第六章 聚类分析聚类分析 合并合并X(2),X(5)=CL3,并类距离并类距离 D2=3.合并合并CL3,CL4=CL2,并类距离并类距离 D3=(165/4)1/2.所有样品合并为一类所有样品合并为一类CL1,并类距离并类距离 D4=(121/2)1/2.131第六章第六章 聚类分析聚类分析类平均法的谱系

38、聚类图如下类平均法的谱系聚类图如下:132第六章第六章 聚类分析聚类分析6-4 利用距离平方的递推公式利用距离平方的递推公式来证明当来证明当0,p0,q0,p+q+1时时,系统聚类中的类系统聚类中的类平均法、可变类平均法、可变法、平均法、可变类平均法、可变法、Ward法的单调性法的单调性.证明:证明:设第设第L次合并次合并Gp和和Gq为新类为新类Gr后后,并类距离并类距离DL Dpq,且必有且必有Dpq2Dij2.新类新类Gr与其它类与其它类Gk的距离平方的递的距离平方的递推公式推公式,当当0,p0,q0,p+q+1 时时 这表明新的距离矩阵中类间的距离均这表明新的距离矩阵中类间的距离均 Dp

39、q DL,故有故有DL1 DL,即相应的聚类法有单调性,即相应的聚类法有单调性.133第六章第六章 聚类分析聚类分析 对于类平均法,因对于类平均法,因故类平均法具有单调性。故类平均法具有单调性。对于可变类平均法,因对于可变类平均法,因故可变类平均法具有单调性。故可变类平均法具有单调性。134第六章第六章 聚类分析聚类分析 对于可变法,因对于可变法,因故可变法具有单调性。故可变法具有单调性。对于离差平方和法,因对于离差平方和法,因故离差平方和法具有单调性。故离差平方和法具有单调性。135第六章第六章 聚类分析聚类分析6-5 试从定义直接证明最长和最短距离法的单调性试从定义直接证明最长和最短距离法

40、的单调性.证明:证明:先考虑最短距离法:先考虑最短距离法:设第设第L步从类间距离矩阵步从类间距离矩阵 出发,假设出发,假设故合并故合并Gp和和Gq为一新类为一新类Gr,这时第,这时第L步的并类距离步的并类距离:且新类且新类Gr与其它类与其它类Gk的距离由递推公式可知的距离由递推公式可知设第设第L+1步从类间距离矩阵步从类间距离矩阵 出发,出发,136第六章第六章 聚类分析聚类分析故第故第L1步的并类距离步的并类距离:即最短距离法具有单调性即最短距离法具有单调性.类似地类似地,可以证明最长距离法也具有单调性可以证明最长距离法也具有单调性.137第六章第六章 聚类分析聚类分析6-6 设设A,B,C

41、为平面上三个点为平面上三个点,它们之间的距离为它们之间的距离为将三个点看成三个二维样品将三个点看成三个二维样品,试用此例说明中间距离法试用此例说明中间距离法和重心法不具有单调性和重心法不具有单调性.解解:按中间距离法按中间距离法,取取=-1/4,=-1/4,将将B B和和C C合并为合并为一类后一类后,并类距离并类距离D1 1=1,=1,而而A A与新类与新类Gr=B,C=B,C的的类间平方距离为类间平方距离为138第六章第六章 聚类分析聚类分析故中间距离法不具有单调性。故中间距离法不具有单调性。按重心法按重心法,将将B B和和C C合并为一类后合并为一类后,并类距离并类距离D1 1=1,=1

42、,而而A与新类与新类Gr=B,C=B,C的类间平方距离为的类间平方距离为当把当把A与与B,C并为一类时,并类距离并为一类时,并类距离139第六章第六章 聚类分析聚类分析故故重心法重心法法不具有单调性。法不具有单调性。并类过程如下:并类过程如下:当把当把A与与B,C并为一类时,并类距离并为一类时,并类距离ABC140第六章第六章 聚类分析聚类分析解一解一:利用利用如果样品间的距离定义为欧氏距离如果样品间的距离定义为欧氏距离,则有则有6-7 试推导重心法的距离递推公式试推导重心法的距离递推公式(6.3.2);141第六章第六章 聚类分析聚类分析142第六章第六章 聚类分析聚类分析143第六章第六章

43、 聚类分析聚类分析解二解二:因样品间的距离定义为欧氏距离因样品间的距离定义为欧氏距离,利用利用144第六章第六章 聚类分析聚类分析利用利用145第六章第六章 聚类分析聚类分析故有故有146第六章第六章 聚类分析聚类分析6-8 试推导试推导Ward法的距离递推公式法的距离递推公式(6.3.3);解:解:WardWard法把两类合并后增加的离差平方和看成法把两类合并后增加的离差平方和看成类间的平方距离类间的平方距离,即把类即把类Gp和和Gq的平方距离定义的平方距离定义为为利用利用Wr的定义的定义:147第六章第六章 聚类分析聚类分析148第六章第六章 聚类分析聚类分析149第六章第六章 聚类分析聚

44、类分析(当样品间的距离定义为欧氏距离时)当样品间的距离定义为欧氏距离时)记GrGp,Gq,则新类Gr与其它类Gk的平方距离为利用重心法的递推公式利用重心法的递推公式(6-7题已证明题已证明)可得:可得:150第六章第六章 聚类分析聚类分析151第六章第六章 聚类分析聚类分析6-9 设有设有5个样品个样品,对每个样品考察一个指标得数据为对每个样品考察一个指标得数据为1,2,5,7,10.试用离差平方和法求试用离差平方和法求5个样品分为个样品分为k类类(k5,4,3,2,1)的分类法的分类法bk及相应的总离差平方和及相应的总离差平方和W(k).解:解:计算样品间的欧氏平方距离阵计算样品间的欧氏平方

45、距离阵 合并合并 1,2 CL4,并类距离并类距离D1=(0.5)1/2=0.707,并,并利用递推公式计算新类与其它类的平方距离得利用递推公式计算新类与其它类的平方距离得152第六章第六章 聚类分析聚类分析合并合并 5,7 CL3,并类距离并类距离D2=(2)1/2=1.414,并利,并利用递推公式计算新类与其它类的平方距离得用递推公式计算新类与其它类的平方距离得 合并合并 CL3,10=5,7,10 CL2,并类距离并类距离D3=(32/3)1/2=3.266,并利用递推公式计算新类与其它,并利用递推公式计算新类与其它类的平方距离得类的平方距离得153第六章第六章 聚类分析聚类分析 合并合

46、并 CL4,CL2=1,2,5,7,10 CL1,并类距离并类距离D4=(245/6)1/2=6.39,并利用递推公式计算新类与其它类,并利用递推公式计算新类与其它类的平方距离得的平方距离得分类法分类法bk及相应的总离差平方和及相应的总离差平方和W(k):154应用多元统计分析应用多元统计分析第七章习题解答第七章习题解答1557-1第七章第七章 主成分分析主成分分析 设设X=(X1,X2)的协方差阵的协方差阵试从试从和相关阵和相关阵R出发求出总体主成分,出发求出总体主成分,并加以比较并加以比较.解解:156第七章第七章 主成分分析主成分分析157第七章第七章 主成分分析主成分分析158第七章第

47、七章 主成分分析主成分分析7-2 设设X=(X1,X2)N2(0,),协方差协方差其中其中为为X1和和X2的相关系数的相关系数(0).(1)试从试从出发求出发求X的两个总体主成分;的两个总体主成分;(2)求求X的等概密度椭园的主轴方向;的等概密度椭园的主轴方向;(3)试问当试问当取多大时才能使第一主成分的贡献率达取多大时才能使第一主成分的贡献率达95%以上以上.解解:159第七章第七章 主成分分析主成分分析1607-3第七章第七章 主成分分析主成分分析 设设p维总体维总体X的协差阵为的协差阵为(1)试证明总体的第一主成分试证明总体的第一主成分(2)试求第一主成分的贡献率试求第一主成分的贡献率.

48、161第七章第七章 主成分分析主成分分析 解解:11627-4第七章第七章 主成分分析主成分分析解解:设总体设总体X(X1,Xp)Np(,)(0),等概率密度等概率密度 椭球为椭球为 (X-)-1(X-)=C2(C为常数为常数).试问椭球的主轴方向是什么试问椭球的主轴方向是什么?1637-5第七章第七章 主成分分析主成分分析 设设3维总体维总体X的协差阵为的协差阵为试求总体主成分试求总体主成分.解解:总体主成分为总体主成分为主成分向量为主成分向量为三个主成分的方差分别为三个主成分的方差分别为4,4,2.164第七章第七章 主成分分析主成分分析 7-6 设设3维总体维总体X的协差阵为的协差阵为试

49、求总体主成分,并计算每个主成分解释的方差比例试求总体主成分,并计算每个主成分解释的方差比例解解:1657-7第七章第七章 主成分分析主成分分析设设4维随机向量维随机向量X的协差阵是的协差阵是试求试求X的主成分的主成分.其中其中166第七章第七章 主成分分析主成分分析解解:1677-8第七章第七章 主成分分析主成分分析168第七章第七章 主成分分析主成分分析1697-9第七章第七章 主成分分析主成分分析170第七章第七章 主成分分析主成分分析1717-10第七章第七章 主成分分析主成分分析1727-117-12第七章第七章 主成分分析主成分分析173结束语结束语谢谢大家聆听!谢谢大家聆听!174

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁