典型相关与对应分析7.1典型相关分析7.2对应分析.ppt

上传人:wuy****n92 文档编号:74764303 上传时间:2023-02-28 格式:PPT 页数:90 大小:468KB
返回 下载 相关 举报
典型相关与对应分析7.1典型相关分析7.2对应分析.ppt_第1页
第1页 / 共90页
典型相关与对应分析7.1典型相关分析7.2对应分析.ppt_第2页
第2页 / 共90页
点击查看更多>>
资源描述

《典型相关与对应分析7.1典型相关分析7.2对应分析.ppt》由会员分享,可在线阅读,更多相关《典型相关与对应分析7.1典型相关分析7.2对应分析.ppt(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程第七章 典型相关与对应分析n7.1 典型相关分析典型相关分析n7.2 对应分析对应分析SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程n7.1 7.1 典型相关分析典型相关分析n7.1.1 典型相关分析的概念与步骤典型相关分析的概念与步骤n7.1.2 用用INSIGHT模块实现典型相关分析模块实现典型相关分析n7.1.3 用用“分析家分析家”实现典型相关分析实现典型相关分析n7.1.4 用用CANCORR过程实现典型相关分析过程实现典型相关分析SASSASSASSASSASSAS软件与统计应用教程软

2、件与统计应用教程7.1.1 典型相关分析的概念与步骤典型相关分析的概念与步骤1.1.典型相关分析的基本思想典型相关分析的基本思想 典典型型相相关关分分析析采采用用主主成成分分的的思思想想浓浓缩缩信信息息,根根据据变变量量间间的的相相关关关关系系,寻寻找找少少数数几几对对综综合合变变量量(实实际际观观测测变变量量的的线线性性组组合合),用用它它们们替替代代原原始始观观测测变变量量,从从而而将将二二组组变变量量的的关关系系集集中中到到少少数数几几对对综综合合变变量量的的关关系系上上,通通过过对对这这些些综综合合变变量量之之间间相相关关性性的的分分析析,回回答答两两组组原原始始变变量量间间相相关关性

3、性的的问问题题。除除了了要要求求所所提提取取的的综综合合变变量量所所含含的的信信息息量量尽尽可可能能大大以以外外,提提取取时时还还要要求求第第一一对对综综合合变变量量间间的的相相关性最大,第二对次之,依次类推。关性最大,第二对次之,依次类推。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 这这些些综综合合变变量量被被称称为为典典型型变变量量,或或典典则则变变量量,第第1对对典典型型变变量量间间的的相相关关系系数数则则被被称称为为第第1典典型型相相关关系系数数。典典型型相相关关系系数数能能简简单单、完完整整地地描描述述两两组组变变量量间间关关系系的的指指标标。当当两两个

4、个变变量量组组均均只只有有一一个个变变量量时时,典典型型相相关关系系数数即即为为简简单单相相关关系系数数;当当其其中中的的一一组组只只有有一一个个变变量量时时,典典型型相相关关系数即为复相关系数。系数即为复相关系数。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程2.2.典型相关系数与典型相关变量典型相关系数与典型相关变量 设设X=(X1,X2,Xp),Y=(Y1,Y2,Yq)是是两两个个随随机机向向量量。利利用用主主成成分分思思想想寻寻找找第第i对对典典型型相相关关变变量量(Ui,Vi):Ui=ai1X1+ai2X2+aipXp=aiXVi=bi1Y1+bi2Y2+b

5、iqYq=biYi=1,2,m=min(p,q);称称ai和和bi为为(第第i对对)典典型变量系数或典型权重。型变量系数或典型权重。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 记第一对典型相关变量间的典型相关系数为:记第一对典型相关变量间的典型相关系数为:CanR1=Corr(U1,V1)(使(使U1与与V1间最大相关);间最大相关);第二对典型相关变量间的典型相关系数为:第二对典型相关变量间的典型相关系数为:CanR2=Corr(U2,V2)(与与U1、V1无无关关;使使U2与与V2间间最最大相关)大相关)第第m对典型相关变量间的典型相关系数为:对典型相关变量间

6、的典型相关系数为:CanRm=Corr(Um,Vm)(与与U1,V1,Um1,Vm1无关;无关;Um与与Vm间最大相关)间最大相关)SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程3.3.典型相关变量的性质典型相关变量的性质 各各对对典典型型相相关关变变量量所所包包括括的的相相关关信信息息互互不不交交叉叉,且且满满足:足:1)U1,U2,Um互互不不相相关关,V1,V2,Vm互互不不相关,即其相关系数为相关,即其相关系数为SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 2)同同一一对对典典型型相相关关变变量量Ui和和Vi之之间间的的相相关关系系

7、数数为为CanRi,不同对的典型相关变量之间互不相关,即:,不同对的典型相关变量之间互不相关,即:3)Ui和和Vi的均值为的均值为0,方差为,方差为1(i=1,m)。)。4)1 CanR1 CanR2 CanRm 0SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程4.4.典型相关系数的求解步骤典型相关系数的求解步骤 1)求求X,Y变量组的相关阵变量组的相关阵 R=;2)求矩阵求矩阵A=(R11)1R12(R22)1R21和和B=(R22)1R21(R11)1R12,可以证明可以证明A、B有相同的非零特征值;有相同的非零特征值;3)求求A或或B的的特特征征值值i与与Can

8、Ri,A或或B的的特特征征值值即即为为典典型相关系数的平方:型相关系数的平方:i=(CanRi)2,i=1,m。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 4)求求A、B关关于于i的的特特征征向向量量。设设ai为为A关关于于i的的特特征征向向量量,bi为为B关关于于i的的特特征征向向量量,则则ai和和bi为为(第第i对对)典典型变量系数。即第型变量系数。即第i对典型相关变量对典型相关变量(Ui,Vi):Ui=aiX*=ai1X1*+ai2X2*+aipXp*Vi=biY*=bi1Y1*+bi2Y2*+biqYq*i=1,2,m=min(p,q);其其中中X*,Y*

9、为为原原变变量量组组的标准化。的标准化。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程5.5.特征根特征根 E E1 1HH的的的的特特征征根根(eigenvalue)是是方方差差分分析析和和多多元元检检验验的的基础,特征根与典型相关系数之间的数量关系为:基础,特征根与典型相关系数之间的数量关系为:上上式式可可以以理理解解为为第第i对对典典型型变变量量表表示示观观测测变变量量总总方方差差作用的指标,它的值越大说明表示作用越大。作用的指标,它的值越大说明表示作用越大。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程6.6.典型相关系数的标准误典型

10、相关系数的标准误7.7.典型相关系数的假设检验典型相关系数的假设检验 典典型型相相关关系系数数的的假假设设检检验验包包括括对对全全部部总总体体典典型型相相关关系系数数的的检检验验和和对对部部分分总总体体典典型型相相关关系系数数的的检检验验。对对数数据据的的要求:要求:1)两个变量组均应服从多维正态分布:两个变量组均应服从多维正态分布:(X,Y)Np+q(,2)2)n p+qSASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程(1)全部总体典型相关系数为全部总体典型相关系数为0 H0:CanRi=0,i=1,m H1:至少有一个:至少有一个CanRi 0 检验的似然比统计量为

11、检验的似然比统计量为对于充分大的对于充分大的n,当,当H0成立时,统计量成立时,统计量近似服从自由度为近似服从自由度为pq的的 2分布。分布。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程(2)部分总体典型相关系数为部分总体典型相关系数为0 仅对较小的典型相关作检验:仅对较小的典型相关作检验:H0:CanRi=0,i=s,m,2 s m H1:至少有一个:至少有一个CanRi 0其检验的统计量为其检验的统计量为对于充分大的对于充分大的n,当,当H0成立时,统计量成立时,统计量近似服从自由度为近似服从自由度为(p k)(q k)的的 2分布。分布。SASSASSASSA

12、SSASSAS软件与统计应用教程软件与统计应用教程7.1.2 用用INSIGHT模块实现典型相关分析模块实现典型相关分析1.1.实例实例【例例7-1】1985年年中中国国28省省市市城城市市男男生生(1922岁岁)的的调调查查数数据据,见见表表7-1。其其中中6项项形形态态指指标标:身身高高(cm)、坐坐高高、体体重重(kg)、胸胸围围、肩肩宽宽、盆盆骨骨宽宽,分分别别记记为为x1,x2,x6;5项项机机能能指指标标:脉脉搏搏(次次/分分)、收收缩缩压压(mmHg)、舒舒张张压压(变变音音)、舒舒张张压压(消消音音)、肺肺活活量量(ml),分分别别记记为为y1,y2,y5。SASSASSASS

13、ASSASSAS软件与统计应用教程软件与统计应用教程表7-1 城市男生(1922岁)形态与机能调查数据设设表表中中数数据据已已经经存存放放在在数数据据集集Mylib.xtyjn中中,试试分分析析形形态指标和机能指标这两组变量间的相关性。态指标和机能指标这两组变量间的相关性。编号身高x1坐高x2体重x3胸围x4肩宽x5盆骨宽x6脉搏y1收缩压y2舒张压y3舒张压y4肺活量y51173.2893.6260.186.7238.9727.5175.3117.474.661.845082172.0992.8360.3887.3938.6227.8276.7120.177.166.244693171.46

14、92.7859.7485.5938.8327.4675.8121.875.265.443984170.0892.2558.0485.9238.3327.2976.1115.173.861.340685170.6192.3659.6787.4638.3827.1472.9119.477.567.1433916167.9490.9155.9786.6638.1727.1676.2110.968.556.8414117168.8291.356.0785.8737.6126.6777.2113.87157.5390518168.0291.2655.2885.6339.6628.0774.5117.27

15、463.8394319167.8790.9655.7984.9238.226.5374.3112.369.350.2419520168.1591.554.5684.8138.4427.3877.5117.475.363.6403921168.9991.5255.1186.2338.327.1477.7113.372.152.84238SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程2.2.分析设置分析设置 在在INSIGHT模块中打开数据集模块中打开数据集Mylib.xtyjn。1)选选择择菜菜单单“Analyze”“Multivariate(Y X)(多多元分析)元分

16、析)”,打开,打开“Multivariate(Y X)”对话框;对话框;2)将将6项项形形态态指指标标:x1至至 x6选选为为X变变量量,将将5项项机机能能指指标:标:y1至至 y5选为选为Y变量,如图变量,如图7-1左所示。左所示。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 3)单单击击“Output”按按钮钮,在在打打开开的的对对话话框框中中选选中中“Canonical Correlation Analysis(典典型型相相关关分分析析)”复复 选选 框框,单单 击击 下下 面面 的的“Canonical Correlation Options(典典型型相相关

17、关选选项项)”按按钮钮,打打开开“Canonical Correlation Options”对话框对话框,并按下图右所示设置。并按下图右所示设置。4)三次单击三次单击“OK”按钮,得到分析结果。按钮,得到分析结果。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程3.3.结果分析结果分析(1)典型相关系数典型相关系数 第第1典典型型相相关关系系数数为为0.939573,校校正正值值为为0.908276,标标准准误误差差为为0.026207,典典型型相相关关系系数数的的平平方方为为0.882797;第第2典典型型相相关关系系数数为为0.877842,校校正正值值为为0.8

18、42459,标标准准误误差差为为0.051294,典典型型相相关关系系数数的的平平方方为为0.770606,如如图所示。图所示。前前两两个个典典型型相相关关系系数数比比形形态态指指标标和和机机能能指指标标两两组组间间的的任何一个相关系数都大。任何一个相关系数都大。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程(2)典型变量所解释的变异典型变量所解释的变异 第第二二部部分分是是的的5个个特特征征根根(Eigenvalues),包包括括:特特征征根根、相相邻邻两两个个特特征征根根之之差差、特特征征根根所所占占方方差差信信息息量量的的比比例例和和累累积积方方差差信信息息量量

19、的的比比例例。从从中中可可以以看看出出,前前两两对对典典型型变变量量所所能能解解释释的的变变异异占占总总变变异异(方方差差)的的91.18%,如如图图7-4所所示示。其其它它三三个个典典型型相相关关变变量量的的作作用用很很小小,一共只解释了总变异的一共只解释了总变异的9%,可以不予考虑。,可以不予考虑。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程(3)典型相关系数的检验典型相关系数的检验 用用似似然然比比法法检检验验典典型型相相关关系系数数与与零零的的差差别别是是否否显显著著,其其原原假假设设为为小小于于此此对对典典型型变变量量典典型型相相关关系系数数的的所所有有典

20、典型型相相关关系系数数都都为为0,其其p值值依依次次为为0.0010,0.0509和和0.5089等等等等,如如图图7-5所所示示,说说明明前前两两对对典典型型相相关关系系数数基基本本具具有有显显著著意意义义(在在 0.0509的的显显著著水水平平下下)。因因此此,两两组组变变量量相相关关性性的的研研究究可可转转化化为为研研究究前前两两对对典典型型相相关关变变量量的相关性。的相关性。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程(4)典型相关结构典型相关结构 典典型型相相关关结结构构(下下图图)分分别别是是各各组组原原始始变变量量与与典典型型变变量量两两两两之之间间的

21、的相相关关系系数数矩矩阵阵。从从相相关关系系数数判判断断,形形态态指指标标中中除除x5(0.0514)、x6(0.2433)外外各各变变量量与与第第一一典典型型 变变 量量 间间 的的 相相 关关 性性 都都 比比 较较 高高,机机 能能 指指 标标 中中 除除 y2(0.0975)外外各各变变量量与与第第一一典典型型变变量量间间的的相相关关性性也也都都比比较高。较高。x5与与第第二二典典型型变变量量间间的的相相关关性性比比较较高高,y2与与第第二二典典型型变量间的相关性比较高。变量间的相关性比较高。y1与前两个典型变量的相关系数为负值。与前两个典型变量的相关系数为负值。SASSASSASSA

22、SSASSAS软件与统计应用教程软件与统计应用教程 说说明明,第第一一对对典典型型变变量量对对肩肩宽宽x5和和收收缩缩压压y2的的解解释释作作用不大。用不大。另另外外,从从形形态态指指标标组组的的变变量量和和机机能能指指标标组组的的典典型型变变量量之之间间,以以及及机机能能指指标标组组的的变变量量和和形形态态指指标标组组的的典典型型变变量量之之间间的的相相关关系系数数可可见见,各各组组变变量量与与前前两两对对典典型型变变量量之之间间均有较强的相关。均有较强的相关。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程(5)标准化变量的典型相关变量的系数标准化变量的典型相关变量

23、的系数 输输出出结结果果中中还还给给出出标标准准化化变变量量的的典典型型变变量量系系数数,如如图图所示。所示。来来自自机机能能指指标标的的第第一一典典型型变变量量CY1为为(原原始始变变量量的的右右上角带上角带“*”表示为标准化变量表示为标准化变量):CY1=0.071672y1*0.789642y2*+0.567178y3*+0.508332y4*+0.533496y5*容容易易看看出出,CY1主主要要代代表表了了舒舒张张压压变变音音、舒舒张张压压消消音音、肺活量等指标。肺活量等指标。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 来自形态指标的第一典型变量来自形态

24、指标的第一典型变量CX1为:为:CX1=0.4287x1*0.09696x2*0.16210 x3*+0.93745x4*+0.23498x5*0.18696x6*易知,易知,CX1主要代表了胸围、身高和肩宽等指标。主要代表了胸围、身高和肩宽等指标。关于第二典型变量有:关于第二典型变量有:CY2=0.026533y1*+1.213436y2*0.535038y3*0.186048y4*+0.455870y5*CX2=0.70270 x1*0.39985x2*+0.84359x3*0.99063x4*0.06829x5*+0.48310 x6*可可见见,CY2代代表表了了收收缩缩压压和和肺肺活活

25、量量等等指指标标;CX2代代表表了了身高、体重、盆骨宽等指标。身高、体重、盆骨宽等指标。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程(6)典型冗余分析典型冗余分析 典典型型冗冗余余分分析析(canonical redundancy analysis)表表明明,两两对对典典型型变变量量仍仍不不能能全全面面预预测测配配对对的的那那组组变变量量。来来自自形形态态指指标标的的标标准准方方差差被被对对方方两两个个典典型型变变量量(CY1、CY2)解解释释的的累累积积方方差差比比例例为为55.86%,来来自自机机能能指指标标的的标标准准方方差差被被对对方方两两个个典典型型变变量

26、量(CX1、CX2)解解释释的的累累积积方方差比例为差比例为44.61%,如图所示。,如图所示。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程7.1.3 用用“分析家分析家”实现典型相关分析实现典型相关分析1.1.实例实例【例例7-2】某某康康复复俱俱乐乐部部对对20名名中中年年人人测测量量了了3项项生生理理指指标标:体体重重(weight)、腰腰围围(waist)、脉脉搏搏(pulse)和和3项项运运动动指指标标:引引体体向向上上(chins)、起起坐坐次次数数(situps)、跳跳跃次数跃次数(jumps)。其数据列于表。其数据列于表7-2中。中。SASSASSA

27、SSASSASSAS软件与统计应用教程软件与统计应用教程表7-2 某康复俱乐部测量的生理指标和运动指标设设表表中中数数据据已已经经存存放放在在数数据据集集Mylib.slzb中中,试试分分析析生生理指标和运动指标这两组变量间的相关性。理指标和运动指标这两组变量间的相关性。编号体重weight腰围waist脉搏pulse引体向上chins起坐次数situps跳跃次数jumpsl191365051626021893752211060319338581210110141623562121053751893546131555861823656410142131543464142151051424746

28、501505015193364667031162023762122101201717637544602518157325211230801915633541522573201383368211043SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程2.2.分析设置分析设置 1)在在“分析家分析家”中打开数据集中打开数据集Mylib.slzb;2)选选择择菜菜单单“Statistics(统统计计)”“Multivariate(多多 元元 分分 析析)”“Canonical Correlation(典典型型相相关关分分析析)”,打打开开“Canonical Correlati

29、on”对话框;对话框;3)在在对对话话框框中中将将生生理理指指标标选选为为Set1,运运动动指指标标选选为为Set2,如图所示。,如图所示。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 4)单单 击击“Statistics(统统 计计)”按按 钮钮,打打 开开“Canonical Correlation:Statistics”对话框;对话框;选选中中“Canonical redundancy statistics”复复选选框框,并并选选择择3个个典典型型变变量量,如如图图所所示示。两两次次单单击击“OK”按按钮钮,得得到计算结果。到计算结果。SASSASSASSAS

30、SASSAS软件与统计应用教程软件与统计应用教程3.3.结果分析结果分析(1)典型相关系数及显著性检验典型相关系数及显著性检验 第第一一部部分分的的4列列依依次次是是:典典型型相相关关系系数数、校校正正的的典典型型相相关关系系数数、近近似似的的标标准准误误以以及及典典型型相相关关系系数数的的平平方方。从从图图7-10中中可可以以看看出出,本本例例提提取取了了3个个典典型型相相关关系系数数,第第一一个个典典型型相相关关系系数数CanR1=0.795608,其其校校正正值值为为0.754056,标标准准误误为为0.084197,CanR12=0.632992,第第一一典典型型相相关关系系数数表表示

31、示的的是是第第一一对对典典型型相相关关变变量量之之间间的的相相关关性性。第第二二个个典典型型相相关关系系数数为为0.200556,第第三三个个为为0.072570。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 第二部分是特征根以及相应的统计量,如图所示。第二部分是特征根以及相应的统计量,如图所示。可可以以看看出出,第第一一对对典典型型变变量量所所能能解解释释的的变变异异已已占占总总变变异异的的97.34%,其其它它两两个个典典型型相相关关变变量量的的作作用用很很小小,一一共只解释了总变异的共只解释了总变异的3%,可以不予考虑。,可以不予考虑。右右边边4列列给给出出对

32、对典典型型相相关关系系数数的的检检验验,结结果果表表明明,第第一一行行的的F值值2.05,p值值为为0.0635,在在0.07的的检检验验水水平平下下,应应拒拒绝绝原原假假设设,认认为为第第一一相相关关系系数数以以及及比比它它小小的的两两个个相相关关系系数数不不为为0;后后两两行行检检验验的的p值值都都远远大大于于显显著著水水平平0.05,故可以认为只有第一个典型相关系数不为,故可以认为只有第一个典型相关系数不为0。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 第第三三部部分分输输出出的的是是用用四四种种多多元元统统计计方方法法进进行行的的所所有有典典型型相相关关系

33、系数数均均为为0的的F检检验验结结果果,如如图图所所示示。四四种种方方法法中中一一般般参参照照Wilks Lambda检检验验的的结结果果。本本例例中中的的Wilks Lambda检检验验结结果果与与前前述述完完全全一一致致,表表明明至至少少有有一个典型相关系数在一个典型相关系数在=0.0635的显著水平下非的显著水平下非0。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程(2)典型变量系数与典型结构典型变量系数与典型结构 第第四四部部分分给给出出的的是是用用原原始始变变量量表表达达的的典典型型变变量量系系数数(典型权重典型权重),如图所示。,如图所示。因因6个个变变量

34、量没没有有使使用用相相同同单单位位进进行行测测量量,因因此此考考虑虑分分析标准化后的系数。析标准化后的系数。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 第第五五部部分分给给出出的的是是用用标标准准化化变变量量(对对原原始始变变量量标标准准化化)表达的典型变量系数,如图所示。表达的典型变量系数,如图所示。V1=0.7754 weight*+1.5793 waist*0.0591 pulse*它它近近似似地地是是waist*和和weight*的的加加权权差差,在在waist*上上权权重更大些。重更大些。V1在在pulse*上系数近似为上系数近似为0。W1=0.3495

35、 chins*1.0540 situps*+0.7164 jumps*它它在在situps*上上的的系系数数最最大大。这这一一对对典典型型变变量量主主要要是是反反映映waist*和和situps*的负相关关系。的负相关关系。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 第第六六部部分分为为典典型型结结构构,分分别别是是各各组组原原始始变变量量与与典典型型变变量两两之间的相关系数矩阵,如图所示。可以看出:量两两之间的相关系数矩阵,如图所示。可以看出:在在原原始始变变量量与与本本组组的的典典型型变变量量的的相相关关关关系系(典典型型载载荷荷)中中,生生理理指指标标的的典

36、典型型变变量量V1与与腰腰围围waist的的相相关关系系数数最最大大(0.9254),说说明明这这个个典典型型变变量量主主要要反反映映人人的的肥肥胖胖程程度度;运运动动指指标标的的典典型型变变量量W1与与起起坐坐次次数数situps和和引引体体向向上上次次数数chins有有较较大大的的负负相相关关关关系系(-0.7276,-0.8177),说说明明这个典型变量主要反映人不适合运动的程度。这个典型变量主要反映人不适合运动的程度。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 在在原原始始变变量量与与配配对对组组的的典典型型变变量量的的相相关关关关系系(典典型型交交叉叉载

37、载荷荷)的的分分析析结结果果中中,腰腰围围waist与与运运动动指指标标的的第第1典典型型变变量量W1的的相相关关性性较较强强,这这也也说说明明了了腰腰围围大大(体体形形较较胖胖)则则运运动动能能力力差差;起起坐坐次次数数和和引引体体向向上上与与生生理理指指标标的的第第1典典型型变变量量V1呈呈一一定定的的负负相相关关系系数数,说说明明人人的的体体形形肥肥胖胖程度对这两种运动能力有负面影响。程度对这两种运动能力有负面影响。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程(3)典型冗余分析典型冗余分析 第七部分给出典型冗余分析的结果第七部分给出典型冗余分析的结果 上上图图

38、是是变变量量的的原原始始方方差差通通过过它它的的典典型型变变量量和和配配对对的的典典型变量所解释的方差比例。型变量所解释的方差比例。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 下下图图是是变变量量的的标标准准化化方方差差通通过过它它的的典典型型变变量量和和配配对对的的典型变量所解释的方差比例。典型变量所解释的方差比例。图图中中看看出出,生生理理指指标标通通过过它它的的第第一一个个典典型型变变量量解解释释的的共共享享方方差差的的比比例例是是45.08,而而被被对对方方第第一一个个典典型型变变量量W1解解释释的的方方差差比比例例为为28.54%,其其比比值值28.54

39、/45.08=0.6330恰恰为为CanR2。运运动动指指标标通通过过它它的的第第一一个个典典型型变变量量解解释释的的共共享享方方差差的的比比例例是是40.81,而而被被对对方方个个典典型型变变量量V1解释的方差比例为解释的方差比例为25.84%,其比值也是,其比值也是0.6330。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 第第八八部部分分给给出出各各原原始始变变量量和和配配对对组组的的典典型型变变量量间间的的复复相相关关系系数数(Multiple Correlations)的的平平方方(图图7-18),即即原原始始变变量量与与典典型型变变量量的的判判定定系系数

40、数,如如weight与与第第1典典型型变变量量W1的的相相关关系系数数为为0.4938(见见图图7-15),则则其其复复相相关系数平方为关系数平方为0.49382=0.2438。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 由由复复相相关关系系数数的的平平方方可可看看出出,生生理理指指标标的的第第一一典典型型变变量量W1对对chins(0.3351)和和situps(0.4233)有有一一定定解解释释能能力力,但但对对jumps(0.0167)几几乎乎没没有有解解释释能能力力。而而来来自自运运动动指指标标的的第第一一典典型型变变量量V1对对waist(0.5421)

41、有有相相当当好好的的解解释释能能力力,对对weight(0.2438)较较差差,而而对对pulse(0.0701)几几乎乎没没有有解解释释能能力力。其其中中,运运动动指指标标的的第第一一典典型型变变量量对对生生理理指指标标中中的的腰腰围围指指标标解解释释能能力力最最强强,可可以以说说明明运运动动对对体体形形影影响响较较大大,加强体育锻炼可以减肥。加强体育锻炼可以减肥。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程7.1.4 用用CANCORR过程实现典型相关分析过程实现典型相关分析1.CANCORR1.CANCORR过程过程 CANCORR过程的常用语法格式如下:过程

42、的常用语法格式如下:PROC CANCORR;WITH;VAR;RUN;其其中中PROC CANCORR语语句句、WITH语语句句是是每每个个过过程程中必不可少的,其余语句可视情况使用。中必不可少的,其余语句可视情况使用。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 下面分别介绍各语句的用法和功能。下面分别介绍各语句的用法和功能。(1)PROC CANCORR语语句句:标标示示典典型型相相关关分分析析开开始始,可可以以规规定定输输入入输输出出数数据据集集,指指定定分分析析方方法法和和控控制制输输出出结结果果的的显显示示等等。语语句句中中可可设设置置的的常常用用选选项

43、项及及其其功功能能见见表表7-3。(2)VAR语语句句:列列出出要要进进行行典典型型相相关关分分析析的的第第一一组组变变量量,变变量量必必须须是是数数值值型型的的。如如果果VAR语语句句被被忽忽略略,所所有有未被其他语句提到的数值型变量都将被视为第一组变量。未被其他语句提到的数值型变量都将被视为第一组变量。(3)WITH语语句句:列列出出要要进进行行典典型型相相关关分分析析的的第第二二组组变变量量,变变量量必必须须是是数数值值型型的的。该该语语句句是是每每一一个个PROC CANCORR中必不可少的。中必不可少的。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程表7-3

44、 常用选项及其功能EDF=指定误差的自由度。EDF数为有效的观察值减1DATA=指定输入数据集的名字,可以是原始数据集,或用TYPE=CORR,COV,FACTOR,SSCP,UCORR,或者UCOV的数据集,如果省略则使用最新创建的数据集OUT=指定输出数据集的名字,输出包括原始数据及典型变量得分的数据集。当输入数据集的类型为CORR,COV,FACTOR,SSCP,UCORR,或者UCOV,就不能使用这个选项OUTSTAT=生成包含各种统计量的SAS数据集,包括典型相关系数和典型系数,以及你要求的多元回归统计量VNAME=为来自VAR语句中分析变量指定标签,作为标签的字符要用单引号引起来V

45、PREFIX=为来自VAR语句的典型变量指定前缀名,默认时典型变量命名为V1,V2,V3等WNAME=为来自WITH语句中的分析变量指定标签,作为标签的字符要用单引号引起来WPREFIX=为来自WITH语句中的典型变量指定前缀名,默认为W1,W2,W3等控制输出的选项ALL打印所有选择的输出CORR打印原始变量之间的相关系数NCAN=规定要输出典型变量的个数NOPRINT禁止所有的输出REDUNDANCY打印冗余度分析的结果SHORT除了典型相关和多元统计列表以外,禁止打印典型相关分析过程默认的输出SIMPLE打印均值、标准差等简单统计量SASSASSASSASSASSAS软件与统计应用教程软

46、件与统计应用教程2.2.使用使用CANCORRCANCORR过程过程【例例7-3】家家庭庭特特征征与与家家庭庭消消费费之之间间的的关关系系。为为了了了了解解家家庭庭的的特特征征与与其其消消费费模模式式之之间间的的关关系系。调调查查了了70个个家家庭庭的下面两组变量:的下面两组变量:x1:每每年年去去餐餐馆馆就就餐餐的的频频率率,x2:每每年年外外出出看看电电影影的的频率;频率;y1:户户主主的的年年龄龄,y2:家家庭庭的的年年收收入入,y3:户户主主受受教教育程度。育程度。试试分分析析两两组组变变量量之之间间的的关关系系。假假定定变变量量的的相相关关系系数阵如表所示。数阵如表所示。x1x2y1

47、y2y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 如下代码,利用变量的相关系数矩阵作典型相关分析:如下代码,利用变量的相关系数矩阵作典型相关分析:DATA jt(TYPE=CORR);INPUT NAME$1-2(X1 X2 Y1-Y3)(6.);CARDS;X1 1.00 0.80 0.26 0.67 0.34X2 0.80 1.00 0.33

48、 0.59 0.34Y1 0.26 0.33 1.00 0.37 0.21Y2 0.67 0.59 0.37 1.00 0.35Y3 0.34 0.34 0.21 0.35 1.00;PROC CANCORR EDF=70 REDUNDANCY;VAR X1 X2;WITH Y1-Y3;RUN;SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 说明:说明:1)在在数数据据集集名名jt后后用用TYPE=CORR表表明明数数据据的的类类型型为相关矩阵,而不是原始数据。为相关矩阵,而不是原始数据。2)INPUT语语句句中中用用“NAME$”读读取取左左侧侧的的变变量量名名,“

49、1-2”表表示示变变量量名名的的字字符符落落在在第第1、2列列上上,“(X1 X2 Y1-Y4)”表表示示各各列列数数据据所所对对应应的的变变量量名名,“(6.)”表表示示读读取取数数据据的的宽宽度度均均为为6列列,其其中中相相关关系系数数占占4位位,其其后后的的空格占空格占2位;位;SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程 3)选选择择项项EDF=n 1,为为典典型型相相关关分分析析提提供供一一个个计计算算误误差差自自由由度度的的参参考考值值,因因为为该该过过程程中中没没有有合合适适的的选选择择项项可可以以将将原原始始数数据据的的样样本本含含量量n准准确确地地

50、送送入入。如如果果忽忽略略这这一一选选择择项项,将将以以缺缺省省值值n=10000作作为为样样本本含含量量参参与与有关计算和统计检验,显然不妥;有关计算和统计检验,显然不妥;4)选选项项REDUNDANCY表表示示输输出出典典型型冗冗余余分分析析的的结结果。果。SASSASSASSASSASSAS软件与统计应用教程软件与统计应用教程3.3.结果分析结果分析(1)典型相关系数及显著性检验典型相关系数及显著性检验 第第一一部部分分的的4列列依依次次是是:典典型型相相关关系系数数、校校正正的的典典型型相相关关系系数数、近近似似的的标标准准误误以以及及典典型型决决定定系系数数(典典型型相相关关系系数数

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁