《典型相关分析讲稿.ppt》由会员分享,可在线阅读,更多相关《典型相关分析讲稿.ppt(64页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、典型相关分析第一页,讲稿共六十四页哦第六章 典型相关分析n第一节 典型相关分析的基本原理n第二节 典型变量与典型相关系数的求法n第三节 典型相关系数的检验n第四节 典型相关分析的计算步骤n第五节 典型相关分析的SPSS实现第二页,讲稿共六十四页哦第一节 典型相关分析的基本原理n一、什么是典型相关分析n在对经济问题的研究和管理研究中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即两组变量之间的相关性。典型相关分析就是测度两组变量之间相关程度的一种多元统计方法。第三页,讲稿共六十四页哦n 通常情况下,为了研究两组变量n 的相关关系,可以用最原始的方法,分别计算两
2、组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。第四页,讲稿共六十四页哦二、典型相关分析的基本思想第五页,讲稿共六十四页哦三、典型相关分析的数学描述第六页,讲稿共六十四页哦第七页,讲稿共六十四页哦第八页,讲稿共六十四页哦第九页,讲稿共六十四页哦第十页,讲稿共六十四页哦四、典型相关分析的应用n典型相关分析的用途很广。在实际分析问题中,当我们面临两组多变量数据,并希望研究两组变量之间的关系时,就要用到典型相关分析。n例如,为了研究扩张性财政政策实施以后对宏
3、观经济发展的影响,就需要考察有关财政政策的一系列指标如财政支出总额的增长率、财政赤字增长率、国债发行额的增长率、税率降低率等与经济发展的一系列指标,如国内生产总值增长率、就业增长率、物价上涨率等两组变量之间的相关程度。n又如,为了研究宏观经济走势与股票市场走势之间的关系,就需要考察各种宏观经济指标如经济增长率、失业率、物价指数、进出口增长率等与各种反映股票市场状况的指标如股票价格指数、股票市场融资金额等两组变量之间的相关关系。n再如,工厂要考察所使用的原料的质量对所生产的产品的质量的影响,就需要对所生产产品的各种质量指标与所使用的原料的各种质量指标之间的相关关系进行测度。第十一页,讲稿共六十四
4、页哦第二节 典型变量与典型相关系数的求法n一、总体典型变量和典型相关系数第十二页,讲稿共六十四页哦第十三页,讲稿共六十四页哦第十四页,讲稿共六十四页哦第十五页,讲稿共六十四页哦第十六页,讲稿共六十四页哦第十七页,讲稿共六十四页哦第十八页,讲稿共六十四页哦第十九页,讲稿共六十四页哦第二十页,讲稿共六十四页哦第二十一页,讲稿共六十四页哦二、原始变理与变型变量之间的相关系数第二十二页,讲稿共六十四页哦第二十三页,讲稿共六十四页哦第二十四页,讲稿共六十四页哦三、样本典型相关变量和样本典型相关系数第二十五页,讲稿共六十四页哦第二十六页,讲稿共六十四页哦第二十七页,讲稿共六十四页哦第二十八页,讲稿共六十四
5、页哦第三节 典型相关系数的检验典型相关分析是否恰当,应该取决于两组原变量之间是否相关,如果两组变量之间毫无相关性而言,则不应该作典型相关分析。用样本来估计总体的典型相关系数是否有误,需要进行检验。(一)整体检验检验的统计量:第二十九页,讲稿共六十四页哦所以,两边同时求行列式,有事实上第三十页,讲稿共六十四页哦第三十一页,讲稿共六十四页哦 由于 所以若M的特征根为,则(l-M)的特征根为(1-)。根据矩阵行列式与特征根的关系,可得:第三十二页,讲稿共六十四页哦在原假设为真的情况下,检验的统计量 近似服从自由度为pq的2分布。在给定的显著性水平下,如果22(pq),则拒绝原假设,认为至少第一对典型
6、变量之间的相关性显著。第三十三页,讲稿共六十四页哦 依此类推,再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进行典型相关分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。第三十四页,讲稿共六十四页哦 若原假设H0被接受,则认为只有第二对典型变量是有用的;若原假设H0被拒绝,则认为第二对典型变量也是有用的,并进一步检验假设。(二)部分总体典型相关系数为零的检验第三十五页,讲稿共六十四页哦如此进行下去.直至对某个k第三十六页,讲稿共六十四页哦检验的统计量 近似服从自
7、由度为(p-k)(q-k)的2分布。在给定的显著性水平下,如果22(p-k)(q-k),则拒绝原假设,认为至少第k+1对典型变量之间的相关性显著。第三十七页,讲稿共六十四页哦第四节 典型相关分析的计算步骤 在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。第三十八页,讲稿共六十四页哦 1、假设有X组和Y组变量,样本容量为n。假设(X1,Y1),(X2,Y2),(Xn,Yn),观测值矩阵为:第三
8、十九页,讲稿共六十四页哦第四十页,讲稿共六十四页哦 2、计算特征根和特征向量 求M1和 M2的特征根 ,对应的特征向量 。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。第四十一页,讲稿共六十四页哦第五节 邮电业与国民经济的典型相关分析 第四十二页,讲稿共六十四页哦n二、数据分析n 我们将基于1995年到2007年我国国民经济数据(数据来自于中国统计年鉴),利用Stata软件来做邮电业和国民经济之间的典型相关分析。数据具体见表1.n我们将采用如下指标来衡量我国各年份的邮电业:采用下面的指标来衡量我国各年份的经济(单位都是万亿)第四十三页,讲稿共六十四页哦第四十四页,讲稿共六十四页
9、哦n.canon(x1-x4)(y1-y4)第四十五页,讲稿共六十四页哦n.canon(x1-x4)(y1-y4),test(1 2 3 4)第四十六页,讲稿共六十四页哦n用似然比法检验典型相关系数与零的差别是否显著,检验r1时,其零假设为r1以及小于r1的所有典型相关系数都为零;检验时r2,其零假设为r2以及小于r2的所有典型相关系数都为零,依此类推。所求的似然比统计量近似服从,其值说明第1和第2典型相关系数分别具有非常显著和显著的意义。第四十七页,讲稿共六十四页哦n.canon(x1-x4)(y1-y4),stdcoef第四十八页,讲稿共六十四页哦n从标准化变量出发的典型系数,对分析结果进
10、行整理。n样本资料是从1995到2007年,即样本数是13,第一组变量数p=4,第二组变量数q=4。从Stata分析结果看,4个典型相关系数分别为:r1=0.9984,r2=0.9512,r3=0.4436,r4=0.3556.经似然比检验的结果,前两对典型变量在0.05显著水平下显著相关。n前两对标准化的典型变量的线性组合是:第四十九页,讲稿共六十四页哦n对结果进行经济意义解释。第五十页,讲稿共六十四页哦第五十一页,讲稿共六十四页哦n.estat loading第五十二页,讲稿共六十四页哦n.findit canred.canred 1Canonical redundancy analysi
11、s for canonical correlation1Canonical correlation coefficient 0.9984Squared canonical correlation coefficient 0.9968own oppositeProportion of standardized variance variate variate of u variables with.0.6294 0.6274of v variables with.0.9901 0.9869.canred 2Canonical redundancy analysis for canonical c
12、orrelation2Canonical correlation coefficient 0.9512Squared canonical correlation coefficient 0.9048own oppositeProportion of standardized variance variate variate of u variables with.0.1745 0.1579of v variables with.0.0067 0.0061第五十三页,讲稿共六十四页哦n.predict u1,u corr(1)n .predict u2,u corr(2)n.predict v1
13、,v corr(1)n .predict v2,v corr(2)第五十四页,讲稿共六十四页哦第五节 利用SPSS进行典型相关分析n例:研究人口出生与受教育程度、生活水平等的相关,如表所示:X1 X2 X3 X4 X5 分别代表多孩率、综合节育率、初中及以上受教育程度的人口比例、人均国民收入和城镇人口比例。第五十五页,讲稿共六十四页哦数据准备第五十六页,讲稿共六十四页哦SPSS中没有现成的菜单可以做典型相关分析,需要使用语法窗口:第五十七页,讲稿共六十四页哦点击运行按纽ninclude c:program filesspsscanonical correlation.sps.ncancorr
14、set1=x1 x2n/set2=x3 x4 x5.第五十八页,讲稿共六十四页哦n两组变量内部的相关系数:输出结果:第五十九页,讲稿共六十四页哦n典型相关系数及其显著性检验:基本可以认为第一典型相关系数在10%水平上显著。第二典型相关系数不显著。故只分析第一典型相关系数。第六十页,讲稿共六十四页哦n典型变量的系数第六十一页,讲稿共六十四页哦n典型结构分析:Canonical loadings 表示一组原始变量与其相应的典型变量间的相关关系。Cross loadings 表示一组原始变量与其对立的典型变量间的相关关系。第六十二页,讲稿共六十四页哦n典型冗余分析:表示各典型变量对原始变量组整体的变差解释程度。来自出生指标的第一典型变量U1可解释相应的出生变量组的58.4%的组内方差,第二典型变量U2可以解释41.6%的组内方差。来自受教育和生活水平指标的第一典型变量V1可解释对立的出生变量组的19.54%的组内方差,第二典型V2变量可以解释0%的组内方差。来自受教育和生活水平指标的第一典型变量V1可解释相应的变量组的78.0%的组内方差,第二典型变量V2可以解释5.3%的组内方差。可见第二典型变量的解释能力不够强。第六十三页,讲稿共六十四页哦第六十四页,讲稿共六十四页哦