《典型相关分析.ppt》由会员分享,可在线阅读,更多相关《典型相关分析.ppt(86页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、典型相关分析1一、典型相关分析的原理一、典型相关分析的原理X1 y1 X2 r1 X3 r2X4 r3X5 y3x6U1U2U3V1V2V32典型相关分析是研究两组变量之间相典型相关分析是研究两组变量之间相关关系的多元统计分析方法。关关系的多元统计分析方法。首先在每组变量中找出变量的线性组首先在每组变量中找出变量的线性组合,使其具有最大相关性,然后再在每组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与变量中找出第二对线性组合,使其分别与第一对线性组合不相关,而第二对本身具第一对线性组合不相关,而第二对本身具有最大的相关性,继续下去,直到两组变有最大的相关性,继续下去,
2、直到两组变量之间的相关性被提取完毕为止。量之间的相关性被提取完毕为止。3二、在二、在SPSSSPSS中如何进行典型相关中如何进行典型相关分析分析例1:生育状况与影响因素的相关分析X1-多孩率X2-综合节育率X3-初中以上受教育程度的人口比例X4-人均国民收入X5-城镇人口比例4在在SPSSSPSS中有一个命令文件中有一个命令文件CANONICAL CORRELATION.SPSCANONICAL CORRELATION.SPS 1.1.打开数据文件打开数据文件T3-2.SAVT3-2.SAV 2.2.在在FILEFILE中选中选NEW-SYNTAXNEW-SYNTAX 3.3.输入命令输入命令
3、INCLUDE C:PROGRAM FILESSPSSCANONICAL CORRELATION.SPS.CANCORR SET1=X1 TO X4/SET2=X5 TO X12.4.4.运行运行RUNRUN5三、典型相关系数三、典型相关系数典型相关系数是两个典型变量的简单相关系数,共有min(k1,k2)个。典型相关系数不是两组预测变量之间的相关,而是典型变式之间的相关。典型相关系数序号越靠前典型相关程度越高。6四、典型相关系数的显著性检验四、典型相关系数的显著性检验在分析结果中可以给出Wilks统计量和Chi-SQ统计量及Sig.,当其小于给定的显著性水平时,说明本行的典型变式之间的相关关
4、系显著。7五、典型系数五、典型系数典型系数是观测变量转换为典型变式的权数,相当于回归系数,典型系数共有2*min(k1,k2)套。典型系数有标准化的和未加工的,在分析时,一般用标准化的,类似于标准化回归系数。例:U1=-1.319X1-0.486X2 V1=0.997X3+0.292X4-0.274X58六、典型负载系数六、典型负载系数是典型变量与本组观测变量之间的简单相关系数。如U1、U2与X1、X2的简单相关系数为Canonical Loadings for Set-1 1 2X1 -.949 -.316 X2 .299 .8569七、交叉负载系数七、交叉负载系数是一组典型变量与另一组观测
5、变量之间的简单相关系数。如U1、U2与X3、X4、X5的简单相关系数为Cross Loadings for Set-2 1 2X3 .572 -.004 X4 .474 .009X5 .479 -.00410八、冗余分析八、冗余分析是典型变式对本组所有观测变量的总方差的代表比例,共有:第一组观测变量总方差中由本组变式代表的比例第一组观测变量总方差中由第二组变式解释的比例第二组观测变量总方差中由本组变式代表的比例第二组观测变量总方差中由第二组变式解释的比例11例二:全国省市自治区农村居民收入与支出例二:全国省市自治区农村居民收入与支出的典型相关分析的典型相关分析农村居民收入:农村居民收入:X1-
6、劳动者报酬、劳动者报酬、X2-家庭经营收入家庭经营收入X3-转移性收入、转移性收入、X4-财产性收入财产性收入农村居民生活费支出:农村居民生活费支出:X5-食品支出、食品支出、X6-衣着支出衣着支出X7-居住支出居住支出X8-家庭设备及服务支出家庭设备及服务支出X9-医疗保健支出医疗保健支出X10-交通和通讯支出交通和通讯支出X11-文教、娱乐及服务支出文教、娱乐及服务支出X12-其它商品及服务支出其它商品及服务支出12要 点典型相关分析的数学表达方式,假定条件;典型相关系数的数学含义;典型变量系数的数学含义;简单相关,复相关和典型相关的意义;典型相关的应用13 一、什么是典型相关分析及基本思
7、想一、什么是典型相关分析及基本思想 通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。14 在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标 和P个原材料的指标 之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。15例 家庭特征与家庭消费之间
8、的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。16X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵17y2y3y1x2x118 典型相关分析的思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,19 然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。u2和v2
9、与u1和v1相互独立,但u2和v2相关。如此继续下去,直至进行到r步,两组变量的相关性被提取完为止。rmin(p,q),可以得到r组变量。20例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。21X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵22典型相关分析典型相关分析典型相典型相关系数关系数调整典型调
10、整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491923X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y组典型变量的系数V1V2Y1(年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.295624三、典型变量的性质1、同一组的典型变量之间互不相关 X组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:Y组的典型变量之间是相互独立的:组的
11、典型变量之间是相互独立的:因为特征向量之间是正交的。故252、不同组的典型变量之间相关性 不同组内一对典型变量之间的相关系数为:26同对则协方差为i,不同对则为零。27例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。28X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵29典型相关分析典型相关分析典型相典
12、型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491930X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y组典型变量的系数V1V2Y1(年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.295631典型变量的结构(相关系数)U1U2X10.9866-0.1632X20.88720.4614V1V2Y10.42110.84
13、64Y20.9822-0.1101Y30.51450.301332典型变量的结构(相关系数)V1V2X10.6787-0.0305X20.61040.0862U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.056333 两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入,u1和 v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;34 第二对典型变量中u2与x2的
14、相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度,u2和 v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。354、各组原始变量被典型变量所解释的方差X组原始变量被ui解释的方差比例X组原始变量被vi解释的方差比例y组原始变量被ui解释的方差比例y组原始变量被vi解释的方差比例36被典型变量解释的被典型变量解释的X组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方Y组典型变量解释组典型变量解
15、释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比例10.88030.88030.47330.41660.416620.11971.00000.03490.00420.420837被典型变量解释的被典型变量解释的Y组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方X组典型变量解释组典型变量解释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比例10.46890.46890.47330.22190.221920.27310.74200.03490.00950.231538 5、简单相关、复相关和典型相关之
16、间的关系 若p1且q1,则x和y的典型相关就是简单相关;若p1或q1,则x和y的典型相关就是复相关;39六、典型相关系数的检验典型相关分析是否恰当,应该取决于两组原变量之间是否相关,如果两组变量之间毫无相关性而言,则不应该作典型相关分析。用样本来估计总体的典型相关系数是否有误,需要进行检验。40H0:当前和后面的典型相关系数均为零当前和后面的典型相关系数均为零H1:至少当前的典型相关系数为零至少当前的典型相关系数为零LikelihoodRatioApproxFNumDFDenDFPrF10.508334981341.2346199900.000120.96508130180.838299960
17、.0001可见,前面两对典型变量的相关性是很强的。41职业满意度典型相关分析 某调查公司从一个大型零售公司随机调查了784人,测量了5个职业特性指标和7个职业满意变量。讨论 两组指标之间是否相联系。X组:Y组:X1用户反馈 Y1主管满意度X2任务重要性 Y2事业前景满意度X3任务多样性 Y3财政满意度X4任务特殊性 Y4工作强度满意度X5自主权 Y5公司地位满意度 Y6工作满意度 Y7总体满意度42X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.3
18、00.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.190.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.2
19、70.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.281.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.0043CanonicalCorrelationAnalysisAdjustedCanonicalCorrelationApproxCanonicalCo
20、rrelationSquaredStandardErrorCanonicalCorrelation10.5537060.5530730.0069340.30659120.2364040.2346890.0094420.05588730.119186.0.0098580.01420540.072228.0.0099480.00521750.057270.0.0099680.00328044LikelihoodRatioApproxFNumDFDenDFPrF10.63988477134.42373542018.150.000120.9228094133.82422434848.670.00013
21、0.9774354115.26341527578.390.000140.9915203010.65798199820.000150.9967201510.9600399920.0001当前和后面的典型相关系数均为零的检验45U1U2U3U4U5X10.42170.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392X组的典型变
22、量46V1V2V3V4V5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141Y组的典型变量47U1U2U3U4U5X10.82930.1093-0.4853-0.24
23、690.0611X20.7304-0.43660.20010.00210.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026X50.86060.26600.38860.1484-0.1246V1V2V3V4V5Y10.75640.04460.3395-0.1294-0.3370Y20.64390.3582-0.1717-0.3530-0.3335Y30.38720.0373-0.1767-0.53480.4148Y40.37720.7919-0.00540.28860.3341Y50.65320.10
24、840.2092-0.43760.4346Y60.8040-0.2416-0.23480.40520.1964Y70.50240.16280.4933-0.18900.0678原始变量与本组典型变量之间的相关系数48V1V2V3V4V5X10.45920.0258-0.0578-0.01780.0035X20.4044-0.10320.02390.00020.0278X30.4171-0.1102-0.01260.0218-0.0192X40.34110.0526-0.02450.04780.0173X50.47650.06290.04630.0107-0.0071U1U2U3U4U5Y10.
25、41880.01050.0405-0.0093-0.0193Y20.35650.0847-0.0205-0.0255-0.0191Y30.21440.0088-0.0211-0.03860.0238Y40.20880.1872-0.00060.02080.0191Y50.36170.02560.0249-0.03160.0249Y60.4452-0.0571-0.02800.02930.0112Y70.27820.03850.0588-0.01360.0039原始变量与对应组典型变量之间的相关系数49 可以看出,所有五个表示职业特性的变量与u1有大致相同的相关系数,u1视为形容职业特性的指标。
26、第一对典型变量的第二个成员v1与Y1,Y2,Y5,Y6有较大的相关系数,说明v1主要代表了主管满意度,事业前景满意度,公司地位满意度和工种满意度。而u1和v1之间的相关系数0.5537。50 CanonicalRedundancyAnalysisRawVarianceoftheVARVariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.58180.58180.17840.17
27、8420.10800.68980.00600.184430.09600.78580.00140.185840.12230.90810.00060.186450.09191.00000.00030.1867RawVarianceoftheWITHVariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.37210.37210.11410.114120.12220.49430.006
28、80.120930.07400.56830.00110.122040.12890.69720.00070.122650.10580.80300.00030.123051u1和v1解释的本组原始变量的比率:X组的原始变量被u1到u5解释了100%Y组的原始变量被v1到v5解释了80.3%X组的原始变量被u1到u4解释了90.81%Y组的原始变量被v1到v4解释了69.72%52房地产指标典型相关分析报告房地产指标典型相关分析报告在对房地产指标的典型相关分析中建立了如下的指标体系:X1:开发公司个数(个)X2:年平均职工人数(人)X3:自开始建设至本年底累计完成投资X4:本年完成投资 X5:施工房
29、屋面积(万平方米)Y1:经营总收入 Y2:土地转让收入Y3:商品房屋销售收入 Y4:房屋出租收入Y5:经营税金及附加 Y6:营业利润Y7:竣工房屋面积(万平方米)Y8:竣工房屋价值(万元)其中,X1-X5是反映房地产投入的变量,Y1-Y8是反映房地产产出的变量。数据来源于1999中国统计年鉴,选取了全国30个省市自治区的相应指标值(西藏和新疆两自治区因数据不全而删除53序号序号典型相关系数典型相关系数典典型型变变量量10.998716U1=-0.1769X1+0.0639X2+0.7264X3+0.3633X4+0.0053X5V1=2.5217Y1+0.1720Y2-1.7370Y3-0.1
30、993Y4-0.0886Y5-0.3747Y6-0.1016Y7+0.6610Y820.980640U2=0.3319X1+0.0785X2-3.3077X3+1.8943X4+1.2047X5V2=-2.0308Y1-0.2555Y2+0.3219Y3+0.4304Y4+1.4052Y5+0.4774Y6+2.0697Y7-1.8594Y830.916191U3=-1.1339X1-3.1176X2+1.2803X3-3.9436X4+6.7392X5V3=0.3990Y1-0.6098Y2-0.7852Y3-2.0872Y4+4.2927Y5-0.6167Y6-1.6135Y7+0.507
31、1Y840.757332U4=1.4478X1-1.7250X2-4.4766X3+8.1918X4+3.5963X5V4=-8.0531Y1-0.9941Y2-1.6221Y3-1.3311Y4+5.1584Y5+1.6818Y6-0.9464Y7+6.4783Y850.739978U5=-3.7387X1+2.3073X2-2.0488X3+1.8063X4+1.4170X5V5=4.7208Y1-0.3733Y2-4.4002Y3+3.1983Y4-4.2877Y5-1.8271Y6+1.5460Y8+0.9555Y954第一对典型变量中,U1主要受自开始建设至本年底累计完成投资影响,V
32、1主要受经营总收入和商品房屋销售收入影响;第二对典型变量中,U2主要受自开始建设至本年底累计完成投资、本年完成投资和施工房屋面积影响,V2主要受经营税金及附加、竣工房屋面积和竣工房屋价值影响:第三对典型变量中,U3受各个指标影响都较大,V4主要受房屋出租收入、经营税金及附加和竣工房屋面积的影响;第四对典型变量中,U4主要受本年完成投资的影响,V4主要受经营总收入和工房屋价值的影响。第五对典型变量中,U5主要受开发公司个数影响,V4主要受经营总收入、商品房屋销售收入、房屋出租收入和经营税金及附加影响。但注意到,第一对典型变量的方差贡献率已达92.20%,故保留第一对典型变量用作分析,从而达到降维
33、的目的。总的来说,房地产的投入变量主要受自开始建设至本年底累计完成投资影响,产出变量集中在经营总收入和商品房屋销售收入上。累计完成投资额与经营总收入,特别是商品房屋销售收入高度相关。55 典型相关分析的基本思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有最大相关性。如此下去,直至两组变量的相关性被提取完为止。本例想利用我国1999年城镇居民的家庭收入来源和消费性支出的数据了解我国居民消费构成及主要影响因素分析所用的数据来自:中国统计年鉴2000。我国居民消费构成及主要影响因素 56 收入
34、指标:X1可支配收入 X2实际收入 X3国有单位职工收入 X4集体单位职工收入 X5其他经济类型职工收入,X6转移收入 支出指标:Y1消费性支出 Y2食品 Y3衣着 Y4交通和通讯 Y5医疗和保健 Y6娱乐、教育、文化服务 Y7居住 57序号序号典型相关系数典型相关系数典型变量典型变量10.990174U1=0.9989X1+-0.0595X2+0.0776X3+0.0489X4-0.0931X5+0.0074X6V1=1.3263Y1-0.0270Y2-0.0005Y3-0.0769Y4-0.0717Y5-0.2031Y6-0.0219Y20.868704U2=-4.8668X1+0.126
35、4X2+1.9585X3+0.3299X4+1.4095X5+2.6453X6V2=-4.4920Y1+2.5421Y2+1.2480Y3-0.4621Y4+1.0443Y5+0.8610Y6+0.0586Y758由累计贡献率得知,第一组和第二组变量的累计贡献率已达到了97.56%,而且,这两组的系数和方差与其他组相比要大得多.即只需要前两组变量就已经可以解释全部信息的97.56%.在第一对典型变量中,U1主要受可支配收入的影响,V1主要受消费性支出的影响;可见实际收入对消费支出的影响远小于可支配收入的影响。居民消费主要依据其可支配收入而定。第二对典型变量中,U2主要受国有单位职工收入、其他经
36、济类型职工收入和转移收入的影响,V2主要受食品、衣着、医疗和保健的影响。59在此,可见我国集体单位的职工收入还不能够与国有甚至是其他经济类型的单位这职工收入相比,这也从一个侧面放反映了集体单位规模等方面的现状。再有就是我国居民食品和衣着方面的支出仍占了总支出的大部分,反映了我国居民总体收入水平还不够高;其次,医疗保健支出的比例比较大是可喜的,说明我国居民已经可以把部分精力放在了自己身体的调养上来,全国居民的总体健康状况在上升之中。让我们担忧的是在教育方面的支出所占比例太小,不符合现今世界发展对教育程度的要求。科技是第一生产力,如何提高国民的科技文化知识水平是当今的一大重点。在当代激烈的竞争中,
37、没有知识的支撑是不行的。60协整关系(cointegration)典型相关分析的应用典型相关分析的应用 -约翰森协整关系检验约翰森协整关系检验61 协整关系协整关系宏观经济变量的大多数,单个来观察的话,随着时间的推移它们呈现一种醉步(非平稳)的走势。如果把几个经济变量的走势图形放在一起观察的话,会发现它们的运动具有某种相似性(例如,消费和收入,进口和出口等)。这种现象的产生,引起了人们的兴趣,这种经济变量运动的相似性构成了协整概念的基础,62 定义(协整):设YtI(1),xtI(1)。如果存在常数b,使得YtbXt为I(0)(平稳时间序列)时,称Yt和Xt之间存在协整关系。上面提到当Yt和X
38、t均为非平稳时间序列Yt和Xt作回归时,要注意假相关问题的出现,但是当Yt和Xt之间存在协整关系时,不会产生这样的问题。一、两个变量间协整的检验一、两个变量间协整的检验 63 由协整的定义可以知道,协整的检验与单位根的检验分不开。关于协整关系的检验,这里只简单介绍一下利用回归残差进行检验的Engle-Granger方法(Engle and Granger8)具体步骤如下:第一步:设Yt和Xt之间存在以下的关系Yt=m+bXtut,用OLS对式作回归得到残差et。第二步:对残差et运用DF的单位根检验方法来判断ut的平稳性,如果得出utI(0)的结论,则称Yt和Xt之间存在协整关系。64二、多重
39、协整多重协整 当研究的变量在3个或3个以上时,我们仍然关心他们是否具有协整关系,即他们中构成协整关系的变量有几组。1、多重协整的基本理论、多重协整的基本理论设Yt是一个m维的非平稳时间序列65 当Yt是一个m维的非平稳时间序列I(1)时,如果存在某个mr的矩阵mr,mr 为列满秩。成为I(0)过程,则称Yt在mr上具有r个协整关系。使得6667通过适当的变换,等价的模型为其中:68例 一阶自回归的情形 我们以一个一阶自回归过程为例,来讨论关于 协整的问题。69当当0,即,即 ,则,则rank()=0容易得到容易得到Yt所有分量均为所有分量均为I(1),),且没有协整关系。且没有协整关系。70当
40、当0,即,即,且,且rank()=m,对方程,对方程 可见可见Yt本生就是平稳序列。本生就是平稳序列。因为其左边是平稳的序列,右边也应该是平稳序列,是满秩矩阵,故71 当当0,即,即,rank()=rm,根据线性代数的,根据线性代数的结论,有结论,有m r阶矩阵阶矩阵 和和 列满秩矩阵,使列满秩矩阵,使 有有 包含包含r个协整关系。个协整关系。该模型成为误差校正模型。协整关系,调整系数。72总结起来有三种情形:1、系数矩阵的秩为r时,Yt的分量间存在有r个协整组合,有m-r个组合仍为I(1)。2、当系数矩阵的秩为m时,Yt为I(0)向量。平稳的向量。3、当系数矩阵的秩为0时,Yt为I(1)向量
41、,且不存在任何协整关系。至此,我们已经发现,讨论多讨论多重协整关系的问题,归于讨论重协整关系的问题,归于讨论 的秩的问题。的秩的问题。73约翰森(Johansen)检验提供了确定协整变量个数的方法,其方法的理论基础是典型相关分析。2、协整变量的个数协整变量的个数 其中:74 的秩=r0是ut和 t中m对典型变量(线性组合)相关系数的平方。是ut和 t的协方差矩阵,如果ut和 t无相关关系,则S01=0。Johansen检验的思想就是检验ut和 t是否存在相关的典型变量和有几对相关性较大的典型变量。8081如果ut和 t无相关关系,S01=0,则 无协整关系,否则当很小时,支持备择假设,至少有一
42、个协整变量。82 检验的统计量 当H0:r=0的情形下,接受原假设,则没有协整关系,如果拒绝原假设,则要进行下一步检验,即检验r=1时的情形。H1:有2个协整关系,即在ut和vt中有2对典型变量相关性显著;H0:至多存在1个协整关系,即在ut和vt中有1对典型变量相关性显著;83检验的统计量为:当r=1的情形下,接受原假设,则仅有一个协整变量,如果拒绝原假设,则要进行下一步检验,即检验r=2时。与此类推,当r=k的情形下,接受原假设,则有k个协整变量,如果拒绝原假设,则要进行下一步检验,即检验r=k+1时情况。84(3)Johansen检验的实施 85 Johansen检验要求,协整方程有5种,上面的对话框左侧:序列y或协整方程种无确定趋势项或无截距项;序列y无截距项且协整方程只有截距项;序列y或协整方程中只有截距项;序列y无趋势项和在协整方程既有截距项也有趋势项;序列y有线性趋势且在协整方程既有截距项也有趋势项。86