《主成分分析应用实例.doc》由会员分享,可在线阅读,更多相关《主成分分析应用实例.doc(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、主成分分析应用实例应用实例对全国30个省市自治区经济发展基本情况的8项指标作主成分分析,数据见程序中。其中八个指标依次为GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。SAS程序如下:data a1;input diqu $ x1x8;cards;北京 1394.892505519.018144373。9117.3112.6843。43天津 920。112720345。466501342.8115.2110。6582.51河北 2849。521258704.8748392033。3115.2115.81234。85山西 1092。4
2、81250290。94721717.3116.9115。6697.25内蒙 832.881387250。234134781。7117.5116.8419。39辽宁 2793。372397387.9949111371。1116。11141840。55吉林 1129。21872320。454430497。4115。2114。2762。47黑龙江 2014.532334435。734145824。8116。1114。31240。37上海 2462。575343996。489279207。4118.71131642。95江苏 5155.2519261434.9559431025。5115。8114.3
3、2026。64浙江 3524。7922491006。396619754。4116.6113。5916.59安徽 2003.5812544744609908。3114。8112.7824。14福建 2160.522320553.975857609。3115。2114。4433。67江西 1205.111182282。844211411.7116。9115.9571.84山东 5002.3415271229.5551451196.6117。6114。22207.69河南 3002。741034670。3543441574.4116。5114.91367.92湖北 2391。421527571。68
4、4685849120116。61220.72湖南 2195.71408422.6147971011.8119115.5843.83广东 5381.7226991639。838250656。5114111.61396.35广西 1606。151314382.595150556118。4116。4554.97海南 364。171814198.355340232。1113.5111.364.33四川 35341261822。544645902。3118.51171431.81贵州 630。07942150.844475301.1121。4117.2324.72云南 1206.681261334514
5、9310.4121.3118。1716.65西藏 55.98111017.8773824.2117。3114。95.57陕西 1000。031208300。274396500.9119117600.98甘肃 553。351007114。815493507119.8116。5468。79青海 165.31144547.76575361。6118116.3105。8宁夏 169。75135561。985079121。8117.1115.3114。4新疆 834.571469376.965348339119.7116.7428。76;proc princomp data=a1 n=4 out=w1
6、outstat=w2;var x1-x8;proc sort data=w1;by descending prin1;proc print data=w1;run;结果分析:(1)相关系数矩阵由相关系数矩阵可以看出,有较强相关性的变量依次为:GDP(x1)与固定资产投资(x2)之间的相关系数为0.9506;GDP(x1)与工业总产值(x8)之间的相关系数为:0。8734;固定资产投资(x3)与工业总产值(x8)之间的相关系数为0.7919;居民消费价格指数(x6)与商品零售价格指数(x7)之间的相关系数为0.7628;货物周转量(x5)与工业总产值(x8)之间的相关系数为0.6586。(2)相
7、关系数矩阵特征值相关系数矩阵的特征值即各主成分的方差,由它可以看出,第一主成分对方差的贡献率为46。93,第二主成分对方差的贡献率为27.6%,第三主成分对方差的贡献率为15。19%,第四主成分对方差的贡献率为5。03%。因前三个主成分的累积贡献率为89.58,故用前三个主成分就可以很好的概括此组数据。(3)特征向量由此可写出前三个主成分的表达式:Prin1=Prin2=Prin3=可见,第一主成分中的系数较大;第二主成分中具有较大的正系数,则具有较大的负系数;第三主成分中的系数最大,远远超过其他指标的影响。因此可以把第一主成分看成是由固定资产投资、居民消费水平、GDP、工业总产值所刻画的反映经济发展水平的综合指标;把第二主成分看成是由货物周转量、商品零售价格指数所刻画的与人民生活水平有关的综合指标;把第三主成分单独看成是居民消费价格指数的影响指标。(4)按第一主成分排序结果