《SPSS第10章主成分分析和因子分析.ppt》由会员分享,可在线阅读,更多相关《SPSS第10章主成分分析和因子分析.ppt(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、西南财经大学出版社 SPSS16.0与统计数据分析第十章主成分分析和因子分析1西南财经大学出版社 SPSS16.0与统计数据分析主要内容主要内容11.1 主成分析主成分析12.2 因子分析因子分析2西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析(1)基本概念 主成分分析(Principal Component Analysis)就是考虑各指标之间的相互关系,利用降维的方法将多个指标转换为少数几个互不相关的指标,从而使进一步研究变得简单的一种统计方法。主成分分析是由Hotelling于1933年首先提出的,是利用“降维”的思想,在损失很少信息的前提下把多个指标转化为
2、几个综合指标,称为主成分。分类变量和连续变量均可以参与两步聚类分析。每个主成分均是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。主成分分析不能看作是研究的结果,而应该在主成分分析的基础上继续采用其他多元统计方法来解决实际问题。3西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析(2)统计原理 第i个主成分:设第k个主成分的方差占总方差的比例为 ,则有:主成分的计算公式为:4西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析(3)分析步骤第1步 原始数据的标准化处理;第2步 计算相关系数矩阵;第3步
3、 计算特征值及单位特征向量;第4步 计算主成分的方差贡献率和累计方差贡献率;第5步 计算主成分。5西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析(4)SPSS实现举例【例11-1】为了从总体上反映世界经济全球化的状况,现选择了具有代表性的16个国家的数据,这些国家参与经济全球化程度指标值见下表。试对其进行主成分分析。编号国家x1x2x3x4x5x6x7x8x9x10 x11x12x13x14x151中国3.20554.528.530.8781.4090.89411.62.3050.5472.9324.8189.0032.73.9141.4722印度1.44931.
4、10.2790.3390.2720.12.70.1280.1930.8252.3185.1270.640.2183日本14.07952.30.65310.25411.7691.09701.9671.36.17814.74627.29730.957.73415.1254韩国1.318136.31.0111.60.421.8381.30.770.782.26723.3242.8759.112.1290.4525新加坡0.275739.53.57227.8410.88413.31428.60.6220.1431.885169.772 319.90754.2917.3280.7186美国29.6414
5、6.13.6826.42920.5634.8085.424.25329.94115.63810.78424.55513.624.49521.2747加拿大2.056101.50.8988.2762.3135.36910.52.4445.1453.85434.69167.04715.121.831.3628巴西2.43427.11.5842.3270.9622.9056.81.9532.30.8574.71610.1016.75.4981.1049墨西哥1.567151.41.6572.8370.7971.47110.90.670.2122.18618.48537.9864.54.8870.46
6、810英国4.67118.40.49726.15112.45622.13711.216.55219.6425.54228.43458.766.1278.96811.28911法国4.639120.61.849.2424.49210.8488.58.2825.8415.2128.4654.05229.256.4538.88912德国6.84132.92.2529.5586.6467.7472.28.5898.9718.84332.12163.1743651.51412.1813意大利3.792104.50.3218.1533.7241.0592.50.771.9134.03222.86943.9
7、242717.7765.67814俄罗斯1.358.61.5331.4990.5520.4992.50.310.2980.9877.7712.5811.12.0010.46915澳大利亚1.30994.50.5025.7730.9411.98718.90.5271.3711.13115.74533.79513.224.1170.79716新西兰0.177110.50.2187.3740.1793.0431.50.1260.3380.24823.22147.38719.841.2740.2156西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析第1步 分析:根据题目要求
8、,需进行主成分分析。第2步 数据组织:按如上表所示的“指标”一列定义变量,输入数据并保存;第3步 主成分分析的设置,主要如下两图所示。7西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析第4步 因子分析的结果;u特征值与方差贡献表 ComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal%of VarianceCumulative%Total%of VarianceCumulative%16.04940.32540.3256.04940.32540.32525.81338.75579.08
9、05.81338.75579.08031.1427.61686.6961.1427.61686.6964.8765.84292.5385.5993.99696.5346.3262.17498.7097.119.79699.5058.041.27299.7769.018.12199.89710.010.06399.96111.004.02799.98812.001.00999.99713.000.00299.99914.000.001100.000154.080E-72.720E-6100.000Extraction Method:Principal Component Analysis.从表中
10、可以看出前3个主成分已经解释了总方差的近86.7%,故可以选择前3个主成分进行分析。8西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析 u主成分的碎石图该图从另一个侧面说明了取前三个主成分为宜。9西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析 u旋转前的因子载荷矩阵Component123x1.407.805.268x2.596-.727.209x3-.147.016.821x4.895-.333-.181x5.614.763.028x6.826-.124-.281x7.273-.627.184x8.636.703.041x9.619.
11、703.008x10.552.766.196x11.654-.691.172x12.666-.685.166x13.863-.191-.297x14.728-.632.144x15.579.760.005Extraction Method:Principal Component Analysis.a.3 components extracted.10西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析 第5步 利用因子分析的结果进行主成分分析:上表是旋转前的因子载荷矩阵,并不是主成分分析中所需要的标准化的正交向量,要得到标准化正交向量还需作如下运算:l将上表因子载荷矩阵
12、中的数据输入SPSS数据编辑窗口中,将3个变量名分别命名为a1,a2和a3。l用公式 计算出标准化特征向量。其步骤为:打开Analyze Compute Variable,计算过程如下图所示。11西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析 l计算结束后得到的特征向量矩阵如下表所示。变量t1t2t3x10.170.330.25x20.24-0.300.20 x3-0.060.010.77x40.36-0.14-0.17x50.250.320.03x60.34-0.05-0.26x70.11-0.260.17x80.260.290.04x90.250.290.01
13、x100.220.320.18x110.27-0.290.16x120.27-0.280.16x130.35-0.08-0.28x140.30-0.260.13x150.240.320.0012西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析 l对原始的数据变量进行标准化。由于是以相关系数矩阵为出发点进行因子分析的,所以主成分分析表达式中的变量应该是经过标准化的数据。l计算主成分:再通过表各个主成分所分析的方差百分比计算出综合得分函数,其公式为:13西南财经大学出版社 SPSS16.0与统计数据分析11.1 主成分析主成分析 l主成分及综合得分表:编号国家y1y2y
14、3y综1中国-2.190.073.01-0.632印度-2.56-0.11-0.46-1.113日本0.451.85-0.270.884韩国-1.69-0.46-0.27-0.885新加坡5.28-6.261.19-0.206美国3.306.071.463.807加拿大-0.43-0.47-0.31-0.388巴西-1.91-0.06-0.43-0.839墨西哥-1.68-0.680.03-0.9410英国4.460.98-1.752.0511法国0.870.46-0.520.4912德国1.401.34-0.261.0613意大利-0.610.10-0.54-0.2514俄罗斯-2.35-0
15、.20-0.30-1.0515澳大利亚-1.36-0.92-0.30-0.9316新西兰-0.99-1.73-0.28-1.0914西南财经大学出版社 SPSS16.0与统计数据分析主要内容主要内容11.1 主成分析主成分析11.2 因子分析因子分析15西南财经大学出版社 SPSS16.0与统计数据分析11.2 因子分析因子分析(1)基本概念 因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的分析方法,最早是由心理学家Chales Spearman在1904年提出的,它的基本思想是将实测的多个指标,用少数几个潜在的指标(因子)的线性组合表示。因子分析主要应用到两个方面:一是寻求
16、基本结构,简化观测系统;二是对变量或样本进行分类。因子分析的基本思想是根据相关性的大小把变量分组,使得同组内的变量的相关性较高,而不同组的变量相关性较低。每组变量代表一个基本结构,这个基本结构称为一个公共因子。16西南财经大学出版社 SPSS16.0与统计数据分析11.2 因子分析因子分析(2)统计原理 其中x1,x2,xp为p个原有变量,是均值为零,标准差为1的标准化变量,F1,F2,Fm为m个因子变量,m小于p,表示成矩阵形式为:17西南财经大学出版社 SPSS16.0与统计数据分析11.2 因子分析因子分析(3)分析步骤第1步 将原始数据进行标准化;第2步 确定待分析的原有若干变量是否适
17、合于因子分析;第3步 构造因子变量;第4步 利用旋转使得因子变量更具有可解释性;第5步 计算因子变量的得分。计算因子得分和模型为:j=1,2,m 18西南财经大学出版社 SPSS16.0与统计数据分析11.2 因子分析因子分析(4)SPSS实现举例【例11-2】为了研究几个省市的科技创新力问题,现取了2005年8个省市的15个科技指标数据,请对其进行因子分析。省市x1x2x3x4x5x6x7x8x9x10 x11x12x13x14x15北京 229 80.2648.524.49 3.55 5.55 10.23 44774.45 25.0224.1 779.24 226.01 34.42 318
18、3.29 2.12天冿8767.48 36.82 14.08 2.62 1.964.49 35451.77 33.59 21.38 410.34 73.15 25.06 495.78 1.82辽宁4465.69 35.948.342.32 1.562.4518974.2 11.295.57 263.35 22.32 15.21 204.98 1.78上海 104 74.06 35.98 17.84 4.78 2.284.851485.83 39.72 19.08 654.31 112.32 15.85 1303.322江苏5060.79 34.076.82.13 1.473.17 24489.
19、18 43.13 17.99 206.6816.69.14134.89 1.41浙江5363.48 31.085.423.95 1.221.83 27435.38 7.947.63 257.65 22.665.8279.011.72山东3064.59 33.224.441.81 1.051.59 20022.57 9.175.69117.739.768.41106.36 1.34广东3569.64 37.275.813.66 1.092.18 24327.32 35.67 24.99 117.5120.45.08122.33 1.4719西南财经大学出版社 SPSS16.0与统计数据分析11.
20、2 因子分析因子分析第1步 分析:如题所示,要求用因子分析法分析。第2步 数据组织:建立x1-x15共15个数据变量和一个“省市”字符型变量,将北京、天津等8个省市作为个案数据输入并保存。第3步 因子分析设置:20西南财经大学出版社 SPSS16.0与统计数据分析11.2 因子分析因子分析正交旋转设置:保存对话框设置:21西南财经大学出版社 SPSS16.0与统计数据分析11.2 因子分析因子分析第4步 主要结果及分析:u特征值与方差贡献表 ComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal%of Varia
21、nceCumulative%Total%of VarianceCumulative%16.04940.32540.3256.04940.32540.32525.81338.75579.0805.81338.75579.08031.1427.61686.6961.1427.61686.6964.8765.84292.5385.5993.99696.5346.3262.17498.7097.119.79699.5058.041.27299.7769.018.12199.89710.010.06399.96111.004.02799.98812.001.00999.99713.000.00299.9
22、9914.000.001100.000154.080E-72.720E-6100.000Extraction Method:Principal Component Analysis.可以看出前3个特征值大于1,同时这3个公共因子的方差贡献率占了93.924%,说明提取这3个公共因子可以解释原变量的绝大部分信息。22西南财经大学出版社 SPSS16.0与统计数据分析11.2 因子分析因子分析u旋转前的因子载荷矩阵在表的底部表明使用的是主成分分析法,3个主成分被抽取出来。Component123x1.973-.158.052x2.919.036-.090 x3.883-.161.334x4.985
23、-.004-.022x5.482.497-.664x6.947-.242.131x7.972-.108.178x8.849.340-.301x9.300.834.386x10.611.637.399x11.955.000-.211x12.992-.091-.001x13.876-.282.205x14.968-.156.032x15.859-.092-.385Extraction Method:Principal Component Analysis.a.3 components extracted.23西南财经大学出版社 SPSS16.0与统计数据分析11.2 因子分析因子分析u旋转后的因子
24、载荷矩阵从旋转后的因子载荷矩阵可以看出。因子1在1、3、4、6、7、12、13、14上有较大的载荷,反映科技投入与产出情况,可以命名为创新水平因子。因子2在指标5、8和15上有较大载荷,反映地区经济发展及财政科教投入水平,可以命名创新环境因子,因子3在指标9和指标10上有较大的载荷,可以命名为高技术产业发展因子。Component123x1.936.286.130 x2.776.459.202x3.924.016.251x4.867.413.221x5.068.940.180 x6.966.177.095x7.944.202.235x8.541.726.327x9.018.137.956x10
25、.377.172.876x11.794.558.118x12.913.365.161x13.937.071.084x14.926.301.119x15.705.626-.069Extraction Method:Principal Component Analysis.Rotation Method:Varimax with Kaiser Normalization.a.Rotation converged in 5 iterations.24西南财经大学出版社 SPSS16.0与统计数据分析11.2 因子分析因子分析u因子转换矩阵表明了因子提取的方法是主成分分析,旋转的方法是方差极大法。Co
26、mponent1231.884.403.2392-.405.400.8223.236-.823.517Extraction Method:Principal Component Analysis.Rotation Method:Varimax with Kaiser Normalization.u因子得分及综合因子得分情况:通过以下函数计算得出综合因子得分情况。省市F1F2F3F综合排序山东 -0.344-1.001-0.945-0.5368浙江 -0.7910.905-1.223-0.4737江苏 -0.488-1.0241.073-0.3426广东 -0.791-0.1041.202-0.3275辽宁 -0.002-0.500-1.206-0.2694天冿 0.248-0.2750.5720.1773上海 -0.1361.9470.4810.3662北京 2.3050.0530.0451.406125