《主成分分析的SPSS实现课件.ppt》由会员分享,可在线阅读,更多相关《主成分分析的SPSS实现课件.ppt(77页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、用用SPSSSPSS作主成分分析作主成分分析以城镇居民消费支出资料为例,用主成分分析法对各省、市作综合评价(spssex-2/城镇居民消费支出的主成分分析)以经济效益数据为例,用主成分分析法对各企业作综合评价(spssex-2/企业经济效益的主成分分析)主成分分析法和主成分分析法和SPSS软件应用时软件应用时 一对一的正确步骤:一对一的正确步骤:(一)指标的正向化。指标最好有同趋势化,一般为了评价分析的方便,需要将逆指标转化为正指标,转化的方式为用逆指标的倒数值代替原指标。(二)指标数据标准化(SPSS软件自动执行,下图)。(三)指标之间的相关性判定:用SPSS软件中表“Correlation
2、Matrix(相关系数矩阵)”判定。数据标准化:(四)确定主成分个数m:用SPSS软件中表“TotalVarianceExplained(总方差解释)”的主成分方差累计贡献率%、结合表“ComponentMatrix(初始因子载荷阵)”中变量不出现丢失确定主成分个数m。(SPSS中选取主成分的方法有两个:一是根据特征根1来选取;另一种是用户直接规定主成分的个数来选取。)(五)主成分Fi表达式(这是SPSS软件及其教科书中没完善的地方):经过FACTOR过程产生的是因子载荷阵,但主成分分析模型需要的不是因子载荷量而是特征向量,所以还需将因子载荷量输入数据编辑窗口,利用“主成分相应特征根的平方根与
3、特征向量乘积为因子载荷量”的性质用TRANSFORMCOMPUTE来计算特征向量,得到主成分的线性表达式。将SPSS软件中表“ComponentMatrix”中的第i列向量除以第i个特征根的开根后就得到第i个主成分函数Fi的系数(将前m个因子载荷矩阵输入到数据编辑窗口,为变量A1,A2,Am,在“transform-compute”中进行计算Ui=Ai/SQR(),得到特征向量Ui,由此写出主成分Fi表达式。(六)主成分Fi命名:用SPSS软件中表“ComponentMatrix”中的第i列中系数绝对值大的对应变量对Fi命名(有时命名清晰性低)。(七)主成分与综合主成分得分(评价值)(这是SP
4、SS软件及其教科书中没完善的地方):主成分得分是根据表达式将标准化后的相应数据代入得到的,在“transform_compute”中输入主成分的表达式(特征向量与标准化后的数据相乘),确定后即可得到各主成分的得分Fi。若需要综合得分,还需在“transform_compute”中输入综合评价函数是主成分的方差贡献率。最后在”transform_rank case”中选中Y进行排序。主成分得分一般用来对研究现象进行综合评价、排序及筛选变量 。(八)检验:综合主成分(评价)值用实际结果、经验与原始数据做聚类分析进行检验(对有争议的结果,可用原始数据做判别分析解决争议)。(九)综合实证分析。x1:人
5、均粮食支出(元/人)x2:人均副食支出(元/人)x3:人均烟、酒、茶支出(元/人)x4:人均其他副食支出(元/人)x5:人均衣着商品支出(元/人)x6:人均日用品支出(元/人x7:人均燃料支出(元/人)x8:人均非商品支出(元/人)指标解释:城镇居民消费支出的主成分分析城镇居民消费支出的主成分分析 利用FACTOR 实现主成分分析时,在确定公共因子个数(Numbers of Factor)时,一般直接选择与原变量数目相等的个数,这样可以避免由于采用默认形式后累计方差贡献率达不到85%而造成的二次操作。F F F F1 1 1 1F F2 2F F3 3F F1 1、F F2 2、F F3 3Y
6、 YF F1 1F F2 2F F3 3F F1 1、F F2 2、F F3 3Y Y用用SPSSSPSS作主成分分析作主成分分析以城镇居民消费支出资料为例,用主成分分析法对各省、市作综合评价(spssex-2/城镇居民消费支出的主成分分析)以经济效益数据为例,用主成分分析法对各企业作综合评价(spssex-2/企业经济效益的主成分分析)主成分分析法和主成分分析法和SPSS软件应用时软件应用时 一对一的正确步骤:一对一的正确步骤:(一)指标的正向化。指标最好有同趋势化,一般为了评价分析的方便,需要将逆指标转化为正指标,转化的方式为用逆指标的倒数值代替原指标。(二)指标数据标准化(SPSS软件自
7、动执行,下图)。(三)指标之间的相关性判定:用SPSS软件中表“CorrelationMatrix(相关系数矩阵)”判定。数据标准化:(四)确定主成分个数m:用SPSS软件中表“TotalVarianceExplained(总方差解释)”的主成分方差累计贡献率%、结合表“ComponentMatrix(初始因子载荷阵)”中变量不出现丢失确定主成分个数m。(SPSS中选取主成分的方法有两个:一是根据特征根1来选取;另一种是用户直接规定主成分的个数来选取。)(五)主成分Fi表达式(这是SPSS软件及其教科书中没完善的地方):经过FACTOR过程产生的是因子载荷阵,但主成分分析模型需要的不是因子载荷
8、量而是特征向量,所以还需将因子载荷量输入数据编辑窗口,利用“主成分相应特征根的平方根与特征向量乘积为因子载荷量”的性质用TRANSFORMCOMPUTE来计算特征向量,得到主成分的线性表达式。将SPSS软件中表“ComponentMatrix”中的第i列向量除以第i个特征根的开根后就得到第i个主成分函数Fi的系数(将前m个因子载荷矩阵输入到数据编辑窗口,为变量A1,A2,Am,在“transform-compute”中进行计算Ui=Ai/SQR(),得到特征向量Ui,由此写出主成分Fi表达式。(六)主成分Fi命名:用SPSS软件中表“ComponentMatrix”中的第i列中系数绝对值大的对
9、应变量对Fi命名(有时命名清晰性低)。(七)主成分与综合主成分得分(评价值)(这是SPSS软件及其教科书中没完善的地方):主成分得分是根据表达式将标准化后的相应数据代入得到的,在“transform_compute”中输入主成分的表达式(特征向量与标准化后的数据相乘),确定后即可得到各主成分的得分Fi。若需要综合得分,还需在“transform_compute”中输入综合评价函数是主成分的方差贡献率。最后在”transform_rank case”中选中Y进行排序。主成分得分一般用来对研究现象进行综合评价、排序及筛选变量 。(八)检验:综合主成分(评价)值用实际结果、经验与原始数据做聚类分析进
10、行检验(对有争议的结果,可用原始数据做判别分析解决争议)。(九)综合实证分析。x1:人均粮食支出(元/人)x2:人均副食支出(元/人)x3:人均烟、酒、茶支出(元/人)x4:人均其他副食支出(元/人)x5:人均衣着商品支出(元/人)x6:人均日用品支出(元/人x7:人均燃料支出(元/人)x8:人均非商品支出(元/人)指标解释:城镇居民消费支出的主成分分析城镇居民消费支出的主成分分析 利用FACTOR 实现主成分分析时,在确定公共因子个数(Numbers of Factor)时,一般直接选择与原变量数目相等的个数,这样可以避免由于采用默认形式后累计方差贡献率达不到85%而造成的二次操作。F F
11、F F1 1 1 1F F2 2F F3 3F F1 1、F F2 2、F F3 3Y YF F1 1F F2 2F F3 3F F1 1、F F2 2、F F3 3Y YSPSSSPSS实现因子分析实现因子分析FACTORFACTOR过程的选择项过程的选择项FACTOR过程的选择项共分为五类,分别使用主对话框中的五个子对话框按钮展开相应的子对话框进行选择。Descriptives 展开相应的子对话框可以选择单变量的描述统计量和初始分析结果。Extraction 展开相应的子对话框可以选择不同的提取公因子的方法和控制提取结果的判据。Rotation 展开相应的子对话框可以选择因子旋转方法。Sc
12、ores 展开相应的子对话框可以要求计算因子得分,选择显示或作为新变量保存。Options 展开相应的子对话框可以进一步选择各种输出项。1、Descriptives子对话框中的选择项子对话框中的选择项Descriptives子对话框如图3-2所示。描述统计量分的选择项为两组:(1)Statistics统计量组,共有两项供选择:UnivariateDescriptives单变量描述统计量,选择此项可以输出参与分析的各原始变量的均值、标准差等。Initialsolution初始分析结果,选择此项可以给出原始变量的公因子方差、与变量数相等的因子、各因子的特征值、各因子特征值占总方差的百分比以及累积百
13、分比。(2)CorrelationMatix相关矩阵组Coeffients相关系数选择此项给出原始变量间的相关系数矩阵。这是分析的基础Significancelevels显著性水平选择此项给出每个相关系数相对于相关系数为0的设检验的概率水平。Determinant相关系数矩阵的行列式。Inverse相关系数矩阵的逆矩阵。Reproduced再生相关阵,选择此项给出因子分析后的相关阵,还给出残差,即原软关与再生相关之间的差值。Anti-image反映象相关阵。包括偏相关系数的负数;反映象协方差阵,包括偏协方差的负数;在一个好的因子模型中除对角线上的系数较大外,远离对角线的元素应该比较小。KMOa
14、ndBartlettstestofsphericityKMO和球形Bartlett检验。选择此项给出对采样充足度的Kaisex-Meyer-Olkin测度。检验变量间的偏相关是否很小。Bartlett球形检验,检验的书相关阵是否是单位阵。它表明因子模型是否是不合适宜的。Cntinue按钮确认选择,返回主对话框;Cancle按钮使选择作废,返回主对话框。2、Extraction 因子提取子对话框因子提取子对话框Extraction因子提取子对话框如图3-3所示。有关因子提取的选择项共分四部分(如果是主成分分析,则选PrincipalComponents)。(1)因子提取方法选择项子对话框第一项M
15、ethod:是一组指定提取方法的选择项。单击矩形框右面的箭头可以展开提取方法选择项表,提供七种提取方法可以选择:Principalcomponents主成份法。该方法假设变量是因子的纯线性组合。Unweightedleastsquare不加权最小平方法。该方法使观测的和再生的相关阵之差平方最小。Generalizedleastsquare用变量的单位加权一体观测的和再生的相关阵之差的平方最小。MaximumLikelihoud最大似然法。此方法不要求多元正态分布。给出参数估计,如果样本来自多元正态总体它们与原始变量的相关阵极为相似。PrincipalAxisfactoring使用多元相关的平方
16、作为对公因子方差的初始估计。Alpha因子提取法Image映象因子提取法。是根据变量映象的概念提取公因子的方法。把一个变量看作其它各变量的多元回归。(2)Extract控制提取进程和提取结果的选择项理论上因子数目与原始变量数目相等,但因子分析的目的是用少量因子代替多个原始变色选择提取多少个因子由本组选择项决定。Eigenvaluseover该选择项指定提取的因子的特征值。在此项后面的矩形框中给出系统默认值为1即要求提取那些特征值大于1的因子。指定特征值决定提取因子数目的方法是系统默认的方法。Numberoffactor该选择项指定提取公因子的数目。用鼠标单击选择此项后,将指定的数目键人到该选择
17、项后面的矩形框中。(3)Display 指定与因子提取有关的输出项 Unrotated factor solution 要求显示未经旋转的因子提取结果。此项为系统默认的输出项。Scree plot 要求显示按特征值大小排列的因子序号与特征值为两个坐标轴的碎石图。(4)Maximum iterations for Convergence因子分析收敛的最大迭代次数。系统默认的最大迭代次数为25。Continue 按钮确认所有选择,返回主对话框;Cancel按钮作废本次所有选择,返回主对话框。3、Rotation 旋转方法选择子对话框旋转方法选择子对话框Rotation旋转方法选择子对话框如图3-4
18、所示,选择项分三组(如果是主成分分析就选None)。(1)Methd旋转方法选择项None不进行旋转。此为系统默认的选择项。Varimax方差最大旋转Equamax平均正交旋转Quartmax四次方最大正交旋转DirectOblimin斜交旋转,指定此项可以在下面的矩形框中键入(值,该值应该在01之间,是因子映象自相关的范围。0值产生最高相关因子,大负数产生旋转的结果与正交接近。(2)Display有关输出显示的选择项Rotatedsoltion旋转结果。指定此项将对正交旋转显示旋转后的因子矩阵模式、因子转换矩阵;对斜交旋转显示旋转后的因子矩阵模式、因子结构矩阵和因子间的相关阵。Lodingp
19、lot(s)因子载荷散点图。指定此项将给出以两两因子为坐标轴的各变量的载荷散点图。如果有两个因子,给出各原始变量在factorlfactor2坐标系中的散点图,如果多于两个因子则给出三维因子载荷散点图。(3)MaximumiterationsforConvergence:旋转收敛的最大迭代次数。系统默认值为25。可以在此项后面的矩形框中键入指定值。有关因子得分的选择项在FactorScorce子对话框中。对话框如图3-5所示。选择项共分三组:4 4、Factor Factor ScorceScorce 有关因子得分的选择项有关因子得分的选择项(1)Saveasvariables选择此项,将因子
20、得分作为新变量保存在数据文件中。程序运结束后,在数据窗中显示出新变量。对每一次分析产生一组新变量,用最后一个数字字符表示分析的顺序号。每次分析中产生多少个因子,就生成多少个新变量,因子序号占倒数第三个字符的位置。倒数第二个字符为。在输出窗中给出对因子得分的命名解释。(2)Method指定计算因子得分的方法。可供选择的方法有:Regression回归法。其因子得分的均值为0方差等于估计因子得分与实际因子得分之间的多元相关的平方。Bartlett巴特利特法。因子得分均值为0。Anderson-Rubin安德森一鲁宾法。是为了保证因子的正交性而对巴特利特因子得分的调整。其因子得分的均值为0,标准差为
21、1。(3)Displayfactorscorecoefficientmatrix选择此项将在输出窗中显示因子得分系数矩阵。是标准化的得分系数,原始变量值进行标准化后,可以根据该矩阵给出的系数计算各观测量的因子得分。5、Options 有关输出的选择项有关输出的选择项有关输出方式以及对带有缺失值的观测量处理方法的选择项均在Options子对话框中。Options子对话框如图3-6所示。初步分析的统计量,分为两部分。星号左面的两项,右面的四项。分别解释如下:Variable变量Communality公因子方差,原始变量的公因子方差均为1,五个变量的公因子方差之总和为5。Factor因子序号。Eig
22、envalue各因子的特征值。前两个因子的特征值大于1。PctofVar各因子特征值占特征值总和的百分比。CumPct自上至下各因子方差占总方差百分比的累积百分比。初 始 统 计 量对于初用SPSS进行统计分析的同学,可以完全使用系统默认值进行最简单的因子分析。虽然可能得不到非常满意的结果,但通过初步分析可以对所研究的问题有初步的认识,对进一步的研究会有帮助。对比较简单的问题,有时只使用系统默认值进行因子分析就可以得到比较满意结果。以城镇居民消费支出资料为例,用因子分析法对各省、市作综合评价(spssex-3/城镇居民消费支出的因子分析)以经济效益数据为例,用因子分析法对各企业作综合评价(spssex-3/经济效益的因子分析)SPSS的实例分析的实例分析城镇居民消费支出的因子分析城镇居民消费支出的因子分析x1:人均粮食支出(元/人)x2:人均副食支出(元/人)x3:人均烟、酒、茶支出(元/人)x4:人均其他副食支出(元/人)x5:人均衣着商品支出(元/人)x6:人均日用品支出(元/人x7:人均燃料支出(元/人)x8:人均非商品支出(元/人)指标解释:指标解释: