《主成分因子分析步骤.docx》由会员分享,可在线阅读,更多相关《主成分因子分析步骤.docx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、主成份分析、因子分析步骤不同点主成份分析因子分析概念具有相关关系的P个变将原数据中多个可能相关的变量综合 成少数量,经过线性组合后成为几个不相关的可反映原始变量的绝大多数信息k个不相关的新变量的综合变量主要减少变量个数,以较少的找寻变量间的内部相关性及潜在的共目标主成份来解释原有变量间同因素,适合做数据结构检测的大局部变异,适合于数据简化强调强调的是解释数据变异的强调的是变量之间的相关性,以协方重占八、水平,以方差为导向,使差为导向,关心每一个变量与其他变量方差到达最大共同学后局部的大小、形成一个或者数个总指标变反映变量间潜在或者观察小到的因素结果 量旋转应用变异它将所有的父量的父异都只考虑每
2、一题与其他题目共同享有的 变异,因解释考虑在内,因血没有误差而后误差项,叫独特因素程度项是否主成份分析作综合指标因子分析需要经过旋转才干对因子作需要用,不需要旋转命名与解释变异变异总计的%累加总计的累加%13.56859.47459.4743.56859.47459.47421.28821,46680.9391.28821.46680.9393.60010.00190.9414.3585.97596.9165.1422.37299.2886.043.712100.000撷取方法:主体元件分析.因子1的奉献率为49.0%,因子2的奉献率为31.899%,这两个因子奉献率积累达80.9%,即这两个
3、因子可解释原有变量80.9%的信息,于是因子取二维比拟显着.(5)成份矩阵(因子载荷矩阵)元件矩阵元件12食品.902.255衣着,880.224燃料.093.912住房.878.195交通和通.925-.252讯娱乐教育.588.488文化撷取方法:主体元件分析.a.撷取2个元件.该矩阵并非主成份1和主成份2的系数.主成份系数的求法:各自主成份载荷向量除以主成份方差的算数平方根.那末第1主成份的各个系数是向量(0.925 , 0.902 , 0.880 , 0.878 ,除,58以.56.809后才)得到 的,即(0/90, 0.478, 0.466, 0,465, 0.311,才0Q4 ?
4、成)分 1 的特征向量.第1主成份的函数表达式:Yl=0.490*Z 交+0.478*Z 食+0.466*Z 衣+0.465*Z 住+0,311*Z 娱+0.049*Z 燃(6)因子得分因子得分显示在SPSS勺数据窗口里.通过因子得分计算主成份得分.(7)主成份得分主成份的得分是相应的因子得分乘以相应方差的算数平方根.即:主成份1得分二因子1得分乘以3.568的算数平方根主成份2得分二因子2得分乘以1.288的算数平方根【转换】一【计算变量】(8)综合得分及排序综合得分是根据以下公式计算:综合彳导分Y为:【数据】【排序个案】是否有假设只是对数据作变换,故不需要假设因子分析对资料要求需符合许多假
5、设,如果假设条件不符,那末因子分析的结果将受到质疑因子分析1【分析】-【降维】【因子分析】(1)描述性统计量(Descriptives )对话框设置KM%口 Bartlett的球形度检验(检验多变量正态性和原始变量是否适合作因子 分析).(2)因子抽取(Extraction )对话框设置方法:默认主成份法.主成份分析一定要选主成份法分析:主成份分析:相关性矩阵.输出:为旋转的因子图抽取:默认选1.最大收敛性迭代次数:默认25.(3)因子旋转(Rotation对)话框设置因子旋转的方法,常选择“最慷慨差法.“输出框中的“旋转解.(4)因子得分(Scores)对话框设置“保存为变量,那末可将新建立
6、的因子得分储存至数据文件中,并产生新的 变量名称.(5)选项(Options对)话框设置2结果分析(1) KMCM Bartlett 1检 s验取样足够度的Kaiser-Meyer-OlkinBartlett的球近似卡方形度检验dfSig.,5153.7846706的检验KMO 和 Bartlett当KMO值愈大时,表示变量间的共同因子愈多,愈适合作因子分析.根据Kaiser 的观点当 KMO 0.9 (很棒)、KMO 0.8 (很好、KMO 0,7 (中等、KMO 0.6 (普通)、KMO0,5 (粗劣)、KM& 0.5不能接受).2公因子方差公因子方差起始撷取卫生1.000,855等待时1
7、.000,846间1.000,819滋味1.000,919亲切1.000,608撷取方法:主体元件分析.Commonalities (称共同度表示公因子对各个变量能说明的程度,每一个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大.共同度低说明在因子中的重要度低般的基准是V0.4就可以认为是比拟低,这时变量在分析中去掉比拟好(3)解释的总方差说明的变异数总计元件各因子的特征值囚十贝献罕因子积累奉献率总计变异的%累加%总计变异的累加总计变异的累加%12.45149.02449.0242.45149.02449.0242.04240.8434
8、0.8432345撷取方1 第二列: 第三列: 第四列:第一1.595.662.191.100去:主体元彳各因子的多各因子特彳积累百分匕二列统计的,31.89913.2463.8232.008牛分析.充计值E值与全体生匕也称因子恐值是各因子80.92394.16897.992100.000,征值总和2气累奉献率:的特征值1.595二比的百分1:却各因子能)31.899匕.也称因子,解释的方差,80.923奉献率.普通的,2.00440.079特征值80.923在1以上就是重要的因子;第三列 娓各因子的特征值与所有因子的特征值总和 的比,也称因子奉献率;第四列是因子累计奉献率.如因子1的特征值为
9、2.451因,子2的特征值为1.595因,子3,4,5的特征值在1以下.因子1的奉献率为49.0%,因子2的奉献率为31.899%,这两个因子贡献率积累达809%卸这两个因子可解释原有变量80.9%的信息,于是 因子取二维比拟显着.2个变量,至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了facl.l、fac2_l即,为因子得分.(4)成份矩阵与旋转成份矩阵成份矩阵是 未旋转前的因子矩阵,从该表中并无法清晰地看出每一个变量到底应归属于哪个因子.旋转后的因子矩阵,从该表中可清晰地看出每一个变量到底应归属于哪个因子.此表显示 旋转后原始的所有变量与新生的2个公因子之间的相关程度.普通的
10、,因子负荷量的绝对值0.4以上,认为是显着的变量,超过0.5时可以说是非常重要的变量.如滋味 与饭量关于因子1的负荷量高,所以聚成因子L称为饮食因子;等待时间、卫生、亲切关于因子2的负荷 量高,所以聚成因子2,又可以称为效劳因子.(5)因子得分系数矩阵元件评分系数矩阵元件12卫生-.010.447.425-.036等待时-.038.424间滋味,480.059亲切-.316-.371撷取方法厂主本兀件分析.转轴方法:具有Kaiser正规化的最大变异法.元件评分.因子得分系数矩阵给出了因子与各变量的线性组合系数.因子 1 的分数=0.010*Xl+0.425*X20.038*X3+0408*X4
11、0,316*X5因子 2 的分数=0,447*Xl-0.036*X2+0.424*X3+0.059*X4-0.371*X5(6)因子转换矩阵转轴方法:具有Kaiser正规化的最大变异法.因子转换矩阵是主成份形式的系数.(7)因子得分协方差矩阵元件评分共变异数矩阵元件 1211,000 领 02.000A 1.000撷取方法:主体元件分析.转轴方法:具有Kaiser正规化的最大变异法.元件评分.看各因子间的相关系数,假设很小,那末因子间根本是两两独立的,说明这样的分类是较合理的主成份分析1【分析】一一【降维】一一【因子分析】(1)设计分析的统计量【相关性矩阵】中的“系数:会显示相关系数矩阵;KM
12、G 口 Bartlett的球形度检验】:检验原始变量是否适合作主成份分析.【方法】里选取“主成份.【旋转】:选取第一个选项“无.【得分】: 保存为变量【方法】:回归;再选中“显示因子得分系数矩阵2结果分析(1)相关系数矩阵相关性矩阵食品衣着燃料住房交通和通讯娱乐教育文化相关食品1.000,692,319,760,738,556衣着,6921.000-,081,663,902,389燃料,319-,0811.000-,089-Q61,267住房,760,663,0891.000,831,387交通和通讯,738,902-,061,8311.000,326娱乐教育文化,556,389,267,38
13、7,3261.000两两之间的相关系数大小的方阵.通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系.由表中可知许多变量之间直接的相关性比拟强,证实他们存在信息上的重叠.(2) KMCM Bartlet检t验sKMO 与 Bartlett 检定Kaiser-Meyer-Olkin适当性.测量取样,602Bartlett的球大约卡方62,216形检定df15显着性,000根据Kaiser的观点,当KMO0.9 (很棒、KMO 0.8 (很好)、KMO 0,7中等)、KMO 0.6 (普通)、KMO0,5 (粗劣)、KM& 0.5 (不能接受)3公因子方差Communalities起始撷取食品1.000,878衣着1.000,825燃料1.000.841住房1.000,810交通和通讯1.000,919娱乐教育文化1.000,584撷取方法:主体元件分析.Communalities 称共同度)表示公因子对各个变量能说明的程度,每一个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大.共同度低说明在因子中的重要度低.普通的基准是0,4就可以认为是比拟低,这时变量在分析中去掉比拟好.4)解释的总方差:说明的变异数总计元件起始特征值撷取平方和载入