《《SPSS数据分析教程》——因子分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《《SPSS数据分析教程》——因子分析ppt课件.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、SPSS数据分析教程因子分析因子分析目录n12.1因子分析简介n12.2因子分析法的统计理论q12.2.1因子分析的模型q12.2.2因子分析模型的求解方法q12.2.3因子分析的应用前提q12.2.4因子个数的确定q12.2.5因子的解释q12.2.6因子旋转q12.2.7因子得分n12.3因子分析案例q12.3.1探索变量间的结构关系q12.3.2因子分析在市场调查中的应用n12.4因子分析结果的有效性n12.5因子分析和主成分分析的比较本章要求n了解因子分析模型的基本理论;n了解因子分析法的应用条件n因子分析模型的求解方法;n掌握因子分析法的应用;n掌握因子分析法输出结果的解释;n了解因
2、子旋转的方法。12.1 因子分析简介n有时侯,我们要考察的指标是无法直接测量的。比如考察学生的学习能力,可以直接测试的指标有数学、语文、物理等科目的考试成绩,但是一些抽象的指标,譬如运算能力、表达能力则无法通过直接测试的方法得到,然而这些抽象指标却体现在上述可以测试的指标之中。因子分析法就是研究如何来表达这两类不同性质的指标之间的关系的。 因子分析是一种数据降维方法n因子分析试图用最少个数的不可观测的互不相关的公共因子(例如运算能力、表达能力等公共因子)的线性组合,再加上特殊因子来描述原来一组可观测的有相互关系的变量。其目的是尽可能合理地解释存在于原始变量之间的相关性,并且简化变量的维数和结构
3、。 因子分析的分类n因子分析既可以对变量作因子分析,也可以对样品作因子分析。前者称为R型因子分析,后者称为Q型因子分析。 n根据原始变量之间是否有先验的关系结构,因子分析法又可以分为探索性因子分析和验证性因子分析。探索性因子分析事前没有原始变量之间、原始变量和因子之间以及因子之间关系的先验知识,而验证性因子分析事前给出原始变量和因子的结构关系。 12.2 因子分析的统计理论n因子分析假设每一个原始变量都可以表示成不可观测的公共因子的线性组合和一个特殊因子之和。 21 122212222111 1122111 122qpqqqpqqppppXa Fa FaFXa Fa Fa FXa FaFaF因
4、子分析模型(1)n这里q为公共因子的个数 ,F1,,Fq表示公共因子 , 也可以表示为下列矩阵形式: (1)n 其中,A称为载荷矩阵XAF111212122212qqpppqaaaaaaaaaA因子分析模型(2)n因子分析模型要求方程(1)满足下列条件:qqp:公共因子的个数不大于原始变量的个 数q公共因子和特殊因子是不相关的,即:q公共因子F F1 1, ,F,Fq q不相关且方差为1 q各个特殊因子不相关,但是方差不要求相等。 Cov( , )0F 因子分析结果解释n因子载荷的意义 q在因子上的因子载荷实际上是原始变量和公共因子的相关系数。它们的大小反映了原始变量对公共因子的重要性。 n变
5、量共同度 q它反映了公共因子对原始变量的影响程度 n公共因子的方差贡献 q它衡量公共因子的重要性。 因子分析模型的求解方法 (1)nSPSS中给出了7种求解因子分析模型的方法q主成分q未加权的最小平方法q综合最小平方法q最大似然(K)q主轴因子分解q因子分解q映像因子分解法。 因子分析模型的求解方法(2)n这7种求解因子分析模型的方法都可以基于相关系数矩阵 。n主成分、主轴因子分解和映像因子分解 3种方法既可以基于相关系数矩阵,也可以基于协方差矩阵。因子分析的应用前提 n因子分析的主要目的是数据降维,如果原始变量之间没有相关性,因子分析的意义不大。 n判断原始变量之间是否有相关性。判断的方法为
6、Bartlett球形检验和KMO方法。q经验上,因子分析方法要求个案个数是变量个数的10到25倍。如果个案个数相对于变量个数而言较少,那么考虑用主成分法来替代。q建议如果变量中有分类变量,那么分类变量的可取值个数要不小于5。 因子个数的确定 n有3个方法可以用来确定因子的个数 q方差贡献率 q设定特征值条件q碎石图 因子旋转 n当因子分析模型得到的公共因子没有较好的解释时,一般可以对因子进行旋转以得到原始变量和公共因子之间关系的较好解释。n因子旋转分为正交旋转和非正交旋转。在正交旋转下,特殊因子的协方差、公共因子的协方差都不变,因此旋转之后的因子仍然是不相关的。 正交旋转 nSPSS提供了3种
7、正交旋转的方法,它们是q最大四次方值法(Q: Q Quartmax Rotaiton)q最大方差法(V:Kaisers V Varimax Rotationq最大平衡值法(E: E Equamax)n这三种方法的目的都是简化因子载荷矩阵,使得某些元素为0或者接近于0。并且这三种方法的坐标轴都是正交的,旋转后的公共因子仍然是相互无关的。 因子得分 n因子分析中各个变量的公共因子取值称为因子得分。从因子分析模型知道,原始变量是公共因子的线性组合和特殊因子之和。 nSPSS提供了三种估计因子得分的方法,它们是Thomson回归法、Bartlett法和Anderson-Rubin法。因子分析案例 nS
8、PSS因子分析的菜单是【分析】【降维】【因子分析】 案例1:探索变量间的结构关系 n直接从相关系数矩阵或者协方差矩阵开始,用语法命令的方式来进行因子分析。n为了分析(英格兰)盖尔语、英语、历史、算术、几何和代数6门学科之间的相互关系,Lawley和Maxwell调查了220名男学生的6门学科的成绩,并记录下它们的相关系数矩阵Gaelic English History Arithmetic Algebra Geometry1.000 0.439 1.0000.410 0.351 1.0000.288 0.354 0.164 1.000.329 0.320 0.190 0.595 1.0000.
9、248 0.329 0.181 0.470 0.464 R 1.00输入数据MATRIX DATA variables=ROWTYPE_ Gaelic English History Arithmeti Algebra Geometry.begin data.N 220 220 220 220 220 220 SD 1 1 1 1 1 1 CORR 1.00CORR 0.439 1.00CORR 0.410 0.351 1.00CORR 0.288 0.354 0.164 1.0CORR 0.329 0.320 0.190 0.595 1.00CORR 0.248 0.329 0.181 0.
10、470 0.464 1.00END data.结果分析(1):相关系数矩阵 Gaelic English History Arithmeti Algebra Geometry Gaelic 1.000 .439 .410 .288 .329 .248 English .439 1.000 .351 .354 .320 .329 History .410 .351 1.000 .164 .190 .181 Arithmeti .288 .354 .164 1.000 .595 .470 Algebra .329 .320 .190 .595 1.000 .464 相关 Geometry .248
11、 .329 .181 .470 .464 1.000 KMO和Bartlett检验取样足够度的 Kaiser-Meyer-Olkin 度量。 .775 近似卡方 310.841 df 15 Bartlett 的球形度检验 Sig. .000 特征值、方差贡献率和累积方差贡献率 初始特征值 提取平方和载入 旋转平方和载入 因子 合计 方差的% 累积% 合计 方差的% 累积% 合计 方差的% 累积% 1 2.733 45.548 45.548 2.209 36.824 36.824 1.606 26.762 26.762 2 1.13 18.83 64.378 0.606 10.095 46.91
12、8 1.209 20.157 46.918 3 0.615 10.253 74.63 4 0.601 10.02 84.651 5 0.525 8.747 93.397 6 0.396 6.603 100 初始因子载荷矩阵旋转因子载荷矩阵因 子 1 2 Gaelic .232 .660 English .321 .551 History .085 .591 Arithmeti .770 .173 Algebra .723 .215 Geometry .572 .213 碎石图因子载荷图 案例2:因子分析在市场调查中的应用 n数据文件cereals.sav n某市场调查项目需要了解消费者是否偏爱
13、某个谷物品牌。现有117个受访者对12个销量比较好的谷物产品的25个属性进行评分。现在用因子分析法对消费者的偏好习惯进行分析。哪些品牌的谷物产品易受消费者青睐?消费者喜欢哪些属性?这些属性之间有什么关系?因子分析选项设置(1)因子分析选项设置(2)n如果因子分析的结果输出错误信息“解不收敛”,可以考虑更改 “最大收敛性迭代次数”为一个较大的值,然后重新进行因子分析。 因子分析选项设置(3)因子分析结果(1)因子分析结果(2)因子分析结果(3)旋转后的因子载荷矩阵因子的解释n第一个因子上载荷较大的原始变量有Fibre、Nutritious、Health、Natural、Regular、Filling、Quality、Energy和Satisfying,所有这些变量都描述了谷物产品的自然健康属性,我们称之为“健康因子”。n第二个因子上载荷较大的原始变量有Sugar、Salt、Calories、Sweet和Process,所有这些都是谷物产品的人工添加成分所体现的属性,称为“人工成分因子”。 n第三个因子上载荷较大的原始变量有Kids、Family和Fun,称为“群体因子”。前两个主成分的因子载荷图 产品在前两个公共因子上的定位图 小结