《第八章因子分析-新.ppt》由会员分享,可在线阅读,更多相关《第八章因子分析-新.ppt(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章 因子分析n因子分析的目的与类型因子分析的目的与类型n探索性因子分析的模型探索性因子分析的模型n因子模型的求解因子模型的求解n因子旋转因子旋转n因子得分因子得分n因子分析的因子分析的SPSS实现实现n实例分析实例分析n确认性因子分析确认性因子分析1/4/20231Origins of Factor AnalysisIn conjunction with his famous two-factor theory of intelligenceCharles Spearman1863-1945一、因子分析的目的与类型因子分析的目的:用少数几个不可观测的隐变因子分析的目的:用少数几个不可观测的
2、隐变量来解释原始变量间的协方差关系量来解释原始变量间的协方差关系Origins of Factor AnalysisnWanted to estimate intelligence of 24 children in a village school.nRealized way of measuring intelligence was imperfect and that the correlation between any two variables(say,ones score on a mathematics exam and on a classics exam)would be
3、underestimated.nNoticed that the observed correlations between the variables he was interested in were all positive and followed a pattern.nSpearman wanted to develop a model that would reflect the pattern he saw.What did Spearman notice?Correlations Between Examination ScoresNotice the trend across
4、 each row on the upper diagonal认为存在着“general intelligence”,影响着个体在所有智力活动中的表现(解释各变量间的高度相关),而个体在不同智力活动中表现的差异则是由另一些“specific factors”决定的(解释相关程度差异)。区分这两类因素可以更准确地预测出某个人在某项工作中的表现。two-factor theory of intelligence nCould model each test score as having two types of components:one common to all the scores an
5、d one specific to the particular testvf:available to the same individual to the same degree for all intellectual acts v:varies in strength from one act to another nIf one knows how a person performs on one task that is highly saturated with“f,one can safely predict a similar level of performance for
6、 a another highly“f saturated task.nthe most important information to have about a persons intellectual ability is an estimate of their“f Schematicallyclassicsfrenchenglishmathdiscrmusich1h2h3h4h5h6ff f因子因子:不可观测:不可观测可观测可观测特殊因子特殊因子:不可观测,难以估计:不可观测,难以估计构成:测量误差构成:测量误差+个性因素个性因素Goals of Factor Analysisnmo
7、del correlation patterns in useful waypatterns in useful wayv通过对多个变量的相关系数矩阵的研究,找出同时影响或支配多个变量的共性因素。nallow for contextual interpretationinterpretation of the new variablesnevaluate the original data in light of the new variables注意:因子分析是一种用来分析隐藏在表象背后的潜在因注意:因子分析是一种用来分析隐藏在表象背后的潜在因注意:因子分析是一种用来分析隐藏在表象背后的潜在
8、因注意:因子分析是一种用来分析隐藏在表象背后的潜在因子作用的统计模型,这些共同因素通常是子作用的统计模型,这些共同因素通常是子作用的统计模型,这些共同因素通常是子作用的统计模型,这些共同因素通常是不可直接观测不可直接观测不可直接观测不可直接观测的的的的基本思想:认为存在一些潜在共性基本思想:认为存在一些潜在共性因素影响着事物在多方面的表现因素影响着事物在多方面的表现实例1n考查人体的五项生理指标:收缩压、舒张压、考查人体的五项生理指标:收缩压、舒张压、心跳间隔、呼吸间隔和舌下温度。心跳间隔、呼吸间隔和舌下温度。n从生理学知识可知,这五项指标是受植物神经从生理学知识可知,这五项指标是受植物神经支
9、配的,植物神经又分为交感神经和负交感神支配的,植物神经又分为交感神经和负交感神经,因此这五项指标至少受到两个公共因子的经,因此这五项指标至少受到两个公共因子的影响,也可用因子模型去处理。影响,也可用因子模型去处理。n五项指标均可观测,而两个公共因子是不可直五项指标均可观测,而两个公共因子是不可直接观测的:通过指标与公共因子的关系诊病。接观测的:通过指标与公共因子的关系诊病。舒张压舒张压心跳间隔心跳间隔呼吸间隔呼吸间隔舌下温度舌下温度收缩压收缩压交感神经交感神经负交感神经负交感神经实例2 n林登根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研
10、究。这十个全能项目为:v100米跑x1、跳远x2、铅球x3、跳高x4、400米跑x5、110米跨栏x6、铁饼x7、撑杆跳x8、标枪x9、1500米跑x10n对10个变量标准化后的因子分析表明,十项得分基本上可归结于他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一方面都称为一个公共因子。因子分析的类型n探索性因子分析探索性因子分析exploratory Factor Analysis v根据变量间相关关系探索因子结构根据变量间相关关系探索因子结构v实例实例2n确认性因子分析确认性因子分析Confirmatory Factor Analysis v检验对因子结构的先验认识是否合理,评估
11、因子模检验对因子结构的先验认识是否合理,评估因子模型的拟合程度型的拟合程度v实例实例1二、探索性因子分析模型n正交因子模型正交因子模型n重要假设重要假设n因子载荷阵的统计意义因子载荷阵的统计意义1.正交因子模型observed variablesfactor loadingscommon factorsspecific factors设:可观测随机变量xi,E(xi)=i,i=1,2,p,不可观测正交随机变量fj,j=1,2,m,E(fj)=0,(fj)=1,一般因子模型:反映了各变量与公共因子的关系mp因子载荷阵因子分析:求出各因子载荷量aij,并在此基础上计算各样本的因子得分,据此评价样本
12、,预测。与线性回归模与线性回归模型的区别?型的区别?因子载荷量中中心心化化变变量量因子模型x1x2x3xixph1h2h3hihP Pf1f2fmf f因子因子:不可观测,:不可观测,可估计可估计可观测可观测特殊因子特殊因子:不可观测,难以估计:不可观测,难以估计构成:测量误差构成:测量误差+个性因素个性因素十项全能例因子模型因子模型因子得分计算公式因子得分计算公式2.Important Assumptionsnf1,f2,fm are independent,with identical distributions having a mean of 0 and a variance of 1
13、n 1、2、pare independent,with distributions having a mean of 0 and variances i2nfi and j are independent for all i,j combinationsUnder the assumptions aboveActually,the goal of“factor analysis”is to try to decompose the covariance matrix(or correlation matrix for standardized data)into two parts each
14、in the form dictated above.当m=p时,var(x x)=AAT然而只有当m0.2Measure Reliabilityntells us whether a particular variable Xi does a good job of measuring the true underlying factor that it purports to measurevRule of thumb:i0.7X1XiXkh1hih3f11ikReliability of the composite indexntells us whether the measureme
15、nt model is good enough to measure the latent factorX1XiXkh1hih3f11ik因子分析:止痛药例Factor1:有效性Factor2:和缓性极大似然估计结果比较模型本章小结n因子分析:因子分析:一种用来分析隐藏在表象背后的潜在一种用来分析隐藏在表象背后的潜在一种用来分析隐藏在表象背后的潜在一种用来分析隐藏在表象背后的潜在因子作用的统计模型因子作用的统计模型因子作用的统计模型因子作用的统计模型vv基本思想:认为存在一些潜在共性因素影响着事物在基本思想:认为存在一些潜在共性因素影响着事物在多方面的表现多方面的表现n探索性因子模型探索性因子
16、模型因子模型求解:因子模型求解:估计公共因子个数估计公共因子个数估计公共因子个数估计公共因子个数mm、载荷阵、载荷阵、载荷阵、载荷阵A A和和和和特殊因子方差特殊因子方差特殊因子方差特殊因子方差载荷阵元素载荷阵元素载荷阵元素载荷阵元素a aij ij表示表示表示表示x xi i对对对对f fj j的依赖程度的依赖程度的依赖程度的依赖程度因子旋转:使每个变量的载荷都尽可能集中在某个因子上,因子旋转:使每个变量的载荷都尽可能集中在某个因子上,以使公因子易于解释。因子旋转不改变变量共同度和特殊以使公因子易于解释。因子旋转不改变变量共同度和特殊因子方差。因子方差。因子模型建立之后,通过因子得分评价各样
17、本在各个公共因因子模型建立之后,通过因子得分评价各样本在各个公共因子上的表现子上的表现确认性因子分析n先验因子结构先验因子结构n因子间可相关因子间可相关n可估计标准误差,做参数检验、拟合优可估计标准误差,做参数检验、拟合优度检验、测量指标可靠度度检验、测量指标可靠度n便于模型比较便于模型比较因子分析与主成分分析的区别n主成分分析只是通常的变量变换,不能做模型主成分分析只是通常的变量变换,不能做模型v将一组具有相关关系的变量变换为一组互不相关的变量将一组具有相关关系的变量变换为一组互不相关的变量v主成分是可观测的原始变量的线性组合主成分是可观测的原始变量的线性组合v主成分个数主成分个数=变量数(
18、应用时只取前几个主成分)变量数(应用时只取前几个主成分)v主成分不一定可以解释主成分不一定可以解释n因子分析需要构造因子模型因子分析需要构造因子模型v用尽可能少的公因子,以便构造一个结构简单的因子模型用尽可能少的公因子,以便构造一个结构简单的因子模型v将原始变量表示为公因子与特殊因子的线性组合将原始变量表示为公因子与特殊因子的线性组合v公因子是不可观测的,且共因子不能表示为原始变量的相性组合公因子是不可观测的,且共因子不能表示为原始变量的相性组合v比主成分分析更灵活(可旋转,因而共因子通常更容易得到解释)比主成分分析更灵活(可旋转,因而共因子通常更容易得到解释)共同点:分析变量间的相关性。若原始变量间的共同点:分析变量间的相关性。若原始变量间的相关性弱,则不适宜做因子分析或主成分分析相关性弱,则不适宜做因子分析或主成分分析