第8章 因子分析精选文档.ppt

上传人:石*** 文档编号:87334986 上传时间:2023-04-16 格式:PPT 页数:111 大小:4.79MB
返回 下载 相关 举报
第8章 因子分析精选文档.ppt_第1页
第1页 / 共111页
第8章 因子分析精选文档.ppt_第2页
第2页 / 共111页
点击查看更多>>
资源描述

《第8章 因子分析精选文档.ppt》由会员分享,可在线阅读,更多相关《第8章 因子分析精选文档.ppt(111页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第8章 因子分析本讲稿第一页,共一百一十一页8.1引言引言1、什么是因子分析?、什么是因子分析?因子分析是主成分分析的推广因子分析是主成分分析的推广,也是利用也是利用降维降维降维降维的思想的思想,由研究原始变由研究原始变量相关矩阵或协方差矩阵的内部依赖关系出发量相关矩阵或协方差矩阵的内部依赖关系出发,把一些具有错综复杂关系的把一些具有错综复杂关系的多个变量归结为少数几个综合因子多个变量归结为少数几个综合因子,以再现原始变量与因子之间的相关关系以再现原始变量与因子之间的相关关系的一种多元统计分析方法。的一种多元统计分析方法。2 2、因子分析的基本思想:、因子分析的基本思想:、因子分析的基本思想:

2、、因子分析的基本思想:把每个研究变量分解为几个影响因素变量把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两将每个原始变量分解成两部分因素部分因素,一部分是由所有变量共同具有的少数几个一部分是由所有变量共同具有的少数几个公共因子公共因子公共因子公共因子组成的组成的,另另一部分是每个变量独自具有的因素一部分是每个变量独自具有的因素,即即特殊因子特殊因子特殊因子特殊因子.本讲稿第二页,共一百一十一页3、因子分析的目的:、因子分析的目的:因子分析的目的之一因子分析的目的之一,简化变量维数简化变量维数简化变量维数简化变量维数,即要使因素结构简单化即要使因素结构简单化,希望以希望以最少的共同因

3、素最少的共同因素(公共因子公共因子),能对总变异量作最大的解释能对总变异量作最大的解释,因而抽取得因而抽取得因子愈少愈好因子愈少愈好,但抽取因子的累积解释的变异量愈大愈好但抽取因子的累积解释的变异量愈大愈好.在因子分析的公共因子抽取中在因子分析的公共因子抽取中,应最先抽取特征值最大的公共因子应最先抽取特征值最大的公共因子,其次是次大者其次是次大者,最后抽取公共因子的特征值最小最后抽取公共因子的特征值最小,通常会接近通常会接近0.本讲稿第三页,共一百一十一页实例实例实例实例1 1在企业形象或品牌形象的研究中在企业形象或品牌形象的研究中,消费者可以通过一个有消费者可以通过一个有24个指标构成的评价

4、体系个指标构成的评价体系,评价百货商场的评价百货商场的24个方面的优劣个方面的优劣.但消费者主要关心的是三个方面但消费者主要关心的是三个方面,即商店的环境、商店的服务和商品的即商店的环境、商店的服务和商品的价格价格.因子分析方法可以通过因子分析方法可以通过24个变量个变量,找出反映商店环境、商店服务找出反映商店环境、商店服务水平和商品价格的三个潜在的因子水平和商品价格的三个潜在的因子,对商店进行综合评价对商店进行综合评价.而这三个而这三个公共因子可以表示为:公共因子可以表示为:称称是不可观测的潜在因子是不可观测的潜在因子,称为公共因子称为公共因子.24个变量共享这个变量共享这三个因子三个因子,

5、但是每个变量又有自己的个性但是每个变量又有自己的个性,不被包含的部分不被包含的部分,称为称为特殊因子特殊因子.这就是个因子分析模型这就是个因子分析模型.(i=1,2,24)本讲稿第四页,共一百一十一页实例实例2调查青年对婚姻家庭的态度调查青年对婚姻家庭的态度,抽取抽取n个个青年回答了青年回答了p=50个问题的答卷个问题的答卷,这些问题课归纳为如这些问题课归纳为如下几个方面下几个方面:对相貌的重视、对孩子的观点、对老人对相貌的重视、对孩子的观点、对老人的态度等等的态度等等,这也是一个因子分析的模型这也是一个因子分析的模型,每一个方面每一个方面就是一个因子就是一个因子.本讲稿第五页,共一百一十一页

6、实例实例3考察人体的五项生理指标考察人体的五项生理指标:收缩压收缩压(X1)、舒张压舒张压(X2)、心跳间隔、心跳间隔(X3)、呼吸间隔、呼吸间隔(X4)和舌和舌下温度下温度(X5).从生理学知识可知从生理学知识可知,这五项指标是受这五项指标是受植物神经支配的植物神经支配的,植物神经又分为交感神经和副交植物神经又分为交感神经和副交感神经感神经,因此这五项指标至少受到两个公共因子的因此这五项指标至少受到两个公共因子的影响影响,也可用因子分析的模型去处理它也可用因子分析的模型去处理它.本讲稿第六页,共一百一十一页因子分析的因子分析的主要应用主要应用主要应用主要应用有两方面有两方面:一是寻求基本结构

7、一是寻求基本结构,简化观测系统简化观测系统,将将具有错综复杂的对象具有错综复杂的对象(变量或样品变量或样品)综合为少数几个因子综合为少数几个因子(不可观测的随机不可观测的随机变量变量),以再现因子与原始变量之间的内在联系以再现因子与原始变量之间的内在联系;二是用于分类二是用于分类,对对p个变量个变量或或n个样品进行分类个样品进行分类.因因因因子子子子分分分分析析析析R R型因子分析型因子分析型因子分析型因子分析QQ型因子分析型因子分析型因子分析型因子分析研究变量研究变量(指标指标)之间的相关关系之间的相关关系,通通过对变量的过对变量的相关阵相关阵相关阵相关阵或协方差阵内部结或协方差阵内部结构的

8、研究构的研究,找出控制所有变量的几个找出控制所有变量的几个公共因子公共因子(或称主因子、潜因子或称主因子、潜因子),用用以对变量或样品进行分类以对变量或样品进行分类.研究样品之间的相关关系研究样品之间的相关关系,通过对样通过对样品的品的相似矩阵相似矩阵相似矩阵相似矩阵内部结构的研究找出控内部结构的研究找出控制所有样品的几个主要因素制所有样品的几个主要因素(或称主或称主因子因子).本讲稿第七页,共一百一十一页4 4、主成分分析分析与因子分析的联系和差异:、主成分分析分析与因子分析的联系和差异:联系联系联系联系:(1)因子分析是主成分分析的推广因子分析是主成分分析的推广,是主成分分析的逆问题是主成

9、分分析的逆问题.(2)二二者都是以者都是以“降维降维”为目的为目的,都是从协方差矩阵或相关系数矩阵出发都是从协方差矩阵或相关系数矩阵出发.区别区别区别区别:(1)主成分分析模型是原始变量的线性组合主成分分析模型是原始变量的线性组合,是将原始变量加是将原始变量加以综合、归纳以综合、归纳,仅仅是变量变换仅仅是变量变换;而因子分析是将原始变量加以分解而因子分析是将原始变量加以分解,描述原始变量协方差矩阵结构的模型描述原始变量协方差矩阵结构的模型;只有当提取的公因子个数等于只有当提取的公因子个数等于原始变量个数时原始变量个数时,因子分析才对应变量变换因子分析才对应变量变换.(2)主成分分析主成分分析,

10、中每个主中每个主成分对应的系数是唯一确定的成分对应的系数是唯一确定的;因子分析中每个因子的相应系数即因子分析中每个因子的相应系数即因子载荷不是唯一的因子载荷不是唯一的.(3)因子分析中因子载荷的不唯一性有利于对因子分析中因子载荷的不唯一性有利于对公因子进行有效解释公因子进行有效解释;而主成分分析对提取的主成分的解释能力有而主成分分析对提取的主成分的解释能力有限限.本讲稿第八页,共一百一十一页8.2因子模型因子模型一、正交因子模型一、正交因子模型设设是可观测是随机向量是可观测是随机向量,E(X)=,D(X)=,且设且设(mp)是不可观测的随机向量是不可观测的随机向量,E(F)=0,D(F)=Im

11、(即即F 的各分量方差为的各分量方差为1,且互不相关且互不相关).又设又设与与F互不相关互不相关,且且defD(对角矩阵对角矩阵)本讲稿第九页,共一百一十一页假定随机向量假定随机向量X满足以下的模型满足以下的模型:(8.2.1)则称模型则称模型(8.2.1)为为正交因子模型正交因子模型正交因子模型正交因子模型.本讲稿第十页,共一百一十一页(8.2.2)模型模型(8.2.1)用矩阵表示为用矩阵表示为其中其中,F1,Fm 称为称为X 的的公共因子公共因子公共因子公共因子;,1,p称为称为X的的特殊因子特殊因子特殊因子特殊因子;公共因子公共因子F1,Fm 一般对一般对X的每一个分量的每一个分量Xi都

12、有作用都有作用,而而 i只对只对Xi起作用起作用,而且各特而且各特殊殊因子之间以及特殊因子与所有公共因子之间都是互不相关的因子之间以及特殊因子与所有公共因子之间都是互不相关的.模型中的矩阵模型中的矩阵A=(aij)pm是待估的参数矩阵是待估的参数矩阵,称为因子载荷矩阵称为因子载荷矩阵,aij(i=1,p;j=1,m)称为第称为第i个变量在第个变量在第j个因子上的载荷个因子上的载荷(简称简称为为因子载荷因子载荷因子载荷因子载荷).本讲稿第十一页,共一百一十一页(1)(2)三个关键的假设:三个关键的假设:即即 互不相关互不相关,方差为方差为1.1.,即特殊因子同公共因子相互独即特殊因子同公共因子相

13、互独立即不相关立即不相关;本讲稿第十二页,共一百一十一页(3 3)即特殊因子互不相关即特殊因子互不相关,方差不一定相等,方差不一定相等,。满足以上条件的,称为满足以上条件的,称为正交因子模型正交因子模型正交因子模型正交因子模型defD如如果果(2)不不成成立立,即即各各公公共共因因子子之之间间不不独独立立,则则因子分析模型为因子分析模型为斜交因子模型斜交因子模型在主成分分析中在主成分分析中,回归模型回归模型(7.2.2)中的残差通常是彼此相关中的残差通常是彼此相关的的.在因子分析中在因子分析中,特殊因子起着残差的作用特殊因子起着残差的作用,但被定义为彼此不相但被定义为彼此不相关且与公共因子也不

14、相关关且与公共因子也不相关;而且每个公共因子假定至少对两个变量而且每个公共因子假定至少对两个变量有贡献有贡献,否则它将是一个特殊因子否则它将是一个特殊因子.本讲稿第十三页,共一百一十一页在正交因子模型中在正交因子模型中,假定公共因子彼此不相关且具有单位方差假定公共因子彼此不相关且具有单位方差,即即D(F)=Im.由由可知可知,正交因子模型意味着第正交因子模型意味着第j个变量和第个变量和第k个变量的协方差个变量的协方差 jk由下式给由下式给出出(8.2.3)本讲稿第十四页,共一百一十一页如果原始变量已被标准化如果原始变量已被标准化,在在(8.2.3)式中将用相式中将用相关阵代替协方差阵关阵代替协

15、方差阵.在此意义上在此意义上,公共因子解释了观公共因子解释了观测变量间的相关性测变量间的相关性.用正交因子模型预测的相关与实用正交因子模型预测的相关与实际的相关之间的差异就是剩余相关际的相关之间的差异就是剩余相关.评估正交因子模评估正交因子模型拟合优度的好方法就是考察剩余相关的大小型拟合优度的好方法就是考察剩余相关的大小.本讲稿第十五页,共一百一十一页因子分析的目的首先是由样本协方差阵因子分析的目的首先是由样本协方差阵估计估计 ,然后由然后由分解式分解式(8.2.3)求得求得A 和和D,也就是从可以预测的变量也就是从可以预测的变量给出的样本资料中给出的样本资料中,求出载荷矩阵求出载荷矩阵A,然

16、后预测公共因子然后预测公共因子F1,Fm.又因又因(8.2.4)其中其中A 为为pm 矩阵矩阵.可见可见A中元素中元素aij刻画变量刻画变量Xi与与Fj之间的相关性之间的相关性,称为称为Xi在在Fj上的因子载荷上的因子载荷.本讲稿第十六页,共一百一十一页(8.2.3)(8.2.4)上述两个关系式称为正交因子模型的上述两个关系式称为正交因子模型的协方差结构协方差结构.本讲稿第十七页,共一百一十一页公因子公因子F1公因子公因子F2共同度共同度hi特殊因子特殊因子ix1=代数代数10.8960.3410.9190.081x2=代数代数20.8020.4960.8890.111x3=几何几何0.516

17、0.8550.9970.003x4=三角三角0.8410.4440.9040.096x5=解析几何解析几何0.8330.4340.8820.118方差贡献方差贡献(特征值特征值)3.1131.4794.9590.409方差贡献率方差贡献率(变异量变异量)62.26%29.58%91.85%因子分析案例因子分析案例因子分析案例因子分析案例F1体现逻辑思维和运算能力体现逻辑思维和运算能力,F2体现空间思维和推理能力体现空间思维和推理能力本讲稿第十八页,共一百一十一页二、正交因子模型中各个量的统计意义二、正交因子模型中各个量的统计意义1.1.因子载荷的统计意义因子载荷的统计意义因子载荷的统计意义因子

18、载荷的统计意义因子负荷量因子负荷量(或称因子载荷或称因子载荷)是指因子结构中原始变量与因子分析时抽取出是指因子结构中原始变量与因子分析时抽取出的公共因子的相关程度的公共因子的相关程度.由因子模型由因子模型(8.2.1)及及(8.2.4)可知可知,Xi与与Fj的协方差的协方差本讲稿第十九页,共一百一十一页如果如果Xi是标准化变量是标准化变量(即即E(Xi)=0,Var(Xi)=1),即即Xi为为则则本讲稿第二十页,共一百一十一页 在各公共因子不相关的前提下在各公共因子不相关的前提下,(载荷矩阵中载荷矩阵中第第i行行,第第j列的元素列的元素)是随机变量是随机变量Xi与公共因子与公共因子Fj的相的相

19、关系数关系数,统计术语叫做统计术语叫做“权重权重”,它表示它表示Xi依赖依赖Fj的分的分量量(比重比重).由于历史的原因由于历史的原因,在心理学中将模型在心理学中将模型(8.2.1)中的系数中的系数叫做叫做“载荷载荷”,即第即第i个变量在第个变量在第j个因个因子上的载荷子上的载荷(或负荷或负荷),反映了第反映了第i个原始变量在第个原始变量在第j个公个公共因子上的相对重要性共因子上的相对重要性.因此因此绝对值越大绝对值越大,则公共则公共因子因子Fj与原始变量与原始变量Xi的关系越强的关系越强.本讲稿第二十一页,共一百一十一页2.变量共同度的统计意义变量共同度的统计意义共同度共同度共同度共同度又称

20、共性方差或公因子方差又称共性方差或公因子方差(community或或commonvariance)就就是变量与每个公共因子之负荷量的平方总和是变量与每个公共因子之负荷量的平方总和(一行中所有因素负荷量的平方和一行中所有因素负荷量的平方和).变量的共同度是因子载荷矩阵变量的共同度是因子载荷矩阵A 的各行的元素的平方和的各行的元素的平方和hi2.记为记为从共同性的大小可以判断这个原始实测变量与公共因子之间从共同性的大小可以判断这个原始实测变量与公共因子之间从共同性的大小可以判断这个原始实测变量与公共因子之间从共同性的大小可以判断这个原始实测变量与公共因子之间的关系程度的关系程度的关系程度的关系程度

21、.如因子分析案例中如因子分析案例中:共同度共同度h12=(0.896)2+(0.341)2=0.919本讲稿第二十二页,共一百一十一页为了给出为了给出hi2的统计意义的统计意义,下面来计算下面来计算Xi的方差的方差:左式表明左式表明Xi的方差由两部分组成的方差由两部分组成,第一第一部分部分hi2是全部公共因子对变量是全部公共因子对变量Xi的的总方差所作出的贡献总方差所作出的贡献,称为称为公因子公因子公因子公因子方差方差方差方差;第二部分第二部分 i2是由特定因子是由特定因子 i产产生的方差生的方差,它仅与变量它仅与变量Xi有关有关,也称也称为为剩余方差剩余方差剩余方差剩余方差.本讲稿第二十三页

22、,共一百一十一页所有的公共因子和特殊因子对变量所有的公共因子和特殊因子对变量Xi的贡献为的贡献为1,即即hi2+i21.hi2反映反映了全部公共因子对变量了全部公共因子对变量Xi的影响的影响,是全部公共因是全部公共因子对变量方差所做出的子对变量方差所做出的贡献贡献,或者说或者说Xi对公共因子的共同依赖程度对公共因子的共同依赖程度,称为公共因子对变量称为公共因子对变量Xi的方的方差贡献差贡献.hi2接近于接近于1,表明该变量的原始信息几乎都被选取的公共因子说明了表明该变量的原始信息几乎都被选取的公共因子说明了.hi2反映了变量反映了变量Xi对公因子对公因子F依赖的程度依赖的程度,故也称公因子方差

23、故也称公因子方差hi2为变量为变量Xi的的共同共同共同共同度度度度.特殊因子的方差特殊因子的方差 i2(剩余方差剩余方差),反映了原始变量方差中无法被公共反映了原始变量方差中无法被公共因子描述的比例因子描述的比例,即各变量的特殊因素影响的大小即各变量的特殊因素影响的大小,就是就是1减掉该变量减掉该变量共同度的值共同度的值.如因子分析案例中如因子分析案例中:i2=1-0.919=0.081本讲稿第二十四页,共一百一十一页3.3.公共因子公共因子公共因子公共因子F Fj的方差贡献的统计意义的方差贡献的统计意义的方差贡献的统计意义的方差贡献的统计意义在因子载荷矩阵在因子载荷矩阵A 中中,求求A 的各

24、列的平方和的各列的平方和,记为记为qj2,即即qj2的统计意义与的统计意义与Xi的共同度的共同度hi2恰好相反恰好相反,qj2表示第表示第j 个公共因子个公共因子Fj对对X的的所有分量所有分量X1,Xp的总影响的总影响,称为第称为第j 个公因子个公因子Fj 对对X 的贡献的贡献,它是衡量它是衡量第第j 个公共因子相对重要性的指标个公共因子相对重要性的指标.方差贡献方差贡献方差贡献方差贡献q qj j2 2即即每个变量与某一共同每个变量与某一共同因素之因素负荷量的平方总和因素之因素负荷量的平方总和(因子载荷矩阵中某一公共因子列所有因子载荷矩阵中某一公共因子列所有因子负荷量的平方和因子负荷量的平方

25、和),又称为又称为特征值特征值特征值特征值.如因子分析案例中如因子分析案例中:F1的方差贡献为的方差贡献为=(0.896)2+(0.802)2+(0.516)2+(0.841)2+(0.833)2=3.113本讲稿第二十五页,共一百一十一页qj2愈大愈大,表明表明Fj 对对X 的贡献愈大的贡献愈大,该因子的重要程度越高该因子的重要程度越高.如果我们把如果我们把载荷矩阵载荷矩阵A的各列平方和都计算的各列平方和都计算,使相应的贡献有顺序使相应的贡献有顺序:q12qm2,我们就我们就能够以此为依据能够以此为依据,找出最有影响的公共因子找出最有影响的公共因子.要解决此问题要解决此问题,关键是求关键是求

26、载荷矩阵载荷矩阵A的估计的估计.方差贡献率方差贡献率方差贡献率方差贡献率指公共因子对实测变量的贡献指公共因子对实测变量的贡献,又称变异量又称变异量.方差贡献率方差贡献率方差贡献率方差贡献率=方差贡献方差贡献方差贡献方差贡献q qj2/实测变量数实测变量数实测变量数实测变量数 p,是衡量公共因子相对重要性的指标是衡量公共因子相对重要性的指标.qj2越大越大,表明公共因子表明公共因子Fj对对X 的贡的贡献越大献越大,该因子的重要程度越高该因子的重要程度越高.如因子分析案例中如因子分析案例中:F1的贡献率为的贡献率为3.113/5=62.26%本讲稿第二十六页,共一百一十一页 【注】【注】关于因子模

27、型有下列两点需要指出关于因子模型有下列两点需要指出(书书P298):(1)模型不受量纲的影响模型不受量纲的影响.(2)因子载荷矩阵因子载荷矩阵A不是唯一的不是唯一的.本讲稿第二十七页,共一百一十一页例例8.2.1已知已知的协方差阵的协方差阵 为为试求满足试求满足(8.2.3)式的因子载荷矩阵式的因子载荷矩阵A 和特殊因子协方差和特殊因子协方差阵阵D,并计算并计算X1的共同度的共同度.本讲稿第二十八页,共一百一十一页解解解解:容易验证容易验证本讲稿第二十九页,共一百一十一页因而因子载荷矩阵因而因子载荷矩阵A 和特殊因子协方差阵和特殊因子协方差阵D分别为分别为即即X的协方差阵的协方差阵 具有具有m

28、=2的正交因子模型结构的正交因子模型结构,且且X1的共同度为的共同度为第一个特殊因子第一个特殊因子 1的方差的方差 12=2,X1的方差可分解为的方差可分解为即即方差共同度特殊方差方差共同度特殊方差对对Xi(i=2,3,4)也有类似地分解也有类似地分解.本讲稿第三十页,共一百一十一页8.3参数估计方法参数估计方法已知已知p 个相关变量的个相关变量的n 次观测值次观测值(i=1,2,n).因子分析的目的是用少数几个公共因子因子分析的目的是用少数几个公共因子(设为设为m个个)来来描述描述p个相关变量间的协方差结构个相关变量间的协方差结构:其中其中A=(aij)为为pm的因子载荷矩阵的因子载荷矩阵;

29、D=diag(12,p2)为为p阶对角阶对角矩阵矩阵.也就是估计公共因子的个数也就是估计公共因子的个数m、因子载荷矩阵、因子载荷矩阵A及特殊因子及特殊因子方差方差 i2(i=1,p),使得满足使得满足本讲稿第三十一页,共一百一十一页由由p 个相关变量的观测数据计算样本协方差阵个相关变量的观测数据计算样本协方差阵S,作为协方差阵的估计作为协方差阵的估计.为了建立公因子模型为了建立公因子模型,首先要首先要估计因子载荷估计因子载荷aij和特殊因子方差和特殊因子方差 i2.常用的参数估常用的参数估计方法有一下几种计方法有一下几种:主成分法主成分法,主因子解主因子解和和极大似然极大似然法法.本讲稿第三十

30、二页,共一百一十一页一、主成分法一、主成分法(基于主成分模型的主成分分析法基于主成分模型的主成分分析法Principalcomponents)设样本协方差阵设样本协方差阵S 的特征值为的特征值为 1 2 p0,相应单位正交特征向相应单位正交特征向量为量为l1,l2,lp,则则S 有谱分解式有谱分解式:本讲稿第三十三页,共一百一十一页当最后当最后pm个特征值较小时个特征值较小时,S 可近似地分解为可近似地分解为(8.3.1)本讲稿第三十四页,共一百一十一页其中其中def(8.3.2)(8.3.2)式给出的式给出的A 和和D 就是因子模型的一个解就是因子模型的一个解.载荷矩阵载荷矩阵A 中第中第j

31、 列列(即第即第j 个公共因子个公共因子Fj 在在X 上的载荷上的载荷)和和X 的第的第j 个主成分的系个主成分的系数相差一个倍数数相差一个倍数故故(8.3.2)式给出的这个解常式给出的这个解常称为因子模型的称为因子模型的主成分解主成分解主成分解主成分解.本讲稿第三十五页,共一百一十一页公因子个数公因子个数m 的确定方法一般有两种的确定方法一般有两种,一是根据实际问题的一是根据实际问题的意义或专业理论知识来确定意义或专业理论知识来确定;二是用确定主成分个数的原则二是用确定主成分个数的原则,选选m为满足为满足:的最小整数的最小整数(比如取比如取P00.70且且P0m,所以不能得,所以不能得到精确

32、的得分,只能通过估计。到精确的得分,只能通过估计。l l因子得分的计算方法:因子得分的计算方法:(1)运用回归分析思想求解)运用回归分析思想求解(2)Bartlett法法(即即:加权最小二乘法加权最小二乘法)本讲稿第六十七页,共一百一十一页(1 1)运用回归分析思想求解)运用回归分析思想求解本讲稿第六十八页,共一百一十一页则,我们有如下的方程组:则,我们有如下的方程组:本讲稿第六十九页,共一百一十一页(j=1,2,m)本讲稿第七十页,共一百一十一页注注:共需要解共需要解m次才能解出所有的得分函数的系数次才能解出所有的得分函数的系数.本讲稿第七十一页,共一百一十一页(2)Bartlett法法(即

33、:加权最小二乘法)即:加权最小二乘法)l把一个个体的把一个个体的p个变量的取值个变量的取值X*当作因变量,把求因子当作因变量,把求因子解中得到的解中得到的A作为自变量数据阵,对于这个个体在公因作为自变量数据阵,对于这个个体在公因子上的取值子上的取值f,当作未知参数,而特殊因子的取值看,当作未知参数,而特殊因子的取值看作误差作误差e,于是得到如下的线性回归模型:,于是得到如下的线性回归模型:X*=Af+e,则称未知参数,则称未知参数f为取值为为取值为X*的因子得分。的因子得分。最小二乘法最小二乘法本讲稿第七十二页,共一百一十一页案例分析:案例分析:国民生活质量的因素分析国民生活质量的因素分析 国

34、国家家发发展展的的最最终终目目标标,是是为为了了全全面面提提高高全全体体国国民民的的生生活活质质量量,满满足足广广大大国国民民日日益益增增长长的的物物质质和和文文化化的的合合理理需需求求。在在可可持持续续发发展展消消费费的的统统一一理理念念下下,增增加加社社会会财财富富,创创造造更更多多的的物物质质文文明明和和精精神神文文明明,保保持持人人类类的的健健康康延延续续和和生生生生不不息息,在在人人类类与与自自然然协协同同进进化化的的基基础础上上,维维系系人人类类与与自自然然的的平平衡衡,达达到到完完整整的的代代际际公公平平和和区区际际公平公平(即时间过程的最大合理性与空间分布的最大合理化即时间过程

35、的最大合理性与空间分布的最大合理化)。从从1990年年开开始始,联联合合国国开开发发计计划划署署(UYNP)首首次次采采用用“人人文文发发展展系系数数”指指标标对对于于国国民民生生活活质质量量进进行行测测度度。人人文文发发展展系系数数利利用用三三类类内内涵涵丰丰富富的的指指标标组组合合,即即人人的的健健康康状状况况(使使用用出出生生时时的的人人均均预预期期寿寿命命表表达达)、人人的的智智力力程程度度(使使用用组组合合的的教教育育成成就就表表达达)、人人的的福福利利水水平平(使使用用人人均均国国民民收收入入或或人人均均GDP表表达达),并并且且特特别别强强调调三三类类指指标标组组合合的的整整体体

36、表表达达内内涵涵,去去衡衡量量一一个个国国家家或或地地区区的的社社会会发发展展总总体体状状况况以以及及国民生活质量的总水平。国民生活质量的总水平。本讲稿第七十三页,共一百一十一页在这个指标体系中有如下的指标:在这个指标体系中有如下的指标:X1预期寿命预期寿命X2成人识字率成人识字率X3综合入学率综合入学率X4人均人均GDP(美元美元)X5预期寿命指数预期寿命指数X6教育成就指数教育成就指数X7人均人均GDP指数指数本讲稿第七十四页,共一百一十一页旋转后的因子结构旋转后的因子结构RotatedFactorPatternFACTOR1FACTOR2FACTOR3X10.381290.417650.

37、81714X20.121660.848280.45981X30.648030.618220.22398X40.904100.205310.34100X50.388540.432950.80848X60.282070.853250.43289X70.900910.206120.35052FACTOR1FACTOR1为经济发展因子为经济发展因子为经济发展因子为经济发展因子 FACTOR2FACTOR2为教育成就因子为教育成就因子为教育成就因子为教育成就因子 FACTOR3FACTOR3为健康水平因子为健康水平因子为健康水平因子为健康水平因子本讲稿第七十五页,共一百一十一页StandardizedS

38、coringCoefficients(标准化得分系数标准化得分系数)FACTOR1FACTOR2FACTOR3X1-0.18875-0.343970.85077X2-0.241090.60335-0.10234X30.354620.50232-0.59895X40.53990-0.17336-0.10355X5-0.17918-0.316040.81490X6-0.092300.62258-0.24876本讲稿第七十六页,共一百一十一页 生育率的影响因素分析生育率的影响因素分析生育率的影响因素分析生育率的影响因素分析生育率受社会、经济、文化、计划生育政策等很多因素影响,生育率受社会、经济、文化

39、、计划生育政策等很多因素影响,但这些因素对生育率的影响并不是完全独立的,而是交织在一起,但这些因素对生育率的影响并不是完全独立的,而是交织在一起,如果直接用选定的变量对生育率进行多元回归分析,最终结果往如果直接用选定的变量对生育率进行多元回归分析,最终结果往往只能保留两三个变量,其他变量的信息就损失了。因此,考虑往只能保留两三个变量,其他变量的信息就损失了。因此,考虑用因子分析的方法,找出变量间的数据结构,在信息损失最少的用因子分析的方法,找出变量间的数据结构,在信息损失最少的情况下用新生成的因子对生育率进行分析。情况下用新生成的因子对生育率进行分析。选择的变量有:多子率、综合节育率、初中以上

40、文化程选择的变量有:多子率、综合节育率、初中以上文化程度比例、城镇人口比例、人均国民收入。下表是度比例、城镇人口比例、人均国民收入。下表是1990年中年中国国30个省、自治区、直辖市的数据个省、自治区、直辖市的数据。本讲稿第七十七页,共一百一十一页本讲稿第七十八页,共一百一十一页特征根与各因子的贡献特征根与各因子的贡献Eigenvalue特征值特征值DifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94

41、310.184131090.083536290.03680.97990.100594800.02011.0000本讲稿第七十九页,共一百一十一页没有旋转的因子结构没有旋转的因子结构Factor1Factor2X1-0.760620.55316X20.56898-0.76662X30.891840.25374X40.870660.34618X50.890760.36962本讲稿第八十页,共一百一十一页各旋转后的共同度各旋转后的共同度0.884540230.911439980.859770610.877894530.93006369Factor1可解释方差可解释方差Factor2可解释方差可解释方

42、差2.99754292.1642615本讲稿第八十一页,共一百一十一页在这个例子中我们得到了两个因子,第一个因子是社会经济在这个例子中我们得到了两个因子,第一个因子是社会经济发展水平因子,第二个是计划生育因子。有了因子得分值后,则发展水平因子,第二个是计划生育因子。有了因子得分值后,则可以利用因子得分为变量,进行其他的统计分析。可以利用因子得分为变量,进行其他的统计分析。Factor1Factor2x1-0.35310-0.87170 x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728Factor1Factor2x1

43、-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋转后的因子结构方差最大旋转后的因子结构标准化得分函数标准化得分函数本讲稿第八十二页,共一百一十一页因子分析的因子分析的SPSS上机操作过程上机操作过程(1)(1)(1)(1)选择分析变量选择分析变量选择分析变量选择分析变量 选选SPSSAnalyze菜单中的菜单中的(DataReduction)(Factor),出现出现【FactorAnalysis】对话框;】对话框;在在【FactorAnalysis】对话框中左边的原

44、始变量中,选择】对话框中左边的原始变量中,选择将进行因子分析的变量选入将进行因子分析的变量选入(Variables)栏。栏。本讲稿第八十三页,共一百一十一页本讲稿第八十四页,共一百一十一页(2)(2)(2)(2)设置描述性统计量设置描述性统计量设置描述性统计量设置描述性统计量在在【FactorAnalysis】框中选】框中选【Descriptives】按钮,出现】按钮,出现【Descriptives】对话框;】对话框;选择选择Initialsolution(未转轴的统计量)选项(未转轴的统计量)选项选择选择KMO选项选项点击(点击(Contiue)按钮确定。)按钮确定。提供描述性统计量和与相关

45、矩阵有提供描述性统计量和与相关矩阵有提供描述性统计量和与相关矩阵有提供描述性统计量和与相关矩阵有关的统计量关的统计量关的统计量关的统计量本讲稿第八十五页,共一百一十一页显示各观测变量显示各观测变量的均值和标准差的均值和标准差显示公因子方差、显示公因子方差、特征值、各因子解特征值、各因子解释的方差比例和累释的方差比例和累计比例计比例观测变量的相关系数观测变量的相关系数矩阵矩阵每个相关系数的每个相关系数的显著水平显著水平相关系数矩阵的行相关系数矩阵的行列式列式相关系数矩阵的相关系数矩阵的逆矩阵逆矩阵由因子模型估计出的由因子模型估计出的相关系数及残差相关系数及残差反应象相关系反应象相关系数数KMO测

46、度和巴特利测度和巴特利特球体检验特球体检验本讲稿第八十六页,共一百一十一页(3)设置对因子的抽取选项)设置对因子的抽取选项在在【FactorAnalysis】框中点击】框中点击【Extraction】按钮】按钮,出现出现【FactorAnalysis:Extraction】对话框;】对话框;在在Method栏中选择栏中选择(Principalcomponents)选项;选项;在在Analyze栏中选择栏中选择Correlationmatrix选项;选项;在在Display栏中选择栏中选择Unrotatedfactorsolution选项;选项;在在Extract栏中选择栏中选择Eigenval

47、uesover并填上并填上1;点击点击(Contiue)按钮确定,回到按钮确定,回到【FactorAnalysis】对话框中。】对话框中。本讲稿第八十七页,共一百一十一页提供和因子提取有关的选项提供和因子提取有关的选项提供和因子提取有关的选项提供和因子提取有关的选项本讲稿第八十八页,共一百一十一页选择提取因子的选择提取因子的方法方法决定提取决定提取因子的个因子的个数数直接指定提取直接指定提取的因子的个数的因子的个数指定与初始有关指定与初始有关的输出项的输出项显示未经旋转的显示未经旋转的因子解因子解显示碎石图显示碎石图指定因子分析收敛指定因子分析收敛的最大迭代次数的最大迭代次数.系系统默认值是统

48、默认值是25.本讲稿第八十九页,共一百一十一页其中选择的方法其中选择的方法,从上到下依次是:从上到下依次是:主成分分析主成分分析普通最小二乘法普通最小二乘法广义最小二乘法广义最小二乘法最大似然法最大似然法主轴因子法主因子解法主轴因子法主因子解法 因子提取法因子提取法映象分析法映象分析法本讲稿第九十页,共一百一十一页(4)(4)(4)(4)设置因子转轴设置因子转轴设置因子转轴设置因子转轴 在在【FactorAnalysis】对话框中,点击】对话框中,点击【Rotation】按钮按钮,出现出现【FactorAnalysis:Rotation】(因子分析因子分析:旋转旋转)对话框。对话框。在在Met

49、hod栏中选择栏中选择Varimax(最大变异法最大变异法)在在Display栏中选择栏中选择Rotatedsolution(转轴后的解转轴后的解)点击点击(Contiue)按钮确定,回到按钮确定,回到【FactorAnalysis】对话框中。】对话框中。提供和因子旋转有关的选项提供和因子旋转有关的选项提供和因子旋转有关的选项提供和因子旋转有关的选项本讲稿第九十一页,共一百一十一页选择因子旋转选择因子旋转的方法的方法不进行旋转不进行旋转方差最大法方差最大法斜交旋转法斜交旋转法四次方最大法四次方最大法等量最大法等量最大法指定输指定输出项出项显示旋转后的显示旋转后的因子解因子解显示因子负显示因子负

50、载图载图指定旋转收敛的最大迭代指定旋转收敛的最大迭代次数次数.系统默认值为系统默认值为25.本讲稿第九十二页,共一百一十一页(5)(5)(5)(5)设置因素分数设置因素分数设置因素分数设置因素分数 在在【FactorAnalysis】对话框中,点击【】对话框中,点击【Scores】按钮按钮,出现出现【FactorAnalysis:Scores】(因素分析因素分析:分数分数)对话框对话框.一般取默认值一般取默认值.点击点击(Contiue)按钮确定按钮确定,回到回到【FactorAnalysis】对话框】对话框.提供和因子值有关的选项提供和因子值有关的选项本讲稿第九十三页,共一百一十一页指定计算

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁