《SPSS因子分析与对应分析(精品).ppt》由会员分享,可在线阅读,更多相关《SPSS因子分析与对应分析(精品).ppt(67页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第第1212章章 因子分析与对应分析因子分析与对应分析 FACTOR 返回返回目 录 因子分析因子分析主成分分析与因子分析概述因子分析过程(操作)因子分析实例利用因子得分进行聚类市场研究中的顾客偏好分析习题及参考答案 对应分析对应分析对应分析过程(操作)对应分析实例习题及参考答案 结束返回返回主成分分析与与因子分析主成分分析与因子分析概述主成分分析与因子分析概述 身高体重数据身高体重数据 变量观测量i身高h体重w1h1w12h2w23h3w34h4w4nhnwn主成分概念示意图主成分概念示意图 用p1一个指标来代替原始变量h、w研究n个观测对象的差异。p1、p2可以用原始变量h、w的线性组合
2、来表示:主成分分析与因子分析概述主成分分析与因子分析概述 变量j观测量ix1x2x3x4x5xm1x11x12x13x14x15x1m2x21x22x23x24x25x2m3x31x32x33x34x35x3m4x41x42x43x44x45x4m5x51x52x53x54x55x5mnxn1xn2xn3xn4xn5xnm参与因子分析的观测量与变量数据 主成分分析中的主要统计量主成分分析中的主要统计量 返回返回主成分分析与因子分析概述主成分分析与因子分析概述第第i个特征值个特征值 关于特征方程的根关于特征方程的根 主成分分析与因子分析概述主成分分析与因子分析概述第第i个成分的贡献率:个成分的贡
3、献率:前前k k个成分的累计贡献率个成分的累计贡献率 返回返回主成分分析与因子分析概述主成分分析与因子分析概述为为第第i个成分和第个成分和第j个个变变量的相关系数量的相关系数返回返回载荷载荷(loading)因子分析的概念因子分析的概念设有原始变量:设有原始变量:x1,x2,x3,xm。它们与潜在因子之间的关系可以表示为。它们与潜在因子之间的关系可以表示为 其中z1zm为m个潜在因子,共性因子共性因子;e1em为个性因子个性因子 返回返回因子分析的概念因子分析的概念公因子数为公因子数为k,初始因子模型为:,初始因子模型为:其中是是对对原始原始变变量量进进行均行均值为值为0,标标准差准差为为1标
4、标准化后的准化后的变变量。量。fi 为第为第i个因子,个因子,ij 为为 xI 在共性因子在共性因子 fi 上的载荷上的载荷 返回返回因子分析的概念因子分析的概念,记记做做 由两部分组成:由两部分组成:共性方差:共性方差:特性方差特性方差V(e)前前k个因子,共性方差为:个因子,共性方差为:返回返回因子分析菜单因子分析菜单返回返回因子分析主对话框因子分析主对话框 现以对12个地区的5个经济指标的调查数据进行因子分析为例,本数据是美国洛杉矶标准大城市统计区中的12个人口调查区的五个经济学变量的数据。返回返回因子分析简单实例输出因子分析简单实例输出1 1返回返回总方差分解总方差分解返回返回因子载荷
5、阵因子载荷阵因子分析简单实例输出因子分析简单实例输出2 2选择描述统计量的子对话框选择描述统计量的子对话框 返回返回因子提取子对话框因子提取子对话框 返回返回有关旋转方法选择的子对话框有关旋转方法选择的子对话框 返回返回因子得分选择项子对话框因子得分选择项子对话框 返回返回选择输出项对话框选择输出项对话框 返回返回因子分析实例输出因子分析实例输出1 1返回返回原始变量的相关矩阵原始变量的相关矩阵因子分析实例输出因子分析实例输出2 2返回返回旋转前的因子载荷阵旋转前的因子载荷阵因子分析实例输出因子分析实例输出3 3因子得分系数因子得分系数旋转后的因子与原始变量的相关阵旋转后的因子与原始变量的相关
6、阵返回返回旋转后的因子载荷阵旋转后的因子载荷阵因子分析实例输出因子分析实例输出4 4返回返回各成分特征值的碎石图各成分特征值的碎石图旋转后的主成分图旋转后的主成分图因子分析实例输出因子分析实例输出5 5返回返回各观测量的两个因子得分的新变量各观测量的两个因子得分的新变量利用因子得分聚类实例输出利用因子得分聚类实例输出1 1 相似性矩阵相似性矩阵 返回返回利用因子得分聚类实例输出利用因子得分聚类实例输出2返回返回聚为聚为2、3和和4类的各观测量分类结果类的各观测量分类结果利用因子得分聚类实例输出利用因子得分聚类实例输出3返回返回平均连接法形成的冰柱图平均连接法形成的冰柱图利用因子得分聚类实例输出
7、利用因子得分聚类实例输出4返回返回反映聚类全过程的树形图反映聚类全过程的树形图利用因子得分变量作散点图利用因子得分变量作散点图输出输出1返回返回以编号标识的散点图以编号标识的散点图以类号标识的散点图以类号标识的散点图排序后的数据排序后的数据 返回返回市场研究中的顾客偏好分析输出市场研究中的顾客偏好分析输出1 1 初始因子载荷阵初始因子载荷阵 前前3 3个因子(成分)方差解释个因子(成分)方差解释 返回返回市场研究中的顾客偏好分析输出市场研究中的顾客偏好分析输出2 2 返回返回特征值散点图特征值散点图市场研究中的顾客偏好分析输出市场研究中的顾客偏好分析输出3 3数据文件中的三个新变量数据文件中的
8、三个新变量因子得分因子得分返回返回1717种车型的因子得分散点图种车型的因子得分散点图 返回返回2525个顾客的偏好散点图个顾客的偏好散点图返回返回对对 应应 分分 析析概述(略)返回返回对应分析菜单返回返回 对原始数据加权对话框对原始数据加权对话框 返回返回对应分析主对话框对应分析主对话框 定义行变量定义行变量返回返回指定行变量的数值范围对话框指定行变量的数值范围对话框返回返回定义列变量对话框定义列变量对话框返回返回列变量的数值范围对话框列变量的数值范围对话框返回返回对应分析对应分析-模型选择对话框模型选择对话框返回返回输出统计量和输出项对话框输出统计量和输出项对话框返回返回输出的统计图形对
9、话框输出的统计图形对话框返回返回对应分析实例输出对应分析实例输出1 1返回返回对应表对应表对应分析实例输出对应分析实例输出2 2返回返回行、列归一化处理表行、列归一化处理表对应分析实例输出对应分析实例输出3 3汇总表汇总表返回返回对应分析实例输出对应分析实例输出4 4返回返回行、列得分图行、列得分图习题习题12121.1.简述主成分分析的基本思想。简述主成分分析的基本思想。2.2.用什么统计量衡量主成分中各成分提供的信息量?用什么统计量衡量主成分中各成分提供的信息量?3.3.一般根据什么确定主成分提取的数量?一般根据什么确定主成分提取的数量?4.4.简述因子分析的基本思想。简述因子分析的基本思
10、想。5.5.为什么要对初始因子分析结果进行旋转?为什么要对初始因子分析结果进行旋转?6.6.简述对应分析的基本思想,对应分析与因子分析有什么简述对应分析的基本思想,对应分析与因子分析有什么不同?不同?7.7.数据数据data12-04data12-04是某医院是某医院3 3年中各月的数据,包括门诊人年中各月的数据,包括门诊人次、出院人数、病床利用率和周转次数、平均住院天数、次、出院人数、病床利用率和周转次数、平均住院天数、治愈或好转率、病死率、诊断符合率、抢救成功率。采用治愈或好转率、病死率、诊断符合率、抢救成功率。采用因子分析法探讨综合评价指标。因子分析法探讨综合评价指标。8.8.数据数据d
11、ata12-05data12-05是是19971997年全国年全国3131个省市自治区按各种经济个省市自治区按各种经济类型资产占总资产比重(类型资产占总资产比重(%)的数据,试对其作对应分析。)的数据,试对其作对应分析。返回返回习题参考答案习题参考答案1.从众多的原始变量中根据他们之间的相关性找出几个综合指标,每个综合指标都是原始变量的线性组合。这些指标包含了原始变量的大部分信息。由于综合指标的数量大大低于原始变量数目,从而大大降低了分析计算的工作量。对被研究对象的描述也会因为维数的降低更加容易。2.各成分提供的信息量用方差来衡量。因为主成分分析是把原始变量的总方差分解为各成分的方差。原始变量
12、的总方差等于各成分方差之和(原始变量标准化后总方差等于变量个数)。每个成分即每个综合指标的方差在总方差中的比值就是他的贡献率,贡献率越大说明他对解释原始变量之间差异的能力越大即他包含的信息量越大。因此各成分提供的信息量用方差来衡量。3.一般主成分数的确定主要看:(1)累计贡献率。各成分的方差按降序排序后,前n个成分的累计贡献率达到某个特定值时就取n个成分作为原始变量的主成分。一般要求达到70%以上,否则丢失信息量太大。(2)取特征值=1的的成分定为主成分。4.在研究工作中往往存在不可直接观察到的现象或因素,这些因素表现在各个可以观测到的指标之中。因子分析就是根据可观测到的变量之间的相关性探讨对
13、这种相关性起支配作用的潜在因素的方法。返回返回习题参考答案习题参考答案5、因子分析的目的不仅仅是找出公因子,更重要的是探讨各因子的专业意义,从而达到分析实际问题的目的。但是在因子分析的初始结果中,各因子的代表变量往往不是能集中表达其专业意义的,因此很难对公因子进行命名和解释。由于因子分解的解并不唯一,可以通过将因子载荷阵乘以一个正交旋转矩阵,得到因子矩阵的变换(旋转)可以解决上述问题。6、见书中p506返回返回习题参考答案习题参考答案第6题:操作过程:用主成分法进行因子分析。返回返回习题参考答案习题参考答案执行的程序:FACTOR /VARIABLES x1 x2 x3 x4 x5 x6 x7
14、 x8 x9 /MISSING LISTWISE/ANALYSIS x1 x2 x3 x4 x5 x6 x7 x8 x9 /PRINT INITIAL CORRELATION SIG EXTRACTION ROTATION FSCORE /FORMAT SORT /PLOT EIGEN ROTATION /CRITERIA FACTORS(4)ITERATE(25)/EXTRACTION PC /CRITERIA ITERATE(25)/ROTATION VARIMAX /SAVE REG(ALL)/METHOD=CORRELATION.返回返回第第7题参考答案题参考答案1描述统计量和相关矩阵
15、。描述统计量和相关矩阵。返回返回第第7题参考答案题参考答案2按按特征值大于等于特征值大于等于1原则提取前原则提取前3个成分为主成分,累计百分比达到个成分为主成分,累计百分比达到69.4%,少点;,少点;如果提取如果提取4个,累计百分比达到个,累计百分比达到78.1%返回返回第第7题参考答案题参考答案3从碎石图可以看出在第四个主成分处是明显的拐点。因此取4个主成分比较合适返回返回第第7题参考答案题参考答案4旋转前后的各成分与原始变量的相关阵。旋转前的相关系数矩阵不好解释,旋转后则较好命名各因子。下面试对各因子命名(仅供参考)第一因子:医院职能因子是个综合因子。第二因子:(经济)效率因子第三因子:
16、水平(效果)因子第四因子:人气因子返回返回第第7题参考答案题参考答案5通过回归方法得出的各成分分数的系数矩阵。可以裾此写出各主成分分数的表达式。返回返回第第8题参考答案题参考答案1各经济类别占总资产的比例定义为加权变量返回返回定义加权变量定义加权变量122-12-2第第8题参考答案题参考答案2返回返回第三步:输入变量、设定参数第三步:输入变量、设定参数第第8题参考答案题参考答案3(对应表)(对应表)返回返回第第8题参考答案题参考答案4(对应图)(对应图)返回返回输出结果及其解释输出结果及其解释根据上图可将变量点和样品点分为三类:一类:变量点为:港澳台经济/总资产样品点为:福建、广东。二类:变量
17、点为:联营经济/总资产、股份制经济/总资产、外商投资经济/总资产样品点为:北京、上海、天津、江苏、浙江、海南。三类:变量点为:国有经济/总资产、集体经济/总资产样品点为:除上述省市以外的其它省份。从我国各地经济发展的实际情况来看,这样的分类还是比较符合实际的。在第一类中,样品点为:福建、广东,属东南沿海省份,港澳台华侨较多,所以港澳台经济占主导。在第二类中,样品点为:北京、上海、天津、江苏、浙江、海南,这些省市经济发达,开放程度高,所以,联营经济、股份制经济和外商投资经济占主导。第三类是其它省份,由于这些省份受传统因素的影响较大,所以国有经济和集体经济仍占主导。返回返回充分利用数据,探求深层信息!返回返回返回返回