因子分析主成分分析精选PPT.ppt

上传人:石*** 文档编号:47506905 上传时间:2022-10-02 格式:PPT 页数:89 大小:6.88MB
返回 下载 相关 举报
因子分析主成分分析精选PPT.ppt_第1页
第1页 / 共89页
因子分析主成分分析精选PPT.ppt_第2页
第2页 / 共89页
点击查看更多>>
资源描述

《因子分析主成分分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《因子分析主成分分析精选PPT.ppt(89页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于因子分析主成分分析第1页,讲稿共89张,创作于星期日问题的提出问题的提出假定你现在掌握了一个区域内假定你现在掌握了一个区域内评价自然评价自然资源的多个指标资源的多个指标。这些指标从不同的侧面。这些指标从不同的侧面反映所评价自然资源特征反映所评价自然资源特征 如果让你分析该区域的自然资源情况,如果让你分析该区域的自然资源情况,能不能找到能不能找到综合变量综合变量来对该区域内的发展来对该区域内的发展水平排序呢?水平排序呢?第2页,讲稿共89张,创作于星期日方法的选择方法的选择l常用方法:常用方法:l主成分分析主成分分析找出主要影响因素(主成分)找出主要影响因素(主成分)l因子分析因子分析找出公

2、共因子,该公共因子找出公共因子,该公共因子可以概括其所包含的可以概括其所包含的变量变量第3页,讲稿共89张,创作于星期日方法的选择方法的选择l主成分分析主成分分析找出主要影响因素(主成分)找出主要影响因素(主成分)l减少需要考虑的变量减少需要考虑的变量综合排序综合排序l优先考虑第一主成分优先考虑第一主成分各变量对整个样本的影响程度各变量对整个样本的影响程度第4页,讲稿共89张,创作于星期日方法的选择方法的选择l因子分析因子分析找出公共因子找出公共因子综合排序综合排序l综合考虑各公共因子综合考虑各公共因子各变量对整个样本的影响程度各变量对整个样本的影响程度第5页,讲稿共89张,创作于星期日方法的

3、选择方法的选择l主成分分析与因子分析的区别主成分分析与因子分析的区别对原始对原始数据数据的要求的要求l因子分析要求各变量互不相关因子分析要求各变量互不相关l主成分分析要考虑各变量的物理意义(即是否有些变主成分分析要考虑各变量的物理意义(即是否有些变量可以不考虑)量可以不考虑)计算计算方法方法l因子分析:要对系数矩阵做旋转因子分析:要对系数矩阵做旋转l主成分分析:不需要对系数矩阵旋转主成分分析:不需要对系数矩阵旋转第6页,讲稿共89张,创作于星期日方法的选择方法的选择l主成分分析与因子分析的主成分分析与因子分析的优缺点比较优缺点比较对原始变量的保留对原始变量的保留l因子分析:不对原始变量进行取舍

4、,只是因子分析:不对原始变量进行取舍,只是重新组合重新组合l主成分分析:主成分分析:舍弃小部分舍弃小部分原始变量原始变量对实际工作量的影响对实际工作量的影响l因子分析:对工作量减少的影响有限(因综合考虑各变量)因子分析:对工作量减少的影响有限(因综合考虑各变量)l主成分分析:大幅减少工作量(因只考虑主成分,实际工作中可以舍弃非主成分)主成分分析:大幅减少工作量(因只考虑主成分,实际工作中可以舍弃非主成分)综合排序的准确性(理论上)综合排序的准确性(理论上)l因子分析大于主成分分析因子分析大于主成分分析第7页,讲稿共89张,创作于星期日方法的选择方法的选择l分析建立在大样本的基础之上有人认为样本

5、容量要大于50个有人认为样本容量要是变量个数的10倍以上有人认为如果数据均匀,则不需要大样本有人认为第8页,讲稿共89张,创作于星期日方法的选择方法的选择l本实验适合做因子分析,不适合做主成分分本实验适合做因子分析,不适合做主成分分析析l本实验首先本实验首先详细介绍因子分析详细介绍因子分析l然后用本实验的数据,介绍然后用本实验的数据,介绍SPSS中主成分中主成分分析的方法分析的方法第9页,讲稿共89张,创作于星期日方法的选择方法的选择l因子分析试图因子分析试图:在力保数据在力保数据信息丢失最少信息丢失最少原则下原则下研究指标体系的少数几个线性组合研究指标体系的少数几个线性组合几个线性组合所构成

6、的几个线性组合所构成的综合指标综合指标能尽可能多地保能尽可能多地保留原来指标的信息留原来指标的信息这些综合指标就称这些综合指标就称公共因子公共因子。第10页,讲稿共89张,创作于星期日方法的选择方法的选择l选择几个公共因子?选择几个公共因子?因子分析的目的是因子分析的目的是简化变量简化变量,公共因子的个数应,公共因子的个数应该小于原始变量个数该小于原始变量个数保留几个公共因子?应该权衡公共因子个数和保留几个公共因子?应该权衡公共因子个数和保留的信息的程度,一般要保留的信息的程度,一般要保留原始信息的保留原始信息的85%以上。以上。第11页,讲稿共89张,创作于星期日方法的选择方法的选择lSPS

7、S适用于统计初学者或非统计学专业人适用于统计初学者或非统计学专业人员员l数据转换功能较强数据转换功能较强Spss(*.sav)Excel(*.xls)Text(*.txt)dBase(*.dbf).第12页,讲稿共89张,创作于星期日实验步骤实验步骤l1.1.数据的准备操作数据的准备操作打开打开保存数据保存数据l2.2.数据描述分析(数据描述分析(DescriptiveDescriptive)l3.3.因子分析因子分析l4.4.输出结果分析输出结果分析第13页,讲稿共89张,创作于星期日一、数据准备一、数据准备l1)首先在)首先在Excel中打开中打开“水样元素成分水样元素成分分析数据分析数据

8、”,删除表名,删除表名“水样元素成分水样元素成分分析数据分析数据”,保存数据。保存数据。l2)在)在 SPSS中打开保存好的中打开保存好的Excel数据数据第14页,讲稿共89张,创作于星期日一、数据准备一、数据准备在在Excel中删除中删除在在SPSS中自动转为列标题中自动转为列标题第15页,讲稿共89张,创作于星期日数据准备数据准备l启动启动SPSS双击双击SPSS15.0图标图标l在开始菜单中找到在开始菜单中找到SPSS 15.0 for Windows,点击。,点击。第16页,讲稿共89张,创作于星期日选择文件l选择选择 Open an existing data sourcel双击双

9、击More File第17页,讲稿共89张,创作于星期日选择文件l在文件类在文件类型中选择型中选择Excel第18页,讲稿共89张,创作于星期日选择文件l“Worksheet”表示的是Excel表格中的行范围第19页,讲稿共89张,创作于星期日数据编辑窗口数据编辑窗口lSPSS中的列名为Excel中第一行第20页,讲稿共89张,创作于星期日数据编辑窗口l左下角的两个选项卡,DataView和VariableViewl默认状态下是DataViewl切换到VariableView第21页,讲稿共89张,创作于星期日变量格式设置窗口l在VariableView中可以设置变更的名称、类型等参数名称类型

10、小数显示位数输出结果中变量的显示名称输出结果中变量内容的显示名称第22页,讲稿共89张,创作于星期日VariableViewlName更改变量名称lType选择变量类型(如numeric、string)lDecimals设定小数显示的位数lLabel分析输出结果中变量的显示名称lValues 分析输出结果中变量内容的显示名称第23页,讲稿共89张,创作于星期日结果输出窗口lOutput为结果输出窗口,可以显示我们对文件的操作信息以及对数据的分析结果第24页,讲稿共89张,创作于星期日数据格式转换l将将Excel数据转换成为数据转换成为SPSS数据数据,第25页,讲稿共89张,创作于星期日保存文

11、件l点击File菜单下的SaveAs选项第26页,讲稿共89张,创作于星期日保存文件l保存时类型为SPSS(*.sav)第27页,讲稿共89张,创作于星期日保存结果输出文件lOutput结果输出窗口点击File菜单下的SaveAs选项第28页,讲稿共89张,创作于星期日保存结果输出文件l保存时类型为SPSS(*.spo)第29页,讲稿共89张,创作于星期日因子分析的步骤:l1.判断是否需要进行因子分析判断是否需要进行因子分析判断方法:对变量进行线性回归分析(spss中的Descriptive命令可以实现)通常各变量的线性回归系数没有明显差别,为了使各变量的线性回归系数向0或1两极分化,要进行旋

12、转依据变量的相关性进行判断,采用Bartlett球检验法或KMO检验法,确定是否有进行因子分析的必要l2.如果有因子分析的必要,则进行因子分析如果有因子分析的必要,则进行因子分析第30页,讲稿共89张,创作于星期日二、数据特征描述操作:l命令命令Descriptive l该命令可完成多种该命令可完成多种统计指标统计指标:均值、中位数、众数、和均值、中位数、众数、和标准差、方差(标准差的平方)标准差、方差(标准差的平方)极大值、极小值、全距极大值、极小值、全距均值的标准误差均值的标准误差偏度、峰度。偏度、峰度。第31页,讲稿共89张,创作于星期日Descriptives过程l点击Analyze下

13、的DescriptiveStatistics(描述统计)选项,选择该选项下的Descriptives第32页,讲稿共89张,创作于星期日Descriptivesl选中待处理的变量(左侧的As.Hg等);l点击使变量As.Hg移至Variable(s)中;l选中Savestandrdizedvaluesasvariables(保存标准化值作为变量);l点击Options(选项)12第33页,讲稿共89张,创作于星期日Descriptives过程l选择所要的特征值:lMean(均数)lStd.deviation(标准差)lMinimum(最小值)lMaximum(最大值)l升序排列(Ascendi

14、ngmeans)l点击Continue第34页,讲稿共89张,创作于星期日Descriptives过程l原始数据标准化原始数据标准化将原始数据转换成标准将原始数据转换成标准Z分值并存入数据库分值并存入数据库根据原始数据与均值的大小根据原始数据与均值的大小,大于均值的为正值,大于均值的为正值,小于均值的为负值,相等的为零小于均值的为负值,相等的为零 l输出原始数据特征的描述参数,如均值、方输出原始数据特征的描述参数,如均值、方差等差等第35页,讲稿共89张,创作于星期日数据标准化l标准化过程就是将数据进行处理后,新数据具有均值为0、标准差为1的特征第36页,讲稿共89张,创作于星期日因子分析法因

15、子分析法(数据标准化数据标准化)对于具有不同级或不同单位的数据进行处理,使资料在更平等的条件下进行分析。假设为原观测值,为数据均值,S为标准差,则标准化后的观测值(标准正态变换)为第37页,讲稿共89张,创作于星期日Descriptives过程l点击OK第38页,讲稿共89张,创作于星期日Descriptives过程l标准化处理后的数据第39页,讲稿共89张,创作于星期日Descriptives过程样品数量样品数量最小值最小值最大值最大值均数均数标准差标准差第40页,讲稿共89张,创作于星期日三、因子分析l点击Analyze下的DataReduction(数据降维)选项,选择该选项下的Fact

16、or(因子分析)过程第41页,讲稿共89张,创作于星期日因子分析l1、选中待处理的变量,移至Variables第42页,讲稿共89张,创作于星期日因子分析l2、点击Descriptivesl判断是否有进行因子分析的必要Coefficients(计算相关系数矩阵)Significancelevels(显著水平)KMOandBartlettstestofsphericity(对相关系数矩阵进行统计学检验)第43页,讲稿共89张,创作于星期日因子分析l判断是否有进行因子分析的必要Inverse(倒数模式):求出相关矩阵的反矩阵(因子分析用不到)Reproduced(重制的):显示重制相关矩阵(因子分

17、析用不到)Determinant(行列式):求出前述相关矩阵的行列式值(因子分析用不到)Anti-image(反映像):求出反映像的共同量及相关矩阵。(因子分析用不到)第44页,讲稿共89张,创作于星期日因子分析Statistics选项框:l选中Univariatedescriptive单变量描述统计量(输出被选中的各变量的均数与标准差)lInitialsolution未旋转之统计量(显示未旋转前之共同性、特征值、变异数百分比及累积百分比,由于因子分析要求进行旋转操作,所以此处不必选择)l点击Continue第45页,讲稿共89张,创作于星期日因子分析l3、点击Extraction(因子提取)

18、第46页,讲稿共89张,创作于星期日因子分析l选择因子分析方法(因子分析一般使用用Principalcomponents,即公共因子分析法),该方法要求Extract选项中的特征值大于1)l输出未旋转的因子载荷矩阵(可选)第47页,讲稿共89张,创作于星期日因子分析lMethod所提供的选项有:PrincipalComponents公共因子分析法Unweightedleastsquares未加权最小平方法Generalizedleastsquares综合最小平方法Maximumlikelihood极大似然估计法Principalaxisfactoring主轴因子法Alpphafatoring因

19、子法Imagefatoring多元回归法第48页,讲稿共89张,创作于星期日因子分析l选中Principalcomponents(注:此对话框中的选项,除Display外,均为Principalcomponents法默认的选项,一般情况下,不需要更改以相关矩阵为依据提取因子变量以相关矩阵为依据提取因子变量提取特征值大于提取特征值大于1的因子作为因子变量的因子作为因子变量 旋转前输出未旋转的因子载荷矩阵旋转前输出未旋转的因子载荷矩阵 迭代到迭代到25次后终止分析次后终止分析碎石图(显示特征值的贡献率,碎石图(显示特征值的贡献率,可选)可选)此处可输入限定之因子个数此处可输入限定之因子个数 以共变

20、量矩阵为依据提取因子变量以共变量矩阵为依据提取因子变量第49页,讲稿共89张,创作于星期日因子分析l4、点击Rotation(旋转)第50页,讲稿共89张,创作于星期日因子分析l输出旋转后的因子载荷矩阵第51页,讲稿共89张,创作于星期日因子分析l选中Varimax(正交旋转l选中Rotatedsolution(输出选中后的因子载荷矩阵)l点击Continue因子载荷图:绘出因子载因子载荷图:绘出因子载荷散布图(可选)荷散布图(可选)全体旋转全体旋转四分旋转四分旋转直接斜交旋转法直接斜交旋转法旋转时执行的叠代最多次数旋转时执行的叠代最多次数六种因素旋转方法六种因素旋转方法斜交法斜交法第52页,

21、讲稿共89张,创作于星期日因子分析l因子载荷矩阵旋转使用方差最大正交旋转或斜交旋转,其他旋转方法一般不用于因子分析中l方差最大正交旋转:保持变量之间互不相关,使载荷向0、1两端分化。本实验中,认为As、Pb、Cu等变量之间无必然的联系,所以采用方差最大正交旋转l斜交旋转:在变量之间必定存在某种联系的时候使用,比如,在经济学中,人的消费心理、产品质量、文化差异之间必定会存在联系,所以用斜交旋转第53页,讲稿共89张,创作于星期日因子分析l5、点击Scores第54页,讲稿共89张,创作于星期日因子分析l选中Saveasvariables(把因子得分保存在数据文件中)l选中Regression(回

22、归因子得分)l点击Continue计算因素分数的方法计算因素分数的方法在分析结果中给出因子得分系数在分析结果中给出因子得分系数矩阵及其相关矩阵矩阵及其相关矩阵 第55页,讲稿共89张,创作于星期日因子分析Regression:回归因子得分Bartlett:极大似然估计Anderson-Rubin:Bartlett算法的改进算法计算因素分数的方法计算因素分数的方法第56页,讲稿共89张,创作于星期日因子分析l6、点击Options第57页,讲稿共89张,创作于星期日因子分析l选中Excludecaseslistwise(去除所有含缺失数据的样本、再进行分析,只要样品数据中有缺失,就删除该样品数据

23、)l选中Sortedbysize(载荷系数将按照数值大小排列,并构成矩阵)l不显示绝对值小于设定值的载荷系数,设定值范围01l点击Continue第58页,讲稿共89张,创作于星期日因子分析lExcludecasespairwise(当样品数据中缺少2个或2个以上的数据时,才删除该样品数据,选中此项最大限度的利用得来不易的数据)lRaplacewithmean(当分析计算涉及含有缺失值的变量时,用平均值代替该缺失值)第59页,讲稿共89张,创作于星期日因子分析l7、点击OK第60页,讲稿共89张,创作于星期日结果分析lSPSS输出的第一个表格列出了标准化后数据的平均值(Mean)、标准差(St

24、d.Deviation)和分析用到的取值个数(N)Univariatedescriptive单变量描述统计量(输出被选中的各变量的均数与标准差)第61页,讲稿共89张,创作于星期日结果分析l系统输出的第2个表格是8个原始变量的相关矩阵与单尾显著性检验第62页,讲稿共89张,创作于星期日结果分析l多个多个变量之间的相关系数较大变量之间的相关系数较大,说明这些变量之间存,说明这些变量之间存在着较为显著的相关性,且其对应的在着较为显著的相关性,且其对应的Sig值(显著性)值(显著性)普遍较小普遍较小,根据分析,这些数据有进行因子分析的,根据分析,这些数据有进行因子分析的必要必要。第63页,讲稿共89

25、张,创作于星期日结果分析lKMO检验法和巴特利特球形检验法(KMO and Bartlett Test of Sphericity)的检验结果第64页,讲稿共89张,创作于星期日结果分析lBartlett球形检验统计量的Sig0.01,认为各变量之间存在着显著的相关性,可以进行因子分析.第65页,讲稿共89张,创作于星期日结果分析l一般,KMO大于0.9时,认为因子分析的结果可靠,0.7以上可以接受,0.5以下可能不能接受第66页,讲稿共89张,创作于星期日结果分析lSPSS输出的第四个表格“成分矩阵”是初始的未经旋转的因子载荷矩阵第67页,讲稿共89张,创作于星期日结果分析l已选出了3个主因

26、子,以替代原有的8个变量第68页,讲稿共89张,创作于星期日结果分析lSPSS输出的第七个表格“旋转成分矩阵”是经过旋转后的因子载荷矩阵。第69页,讲稿共89张,创作于星期日结果分析l旋转后每个公因子上的载荷分配地更清晰,因子变量代表的变量相对集中,比未旋转时更容易解释各因子的意义。第70页,讲稿共89张,创作于星期日结果分析l载荷绝对值较大的因子与变量的关系更为密切,也更能代表这个变量第71页,讲稿共89张,创作于星期日结果分析l第1公因子代表Cd、Zn、As、Pb这几个变量因素l第2公因子代表Cr、P两个变量 l第3公因子代表Cu、Hg两个变量第72页,讲稿共89张,创作于星期日结果分析l

27、可以根据实际情况对第1公因子、第2公因子、第3公因子命名l我们将第1公因子命名为镉类,第2公因子命名为铬类,第3公因子命名为铜类第73页,讲稿共89张,创作于星期日结果分析lSPSS输出的第八个表格,是将Cd、Zn、As、Pb用第1因子代替、Cr、Pb用第2因子代替,Cu、Hg用第3因子代替,显示了因子分析后,提取出的各因子之间的相关性,因子之间相关性越小,结果越可靠l可以看到,本实验的各公共因子之间的相关性比较大,认为本实验的因子分析结果不可靠第74页,讲稿共89张,创作于星期日结果分析lSPSS输出的第六个表格表示各因子变量的特征值与累积贡献率提取因子的初始值提取因子的初始值旋转后提取因子

28、的值旋转后提取因子的值特征值特征值贡献率贡献率累计贡献率累计贡献率第75页,讲稿共89张,创作于星期日结果分析l由于前3个因子累计贡献率达到91.798%,根据累计贡献率大于85%的原则,故选取这三个因子提取因子的初始特征值提取因子的初始特征值旋转后提取因子的特征值旋转后提取因子的特征值特征值特征值贡献率贡献率累计贡献率累计贡献率第76页,讲稿共89张,创作于星期日结果分析lSPSS输出的第五个表格表示所提取的公共因子对该变量的信息综合、解释能力第77页,讲稿共89张,创作于星期日结果分析lAs的为0.974,可以理解为3个公共因子能够综合As的信息的97.4%;Pb的为0.581,可以理解为

29、3个公共因子能够解释As的信息的58.1%。第78页,讲稿共89张,创作于星期日结果分析l回到DataView窗口的当前数据集,会看到文件中增加了3列FAC1_1(第1因子得分)、FAC2_1(第2因子得分)和FAC3_1(第3因子得分),得分表示的是每个公共因子所占的权重。比如,本实验中表示的是每类元素的含量所占的权重。第第1公因子代表公因子代表Cd、Zn、As、Pb第第2公因子代表公因子代表Cr、P第第3公因子代表公因子代表Cu、Hg第79页,讲稿共89张,创作于星期日结果分析l我们可以通过第1因子得分来了解镉类元素的分布情况,通过第2公因子来了解铬类元素的分布情况,通过第3公因子来了解铜

30、类元素的分布情况第第1公因子代表公因子代表Cd、Zn、As、Pb第第2公因子代表公因子代表Cr、P第第3公因子代表公因子代表Cu、Hg第80页,讲稿共89张,创作于星期日结果分析l样号为Z-W-2-02的样品Cd、Zn、As、Pb含量较高,样号为C-W-06-01的样品Cr、P含量较高,样号为C-W-01-02的样品重金属含量较高第第1公因子代表公因子代表Cd、Zn、As、Pb第第2公因子代表公因子代表Cr、P第第3公因子代表公因子代表Cu、Hg第81页,讲稿共89张,创作于星期日结果分析l接下来,就是对该区发展水平排序。要用到综合得分:综合得分=因子1贡献率*因子1得分+因子2贡献率*因子2

31、得分+lzF(综合得分)46.048%*FAC1_1+24.085%*FAC2_1+21.665%*FAC3_1。提取因子的初始值提取因子的初始值旋转后提取因子的值旋转后提取因子的值特征值特征值贡献率贡献率累计贡献率累计贡献率第82页,讲稿共89张,创作于星期日结果分析l综合得分反应了总体情况,Z-W-2-02的综合得分最高,表明其所含的As、Cu、Cr等重金属离子的含量越高,反应出其污染越严重第83页,讲稿共89张,创作于星期日l接下来,介绍主成分分析的操作步骤l再次强调,本实验不适合做主成分分析第84页,讲稿共89张,创作于星期日主成分分析l主成分分析除了不需要做矩阵的旋转之外,其余操作与

32、因子分析相同第85页,讲稿共89张,创作于星期日主成分分析l主成分分析用到的两个表为:未经旋转的因子载荷矩阵(即输出结果中的componentmatrix表)未旋转之前的贡献率(即输出结果中的TotalVaricanceExplained表的ExtractionSumsofSquaredLoadings部分)第86页,讲稿共89张,创作于星期日主成分分析lcomponentmatrix表中显示l第一主成分包含Cd、As、Zn、Hg、Pb五个变量l第二主成分包含P、Cr两个变量l第三主成分包含Cu一个变量第87页,讲稿共89张,创作于星期日主成分分析TotalVaricanceExplained表的ExtractionSumsofSquaredLoadings部分显示了各主成分对样本的影响第一主成分的影响为54.259%第二主成分的影响为23.720%第三主成分的影响为13.819%第88页,讲稿共89张,创作于星期日感感谢谢大大家家观观看看第89页,讲稿共89张,创作于星期日

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁