《第8章主成分分析.课件电子教案教学教程.pptx》由会员分享,可在线阅读,更多相关《第8章主成分分析.课件电子教案教学教程.pptx(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第8章 主成分分析及R使用多元统计分析及建模 王斌会王斌会 教授教授多元统计分析及R语言建模(1)主成分分析的目的和意义(2)主成分分析的数学模型及几何解释(3)主成分的推导及基本性质(4)程序中有关主成分分析的算法基础(5)主成分分析的基本步骤以及实证分析多元统计分析及R语言建模(1)了解主成分分析的统计思想和实际意义(2)了解主成分的数学模型和空间上的解释(3)掌握主成分的推导步骤及其基本性质(4)能够利用R语言解决实际问题并给出分析多元统计分析及R语言建模 主成分分析(主成分分析(Principal Component Analysis,简记,简记PCA) 是是将将多多个个指标化为指标化
2、为少数几个综合指标的一种统计分析少数几个综合指标的一种统计分析方法方法, 即即通过通过降维技术把多个变量化为几个少数主成分的降维技术把多个变量化为几个少数主成分的方法方法。8.1.1 主成分分析的提出主成分分析的提出基本思想:将原来众多具有一定相关性的指标,重新组合成 一组新的相互无关的综合指标来代替原来指标。数学处理:就是将原来p个指标作线性组合,作为新的指标。 8.1.2 主成分的直观解释主成分的直观解释今今有有14名学生的身高与体重数据名学生的身高与体重数据,做,做相关图以显示变量间的相关图以显示变量间的关系关系1 0.9672 主成分分析的主要目的是用较少的变量去解释原资料中的大部分变
3、异,即期望能将手中许多相关性很高的变量转化成互相独立的变量,并能解释大部分资料之变异的几个新变量,也就是所谓的主成分。y1第1主成分y2第2主成分yp第p主成分 设 求主成分就是寻找的线性函数,使相应的方差达到最大, 即 达到最大。变量x的主成分y是以的特征向量为系数的线性组合,它们互不相关,方差为的特征根,且S=UDVR=UDV主成分载荷主成分得分将主成分系数带入设 y = ax 中即可的主成分得分(scores)主主成成分分信信息息图图方差贡献率将原始数据标准化,得标准化数据矩阵建立相关系数阵求特征值及特征向量获得主成分8.3.1 主成分改进计算8.3.1 主成分改进计算8.3.2 R语言
4、分析过程语言分析过程一、主成分的计算一、主成分的计算三、三、综合得分及排名综合得分及排名二、二、主成分得分图主成分得分图 四、进行四、进行主成分分析主成分分析(1)主成分对象:)主成分对象:(2)方差贡献率:)方差贡献率:(3)主成分个数:)主成分个数:(1)主成分得分:)主成分得分: (2)主成分得分图:)主成分得分图:(1)综合得分:)综合得分:(2)得分排序:)得分排序:princomp 或或 msa.pcasummary, $vars80% Comp.j = ajxComp = Wj Comp.j【例例8.2】对例对例3.1居民消费居民消费数据数据做做主成分分析主成分分析居民消费居民消费数据数据的的主成分分析主成分分析居居民民消消费费数数据据的的主主成成分分分分析析l1.主成分分析,最好以相关系数矩阵为主l2.为使方差达到最大,通常主成分分析是不加以转轴l3.通常将特征值小于1的成分放弃,只保留大于1的成分l4.在实际研究里,若用3或5个成分,就能解释变异80%也行l5.使用主成分,会使各变量方差为最大,且成分间彼此独立