主成分分析---××ppt课件.pptx

上传人:飞****2 文档编号:69287324 上传时间:2023-01-01 格式:PPTX 页数:37 大小:13.82MB
返回 下载 相关 举报
主成分分析---××ppt课件.pptx_第1页
第1页 / 共37页
主成分分析---××ppt课件.pptx_第2页
第2页 / 共37页
点击查看更多>>
资源描述

《主成分分析---××ppt课件.pptx》由会员分享,可在线阅读,更多相关《主成分分析---××ppt课件.pptx(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、rincipal Components Analysisrincipal Components Analysis 主成分分析主成分分析P P报告人:问题的引入在对某事物进行实证研究时,为了更全面、准确地反映事物的特征及其发展规律,人们往往要考虑与其有关系的多个指标,这些指标在多元统计中也被称为变量。这样就产生了如下的问题:一方面人们为了避免遗漏重要的信息而考虑尽可能多的指标,另一方面考虑指标增多增加了问题的复杂性。同时由于各指标均是对同一事物的反映,不可避免地造成信息的大量重叠,这种信息的重叠有时甚至会抹杀事物的真正特征和内在规律。前 言问题的引入如何解决主成分特点意义问题的引入?何何如如解决

2、呢解决呢前 言如何解决?基于此,通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维和简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。前 言问题的引入如何解决主成分特点意义如何解决每一个主成分都是各原始变量的线性组合主成分的数目大大少于原始变量的数目各主成分之间互不相关主成分保留了原始变量绝大多数信息主成分特点前 言问题的引入如何解决主成分特点意义主成分特点意义 通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,解释变量之间的内在关系,得到对事

3、物特征及其发展规律的一些深层次的启发,把研究工作引向深入。前 言问题的引入如何解决主成分特点意义意义那么,到底什么是主成分分析呢?目 录目 录ONTENTSC1主成分分析的原理及模型主成分分析的原理及模型2主成分分析的计算步骤主成分分析的计算步骤3主成分分析在主成分分析在 SPSSSPSS 上实现上实现1主成分分析的原理及模型主成分分析的原理及模型目 录目 录ONTENTSC231主成分分析的原理及模型主成分分析的原理及模型主成分分析的计算步骤主成分分析的计算步骤主成分分析在主成分分析在 SPSSSPSS 上实现上实现利用降维的思想 在损失很少信息的前提下把多个指标转化为几个综合指标(主成分)

4、每个主成分都是原始变量的线性组合且各个主成分之间互不相关主成分分析(PCA)主成分分析(principal components analysis,PCA)也称主分量分析,是由霍特林于1933年首先提出的.主成分分析的原理及数学模型在保留原始变量尽可能多的信息的前提下达到降维的目的,从而简化问题的复杂性并抓住问题的主要矛盾.基本思想主成分分析的原理及数学模型主成分分析(PCA)特 点较原始变量有更多的优越性能!更容易抓住事物的主要矛盾揭示事物内部变量之间的规律性使问题得到简化,提高分析效率个人理解实质上就是完成从“高维空间”向低维空间的转换,把互相关联复杂问题简单化的方法主成分分析是一种对多元

5、数据的变量数目进行有效减维压缩的方法。它提供了一种能在保持原事物大部分信息的基础上,将变量数较多而且变量间有不同程度相关关系的数据转换成一组变量数较少而且变量间相互独立的新数据的方法。主成分分析的原理及数学模型200水稻品种水稻品种20个性状的观察值个性状的观察值品种编号品种编号X1X2X201.2.200.200水稻品种水稻品种5个主成分个主成分品种编号品种编号X1X2X51.2.200.原理x1x2y2y1先讨论只有两个变量的情况。事物结构不变,只是坐标轴旋转了,所以总方差不变,即S2x1+S2x2=S2y1+S2y2,而右图中,y1的变异比y2的变异大得多。如果y2的变异小到可以认为是由

6、于误差造成的,则只需y1就足以说明问题。主成分分析的原理及数学模型方差是事方差是事物信息量物信息量的度量的度量是为了使得样品是为了使得样品点在点在y1轴方向离轴方向离散程度最大散程度最大转换公式x1x2y1y2主成分分析的原理及数学模型转换公式可以看到新变量Y1和Y2是原变量X1和X2的线性组合,它的矩阵表示形式为:l其中,T为旋转变换矩阵,它是正交矩阵,即有:T T=IlYl,Y2除了可以对包含在Xl,X2中的信息起着浓缩作用之外,还具有不相关的性质,这就使得在研究复杂的问题时避免了信息重叠所带来的虚假性。主成分分析的原理及数学模型主成分分析推广到p维情形设(X1,X2,Xp)是p维随机向量

7、,EX=,DX=考虑如下的线性变换:则:我们希望寻找一组新的变量(Z1,Z2,Zm)(mp),这组新的变量要求充分地反映原变量(X1,X2,Xp)的信息,而且相互独立。主成分分析的原理及数学模型用用Z1=a 1X来代替原来来代替原来p个变量个变量X1,X2,Xp,显然,当,显然,当var(Z1)越大,越大,表示表示Z1包含的信息越多。包含的信息越多。显然,如果显然,如果a1 使得使得var(Z1)达到最大,则达到最大,则ca1也使得也使得var(Z1)达到最大,因此必须对达到最大,因此必须对a1 加加上限制,一般取上限制,一般取a1使得使得a 1 a1=1 时使时使var(Z1)达到最大。达到

8、最大。此时就称此时就称Z1为第一主成分(或主分量)。为第一主成分(或主分量)。主成分分析的原理及数学模型类似地,可求第三主成类似地,可求第三主成分,第四主成分等等。分,第四主成分等等。主成分分析的原理及数学模型主成分分析的原理及数学模型使得z=aTx方差最大var(z)=var(aTx)=aTa拉格朗日极值法化简F(a)=aTa-(aTa-1)可见a是的长度为1的特征向量,此时max(var(z)=aTa=aTa=数学推导过程数学推导过程1主成分分析的计算步骤主成分分析的计算步骤目 录目 录ONTENTSC312主成分分析的计算步骤主成分分析的计算步骤主成分分析的原理及模型主成分分析的原理及模

9、型主成分分析在主成分分析在 SPSSSPSS 上实现上实现协方差矩阵贡献率累计贡献率特征值特征向量协方差矩阵特征值特征向量贡献率累计贡献率协方差矩阵主成分分析的解法在sij(i,j=1,2,p)为原来变量zxi与zxj的协方差cov(zxi,zxj),其计算公式为:其中:由于协方差矩阵易受指量纲的影响,通常需要对数据进行消除量纲影响的处理,也就是标准化。不过这些SPSS会自动完成。主成分分析的解法协方差矩阵特征值特征向量贡献率累积贡献率特征值特征向量首先解特征方程|E-|=0求出特征值i(i=1,2,p),并使其按大小顺序排列,即12.p0;然后分别求出对应特征值i的特征向量ai(i=1,2,

10、p),然后,单位化,正交化。协方差矩阵特征值特征向量贡献率累积贡献率贡献率累积贡献率n 主成分贡献率n 主成分累计贡献率主成分Zi贡献率定义为 (i=1,2,p)主成分分析的解法n主成分贡献率解释相应主成分 Z i 所反映综合信息能力的大小协方差矩阵特征值特征向量 贡献率累积贡献率n主成分贡献率n主成分累积贡献率 .一般取累积贡献率达85%95%的特征值1,2,m所对应的第一,第二,,第m(mp)个主成分.主成分分析的解法n 主成分累计贡献率贡献率累积贡献率3主成分分析在主成分分析在 SPSSSPSS 上实现上实现目 录目 录ONTENTSC213主成分分析在主成分分析在 SPSSSPSS 上

11、实现上实现主成分分析的计算步骤主成分分析的计算步骤主成分分析的原理及模型主成分分析的原理及模型主成分分析在 上实现原始数据原始数据用用SPSS进行主成分分析进行主成分分析分析结果分析结果SPSSSPSS(Statistical Product and Service Solutions),”统计产品与服务解决方案统计产品与服务解决方案”软件软件主成分分析在SPSS上实现从上表(相关系数矩阵)可知,土壤水分与Mclntosh指数、幸普森指数、Pielou指数存在着显著关系。可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。特

12、征值在某种程度上可以看成是表示主成分影响力大小的指标。如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均值解释力度大。因此可以用特征值大于1作为判断主成分的标准。此外还要考虑累积贡献率大于85%。相关系数矩阵相关系数矩阵主成分分析在SPSS上实现从左表(方差分解主成分提取分析)可知,一共提取四个主成分;从右表(初始因子载荷矩阵)可知,Shannon指数、种间相遇率、Mclntosh指数、幸普森指数、Pielou指数在第一主成分有较高载荷,说明第一主成分基本反映了这些指标的信息,全N质量分数在第二主成分中有较高的载荷,说明第二主成分基本反映了全N质量分数指标的基本信息等等。所

13、以提取四个主成分是可以基本反映全部指标的信息,也就可以仅用四个新变量来代替原来11个变量,在理论上是行得通的。方差分解主成分提取分析表方差分解主成分提取分析表初始因子载荷矩阵初始因子载荷矩阵主成分分析在SPSS上实现对原始变量提取的百分比!主成分分析在SPSS上实现F1=0.3ZX1+0.03ZX2-0.08ZX3+0.07ZX4+0.4ZX5+0.39ZX6-0.41ZX7+0.12ZX8-0.41ZX9+0.41ZX10-0.27ZX11F20.22ZX10.34ZX20.43ZX30.61ZX40.15ZX50.15ZX60.02ZX70.47ZX80.02ZX90.05ZX10.0.0

14、4ZX11F30.22ZX10.56ZX20.4ZX30.02ZX40.04ZX50.02ZX60.15ZX70.06ZX80.15ZX90.04ZX10.0.65ZX11F40.15ZX10.55ZX20.52ZX30.13ZX40.05ZX50.05ZX60.06ZX70.58ZX80.06ZX90.16ZX10.0.12ZX11用主成分载荷矩阵中的数据除以主成分相对应的特征值开平方便得到每个主成分中每个指标所对应的系数,运行SPSS,可得到特征向量,将得到的特征向量与标准化后的数据相乘,就可以得到主成分表达式。求主成分表达式求主成分表达式在SPSS中企业主成分表达式中每个指标所对应的系数主成分分析在SPSS上实现综合主成分值及排名综合主成分值及排名求主成分综合模型求主成分综合模型Thank You!Thank You!谢谢观看!谢谢观看!三周时间准备,两周时间制作。希望能实际应用中用好 !主成分分析

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁