主成分分析法例子讲稿.ppt

上传人:石*** 文档编号:38214078 上传时间:2022-09-03 格式:PPT 页数:20 大小:576KB
返回 下载 相关 举报
主成分分析法例子讲稿.ppt_第1页
第1页 / 共20页
主成分分析法例子讲稿.ppt_第2页
第2页 / 共20页
点击查看更多>>
资源描述

《主成分分析法例子讲稿.ppt》由会员分享,可在线阅读,更多相关《主成分分析法例子讲稿.ppt(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于主成分分析法例子第一页,讲稿共二十页哦一、主成分分析的基本原理 v假定有n个样本,每个样本共有p个变量,构成一个np阶的数据矩阵npnnppxxxxxxxxxX212222111211(1) 第二页,讲稿共二十页哦v降维处理!当p较大时,在p维空间中考察问题比较麻烦。降维是用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。第三页,讲稿共二十页哦定义:记x1,x2,xP为原变量指标,z1,z2,zm(mp)为新变量指标pmpmmmppppxlxlxlzxlxlxlzxlxlxlz22112222121

2、212121111(2) 第四页,讲稿共二十页哦v系数lij的确定原则: zi与zj( ij;i,j=1,2,m )相互无关; z1是x1,x2,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,xP的所有线性组合中方差最大者; zm是与z1,z2,zm1都不相关的x1,x2,xP, 的所有线性组合中方差最大者。 则新变量指标z1,z2,zm分别称为原变量指标x1,x2,xP的第一,第二,第m主成分。 第五页,讲稿共二十页哦 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 , p)在诸主成分zi(i=1,2,m)上的载荷 lij( i=1,2,m; j=1

3、,2 ,p)。 从数学上可以证明,载荷lij分别是相关矩阵的m个较大的特征值所对应的特征向量。 第六页,讲稿共二十页哦二、计算步骤 (一)计算相关系数矩阵(一)计算相关系数矩阵 rij(i,j=1,2,p)为原变量xi与xj的相关系数, rij=rji,其计算公式为:pppppprrrrrrrrrR212222111211(3) nknkjkjikinkjkjikiijxxxxxxxxr11221)()()((4) 第七页,讲稿共二十页哦 (二)计算特征值与特征向量:(二)计算特征值与特征向量: 解特征方程,求出特征值,并使其按大小顺序排列 ; 0RI0,21p 分别求出对应于特征值的特征向量

4、 ,要求 =1,即,其中表示向量 的第j个分量。i), 2 , 1(piliil112pjijlijlil第八页,讲稿共二十页哦 计算主成分贡献率及累计贡献率 贡献率:),2, 1(1pipkki累计贡献率: ),2, 1(11pipkkikk一般取累计贡献率达8595%的特征值所对应的第一、第二、第m(mp)个主成分。 m,21第九页,讲稿共二十页哦pnpnnppxxxlllllllllZ.21212222111211(6) 各主成分的得分第十页,讲稿共二十页哦三、 主成分分析方法应用实例表表1 1 某农业生态经济系统各区域单元的有关数据某农业生态经济系统各区域单元的有关数据 第十一页,讲稿

5、共二十页哦668.3372.03276.2041540.29216.398.1284.0650.0114.861795.4160.80171.106926.35291.528.1354.0630.0124.862862.9011.65273.3071501.24225.2518.3522.6450.0343.201986.6240.84168.904897.36196.3716.8615.1760.0556.1671091.3940.81266.502911.24226.5118.2795.6430.0764.4771176.9120.85850.302103.52217.0919.7934.

6、8810.0016.1651251.2741.04164.609968.33181.384.0054.0660.0155.4021368.8310.83662.804957.14194.049.114.4840.0025.791477.3010.62360.102824.37188.0919.4095.7215.0558.4131576.9481.02268.0011255.42211.5511.1023.1330.013.4251699.2650.65460.7021251.03220.914.3834.6150.0115.59317118.5050.66163.3041246.47242.

7、1610.7066.0530.1548.70118141.4730.73754.206814.21193.4611.4196.4420.01212.94519137.7610.59855.9011124.05228.449.5217.8810.06912.65420117.6121.24554.503805.67175.2318.1065.7890.0488.46121122.7810.73149.1021313.11236.2926.7247.1620.09210.078第十二页,讲稿共二十页哦步骤如下:(1)将表1中的数据作标准差标准化处理,然后将它们代入公式(4)计算相关系数矩阵(见表2

8、)。x1x2x3x4x5x6x7x8x9x11-0.327 -0.714 -0.3360.3090.4080.790.1560.744x2-0.331-0.0350.6440.420.2550.009-0.0780.094x3-0.71-0.03510.07-0.74-0.755-0.93-0.109-0.924x4-0.340.6440.0710.3830.069-0.05-0.0310.073x50.3090.42-0.740.38310.7340.6720.0980.747x60.4080.255-0.7550.0690.73410.6580.2220.707x70.790.009-0.

9、93-0.0460.6720.6581-0.030.89x80.156-0.078 -0.109 -0.0310.0980.222-0.0310.29x90.7440.094-0.9240.0730.7470.7070.890.291表表2 2相关系数矩阵相关系数矩阵 第十三页,讲稿共二十页哦 (2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表3)。由表3可知,第一,第二,第三主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。 第十四页,讲稿共二十页哦表表3 3特征值及主成分贡献率特征值及主成分贡献率 第十五页,

10、讲稿共二十页哦 (3)对于特征值=4.6610,=2.0890,=1.0430分别求出其特征向量l1,l2,l3。第十六页,讲稿共二十页哦表表4 4 主成分载荷主成分载荷 z1z2z3占方差的百分数(%)x10.739-0.532-0.006182.918x20.1230.887-0.002880.191x3-0.9640.00960.009592.948x40.00420.8680.003775.346x50.8130.444-0.001185.811x60.8190.1790.12571.843x70.933-0.133-0.25195.118x80.197-0.10.9798.971x9

11、0.964-0.00250.009292.939第十七页,讲稿共二十页哦 第一主成分z1与x1,x5,x6,x7,x9呈显出较强的正相关,与x3呈显出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因此可以认为第一主成分z1是生态经济结构的代表。 第二主成分z2与x2,x4,x5呈显出较强的正相关,与x1呈显出较强的负相关,其中,除了x1为人口总数外,x2,x4,x5都反映了人均占有资源量的情况,因此可以认为第二主成分z2代表了人均资源量。 分析:分析:第十八页,讲稿共二十页哦显然,用三个主成分z1、z2、z3代替原来9个变量(x1,x2,x9),描述农业生态经济系统,可以使问题更进一步简化、明了。第三主成分z3,与x8呈显出的正相关程度最高,其次是x6,而与x7呈负相关,因此可以认为第三主成分在一定程度上代表了农业经济结构。 第十九页,讲稿共二十页哦感谢大家观看感谢大家观看第二十页,讲稿共二十页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁