《主成分分析R语言(3页).doc》由会员分享,可在线阅读,更多相关《主成分分析R语言(3页).doc(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-主成分分析R语言-第 3 页第一题 data=read.table(q1.txt,head=T) head(data)#前六行数据 attach(data) options(digits=2) data=as.matrix(data)#转化为矩阵 v1 v1 zhuchengfen summary(zhuchengfen) x y screeplot(zhuchengfen,type=lines)根据累计方差贡献率和Kaiser准则,应该选择三个主成分,即PC1、PC2、PC3。累计方差贡献率为64%。PC1、PC2、PC3对方差贡献率分别是38%、15%、11%。结果如下:运动项目第一主成
2、分第二主成分第三主成分100米-0.355-0.1760.493跳远-0.405-0.1490.182铅球-0.3610.434跳高-0.346-0.109-0.131400米-0.318-0.447110米跨栏-0.3530.153铁饼-0.3190.423-0.104撑杆跳高-0.277-0.389标枪-0.2230.356-0.3521500米-0.484-0.623方差贡献率0.380.150.11累积方差贡献率0.380.530.64解释:前三个主成分解释了大部分信息;第一次主成分测量的是综合运动能力,第二个主成分代表了爆发力臂力,第三主成分测量的是爆发性腿力。附录:这是psych软
3、件包中计算主成分的结果,主成分载荷与princomp得到的结果有很大的差异,并且这个结果似乎更容易解释第二题 library(RODBC) data=odbcConnectExcel(G:/R/q2.xls) data1=sqlFetch(data,Sheet1) close(data) #关闭通道 attach(data1) head(data1)#查看前六行数据 data2=data1,-1#去掉第一列数据 options(digits=2) #数据均保留小数点后两位 q2 options(digits=2) #数据均保留小数点后两位 summary(q2)第一主成分对数据方差的解释度达到83%,因此我们只需要选择一个主成分,即第一主成分PC1 x y order(y,1)#排序 png(normal.png) qqnorm(y,1,main=First PC)#正态性检验 qqline(y,1) dev.off()由第一主成分的Q-Q图可以看出,除少数离群点之外,大部分点都在理论值附近,可以看成是近似服从多元正态分布。