《统计建模与R软件实验报告.pdf》由会员分享,可在线阅读,更多相关《统计建模与R软件实验报告.pdf(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、开课学院、开课学院、实验室:实验室:数学与统计学院数学与统计学院实验时间实验时间:20132013年年 3 3 月月日日实验项目多维数组和矩阵名称指导教师张应应成绩验证实验项目类型演示综合设计其他一、实验目的二、实验内容生成一个 5 阶的 Hilbert 矩阵H (hij)nn,hij1,i,j 1,2,.n.i j 1(1)计算 Hilbert 矩阵 H 的行列式(2)求 H 的逆矩阵(3)求 H 的特征值和特征向量。三、实验原理、方法算法、步骤1.函数 det(A)是求矩阵 A 的行列式的值 2.求矩阵 A 的逆,其命令形式为 slove(A)3.函数 eigenSm是求对称矩阵 Sm 的
2、特征值与特征向量n-5;x-array(0,dim=c(n,n)for(i in 1:n)for(j in 1:n)xi,j n-5;x for(i in 1:n)+for(j in 1:n)+xi,j det(x)solve(x),1,2,3,4,51,25-3001050-14006302,-3004800-1890026880-126003,1050-1890079380-117600567004,-140026880-117600179200-882005,630-1260056700-8820044100 eigen(x)$values$vectors,1,2,3,4,5分析:从实验
3、结果来看。R 软件在处理数据上相当准确,方便。教师签名年月日开课学院、开课学院、实验室:实验室:数学与统计学院数学与统计学院实验时间实验时间:20132013年年3 3 月月日日实验项目描述统计量名称指导教师张应应成绩验证实验项目类型演示综合设计其他一、实验目的二、实验内容用三、实验原理、方法算法、步骤Pearson 相关性检验:利用统计量 t 服从自由度为 n-2 的 t 分布的性质,对数据 X 和 Y 的相关性进行检验。t rxyn221rxy其中。四、实验环境所用软件、硬件等及实验数据文件 R 2.15.3 数据文件 3.7 数据.txt,其内容如下:学号性别 年龄 身高 体重五、实验结
4、果及实例分析student cor.test(身高,体重)#Pearson 相关性检验Pearsons product-moment correlationdata:身高 and 体重alternative hypothesis:true correlation is not equal to 095 percent confidence interval:0.7044314 0.9523101sample estimates:cor0.8777852其 p 值 7.887e-07 x t.test(x)#做单样本正态分布区间估计One Sample t-testdata:xalternati
5、ve hypothesis:true mean is not equal to 095 percent confidence interval:63.1585 71.6415sample estimates:mean of x67.4#平均脉搏点估计为,95%置信度的区间估计为,。t.test(x,alternative=less,mu=72)#做单样本正态分布单侧区间估计One Sample t-testdata:xalternative hypothesis:true mean is less than 7295 percent confidence interval:-Inf 70.83
6、705sample estimates:mean of x67.4 a b ks.test(a,pnorm,mean(a),sd(a)One-sample Kolmogorov-Smirnov testdata:aalternative hypothesis:two-sided ks.test(b,pnorm,mean(b),sd(b)One-sample Kolmogorov-Smirnov testdata:balternative hypothesis:two-sided#方差齐性检验:var.test(a,b)F test to compare two variancesdata:a
7、and balternative hypothesis:true ratio of variances is not equal to 195 percent confidence interval:0.5021943 7.0488630sample estimates:ratio of variances1.964622#可认为 a 和 b 的方差相同。#选用方差相同模型 t 检验:t.test(a,b,var.equal=TRUE)Two Sample t-testdata:a and balternative hypothesis:true difference in means is
8、not equal to 095 percent confidence interval:-48.24975-29.78358sample estimates:mean of x mean of y125.5833164.60000.05,因而认为两者有显著差异。教师签名年月日开课学院、开课学院、实验室:实验室:数学与统计学院实验时间实验时间:2013年年月月日日实验项目回归分析名称指导教师张应应成绩验证实验项目类型演示综合设计其他一、实验目的1.掌握回归分析的原理以及在 R 软件上的使用2.掌握回归诊断在 R 软件上的使用二、实验内容为了估计山上积雪融化后对下游灌溉的影响,在山上建立一个 观
9、测站,测量最大面积积雪深度X 与当年灌溉面积 Y,测得连续 10 年的数据10 年中最大积雪深度与当年灌溉面积的数据年序12345X/mY/hm219071287270023733260序号678910X/mY/hm2300019472273311324931.试画相应的散点图,判断Y 与 X 是否有线性关系线性回归方程;3.对方程做显著性分析;4.先测得今年的数据是 X=7m,给出今年灌溉面积的预测值和相应的区间估计 三、实验原理、方法算法、步骤回归分析研究的主要问题是:1.确定 Y 与 X1,X2.Xp 间的定量关系表达式,即回归方程 3.判断自变量 Xj(j=1,2,.p)对 Y 有无影
10、响 4.利用所求的的回归方程进行预测和控制,在比较严密的分析中,一般不轻易剔除变量,而是对显著差异变量进行分析。四、实验环境所用软件、硬件等及实验数据文件软件:R 2.15.3数据见实验内容五、实验结果及实例分析#输入数据并运行得:x-c(5.1,3.5,7.1,6.2,8.8,7.8,4.5,5.6,8.0,6.4)y-c(1907,1287,2700,2373,3260,3000,1947,2273,3113,2493)plot(x,y)分析结果:由散点图可得x,y 线性相关lm.sol|t|)(Intercept)140.95125.111.1270.293x364.1819.266.3
11、3e-08*-Signif.codes:0*0.001*0.01*0.05.0.1 1Residual standard error:96.42 on 8 degrees of freedomMultiple R-squared:0.9781,Adjusted R-squared:0.9754分析结果:由上述结果可得y 关于 x 的一元线性回归方程为 y=+x;并由 F 检验和 t 检验,可得回归方程通过了回归方程的显著性检验#对数据进行预测,并且给相应的区间估计new-data.frame(x=7)lm.pred industry industry.pr summary(industry.p
12、r)#做主成分分析,得到 4 个主成分,累积奉献率达94.68%Importance of components:load loadLoadings:X50.388-0.331-0.321-0.199-0.4500.5820.233X60.352-0.403-0.1450.279-0.317-0.714X7-0.2150.377-0.1400.758-0.4180.194X8-0.2730.891-0.3220.122 plot(load,1:2)text(load,1,load,2,adj=c(-0.4,-0.3)screeplot(industry.pr,npcs=4,type=lines
13、)#得出主成分的碎石图 biplot(industry.pr)#得出在第一,第二主成分之下的散点图 p order(p,1);order(p,2);order(p,3);order(p,4);#将预测值分别以第一,第二,第三,第四主成分进行排序1513246 13 1197 12 10815849 101 13 127 11623181539 127 1026 114 131 11657 10 13 12918324 kmeans(scale(p),4)#将预测值进行标准化,并分为4 类K-means clustering with 4 clusters of sizes 5,1,4,3Clu
14、ster means:Clustering vector:1 4 3 3 4 2 1 1 1 1 3 1 3 4Within cluster sum of squares by cluster:(between_SS/total_SS=37.0%)Available components:1 clustercenterstotsswithinsstot.withinss6 betweensssize#用 order分别对 4 个主成分的预测值进行排序,结果是如下表26,而利用kmeans进行动态排序得到如下分类:第 1 类:建材6,森工7,食品8,纺织9,皮革11;第 2 类:机械5;第 3 类:电力2,煤炭3,缝纫10造纸12;第 4 类:冶金1化学4,文教艺术用品13。成分第一主成分:第二主成分:第三主成分:第四主成分:5581118163455293741091013 个行业排序结果611213131371211121099721711681261131024283134表26各行业按主成分得分进行排序结果教师签名年月日