《2022年统计建模与R软件实验报告 .pdf》由会员分享,可在线阅读,更多相关《2022年统计建模与R软件实验报告 .pdf(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、开课学院、实验室:数学与统计学院实验时间:2013 年 3 月日实验项目名称多维数组和矩阵实验项目类型验证演示综合设计其他指导教师张应应成绩一、实验目的二、实验内容生成一个5 阶的 Hilbert 矩阵.,.2, 1,11)(,njijihhHijnnij(1)计算 Hilbert 矩阵 H 的行列式(2)求 H 的逆矩阵(3)求 H 的特征值和特征向量。三、实验原理、方法算法 、步骤1. 函数 det(A) 是求矩阵 A的行列式的值 2.求矩阵 A的逆,其命令形式为slove(A) 3.函数 eigen Sm 是求对称矩阵 Sm的特征值与特征向量n-5;x-array(0,dim=c(n,n
2、) for (i in 1:n)for (j in 1:n)xi,j n-5;x for (i in 1:n) + for (j in 1:n) + xi,j det(x) solve(x) ,1 ,2 ,3 ,4 ,5 1, 25 -300 1050 -1400 630 2, -300 4800 -18900 26880 -12600 3, 1050 -18900 79380 -117600 56700 4, -1400 26880 -117600 179200 -88200 5, 630 -12600 56700 -88200 44100 eigen(x) $values $vectors
3、 ,1 ,2 ,3 ,4 ,5 分析:从实验结果来看。R 软件在处理数据上相当准确,方便。教师签名年月日精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 18 页开课学院、 实验室:数学与统计学院实验时间:2013 年3 月日实验项目名称描述统计量实验项目类型验证演示综合设计其他指导教师张应应成绩一、实验目的二、实验内容用三、实验原理、方法算法 、步骤Pearson 相关性检验:利用统计量t 服从自由度为 n-2 的 t 分布的性质,对数据X和 Y 的相关性进行检验。其中212xyxyrnrt。四、实验环境所用软件、硬件等及实验数据文件
4、R 2.15.3 数据文件 3.7 数据.txt,其内容如下:学号性别 年龄 身高 体重精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 18 页五、实验结果及实例分析student cor.test(身高 ,体重 ) #Pearson 相关性检验Pearsons product-moment correlation data: 身高and 体重alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.70443
5、14 0.9523101 sample estimates: cor 0.8777852 其 p 值 7.887e-07 x t.test(x) #做单样本正态分布区间估计One Sample t-test data: x alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 63.1585 71.6415 sample estimates: mean of x 67.4 #平均脉搏点估计为, 95%置信度的区间估计为 , 。 t.test(x,alternative=less,m
6、u=72) #做单样本正态分布单侧区间估计One Sample t-test data: x alternative hypothesis: true mean is less than 72 95 percent confidence interval: -Inf 70.83705 sample estimates: mean of x 67.4 a b ks.test(a,pnorm,mean(a),sd(a) One-sample Kolmogorov-Smirnov test data: a alternative hypothesis: two-sided ks.test(b,pno
7、rm,mean(b),sd(b) One-sample Kolmogorov-Smirnov test data: b alternative hypothesis: two-sided #方差齐性检验: var.test(a,b) 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 18 页F test to compare two variances data: a and b alternative hypothesis: true ratio of variances is not equal to 1 95 percent con
8、fidence interval: 0.5021943 7.0488630 sample estimates: ratio of variances 1.964622 #可认为 a 和 b 的方差相同。#选用方差相同模型t 检验: t.test(a,b,var.equal=TRUE) Two Sample t-test data: a and b alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -48.24975 -29.78358 sample
9、 estimates: mean of x mean of y 125.5833 164.6000 0.05,因而认为两者有显著差异。教师签名年月日精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 18 页开课学院、实验室:数学与统计学院实验时间:2013 年月日实验项目名称回归分析实验项目类型验证演示综合设计其他指导教师张应应成绩一、实验目的1.掌握回归分析的原理以及在R 软件上的使用2.掌握回归诊断在 R 软件上的使用二、实验内容为了估计山上积雪融化后对下游灌溉的影响,在山上建立一个观测站, 测量最大面积积雪深度X 与当年灌溉面积Y,
10、测得连续10 年的数据10 年中最大积雪深度与当年灌溉面积的数据年序X/m Y/hm2 序号X/m Y/hm2 1 1907 6 3000 2 1287 7 1947 3 2700 8 2273 4 2373 9 3113 5 3260 10 2493 1.试画相应的散点图,判断Y 与 X 是否有线性关系线性回归方程;3.对方程做显著性分析;4.先测得今年的数据是X=7m,给出今年灌溉面积的预测值和相应的区间估计 三、实验原理、方法算法 、步骤回归分析研究的主要问题是: 1. 确定 Y与 X1,X2.Xp间的定量关系表达式,即回归方程 3. 判断自变量 Xj(j=1,2,.p)对 Y有无影响
11、4. 利用所求的的回归方程进行预测和控制,在比较严密的分析中,一般不轻易剔除变量,而是对显著差异变量进行分析。四、实验环境所用软件、硬件等及实验数据文件软件: R 2.15.3 数据见实验内容精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页,共 18 页五、实验结果及实例分析#输入数据并运行得:x-c(5.1,3.5,7.1,6.2,8.8,7.8,4.5,5.6,8.0,6.4) y-c(1907,1287,2700,2373,3260,3000,1947,2273,3113,2493) plot(x,y) 分析结果:由散点图可得x,y
12、线性相关lm.sol|t|) (Intercept) 140.95 125.11 1.127 0.293 x 364.18 19.26 6.33e-08 * - Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 96.42 on 8 degrees of freedom Multiple R-squared: 0.9781, Adjusted R-squared: 0.9754 分析结果:由上述结果可得y 关于 x 的一元线性回归方程为y=+x ;并由 F检验和 t 检验,可得回归方程通过了回归方程的
13、显著性检验#对数据进行预测,并且给相应的区间估计new-data.frame(x=7) lm.pred industry industry.pr summary(industry.pr) # 做主成分分析,得到4 个主成分,累积奉献率达94.68% Importance of components: load load Loadings: X5 0.388 -0.331 -0.321 -0.199 -0.450 0.582 0.233 X6 0.352 -0.403 -0.145 0.279 -0.317 -0.714 X7 -0.215 0.377 -0.140 0.758 -0.418 0
14、.194 X8 -0.273 0.891 -0.322 0.122 plot(load,1:2) text(load,1,load,2,adj=c(-0.4,-0.3) screeplot(industry.pr,npcs=4,type=lines) #得出主成分的碎石图精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 16 页,共 18 页 biplot(industry.pr) #得出在第一,第二主成分之下的散点图 p order(p,1);order(p,2);order(p,3);order(p,4); #将预测值分别以第一,第二,第三,第四
15、主成分进行排序1 5 1 3 2 4 6 13 11 9 7 12 10 8 1 5 8 4 9 10 1 13 12 7 11 6 2 3 1 8 1 5 3 9 12 7 10 2 6 11 4 13 1 11 6 5 7 10 13 12 9 1 8 3 2 4 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 17 页,共 18 页 kmeans(scale(p),4) #将预测值进行标准化,并分为4 类K-means clustering with 4 clusters of sizes 5, 1, 4, 3 Cluster means:
16、Clustering vector: 1 4 3 3 4 2 1 1 1 1 3 1 3 4 Within cluster sum of squares by cluster: (between_SS / total_SS = 37.0 %) Available components: 1 cluster centers totss withinss tot.withinss 6 betweenss size #用 order分别对4 个主成分的预测值进行排序,结果是如下表26 ,而利用kmeans进行动态排序得到如下分类:第 1 类:建材 6 ,森工 7 ,食品 8 ,纺织 9 ,皮革 11
17、 ;第 2 类:机械 5 ;第 3 类:电力 2 ,煤炭 3 ,缝纫 10造纸 12 ;第 4 类:冶金 1化学 4 ,文教艺术用品13 。成分13 个行业排序结果第一主成分:5 1 3 2 4 6 13 11 9 7 12 10 8 第二主成分:5 8 4 9 10 1 13 12 7 11 6 2 3 第三主成分:8 1 5 3 9 12 7 10 2 6 11 4 13 第四主成分:11 6 5 7 10 13 12 9 1 8 3 2 4 表 26各行业按主成分得分进行排序结果教师签名年月日精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 18 页,共 18 页