2022年R软件一元线性回归分析 .pdf

上传人:C****o 文档编号:40140469 上传时间:2022-09-08 格式:PDF 页数:8 大小:112.03KB
返回 下载 相关 举报
2022年R软件一元线性回归分析 .pdf_第1页
第1页 / 共8页
2022年R软件一元线性回归分析 .pdf_第2页
第2页 / 共8页
点击查看更多>>
资源描述

《2022年R软件一元线性回归分析 .pdf》由会员分享,可在线阅读,更多相关《2022年R软件一元线性回归分析 .pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、R 软件一元线性回归分析数据选自数理统计教材例题8.4.1 合金钢强度与碳含量的数据序号碳含量/%合金钢强度/107pa 1 0.10 42.0 2 0.11 43.0 3 0.12 45.0 4 0.13 45.0 5 0.14 45.0 6 0.15 47.5 7 0.16 49.0 8 0.17 53.0 9 0.18 50.0 10 0.20 55.0 11 0.21 55.0 12 0.23 60.0 这里取碳含量为 x 是普通变量,取合金钢强度为y 是随机变量使用 R软件对以上数据绘出散点图程序如下:x=matrix(c(0.1,42,0.11,43,0.12,45,0.13,45

2、,0.14,45,0.15,47.5,0.16,49,0.17,53,0.18,50,0.2,55,0.21,55,0.23,60),nrow=12,ncol=2,byrow=T,dimnames=list(1:12,c(C,E)outputcost=as.data.frame(x)plot(outputcost$C,outputcost$E)名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 8 页 -0.100.120.140.160.180.200.2245505560outputcost$Coutputcost$E很显然这些点基本上(但并不精确地)落在一条直线上。下面在之前数

3、据录入的基础上做回归分析(程序接前文,下同)lm.sol=lm(EC,data=outputcost)summary(lm.sol)得到以下结果:Call:lm(formula=E C,data=outputcost)Residuals:Min 1Q Median 3Q Max-2.00449-0.63600-0.02401 0.71297 2.32451 Coefficients:Estimate Std.Error t value Pr(|t|)(Intercept)28.083 1.567 17.92 6.27e-09*C 132.899 9.606 13.84 7.59e-08*-Si

4、gnif.codes:0*0.001*0.01*0.05.0.1 1 Residual standard error:1.309 on 10 degrees of freedom Multiple R-squared:0.9503,Adjusted R-squared:0.9454 F-statistic:191.4 on 1 and 10 DF,p-value:7.585e-08 由计算结果分析:名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 8 页 -常数项0=28.083,变量(即碳含量)的系数1=132.899 得到回归方程:y=28.083+132.899x 由于回归模

5、型建立使用的是最小二乘法,而最小二乘法只是一种单纯的数学方法 ,存在着一定的缺陷,即不论变量间有无相关关系或有无显著线性相关关系,用最小二乘法都可以找到一条直线去拟合变量间关系。所以回归模型建立之后,还要对其进行显著性检验:在上面的结果中sd(0)=1.567,sd(1)=9.606。而对应于两个系数的 P值 6.27e-09和 7.59e-08,故是非常显著的。关于方程的检验,残差的标准差=1.309。相关系数的平方 R2=0.9503。关于 F分布的 P值为 7.585e-08,也是非常显著的。我们将得到的直线方程画在散点图上,程序如下:abline(lm.sol)得到散点图及相应的回归直

6、线:名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 8 页 -0.100.120.140.160.180.200.2245505560outputcost$Coutputcost$E下面分析残差:在 R软件中,可用函数residuals()计算回归方程的残差。程序如下:y.res=residuals(lm.sol);plot(y.res)得到残差图名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 8 页 -24681012-2-1012Indexy.res从残差图可以看出,第 8 个点有些反常,这样我们用程序将第8 个点的残差标出,程序如下:text(8,y.res8

7、,labels=8,adj=1.2)24681012-2-1012Indexy.res8名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 8 页 -这个点可能有问题,下面做简单处理,去掉该样本点,编程如下:i=1:12;outputcost2=as.data.frame(xi!=8,)lm2=lm(EC,data=outputcost2)summary(lm2)结果输出如下:Call:lm(formula=E C,data=outputcost2)Residuals:Min 1Q Median 3Q Max-1.7567-0.5067-0.1308 0.6821 1.6787 Co

8、efficients:Estimate Std.Error t value Pr(|t|)(Intercept)28.124 1.335 21.06 5.75e-09*C 131.293 8.217 15.98 6.51e-08*-Signif.codes:0 *0.001 *0.01*0.05.0.1 1 Residual standard error:1.115 on 9 degrees of freedom Multiple R-squared:0.966,Adjusted R-squared:0.9622 F-statistic:255.3 on 1 and 9 DF,p-value:

9、6.506e-08 由结果分析,去掉第8 个点之后,回归方程系数变化不大,R2 相关系数有所提高,并且p-值变小了,这说明样本点8 可以去掉。所得新模型较为理想。总结程序如下:x2=matrix(c(0.1,42,0.11,43,0.12,45,0.13,45,0.14,45,0.15,47.5,0.16,49,0.18,50,0.2,55,0.21,55,0.23,60),nrow=11,ncol=2,byrow=T,dimnames=list(1:11,c(C,E)outputcost=as.data.frame(x2)plot(outputcost$C,outputcost$E)lm.s

10、ol=lm(EC,data=outputcost)名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 8 页 -summary(lm.sol)Call:lm(formula=E C,data=outputcost)Residuals:Min 1Q Median 3Q Max-1.7567-0.5067-0.1308 0.6821 1.6787 Coefficients:Estimate Std.Error t value Pr(|t|)(Intercept)28.124 1.335 21.06 5.75e-09*C 131.293 8.217 15.98 6.51e-08*-Sign

11、if.codes:0*0.001*0.01*0.05.0.1 1 Residual standard error:1.115 on 9 degrees of freedom Multiple R-squared:0.966,Adjusted R-squared:0.9622 F-statistic:255.3 on 1 and 9 DF,p-value:6.506e-08 abline(lm.sol)得到最后的散点图和回归直线0.100.120.140.160.180.200.2245505560outputcost$Coutputcost$E名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 8 页 -得到回归方程:y=28.124+131.293x 名师资料总结-精品资料欢迎下载-名师精心整理-第 8 页,共 8 页 -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁