《实验三-回归分析(共7页).doc》由会员分享,可在线阅读,更多相关《实验三-回归分析(共7页).doc(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上实验三 回归分析1.为了分析X射线的杀菌作用,用200千伏的X射线来照射细菌,每次照射6分钟用平板计数法估计尚存活的细菌数,照射次数记为 t,照射后的细菌数y如表1所示。表1 X射线照射次数与残留细菌数试求:给出y与t的二次函数回归模型;在同一坐标系内做出原始数据与拟合结果的散点图;预测t=16时残留的细菌数;根据问题实际意义,你认为选择多项式函数是否合适?给出非线性回归模型,并预测照射16次后细菌残留数目。解:(1)实验程序:t=1:15;y=352 211 197 160 142 106 104 60 56 38 36 32 21 19 15;rstool(t,y
2、,purequadratic)结果如图1所示:图1在Matlab工作区中输入命令:beta,rmsebeta =347.8967 -51.1394 1.9897rmse =22.2649所以y与t的二次回归模型函数:(2)画出同一坐标散点图,如图2所示,程序如下:p,s=polyfit(t,y,2);Y=polyconf(p,t,y);plot(t,y,k+,t,Y,r)图2 散点图(3)当t=16时,计算程序如下:p,s=polyfit(t,y,2);Y=polyconf(p,16);结果是:Y =39.0396即说明预测残留的细菌数y=39.0396个;(4)用二次函数计算出细菌残留数为3
3、9.0396,显然与实际不相符合。根据实际问题的意义可知:尽管二次多项式拟合效果较好,但是用于预测并不理想。因此,如何根据原始数据散点图的规律,选择适当的回归曲线是非常重要的,因此有必要研究非线性回归分析。(5)由(2)散点图可知,可以假设将要拟合的的非线性模型为对将要拟合的非线性模型,建立的M-文件volum.m如下:function yhat=volum(beta,t)yhat=beta(1)*exp(beta(2).*t);%输入数据t=1:15;y=352 211 197 160 142 106 104 60 56 38 36 32 21 19 15;beta0=150,0;%求回归系
4、数beta,r,J=nlinfit(t,y,volum,beta0); beta y=nlpredci(volum,16,beta,r,J)得结果:beta =400.0905 -0.2240,y =11.1014,即回归模型为:,那么根据此模型我们可以知道:当t=16时,残留的细菌数y=11.1014,很显然这样的结果会更令人满意!2.某销售公司将库存占用资金情况、广告投入的费用、员工薪酬以及销售额等方面的数据作了汇总(表 2),该公司试图根据这些数据找到销售额与其他变量之间的关系,以便进行销售额预测并为工作决策提供参考依据。(1)建立销售额的回归模型;(2)如果未来某月库存资金额为150万
5、元,广告投入预算为45万元,员工薪酬总额为27万元,试根据建立的回归模型预测该月的销售额。表2 库存资金额、广告投入、员工薪酬、销售额汇总表(单位:万元)月份 库存资金额(x1) 广告投入(x2) 员工薪酬总额(x3) 销售额(y)21.121.422.921.421.521.721.521.022.424.723.224.323.129.124.627.526.526.81090.41133.01242.11003.21283.21012.21098.8826.31003.31554.61199.01483.11407.11551.31601.22311.72126.72256.530.63
6、1.333.929.632.527.924.823.633.927.745.542.640.045.851.767.265.065.41 75.22 77.63 80.74 76.05 79.56 81.87 67.78 98.39 74.010 151.011 90.812 102.313 115.614 125.015 137.816 175.617 155.218 174.3解:首先,作出因变量与各自变量的样本散点图,如图3所示,程序如下:x1=75.2 77.6 80.7 76.0 79.5 81.8 67.7 98.3 74.0 151.0 90.8 102.3 115.6 125.
7、0 137.8 175.6 155.2 174.3;x2=30.6 31.3 33.9 29.6 32.5 27.9 24.8 23.6 33.9 27.7 45.5 42.6 40.0 45.8 51.7 67.2 65.0 65.4;x3=21.1 21.4 22.9 21.4 21.5 21.7 21.5 21.0 22.4 24.7 23.2 24.3 23.1 29.1 24.6 27.5 26.5 26.8;y=1090.4 1133.0 1242.1 1003.2 1283.2 1012.2 1098.8 826.3 1003.3 1554.6 1199.0 1483.1 140
8、7.1 1551.3 1601.2 2311.7 2126.7 2256.5;subplot(1,3,1),plot(x1,y,g*);subplot(1,3,2),plot(x2,y,k+);subplot(1,3,3),plot(x3,y,ro);图3 因变量y与各自变量的样本散点图从图上可以看出这些点大致分布在一条直线旁边,因此有较好的线性关系,可以采用线性回归。设回归方程为:,建立M-文件输入如下程序:x1=75.2 77.6 80.7 76.0 79.5 81.8 67.7 98.3 74.0 151.0 90.8 102.3 115.6 125.0 137.8 175.6 155.
9、2 174.3;x2=30.6 31.3 33.9 29.6 32.5 27.9 24.8 23.6 33.9 27.7 45.5 42.6 40.0 45.8 51.7 67.2 65.0 65.4;x3=21.1 21.4 22.9 21.4 21.5 21.7 21.5 21.0 22.4 24.7 23.2 24.3 23.1 29.1 24.6 27.5 26.5 26.8;y=1090.4 1133.0 1242.1 1003.2 1283.2 1012.2 1098.8 826.3 1003.3 1554.6 1199.0 1483.1 1407.1 1551.3 1601.2
10、2311.7 2126.7 2256.5;n=18;m=3;x=ones(n,1),x1,x2,x3;b,bint,r,rint,s=regress(y,x,0.05);b,bint,r,rint,s运行后即得到结果如表3所示表3 对初步回归模型的计算结果回归系数回归系数的估计值回归系数的置信区间-53.9075-1011.2,903.45.72522.0,9.415.28796.4,24.29.5698-44.9,64.1,,残差列向量r =44.0394 59.3264 96.5750 -35.3239 179.3461 -36.4116 180.2202 -244.3408 -99.08
11、12 84.1521 -184.5600 67.5082 -33.4048 -89.1104 -159.6274 69.7451 44.7425 56.2050对应残差的置信区间rint如下:-228.8318,316.9105、 -214.8092,333.4620-173.5015,366.6515、 -311.2066,240.5589-75.9312,434.6233、 -313.1813, 240.3581-69.6357,430.0762、 -449.7576,-38.9240-365.7729,167.6105、 -69.8815,238.1857-428.0384,58.918
12、5、 -208.3399,343.3563-312.3682, 245.5587、-199.0870,20.8662-415.9094,96.6547、 -172.6973,312.1875-207.2697,296.7547、 -186.8695,299.2794。因此得到初步的回归方程为:,当未来某月库存资金额为150万元,广告投入预算为45万元,员工薪酬总额为27万元,那么根据所建立的回归模型可以预测出该月的销售额为1751.2万元。3.葛洲坝机组发电耗水率的主要影响因素为库水位、出库流量。现从数据库中将 2005年10月某天15时-16时06分范围内的出库流量、库水位对应的耗水率读取处
13、理,数据如表4所示,试利用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。(表4数据来源:余波,多元线性回归分析在机组发电耗水率中的应用,计算机与现代化,2008(2)表4 耗水率与出库流量、库水位数据 时间 库水位(米) 出库流量 机组发电耗水率(年-月-天-时) (立方米) (立方米/万千瓦)65.0865.1065.1265.1765.2165.3765.3865.3965.4065.4365.4765.5365.6265.5865.7065.842005-10-15:002005-10-15:022005-10-15:042005-10-15:062005-10-15:0820
14、05-10-15:102005-10-15:122005-10-15:142005-10-15:162005-10-15:182005-10-15:202005-10-15:222005-10-16:002005-10-16:022005-10-16:042005-10-16:061560715565155401550715432156191553615514155191551015489154371635514708143931429660.4660.2860.1059.7859.4459.2558.9158.7658.7358.6358.4858.3157.9657.0656.4355.8
15、3解:首先,作出耗水率y与各自变量的样本散点图,如图4所示,程序如下:x1=65.08 65.10 65.12 65.17 65.21 65.37 65.38 65.39 65.40 65.43 65.47 65.53 65.62 65.58 65.70 65.84;x2=15607 15565 15540 15507 15432 15619 15536 15514 15519 15510 15489 15437 16355 14708 14393 14296;y=60.46 60.28 60.10 59.78 59.44 59.25 58.91 58.76 58.73 58.63 58.48
16、 58.31 57.96 57.06 56.43 55.83;subplot(1,2,1),plot(x1,y,g*);subplot(1,2,2),plot(x2,y,k+);图4 耗水率y与库水位、出库量关系散点图从散点图中可以看出机组发电耗水率与库水位有较好的线性关系,而与出库流量的关系难以确定,可以采用建立二次函数的回归模型。一般的多元二项式回归模型可表示为:。程序如下:x=x1,x2;rstool(x,y,interaction,0.05) % 包含线性项和完全二次项(交叉)结果得到交互式化面,如图5所示图5 耗水率y与库水位、出库流量的一个交互界面在左边图形下方的方框中输入65.4
17、0,右边图形下方的方框中输入15519,则画面左边的Predicted Y下方的数据变为58.7291,其置信区间在,即表明预测出库水位为65.40米,出库流量为15529立方米时的机组发电耗水率为58.7291立方米/万千瓦。在画面左下方的下拉式菜单Export里选“all”,则beta、rmse和residuals的值都发送到MATLAB界面,只需在MATLAB界面中输入:beta,rmse,residuals 即可得到结果如下:beta =-559.9056 9.2385 0.0611 -0.0009rmse= 0.1643residuals =0.0079 -0.0189 -0.0674 -0.0963 -0.1520 0.2737 0.0638 -0.0149 0.0009 0.0605 0.1302 0.3036 -0.2672 -0.1403 -0.0481 -0.0356故该多元线性回归模型:,剩余标准差为0.1643,说明此回归模型的显著效果很好。专心-专注-专业