数学建模南瓜问题(共14页).doc

上传人:飞****2 文档编号:13447691 上传时间:2022-04-29 格式:DOC 页数:14 大小:134.50KB
返回 下载 相关 举报
数学建模南瓜问题(共14页).doc_第1页
第1页 / 共14页
数学建模南瓜问题(共14页).doc_第2页
第2页 / 共14页
点击查看更多>>
资源描述

《数学建模南瓜问题(共14页).doc》由会员分享,可在线阅读,更多相关《数学建模南瓜问题(共14页).doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精选优质文档-倾情为你奉上 南瓜估重问题 摘要:在秤出现以前人们想出各种方法来测量物体的重量。最常见的就是观测物体的体形来预测起重量。如今不用天平估计南瓜重量是某些农村居民在秋天一种常见的竞赛,对于农民来说这可能就要靠平时所积累的经验了,但对于我们来说要估计一个南瓜的重量或者区分不同品种的南瓜就可以用数学知识建立模型解决问题。2003 Data周边垂直长度高度t水平长度垂直方向1垂直方向2重量422.819.319.20.25630.426.426.50.67.531.128.7290.759.75042.542.32.414.74648.848.82.819.76666.566731.266

2、858810.124.785868112.532.783.797.599.516.923.2101.293.389.817.2单位 cm精确到 +/- 0.1磅2004 Data周边垂直长度高度水平长度垂直方向1垂直方向2重量7.427.82727.50.6258.14135.535.81.1258.450.541.7422.12512.547.546462.751867.564.5667.6252174.673.572.58.8751985.8817911.2526.578.3908912.7525.490.189.5891623.5101.59394.519.375单位 cm精确到 +/-

3、 1/8磅关键词:重量 高度 水平长度 垂直方向1 垂直方向2 重量 问题的分析及简化: 在本次的建模过程主要用到回归分析法,预测一个南瓜的重量跟许多因素有关,而这些因素又往往相互制约,要确立一个估计南瓜重量的函数关系就必须找出重量与各因素之间的关系。要找出这些关系首先利用已给的数据画出散点图,然后确立因变量与自变量之间的关系。 问题一:讨论南瓜的各种度量和假设。 问题二:列出估计南瓜重量的表达式。 问题三:运用2003年的数据检验表达式的可行性。 问题四:运用2004年的数据辨别出白南瓜。模型假设:(1) 重量的估计只与高度 水平长度 垂直方向1 垂直方向2四个变量有关。(2) 一定范围内的

4、误差可忽略不计,如可以删去一些差距很大的数据 变量说明:x1: 南瓜的高度x2: 南瓜的垂直方向2x3:南瓜的垂直方向1x4:南瓜的水平长度w:南瓜的重量模型建立:首先运用MATLAB中的scatter命令分别画出重量和个变量高度 水平长度 垂直方向1 垂直方向2之间的散点图从而大致判断他们之间的函数关系.(1) 重量与水平长度程序: clearw=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;x4=22.8 30.4 31.1 50 46 66 66 85 83.7 101.2;scatterx4,w)图象: 图1(2) 重量与垂直方向1程序:cle

5、arw=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3;scatter(x3,w)图象:图2(3) 重量与垂直方向2程序: clearw=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8;scatter(x2,w)图象: 图3(4) 重量与高度程序:clearx1=4 6 7.5 9.7 14.7 19.7 31.2 24.7 32

6、.7 23.2;w=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;scatter(x1,w)图象: 图4 从图1和图4可以发现,随着x4和x1的增加,w的值有向上弯曲的增加的趋势,而且可以观察到图一的曲线是经过原点的.所以图中的曲线可分别用两条曲线模拟:曲线1: w=a1*x4+a2*x42+b曲线2: w=a0+a1*x1+a2*x12而图2,3中,当x3和x2增加时,w的值有比较明显的线性增长趋势,图中的直线分被用两条直线模拟: 直线1: w=a0+a1*x3+b 直线2: w=a0+a1*x2+b综上所述,结合以上四个模型建立如下的回归模型:w=

7、a0+a1x4+a2*x42+ a3*x1+a4*x12+ a5*x3+a6*x2+b(其中a0,a1,a2,a3,a4,a5,a6为常数,b是随机误差,如果模型选择合理的话,b应大致服从均值为零的正态分布)模型的求解:直接利用MATLAB中的regress命令求解,求解过程及结果如下:程序:clearx1=4 6 7.5 9.7 14.7 19.7 31.2 24.7 32.7 23.2;x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8;x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3;x4=22.8 3

8、0.4 31.1 50 46 66 66 85 83.7 101.2;w=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;n=10;X=ones(n,1),x1,x1.2,x2,x3,x4,x4.2;b,bint,r,rint,s=regress(w,X,0.05);b,bint,s,rcoplot(r,rint)结果:b = 1.0334 -0.1556 0.0103 0.1022 -0.1242 -0.0386 0.0020bint = -7.9118 9.9786 -5.0098 4.6985 -0.0104 0.0311 -0.6130 0.81

9、74 -2.9738 2.7253 -1.3954 1.3183 -0.0015 0.0055s =0.9954 108.9983 0.0013 程序说明: 语句X=ones(n,1),x1,x1.2,x2,x3,x4,x4.2表示一个向量矩阵,其中ones(n,1)生成一个n行1列的元素全为1的矩阵.语句b,bint,r,rint,s=regress(w,X,0.05)中bint是回归系数的置信区间,r是残差(列向量),rint是残差的置信区间,s包含3个统计量:决定系数R2(相关系数为R); F值; F(1,n-2)分布大于F值的概率p.语句rcoplot(r,rint)生成一个是序残差图

10、即下图. 时序残差图结果分析:由结果可得,R2=0.9954在0.8到1之间,可判断回归自变量和因变量具有较强的线性相关性;此模型中F的值要比F(1,n-2)大很多,同样也表现出两者具有较强的线行相关性;p小于显著水平0.05,所以所得的模型可用.模型的检验:将数据带2003年数据带入模型中进行检验程序: clearx1=4 6 7.5 9.7 14.7 19.7 31.2 24.7 32.7 23.2;x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8;x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3;x4

11、=22.8 30.4 31.1 50 46 66 66 85 83.7 101.2;w=x1.*0.6255-2.9611.*sqrt(x2+x3)./2)+0.0021.*x4.2+9.9289结果:w = 0.3006 0.5749 0.5790 2.6078 2.3546 6.6157 10.8061 12.2400 15.7989 17.1336结果基本与数据相符,所以此模型有效.模型的应用:根据题目要求将2004年的数据带入已求的模型中,辨认出其中的白南瓜程序: clearx1=7.4 8.1 8.4 12.5 18 21 19 26.5 25.4 23.5;x2=27.5 35.8

12、 42 46 66 72.5 79 89 89 101.5 ;x3=27 35.5 41.7 46 64.5 73.5 81 90 89.5 93;x4=27.8 41 50.5 47.5 67.5 74.6 85.8 78.3 90.1 94.5;w=x1.*0.6255-2.9611.*sqrt(x2+x3)./2)+0.0021.*x4.2+9.9289结果:w = 0.7232 0.8455 1.3828 2.40266.8370 9.4516 10.7880 11.3662 14.8903 14.1807与原数据: 0.625 1.125 2.125 2.75 7.625 8.875

13、 11.25 12.75 16 19.375相不容易看出哪一个是白南瓜.由于无法辨认白南瓜且置信区间都为负的且所得结果和真实数据还是存在一定的误差,为使模型更加完善需进一 步改善.模型的改进:由于x2和x3的本质是一样的,所以将两者区算术平均,重新拟合:程序: clearw=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8;x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3;scatter(x3+x2)./2,w)图象:此

14、曲线可由模型:w=a0+a1*(x2+x3)./2+a2*(x2+x3)./2).2+b 拟合;接下来讨论两种改进方法.方法一:可采用残差分析法进行改进,由模型的时序残差图可发现有四个点的残差偏离原点,可看做奇异点看待,去掉后重新拟合,但此图只有10组数据,如果去掉4个,此模型的实际参考价值就会远远降低,所以此方法不可行.方法二:添加交互项.本题添加交互项为w=a0+a1x4+a2*x42+a3*x1+a4*(x2+x3)./2+a5*(x2+x3)./2).2+a6*x1*(x2+x3)./2+x7*x1*x4+a8*(a2+a3)./2*a4求解;程序:clearx1=4 6 7.5 9.

15、7 14.7 19.7 31.2 24.7 32.7 23.2;x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8;x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3;x4=22.8 30.4 31.1 50 46 66 66 85 83.7 101.2;w=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;n=10;X=ones(n,1),x1,x1.2,(x2+x3)./2,(x2+x3)./2).2,x4,x4.2,x1.*(x2+x3)./2,x4.*(x2+x3)

16、./2;b,bint,r,rint,s=regress(w,X,0.05);b,bint,s,rcoplot(r,rint)结果:b = 1.3138 0.9004 0.0272 -0.6945 0.0082 0.3262 -0.0068 -0.0334 0.0089bint = -0.6447 3.2722 -1.6602 3.4610 -0.4907 0.5451 -2.2552 0.8662 -0.0096 0.0261 -0.4602 1.1126 -0.0600 0.0463 -0.3468 0.2800 -0.0926 0.1104s = 1.0e+004 * 0.0001 4.7

17、019 0.0000结果分析:与前一个模型相比较虽然回归系数的置信区间仍为负,没有达到预期的效果的,但模型明显得到优化,具体体现在以下几个方面:R2和F的值都增加了且p的值减少,这说明因变量和自变量之间有更强的相关性;另一方面由时序残差图可以看出改进之后的模型没有奇异点.模型的检验:程序:clearx1=4 6 7.5 9.7 14.7 19.7 31.2 24.7 32.7 23.2 23.5;x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8 101.5;x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3

18、93;x4=22.8 30.4 31.1 50 46 66 66 85 83.7 101.2 94.5;w=1.3138+0.9004.*x1+0.0272.*x1.2-0.6945.*(x2+x3)./2+0.0082.*(x2+x3)./2).2+0.3262.*x4-0.0068.*x4.2-0.0334.*x1.*(x2+x3)./2+0.0089.*x4.*(x2+x3)./2结果:w = 0.2569 0.5505 0.7118 2.3430 2.6988 6.8199 9.7426 12.2087 16.4519 16.8759 23.0671模型应用(辨别白南瓜)程序:clea

19、rx1=7.4 8.1 8.4 12.5 18 21 19 26.5 25.4;x2=27.5 35.8 42 46 66 72.5 79 89 89;x3=27 35.5 41.7 46 64.5 73.5 81 90 89.5;x4=27.8 41 50.5 47.5 67.5 74.6 85.8 78.3 90.1;w=1.3138+0.9004.*x1+0.0272.*x1.2-0.6945.*(x2+x3)./2+0.0082.*(x2+x3)./2).2+0.3262.*x4-0.0068.*x4.2-0.0334.*x1.*(x2+x3)./2+0.0089.*x4.*(x2+x

20、3)./2结果:w =0.4503 1.3616 2.2927 2.6165 6.9363 8.9736 13.4110 14.8067 15.1065模型的分析:将以上两种方法的结果与2003年,2004年的数据分别进行对比:2003年数据对比:改进之前的结果改进之后的结果原始数据0.30060.25690.250.57490.55050.60.57900.71180.752.60782.34302.42.35462.69882.86.61576.8199710.80619.742610.112.240012.208612.515.798916.451916.917.133616.87591

21、7.2对比表中的数据可以明显看出改进之后的结果更加接近原始数据,所以改进之后的模型更优。2004年数据对比改进之前结果改进之后结果原始数据0.72320.45030.6250.84551.36161.1251.38282.29272.1252.40262.61652.756.83706.93637.6259.45168.97368.87510.788013.411811.2511.366214.806712.7514.890315.10651614.180723.067119.375对比表格中的数据可以看出第10组数据的差异不比较大,所以判定第10个 南瓜是白南瓜其他的是黄南瓜。模型的评价:此模型采用了回归分析的方法,一般此种方法要处理大量数据,工作两非常大,而MATLAB软件的应用使计算简单化,MATLAB统计工具箱几乎包含了数理统计方面的概念,理论,方法和算法。其强大的图形功能使得概念,过程和结果可以直观地展现在我们面前。但此模型中对于回归系数的估计不是很理想,回归系数的置信区间都包含零点,所以此模型还有待进一步改善。参考文献:数学建模及典型案例分析化学工业出版社 李志林 欧宜贵 编著数学模型应用实例合肥工业大学出版社 杨桂元 李天胜 徐军 编著数学模型及其应用科学出版社 戴明强 李卫军 杨鹏飞 编著专心-专注-专业

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁