数学建模大赛优秀参赛论文.pdf

上传人:赵** 文档编号:21128053 上传时间:2022-06-18 格式:PDF 页数:13 大小:635.51KB
返回 下载 相关 举报
数学建模大赛优秀参赛论文.pdf_第1页
第1页 / 共13页
数学建模大赛优秀参赛论文.pdf_第2页
第2页 / 共13页
点击查看更多>>
资源描述

《数学建模大赛优秀参赛论文.pdf》由会员分享,可在线阅读,更多相关《数学建模大赛优秀参赛论文.pdf(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、20122012 高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛承承诺诺书书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论

2、文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等) 。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写) :A我们的参赛报名号为(如果赛区设置报名号的话) :所属学校(请填写完整的全名) : 中国石油大学胜利学院参赛队员 (打印并签名) :1.侯春莹2.郑辰龙3.李新立指导教师或指导教师组负责人(打印并签名):日期:2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):20122012 高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛编编 号号 专专 用用 页页评阅人评分备注赛区评阅编号(由赛区组委会评阅前进行编号

3、):赛区评阅记录(可供赛区评阅时使用):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒质量评价的统计分析模型摘要研究葡萄酒的质量及影响其质量的因素对葡萄酒的生产指导具有重大的意义,评定葡萄酒的质量主要是通过一些有资质的评酒员对葡萄酒分类指标打分求和得到总分后,确定葡萄酒的质量。本文在给定合理假设的条件下,主要应用统计分析的方法对给定数据进行处理,得出了相应的结论。问题 1 中,首先计算两组评酒员对酒样评分的标准差,然后运用 T 检验来检验两组数据的显著性, 使用 matlab 画出标准差曲线, 分析得到第二组评酒员的评酒结果更为可信;问题 2 中

4、,根据酿酒葡萄的理化指标和葡萄酒的质量,运用主成分分析法及聚类分析,对红、白酿酒葡萄进行了优良中差四个等级的分级;问题 3 中,使用 sas 软件计算酿酒葡萄与葡萄酒理化指标之间的相关系数,建立了统计分析模型,最后分别列表给出酿酒葡萄与葡萄酒的理化指标之间的联系;问题 4 中, 根据前三个问题的解答分析, 建立了回归模型, 并求得相应的回归方程,以此来论证了能用酿酒葡萄和葡萄酒的理化指标去评价葡萄酒质量的问题。关键词关键词: :T 检验;matlab;sas;主成分分析法;聚类分析;相关性分析;回归分析11问题重述葡萄酒的质量是葡萄酒的一种特性,它是表示葡萄酒优秀的程度。影响葡萄酒质量的因素有

5、酿酒葡萄的好坏等,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,对葡萄酒的质量进行评价是通过感官指标和理化指标来实现的,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评,每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。附件 1给出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信;2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级;3. 分析酿酒葡萄与

6、葡萄酒的理化指标之间的联系;4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响, 并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。2模型假设1.2.3.4.5.假设所有附件数据真实可靠;假设数据计算中产生的误差忽略不计;假设温度、空气湿度、光照等外界因素不产生任何影响;假设品酒员在品酒过程中不掺杂任何个人因素;假设附件 1 中的数据符合正态分布。3. 符号说明:样本均值:样本均值t:检验统计量:检验水准r:相关系数:均值差4. 模型建立与求解4.1 问题 1 的分析及求解4.1.1 问题 1 的分析根据附件 1 中给出的数据, 对问题 1 用 T 检验1来判定两组评酒员的评价结果有无

7、著性差异,T 检验用于具有相同方差且和均未知的正态分布的样本,其中检验水准为,本题符合以上条件,所以可以用T 分布理论来推断差异发生的概率2,从而判定两组评酒员的评价结果差异是否显著。2然后再利用求得的标准差, 运用 matlab 画出图形, 比较两组评酒员对酒样评分标准差的折线走势得到结论,标准差走势较平缓且较小者,则其结果更加可信。4.1.2 模型建立及求解依据模型建立的思想,其模型具体求解的过程如下:引用下述t统计量作为检验统计量:-(1)t 11snn12则对两组 27 个红葡萄酒样本的评分进行t检验,运用 sas 的 Proc anova 的命令得出如下所示的结果:表 1 红葡萄酒样

8、本的p值p值p值酒样号酒样号12345678910111213140.21280.01590.05040.50960.66780.05260.14580.07260.18990.05080.66780.00030.02960.8712151617181920212223242526270.06500.76820.14100.09510.89610.28700.22430.05560.00230.03940.76480.43780.5785可以得出p值小于 0.10 的酒样号有 2、3、6、8、10、12、13、15、18、22、23、24 号,即针对以上红葡萄酒样,两组评论结果具有显著性差异。

9、对两组 28 个白葡萄酒样本的评分同样进行以上处理得结果如下:表 2 红葡萄酒样本的p值p值p值酒样号酒样号1234567891011120.24830.75270.67270.40730.00890.11650.19360.84820.11000.31490.86310.088831516171819202122232425260.18070.20550.72970.41580.13610.72690.57240.07140.53140.47850.52990.112313140.10350.174427280.01010.6077可以得出p值小于 0.10 的酒样号有 5、12、22、27

10、 号,即针对以上白葡萄酒样,两组评论结果具有显著性差异。运用 matlab 的 plot 命令可以得出以下曲线,具体分析如下:图 1 两组红葡萄酒评分的标准差曲线横轴表示酒样号,纵轴表示标准差,蓝色线表示第一组评酒员,绿色线表示第二组评酒员根据曲线取值总体大小,可以得出相对红葡萄酒而言,第二组评酒员的评酒结果更可信。图 2 两组白葡萄酒评分的标准差曲线横轴表示酒样号,纵轴表示标准差,蓝色线表示第一组评酒员,绿色线表示第二组评酒员根据曲线取值总体大小,可以得出相对白葡萄酒而言,第二组评酒员的评酒结果更可信。4.2 问题 2 的分析及求解4.2.1 问题 2 的分析面对问题 2 的大量数据和多项指

11、标,则可以运用主成分分析法3的降维思想,将多个指标转化为少数几个能够反映绝大部分信息的主成分,主成分之间互不相关,建立主成分分析法代数模型,使复杂问题得以简化,然后运用聚类分析3来进行对酿酒葡萄的4分级,聚类分析就是根据研究对象的特征把性质相近的个体归为一类,使得同一类中的个体具有高度的同质性,不同类之间的个体具有高度的异质性的多元分析技术。问题求解过程中的数据图表均为用 sas 处理得到的结果。4.2.2 模型建立与求解在附件 2 中,对 55 个红葡萄酒的指标经主成分分析后,得到 8 个主成分,累计贡献率为 82.92%,具有统计学上的意义,下图表明,这 8 个主成分所包含的成分指标基本可

12、以代表所有测定的成分指标,并且对红葡萄酒质量具有重要贡献。运用 sas 的 Procprincomp 命令处理数据,得出以下各图:表 3 红葡萄酒指标的主成分分析结果主成分累计贡献率(%)23.01第一主成分38.20第二主成分51.00第三主成分第四主成分第五主成分第六主成分第七主成分第八主成分60.7967.6273.5878.4582.92以主成分分析所得主成分作为变量进行聚类分析,结果如图所示:图 3 不同品种红葡萄酒聚类分析结果对两组红葡萄酒样得分取均值,进行升序排列结果如下:酒样号2393表 4 两组红葡萄酒样得分均值排序均值排序酒样号均值排序81.352772.2579.8513

13、71.7077.501071.5052171920242122261451677.1576.9075.6075.4074.7574.7074.4072.9072.8072.7072.4046825711118151269.9069.2569.1568.7068.4065.8565.4062.6562.2061.10对图 3 进行等级划分再结合表 4, 可以将红葡萄酒的酿酒葡萄分为以下四个等级 (数字表示各酿酒葡萄样本号):优23良2 3 5 17 20 24中4 6 7 10 12 13 14 15 16 18 19 21 22 26 27差1 11对 55 个白葡萄酒的指标经主成分分析后,

14、得到 8 个主成分, 累计贡献率为 89.04%,具有统计学上的意义,下表表明,这8 个主成分所包含的成分指标基本可以代表所有测定的成分指标,并且对白葡萄酒质量具有重要贡献。表 5 白葡萄酒指标的主成分分析结果主成分累计贡献率(%)23.13第一主成分41.61第二主成分54.23第三主成分63.91第四主成分71.90第五主成分79.33第六主成分84.94第七主成分89.04第八主成分以主成分分析所得主成分作为变量进行聚类分析,结果如图所示:6图 4 不同品种白葡萄酒聚类分析结果对两组白葡萄酒样得分取均值,进行升序排列结果如下:酒样号1213211681161814201921715表 6

15、 两组红葡萄酒样得分均值排序均值排序酒样号均值排序67.85575.7569.90775.8570.65976.6570.902276.6571.851077.0571.852577.2071.852777.8074.302377.8074.552478.0574.70478.1574.902679.5575.00179.9575.20380.4575.402880.45对图 4 进行等级划分再结合表 6, 可以将白葡萄酒的酿酒葡萄分为以下四个等级 (数字表示各酿酒葡萄样本号):优1 3 26良2 4 5 6 7 9 10 12 15 17 18 22 23 24 25 27 28中8 11

16、14 19 20 21差13 164.3 问题 34.3.1 问题 3 的分析7本题旨在分析酿酒葡萄与葡萄酒的理化指标之间的联系,所以可以采用相关性3分析的方法,来了解两个变量之间的关系密切程度。Pearson 相关系数是用来反映两个变量线性相关程度的统计量,相关系数用r表示,描述的是两个变量间线性相关强弱的程度,r的绝对值越接近于 1,p值越接近于 0,表明相关性越强。计算两个变量x、y相关系数的公式如下:(xi x)(yi y)(2)r 22(xi x)(yi y)4.3.2 模型建立及求解根据附件 2 中的数据,利用 sas 工具的 proc corr 命令,可以输出包括两组变量各自的相

17、关系数矩阵和两组变量之间的相关系数,典型相关系数及典型相关变量的系数,典型变量对之间相关的显著性检验的 F 统计量及其p值等,从而得出下表 4.11、表 4.12。表 7 酿酒葡萄与红葡萄酒的理化指标的相关系数(Pearson 相关系数 N=27)指标花色苷葡萄酒石酸黄酮醇葡萄总黄酮果皮颜色b(*)单宁总酚酒总黄铜白藜芦醇DPPH 半抑制体积色泽L(*)色泽a(*)r=-0.83422p0.0001色泽b(*)r=0.92285p.0001r=0.82599p.0001r=0.87643p.0001r=0.83011p0.0001r=0.89208p.0001r=0.87550p.0001r=

18、0.90690p0.0001_(表示相关性弱)结果显示,酿酒葡萄与红葡萄酒的理化指标之间,酒石酸与单宁相关性极强,与色泽 a(*)相关性强,葡萄总黄酮与总酚、酒总黄酮、白藜芦醇、色泽L(*)相关性强,果皮颜色 b(*)与花色苷相关性极强。表 8 酿酒葡萄与白葡萄酒的理化指标的相关系数Pearson 相关系数 N=28DDPH总酚酒总黄酮白藜色泽芦醇半抑制L*(D65)体积r=0.57504p0.0014r=0.59500r=0.69584p=0.0008p0.0001指标葡萄总酚葡萄总黄酮单宁色泽b*色泽b*(D65)8黄酮醇干物质含量出汁率r=0.61607p=0.0005r=-0.7207

19、1p0.0001r=0.68457p0.0001r=0.67755p0.0001r=-0.75011p0.0001(表示相关性弱)结果显示,酿酒葡萄与白葡萄酒的理化指标之间,总酚与总酚相关性较强,葡萄总黄酮与总酚相关性较强,与葡萄总黄酮相关性强,黄酮醇与酒总黄酮相关性强,干物质含量与色泽 L*(D65)相关性极强,与色泽 b*(D65)相关性强,出汁率与与色泽 L*(D65)相关性强,与色泽 b*(D65)相关性极强。4.4 问题 4 的分析及求解4.4.1 模型的分析与建立结合附件 2 和附件 3 的数据,在采用同问题3 相同的相关分析法的基础上,建立回归模型,回归分析是研究一个变量(被解释

20、变量y)关于另一个(些)变量(解释变量x)的具体依赖关系的计算方法和理论,特别是研究y关于x的条件均值的具体形式,即研究总体回归函数g(x),然后利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。假设总体回归函数为线性函数则建立回归模型为y 01x1pxp(3)对以上回归模型,还需进行系数的显著性检验( 0.05),模型的拟合优度检验,这些检验都能通过的模型是适当模型。4.4.2 模型求解结合附件 2、3 给出的数据,运用 sas 的 Proc reg 命令回归分析后最终得到回归关系显著地回归方程式(P)的结果如下:1、红葡萄(1)红葡

21、萄酒的理化指标和红葡萄酒芳香对红葡萄酒质量的回归方程如下:红葡萄酒的质量 = -1.84839(2-壬醇) +1.02128(十二酸乙酸) +0.43987(白藜芦醇)+0.63626(色泽 a(D65)(2)红葡萄的理化指标和红葡萄酒芳香对红葡萄酒质量的回归方程如下:红葡萄的质量 = -0.47465(3-甲基丁醛)+3.76174(2-戊酮)-72.50091(乙酸戊酯) +2.80623( 3,7-二甲基-2,6-辛二烯酸甲酯)-2.76918( (E)-2-壬烯-1-醇)-0.56984(总酚)-0.36955(总糖)+14.77155(百粒质量)+59.74434(出汁率)-2.10

22、423(果皮颜色 b*(黄) )92、白葡萄(1)白葡萄酒的理化指标和白葡萄酒芳香对白葡萄酒质量的回归方程如下:白葡萄酒的质量 = 0.6559(香叶乙醚)+5.70456(辛酸丙脂)-4.96765(5-甲基糠醛)+1.24211(丁二酸二乙酯)(2)白葡萄的理化指标和白葡萄芳香对白葡萄酒质量的一元回归方程如下:白葡萄的质量= -5.09217(3-甲基-1-丁醇-乙酸脂 )+1.43456(蛋白质)+498.38389(VC 含量)-91.74414(花色苷)+35.16078(酒石酸)通过线性回归分析可以阐明一个因变量 (葡萄酒的质量) 与多个自变量 (性能指标)间的线性依存关系,因此可

23、以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。5问题总结在满足一定的假设条件下,对题目中的四个问题作出以下分析:问题 1: 计算两组评酒员对各酒样评分的标准差大小, 运用 T 检验两组显著性大小,红葡萄酒样中的 2、3、6、8、10、12、13、15、18、22、23、24 号,白葡萄酒样中的5、12、22、27 号,两组评论结果具有显著性差异,再分析 matlab 画出的曲线,得到第二组评酒员的评酒结果更可信;问题 2:根据酿酒葡萄的理化指标和葡萄酒的质量,运用主成分分析和聚类分析的方法,对酿酒葡萄进行分级得到结果如下: 红葡萄 优 23,良2 3 5 17 20 24,中4 6 7 101

24、2 13 14 15 16 18 19 21 22 26 27, 差 1 11; 白葡萄 优 1 3 26, 良 2 4 5 6 7 9 10 12 15 17 1822 23 24 25 27 28,中 8 11 14 19 20 21,差 13 16;问题 3: 通过计算酿酒葡萄与葡萄酒理化指标之间的相关系数, 建立相关分析模型,分析得到两者之间的联系,红葡萄酒中酒石酸与单宁相关性极强,果皮颜色b(*)与花色苷相关性极强,白葡萄酒中干物质含量与色泽L*(D65)相关性极强,出汁率与色泽b*(D65)相关性极强。问题 4:根据对问题 1、2、3 的解答分析,综合所有数据,先经过相关分析,再求

25、解得到相应的回归方程,表示出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,从而论证:酿酒葡萄和葡萄酒的理化指标可以用来评价葡萄酒的质量。6模型评价与推广6.1 模型优点建立模型时,主要运用主成分分析、聚类分析、相关分析法、回归分析来建模,比较易于运用 sas、matlab 等工具,采用直观的图表形式,比较易于接受与理解,把数据繁杂的问题简单化,使问题的解决更容易。6.2 模型缺点在考虑问题时,都是在理想的假设条件下进行的,而真实情况下不可能没有任何客观因素影响,本题为了便于模型的建立与讨论,把这点当成一个强制的假设,另外计算过程中,使用了主成分分析法,从而有很多数据被筛选掉,不免也会对结果的真

26、实性造成影响,不如直接的感官接触。6.3 模型推广10人们在日常生活与工作中,常常要遇到运用主成分分析法来解决的问题,例如在啤酒节上要评定啤酒的风味,面对多个指标的评定数据,这就避免了啤酒节中评定流程的繁杂,还可以克服单一的财务指标不能真实反映企业的财务情况的缺点,引进多方面的财务指标, 将复杂因素归结为几个主成分, 使得复杂问题得以简化, 同时得到更为科学、准确的财务信息, 另外在教师评优或者企业职工评优等需要考虑多因素多指标的问题中也可以运用此种方法解决。对于相关性分析模型,可以用于比较两个专业之间各科成绩和数学水平的优劣,以及各科之间的相关性,也可以推广到其他领域,用来比较两组数据之间的差异显著性和两种变量之间的相关性,而建立回归模型,主要是求得自变量对因变量的影响,生活中也大有应用,如血压是否随年龄而变化等。参考文献1 盛骤,谢式千,潘承毅,概率论与数理统计(第四版) ,北京:高等教育出版社,2008 年 6 月2李运,李记明,姜忠军,统计分析在葡萄酒质量评价中的应用,北京:中国轻工业出版社,2009 年3 梅长林,范金成,数据分析方法,北京:高等教育出版社,2010 年 12 月11

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁