《2012年全国大学生数学建模A题葡萄酒质量评价.doc》由会员分享,可在线阅读,更多相关《2012年全国大学生数学建模A题葡萄酒质量评价.doc(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、,2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示
2、,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):统计学在葡萄酒质
3、量评价中的应用摘要:随着酿酒业的发展,越来越多不同层次的葡萄酒涌入市场,葡萄酒质量的评价也越发的重要。对于第一题,在对两组评酒员评价结果进行显著性检验的过程就是假设检验的过程。为了推断两组品酒员的评价结果是否有显著性差异,需要提出一个没有显著性差异的零假设。通过对样本的总体特征来判断假设的合理性。我们用双样本的Kolmogorov-Smirnov检验方法得到两组评价结果是有明显性差异的。在可信度分析中,通过方差分析,得出第二组的评价结果更合理。第二题,这是个多对象多指标的分级问题。所以我们采用综合评价方法,结合评价员对葡萄酒的评分,分别对酿酒葡萄的理化指标和葡萄酒的质量进行评价并分级(为方便数
4、据处理,分为10个等级)。在设置不同指标间的权重时,我们利用了附录一中品酒员对葡萄酒评价的评分标准。但是,葡萄的等级高不能说明酿酒葡萄的等级也高,即有些葡萄品质很好,但不适合酿酒;而有些葡萄品质较低,但适合酿酒。所以我们将葡萄的理化指标等级(即葡萄自身质量)作为横轴,葡萄酒的质量等级作为纵轴做出一个坐标轴,并做出图象。然后将葡萄样品分布在该坐标轴上,在直线上方的点表示较劣质的葡萄酿出较优质的酒,这类葡萄就是优质的酿酒葡萄。通过这种方法,我们将酿酒葡萄分为“优质葡萄”、“中等葡萄”、“劣质葡萄”三个等级。第三题中,我们将酿酒葡萄理化指标和葡萄酒的理化指标中都具有的指标拿出来。然后使用回归分析法对
5、每一个单独的理化指标进行分析,得到回归方程。通过MATLAB软件检验,判断回归方程是否成立。第四题中,我们用葡萄等级和葡萄酒等级代替酿酒葡萄和葡萄酒的理化指标。再将葡萄等级、葡萄酒等级和葡萄酒质量进行拟合,得到二元一次方程。由拟合方程得到估计葡萄酒质量。通过对葡萄酒质量的实际值与估计值做显著性检验,得到实际值与估计值之间无显著性差异,即可以用拟合方程得到葡萄酒质量。所以可以用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。关键字:显著性检验 综合评价法 回归分析法 葡萄等级 葡萄酒质量一、 问题重述 葡萄酒是许多人都喜欢的饮品,但是大多数人在选购葡萄酒时,都会面临葡萄酒质量好坏的问题。本题,我们就
6、是要解决能否用一种更加直观,更加简单的方法来量化葡萄酒的质量。于是,我们要解决下列问题:1、 分析附件1中两组评酒员的评价结果是否有显著性差异,并给出那组结果更可信。2、 通过酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3、 分析酿酒葡萄与葡萄酒的理化指标之间的关系。4、 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并讨论能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二、 问题分析确定葡萄酒质量的一般方法是通过评酒员的品评。但是葡萄酒以及酿酒葡萄中是有很多量化的理化指标的,所以我们研究能不能建立一种新的方法即通过这些理化指标就可以得到葡萄酒的质量。这样就可以简化对葡萄酒质量
7、评定,而且更加准确,易行。葡萄酒的主要影响指标通常是外观、气味和口感。外观和酿酒所用的葡萄品种是有着直接的关系的,当然还有制作工艺等等。气味主要来源去酒中的各种芳香物质,像乙酸乙酯、己酸乙酯和乙醇等。口感的影响因素比较多,有糖、酸、单宁、可溶性固形物和固酸比等等。在对各个问题进行分析时,必须抓住问题重点,对这些指标加以区分,有侧重的考虑和使用,才能反映问题特点。三、 模型假设1、 假设评酒员在分成两组时是随机分配的。2、 假设评酒员在进行评酒时有统一的评价标准,除“平衡/整体评价”外,其它评价忽略个人的喜好、感情等主观因素。只考虑评酒能力。3、 假设通过网络查询的文献资料真实可靠。4、 假设显
8、著性分析时,评酒员的评分是符合正态分布的。5、假设葡萄酒的质量不考虑制作工艺水平。四、 符号说明符号意义备注综合评价中的对象综合评价中的指标经过一致化处理后的指标第种指标的标准差第种指标的权重第种指标的综合评分五、 模型建立问题一、1-1有无显著性差异分析 对于问题一,我们利用MATLAB中双样本Kolmogorov-Smirnov检验方法判断两组评酒员的评价结果是否有显著性差异。我们将两组人员的评价结果分为白葡萄酒和红葡萄酒两部分分别进行检验。下面我们以红葡萄酒为例:我们注意到,每个酒样本的总分都是100分,并分成四个小项目“外观分析”,“香气分析”,“口感分析”,“平衡/整体分析”。同时在
9、每一组中都有10名评酒员进行评分。分别将10名评酒员的总分算出,并得到该小组对每个样品的评分的平均值。将两个小组对红葡萄酒每个样品评分的平均值作为两个样本,提出零假设:零假设:样本1和样本2无显著性差异。由MATLAB得到:为小概率,表示接受原假设的概率很小,故拒绝零假设,即样本1和样本2有显著性差异。同理,对白葡萄酒同样由MATLAB得到:可以看出在对白葡萄酒的评价中,两个小组仍然具有显著性差异。1-2可信度分析 在可信度问题中,因为两个评价组评价的的样品都是一样的,即红葡萄酒1至27样品,白葡萄酒1至28样品,所以影响可信度的因素是评价员的品酒水平。一般来说,评价员的水平都较高时,对同一种
10、酒的评价结果是接近的,即方差会较小。所以,将两个小组对各种葡萄酒评分的的方差算出,并统计为下图。 由上图可以看出,第二组的方差相对第一组较小。所以,第二组的评价员的整体品酒水平更高一些,即可信度更高。问题二、在问题二中,对酿酒葡萄的分级是从两个方面综合评价的,分别是葡萄的理化指标和这种品种的葡萄所酿酒的质量。首先,通过查阅资料,确定葡萄品质和葡萄酒质量的主要理化指标,由此将葡萄品质及这种葡萄对应葡萄酒进行分级(等级越高,品质越好),为了便于计算,将等级分为十个等级。然后建立坐标系,将葡萄品质等级作为横轴,葡萄酒等级作为纵轴,将各种葡萄作为一个点反应在该坐标轴上。而后从经济利润的角度对酿酒葡萄进
11、行分级。2-1 葡萄品质等级划分针对葡萄理化指标较多的问题,我们采用综合评价法对葡萄品质等级进行划分。但是即便使用综合评价法,对多达五十多种指标进行评价也是不现实的。出于时间和模型更加简单易操作考虑,我们通过查阅资料并结合附录一评分标准,只选取其中以下几种最重要的指标,对这几种指标进行评价就可以基本评定葡萄的品质。评分项目影响指标外观15果皮颜色香气30乙酸乙酯己酸乙酯口感44总酸单宁可溶性固形物固酸比因为对葡萄品质等级评价最终是为了对酿酒葡萄进行分级,而果皮颜色主要影响因素是葡萄皮中的花色苷,所以对外观的影响指标应该用花色苷代替。以红葡萄为例建立评价模型(1) 、确定被评价对象该问题中的评价
12、对象即为红葡萄的27种样品,记为。(2) 、建立评价体系1 评价指标类型的一致化处理由于影响葡萄等级的七种指标中可能包含有“极大型指标”,“极小型指标”,“中间型指标”,“区间型指标”。所以在处理数据前要把各种指标都化成“极大型指标”。极小型指标:通过变换,可以将x极大化。中间型指标:通过变换可以将x极大化(M和m分别是x可能取值的最大值和最小值)。区间型指标:通过变换可以将x极大化(是x的最佳稳定区间,M和m分别是x取值的最大值和最小值)。2 评价指标的标准化处理由于评价指标之间存在不同的单位和数量级,所以在数据处理前要进行指标数据的标准化处理。利用标准差方法,令得到的标准观测值。具体使用M
13、ATLAB中的zscore()函数对各评价指标样本进行标准化处理。(3) 、确定各指标的权重 通过参考附件一中品酒员的评分标准,我们确定各评价项目的权重,列为下表:评分项目评分标准权重外观15香气30口感44 所以,各评价指标权重为评价指标花色苷乙酸乙酯己酸乙酯总酸单宁可溶性固形物固酸比权重(4) 、建立模型我们选用线性加权函数作为评价模型,对27种对象进行综合评价。第i种红葡萄样品的综合得分为。最终得到27种红葡萄样品得分如下表:样品编号综合得分样品编号综合得分葡萄样品1-0.594156223葡萄样品15-0.21612179葡萄样品2-0.034517073葡萄样品16-0.198706
14、02葡萄样品30.382402192葡萄样品170.077067874葡萄样品4-0.0503045葡萄样品18-0.351996136葡萄样品50.685716801葡萄样品190.651919673葡萄样品6-0.062670427葡萄样品20-0.442105383葡萄样品7-0.063926378葡萄样品210.545201379葡萄样品80.400502647葡萄样品220.389542935葡萄样品90.43985833葡萄样品230.44550505葡萄样品10-0.653478903葡萄样品240.376561321葡萄样品11-0.631819738葡萄样品25-0.6663
15、78834葡萄样品12-0.502941061葡萄样品26-0.50641703葡萄样品130.147925048葡萄样品270.260412798葡萄样品140.172923447 (5) 、红葡萄的等级划分 将上表中最大值和最小值之间的数据划分为10个等级,得分越高,等级越高,品质越好。最终统计为下表:等级10级9级8级7级6级样品199、21、233、8、22、2413、14、2717等级5级4级3级2级1级样品2、4、6、715、161812、20、261、10、11、25同理,白葡萄的综合评分为:葡萄样品综合评分葡萄样品综合评分葡萄样品1-0.139333958葡萄样品15-0.52
16、8631448葡萄样品20.06751818葡萄样品16-0.533273849葡萄样品3-0.395686004葡萄样品170.315014756葡萄样品40.494884872葡萄样品180.055582788葡萄样品5-0.580841809葡萄样品190.641303506葡萄样品60.789113804葡萄样品20-0.451078813葡萄样品70.482173185葡萄样品210.120248229葡萄样品80.149281088葡萄样品220.365608876葡萄样品9-0.14177467葡萄样品230.381455986葡萄样品10-0.222594614葡萄样品24-0
17、.209647948葡萄样品11-0.382741111葡萄样品250.062074531葡萄样品12-0.152593587葡萄样品260.033876861葡萄样品13-0.221329809葡萄样品27-0.167797615葡萄样品14-0.477509997葡萄样品280.64669857白葡萄的最终等级划分为:等级10级9级8级7级6级样品619、284、7、2317、228、21等级5级4级3级2级1级样品2、18、25、261、9、12、2710、13、243、115、14、15、16、202-2葡萄酒的等级划分 同样使用综合评价法,对葡萄酒等级进行划分。通过查阅资料和参看附录
18、一与附录二,选择一下几种评价指标。红葡萄酒:评分项目影响指标外观15花色苷香气30乙酸乙酯己酸乙酯口感44单宁权重分别取为评价指标花色苷乙酸乙酯己酸乙酯单宁权重综合评价得分为酒样品综合评分酒样品综合评分酒样品1-0.369075822酒样品15-0.60388582酒样品20.608722688酒样品16-0.014676737酒样品3-0.438728269酒样品170.954452419酒样品40.675632821酒样品18-0.875305774酒样品50.607741893酒样品190.436044421酒样品60.648147262酒样品20-0.049509681酒样品7-0.8
19、3984902酒样品210.797152038酒样品8-0.59578418酒样品220.531354784酒样品9-0.284343134酒样品230.758311854酒样品10-0.102448385酒样品24-0.030855662酒样品11-1.151671331酒样品25-0.367748508酒样品12-0.095870935酒样品26-0.708597617酒样品130.506527463酒样品27-0.016379895酒样品140.020643126最终红葡萄酒的等级划分为等级10级9级8级7级6级样品17、21、232、4、5、613、19、2212、14、24、16、2
20、0、27等级5级4级3级2级1级样品9、101、3、258、15、267、1811同理,可以对白葡萄酒进行等级划分。但是,因为白葡萄酒在酿造过程中去除了葡萄皮,所以花色苷的含量接近于零。所以,白葡萄酒的评价指标中不含花色苷。各评价指标权重为评价指标乙酸乙酯己酸乙酯单宁权重综合评分为酒样品综合评分酒样品综合评分酒样品1-0.260636719酒样品151.249656145酒样品2-0.498127949酒样品16-0.636470853酒样品30.553674911酒样品17-0.334784982酒样品40.770327351酒样品18-0.845475888酒样品5-0.022097031
21、酒样品190.194819986酒样品6-0.730349233酒样品201.467106036酒样品7-0.791825366酒样品21-0.16815625酒样品8-0.362899089酒样品220.378643061酒样品90.153347575酒样品23-0.75056111酒样品100.850539305酒样品24-0.709503116酒样品11-0.931999174酒样品25-0.284285655酒样品120.790980104酒样品26-0.007346044酒样品13-0.25104734酒样品271.278439376酒样品14-0.546549194酒样品280.4
22、44581143最终白葡萄酒的等级划分为等级10级9级8级7级6级样品15、20、 274、10、12322、28等级5级4级3级2级1级样品9、195、21、2618、25、13、172、14、166、7、11、18、23、242-3酿酒葡萄的等级划分 得到葡萄品质与葡萄酒质量的等级划分后,以葡萄品质为横轴,葡萄酒质量为纵轴。得到红葡萄和白葡萄在坐标轴上的分布,同时做一条参考直线。以经济利润为酿酒葡萄的分级标准: 在直线上方的点是较为劣质的葡萄却酿出了较为优质的葡萄酒,所以这类葡萄的经济利润大,是比较理想的酿酒葡萄,定为优质酿酒葡萄。 在直线下方的点是较为优质的葡萄却酿出了较为劣质的葡萄酒,
23、所以这类葡萄的经济利润小,甚至可能会入不敷出,定为劣质酿酒葡萄。 刚好在直线上的点定为中等酿酒葡萄。酿酒葡萄等级红葡萄样品优质酿酒葡萄 1、2、4、6、10、12、13、16、17、20、21、23、25、26劣质酿酒葡萄3、5、7、8、9、14、15、18、19、24、27中等酿酒葡萄11、22酿酒葡萄等级白葡萄样品优质酿酒葡萄3、5、8、9、10、12、14、15、16、20、27劣质酿酒葡萄1、2、6、7、11、17、28、18、19、21、22、23、24、25、26中等酿酒葡萄4、13问题三、 在问题三中,要寻找酿酒葡萄与葡萄酒的理化指标之间的联系。 首先,通过对葡萄酒和酿酒葡萄的各
24、项理化指标对比分析,我们发现了在葡萄酒和酿酒葡萄都存在的理化指标。然后,对这些理化指标进行回归性分析,得到两者之间的联系。 经过分析,列出两者都具有的理化指标有:花色苷、单宁、总黄酮、白藜芦醇。 由MATLAB软件得到各个理化指标的回归方程,以及与F值对应的概率p。(1) 红葡萄与红葡萄酒的花色苷分析 回归方程为:,F值所对应的概率p=00.05;(2) 红葡萄与红葡萄酒的单宁分析 回归方程为:,F值所对应的概率p=00.05;(3) 白葡萄与白葡萄酒的单宁分析 回归方程为:,F值所对应的概率p=0.00140.05;(4) 红葡萄与红葡萄酒的总黄酮分析 回归方程为:,F值所对应的概率p=00
25、.05;(5) 白葡萄与白葡萄酒的总黄酮分析 回归方程为:,F值所对应的概率p=00.05,说明酿酒葡萄中的白藜芦醇与葡萄酒中的白藜芦醇没有关系;问题四、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。之前,我们已经将酿酒葡萄和葡萄酒的理化指标量化为葡萄等级和葡萄酒等级。所以,这题就是分析葡萄等级和葡萄酒等级对葡萄酒质量的影响。而葡萄酒质量就是评酒员评分的平均值。首先,用功效系数法将葡萄酒质量标准化并且将数值大小放到区间之间。在用二元拟合的方法,把葡萄等级作为x,葡萄酒等级作为y,葡萄酒质量作为z。拟合方程,得到系数的值。将带回拟合方程,得到估算值。最后,用双样本K-S检验对进行显著性检验。
26、具体使用MATLAB得到,。所以拟合方程为。显著性检验提出零假设:得到为大概率,所以接受零假设。所以无显著性差异。所以可以用这个拟合方程与葡萄等级和葡萄酒等级来求出葡萄酒质量。所以可以用葡萄等级和葡萄酒等级求出葡萄酒质量。所以可以用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。6、 模型分析在问题二中所建立的综合评价模型中,将红葡萄酒最终划分的等级与附录一中评酒员对红葡萄酒的评分平均值做对比。观察这种模型是否可靠。图中出现不能完全吻合的情况主要是由于建立综合评价模型时只考虑了主要指标,很多次要指标没有加入到模型中,所以数值会有些误差。但是,估计值和平均值的走势是一致的,这说明这个模型是成功的,
27、只是精度有些误差。7、 模型评价在问题二中,对数据采取了线性加权的方法,当权重系数预先给定时,该方法使评价结果对于各备选方案之间的差异表现不敏感;而且该方法计算简便,可操作性强,能够推广到对白酒等酒种理化指标的分级。对酿酒葡萄的分级过程中,用葡萄品质及葡萄酒质量来建立坐标系,将葡萄样品分布在坐标系中。这种方法直观,新颖。由于时间原因,在综合评价时选取的指标有限,这样对葡萄及葡萄酒分级得到的结果会有一定的误差。但是,因为选取的指标为主要指标,所以误差在容许范围以内。8、 参考文献1 茆诗松、程依明 、濮晓龙,概率论与数理统计教程,北京:高等教育出版社,2004.72占君、张倩、满谦,MATLAB
28、函数查询手册,北京:机械工程出版社,2011.13马莉,MATLAB数学实验与建模,北京:清华大学出版社,2010.14谭永基、蔡志杰,数学模型,上海:复旦大学出版社,2011.15谢辉樊、丁宇、张雯、郭春苗、周晓明、闫鹏、卢春,统计方法在葡萄理化指标简化中的应用, ,2012.9.86酒类新闻纵横,酿酒葡萄品质好坏的五大指标,http:/www.9998.tv/news/29070.html ,2012.9.87百度文库,综合评价方法及其应用, ,2012.9.78百度文库,第11讲_matlab回归分析, ,2012.9.99、 附录附件1:葡萄酒品尝评分表(含4个表格)附件2:葡萄和葡萄酒的理化指标(含2个表格)附件3:葡萄和葡萄酒的芳香物质(含4个表格)附件4:综合评价数据处理附件5:评分表的数据处理附件6:MATLAB程序汇总