《数学建模葡萄酒问题二的分析.docx》由会员分享,可在线阅读,更多相关《数学建模葡萄酒问题二的分析.docx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4
2、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件1:葡萄酒品尝评分表(含4个表格)附件2:葡萄和葡萄酒的理化指标(含2个表格)附件3:葡萄和葡萄酒的芳香物质(含4个表格) 二、问题分析问题二的分析问题二要根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。题目对葡萄酒样品给出了葡萄酒品尝评分表、理化指标分析表和芳香物质分析表。由于葡萄酒理化指标分析表和芳香物质分析表没有一个可行的分析方法对葡萄酒的质量进行判断。因此,把葡萄酒品尝评分表作为对葡萄酒质量的评定。 由问题一,得到第二组评酒员的评价结果更可信。先对葡萄酒评分求平均值。
3、再用主成分分析法处理酿酒葡萄的理化指标,将30个指标缩减为几个主成分。由于数据的计量单位不同,对葡萄酒的平均分和酿酒葡萄的理化指标量纲化处理。通过spss求出葡萄样本各指标与主成分的相关系数矩阵。从而求出各葡萄样本与主成分的关系矩阵Y=最后用综合主成分分析法,将各葡萄酒的平均值(量纲化处理)与各葡萄样本跟主成分的关系矩阵建立一个线性关系。通过这个线性关系对葡萄样品进行打分,再用分值对葡萄进行分级。三、模型假设1、 葡萄酒的质量仅由葡萄酒的评分决定。2、 葡萄酒的二级理化指标的信息全部反应在相对应得一级理化指标中。四、符号说明 表示综合得分的数学期望, 表示第组评分与总平均值之差, 表示第组第个
4、评酒师的评分与第组评分均值的偏差; 表示第组的第号评酒师对第号酒的综合评分 表示第组第个评酒师弟K号样品酒分析结果与第号评酒师评分的偏离; 称为因素A的离差平方和, 称为因素E的离差平方和, 称为因素B的离差平方和 酿酒葡萄的不同的理化指标 各葡萄样本与主成分的关系矩阵 酿酒葡萄理化指标提取的主成分对应理化指标中的贡献率 各葡萄酒评分量纲化处理后的数值 主成分与其贡献率的乘积加上葡萄酒评分数值构成线性组合五、模型建立及求解5.1.1问题一模型的建立及求解葡萄酒历史悠久,在葡萄酒诞生之初,人类就给予了它对于其它任何食物与饮品都没有的偏爱。然而即使是极品葡萄酒不同的人对他的评价也不可能完全一样,本
5、问就是要讨论两组评酒员的评价结果有无显著性差异,及哪一组结果更可信。对于要分析无显著性差异,这里是通过用三因素(酒类,品酒员,组号)方差分析及T检验法,T检验当中的值小于0.05则说明而对于要判断哪一组结果更可信,则是通过计算出每组样品酒方差的平均来判断,平均值越小则说明越稳定,结果就更可靠。首先建立三因素方差分析的数学模型三因素方差分析的数学模型:表示综合得分的数学期望,表示第组评分与总平均值之差,表示第组第个评酒师的评分与第组评分均值的偏差;表示第组的第号评酒师对第号酒的综合评分表示第组第个评酒师弟K号样品酒分析结果与第号评酒师评分的偏离;三因素方差分析的计算步骤根据数理统计原理,计算各离
6、差平方和:称为因素A的离差平方和,反映因素A对试验指标的影响。称为因素E的离差平方和,反映因素E对试验指标的影响。称为因素B的离差平方和,反映因素B对试验指标的影响计算样本方差 单总体T检验如果样本是属于大样本(30)也可写成:在这里,为样本平均数与总体平均数的离差统计量;为样本平均数;为总体平均数;为样本标准差;为样本容量。以0.05为显著性水平, t0.05则说明无显著性差异。反之说明有显著性差异。可信度分析的数学模型表示第组的第号评酒师对第个评分项目的分值(=110,分别表示澄清度,色调,香气分析当中的纯正度,香气分析当中的浓度,香气分析当中的质量,纯正度,浓度,持久性,质量,整体评价
7、)表示第组中第号酒的综合得分期望。表示第组号酒的综合得分方差。表示该组方差的平均值方差的平均越小说明越稳定,则可信度越高。数据的处理及结果根据附表一中的数据通过excel可以算出白酒第一组中毎位评酒师对各样品酒的综合得分,例如第26号酒的综合得分如表一所示: 表一总分:100品酒员1品酒员1026项目满分酒样品26外观分析5澄清度441510色调68香气分析6纯正度55308浓度7716质量1414口感分析6纯正度44448浓度768持久性7722质量1319平衡/整体评价118107584如表一所示算出第一组及第二组每种样品酒的综合得分,将所有白酒的数据整理得到下表二:组别品酒员酒样品综合得
8、分1品酒1号26751品酒2号26662品酒员1号2680.全表为附录表一将附录表一当中的数据导入到SPSS,分析综合得分与酒类,品酒员,组号的关系,得到数据如表三:表三离差来源离差平方和方差分量 F值组别 3376.11128.020.00评酒员13876.08912.790.00酒样品34113.202710.480.00T检验当中组别的t小于0.05可得知白酒的两组评价员的结果有显著性差异。同样的方法用SPSS对红酒进行三因素分析得到表四:表四离差来源离差平方和方差分量 F值sig t组别 871.471871.470.00评酒员14380.5826553.10.00酒样品3477.71
9、9386.410.00T检验当中组别的t小于0.05可得知白酒的两组评价员的结果有显著性差异。不管是白酒还是红酒,两组评价员的结果都有显著性差异。附录表一当中已经算出来所有样品酒的综合得分利用excel可以很容易的算出每组综合得分的方差平均值,结果如表五所示:表五白酒第一组129.19第二组55.63红酒第一组58.62第二组33.79从表五中可以看出不管是白酒还是红酒,第二组方差的平均值都小于第一组的方差平均值,可得出结论第二组的稳定性更好,结果更可靠。5.3.1问题三模型的建立及求解为了研究酿酒葡萄与葡萄酒的理化指标之间的联系,将葡萄酒的理化指标定义为Y,把酿酒葡萄的理化指标定义为X,先利
10、用相关性分析,可以分别算出每一个Y关于所有X的相关系数矩阵。取出其中相关系数大于0.35的X,在利用多元线性回归,分别算出每一个Y关于相关系数大于0.35的X的R2,及各X的系数与置信区间。根据R2的值把Y分成三类:A类为R2大于0.8。B类为R2介于0.5到0.8之间C类为R2小于0.5.对于A类如果置信区间包含0,则把相应的变量踢除。根据这些新的变量,从新做一次线性回归如果R2的值与剔除变量之前相差不大,就取剔除变量之后的变量。若相差较大则取没有剔除变量的那些X来表示Y。对于B类可直接得出Y关于X的线性方程,对于C类,模型的建立与求解:问题二的模型葡萄酒的理化指标分为一级指标和二级指标。由
11、于二级指标都在一级指标中进行反应,剔除二级指标。对多次测试的项目取平均值,精简得到酿酒葡萄的理化指标分析表,共30个指标。由于指标太多,并且多指标之间往往存在着一定程度的相关性。为了把指标复杂的关系进行简化,对理化指标做主成分分析。由于理化指标中的指标不同,其计量单位不同,所以数据量纲也不一致。因此,在进行主成分分析前,先对数据进行量纲化处理。统计学原理告诉我们,要对多组不同量纲数据进行比较,可以先将它们标准化转化成无量纲的标准化数据。而综合评价就是要将多组不同的数据进行综合,因而可以借助于标准化方法来消除数据量纲的影响。无量纲标准化法:上式中:无量纲化处理葡萄样品的评分、葡萄酒的理化指标结果
12、(以下仅是表的一部分)如下:红葡萄得分平均均值标准化氨基酸总量标准蛋白质标准VC含标准葡萄样品1-0.607044289-0.23-0.05-0.13葡萄样品20.876117601-0.161.56-0.22葡萄样品31.0269476233.840.65-0.09白葡萄得分平均值标准化氨基酸总量标准蛋白质标准VC含标准葡萄样品10.431372889-0.73-0.182.2葡萄样品2-0.230891494-0.080.55-0.75葡萄样品3-0.2939642933.37-0.69-0.29主成分分析模型: 酿酒葡萄的无量纲化理化指标有30个,设为。令X=(),假定存在二阶矩阵,其均
13、值和协方差分别记为。每个主成分的系数平方和为1。主成分之间相互独立,即无重叠信息。主成分分析的目的是减少变量的个数,所以一般不会使用所有的变量,忽略一些带有较小的主成分将不会给总方差带来太大的影响。主成分的方差依次递减,重要性依次递减,即。如果第一主成分表达的信息不够,这依次往下找。主成分对整个数据的反应能力越强,则它对数据的贡献率越大。一般,累积贡献率达到85%左右就可以说对数据有了较好的反映。将数据带入SPSS,得出结果。综合评价模型: 酿酒葡萄的分级和酿酒葡萄的理化指标、葡萄酒的质量有关。葡萄的评分决定葡萄酒的质量,设评分量纲化数值为b1,b2,b3,bx。通过主成分分析酿酒葡萄的理化指
14、标进行将变量缩减。由于以上数据都做了量纲化处理,所以这些数据可以进行比较。主成分与其贡献率加上葡萄酒评分数值构成线性组合,其中的累积贡献率很大,这些主成分可代表理化指标的信息。考虑到酿酒葡萄与葡萄酒的质量、酿酒葡萄的理化指标有关。令综合数值Z:即 Z1=+b1由于各样品的综合成分值各不相同。当得分越高时,样品葡萄的等级越高。 将酿酒红葡萄的理化指标带入SPSS软件中,进行主成分分析。提取以下结果:ComponentExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsTotal% of VarianceCumul
15、ative %Total% of VarianceCumulative %16.96623.22123.2215.19617.31817.31824.94016.46739.6874.45814.85932.17733.73712.45752.1443.13510.45142.62942.8409.46761.6112.7129.03951.66851.9996.66368.2742.6908.96860.63661.7425.80874.0822.5658.55269.18771.4184.72878.8102.2577.52376.71181.2704.23483.0441.9006.33
16、383.044上图表给出了各个因子的贡献率,第1个因子的贡献率是23.221%,第2个因子的贡献率是16.467%,第3个因子的贡献率是12.457%,第3、4、5、6、7、8因子的贡献率分别是9.467%、6.663%、5.808%、4.728%、4.234%,这8个因子的累积贡献率达到83.044%,则这8个因子能反应足够的信息。图上为30个指标与8个因子之间的相关系数图。通过SPSS分析,即将30个指标精简为8个主成分。从图上可以看出,不同的理性指标与各因子的相关系数不相同。例如:将红葡萄样品1的各指标乘以图表上的相关系数,求到的是红葡萄样品1与因子1的相关系数。红葡萄样品1表达式为红葡
17、萄样品2红葡萄样品27。Y1= 矩阵如下:见附录。用矩阵Y1与8个主成分的贡献率、评分数值来求综合数值Z。综合评价方程如下:Z1=+b1Z2=+b2Zm=+bm得到27个葡萄样品的得分红葡萄得分红葡萄得分红葡萄得分葡萄样品11-2.16363葡萄样品12-0.4975183葡萄样品190.3501305葡萄样品7-1.66461葡萄样品16-0.4274949葡萄样品50.6392122葡萄样品18-1.44279葡萄样品4-0.2411962葡萄样品140.6962257葡萄样品15-1.40382葡萄样品27-0.15253葡萄样品201.2188329葡萄样品25-1.1349葡萄样品1
18、-0.0330426葡萄样品21.2380468葡萄样品10-1.02062葡萄样品260.19987594葡萄样品171.3808782葡萄样品6-0.99605葡萄样品220.2176509葡萄样品31.4740503葡萄样品13-0.72034葡萄样品210.25860596葡萄样品232.2283205葡萄样品8-0.6507葡萄样品240.33750222葡萄样品92.309916从以上图表,对葡萄样品进行分类。第一类,得分大于2,葡萄样品9、葡萄样品23。第二类,得分21,葡萄样品3、葡萄样品17、葡萄样品2、葡萄样品20。第三类,得分10,葡萄样品14、葡萄样品5、葡萄样品19。
19、第四类,得分0-1,葡萄样品8,葡萄样品13、葡萄样品6。第五类,得分-1-2,葡萄样品10、葡萄样品25、葡萄样品15、葡萄样品18、葡萄样品7。第六类,得分小于-2,葡萄样品11.酿酒白葡萄的主成分分析法如上:将表二带入SPSS进行主成分分析,从上图可得,第1个因子的贡献率为19.434%,第2个因子的贡献率是16.422%,第3个因子的贡献率是12.102%,第3、4、5、6、7、8、9、10因子的贡献率分别是6.935%、6.297%、5.516%、5.077%、4.266%,4.127%,3.340%。前10个因子的累积贡献率为83.516%,能反映足够的信息。图上为30个指标与10
20、个因子之间的相关系数。白葡萄样品1表达式为白葡萄样品2白葡萄样品28。Y2= 的矩阵见附录。用矩阵Y1与8个主成分的贡献率、评分数值来求综合数值Z。得到28个白葡萄样品的分值,如下:白葡萄得分白葡萄得分白葡萄得分葡萄样品16-3.55127葡萄样品19-0.4803603葡萄样品10.812696葡萄样品11-2.39328葡萄样品240.03380824葡萄样品271.012145葡萄样品8-2.3848葡萄样品30.20140592葡萄样品211.022047葡萄样品12-2.02182葡萄样品150.22233295葡萄样品101.067077葡萄样品7-1.67015葡萄样品40.23
21、961075葡萄样品281.296516葡萄样品14-1.04134葡萄样品60.24348091葡萄样品91.439858葡萄样品13-0.89459葡萄样品250.39224737葡萄样品51.945056葡萄样品18-0.73534葡萄样品230.66725259葡萄样品222.111706葡萄样品2-0.61099葡萄样品200.71353903葡萄样品172.894169葡萄样品26-0.53099通过以上图表对白葡萄样品进行分类。第一类,得分大于2,葡萄样品17、葡萄样品22。第二类,得分21,葡萄样品5、葡萄样品9、葡萄样品28、葡萄样品10、葡萄样品21、葡萄样品27。第三类,得分10,葡萄样品1。第四类,得分0-1,葡萄样品26、葡萄样品2、葡萄样品18、葡萄样品13。第五类,得分-1-2,葡萄样品14、葡萄样品7。第六类,得分小于-2,葡萄样品12、葡萄样品8、葡萄样品11、葡萄样品16。模型的评价与推广问题二考虑到,酿酒葡萄的理化指标多而且复杂,多个指标之间往往存在着一定程度的相关性。先用主成分分析法对理化指标进行最佳综合简化,再用综合评价模型对酿酒葡萄进行分级。参考文献姜启源.数学模型(第三版)M.北京:高等教育出版社杨振华等,钢管订购与运输问题一的数学模型与求解马欣等,管道订购和运输J.数学的实践与认识