论文模板之一.doc

上传人:pei****hi 文档编号:3039804 上传时间:2020-06-24 格式:DOC 页数:24 大小:1.10MB
返回 下载 相关 举报
论文模板之一.doc_第1页
第1页 / 共24页
论文模板之一.doc_第2页
第2页 / 共24页
点击查看更多>>
资源描述

《论文模板之一.doc》由会员分享,可在线阅读,更多相关《论文模板之一.doc(24页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、葡萄酒的评价摘要 本文对葡萄酒的质量问题进行讨论,首先检验两组评酒员的评价数据的正态性,之后利用F检验和t检验判断两组数据是否有显著性差异,继而通过方差比较得到第二组的结果更可靠。然后利用主成分分析法和聚类分析法对酿酒葡萄进行分类。对酿酒葡萄和葡萄酒的理化指标进行相关性分析,进而使用多因子线性回归,得到酿酒葡萄和葡萄酒的理化指标之间的联系。最后通过酿酒葡萄的理化指标与葡萄酒质量的相关性分析和通径分析,得到对葡萄酒质量影响显著的理化指标,并据此建立了BP神经网络模型。通过对葡萄酒的质量进行训练、学习、预测,并对相对误差进行分析,发现评价葡萄酒的质量需加入芳香物质指标。针对问题一,首先计算出每个评

2、酒员对葡萄酒的平均评分,将得到的数据作为两组评酒员评分的基本数据。然后利用SPSS 13.0和Matlab7.0检验出关于红、白葡萄酒的两组评分数据都服从正态分布,再运用F检验及t检验法对其进行显著性检验。当显著性水平从0.05变化到0.2时,白葡萄酒的两组评价结果都没有显著性差异,而红葡萄酒的两组评价结果由没有显著性差异变为有显著性差异。最后通过比较两组评酒员各项指标平均方差的大小,得到了第二组评酒员的评价可信度更高。针对问题二,由于酿酒葡萄的理化指标过多,所以我们利用SPSS 13.0进行主成分分析,根据葡萄酒的质量,对酿酒葡萄的理化指标进行分类,得到12类红葡萄的理化指标和13类白葡萄的

3、理化指标。然后对分好的理化指标进行聚类分析,即可得到相应的聚类树形图,由该图即可直接将红、白酿酒葡萄样品分别分成三类,再比较不同类别相应葡萄酒样品的平均评分,对其进行等级排序。 针对问题三,首先对每个葡萄酒样本的理化指标与酿酒葡萄的理化指标进行相关性分析,找出酿酒葡萄中与葡萄酒理化指标具有显著相关性的理化指标,然后用SPSS对这些指标进行多因子线性回归分析,得到以酿酒葡萄的理化指标为自变量,葡萄酒的各个理化指标为因变量的多个线性方程,继而对回归方程进行误差分析,发现线性方程可以被接受,即得到了酿酒葡萄与葡萄酒的理化指标之间的联系。 针对问题四,因为葡萄酒的理化指标可以用葡萄的来表示,所以可以只

4、讨论酿酒葡萄的理化指标对葡萄酒质量的影响。对酿酒葡萄的理化指标和葡萄酒的质量之间进行相关性分析和通径分析,选出对红葡萄酒质量有显著影响的11个理化指标,对白葡萄质量有显著影响的7个理化指标,然后以这些理化指标为输入层节点,以葡萄酒质量为输出层节点,构建出BP人工神经网络模型。之后分别选取17个红葡萄酒样本和18个白葡萄样本进行训练、学习,用剩下的样本对神经网络进行预测,将预测的数据与实际数据进行比较,发现相对误差比较大,故不能只用葡萄和葡萄酒的理化指标评价葡萄酒的质量。加入芳香物质以后,将其作为一个输入节点,用神经网络进行预测,发现误差有明显的改善,所以需将其考虑在内用以评价葡萄酒的质量。关键

5、词: 主成分分析 聚类分析 线性回归 相关性分析 BP神经网络一、问题重述1.1 问题背景: 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。1.2 问题提出:(1)不同的评酒员的评价结果有无显著性差异,结果是否可信。(2)从酿酒葡萄的理化指标和葡萄酒的质量出发,如何对这些酿酒葡萄进行分级。(3)酿酒葡萄与葡萄酒的理化指标之间的有什么联系。(4)酿酒葡萄和葡萄酒的理化指标对葡萄酒质量

6、的影响,葡萄和葡萄酒的理化指标来是否可以用来评价葡萄酒的质量。二、问题分析2.1 问题一:首先计算出每个评酒员对全部样品的平均评分,将得到的数据作为两组比较的基本数据。在检验出它们分别服从正态分布的前提下,运用F检验以及t检验法进行显著性检验。然后通过比较两组评论员各项指标平均方差的大小来判断哪一组评酒员的可信度更高。2.2 问题二:问题二从酿酒葡萄的理化指标和葡萄酒的质量出发,对这些酿酒葡萄进行分级。由于酿酒葡萄的理化指标太多,首先采用主成分分析法分别对红、白酿酒葡萄的理化指标进行筛选,得到各自相对重要的指标组成新的综合指标。然后运用新的指标进行聚类分析,对红、白酿酒葡萄分类。2.3 问题三

7、: 取每一葡萄酒的理化指标与酿酒葡萄的理化指标进行相关性分析,找出酿酒葡萄中与葡萄酒理化指标相关性较大的理化指标,然后对这些指标进行线性拟合,得到以酿酒葡萄的理化指标为自变量,以葡萄酒的理化指标为因变量的线性方程。2.4 问题四:首先进行相关性分析和通径分析,选出对葡萄酒质量有显著性影响的理化指标,继而以这些理化指标为输入层节点,以葡萄酒质量为输出层节点,构建出一个BP人工神经网络模型。然后选取部分红葡萄酒样本用于训练,同时剩余的样本用来对人工神经网络进行检验。3、 模型假设(1)各个评酒员的评分相互独立,不受彼此影响。(2)进行相关性分析时,忽略相关系数很小的理化指标。(3)有正确的期望函数

8、。即在线性回归模型中没有遗漏任何重要的解释变量,也没有包含任何多余的解释变量。(4)当用数据对神经网络训练时,假设训练得到的网络的误差可以忽略。4、 符号说明符号含义、分别表示第一组第个评酒员对第个白、红葡萄酒样品的评分、分别表示第二组第个评酒员对第个白、红葡萄酒样品的评分、分别表示第一组第个评酒员对全部白、红葡萄酒样品评分的平均值、分别表示第二组第个评酒员对全部白、红葡萄酒样品评分的平均值表示第i样品的第j个指标表示第j个指标的平均值表示第j个指标的修正方差 表示相关系数表示相关系数矩阵表示酿酒葡萄样品的理化指标表示葡萄酒样品的理化指标五、模型建立、求解及分析5.1模型一首先计算出每个评酒员

9、对全部样品的平均评分,将得到的数据作为两组比较的基本数据。为判断两组评酒员评价结果是否具有显著性差异,需先分别对其进行正态分布检验1。5.1.1 正态分布的检验对附件1中数据进行分析(其中给出的数据有两个错误的地方,根据现实和相关数据对其进行修正),通过下面式子求出两组评酒员分别对红葡萄酒和白葡萄酒的平均评分。 对于白葡萄酒, 由题意可知: 对于红葡萄酒, 由题意可知: 由此即可得到两组所有品酒员分别对白葡萄酒的综合评价分数,即可构成一个关于评价分数的数组如下: 两组所有品酒员分别对红葡萄酒的综合评价分数,即可构成一个关于评价分数的数组如下:列表如下:表1 每组各个评酒员对红葡萄酒的平均评价评

10、酒员编号12345678910一组(评分)69.2 75.1 73.4 66.1 74.8 73.3 71.9 72.7 79.2 75.2 二组(评分)71.4 69.8 76.7 65.9 64.3 72.7 72.0 72.8 70.2 69.5 表2 每组各个说评酒员对白葡萄的平均评价评酒员编号12345678910一组(评分)76.3 56.7 83.5 64.4 76.1 72.6 81.7 70.6 81.1 79.5 二组(评分)77.9 77.0 78.3 78.3 76.3 81.8 80.1 63.0 74.3 78.3 根据以上数据,利用SPSS13.0作图如下:图1

11、第一组评酒员对红葡萄酒的评分分布 由图可以看出,第一组评酒员对红葡萄酒的评分可能服从正态分布,同样方法可得红白葡萄酒的两组数据可能均服从正态分布。为了进一步检验是否服从正态分布,通过Matlab7.0编程(见附录一)实现,得到结果:两组数据均服从正态分布1。5.1.2 显著性检验 当数据服从正态分布时,我们采用双正态母体参数的显著性假设检验F检验和t检验方法2进行显著性分析。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用

12、F检验。在本题中,因为不知道两总体方差是否相等,所以应先采用F检验,继而用t检验来检验两个样本平均数与其各自所代表的总体的差异是否显著。 首先在置信度为95%的情况下,对红葡萄酒进行分析: 假设: : () 即得检验问题的拒绝域为 其中, 查表得:, , , 因为 且 故接受,认为两个总体的方差相等。 当两个总体的方差相等时,对均值进行检验。 假设: : 即得检验问题的拒绝域为 其中 , , 所以, 查表得: 因为 ,所以接受原假设,即认为两个总体均值相等。 由于均值与方差可以认为是相同的,所以没有显著性差异。 当置信度为90%时,因为,所以也没有显著性差异; 当置信度为80%时,因为,所以拒

13、绝原假设,两个总体的均值有显著性差异。表3 不同情况下差异性分析大小比较是否拒绝有无显著性差异0.052.10091.61大于否无0.11.73411.61大于否无0.21.33041.61小于是有 由上表可知,当置信度变小时,即变大时,将会出现显著性差异。 对白葡萄酒进行分析: 假设: : () 即得检验问题的拒绝域为 其中, 查表得:, , , 因为 且,故接受,认为两个总体的方差相等。 当两个总体的方差相等时,对均值进行检验。 假设: : 即得检验问题的拒绝域为 其中, , 计算得, 查表得: 因为 所以接受原假设,即认为两个总体均值相等。 由于均值与方差可以认为是相同的,所以没有显著性

14、差异。 当置信度为90%时,因为,所以没有显著性差异; 当置信度为80%时,因为,所以没有显著性差异。表4 不同情况下差异性分析大小比较是否拒绝有无显著性差异0.052.10090.82大于否无0.11.73410.82大于否无0.21.33040.82大于否无由上表可知,当=0.05,0.10,0.20时均无显著性差异,但是关于的单调递减函数,所以当继续增大时,总存在使得,即有显著性差异。5.1.3 可信度分析由上面分析可知,当取不同值时,两组评酒员的评分可能有显著性差异,也即两组评酒员的可信度不相同。下面通过对每一个葡萄酒样品的各项评分标准求方差,然后每一项求平均值,得到结果如下表。表5

15、各指标平均方差对比白葡萄酒红葡萄酒第一组第二组第一组第二组澄清度0.830.50.560.39色调3.671.762.322.07纯正度0.980.510.820.47浓度1.271.231.371.17质量3.352.12.711.77纯正度1.170.490.80.42浓度1.961.21.581.27持久性1.180.580.630.58质量9.184.835.443.46平衡/整体评价1.020.530.610.4总和24.6413.7816.8912.06由上表可知,对白葡萄酒和红葡萄酒,第二组评酒员给出的各单项评分方差均值均小于第一组评酒员,即第二组评酒员的评分更加稳定,所以第二组

16、评酒员的可信度更高。5.2 模型二:由于酿酒葡萄的理化指标较多,若全部予以考虑,会使模型复杂化,且难以得到理想的结果。所以采用主成分分析法对酿酒葡萄的理化指标进行筛选,从而得到一组相对重要的指标组成新的综合指标。然后运用这组新的指标进行聚类分析,达到分类的目的。下面分别对红葡萄和白葡萄进行分析。5.2.1 对红酿酒葡萄的分析 (1)主成分分析法3主成分分析是设法将原来众多具有一定相关性(比如P=59个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来59个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方

17、差来表达,即Var(F1)越大,表示F1 包含的信息越多。因此在所有的线性组合中选取的F1 应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来59个指标的信息,再考虑选取F2 即选第二个线性组合,为了有效地反映原来信息,F1 已有的信息就不需要再出现再F2 中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2 为第二主成分,依此类推可以构造出第三、第四,第P 个主成分。主成分模型步骤: a、原始指标数据的标准化采集p 维随机向量,n=27个样品 ,i=1,2,27。 构造样本阵,对样本阵元进行如下标准化变换: 其中,得标准化阵Z。 b、对标准化阵Z 求相关系数矩阵

18、其中, c、解样本相关矩阵R 的特征方程得p 个特征根,确定主成分见下表。表6 主成分分析(部分)ComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %19.47116.05316.0539.47116.05316.05327.68413.02329.0767.68413.02329.07636.7311.40740.4836.7311.40740.48345.8679.94350.4275.8679.9

19、4350.42754.5757.75558.1814.5757.75558.18163.3715.71363.8953.3715.71363.89572.7234.61668.5112.7234.61668.51182.5994.40572.9162.5994.40572.91692.073.50976.4252.073.50976.425102.0383.45479.8792.0383.45479.879111.6852.85582.7341.6852.85582.734121.4062.38385.1171.4062.38385.117131.1111.884871.1111.88487

20、根据 确定m 值,由上表可直接得到m=12。也即当m=12时主成分的贡献率达到85%。所以我们可以用这12个因子代替原来的59个因子进行分析。然后对每个,j=1,2,.,m, 解方程组得单位特征向量 。 d、将标准化后的指标变量转换为主成分 称为第一主成分, 称为第二主成分, 称为第m 主成分。 (2)聚类分析 根据上述所得的12类主成分对样品进行聚类分析4。为了将酿酒葡萄进行分级,我们采用聚类分析法进行研究。聚类称为分层聚类或系统聚类(hierarchical cluster)在开始时,有多少点就是多少类。它第一步先把最近的两类(点)合并成一类,然后再把剩下的最近的两类合并成一类;这样下去,

21、每次都少一类,直到最后只有一大类为止。显然,越是后来合并的类,距离就越远。 Between-groups linkage(类间平均链锁法):合并两类的结果使所有的两两项对之间的平均距离最小。项对的两个成员分别属于不同的类。该方法中使用的是各对之间的距离,即非最大距离也非最小距离。(系统默认)在选择距离测量技术上,选择Pearson correlation(皮尔森相关系数):相关系数距离,适用于 R 型聚类。类间距离: 按上式计算类中每一变量与其余变量的相关指数(即相关系数的平方),选择该值最大变量作为典型指标。表7 聚类的凝聚过程表StageCluster CombinedCoefficien

22、tsStage Cluster First AppearsNext StageCluster 1Cluster 2Cluster 1Cluster 216180.92100226120.65910133290.6550018417240.627001355260.61500768140.613001475200.572501687150.5220011923250.52100121013270.4830016117220.42380221210230.4220919136170.391242514180.3560618154190.3420019165130.31771023173210.30

23、02118120.25514321194100.2161512222011160.178002321130.12818172622470.01319112423511-0.0271620242445-0.0592223252546-0.0862413262614-0.14721250 不断重复上述步骤就可得到聚类的树形图如下:图2 聚类的树形图由上图可知,红酿酒葡萄可以分为三类,经计算可知,红葡萄酒的得分均值分布情况为第一类72.24分,第二类70.1分,第三类69.2分。分类结果见下表:表8 红葡萄的分类类别样本编号平均得分第一类3、21、2、9、8、14、172.24第二类7、15、22、

24、23、25、10、4、19、5、26、20、13、27、11、1670.1第三类6、18、12、17、2469.2根据各类中平均得分的高低划分酿酒葡萄的等级,得分越高,等级越高。5.2.2对白酿酒葡萄的分析首先通过主成分分析法得到了主成分,部分如下表:表9 白葡萄主成分分析(部分)ComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %112.71121.54421.54412.71121.54421.54

25、427.0511.94933.4937.0511.94933.49335.2458.88942.3825.2458.88942.38244.1537.03949.4214.1537.03949.42153.786.40655.8273.786.40655.82763.2595.52561.3523.2595.52561.35272.3523.98765.3392.3523.98765.33982.2273.77469.1132.2273.77469.11392.0243.4372.5432.0243.4372.543102.0063.39975.9422.0063.39975.942111.9

26、333.27779.2191.9333.27779.219121.6512.79982.0181.6512.79982.018131.4192.40584.4221.4192.40584.422141.2922.18986.6121.2922.18986.612由上表可知,根据得到主成分个数n=13 。再通过聚类分析得到白葡萄的聚类的树形图(图6)如下:图3 聚类的树形图由上图可知,白酿酒葡萄可以大致分为三等级,经计算可知,白葡萄酒的得分均值分布情况为第一类77.53分,第二类76.99分,第三类74.54分。见下表:表10 白葡萄的分类类别样本编号平均得分第一类22、26、25、14、21、

27、23、277.53第二类5、20、4、28、3、9、27、10、24、1276.99第三类7、8、15、6、16、19、1、13、8、11、1774.54 根据不同类对应葡萄酒平均得分的高低划分酿酒葡萄的等级,得分越高,等级越高。5.3 模型三:由于数据太多,我们没有必要对所有的数据进行分析,因此只需找出酿酒葡萄中对葡萄酒质量影响的显著指标,再分析这些显著指标和葡萄酒中的各种理化指标的关系即可,这里我们采用了相关性分析大致分出显著性因子。5.3.1 相关性分析 相关性分析5是对现象之间相互关系的方向和程度进行分析,可以确定现象之间是否存在相关关系、相关关系的表现形式、相关关系的密切程度及相关关

28、系的数学表达式即回归方程式,检验估计值的误差。 在直线相关的条件下,用r表示反映两变量间线性相关密切程度的统计指标:相关系数r的取值范围:-1r1,其中具体判断如下表:表11 相关系数的判断 相关系数r0|r|0.50.3|r|0.50.50.8r=1线性相关性负不正不存在 低度 显著高度完全上表说明了相关系数决定了它们之间和线性相关程度。5.3.2 线性回归6模型(1) 线性回归简介葡萄里的理化指标:(氨基酸总量,蛋白质,花色苷,酒石酸,苹果酸,多酚氧化酶活力,褐变度DPPH自由基总酚单宁,葡萄总黄酮,白藜芦醇,黄酮醇,还原糖,固酸比,干物质含量,果梗比,出汁率,果皮颜色L ,果皮颜色a,

29、果皮颜色b )=(, ,)。葡萄酒里的理化指标:(花色苷,单宁,总酚,酒总黄酮,白藜芦醇, DPPH半抑制体积, L,a, b )=(, )。设有自变量和因变量以及一份由n个个体构成的随机样本,且有如下关系: 其中为待估参数,为残差。由一组样本数据,可求出等估参数的估计值,得到如下回归方程: 由此可见,建立回归方程的过程就是对回归模型中的参数(常数项和偏回归系数)进行估计的过程。 (2)回归方程的假设检验:建立回归方程后,须分析应变量与这p个自变量之间是否确有线性回归关系,可用F分析。回归方程的假设检验: 为残差平方和 (a) 对红葡萄酒: 由上述相关性分析理论,我们首先分析了酿酒葡萄的各种理

30、化指标与葡萄酒的单宁的相关性,得到其相关性显著的酿酒葡萄的理化指标有氨基酸总量,并对其进行线性拟合,得到它们各自的拟合方程为:其形式为: ,其中是X的系数矩阵方程如下对于来说,对于来说,对于来说,对于来说,对于来说,对于来说,对于来说,对于来说,对于来说,(b) 对白葡萄酒分析: 由上述相关性分析理论,我们首先分析了酿酒葡萄的各种理化指标与葡萄酒的单宁的相关性,得到其相关性显著的酿酒葡萄的理化指标有氨基酸总量,并对其进行线性拟合,得到它们各自的拟合方程为:其形式为: ,其中是X的系数矩阵方程如下对于来说,对于来说,对于来说, 对于来说,对于来说,对于来说,对于来说,对于来说,5.4模型四:当知

31、道酿酒葡萄与葡萄酒的理化指标之间的关系时,可以用葡萄的所有指标来表示出葡萄酒的各个指标,即葡萄酒的指标可以转化为酿酒葡萄的指标。要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,即可转化为只分析酿酒葡萄的理化指标对葡萄酒质量的影响。5.4.1 通径分析7 相关性分析只是简单地估测了2个变量之间的关系(密切程度) 而通径分析不仅能说明原因,而且能够准确地估测出各性状因子对因变量 (感官得分) 的相对重要性,由于通径系数是自变量与因变量间有方向的相关系数,它表示的是在剔除其他因素影响后的作用,因此,通径分析反应的是两者之间真正的相关关系。 通径系数的性质: (1)通径系数具有偏回归系数的性质。它

32、是变量标准化后的偏回归系数,能够表示变量间的因果关系,故仍具有偏回归系数的性质。 (2)通径系数具有相关系数的性质。它是一个不带单位的相对数,因而又具有相关系数的性质,是具有方向性的相关系数,能表示原因与结果(自变量与因变量)之间的关系,它是介于回归系数和相关系数之间的一种统计量,可用于各种性状间的相关分析。 (3)可以用它来估计自变量对因变量直接影响效应的大小,比较其相对重要性。利用通径系数分析,可以帮助我们建立“最优”多元回归方程。决定系数(Determination coefficient):通径系数的平方称为决定系数,表示自变量或误差能够解释应变量总变异的程度。 直接通径系数:假设是有

33、n个对象,记作,r对s的相关系数记为:,则r对s的直接通径系数为 通过采用分析软件 AMOS6.0 进行通径分析,可以得到红酿酒葡萄的各个指标与葡萄酒质量的直接通径系数。结合上面得到的相关系数,选出几种与葡萄酒质量显著相关的几个理化指标,现列表如下:表12 红葡萄酒中的各项理化指标对葡萄酒质量的相关系数、直接通径系数以及显著程度质量指标相关系数rSig.决定系数直接通径系数显著程度葡萄总黄酮0.700.310.33(*) 总酚 0.6500.21-0.05(*) DPPH自由0.61015.68-0.3(*) PH值 0.530.012.590.45(*) C2 -0.520.011.84-0

34、.33(*) 蛋白质 0.520.060.280.35(*) 果皮颜色a-0.520.013.90.8(*) C1 -0.50.011.3-1.31(*) 果皮颜色b-0.480.011.88-0.02(*) 顺式白藜0.470.013.410.4(*) C3 -0.460.021.520.44(*) 异鼠李素-0.390.040.120.04(*) 酪氨酸 0.390.053.20.01(*) 由上表可初步确定13个(其中8个指标极显著相关、5个指标显著相关)与红葡萄酒的质量显著相关的酿酒葡萄的理化指标,依次是葡萄总黄、总酚、DPPH自由、PH值 、C2 、蛋白质、果皮颜色a、 C1(极显著

35、相关)、果皮颜色b 、顺式白藜、 C3 、 异鼠李素、酪氨酸(显著相关),上述指标在较大程度上影响了葡萄酒的质量。 除此之外,上表还表明C1、果皮颜色a对红葡萄酒的质量有最为直接的作用。另外,PH值、C3、顺式白藜、蛋白质、C2、葡萄总黄 、DPPH自由等对红葡萄酒的直接通径系数较高,表明这些指标对红葡萄酒的质量也有重要作用。 通过以上相关性分析与通径分析表明,红酿酒葡萄的理化指标葡萄总黄、总酚、DPPH自由、PH值、C2、蛋白质、果皮颜色a、C1、果皮颜色b 、顺式白藜、C3 、异鼠李素、酪氨酸对葡萄酒的质量均有显著性的影响。5.4.2 BP人工神经网络模型8的建立 人工神经网络的特点和优越

36、性,主要表现在三个方面: 第一,具有自学习功能。例如实现图像识别时,只在先把许多不同的图像样板和对应的应识别的结果输入人工神经网络,网络就会通过自学习功能,慢慢学会识别类似的图像。自学习功能对于预测有特别重要的意义。预期未来的人工神经网络计算机将为人类提供经济预测、市场预测、效益预测,其应用前途是很远大的。 图4 BP神经网络示意图 第二,具有联想存储功能。用人工神经网络的反馈网络就可以实现这种联想。 第三,具有高速寻找优化解的能力。寻找一个复杂问题的优化解,往往需要很大的计算量,利用一个针对某问题而设计的反馈型人工神经网络,发挥计算机的高速运算能力,可能很快找到优化解。 所以在本题中,我们通

37、过建立人工神经网络模型来预测葡萄酒的质量,然后与品酒员给葡萄酒的评分进行对比,来判断能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。由以上的相关性和通径分析可知,得出来的11种红酿酒葡萄的理化指标对葡萄酒的质量有着极大的影响,7种白酿酒葡萄的理化指标对葡萄酒的质量有极大地影响,而其他理化指标对葡萄酒的质量的影响非常小,所以可以忽略不计。由此,我们可以构建一个输入层有11个节点,中间层有五个节点,输出层有一个节点的红酿酒葡萄的BP神经网络模型,即为11-5-1模型。和一个输入层有7个节点,中间层有五个节点,输出层有一个节点的白酿酒葡萄的BP神经网络模型,即为7-5-1模型。首先,我们将27个红酿

38、酒葡萄样本分成两部分,28个白酿酒葡萄样本分成两部分,一部分用于训练,一部分用于检验预测结果。为了使模型的预测效果更好,误差更小,将样本中的前17个红葡萄样本,前18个白葡萄样本用于训练。让11种红酿酒葡萄的理化指标作为11个输入节点,葡萄酒的质量作为1个输出结点,通过17次重复训练、学习,确定出红葡萄的神经网络的中间层;让7种白酿酒葡萄的理化指标作为7个输入节点,葡萄酒的质量作为1个输出结点,通过18次重复训练、学习,确定出白葡萄的神经网络的中间层。然后用剩余的10个数据进行模型预测,通过输入10组酿酒葡萄的理化指标,可以预测出相应的葡萄酒的质量,该过程利用matlab7.0进行编程实现(程

39、序见附录二)。 将所预测出的结果与实际的评酒员给出的葡萄酒的分数进行对比,画图如下:18图5 红葡萄酒的预测与实际的比较图6 白葡萄酒的预测与实际的比较23由图可以看出,预测出来的数据与已知的数据之间的差别比较大,对其进行误差分析可知,绝对误差=|预测值-实际值|比较大,所以不能只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。5.4.3 考虑芳香物质考虑到芳香物质,首先将每一个样本的所有化学物质求均值,转化为一个变量,设为芳香物质,将问题简单化,然后采用酿酒葡萄与葡萄酒的理化指标之间的联系的分析方法,可以得到每个葡萄样本的芳香物质与相应的葡萄酒的芳香物质相关。所以葡萄酒的芳香物质可以用酿酒葡萄的

40、芳香物质来表示。将酿酒葡萄的芳香物质作为一个理化指标加入到BP神经网络的输入层,对模型进行进一步优化,将预测结果与实际结果进行比较,画图如下: 图7 加入芳香物质以后的红葡萄酒预测结果与实际结果的比较 图8 加入芳香物质以后的白葡萄酒预测结果与实际结果的比较由图可以看出,预测数据与实际数据之间的差别明显减小,对其进行误差分析,发现绝对误差=|预测值-实际值|比较小,所以加入芳香物质以后,可以使得预测结果更加准确,即可用来评价葡萄酒的质量。 六、模型的优缺点6.1模型优点1) 对两组评酒员的评价分析时,首先计算出每个评酒员对葡萄酒的评价的平均值,并把这些均值作为基本数据进行均值和方差进行分析,思路清晰,数据计算量少,操作简单,更容易让人一目了然。2) 附表1中给出的数据有问题(一个给的超过总分,另一个没有给出任何数据),因此我们就在分析相应的数据时,先进行了均值计算,并给有错误的数据用均值修正。3) 用聚类分析的时候,首先进行了主成分分析,缩减了下面分析的理化指标种类,使解题过程更加详细,让思

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁