《基于光谱技术的芒果内部品质检测技术研究.doc》由会员分享,可在线阅读,更多相关《基于光谱技术的芒果内部品质检测技术研究.doc(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、仲恺农业工程学院毕 业 论 文基于光谱技术的芒果内部品质检测技术研究姓 名 袁梓浩院(系) 机电工程学院专业班级 机械设计制造及自动化152学 号 201520824436指导教师 马稚昱 辜松(校外)职称/职务 副研究员 教授论文答辩日期 2019年05月22日仲恺农业工程学院教务处制Research on Mango Internal Quality Detection Technology Based on Spectral TechnologyYuan ZihaoCollege of Mechanical and Electrical EngineeringZhongkai Unive
2、rsity of Agriculture and EngineeringGuangzhou,ChinaSupervisor: Associate Researcher Ma Zhiyu Prof. Gu Song(Extramural Tutor)学生承诺书本人郑重承诺:所呈交的毕业论文(设计)是本人在导师的指导下独立进行研究所取得的成果。除了文中已用特别标志加以标记的引述内容之外,本论文(设计)不含有任何其他个人或集体已经发表或撰写的研究成果。对本文研究做出过重要贡献的个人或集体,均已在文中以明确的方式标明。若在毕业论文(设计)的各项检查、评比中被发现有抄袭、剽窃或其他的违规行为,本人愿按学
3、校有关规定接受处理,并承担相应的法律责任。学生(签名): 年 月 日 摘 要芒果产业在我国现代农业经济体制中占有重要地位,我国芒果产量达但价格不高,主要原因在于芒果商品化处理水平低,品质检测技术和装备落后,尤其是芒果品质分级工作基本上仍靠人工分拣完成,耗费人力的同时难以保证分级效率和准确率。基于光谱技术的水果内部品质检测技术具有投资小、不破坏样品、分析速度快等一系列独特的优点,因而具有较好的应用前景。本文采用近红外光谱技术对芒果的内部品质实现无损检测,通过光谱信息来判定芒果品质的好坏,进而实现芒果按内部品质分级。关键字:芒果 品质分级 近红外光谱技术 AbstractMango industr
4、y plays an important role in Chinas modern agricultural economic system. Mango production of our country is large but the price is not high , the main reasons are the low level of mango commercialization treatment and backward quality testing technology and equipment. Especially the mango quality gr
5、ading work is remains basically complete by manual sorting, which is still difficult to ensure the classification efficiency and the accuracy while the manpower is exhausted. Fruit internal quality detection technology based on spectral technology has a series of unique advantages, such as low inves
6、tment, no damage to samples, rapid analysis and so on, so it has great application prospects. This study uses near-infrared spectroscopy technology to achieve non-destructive detecting of the internal quality of mango, through the spectral information to determine the quality of mango, so as to achi
7、eve internal quality classification.Keywords: mango; quality classification; near-infrared spectroscopy目 录1 绪论11.1 研究背景及意义11.2 近红外光谱检测技术21.2.1 基本原理21.2.2 国内外研究现状与问题41.3 研究目标、研究内容及技术路线52 研究方案与方法72.1 近红外光谱常规检测方法72.2 光谱检测系统的准备与搭建82.2.1 试验材料82.2.2 仪器设备92.2.3 检测系统的搭建112.2.4 数据处理系统122.3 光谱数据的处理方法132.3.1 光
8、谱预处理132.3.2 光谱特征选取方法142.3.3 建模方法143 光谱数据的分析与建模163.1 样品数据的采集163.1.1 光谱数据163.1.2 真实值测量183.2 处理和建模方案的选择183.3 光谱预处理193.4 可溶性固形物近红外分析模型的建立214 模型的验证224.1 模型评价标准224.2 验证结果及分析235 总结与展望24参考文献26致谢27II1 绪论1.1 研究背景及意义芒果是著名的热带水果,它营养丰富,蜜甜清香,是世界五大热带水果之一,被誉为“热带果中之王”。芒果产业在我国现代农业经济中占有重要地位。据世界粮农组织(Food and Agriculture
9、 Organization of the United Nations,FAO)及我国农业部南亚热带作物办公室的统计数据显示,近年来我国芒果总产量保持稳步增长的态势,从2005年的74.15万吨增长至2014年的143.66万吨,同时我国已成为世界芒果收获面积第二大国家,2014年全国芒果种植收获面积达到了223.72万亩,拥有亚热带季风气候的南方地区是我国主要的芒果生产种植地1。我国芒果生产情况如图1所示。图1 2005-2014年中国芒果生产情况图从芒果产量和种植收获面积来看,中国已然成为了一个芒果生产大国,但这并不说明中国就是一个芒果生产强国。在实际发展中,我国芒果产业存在着诸如产业化和
10、商品化程度低、标准化水平不足和采后处理水平不高等问题。据了解,目前我国大部分地区的芒果在采收后只是通过简单的人工分级(如图2所示)就直接进入市场进行销售,这样低效率且品质分级不精准的产后分级处理方式极大地制约了芒果产业的商品化和产业化。伴随着芒果生产产业的逐步壮大和发展,科学研究重点逐步从扩大产量转移至如何更好的判断芒果成熟度、内部营养价值含量和实现按品质分级等领域和方向2。现如今,落后的芒果品质检测技术和设备远远不能达到实现将芒果按内部品质分级的目标,而这一问题也极大地影响着芒果消费者的食品健康和安全。落后的采后商品化处理手段从国家层面上来说也必然制约着芒果产业进出口商业贸易,阻碍着我国芒果
11、产业从产量到质量和价值的全面升级,限制着产业市场竞争力的发展和进出口贸易量的增加3。芒果的商品化处理存在着巨大的潜在市场和上升空间,发展我国的芒果品质检测技术具有必要性和迫切性。近年来,基于光谱技术在水果内部品质检测领域的研究和应用发展迅速、成果显著,与传统检测技术相比具有投资小、不破坏样品,分析速度快等一系列独特的优点。研究和发展针对芒果内部品质的光谱技术来判定芒果品质的好坏,可以帮助实现芒果按品质分级,提高我国芒果产业的国际市场竞争力,推动芒果产业向优质化、组织化、标准化和产业化方向健康发展。图2 流水线工人对芒果进行人工分拣1.2 近红外光谱检测技术1.2.1 基本原理近红外光谱检测技术
12、不仅检测时间短、效率高,而且它所需要花费的无论是时间还是人力成本都很低,对于被检测体也没有任何损害。作为一种新型分析检测技术,它的发展与进步对科学家们的学习与研究起到的影响作用日益增大,常常在其他不同的分析测定领域被称作科学分析“巨人”。在光谱波长范围内,从图3可以清晰的看到,随着波长数的增大,分别是200780纳米的紫外可见光(Visible Light,VIS)、7802526纳米的近红外光(Near Infrared,NIR)以及超过2526纳米之后的中红外光(Mid-infrared Ray,MIR)。在近红外光中又包含着两个区域,分别是近红外短波(7801100nm)和近红外长波(1
13、1002526nm)。长波的穿透力比较弱,短波穿透力强但行程较短4。近红外光谱的产生原理是样品内部分子从原始基态由于它的非谐振性从而跃升到高能阶段,含氢基团所震动的频率也能被保存下来,而近红外波长吸收率和反射率都会因各种化学成分中的基团处于不同的分子环境产生不同的表现。在获取到的近红外光谱图像中包含着大量的样品内部组织和成分等信息,这不仅能帮助检测和分析标本的各种特性,比如物理性质和化学性质,还可以得到各种成分的含量4。图3 近红外光谱所在位置示意图利用近红外光谱检测芒果内部品质时,芒果表皮受到近红外光的直接照射,光透过表皮进入到芒果内部,同时芒果内部组织与成分导致了近红外光的化学吸收、物理反
14、射和散射现象,反应后的光又被光谱检测探头所吸收,凭借芒果在某些特定光谱区域的吸收强度和反射强度与近红外光粒子数两者间的联系,再加上衡量芒果内部吸收光粒子数和穿透芒果中总光线粒子的联系来进行内部品质定量分析,从而确定芒果内部组成成分及其含量5。电磁波波长越短,能量越强,因此短波近红外的能量一般比中长波近红外要强,其中短波近红外在水果中的传播路径一般可达到几厘米,而中、长波近红外分别只有10mm和1mm左右,短波近红外有更强的穿透能力进入到果实内部,因此,短波近红外应是检测芒果内部品质较为理想的波段。1.2.2 国内外研究现状与问题水果品质检测分析技术可以加快水果产后处理工业化和智能化,提高我国水
15、果市场竞争力,在检测方式上根据是否破坏检测对象可以分别命名叫做水果有损检测和水果无损检测。水果的有损检测通常都是利用检测仪器或者化学原理对水果品质进行检测,虽然这种方式已经非常成熟并且精度也非常准确,但是它主要的缺点就是会破坏样品本身,同时检测过程复杂和费时,检测环境和材料都有较高的要求6。在无损检测的领域,在历经几十年的探索和发展之后,近红外光谱技术的横空出世带来了一次巨大的分析领域的改革,并快速成为现代科技研发分析技术中的一个强大工具,引领了一系列国家和组织对近红外光谱技术研究的浪潮。因为近红外光谱检测技术快速无损的优势,很多国家和组织在品质检测领域中都把它当做是检测行业质量评价的指定分析
16、技术,逐渐取代了经典的化学分析测定方式7。我国针对光谱技术的研究要稍晚于国外发达国家,但经过国内几十年的学习与发展,我国近红外光谱分析技术也逐渐成熟,在未来将继续往便携式检测仪器和在线检测方向发展。屠振华等(2008)采用CCD近红外光谱检测仪器,以芒果品种中具有代表性的“台农”作为试验检测样品采集它的漫反射光谱。在可见/近红外光谱波长范围内建立了芒果可溶性固形物(糖度)以及硬度的内部品质分析模型,在研究中发现对图谱进行小波变换的预处理后模型可靠性得到大幅提高2。虞佳佳等(2008)用偏最小二乘法先求出芒果酸度和糖度光谱数据的主成分因子得分值,在得到芒果的近红外光谱数据指纹图谱后,运用遗传算法
17、和人工神经网络模型技术(GA-BP)对芒果进行内部品质测定。研究发现,虞佳佳等试验的遗传算法加上人工神经网络模型的芒果糖度酸度监测分析方法拥有可靠的预测表现,为芒果近红外光谱内部品质检测提供了新的理论支撑8。曹霞等(2013)对芒果糖度漫反射光谱数据进行多项式平滑算法和一阶线性微分预处理之后,采用两种不同的建模方法偏最小二乘回归算法和主成分回归算法建立了可靠的可溶性固形物芒果近红外定量分析模型。研究证实,建立芒果糖度检测模型可以可靠地依赖基于近红外漫反射光谱技术的检测分析技术9。在国外,作为芒果生产第一大国的印度对芒果检测技术展开了深入的研究,印度学者Shyam Narayan Jha等(20
18、12)通过偏最小二乘算法和多元线性回归对芒果可溶性固形物和PH值建立了定量分析模型,试验对象包含印度7个主要的芒果品种,光谱波长处于近红外光范围内,试验最终校正和预测的相关系数r分别是0.782和0.762(总溶解固体),0.715和0.703(PH)。校准、预测、偏差和差异的标准误差较低,说明近红外光谱能无损地预测芒果的内部质量参数(TSS和PH)10。德国学者Parika Rungpichayapichet等(2016)着重研究了芒果采摘时间对近红外光谱预测芒果内部品质的影响,采用偏最小二乘回归算法,利用7001100nm区域的漫反射光谱建立了硬度、总可溶性固形物(TSS)、可滴定酸度(T
19、A)和成熟指数(RPI)的校准模型,发现采用单收获年模型预测其他年份的数据时,预测误差较大,而采用2年或3年联合数据进行校正,预测精度有了很大提高,结果表明,近红外光谱可以作为一种可靠的芒果质量无损检测技术,并在考虑收获年份影响的情况下,建立了一个稳健的芒果质量评价模型11。就目前国内外研究现状来看,基于光谱技术的芒果内部品质检测技术研究已达到一定的深度和广度,在检测方法和最终应用等方面也取得了丰硕的成果,但目前仍存在着一些问题:(1) 大多数试验往往偏向于建立模型和结果分析而忽视了基础的检测机制的探索,在根源方法上创新不够,过于依赖于现有的方案。(2) 在检测方案选择上,漫反射光谱检测方法虽
20、然获取图像相对容易,但它所包含的内部品质信息量比较低;透射光谱有着丰富的样品内部结构和成分的信息,但缺点在于检测本身噪声大而且透射检测温度较高,有可能对样品造成损坏。(3) 检测时因其他因素比如环境温度和背景颜色所导致对检测结果的影响目前还没有一个系统的定论,同时果体外表和内部色素与水果内部品质的相互联系也还需要进一步的研究3。1.3 研究目标、研究内容及技术路线在了解和分析了芒果产业发展的现状、制约因素及产后商品化处理的必要性和迫切性之后,本研究的目标是采用近红外光谱技术对芒果的内部品质进行无损检测,要求能够测定芒果内部主要营养成分含量,实现通过光谱信息来判定芒果品质的好坏,进而实现按品质分
21、级。在食品行业,判别一种食品的营养价值有各种各样的化学参数,在这其中,可溶性固形物含量就是专门针对液状食品而设置的一项评价标准,它其实是集许多营养成分含量于一体的检测参数,包含着诸如果酸、矿物质、总糖和维生素等形形色色的营养成分。而糖度指代的就是果体内部总糖含量等化为蔗糖溶于水时所能达到的混水化合物溶液的糖度值。虽然可溶性固形物和糖度不能划分等号,但是芒果作为碳水化合物含量较高的一种水果,它的可溶性固形物含量和蔗糖的含量是非常相近的,所以说研究测定芒果的内部品质含量可以把可溶性固形物含量和糖度近似等同起来,以可溶性固形物(糖度)的含量作为本研究中芒果内部品质含量的参考标准12。本研究的具体过程
22、如表1所示。表1 研究过程及说明序号步骤说明(1)(2)(3)(4)(5)(6)选择校正集和验证集样品获取样品近红外光谱数据获取样品待测成分真实值光谱数据的处理分析建立校正模型校正模型的验证理想的校正集和验证集样品应包括尽可能多的有代表性的芒果样本,且在所测的组分含量范围内样品的个数应该是均匀分布的。其中校正集样本的变化范围越大,建立的校正模型的适用范围也越宽,但分析结果的精度可能会变差。如果模型的适用范围较小,则分析的结果精度可能会相对较高,但适用面会变窄。在获取样品光谱数据过程中,必须严格控制包括样品、测试条件、仪器参数等测量参数在内的测量条件;在对校正集样本或验证集样本的光谱进行测量时,
23、实验条件应尽量保持一致。采用糖度仪对芒果样品进行可溶性固形物(糖度)的精准检测,由于模型预测结果的准确性很大程度上取决于真实值测量结果的准确性,为此糖度仪测量的误差应降至最小,取多次测量的平均值。光谱数据的处理包括光谱预处理、光谱特征选取等,其中光谱预处理是为了提取出更加精确、有效的数据;光谱特征选取的作用是降低数据集的维数,用较少的变量去解释原数据中的大部分变异,提取主成分。建立近红外定量分析模型是一个复杂的过程,在研究领域中使用频率较高的方法有偏最小二乘法、逐步多元线性回归和主成分回归等。将模型对验证集中的样品进行预测,把得到的预测数据与真实值进行比对,得出预测集方根误差对模型进行评价和改
24、良。一个良好的校正模型,在用验证集样本对模型进行考核时,其预测结果应与真实值实际测量结果有良好的一致性。2 研究方案与方法2.1 近红外光谱常规检测方法近红外光谱检测仪器的主要组成部分有光源、检测器、测样附件和数据处理系统等,其分析测定技术大体可以分为三大类:全透射光谱法,半透射光谱法和反射光谱法。当光线对物体进行照射时可以形成三种不同的反射形式,分别是镜面反射、漫反射和常规反射。在这三种反射形式中,能够携带光与物体内部结构和分子反射信息的形式叫做漫反射,它包含着物体的内部组成和结构等丰富的信息。在检测和分析漫反射光谱时,将光谱检测探头与全波段光源放置于待测样品的同一侧,这时检测探头接收到的光
25、是光源发出的全波段光线照射到待测样品后,以不同方式所反射给检测探头的光。因为漫反射光谱检测法所能检测的样品部位只是被测样品检测体的一小部分,如果该样品不同部位的可溶性固形物含量差异较大,那么漫反射法所检测到的精度就会受到影响。在科学研究过程中通常把接受到的光与漫反射的光的比称作反射率。除了漫反射法之外,还有一种光谱检测方法称作透射光谱法,它可以检测果皮较厚的水果内部品质,比如西瓜、南瓜等。透射光谱法可根据水果的种类不同而分为全透射光谱法和半透射光谱法两种。全透射光谱法在检测时光源发射出来的光与检测探头接收到的光是处于不同侧放置的,这样可以检测到被测样品的整体信息,在科学理论上来说,用全透射光谱
26、法来检测水果的内部品质是理想的,不过这种方法只适合应用于一些光线比较容易穿透的水果。半透射光谱检测方法在检测时,需要将光线直接照射到待测物体的侧面,光线进入果体内部与内部组织和成分反应后携带着丰富的信息被放置在样品下方的检测探头所接收,这时得到的光谱信息是被检测样品的果体偏下部分。每一种方案都有其适用的对象,透射法虽然能够得到果体整体的信息,但其所需要的光源穿透力必须足够强才能达到预期效果。透射法的不足之处就在于拥有强穿透力的光线不仅温度高,而且极容易对样品造成毁灭性的破坏,因为样本经历高温之后内部成分和结构会发生剧烈变化。通过了解三大分析测定技术的原理和适用范围,再结合芒果本身果皮薄、整体糖
27、度差异性低的特点,本研究将选用近红外漫反射光谱技术无损检测芒果内部品质可溶性固形物(糖度)的含量。含内置光源漫反射检测系统布局如图4所示,光谱仪一端连接计算机数据处理系统,另一端与内置光源通过反射光纤合并经过检测探头对芒果样品进行光谱检测,最后将数据传输到计算机,便于后期处理与分析。图4 反射率测试模拟图2.2 光谱检测系统的准备与搭建2.2.1 试验材料本研究选取芒果品种当中市面上最常见的“台农一号”作为实验样品(图5可见)。“台农一号”是芒果市场上需求最大,也是民间最广为人知的品种,其主要分布区域在广西、广东、海南、华南地区。选择外表无明显缺陷和损伤的“台农一号”芒果一共45个,其中随机挑
28、选30个作为校正集样品,15个为验证集样品,将它们分别编号后置于5摄氏度的冰箱中贮藏。研究应尽量缩短芒果从采摘到检测中间的时间以保证检测数据的科学性和准确性,同时在试验前要保证芒果样品温度与周围环境温度一致,避免因温度不同而造成最终模型的误差。图5 芒果样品集2.2.2 仪器设备本研究选用光谱仪器为晶飞光纤光谱仪(如图6所示),具有先进的光纤探头,快速的传输通道,能够高效的采集到稳定可靠的光谱数据,同时光谱仪还提供相匹配的光谱数据采集和分析软件。试验所用晶飞光谱仪的光谱探测范围是200到1100纳米之间,在摄像头上选择东芝TCD1304DG的纤性阵列相机,光纤探头的探射孔直径为50微米,为了减
29、少杂光对光谱仪探头的影响,在光纤探头处装上一个直径3.6cm的圆柱接头来辅助测定光谱13。如图6所示,浅绿色长方体是光谱仪的主体,一端连接着蓝色的传输光纤,在光纤的尽头是晶飞光谱仪检测探头。在此要特别注意传输光纤在使用和存放过程中都不允许将其折叠,因为这样很容易就会使光纤断裂。光谱仪主体的另一端连接的是与计算机相连的数据传输线,使用时将其连接进计算机即可。图6 晶飞光谱仪FLA5000+试验所需光源必须要求为全波段的光线,普通的LED光源并不满足要求,因此采用飞利浦卤素光源(如图7所示),它的额定电压为12V,功率为50W,照射角为36,可以搭配专用灯座和12V变压器使用。由于光源在提供照射时
30、发热比较严重,特地为此制作了亚克力材料的光源固定支架。图7 卤素光源为了准确测量样品可溶性固形物(糖度)的真实值,试验采用糖度仪(如图8)对芒果样品进行精准检测。测量中采用压榨果汁的方式对可溶性固形物(糖度)的真实值进行检测,将采集点所处的部位进行切片,用工具压榨出果汁并滴取到糖度仪折光棱镜上进行数据检测。图8 糖度仪2.2.3 检测系统的搭建近红外光谱检测系统主要包括外置光源、光谱仪、检测探头、光纤、样品背景和计算机等部件。首先在采集光谱信息过程中,要始终保持光源与样品间一定的位置和照射角度,同时也要尽量保持检测探头与芒果样品采集点之间稳定的距离。本研究设定外置光源照射角为45角斜向下照射,
31、检测探头竖直固定于样品采集点正上方2cm处,可根据芒果高度不同对应调整检测探头的固定点。在试验测定过程中,外置光源发射出全波段的光照射在芒果表皮上,芒果内部成分引起光的漫反射现象,漫反射光线携带着丰富的芒果可溶性固形物信息被样品上方的光纤探头所吸收,通过光纤输送至光谱仪内部并最后将光谱数据传输至计算机中存储,这样就完成了一次芒果样品的光谱数据采集。为了防止其他杂光对试验造成影响,在测定芒果样品光谱数据时要保持环境的封闭性,最好在黑暗环境下进行试验,减少日间杂光的干扰,同时为了凸显芒果内部品质的光谱波长吸收特性,试验采用不反光的蓝色底片作为样品背景。本研究搭建好的漫反射采集系统如下图9所示。图9
32、 光谱漫反射采集装置2.2.4 数据处理系统在数据处理系统方面,本试验在采集光谱图像阶段使用晶飞光谱仪专用软件:晶飞光谱分析系统软件(Spectral Analysis for Windows),主要任务是通过该软件设置采集时的光谱仪各项参数,比如设置积分时间和采样平均次数等,接着通过连续测试实时监控采集图像并记录光谱数据,操作界面如图10所示。图10 晶飞光谱分析系统软件操作界面在数据分析建模阶段则主要使用专业光谱分析系统:The Unscrambler X 10.1,该软件作为一个专业级的光谱数据分析软件,能够高效的处理庞大的数据量,并且软件内置有各种预处理和建模方法,还有不同的分析图表可
33、供研究,为用户研究和分析提供了一个强有力的工具。在收集到光谱数据后将其导入到该软件中进行预处理与建模分析等工作。The Unscrambler X 10.1的操作界面如图11所示。图11 The Unscrambler X 10.1操作界面2.3 光谱数据的处理方法2.3.1 光谱预处理在数据获取过程中通常会伴有一些误差,都会对后期的检测造成一定的影响。因此,为了提取出更加精确、有效的数据,通常会采取一些数据预处理的方法来改善数据,本文就常用到的两种数据预处理方法作简要介绍。(1) 移动平均平滑是最为简单的一种光谱预处理办法,它的的原理是将光谱数据中相邻的奇数位数据点选取出来并以此建立一个窗口
34、,通过得出数据窗口内的数据平均值后,用该平均值替换掉奇数个数据点范围内的中心数据点的光谱数据值,最终得到相邻奇数个数据点平滑之后具有代表性的数据点。在下一步中,保持整个窗口的数据点总数不变,除去数据窗口内的排头数据,在尾部添加一个新的数据点,建立一个首尾移动后的新窗口。(2) Savitzky-Golay多项式平滑算法也称作最小二乘拟合算法,也是一种非常常用的光谱数据平滑处理方法,在数据处理上有许多优点。在处理过程中,SG算法会建立一个窗口,在这个窗口中包含着相邻的奇数个(NSP=2m+l)光谱点,通过运用多项式法对所建立的窗口内的样品数据做最小二乘拟合,计算得到多项式系数之后,运用公式得出窗
35、口中心数据点的各阶导数值和平滑数据值。最后类似于移动平均平滑,除去数据窗口内的排头数据,在尾部添加一个新的数据点,建立一个首尾移动后的新窗口,得到不同导数解析后的光谱图像。2.3.2 光谱特征选取方法光谱特征选取的作用是降低数据集的维数,用较少的变量去解释原数据中的大部分变异,提取主成分。常用的方法有逐步回归分析和主成分分析。(1) 逐步回归分析在光谱数据分析过程中会选用某段比较敏感的波长(比如波峰波谷)来建立一个回归方程,通过针对每一个敏感波长进行计算比对,当该波长对理化性质值y影响异常显著时则保留,如果作用不够大就弃用这一波长。最后整合所有对理化性质值y作用显著的敏感波长,尝试在初始阶段未
36、被选取的不敏感波长中重新选取新的敏感波长,计算比对它的显著性,添加到已建立好的回归方程中,如果整体显著性未有增强,则把它剔除。(2) 主成分分析方法主要是通过数据降维,经过正交变换从高维子空间降到低维子空间,在不损坏原始数据信息的前提下,有效的降低了光谱数据的维数,达到了用少量光谱变量来代表原始数据绝大部分信息的目的,把很多彼此之间相关系数很高的光谱波长变量转化为不受互相影响的无关变量。最终将大量光谱数据糅合成几个具有代表性的新变量,称作主成分。2.3.3 建模方法建立近红外定量分析模型是一个复杂的过程,在研究领域中使用频率较高的方法有偏最小二乘法、多元线性回归和主成分回归等。(1) 多元线性
37、回归(Multiple Linear Regression;MLR)多元线性回归的基础数据是采集到的光谱数据,经过对这些数据内部联系和结构的分析和解析,找到不同变量之间相互存在的影响和作用关系,是一种可以探索变量与变量之间相互联系的数学统计方法。假设K个自变量X1,X2,.,XKi和因变量y之间存在着线性的相关关系: 因为y是随机的,将它可能的取值合成一个数据集合,有:该式子就是数据K元的总体回归线性方程。MLR在实际计算过程中需要随机挑选待测样品的预测值来进行预估,可以将上式回归方程转化为:在上式中:是数据总体平均值的预测值;是数据总体回归系数的预测值;残差项是随机扰动项的预测值。(2) 主
38、成分回归(Principle Component Regression;PCR)PCR利用光谱数据矩阵X在经过主成分分析计算后获得的f个主要得分数据相邻来建立矩阵,为了建立PCR主成分回归模型,将其替换吸光度变量后采用MLR,可以得到下列模型:其中方程系数b的最小二乘解为:在光谱数据矩阵X中,先对其主成分进行分析得到载荷矩阵,得到它的得分向量:接着应用PCR模型b计算出最终的结果:(3) 偏最小二乘法(Partial Least Squares Regression,PLS)在前面介绍的PCR中,为了去除对结果无效的噪声干扰信息,PCR针对矩阵X进行解析却忽视了浓度矩阵Y当中也可能携带着无效的
39、信息。为此偏最小二乘法设立一种多元因子回归算法偏最小二乘法第一步对光谱阵X和浓度阵Y进行分解,其模型为:在上式中,吸光度矩阵X的第k个主因子的得分为tk(n1);pk(1m)为吸光度矩阵的第k个主因子的载荷;f是主因子数。PLS的第二步是将T和U做线性回归:在预测时,首先根据P求出未知样品光谱阵X未知的得分Y未知 ,然后由下式得到浓度预测值:主成分回归成功解决了多元线性回归算法结果不够准确的问题,有效的把光谱的有价值的信息利用起来,省去不具代表性的主成分,在对模型噪声的消除上也有良好的作用。该方法可适用于较复杂的分析体系,不需知道存在具体的干扰组分就可以较为准确地预测出待测组分的含量。对于偏最
40、小二乘回归算法来说,考虑到矩阵X和Y的得分相关性和主成分之间的联系性,在演算光谱数据的主成分时把主成分和待测浓度Y尽可能的关联起来。不满秩求逆和光谱数据无法完全利用的缺陷可以被MLR所解决,大幅增强定量分析模型的稳定预测可靠性。偏最小二乘法把矩阵X和Y之间的关系考虑进去,增强了各自匹配的算法关系,以此来建立一个最优的定量分析校正模型。从科学分析的角度上来说,偏最小二乘法之所以能够成为在多元分析校正领域最为广泛应用的方法,是因为PLS融合了MLR和PCR的优点并且解决了它们的缺陷14。3 光谱数据的分析与建模3.1 样品数据的采集3.1.1 光谱数据在进行试验前将芒果从冷藏柜放置于室内至温度与室
41、温相同,用半湿润的细腻毛巾擦拭芒果表皮,擦去表面的泥土,以免表皮污垢对实验数据造成影响。选取芒果果体赤道部位正反中心两个点作为光谱仪器检测部位,按照顺序对芒果进行标号,注意要在光谱仪检测部位外不影响实验的果皮上标上进行标号,1号样品正面标上A1,反面标上B1,2号样品正面标上A2,反面标上B2,以此类推如图12所示。图12 芒果样品标号示意图在恒定室温26摄氏度(误差不超过正负1摄氏度)的条件下使用晶飞光谱仪FLA5000+对样品进行检测,积分时间2.5毫秒,测定范围285967nm,采样平均次数20次,滑动平均次数为10次。试验光源为额定电压12V额定功率50W的卤素灯泡,在黑暗封闭环境下固
42、定向下倾斜45照射芒果表面,光谱仪检测探头则固定在离芒果正上方5cm处,以便在不受杂光和光源的影响下能够采集准确的芒果近红外光谱检测数据,同时为了凸显芒果内部品质的特征波,采用不反光的蓝色底片作为背景。为了增加光谱数据的可靠性和准确性,对每个样品进行2次光谱采集,采集点位于芒果果体赤道部位的正反中心点。采集完45个样品集后,一共得到90组芒果近红外光谱图像数据。通过晶飞光谱仪对芒果进行近红外光谱数据测定后,以纵列为样品编号,行列为每个样品在不同波长所对应的漫反射率的值,将光谱数据保存至Excel表格内,方便后期对数据进行导入和处理。由于光谱仪器在检测时本身容易产生噪声影响光谱图像,在前端和尾端
43、波长范围内产生了一些震荡性较大的噪声,把这些无效的波段去除之后,截取520770nm波长范围内的光谱数据进行分析。在检测过程中发现有3个存在明显检测异常的样品,将这3个异常样品剔除后得到芒果校正样品集29个,光谱数据58组;芒果验证样品集13个,光谱数据26组。将校正样品集光谱数据导入专业光谱数据分析软件The Unscrambler X 10.1内得到光谱数据原始图像如图13所示,其中横坐标为波长数,纵坐标为漫反射率。图13 芒果校正样品集光谱数据原始图像3.1.2 真实值测量作为建立和验证校正模型的重要依据,我们需要准确的芒果可溶性固形物(糖度)的含量值。在测定完芒果样品的近红外光谱数据后
44、迅速采用糖度仪对芒果进行真实值检测,增强数据的时效性和准确性。每个芒果样品都有两个采集点(与漫反射光谱采集点位置相同),取每个样品的两个采集点糖度的平均值作为该芒果的糖度代表值。测量中采用压榨果汁的方式对可溶性固形物(糖度)的真实值进行检测,将采集点所处的部位进行切片,用工具压榨出果汁并滴取到糖度仪折光棱镜上进行数据检测。最终得到校正集、验证集样品可溶性固形物(糖度)含量真实值等信息如表2所示。表2 芒果校正集、验证集样品可溶性固形物(糖度)含量统计表名称样品数最大值最小值均值标准误校正集验证集291320.718.812.914.516.1616.470.0340.0463.2 处理和建模方
45、案的选择光谱数据处理和建模方法多种多样,各种方法组合对最后模型建立造成的效果也大不相同。在现有研究结果中,虞佳佳(2008)和曹霞(2013)等学者在各自应用光谱技术对芒果内部品质进行检测的研究中都采用了偏最小二乘法(PLS)并选取了不同的因子数建立了芒果糖度近红外分析模型,在预处理方法选择上,学界大都采用经典算法,比如Savitzky-Golay 多项式平滑、移动平均算法和导数变换算法等8,9。在结合本试验特点,并且多次尝试之后,决定预处理方法选用Savitzky-Golay 多项式平滑,降维处理选择二阶导数变换算法,并采用最为常用和认可的偏最小二乘法(PLS)建立模型。为了探讨最适用于本试
46、验建立芒果可溶性固形物近红外分析模型的偏最小二乘因子数,决定分别运用不同的因子数并计算最终模型的相关系数r和RMSEC,以此来评价和选取哪一种参数选择更能精准的建立芒果可溶性固形物近红外分析模型。3.3 光谱预处理从原始图谱中不难看出,在58个校正样品集近红外图谱中,不同的样品其光谱图像具有相似性,随着波长的增加,光谱漫反射反射率也逐步增加,在700709nm达到小高峰之后,进入到735745nm的下降谷。如果对每一个波长都进行针对性的分析和校验,那计算量必然是巨大的,而且并不是最高效的方法。研究与分析需要更加精确和可靠的光谱信息作为基础,于是采用SG多项式平滑来对芒果光谱数据进行预处理。在设
47、置平滑参数时要格外注意平滑点数和平滑阶数的选择。如果选择过大的平滑点数和过高的平滑阶数,都会使得光谱图像变得太多平滑而丧失了某些重要的信息,最终影响到模型的建立和模型的可靠性,以此要选择尽可能小的点数和合适的阶数15。为了提取出更加精确、可靠、有效的数据,在分析软件The Unscrambler X 10.1的Savitzky-Golay 多项式平滑参数设置界面中,把polynomial order(多项式阶数)参数设置为2,对543747nm波长进行处理,得出平滑图谱如图14所示,其中横坐标为波长数,纵坐标为漫反射率。图14 芒果校正样品集光谱数据SG平滑图像在得到平滑图像后,采用二阶导数变换算法进行处理。导数法主要用来消除由基线漂移和平缓背景干扰造成白数据偏差,它能够分辨光谱曲线的重