《基于大数据技术的中药饮片外观性状与内在成分数据的研究与应用.docx》由会员分享,可在线阅读,更多相关《基于大数据技术的中药饮片外观性状与内在成分数据的研究与应用.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、基于大数据技术的中药饮片外观性状与内在成分数据的研究与应用 摘 要 目的:探讨大数据技术在中药饮片外观性状与内在成分数据结合分析中的应用。方法:总结现有中药饮片鉴别中外观性状与内在成分检测技术的不足,就中药饮片“内外结合”大数据库的探讨现状与应用前景进行综述。结果与结论:现有的智能感观技术存在数据不完整、不精确和对多维数据缺乏整合的不足,内在成分检测方法也存在诸多不足。大数据分析流程包括前期数据采集、数据预处理、数据分析与处理、数据可视化处理以及数据应用几个阶段。收集中药饮片形、色、气、味外在性状与内在成分数据以及文献学问库信息,构建中药饮片“内外结合”大数据库,再依据大数据处理流程与算法,可
2、实现人工智能协助中药饮片真伪优劣鉴别,实现对中药产地的辨别区分,挖掘影响中药饮片质量的因素,为其质量限制供应规范化标准。大数据技术的应用能精确、高效地处理中药饮片“内外”多维数据,可为传统中药行业探讨供应新思路,为中药饮片客观化发展供应新动力。 关键词 大数据技术;中药饮片;外观性状;内在成分 中图分类号 R282.5 文献标记码 A 文章编号 1011-040816-2287-04 传统中药鉴别包括基源鉴定、显微鉴定、性状鉴定与理化鉴定4种方法。针对中药的形、色、气、味的外观性状鉴定是对中药质量进行评价的重要指标,从其外观性状可以推断其原生植物品种、生长年限、品质等。然而,目前对于中药外观性
3、状的评价仍通过肉眼视察、口尝、鼻闻等方法来进行,不行避开地会因一些主观因素对鉴定结果的客观性与牢靠性产生影响。基于这种状况,许多学者提出通过机器视觉、电子鼻、电子舌等现代技术对中药饮片的形、色、气、味等性状信息进行量化,客观化表达人工鉴别的主观阅历,用以鉴别中药饮片1。当下大数据技术发展快速,且已广泛应用于农业、医疗、教化、能源、国防、金融等诸多领域。引入大数据技术对中药饮片数据采集过程中积累形成的大量外观性状数据与内在成分数据结合起来进行分析,建立其品质与外在信息间的耦合关系,可对中药饮片智能识别分类、产地智能分析推断的实现及中药质量标准的建立供应理论依据。 1 现有技术方法存在的不足 1.
4、1 智能感官技术的不足 1.1.1 数据缺乏完整性与精确性 已有探讨证明,中药材的形、色、气、味与其内在成分含量具有肯定关联度,但是对其形、色、气、味对应的物质基础探讨较少1,因此采纳智能感官技术进行鉴定缺乏与中药材或饮片内在成分的关联,影响数据采集的完整性。智能感官技术,例如电子鼻、电子舌等,由于仪器自身限制或传感器限制,对中药材的敏感度有限,尤其对辨识度不高的中药材检测正确率较低2,导致人们对其品质评判结果不能完全信任,从而极大地影响了人们的决策。 1.1.2 对多维数据缺乏整合 目前,智能感官技术在中药性状鉴别中的应用也越来越广泛,但大多数探讨人员往往只依靠一两种技术对中药饮片的性状进行
5、判定,多种分析技术的综合应用较少3-6,因此分析结果缺乏普适性,且各项技术得到的数据比较孤立,导致鉴别数据“各自为政”的现状,积累的大量数据分布在各自的“信息孤岛”中,未能得到整合与全面分析。而运用薄层色谱、液相色谱、质谱等多种方法用于內在成分的测定,获得的数据具有肯定的困难度,与外观性状数据的相关性探讨较少,因此对多维数据的集群整合及数据分析存在肯定的难度。 1.2 内在成分检测方法的不足 理化鉴别中一般采纳光谱、色谱、差热分析等技术,即利用中药分子内部一些含氢基团振动的倍频和合频汲取来实现对中药的快速鉴别,但其检测结果多为定性判定,精确度有所欠缺;且在实际操作过程中,针对样本的测量须要大量
6、有代表性且化学值已知的样品建立模型,在这样的状况下采纳上述技术对小批量样品进行分析就显得不太实际。此外,由于仪器状态变更或标准样品发生改变,所建模型也须要不断更新,其稳定性与适用性均难以估值,加之在试验过程中所用模型并不是通用的,每台仪器的模型都不相同,又增加了运用的局限性。 2 中药饮片“内外结合”大数据库的构建 2.1 大数据处理流程简介 大数据处理流程包括前期数据采集、数据预处理、数据处理与分析、数据可视化处理以及数据应用几个阶段,即通过对多来源数据进行整合,结合计算机学习算法对数据进行分析预料,可得出用于展示沟通的可视化图像或图形7-8,进而进行应用,详见图1。 2.2 中药饮片“内外
7、”数据采集 中药饮片“内外”数据是指外中药饮片外观性状数据与内在成分数据,可利用多个数据来源渠道进行采集,例如,运用电子鼻、电子舌等设备可对中药材及饮片的形、色、气、味等外观性状数据进行实时采集;运用色谱、光谱、电泳、差热分析等技术可确定中药材及饮片的内在成分数据;还可检索现有文献学问库中涉及到的相应中药饮片的数据记录等。分析各类数据集合的关联度,可构建中药饮片“内外结合”大数据库,对全部结构化与非结构化的数据进行存储与管理,以便后续数据的查询与处理。 2.3 数据预处理、处理与分析 由于不同来源的数据相互间易受到数据干扰产生噪声,存在数据值缺失、数据错误等问题9,因此须要对采集到的大量数据集
8、合进行预处理工作,以便为后续数据处理与分析阶段供应精确、无误、真实、有效的数据,提高数据的整体质量,保证结果预料的精确性与可行性。详细操作包括数据清理、数据集成、数据规约等。数据清理是指对于中药饮片的外观形、色、气、味数据与内在成分含量数据及文献库提及的全部数据进行数据清理操作,包括数据过滤与修正10-12和数据的不一样性检测等。数据集成则是将不同来源的数据进行集成,形成统一的数据库,以提高数据的完整性和可用性13-15。数据规约用在中药饮片外观形、色、气、味数据与内在成分含量数据处理中如:运用主成分分析法进行数据降维,提取数据主要特征向量,旨在运用少数向量反映原始数据的特征,提高数据的价值密
9、度,以降低数据集规模。 数据分析是大数据处理与应用的关键环节,确定了大数据集合的价值性和可用性,以及分析预料结果的精确性。在数据分析环节,依据大数据应用情境与决策需求选择合适的数据分析技术,可提高大数据分析结果的可用性。 2.4 数据应用 2.4.1 人工智能协助中药饮片真伪优劣鉴别 中药饮片的质量鉴定是对中药饮片真伪优劣的检验,而通过数据挖掘技术对中药饮片“内外结合”大数据库进行处理分析,结合神经网络深度学习算法,即可实现对其“真伪优劣”的鉴别。如熏硫、炒制等传统中药炮制工艺16-17,对一些含糖量高但不易贮存的中药饮片的运用和贮存均有肯定的主动作用。而以炒制为例,不同炒制程度的中药饮片具有
10、不同的临床疗效,炒制温度过低或过高都会影响有效成分的活性18,因此推断相宜的炒制程度就显得至关重要。有探讨获得不同炒制程度下的山楂“L*a*b*”颜色空间三维数值,其中L表示照度,a表示颜色从深绿色到灰色再到亮粉红色,b表示颜色从亮蓝色到灰色再到黄色。将颜色数值与内在含量改变数据进行归一化整合,应用PCA法降维,依据人工神经网络要求预设模型参数与反馈函数,确定最优权值与输出,建立外在性状-内在成分-炒制温度的算法模型。以“性状”数据作为ANN输入自变量,不同炒制程度下内在成分的改变设为因变量,结果该模型对3种不同炒制程度山楂的预料精确度分别为101.9%、92.5%、101.3%,得出山楂最合
11、适的炒制温度为;采纳PCA法对上述预料结果进行验证,结果得PC1=94.237%,PC2=4.533%,PC3=0.693%19-20。可见,该算法模型对不同炒制程度下的山楂具有很好的预料性能,可实现对炮制火候的限制检测30,详细预料流程见图3。 2.4.2 对中药材产地进行分析推断 道地药材是指在特定的自然条件和生态环境的区域内所产的中药材,其生产较为集中,具有特定的栽培技术和采收加工方法,质优效佳。鉴于不同产地的中药材其功效可能有所差别,因此采纳合理的检测技术,并结合有效的分析方法来辨别中药材产地显得尤为重要。 基于大数据的中药材产地判别,指在现有中药材产地数据之上进行各种算法的计算21,
12、如机器学习算法K均值、支持向量机算法、深度学习算法等22-25,形成不同算法模型,挖掘大数据集合中的数据关联性,从而得到中药材产地预料结果。陶梦琳等26收集多产地黄连样本,采集“内外”数据,建立了基于SVM算法的黄连饮片产地区分模型,实现了产地的区分,可用于分析同种药材不同产地的差异。Yang SL等27采纳试验室自助研发的机器视觉系统和AlphaMos公司研发的电子鼻、电子舌,分别获得贝母样品的“L*a*b*”颜色数值、18维气味特征值与7维味道特征值;采纳PCA法对多维数据进行降维处理,采纳SVM算法將不同产地贝母作为输出变量,建立多层数学分析模型,用于推断贝母饮片的不同产地。该算法通过强
13、化学习不断变更权值实现了对贝母“道地性”的鉴别,随着训练数据的积累,预料的结果值不断优化,最终该模型的识别率达到了92.6%。试验中并分别用电子鼻与电子舌数据构建PCA鉴别模型对上述结果进行验证,表明该模型的鉴别效果较好27。整个数据处理环节以Matlab R2022a软件进行操作,详细识别流程见图4。 此外,针对混合药材如不同品种、不同年份或辨识度低的药材饮片,也可通过训练海量数据与构建机器学习模型来提升数据分析与预料的精确性。 2.4.3 提中学药饮片质量限制标准 运用数据挖掘工具对中药饮片“内外结合”大数据库进行分析,建立算法预料模型来分析其各部分数据间的关系,有助于挖掘影响中药饮片质量
14、的关键因素,进而有助于中药饮片质量标准的规范化,从而提高对中药饮片质量的监控与管理水平。 3 结语 随着大数据技术在多个领域的广泛应用,数据挖掘在中药中的应用也越来越多。建立中药饮片“内外结合”大数据库,可在整合海量数据的同时,结合机器学习算法挖掘数据潜力,并进行广泛应用。例如,其可用于中药真伪优劣品质的鉴别,实现人工智能识药;对中药产地进行辨别区分,分析同种药材不同产地的差异性,为道地药材的鉴定供应借鉴;挖掘影响中药饮片质量的因素,为其质量限制供应规范化标准,也为中药饮片质量监控与管理供应依据。大数据技术能有效整合多维、多变的数据,削减因信息单一而引致的错误推断,从而可为中药行业的现代化发展
15、供应有力支撑。 中药饮片外观性状与内在成分数据是对其客观化评价的重要衡量标准,然而在其大数据技术探讨过程中仍旧存在肯定问题,例如,数据来源的真实性与完整性难以得到保证,或不同中药饮片的外观性状数据未能全部获得;在饮片多方数据缺失严峻的状况下,简单造成数据转换率折损、利用率较低等状况。随着当前人工智能技术的普及,引入深度学习方法对海量数据进行处理与分析,构建数学模型,有助于提高分析精准度及牢靠性。应用大数据技术精确、高效地对中药饮片“内外”数据进行挖掘,可为传统中药行业探讨供应新思路,为中药饮片客观化发展供应新动力。 参考文献 1 赵雷蕾,周洋,黎茂. 基于数据化表达的中药“形色气味”探讨进展及
16、思索J. 广东药学院学报,2022,31:692-694. 2 黎江华,吴纯净,孙灵根,等. 基于机器视觉技术实现中药性状“形色”客观化表达的展望J. 中成药,2022,33:1781-1784. 3 吴继华,刘燕德,欧阳爱国. 基于机器视觉的种子品种实时检测系统探讨J. 传感技术学报,2022,18:742-744. 4 张俊雄,陈涛,于振东,等. 基于计算机视觉的新疆棉种颜色分选系统设计J. 农业机械学报,2022,40:161-164. 5 常若葵,张伟玉,崔晶,等. 基于机器视觉的大米外特性评价J.农机化探讨,2022,31:149-151. 6 夏于芬,梁光平. 大数据背景下的中药现
17、代化J.亚太传统医药,2022,11:1-3. 7 CUI M, LI HY, HU XQ. Similarities between “big data” and traditional Chinese medicine informationJ. J Tradit Chin Med,2022, 34:518-522. 8 YEA SJ, SEONG B, JANG YJ, et al. A data mining approach to selecting herbs with similar efficacy:targeted selection methods based on med
18、ical subject headingsJ. J Ethnopharmacol,2022,8:27-34. 9 龙伟,邳馨,向剑,等. 中药方剂网络与中药化学空间的构建与分析J. 北京中医药高校学报,2022,34:739-731. 10 陆爱军,刘冰,刘海波,等. 中药化学数据库关联规则的挖掘J. 计算机与应用化学,2022,22:108-112. 11 GUO J, SHANG E,ZHAO J,et al. Data mining and frequency analysis for licorice as a “Two-Face” herbin Chinese formulae ba
19、sed on Chinese formulae databaseJ. Phytomedicine,2022,21:1281-1286. 12 向杨峰. 基于数据挖掘的新药研发系统D. 北京:北京交通高校,2022. 13 付先军. 基于数据挖掘技术探讨治疗肺系疾病方剂中药物化学成分类别构成及其配伍关系J. 中医药信息学,2022,20:28-30. 14 李振皓,钱忠直,程翼宇. 基于大数据科技的中药质量限制技术创新战略J. 中国中药杂志,2022,40:3374-3378. 15 龚蓓,苏励,董亮,等. 基于大数据的风湿科常用中药饮片肾毒性初探J. 上海中医药杂志,2022,49:7-9.
20、16 曹婷婷, 孙志蓉, 杨春宁,等. 硫黄熏蒸中药材的探讨现状分析J. 中国现代中药,2022,18:678-681. 17 李铎. 硫熏中药材快速检测装置设计探讨D. 保定:河北高校,2022. 18 伍敏生. 硫熏对中药饮片质量的影响探讨J.中国中医药现代远程教化,2022,12:158-159. 19 王洪建. 基于HSV颜色空间的一种车牌定位和分割方法J. 仪器仪表学报,2022,26:373-373. 20 XIE DS, PENG W, CHEN JC, et al. A novel method for the discrimination of hawthorn and it
21、s processed products using an intelligent sensory system and artificial neural networksJ. Food Sci Biotechnol,2022,25:1-6. 21 曾星翔. 通江银耳志M. 北京:方志出版社,2022:8-15. 22 施学丽,邓家刚,蒋筱,等. 195 首治疗乳腺增生中药专利复方的用药规律分析J. 世界科学技术,2022,15:1544-1550. 23 YANG M, JIAO LJ, CHEN PQ, et al. Complex systems entropy network and
22、 its application in data mining for Chinese medicine tumor clinicsJ. World Science Technology,2022,14:1376-1384. 24 CHU H, SUN P, YIN J,et al. Integrated network analysis reveals potentially novel molecular mechanisms and therapeutic targets of refractory epilepsiesJ. PloS One,2022,12:e0174964. 25 T
23、AN C, XIE D, LIU Y, et al. Identification of different bile species and fermentation times of bile arisaema based on an intelligent electronic nose and least squares support vector machineJ. Anal Chem,2022, 90:3460-3466. 26 陶夢琳,顾文涛,侯珂惠,等. 基于支持向量机的“内外结合”中药质量限制新模式探究J. 中国药房,2022,27:118-121. 27 YANG SL,
24、 XIE SP, XU M, et al. A novel method for rapid discrimination of bulbus of Fritillaria by using electronic nose and electronic tongue technologyJ. Anal Methods,2022, 7:943-952. 第13页 共13页第 13 页 共 13 页第 13 页 共 13 页第 13 页 共 13 页第 13 页 共 13 页第 13 页 共 13 页第 13 页 共 13 页第 13 页 共 13 页第 13 页 共 13 页第 13 页 共 13 页第 13 页 共 13 页