最大熵在中医智能辨证的研究及其应用.docx

上传人:l*** 文档编号:10088008 上传时间:2022-04-08 格式:DOCX 页数:10 大小:21.63KB
返回 下载 相关 举报
最大熵在中医智能辨证的研究及其应用.docx_第1页
第1页 / 共10页
最大熵在中医智能辨证的研究及其应用.docx_第2页
第2页 / 共10页
点击查看更多>>
资源描述

《最大熵在中医智能辨证的研究及其应用.docx》由会员分享,可在线阅读,更多相关《最大熵在中医智能辨证的研究及其应用.docx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、最大熵在中医智能辨证的研究及其应用 摘 要: 分析了中医临床记录中症状与症候类别之间的关系,将机器学习中的最大熵原理应用于中医辨症中,建立相应的分类模型,从而视察类别预料的正确性,为中医智能诊断供应初筛和决策支持。同时,将基于最大熵的分类器和基于朴实贝叶斯的分类器进行比较,结果显示,基于最大熵的分类效果赛过朴实贝叶斯分类。这表明将最大熵原理以及算法应用在中医诊断是可行的。 关键词: 中医临床记录; 最大熵; TCM; 中医辨证 中图分类号:TP311.1 文献标记码:A 文章编号:1016-822803-50-04 Abstract: The relationship between clin

2、ical medicine symptoms and symptoms categories of records are analyzed. The principle of maximum entropy in machine learning is applied to the TCM syndrome. The corresponding classification model is established to observe the category and forecast category correctness. Intelligent diagnosis for TCM

3、is provided to support the screening and decision support. Compared with the simple Bayesian classifier, the experimental results show that the maximum entropy classification is more effective than Naive Bayes. This suggests that the maximum entropy principle and the algorithm are feasible in the cl

4、assification of traditional Chinese medicine. Key words: the doctor of traditional Chinese medicine clinical record; maximum entropy; TCM; syndrome differentiation 0 引言 随着信息化和科技化的发展,实现中医现代化这一进程刻不待时,中医诊断智能化是实现中医现代化的重要部分,而在中医诊断智能化中,必需解决的核心问题和关键技术就在于中医智能辨证1-2。中医辨证是须要经验由症状等信息,诊断出病,再考虑用药这一过程,该过程有非线性、模糊性和

5、困难性等特点,由此产生的数据有不规范化性和模糊性等特征,假如单纯的由人工对这浩大数据进行分类分析,就难以保证对全部中医相关信息的综合考量。 数据挖掘本身就是通过分析数据,从海量数据中挖掘出潜在的客观规律或隐藏的有用信息,这一特点使其能够成为能从中医海量数据中挖掘相关信息的主要技术之一,基于此,我们将探讨如何运用数据挖掘技术来实现中医的智能辨证。 中医辨证的诊断过程,实质上是由中医临床记录收集到的各种症状,通过分析,预估证型的过程,其过程相当于分类,因此我们可以采纳数据挖掘中的分类方法来解决。关于分类方法有两类模型,一类是生成模型,另一类是判别模型,它们是分别从不同视角来解决分类问题的。最大熵是

6、属于判别模型中的一种,现已被广泛用于文本分类中,但实际应用于中医智能辨证的探讨还很少。因此我们选用最大熵对其进行中医症候的分类,对其进行相关试验探讨及其分析,从而为中医智能诊断决策供应一次初筛。 1 最大熵原理应用 最大熵原理是由E.T. Jaynes在1957年提出来的。其主要思想是,在只驾驭关于未知分布的部分学问,应当选取符合这些学问但熵值最大的概率分布3,因为在这种状况下,符合已知学问的概率分布可能不止一个,而熵定义的实际最大熵原理指出,我们须要对一个随机事务的概率分布进行预料时,预料应当满意已知的条件,而对未知的状况不要作任何主观假设,在这种状况下,条件概率分布最匀称,预料的风险最小,

7、此时预料模型在满意约束条件下的信息熵最大4。 1.1 最大熵算法应用于中医辨证的可行性 最大熵在不同的领域有不同的表现形式,其敏捷性很强。在中医智能辨证中,我们希望通过给定的症状、特征,来得出它属于哪类证型,但这一结果并没有一个明确的标准,所以通过引入最大熵原理,运用最大熵算法优化,可以使其结果最符合实际状况。 其次,症状与症状之间的相关性,以及约束性,对判别症候有肯定的作用,这与最大熵在约束条件下求解有一些相像。 1.2 最大熵简介 针对中医辨证,假如想知道在给出症状x的前提下,判别属于某证型y的概率,最基本的方法就是通过语料集对其进行概率统计。给定一个训练集,X为症状集,Y为证型集,cou

8、nt为训练集中出现的次数,其概率估计为: 但是这个概率统计存在一个问题,即便存在很大的病例集,但许多像某症状对应某证型这种状况却没有出现,武断地认为它不存在,这是不行取的。针对这个问题,最大熵实行的方法是使其满意已知的约束条件,对其未知状况不作任何主观假设,使其分布平均。例如,寒邪客胃证,饮食伤胃证,脾胃虚寒证这三类证型,假如已知,出现“胃痛”这个症状时,60%的概率属于饮食伤胃证,对于“胃痛”这个症状在其他两类证型中的概率未知。由最大熵原理推想,假如我们给出一训练集,其中包含“胃痛”这个症状,认为这个训练集属于饮食伤胃证的概率为0.6,属于其他两类证型的概率分别是0.2;在给出的训练集中假如

9、不包含“胃痛”这个症状,那么认为训练集分别以相同的概率属于每个证型,这就是最大熵在满意已知条件的状况下,使未知事务尽可能平均分布。 1.3 数据预处理 试验数据由成都中医药高校供应,有效病例25101例,其预处理过程如下。 规范症状表 由于临床医生的不同,收集到的病情资料,其表述也会极不相同,对于用不同的命名规则及术语表达的数据,是不简单进行量化分析的,因此须要在试验起先阶段就对疾病症状等命名进行规范5 。本文进行试验的病例数据中,一共有2000多种症状。 规范病例表 在临床医生录入病例过程中,由于个人阅历不同造成病情症状描述不一,因此对其病例也须要进行规范化处理5。其中证型大约有269种。

10、建立符合试验的规范证型症状表 由于训练模型时,采纳的是“证型/症状集”的文本格式,所以须要依据规范化的症状表与病例表,建立新的证型症状表。 特征选取 经过规范化后的处理,其中一些特征对症候分类是很有用的,而另一些可能是噪声数据,会对症候分类产生干扰,因此,我们须要对其症状进行特征选取操作,将其含有信息量少的症状和噪声数据过滤掉,从而提高症候分类的正确性或有用性。 数据经过预处理后,再进行症候分类初筛。 2 试验结果与分析 数据挖掘中的朴实贝叶斯被广泛应用在中医辨证的探讨中,并取得了比较好的成果,基于此缘由,我们运用朴实贝叶斯和最大熵进行试验对比。 朴实贝叶斯分类从中医临床记录中的特征与中医症候

11、类别之间的生产关系的角度动身,通过发觉包含于中医临床记录中的诊断原则,达到协助诊断的目的,也就是说,发觉中医症候类别与临床记录诊断特征向量之间的定量关系。 2.1 试验数据集 为避开特征训练和预料的随机性,采纳交叉验证方法预料平均值,将数据集分成十份,随机采纳九份样本用于训练,剩余的一份样本用于预料并计算正确率和召回率。交叉验证过程中经验10次训练,精确率和召回率分别取其平均值。 2.3 试验结果 朴实贝叶斯在进行症候分类时,从症候类别与症状的定量关系动身,假设以症状之间是相互独立的为前提,这在实际中医辨证中是不切实际的,同时它通过计算先验概率和类条件概率来进行,但是当训练集中“胃痛”这个症状

12、出现的次数很低时,则简单出现稀疏性问题,计算出的概率特别小,在实际症候分类预料过程中,会很大程度影响预料结果。而最大熵会避开出现这种问题,依据最大熵模型训练,求出每个症状对应证型的最优参数值,然后再依据给出的“胃痛”,“畏寒”,“苔薄白”等症状,计算出概率及预料症候类别。最大熵预料有60%的可能性属于寒邪客胃证,20%的可能性属于饮食伤胃证,20%的可能性属于脾胃虚寒证。虽然这样的预料会有一些偏差,但毫无疑问,可以为中医临床诊断供应重要的决策支持。此外,由于给出的训练集,可能同时属于不同类的证型,相对于朴实贝叶斯,最大熵模型更适于多类别识别,所以在中医症候分类上采纳最大熵模型。 3 结束语 通

13、过上述试验的朴实贝叶斯和最大熵进行中医证型类别的初筛,取得了比较好的试验效果。但是由于上述试验中进行中医症候分类采纳的是人工的结构化的临床记录数据,而采纳人工来记录这些数据耗时又费劲,同时也会使得大量的中医临床记录数据不能被有效地利用。所以下一步工作是,通过对原始自由文本的临床记录进行处理而得到的症状来进行分类,使其适合于中医临床记录的数据挖掘和学问发觉,提高证型初筛的正确性。 参考文献: 1 刘意.21世纪中医中药面临的机遇与挑战再思索D.华中师范高校, 2022. 2 施明辉.面对中医辨证计算的粗糙集学问获得方法及其应用探讨D. 厦门高校,2022. 3 赵伟,赵法心等.一种基于改进的最大

14、熵模型的汉语词性自动标注的 新方法C.中国计算机学会.2022. 4 张奇.基于信息熵的Web信息抽取技术探讨D.广东工业高校, 2022. 5 宋燕等.基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研 究J.成都信息工程学院学报,2022. 6 郦永平,温淑云.中医证候量化探讨的理论探讨J.中医杂志,2022.8: 677-679 7 朱海峰,陈雪功.中医诊断客观化探讨的现状和展望J.甘肃中医, 2022.6:10-13 8 王庆华,唐甜,王清青,刘雅琼,林辉,黄国荣,熊鸿燕.小儿常见发热出 疹性疾病智能诊断模型探讨J.第三军医高校学报,2022.23:2473-2475 9 Zhang

15、NL, Yuan S,Wang Y.Latent. Tree models and diagnosis in traditional Chinese medicine.Artif Intell Med,2022.42:229-245 10 王毅杰,王海笑,杨涛.基于贝叶斯算法的手机在线中医疾病诊断研 究J.软件导刊,2022,12:101-101 11 余江维,马利庄,杨华元.中医智能化诊断的探讨现状与展望J.辽宁 中医杂志,2022.1:50-53 12 许朝霞,王忆勤,颜建军等.基于支持向量机和人工神经网络的心血 管疾病中医证候分类识别探讨J.北京中医药高校学报,2022.34:539-5

16、43 13 李江平,潘保昌,韦玉科.两层级神经网络及在中医智能诊断中的应 用J.计算机应用探讨,2022.10:3169-3173,3173 14 钟昌乐,钟勇,李宁.基于BP神经网络的畜禽疾病诊断专家系统的 设计与实现J.现代计算机,2022.4:23-26 15 王毅杰,王海笑,杨涛.基于贝叶斯算法的手机在线中医疾病诊断研 究J.软件导刊,2022.12:101-101 16 Yaqiang Wang, Zhonghua Yu, Li Chen, Yunhui Chen, Yiguang Liu, Xiaoguang Hu,Yongguang Jiang. Supervised methods for symptom name recognition in free-text clinical records of traditional Chinese medicine: An empirical study. Journal of biomedical informatics,2022. 第10页 共10页第 10 页 共 10 页第 10 页 共 10 页第 10 页 共 10 页第 10 页 共 10 页第 10 页 共 10 页第 10 页 共 10 页第 10 页 共 10 页第 10 页 共 10 页第 10 页 共 10 页第 10 页 共 10 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 策划方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁