《数据挖掘技术在医院信息系统的统计分析与决策中的应用.pdf》由会员分享,可在线阅读,更多相关《数据挖掘技术在医院信息系统的统计分析与决策中的应用.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据挖掘技术在医院信息系统的 统计分析与决策中的应用 Re s e a r c h o f I mp l e me n t S o l u t i o n o f Ho s p i t a l I n f o r ma t i o n S y s t e m Ba s e d o n Da t a W a r e h o us e 劳 孝箩 j 广 州 大 挚 数 学 椭息 科 学 学 院,j 广 l东 _ 广 州 5 l 0(10 6 _。l。|一 【摘 要】数据仓库和数据挖掘技术是信息技术领域的新兴技术,而如何应用到医院的信息化建设 中是医院信息系统(H I S)面临的问题。建立基于H I
2、 S 的数据仓库并使用数据挖掘技术,可以将大 量源数据有效地转化为有用的知识信息,并服务于决策过程。本文结合医院医疗业务提出了系统 实现的解决方案,并 给出了基 于医院医疗业 务数 据仓库 的体系结构 和逻辑模 型,以及基于医院医 疗业务的数据挖掘技术应用方法。【关键词】医院信息系统;数据仓库;数据挖掘;逻辑模型 Ab s t r a c t:Da t a wa r e h o u s e a n d d a t a mi n i n g a r e n e w t e c h n o l o g y i n i n f o r ma t i o n t e c h n o l o g y I
3、 t i s a p r o b l e m t h a t w e mu s t f a c e t o h o w t o u s e t h i s t e c h n o l o gy t o Ho s p i t a l I n f o r ma t i o n S y s t e m(HI S)I f d a t a w a r e h o u s e a n d d a t a mi n i n g a r e u s e d i n HI S,a l o t o f s o u r c e d a t a c a n b e t r a n s f o r me d t o u
4、 s e f u l i nf o r ma t i o n a n d t h e i n b rma t i o n c a n b e il s e d i n t h e d e c i s i o n p r o c e s s T h i s p a p e r p r e s e n t s t h e i n l p】e me n t s o l u t i o n o f H I S b a s e d 0 玎 d a t a wa r e h o u s e,t h e s t r u c t u r e a n d l o g i c o f d a t a wa r e
5、 h o u s e Th e a p p l i c a t i o n me t h o d o f d a t a mi n i n g b a s e d O N HI S i S a l s o d i s c u s s e d Ke y wor ds:HI S;d a t a wa r e h o u s e;d a t a mi n i n g;l o g i c mo d e l G U OQ i n g。G UY a n Ma t h e ma t i c s a n d n f o r ma t i o n c o l l e g e,【中图分类号】T P 3 1 1 5
6、 2;T P 2 7 4 【文献标志码 B G u a n g z h o n g Un i v e r s i t y,G u a n g z h o u【d o i:1 0 3 9 6 9 j i s s n 1 6 7 4-1 6 3 3 2 0 1 0 0 5 0 2 2 G u a n g d o n g 5 1 0 0 0 6,C h i n a 文章编号 1 6 7 4-1 6 3 3(2 0 1 0)0 5-0 0 6 4-0 4 0 引 基于联机事务处理(O L T P)的医院信息系统(HI S)经过多年的使用,累积了大量的历史信息,其容量呈几何 级数增长,这些信息除了在医院
7、的日常业务中发挥重要作 用之外,它还是医院的宝贵财富。如何对大量的历史数据 进行深层次地挖掘,通过信息的分类、整理、分析,从中 发现医疗业务和经营的内在规律,从而为管理人员的决策 提供支持,已成为现代 H I S系统的发展目标。因为以病人 为中心的 H I S系统,除了能协助医院开展高效的医疗服务 之外,还能辅助医院发现医疗业务和管理中的深层次的、潜在的问题,并通过问题的解决,不断提高医院的医疗水 平和管理水平,实现技术、信息和人的全面集成,提高医 院整体水平。基于此,本文将在基于数据仓库的 H I S分析 与设计的基础上,研究数据挖掘技术在医院信息系统的统 收稿 日期:2 0 0 9 0 8
8、 1 4 作者邮箱:g y _ g u y a n y a h o o c o rn c n 计分析与决策中的应用。1 数 仓库技术 数据仓 库是 面向 主题 的、集成 的、随时间变化 的、非 易失性的数据集合,用于支持管理层的决策过程。数据仓 库中的数据不是将业务处理系统中的数据简单集合,而是 对各种 源数 据进行抽 取、筛选、清理、综 合而得到 的数据 集合。数据仓库中所存储的数据不经常进行更新处理,它 主要用 于查询 和分析 。以主题为导向的数据仓库是围绕着医院的基本实体设 计的,如 H I S中数据仓库的设计主题可以医疗业务、病人 结构、病人流动状况、床位占用率、资金流动等情况考虑,它
9、们都是密切联系的,通过数据仓库的建立,可以有利于 实现数据的关系化、规则化,并可提供动态的、多维的数 据统计、分析 和查 询。2 J:数 仓库 的HI S 体系结构 为了充分利用信息的使用价值,并挖掘有用信息,建 立有效的信息框架,进行信息的规范化、标准化是不可或 缺的基础T作。但是,由于 HI S 是一个综合管理信息系统,医疗信息的结构复杂、数量庞大、应用繁杂,导致数据规 范化的工作难度很大,信息的挖掘技术也非常复杂。因此,H I S 一方面应在数据支撑方面,通过对数据的集成,建立 数据仓库,提供数据准备,使 H I S具备一定的决策支持能 力,至少应是一个功能完备的、数据全面的信息报告系统
10、;另一方面,通过使用合适的数据挖掘技术产品,构造一个 实用的决策支持平台。完整的基于数据仓库的 HI S 体系结 构见图 1。T 一 l l 挖 I I 统 计 汇 总 l】统 计 分 析 l l 预 测 和 决 策 _ I数 据 挖 掘 f l f 统 计 与 分 析 工 具 r I l 蔓l I=:l:l l l 数 据抽职 集成、转换、综合、加 载 l 1 f 匿 l_!l业 竺 l l 堕 竺 l 兰 兰 竺 兰 兰l l 三 三!兰 竺 竺l 藿哥 丽 罚 r 嚣 j 军 瞪 砬j蓊 匿 藏 I _ 疆 _祷潭 硬 阿 丽 图 1 基于数据仓库的HI S 体 系结构 3 HI S 数
11、 仓库逻辑f;l 的没汁 逻辑 模型是 对业 务进行抽 象 的工 具。它采 用面 向主题 的方法来有效组织来源多样的业务数据,是构建数据仓库 的重要基础。由于系统的数据是按照决策分析的主题来组 织 的,每个 主题 对应 一个宏 观的分析 领域。因此数据 的逻 辑模 型是 多维数据模 型,这样 可 以用 多维分 析的方 法从多 角度、多层次对数据进行统计分析 2 f。常见的数据模型有:星形模型、雪花模型、星座模型、雪瀑模型等。在 H I S数据仓库 逻辑模 型的设计 中,根据医 院的业务 特点,我们确定了“医疗业务”、“病人”、“药物”、“处方”、“床 位”、“资金”几个主题,在这几个主题中,“
12、医疗业务”主 题将其它几个主题有机联系在一起,因此确定“医疗业务”是数据仓库的主题。根据主题集中涉及的数据信息,选择 医疗业务、资金流动、床位 占用、病人流动为发生事实,并选定 之相关的医疗业务维、病人维、账单维、处方维、药物维、床位维、时间维。HI S数据仓库逻辑模型结构见 图 2 图 2 HI S 数据仓库逻辑模型结构 4 数据挖掘 技术在HI S|1 的应川 4 1 医学数 据挖 掘技术 数据挖掘(D a t a Mi n i n g)是一个多学科交叉领域,它 融合了数据库技术、人工智能、机器学习、统计学、面向 对象方法、信息检索、高性能计算等学科。数据挖掘是从 大量的、不完全的、有噪声
13、 的、模糊的、随机的实际应用 数据中,提取隐含在其中的、事先未知的、潜在有用的信 息和知识的过程。提取的知识表示为概念、规则、规律、模式等形式】。目前主要的数据挖掘方法有统计分析方法、神经网络、机器学习、遗传算法、模糊集法、近似推理等。数据挖掘不一定需要建立在数据仓库的基础上,但基于数 据仓库的数据挖掘能简化数据挖掘过程的某些步骤,提高 数据挖掘的效率,同时能更好地满足高层战略决策的需求。用于 医学数据 挖掘 的数 据虽 然具有一 定 的特 殊性,但 仍遵循一般的知识发现过程,用于医学的数据挖掘不仅能 对过去的数据进行查询和遍历,并能够找出过去数据之间 的潜在联系,从中提取辅助决策的关键性信息
14、。用于医学 的数据挖掘 的步骤 如下:(1)确定挖掘目标 理解医学领域及相关的经验知识,定 义需要解决的问题,从用户角度确定医学数据挖掘的 目标 和结论的评估标准。(2)理解数据 根据数据挖掘的需要,搜索所有与医院对 象有关 的内容和外部的数据信息,完成数据的初步收集,对原始数据进行抽样分析,列出数据属性。(3)准备数据 由于医学数据的冗余性和多样性特征,需 要对原始数据进行审核与整理,并针对各种类型的数据采 取相应的数据预处理方法,并根据数据挖掘方法的 目标和 数据的特征,选择合适的模型,实现数据的转换。(4)数据挖掘 使用合适的数据挖掘算法完成数据分析,2 0 1 0 年第2 5 卷 O
15、5 期 V O L 2 5 N o 0 5 65 这是 医学知识发现过 程中 的一个关 键性步骤。实 现数据挖 掘的方法包括概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析和偏差分析等。挖掘结果在实际运 用中需要反复求证,以检验其合理性。(5)结果分析 对发现的知识进行医学解释,并与最初的 研究目标相比较,其结论对使用者来说必须是可理解的。(6)知识同化及应用 将挖掘结果集成到 H I S的实际医学 过程中,并有计划地实施和控制。医学数据挖掘的流程见图 3。一 一 L 一 图 3 基于数据仓库的HI S 中数据挖掘的流程 4 2 H I S中的数据挖掘与统计分析功能 运用数据仓库
16、和数据挖掘技术,在源数据库和医院联 机事务处理(O L T P)系统的基础上,根据医院管理要求,H I S中的数据挖掘与统计分析功能主要完成医院管理、医 疗服务、经济运行等各种统计信息查询,以便及时了解医 院资源的规划和配置情况、医疗质量信息及经营状况,最 终为医院决策提供第一手信息和科学化根据。具体的功能 见图 4。图 4 HI S中的 数据挖 掘 与统计 分析 功能 结构 图 4 3 H I S中的数据挖掘与统计分析方法 H I S中的数据挖掘与统计分析功能主要完成医院管理、医疗服务、经济运行等领域的各种统计和决策信息的生成 和查询,数据仓库中数据的组织方式为进行这种分析与查 询提供了可能
17、,但仅仅依靠数据仓库并不能完成一些复杂 的分析与查询,因此,为了完成上述功能,可以采用如下 方法:4 3 1统计 汇总。定期 和不定 期地对 历史 数据进行 加 丁汇 总。根据统计需要,统计汇总包括单项统计、复合统计。(1)单项统计 医院单项统计主要指标已达几十种,涉及 医疗工作数量、工作效率、工作质量、经济活动等方而。主要包括:医疗工作质量分析指标、医院工作效率分析指 标等。医院单项统计主要采用描述统计方法,它只对所收 集数据某些现象的内容做出统计加T。具体的描述统计主 要有:平均数 和变 异程度、比和率。平 均数是描 述一组 计 量资料的集中趋势,也称平均水平。在应用中应根据资料 6 6
18、2 0 1 0 年第2 5 卷 0 5 期 V O L 2 5 N o,0 5 的分布特点选择适当的平均数计算方法。一组计量资料除 描述集中趋势外,还应说明其变异程度,也称离散趋势。只有将平均数及变异程度结合才能全面了解资料的分布情 况及特点。最常用的变异指标有:方差、标准差和变异系 数等。比和率虽然都是 由两个相互关联的统计量的比值来 表示,但比和率是不同质的两个指标。(2)复合统计 复合统计指标使指标功能得到增强。它可 以采用综合法和平均法。复合指标与单项指标相比,具有 以下几个特点:较单项指标更为全面、更加综合,增强 了指标的功能,具有对比分析的作用。如床位利用指数、床位疗效指数等。部分
19、复合指标可直接用来评价医院工 作,用于不同医院之间及同一医院不同时期的综合 比较与 分析。如综合指标数、治愈指数、诊断指数等。4 3 2统计分析。实现对资料的多导向、多因素、多层次的 统计分析。统计分析包括统计描述和统计推断两大部分。统计描述是用统计指标、统计表和统计图描述资料的分析 规律及其数量特征;统计推断是以概率论为基础,把数理解 析过程作为主要内容的统计方法,它包括总体参数估计和 假设检验两个内容。参数估计是用样本统计量估计总体参 数所在范围;假设检验是利用样本的实际资料来检验事先 对总体某些数量特征所作的假设是否成立。医院要面临 自负盈亏,实现价值补偿和价值增值,以 取得最佳的经济效
20、益为保障。医院社会效益和经济效益的 评价是建立在大量统计信息基础上的综合指标评价体系,该体系包括:病人主要疾病疗效分析、门诊和住院工作量 分析、床位和设备利用率分析、病人负担程度分析、手术 情况及手术并发症发生情况工作分析、医疗服务质量分析、职 i _q k 绩分析、医院规模分析、医疗管理分析等。4 3 3预测和决策。运用现代数学模型和决策方法,提供 多方式的预测和决策。而向医院的预测和决策模型主要采 用时间序列预测法。该法是将历史数据按时间顺序排列,构成时间序列,并以此为依据,推算现象的未来发展状 况和结果。在面向医院的预测过程中,常用的方法有:利用 趋 势推 测 法进 行 预测、利 用趋
21、势 和季 节成分进 行 预 测。利用该 方法,可用来 预测 医院总收入、门诊人次、住 院人数等。4 3 4数据挖掘。医院数据仓库是一个复杂 的数据集,它包 括电子病历、医学影像、病理参数、化验结果等数据。因 此,需要结合医学信息自身具有的特殊性和复杂性,确定 挖掘过程 中所需要 的技术。利用聚类分析方法,可以进行医疗费用的分析。采用 神经网络模型可以对出院病例的医疗费用进行统计学分析。利用数据关联分析方法,可以对 H I S中相关信息进行分析、挖掘,对药物的用量、耐药性、联合用药、疗程、预防用 药、用药途径及治疗效果等指标实行 自动监控,从而实时、住院人数预测一 门诊人诜预测一 医院规模预测
22、一 医院 总 收 八预测 诊断 指 数 一 治愈指数一 床位 疗效 指 数 床位 利用 指 漱 有效地监测药物使用情况。利用决策树分析法可以形成恶 意配药训练模型,用此模型在线监测医保人员配药情况,并将监测结果输 出给医院药房配药人员,使药房配药人员 能够及时发现、制止恶意配药行为的发生。利用 C HA I D方 法,可从病例 自动提取诊断规则,以辅助疾病的诊断和研究。采用 A R I MA模型、B P神经网络模型、G M(1,1)模型对某些 发病率进行预测分析。利用数据挖掘技术中的聚类和孤立 点等分析方法分析医生用药的不合理性和其它 目的。利用 人工神经网络方法可以完成分类、聚类、关联规则挖
23、掘等 多种数据挖掘任务,从而能够找出某些药物与疾病发作的 关系。A p fi o fi关联分析模型可以作为医生的辅助工具,揭 示两种疾病之间的真正关系,利用该算法还可以对医院门 诊病人并发症的挖掘。基于粗糙集理论的规则产生模型可 以自动发现临床数据库中的正例和反例知识。利用进化算 法从任一初始的群体 出发,通过随机选择、交叉和变异等 过程,使群体进化到搜索空间中越来越好的区域,从而实 现对某些症状疾病进行诊 断和分类。5 结 求 随着 H I S的不断完善和医院信息的不断积累,如何利 用数据挖掘技术构造先进的医疗诊断和管理决策支持系统,这将对提高医院的医疗水平、充分发挥数字化医院的效能 具有重
24、要的意义。而 H I S充分利用数据挖掘技术和统计方 法,从医疗数据和经济数据中挖掘出相关的内在规律,使 整个 H I S脱离了简单的查询、报表和图形模式,从而对决 策支持具有更深层次的作用。f 参考文献】【1】陈京民,等 数据仓库与数据挖掘技术【M】北京:电子工业 出版 社 2 0 0 2 【2】王珊,等 数据仓库技术与联机分析处理【M】北京:科学出版 社 1 9 9 8 【3】苏新宁,等 数据仓库和数 据挖 掘【M】北京:清华大学 出版 社 2 0 0 6 【4 1 L o u Ag o s t a Th e E s s e n t i a l Gu i d e t O Da t a W
25、a r e h o u s i n g M Up p e r S a dd l e R i v e r:Pr e nt i c e H a l l,1 9 9 9 5】W i l l i a m A Gi o v i n a z z o Ob j e c t Or i e n t e d Da t a W a r e h o u s i n g De s i g n M Up p e r S a d d l e Ri v e r:P r e n t i c e Ha ll,2 0 0 0 【6】周 鸾杰,等 数据挖掘可视 化技 术与 医院管理U】医疗设备信 息,2 0 0 6(3):2 3-2
26、 4 7 1 吴进军,等 1 0 种 系统疾病住 院医疗 费用 q L o g i s t i c S 析U】中国 医院 管理 2 0 0 0(4):3 1 3 2 【8】赵应征,等 人工神经网络在药学研究中的应用进展 解放 军 药学学报,2 0 0 3(6):4 8 5 0 【9】武森 数据仓库与数据挖掘【M】北京:冶金工业 出版社,2 0 0 3 【1 0】杨 海清 数据挖掘技术在 医院管理中的应用U】中华 医院管 理杂志,2 0 0 5(7):4 9 7 4 9 9 【1 1】姜代红 数据挖掘及其在HI S 系统 中的应用U 电脑与信息技 术,2 0 0 4(2):5 5 5 7 圈 一
27、k _ 4 垂第8 r,页 诊断乙型肝炎病人脂肪肝不可靠。对于临床医生,超声检查只能给予“亮肝”的提示,任何报告脂肪肝、纤维化或肝炎都应该理解为肝脏出现了 病理改变。4 结 论 笔者发现常规肝脏超声检查没能为乙型肝炎患者提供 准确的脂盼肝诊断。临床医生应慎重看待超声报告的脂肪 肝,脂肪 肝 的报 告 可能提示 肝炎、纤 维化、脂 肪肝 或者几 种情况并俘。相反,超声未发现脂肪肝的表现并不能排除 脂肪肝。目前,肝脏穿 刺活检 仍然是 诊断慢 性肝炎 病人肝 脏脂肪变性 的最佳方法。【参考文献】【1】Ra ma l h o F He p a t i t i s C v i r u s i n f
28、e c t i o n a n d l i v e r s t e a t o s i s J】An t i v i r a l Re s,2 0 0 3,6 0(2):1 2 5 7 【2 J Mo n t o A,A l o n z o J,W a t s o n J J,e t a1 S t e a t o s i s i n c h r o n i c h e p a t i t i s C:r e l a t i v e c on t r i bu t i o ns o f obe s i t y,di a be t e s me l l i t us,a nd a l c o h
29、o l J He p a t o l o g y,2 0 0 2(3 6):7 2 9 7 3 6 3】F o n t a n a R J,L o k A S No n i n v a s i v e mo n i t o ri n g o f p a ti e n t s w i t h c h r o n i c h e p a t i t i s G】He p a t o l o g y,2 0 0 2(3 6):5 7 6 4 【4 K u t c h e r R,S m i t h G S,S e n F,e t a 1 C o m p a ri s o n o f s o n o
30、g r a ms a nd h v e r hi s t o l o g i c fi nd i ng s i n pa t i e n t s wi t h c h r on i c h e p a t i tis C v i r u s i n f e c t i o n J Ul t r a s o u n d Me d,1 9 9 8(1 7):3 2 1 3 2 5 【5】v B j O r o K,Be l l H,He l i u m KB,e t a 1 E f f e c t o f c o mb i n e d i nt e r f e r on一 i nd uc t i
31、on t he r a py a nd r i ba v i r i n on c hr on i c h e p a t i ti s C v i r u s i n f e c t i o n:a r a n d o mi z e d mu l t i c e n t r e s t u d y J S c a n d J Ga s t r o e n t e r o l,2 0 0 2(3 7):2 2 6 2 3 2 6】沈卫东,邹大鹏,刘鹏飞,等 家兔脂肪肝的超声定量分析与肝 血流动力及 临床指标 的关系U】中国超声 医学杂志,2 0 0 9(6):5 3 6-5 38 7】闫国珍,段云友,阮骊韬,等 肝 纤维化 患者无创 定量超 声评 分与临床评分之 间的关系U】中华超 声影像学杂志,2 0 0 6(8):5 8 8 5 9 0 圈 2 0 1 0 年第2 5 卷 O 5 期 V O L 2 5 N o 0 5 8 7