基于数据仓库的医院决策支持系统的研究与设计.pdf

上传人:asd****56 文档编号:70467373 上传时间:2023-01-19 格式:PDF 页数:4 大小:218.24KB
返回 下载 相关 举报
基于数据仓库的医院决策支持系统的研究与设计.pdf_第1页
第1页 / 共4页
基于数据仓库的医院决策支持系统的研究与设计.pdf_第2页
第2页 / 共4页
点击查看更多>>
资源描述

《基于数据仓库的医院决策支持系统的研究与设计.pdf》由会员分享,可在线阅读,更多相关《基于数据仓库的医院决策支持系统的研究与设计.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、总第246期2010年第4期计算机与数字工程Computer&Digital EngineeringVol.38 No.4142基 于 数 据 仓 库 的 医 院 决 策 支 持 系 统 的 研 究 与 设 计3俞 磊 杨松涛 王宗殿(安徽中医学院医药信息工程学院 合肥 230031)摘 要 在医院原有信息系统HIS的基础上,综合运用数据仓库(DW)、联机分析处理(OLA P)、数据挖掘(DM)等新兴技术,搭建了一个完整的医院决策支持系统。清楚简明的介绍了系统的体系结构和总体实现,并对DW、OLAP和DM等关键部件的设计作了详尽的探讨。关键词 决策支持系统;数据仓库;联机分析处理;数据挖掘中图

2、分类号 TP311.132Research and Design of the Decision Supporting Systemof Hospital Based on Data WarehouseYu LeiYang Songt aoWang Zongdian(Institute of Medicine and Info rmation Technology,Anhui University of Traditional Chinese Medicine,Hefei230031)Abs tractThe new technology of data warehouse(DW),o n2l

3、ine analytical processing(OLA P)and data mining(DM)is comp rehensively used to develop a complete decision supporting system of hospital,which is based on the old hospital in2fo rmation system(HIS).The system structure and overall realization is clearly and concisely introduced,and the design ofsome

4、 key components of DW,OLA P and DM is discussed in detail.Key Wordsdecision supporting system,data warehouse,on2line analytical processing,data miningClass NumberTP311.1321 引言近年来,国内医疗市场竞争日趋激烈,社会对医疗质量、医院工作效率和服务质量的要求越来越高,医院信息系统 12(hospital information sys2tem,HIS)有助于医院各类资源的系统整合,对提高医院的事务处理水平产生了积极的促进作用。

5、但随着管理和临床数据的大量积累,HIS原有相对简单的统计功能已不能满足人们日益增长的需求。人们需要随时获取患者、资金、物流、工作量等方面的数据、指标和报表,需要采用复杂的统计分析方法和数据挖掘技术反复处理海量历史数据以便从中总结出临床医学和医院管理方面的新知识。于是以医院数据仓库为基础的医院决策支持系统建设已成为数字化医院建设的一个新的发展方向。本文便在安徽中医学院第一附属医院原有HIS的基础上,综合运用数据仓库DW、联机分析处理OLAP、数据挖掘DM等新兴技术,提出了一个完整的决策支持系统DSS设计方案。2 医院决策支持系统的体系结构本系统采用的是基于DW的DSS这一新型框架结构。具体结构如

6、图1所示,分为四层 3:最底层为数据获取层,数据源主要包括患者信息、药品信息、门诊信息、住院信息以及一些外部数据。外部数据主要包括竞争数据及国家的相关政策法规等,其它信息来自医院信息系统HIS。为保持数据一致性,必须对数据源中的数据进行清理、抽3收稿日期年月日,修回日期年月日基金项目 安徽中医学院校级研究项目(编号z)资助。作者简介 俞磊,女,硕士,助教,研究方向 决策支持系统、数据挖掘。杨松涛,男,硕士,副教授。:20091118:20091228:lgc200921:2010年第4期计算机与数字工程143取、转换,生成综合性统一的数据类型存入医院DW。数据存储层主要用来存储和管理加工处理后

7、的面向决策主题的综合性数据,并按决策主题的需求进行重新组织,为决策支持提供大量的数据依据。数据处理层包括模型库、数据挖掘、OLAP及其相应的管理系统部分。通过OLAP与DM从DW中得出有用的信息和知识。数据访问层为决策者提供与系统交互的入口。把数据处理层得到的信息和知识通过人机交互界面展现给用户,主要包括用户交互、格式化查询及报表和统计图的生成等。图1 医院决策支持系统的体系结构3 医院决策支持系统的设计与实现本系统采用Windows XP下的后台服务器/中间服务器/客户端三层结构。其中后台服务器利用Microsoft SQL Server 2000来设计、存储和管理医院DW;中间服务器采用M

8、icro soft SQL Server2000自带的Analysis Services,用来创建基于医院DW的OLAP多维数据集和DM模型;客户端为人机交互界面,采用PowerBuilder开发。3.1 数据仓库DW的设计3.1.1 数据建模在设计DW之前,必须先确定主题。主题是一个在较高层次将数据归类的标准,它能反映出分析对象所涉及的各项数据以及相互联系。经过对医院业务的仔细分析,我们确定了三个基本主题:患者主题、药品主题、费用主题 4,其中每个主题又可以划分为若干个子主题。各主题的详细内容如表1所示。表1 医院数据仓库中各主题详细内容主题名称 子主题名称 内容患者诊治方案时间、科室、医生

9、、医嘱、处方、治疗效果等患者分布时间、科室、地区、职业、年龄、性别、既往病史等药品药品采购时间、药房、药品、供应商、采购员等药品销售时间、药房、药品、患者、处方、医生等费用门诊费用时间、科室、患者、病因、费用等住院费用时间、科室、患者、病因、费用等 接下来,根据不同的分析主题,确定描述各个主题中可用于分析与决策支持的相应指标,即多维数据模型的事实表,并根据各个指标的约束因素,确定多维数据模型的各个维。以“门诊费用”主题为例,它含有时间维、科室维、疾病维、费用类别维四个维,形成了“门诊费用”分析的不同角度(某段时间、某个科室、某种疾病和某类收费)。事实表由这四个维的主键和一个度量值即“门诊应付费

10、用总计”组成。一个事实表与四个维表联系起来构成了一个四维分析空间。下面,对其进行逻辑结构设计。医院决策支持系统的数据仓库采用星型模型,每个子主题对应一个星型模型结构。星型模型由一个事实表和多个维表构成。比如对“门诊费用”这个子主题,其星型模型结构如图2所示。图2“门诊费用”主题的星型逻辑模型3.1.2 数据集成确定了DW的数据模型之后,下一步就是把源数据集成到DW中,具体的分为数据抽取、数据清理、数据转换和数据加载这四个步骤。其中数据抽取主要是通过网络把从IS中提取出的数据传输到系统DW中。要完成以上工作,需利用M 2Hi144俞 磊等:基于数据仓库的医院决策支持系统的研究与设计第38卷cro

11、soft SQL Server 2000的数据转换服务DTS包组件,在包中指定源数据与目标数据间的映射关系,把数据转换和导入导出过程保存在存储过程中,让服务器自动、定期的执行。3.2 联机分析处理OLAP的设计OLAP是基于DW的信息分析处理过程,主要是通过切片、切块、钻取(上卷、下钻)、旋转56 等方法来进行面向数据的查询、分析、归纳和总结。实现OLAP的基础是建立多维数据模型。在本系统中,多维数据模型的建立非常简单:首先连接医院DW作为分析系统的数据源,然后根据DW中的维表和事实表,利用Microsoft SQL Server 2000中的多维数据集创建向导或维度编辑器来创建共享维度与专用

12、维度,并定义维度的层次关系,这样就建立了用于决策分析的多维数据模型。多维数据模型物理实现主要有三种方式:基于多维数据库的MOLAP、基于关系表的ROLAP和前两者混合的HOLAP5。这里选用ROLAP方式,因为此DSS是建立在原有医院信息系统HIS基础上,而HIS中数据都是以二维关系表形式存在的。有一点需要提及的是:为了更好地实现人机交互,可通过Microsoft SQL Server 2000的OLAP接口透视表服务(pivot2table service)把数据从分析服务器传送至客户端,在客户端产生多维数据集文件,从而模拟OLAP进行多维数据分析。在本系统中,OLAP分析主要概括为以下几个

13、方面:疾病分析:各类疾病的季节和地域分布情况及医疗费用分析。患者分析:患者的地区分布、年龄分布、公费医疗比例及就诊时间情况。门诊分析:各时间段内的门诊人次、住院人次、床位周转率以及医生出诊情况。药品分析:每类药品的金额、消耗数量以及利润情况等。科室分析:对各科室不同时期的产生费用(挂号费、化验费、医药费等)进行比较分析 7。以上分析的结果可有多种方法展示:如果决策人员想查阅具体详细的数据则可选用多维报表显示,即通过不同的维、维的不同层次组合展现;如果想查看各种因素对问题的影响及问题的发展趋势等,则可选用饼图、柱状图、曲线图等表示。3 3 数据挖掘DM的设计DM可以利用OL的分析结果,可以拓展O

14、LAP分析的深度,可以发现更为复杂、细致的信息,其设计的重点是挖掘方法的选择及挖掘出知识的表示。目前已形成多种DM方法(分类、聚类、关联、决策树、神经网络等)和多种知识表现形式(规则、决策树、知识集、网络权值、公式、案例等)5,它们均有各自的优点和不足。由于Microsoft SQLServer 2000只提供了决策树和聚类两种挖掘模型,所以这里选用专门的DM工具SPSS Clemen2tine,它是目前应用最广泛的统计软件之一。本系统对数据的挖掘主要在以下几个方面:关联分析利用关联规则可以从数据仓库中分析某种疾病治疗过程中诱发其他疾病的概率以及与时间的关系等。这里挖掘算法可采用Ap rior

15、算法。聚类分析聚类是将选定的数据对象分成若干个簇,使得簇内的数据相似度高,而不同簇中的数据相似度低。利用聚类分析可以对某些疾病的前兆特征进行分析,发现多种疾病之间的并发关系等,还可分析患者的来源分布、职业分布和年龄分布等,以便能够有针对性地采取 些措施来提高医疗服务质量。离群点分析离群点是指在数据集中存在的不符合数据一般模型的数据对象,一般被视为噪声或异常而丢弃,然而在某些医学应用中罕见的病例可能比正常出现的病例更有用。通过对疾病特征的聚类分析,可以辅助给出诊断结论,但可能有些患者的某些病征不属于我们前面划分的任何簇,对这种情况就要及时反映给有经验的上级医生,进行进一步的观察和诊断,以防止给出

16、错误的治疗方案8。4 结语本文在医院原有信息系统HIS的基础上,综合运用DW、OLAP、DM等新兴技术,搭建了一个基于DW的医院决策支持系统。该系统利用DW存储和管理医院中日益庞大的业务数据,利用OLAP从各个角度、各个层次对业务数据进行准确分析,并通过DM技术挖掘出深层次的信息知识。随着数据的进一步采集与整理以及挖掘算法的不断完善,必能为医院疾病诊断和治疗、医院管理决策等带来极大的方便和可观的效益。参 考 文 献王徐冬,杨希武 数据仓库与数据挖掘在医院信息系统中的应用 医院数字化,().AP1.J.2008 29 8:47492010年第4期计算机与数字工程1452吕英华,马静.数据仓库技术

17、在医院信息系统中的应用J.医院数字化,2009,30(4):48493黄淑芹,曹杰.电力营销DSS体系结构的研究与设计J.通化师范学院学报,2007,28(8):37384叶明全,宋念东.基于HIS的医院数据仓库设计与实现J.计算机工程与设计,2008(3):7797815高洪深.决策支持系统(DSS):理论方法案例M.北京:清华大学出版社,20056 杨帆,秦银河,董军,等.数据仓库技术及其在医疗质量信息分析中的应用J.第三军医大学学报,2005,27(5):4514537 刘佳,兰顺碧,张晓祥,等.数据仓库与数据挖掘在医院信息管理中的应用J.医学与社会,2006,10(4):53568 李

18、雯娟,曾照芳,陈睿.基于医学信息数据仓库模型的数据挖掘J.生物信息学,2009,7(2):146149(上接第117页)点所处的位置及灰度高度,跟临近节点的平滑关系,可以处理一些灰度分布不均匀的图片能准确的通过和附近其他区域的平滑关系得到较好的分离结果。4 仿真实验为了验证此方法的有效性,采用对一幅模糊的神经元灰度图片进行仿真实验,图6(a)为一幅神经元细胞的原始图像,从中可知,该图像背景模糊不清,边缘不明显,背景亮度不均匀,很难进行目标分离。首先对此图进行分水岭处理,对图6(a)得到的分水岭分离变换如图6(b),然后对分水岭后获得的子区域进行灰度值统计,并获得邻接矩阵,根据邻接矩阵及灰度值参

19、数进行山顶山谷区域选择得到结果6(c),最后将为分类的区域分成连续的节点链,对每个连续节点链进行反复迭代平滑合并处理可得到最终的目标分离结果如图6(d)。对比图6(e)为采用Otsu全局阈值分割7 的目标分离结果图。通过实验证明该方法能忠实于原图,符合人眼对目标物体的判断,能取得目标物体的完整边缘。5 结语本文针对在图片处理过程中,往往会遇到一些边界模糊背景不均匀的灰度图像,这些图像难以寻找到准确的物体边界,在文中采用一种先利用形态学分水岭方法找到区域边界,然后逐渐将区域合并,最终获得目标图像的方法。通过实验证明此方法在提取目标方面能获得很好的效果。另外利用文中所采用的区域合并思想,也就是根据

20、各区域的参数特征及和邻近区域的位置关系,亦可用于提取目标的某一部分,总体来说区域合并的思想很适合寻找物体的轮廓线,本文中的方法稍加修改就可以得到不同的图像结果以用于不同的后续图像处理。参 考 文 献 王国权 基于分水岭算法的图像分割方法研究计算机仿真,6(5)5552 王鑫,罗斌,宁晨.一种基于小波和分水岭算法的图像分割方法J.计算机技术与发展,2006,16(1):17223 崔屹.图像处理与分析 数学形态学方法及应用M.北京:科学出版社,2002:75784 林开颜,吴军辉,徐立鸿.彩色图象分割方法综述J.中国图象图形学报,2005,10(1):1105 陈琳,等.基于分形和分水岭的图像分

21、割方法J.计算机应用与软件,2008,25(8):2272286 薛景浩,章毓晋,林行刚.SAR图像基于Raleigh分布假设的最小误差阈值化分割J.电子科学学刊,1992,21(2):2192257 Y.J.Zhang,J.J.Gerbrands.Objective and quantita2tive segmentatio n evaluation and comparisonJ.SignalProcessing,1994,39(11):43548 Fabien Salzenstein,Christop he Collet.Fuzzy MarkovRandom Fields versus Chains forMultispectral ImageS ITOU2yMI,6,()5361.J.2009 2:22 8egmentation J.EEEransactionsil Paem Analsis andachinentelligence 2002811:1717 7

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 其他杂项

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁