《数据分析系统在医院信息系统中的应用.pdf》由会员分享,可在线阅读,更多相关《数据分析系统在医院信息系统中的应用.pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 463数据分析系统在医院信息系统中的应用 数据分析系统在医院信息系统中的应用 陈宁 陈玲 张志强 广州市红十字会医院,510220,广州市同福中路 396 号 关键词关键词 医院信息系统 数据仓库 多维分析 摘 要摘 要 医院信息系统在不断的建设和完善中产生了大量的数据,对数据的利用将成为信息系统建设的热点。通过对历史数据进行整合,集成目前应用系统数据源,按照医院的管理需求和主题抽取、转换和装载数据,实现医院管理者对数据多侧面观察应用。采用阡陌数据分析系统及其集成方案,对需要分析的事实数据表以及相关的维度信息表进行分析,组成了不同的分析主题,实现了数据仓库在医院数据查询、统计分析、医疗质量分
2、析、工作效率评估等多方面的应用,取得了满意的效果。医院信息系统建设经过多年的探索不断发展和完善,目前,一些典型应用已经成熟,从财务管理、检验管理、医技管理、统计分析到临床信息系统,几乎覆盖了医院的各个工作流程,目前,信息系统在医院的应用不断深入和拓展。在系统建设过程中,各应用系统积累了大量的数据,但系统原有的统计功能已不能满足管理者对数据的需要,管理者除需要随时获取患者、资金、物流、工作量和医疗质量等方面的数据、指标和报表外,还需要采用复杂的统计分析方法和数据挖掘技术在各个侧面观察海量的历史数据。对数据的应用将成为信息系统的热点。数据仓库是面向主题的、集成的、稳定的、并且随时间变化的数据集合,
3、用来支持管理人员的决策。数据仓库技术为历史数据的分析和处理提供和很好的工具和方法。我院自2006 年初开始着手进行医院数据仓库的探索,到 2006 年底初步建成并投入使用,并逐步完善,取得良好的效果。1 目标 1 目标 1.1 历史数据整合,数据清洗与转换 1.1 历史数据整合,数据清洗与转换 我院自 1996 年开始信息系统建设,其间,从最开始的 DOS 操作系统,FOXBASE 数据库,到现在的 windows 系统,MSSQL 数据库,系统几经升级更换,系统应用不断拓展,系统覆盖范围越来越广。在系统切换后,因为数据结构变化,以前系统积累下来的历史数据查询困难。需要对原有系统数据进行清洗转
4、换,和现有系统 464进行数据整合。1.2 集成各应用系统的数据,做成统一的查询分析途径 1.2 集成各应用系统的数据,做成统一的查询分析途径 目前我院信息系统建设比较全面,含门诊、住院、药品、财务、物资、统计等多个子系统。各系统数据关联性小,各系统间的数据不能进行关联的分析,进行报表查询只能在具体的系统中进行,且数据查询耗费大量的系统资源。关键是各系统的统计口径并不一致,得出来的结果不尽相同,使用户对数据的可靠产生怀疑。需要寻找一套易于使用的、能够完成集成数据分析的软件解决方案。1.3 进行数据仓库主题探索 1.3 进行数据仓库主题探索 通过信息系统建设过程中,对医院管理者和中层干部对数据需
5、求的分析,发现用户对数据的观察角度不一致,对数据的应用具有共性。需要对用户的数据需求进行归纳,归纳成为不同的主题,按照主题而不是报表提供给用户使用。对该主题的查询提供多侧面查询,且可以由用户自主定义查询方式以进行分析。为实现以上目标,我们对比了市场上的数据仓库系统,最终决定系统采用阡陌数据分析系统及其集成方案,阡陌数据分析系统是基于数据仓库和 WEB 服务器的商业智能系统。阡陌数据分析系统具有操作简单、构建迅速、功能强大、扩展性好的特点。2 系统架构 2 系统架构 阡陌数据分析系统包括数据源、数据仓库数据库、模型设计器、WEB 服务器及应用服务器、基于 WEB 的前端用户交互界面组成。465
6、图 1 阡陌数据分析系统 2.1 数据源2.1 数据源 是数据仓库系统的基础,,是数据仓库系统的信息来源,包括内部各应用系统产生的数据,也包括必要的外部数据源。对于我院来说,数据源主要包括原 HIS 系统数据库、目前 HIS 系统数据库、省厅病案统计系统数据库、人事数据库、经济核算数据库等。2.2数据仓库数据库2.2数据仓库数据库 是整个数据仓库系统的核心,负责数据仓库中海量数据的存贮和管理。在这里数据仓库数据库本质上依然是关系型数据库。与应用系统不同的是,其数据是按主题来组织的。从各应用系统的数据中提取出有用的数据并进行清理,以保证数据的正确性,然后经过抽取、转换和装载,即ETL过程,合并到
7、一个企业级的数据仓库里,从而得到医院数据的一个全局视图。我院数据仓库系统采用MSSQL来实现。2.3模型设计器 2.3模型设计器 供系统开发人员或数据库管理员使用,用来建立或者配置商业模型。主要功能是:其一,针对关系型数据库建立多维模型,把企业数据库中需要分析的事实数据表以及相关的维度信息表提取出来,经过建立表之间的联系,筛选数据表的字段,定义这些字段的属性,如中文名称、维或指标,及建立时间维等操作,把数据表整理成直观的、466最终用户可以理解的多维模型;其二,配置连接到其他OLAP 服务器的信息,引入其中定义好的多维模型。这个多维模型就是报表制作以及数据分析的基础。2.4企业服务器2.4企业
8、服务器 包括WEB服务器和阡陌数据分析应用服务器,是系统应用的核心模块。用来处理用户请求、数据计算、报表管理、数据存储,与企业的数据库或者OLAP 服务器进行交互等工作。2.5基于WEB的前端交互界面2.5基于WEB的前端交互界面 为最终用户提供交互界面。为交互式分析提供了基于浏览器的,强大的,用户友好的环境。为最终用户提供了全面的分析功能,包括制作报表,数据挖掘,统计分析,集合分析和时间序列分析。其报表设计器,编辑器与向导,使最终用户可以创建简单报表,或参数驱动报表。系统直接向应用服务器发送请求,在那里将这些请求转化为优化的数据库查询。然后把查询结果按要求展示出来。3 系统功能 3 系统功能
9、 3.1 多角度,任意角度查看企业数据 3.1 多角度,任意角度查看企业数据 各应用系统产生的数据往往是多维的。如:用药品用量分析,包含了开方时间、药品名称、类别、科室、医生、诊断、患者姓名、患者性别、患者年龄、用药数量、药品金额等。用户在分析用药情况时,由于侧重点的不同,所要分析的因素也会因此有所不同,阡陌数据分析系统提供了灵活的方式,使用户可以从各个角度来查看企业的数据。例如,用户可以从疾病的角度来分析,某一疾病由哪些医生看过,开了哪些药,也可以从医生的角度来分析,某一医生诊过什么病、开过什么药。3.2 向上向下钻取分析数据 3.2 向上向下钻取分析数据 阡陌数据分析系统提供了钻取分析的功
10、能,通过对某一行汇总数据进行细分来分析数据。例如,在做门诊量分析时,可以对某一年度的门诊量细分为各个季度或月份的门诊量,再继续细分到每一个医生的门诊量。通过钻取的功能,使用户获得对数据的更深入了解,更容易的发现问题,做出正确的决策。3.3 旋转查看数据 3.3 旋转查看数据 为了方便用户更直观的查看分析数据,阡陌数据分析系统支持数据的旋转功能,用不同的视角来查看数据,对于一些数据,通过旋转功能,看起来可以更加直观,例如在医疗收入分析中,各科室各年度的增长量情况,把年份作为旋转维度,则同科室不同年度的数据以及增长量将在一行显示,看起来更容易理解。3.4 切片,切块3.4 切片,切块 通过切片,切
11、块功能,用户可以对数据进行过滤,专注于某一方面的问题,例如,用户通过拖拽的方式很容易的得到如“某一科室某一年度的医疗收入”的数据。4674 数据源分析 4 数据源分析 4.1HIS 数据源 4.1HIS 数据源 由于 HIS 系统经过几次升级和更新,原系统和目前运行的系统数据结构有较大的差异。就是现在的系统,为了提升速度,也对数据进行了拆分,分成了当前库和历史库,在当前库中又分了当前表和年表,分析不易。因此,我们把 HIS 数据源分成二部分处理,一是当月数据,直接以当前的 HIS 数据库为数据源,只作较为简单的和必要的查询,二是隔月数据,定时导入到数据仓库中,数据仓库数据库在物理上与在线处理系
12、统分离,这样,做大数据量分析的时候就不会影响到在线处理系统的运行。4.2 统计病案数据源4.2 统计病案数据源 病案统计数据经过病案和统计人员层层把关和核对,数据比较完整,特别是病案首页信息,数据质量比较高,可以直接作多维分析的数据源。但是因为系统经过几次升级,病案统计中有一套独立的科室、病区、人员编码,与当前系统不同,无法与当前的 HIS 数据进行对比分析,我们采用定期把病案统计系统中的数据转入到数据仓库的方法来解决。5 主题应用 5 主题应用 5.1 一般主题分析5.1 一般主题分析 此类应用侧重点在医院组织架构的层次维度(医院各业务科室、人员)、时间层次维度(年/季度/月/时段),通过对
13、工作量、医疗收入、门诊诊次费用、住院病床使用情况、用药情况等量度进行汇总分析、占比分析、同期分析、累计分析、平均分析、排行榜分析、环比分析。提供多个视野角度由汇总到明细的层层分析,便于医院管理层和各科室主任及时掌握医院和科室的工作状况。468 图 2 多维分析模型涉及的维度、量度、分析方法 5.1.1 门诊医疗分析 5.1.1 门诊医疗分析 维度:时间、科室、医生。度量值:门诊量、医疗收入、药品收入、诊次费用。5.1.2 住院医疗分析 5.1.2 住院医疗分析 维度:时间、科室、医生。度量值:出院人数、住院床日、医疗收入、药品收入、床天费用。5.1.3 住院收入分析 5.1.3 住院收入分析
14、维度:时间、科室、医生。度量值:按财务大项分类。5.1.4 用药分析 5.1.4 用药分析 维度:时间、科室、药品(一级分类、二级分类)。469度量值:数量、金额。5.1.5 项目收入分析 5.1.5 项目收入分析 维度:时间、科室、收费项目(项目类别)。度量值:数量、金额。5.2 统计报表 5.2 统计报表 此功能是与省卫生厅统计信息系统相联,把省厅统计信息系统中的数据作为数据源,把其中的一些报表移植过来,做进一步的查询和分析。主要有:医院工作报表(门诊部分),医院工作报表(住院部分),医院出院病人疾病分类报表,医院出院病人疾病年龄构成报表,医院出院病人手术分类报表,医院出院病人病人来源报表
15、,医院出院病人部分病种报表,医院经济效益报表。这些报表转入后也可以按时间、科室作为维度,以相应的指标作为度量值进行多维分析。5.3 专题分析 5.3.1 多元函数变量因素分析 5.3 专题分析 5.3.1 多元函数变量因素分析 多元函数变量因素分析是描述各因素对事物影响程度的统计方法,强调了因素间影响程度的主次,可找出影响变量变化的主要原因。应用多变量因素分析法,对医院医疗收入状况进行分析,以了解相关因素对医疗收入的影响。5.3.2 科室医疗质量综合评价分析(TOPSIS 法)5.3.2 科室医疗质量综合评价分析(TOPSIS 法)在医院的医疗质量评价中,被评价的各指标之间往往出现此好彼差的现
16、象,因此,就必须采用客观、可行、定量、准确的多指标综合评价方法。利用 TOPSIS 分析法,把表示医院医疗质量的指标:治愈率、病死率、病床周转次数、病床使用率、平均住院日、入出院诊断符合率、危重病人抢救成功率、无菌手术感染率等指标。组成多指标综合评价体系。通过归一化处理后找出各项指标的最优和最劣向量,然后通过计算各指标与最优向量和最劣向量之间的距离。求出各指标与最优指标的相对接近程度,计算出综合评价体系的总评分,以此来对科室的医疗质量指标进行综合评价。5.3.3 科室病床利用情况的综合评价(RSR 法)5.3.3 科室病床利用情况的综合评价(RSR 法)选用科室病床使用率、病床周转次数、平均病
17、床工作日、出院病人平均住院日 4 个常见统计指标组成综合评价指标体系,采用秩和比(RSR)法进行综合评价分析,并得出 RSR 质控图。RSR 值反映被评价科室之间得相对优劣程度,RSR 值比较接近,表明被评价科室的水平相当,RSR 值差异较大,表明被评价得科室病床使用情况存在较大差异。5.3.4 引入病床工作效率分析科室病床配置是否合理 5.3.4 引入病床工作效率分析科室病床配置是否合理 根据任一时间段的 RSR 质控值、实 470际占用总床日数、出院人数、平均开放病床数,给定病床工作效率的控制值,得出开放病床数的合理区间,作为科室配置病床数的科学依据。6 结语 6 结语 数据仓库技术引入医
18、院信息系统,从根本上改变了原来的报表方式,由原来被动的、固定的报表模式,到现在可跟据自已的想法,从现有的模型中主动挖掘出自已想要数据,能够充分挖掘医院信息系统的信息资源,提高医院信息系统的应用分析水平。数据仓库应用是一个不断深入、不断完善的过程,完成了一个主题,一个应用,又会提出更多的应用需求。我们目前仅仅仅是初步的应用,已经取得了令人兴奋的效果,接下来我们将对病人信息分析,医疗信息分析、绩效评估等方面进行更深入的研究和实践。参考文献 参考文献 1 叶明全,宋念东.基于 HIS 的医院数据仓库设计与实现.计算机工程与设计,2008,(03).2 胡素芳,刘芳.数据仓库技术在医院管理及决策中的应用.医学信息,2007,(07).3 刘丽华,周忠彬,金水高.基于数据仓库技术建立医院统计数据资源库的应用研究.中国医院统计,2005,(03).4 刘志敏,董军,曹秀堂.数据集市医院数据仓库应用中的选择.医疗卫生装备,2005,(08).