《医疗保险信息系统的数据仓库与数据挖掘研究.docx》由会员分享,可在线阅读,更多相关《医疗保险信息系统的数据仓库与数据挖掘研究.docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医疗保险信息系统的数据仓库与数据挖掘研究 摘 要:数据处理技术是当前许多信息系统之中的一种重要的应用性技术,借助优质的数据处理技术,可以对重要数据信息进行高效率以及高质量地处理工作。医疗保险信息体系构成比较困难且其内部数据具有较强的分散性,数据处理人员很难在规定的时间之内完成处理数据的任务,而新型的数据挖掘技术与数据仓库可以对处理医保信息到良好的促进作用,将数据挖掘技术与数据仓库这种存储性技术结合运用,可以达到完善医保信息系统建设工作的目的。本文依据对构建医保信息系统的阅历,对数据挖掘技术与数据仓库的技术概况以及应用状况进行分析。 关键词:医疗保险信息 数据仓库 数据挖掘 应用探讨 在信息时代
2、的影响下,各行各业的工作重点任务之中都被添加了信息系统建设的工作,而在企业竞争活动之中,具有极强的实效性的信息也渐渐成为企业的关键竞争元素。人们对信息进行处理的方式也在被不断改进,数据仓库是一种应用价值比较高的信息存储载体。数据本身的价值不高,但是经过处理之后,数据被给予了信息的意义之后,其价值倍增。数据挖掘技术是一种可以提升数据价值的有效技术手段,本文以医疗保险信息系统为分析案例,对新型的数据仓库以及数据挖掘技术的应用状况进行分析。 一、医保信息处理工作分析 分析两种处理中重要数据技术的基本状况之前,须要对作为分析案例的医保信息处理系统的状况与信息处理流程进行探讨,不同的国家的医保信息系统的
3、应用状况也存在不同,本文以一种比较常见的医保信息系统为主要分析对象,一般一个国家的医疗保险系统主要由三部分组成,包括私营医疗保险、社会医疗保险以及管理式医疗保险,最主要的保险项目为管理形式的医疗保险,这种保险供应的服务模式主要供应的服务具有联合性的特点,能够将医疗费用有效节约,还能切实地提升医疗服务工作的质量。 该医疗保险的信息处理系统在对业务进行处理的时候,基本流程如下:患者首先须要到医疗人员那里接受治疗,医生向患者推出最佳的治疗方案,在医疗保险的系统之中有一项PPO安排,假如诊治医生是PPO安排的参加者,须要支付的医疗费用会相对降低,PPO组织可以负责主要的沟通与各方联系工作,联系对象包括
4、医生以及保险公司,保险公司会给其供应数量可观的病人,组织会给保险公司折扣,除了患者本人,其家属也可以参保。医生在完成治疗任务之后,可以向相关组织寻求索赔,并将患者的基本账单寄出,该相关组织会借专业软件来处理账单并对保险折扣进行计算,WLT软件就是一种应用效果比较好的处理保险信息的软件,主要是负责索赔工作,完成处理之后,可以将相关数据干脆输送到数据库之中。 二、数据仓库技术概述 1.基本概念。数据仓库之中的数据具有极强的集成性,这些数据并不是静止的数据,会因时间流淌而出现改变,但是这些数据是稳定的,同时具有较强的主题性与历史性,这类数据一般会被应用于决策工作之中。 2.主要特点。数据库的首要特点
5、就是面对主题,数据仓库与一般的操作类型的数据库不同,而数据仓库之中全部数据都是围绕了一个主题;集成性也是数据仓库的显著特点,其在数据仓库中,原本处于分散状态的数据会被以一种特别的处理方式集合起来,数据具有较强的一样性;数据仓库具有较好的稳定性,由于其供应查询功能,因此当数据被添加到数据仓库之中就会被许久地保留下来,施加给数据仓库的数据删除以及修改行为比较少,刷新以及加载的行为更多。数据仓库还能对历史改变进行呈现,能够给决策人员供应阶段性数据。 三、数据信息技术概述 1.基本概念。数据挖掘技术是一种提取数据的新型技术,现代的大部分数据库之中的数据都极为庞杂,这些数据具有极强的模糊性,在应用数据进
6、行决策时,这类数据会降低决策效率,因此须要借助数据挖掘技术来将大量的模糊数据之中潜藏的有价值的信息提取出来,以备决策参考,数据挖掘方法有许多,数据处理人员可以依据须要进行选择。 2.数据处理流程分析。借助数据挖掘技术来达到数据处理目的须要经过以下几个环节:首先须要进行数据采样,查找与查找问题有关联的样本数据子集,达到精选数据的目的,再开展数据探究工作,对数据子集进行分析,接着完成数据调整的任务,将数据有效量化,对子集之中的数据进行删改,将调整之后的数据子集进一步模型化,最终对数据进行分析与评价。 四、应用状况分析 1.建設数据仓库模型。选定数据仓库平台原OLTP 数据库系统架设在DELL 的塔
7、式服务器上,软件环境采纳 Windows Server2000+SQL Server2000,目前运行良好,且有足够的剩余处理实力。经初步估算,数据仓库的数据约 10GB 左右,考虑到现有的设备状况及经济缘由,数据仓库将与原数据库架设在同一平台上。 在 SQL Server 上建立新的数据库在 SQL Server 2000 中,数据库由包含数据的表集合和其它对象组成,目的是为执行与数据有关的活动供应支持。存储在数据库中的数据通常与特定的主题或过程相关,同时 SQL Server 支持多个数据库。原OLTP 数据库系统中,参保公司与人员信息、账单支票信息及医生信息便分别存储在各自的数据库中。对
8、于医疗保险数据仓库,将同样实行关系存储。 2.开展联机分析查询工作。通过对多维数据集进行 OLAP,可以得到供决策支持的统计分析数据,是一种较浅层次的学问发觉。以下将对医疗保险数据仓库的多维数据集进行分析。 依据投保信息多维数据集,可以得到投保总额、投保人数等统计信息,并在不同维度进行分析。 若选定参保公司维度与时间维度,以投保额度为度量,可以生成各公司投保总额的统计数据。在此基础上,若要了解更细微环节的数据,还可进一步的进行下钻操作。单击年份前面的“+”,时间的级别能进一步细化,显示出每季度、每月甚至每天的投保额。若替换时间维度为保险维度,则可分析公司在各保险类型中的投入。同时,OLAP 还
9、支持多个维度综合分析。 3.对数据仓库开展数据挖掘工作。完成前几个环节的数据仓库的建设工作之后,就可以进行最终一个阶段的数据挖掘工作,相关人员要完成医保客户消费状况挖掘模型创建任务,依据客户的医保需求可以將其分为三类,划分之后,可以更好地对不同的客户供应针对性的保险服务,主要对医保消费有关的数据进行数据挖掘工作,借助当前的可应用的数据,可以在账单信息的基础上开展挖掘模型的建设工作,选用聚集算法。 先选择事例,针对账单数据建设数据集,事例主要是作为挖掘工作之中的实体而存在的,完成客户聚类的模型建设工作之后,须要对客户信息进行有效提取;对训练数据进行选择,培训数据是与事例有关的额信息,消费额度是客
10、户聚类的基本标准,因此须要选定客户消费金额,对客户特征进行挖掘,其他培训信息还包括客户的个人信息,最终一个环节的工作是对挖掘模型进行保存,同时对挖掘的数据结果进行分析。依据数据分析结果可以了解到价值比较高的客户是拥有中高消费水平的客户,年龄在40岁左右们可以对其提出额度比较高的医保服务,而中等收入的客户比较适合中等额度的保险服务,中等收入偏下的女性客户比较适合经济型的医疗保险服务。 五、结语 医保信息系统是一种比较典型的信息系统,医保信息构成困难,变动状况也比较多,假如没有科学的信息处理方式作为支撑,信息处理工作就会频繁地出现问题。因此须要借助数据挖掘技术与数据仓库存储作为处理具有信息价值的数
11、据这项工作的协助手段,本文对某种医疗保险信息系统为分析对象,对两种处理信息的技术进行总体分析,对其实际应用也绽开了具体阐述,虽然两种信息处理方式带有较强的新进性,但是照旧有须要改进的部分,技术人员须要增设主题域,对医保客户的用药状况也进行了解,还可以将药品项目也添加到主体域之中,客户端工具的人性化还有待提升技术,技术人员照旧须要加强对这类数据处理技术的探讨力度。 参考文献: 1徐璐. 基于数据仓库的客户关系管理系统探讨D. 南昌高校 2022. 2石萌. 数据挖掘在医疗保险参保人员老龄化问题中的应用探讨D. 贵州财经学院 2022. 3孙光伟. 数据挖掘在网络信息条件下CRM中的探讨与应用D. 吉林高校 2022. 4郑哲鹏. 基于数据挖掘技术的贵阳医保基金风险防控探讨D. 贵州财经高校 2022. 5张莎莎. 数据挖掘在城镇基本医疗保险中的应用分析与设计D. 贵州财经高校 2022. 6李娜娜. 数据挖掘在医疗保险理赔分析中的应用D. 大连理工高校 2022. 第7页 共7页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页