《医疗卫生信息的大数据建模描述和分析.doc》由会员分享,可在线阅读,更多相关《医疗卫生信息的大数据建模描述和分析.doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医疗卫生信息的大数据建模描述和分析伴随着中国医疗卫生服务的信息化进程推进,将产生大量的数据。这些数据主要来源于医疗业务活动、健康体检、公共卫生等9项医疗卫生服务。数据内容包括来自医院的大量电子病历、区域卫生信息平台采集的居民健康档案等。其中大量充斥着非结构化/半结构化的数据,包括图像,office文档,以及XML结构文档等。医疗大数据的应用,关键是整合所有可能得到的这些数据,为机构和政策制定者来找到如何刺激经济并降低共享数据的技术门槛。1.1 我们给出的相关数据模型我国医疗卫生行业涉及的数据实体对象种类非常众多,包括医疗机构科室医生(门诊、住院)、大众群体患者、医疗管理部门卫生局疾控中心医保中
2、心发改委中医药管理局、医药管理部门药监局、医药研发医药生产医药经营药品(处方药、ODC药)、医疗器械研发医疗器械生产医疗器械经营医疗器械、商业医疗保险公司、体检中心体检医生、APP服务等。如下图所示。1.2 卫计委给出的相关数据模型2010 年底,原卫生部完成了“十二五”卫生信息化建设工程规划编制工作,初步确定了我国卫生信息化建设路线图,简称“3521-2工程”,即建设国家级、省级和地市级3级卫生信息平台,加强公共卫生、医疗服务、新农合、基本药物制度、综合管理等5项业务应用,建设健康档案和电子病历2 个基础数据库和1 个专用网络建设,进行医疗卫生信息标准化体系和安全保障体系2个体系建设。201
3、3年11月,卫生部和计生委合并后,信息化建设工程规划的顶层设计规划又调整为“4631-2工程”,其中,“4”代表4级卫生信息平台,分别是:国家级人口健康管理平台,省级人口健康信息平台、地市级人口健康区域信息平台及区县级人口健康区域信息平台;“6”代表6项业务应用,分别是:公共卫生、医疗服务、医疗保障、药品管理、计划生育、综合管理;“3”代表3个基础数据库,分别是:电子健康档案数据库、电子病历数据库和全员人口个案数据库;“1”代表1个融合网络,即人口健康统一网络;最后一个“2”是人口健康信息标准体系和信息安全防护体系。依托中西医协同公共卫生信息系统、基层医疗卫生管理信息系统、医疗健康公共服务系统
4、打造全方位、立体化的国家卫生计生资源体系。卫计委规划的三大基础数据库相互关系和包括的主要数据如下图所示。电子健康档案的数据架构是以人的健康为中心,以生命阶段、健康和疾病问题、卫生服务活动(或干预措施)作为三个纬度构建的一个逻辑架构,用于全面、有效、多视角地描述健康档案的组成结构以及复杂信息间的内在联系。通过一定的时序性、层次性和逻辑性,将人一生中面临的健康和疾病问题、针对性的卫生服务活动(或干预措施)以及所记录的相关信息有机地关联起来,并对所记录的海量信息进行科学分类和抽象描述,使之系统化、条理化和结构化。个人健康档案的三维概念模型,可以清晰地反映出每个个人不同生命阶段、主要疾病和健康问题、主
5、要卫生服务活动三者之间的相互联系。同时,坐标轴上的三维坐标连线交叉所圈定的空间位置(域),表示了人在特定生命时期、因特定健康问题而发生的特定卫生服务活动所需记录的特定记录项集。由于三维空间中的任意一个空间位置都对应着某个特定的健康记录,从而构成了一个完整、立体的健康记录,这些健康记录全面地反映了个人健康档案内容的全貌。l 第一维(X轴):生命阶段按照不同生理年龄可将人的整个生命进程划分为连续的若干生命阶段,如:婴儿期(01岁)、幼儿期(13岁)、学龄前期(36岁)、学龄期(612岁)、青春期(1220岁)、青年期(2145岁)、中年期(4660岁)、老年期(60岁以上)等八个生命阶段。也可以根
6、据基层实际工作的需要,将人群化分为:儿童、青少年、育龄妇女、中年和老年人。l 第二维(Y轴):健康和疾病问题每一个人在不同生命阶段所面临的健康和疾病问题不尽相同。确定不同生命阶段的主要健康和疾病问题及其优先领域,是客观反映居民卫生服务需求、进行健康管理的重要环节。l 第三维(Z轴):卫生服务活动(或干预措施)针对特定的健康和疾病问题,医疗卫生机构开展一系列预防、医疗、保健、康复、健康教育等卫生服务活动(或干预措施),这些活动反映了居民健康需求的满足程度和卫生服务利用情况。 居民健康档案新生儿疾病筛查出生缺陷监测学生健康监测婚前保健服务疾病控制医疗服务免疫接种传染病报告结核病防治门诊诊疗青春期青
7、年期中年期老年期出生医学登记妇女病普查计划生育技术服务体弱儿童管理儿童健康体检五岁以下儿童死亡报告学龄前期幼儿期婴儿期出生学龄期孕产期保健服务与高危管理产前筛查与诊断孕产妇死亡报告慢性丝虫病病人管理职业病报告职业性健康监护伤害监测报告中毒报告成人健康体检疾病管理高血压病例管理糖尿病病例管理肿瘤病病例管理精神分裂症病例管理艾滋病综合防治血吸虫病病人管理儿童保健妇女保健 个人基本信息 主要疾病和 健康问题摘要 主要卫生 服务记录老年人健康管理住院诊疗死亡医学登记死亡行为危险因素监测个人健康档案(EHR)基本结构1.3 相关数据特征对比分析从医药医疗健康大数据分析应用角度,本平台需要一个尽可能全和细
8、的数据集合,所以理想状态是结合上两部分数据内容形成的超集集合,甚至包括一些非医疗健康数据,如考察研究某种药对某种疾病的医疗效果时,如果能获得当地的气象天气信息,可能分析出的结果将明显不同。另外可以看出目前所给数据都是结构化数据,如果从大数据分析应用角度,理想的数据还应该包括图像、图形、文本等半结构和非结构数据,以及非关系数据(多维数据),才能构成满足医药医疗健康大数据分析应用的需求。2000 年以来,我国的医疗数据的生成和采集主要局限于各大医院。近几年,随着社区系统、新农合系统、村卫生室系统等基层医疗卫生信息系统逐步上线,医疗卫生数据源头也越来越多,数据量越来越大。从卫生服务的类型看,区域卫生
9、信息的类型主要有:医疗服务类、公共卫生服务类、社区卫生服务类、卫生业务类、卫生管理服务类数据。根据估算,中国一个中等城市(1千万人口规模)50 年所积累的医疗卫生数据量就会达到10PB级。随着各地区域卫生信息平台的建设,存储于各医疗卫生机构的数据将逐步通过各种方式实现整合与共享。多维数据由于医疗数据是多种数据源数据的汇总,数据之间的关系非常复杂。如下图所示:以患者为中心的服务需要把一个患者的全周期数据按照时间轴排列,并分析诊断、用药和患者生命体征、检验检测值之间的关联;以医生为中心的服务又需要把与医生相关的患者数据挑拣出来,并进行分类;以科室为中心的服务可能需要既从科室所属医生的角度,又要从在该科室就诊患者的角度进行分析;针对社区的服务可能需要统计整个社区居民某项指标(比如血压、血糖)的达标率。医疗数据的多维度、多粒度为各种信息服务的多角度、多层次分析提供了可能,但同时也为大数据分析带来了挑战。因为不可能为每一种信息服务存储一份特定的优化模式的数据,况且也无法枚举出所有可能的信息服务需求。这就需要医疗数据的存储模型能够适应灵活多变的多维统计分析需求。