《临床科研数据库平台建设方案.docx》由会员分享,可在线阅读,更多相关《临床科研数据库平台建设方案.docx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、临床科研数据库平台建设方案等相关分析方法。6 .支持回归分析,包括单因素逻辑回归、多因 素逻辑回归、单因素线性回归、多因素线性回 归、逐步回归7 .支持生存分析,包括Cox回归、KM生存曲线、 long-rank、ROC 曲线、AUC统计分析的结果(如统计表、统计图)可以被 保存在项目拥有者的账号下,方便管理与查看 支持统计结果的自动可视化和导出七、CRF管理1 .科研课题的CRF创建、编辑、删除等管理功能;2 .多种CRF题型和灵活选项设置功能;3 . CRF多样式展示:单列模式、双列模式;4 . CRF内多题目间显示与隐藏的逻辑关系以及自动计算量表等八、知识全库1 .支持医学文献、指南共识
2、、临床路径、药品 说明书、临床试验、误诊误治相关内容的搜索;2 .知识全库须支持图形化方式展示科研热点 趋势;支持科研文献作者图谱展示:3 .研究热点趋势图支持自定义探索功能,支持 输入疾病名称后可展示该疾病下近十年PUBMED 文库中重要主题的河流图,支持选择不同时间段展示河流图热点趋势的分布,另外在右侧展 示T0P5关键词对应10篇文献信息,点击可以 查看文献详情。九、数据字典十、产品使用 引导及帮助 中心十一、系统权限管理1 .开放标准数据集中所有指标的查询,包括:指标定义、值域、加工方法、来源;.透明化每个字段的填充率统计,方便用户感知数据质量.产品功能使用帮助及视频演示1 .常见使用
3、问题解答.产品使用手册2 .新功能提示,第一时间通知用户最新功能.赋予用户角色,授予功能使用权限1 .不同用户开启不同数据授权.支持专病库拥有者自行为用户授权(一)技术要求3(二)数据采集和处理功能3(三)功能描述4(一)技术要求1 .基于医院数据的复杂性及可扩展性要求,平台基于Hadoop 2.7以上的技术框架实现。建设Hadoop平台,为临床数据提供分布 式数据存储资源,并为NLP (自然语言处理)、模型算法提供分布式 计算资源。2 .支持并行计算基础架构或混合式架构,具备基于传统分布式 网络和云计算平台等多种模式部署。3 .支持MapReduce Yarn Spark Azkaban等大
4、数据分布式计 算框架,具备多种算法库,具备大数据存储访问及分布式计算任务调 度等功能。4 .系统须采用分布式搜索引擎技术,实现数据的快速查询及调 阅,进行数据检索的响应速度必须在5秒以内。5 .系统需具备人工智能与机器学习能力,为自然语言处理和知 识图谱构建提供算法支撑。6 .系统须具备对研究对象(患者)隐私信息加密保护的功能, 防止患者隐私数据外泄。7 .系统须具备完善的账号、角色授权功能,具备高级用户、普 通用户等不同角色不同权限控制,实现功能数据权限分离。本项目涉 及的数据和应用部署于采购方指定地点,且必须经过授权才可访问。8 .系统基于B/S架构部署,无需安装客户端,通过浏览器即可 使
5、用。(二)数据采集和处理功能1 .数据采集:平台需从包括但不限于HIS、EMR、LIS、RIS、心 电、病理、手术麻醉、病案、超声、内镜等业务系统进行数据抽取、传输和加载,在大数据平台完成统一的数据集成。2 .数据清洗:数据清洗需参照HL7、CDA、卫健委电子病历基本 架构与数据标准等一系列国内外通用标准制定数据元规则,进行数据 的格式统一。包括但不限于:纠正错误、删除重复项、统一规格、修 正逻辑、转换构造、数据压缩、补足残缺/空值、丢弃数据/变量。3 .数据关联:以患者为维度,以患者单次就诊为最小颗粒度, 将患者在不同系统中的数据关联起来,建立完整的患者数据模型。4 .自然语言处理:(1)医
6、疗文书后结构化。通过后结构化把医 疗文书(病历、医嘱、护理文书、检查报告等)转变为结构化的、可 以计算、可挖掘的数据。(2)医疗文书标准化。在数据挖掘的算法 指导下,参考自然语言的同义词表、医学术语的同义关联词表和国内 外各种数据标准,对不同文字表达但含义相同的信息进行标准化处 理。5 .数据自动化生产:在不影响医院现有业务系统运行的情况下, 进行数据采集和处理全流程的自动化生产,并可按照预设的时间间隔 进行数据自动更新。(三)功能描述一级模块二级模块模块概述数据、首页为管理者提供全院数据的概览,包括查阅全院中心(管理者驾 接入数据不同维度的统计:驶舱) 1.病历时间跨度、总人数、总病例数、接
7、入系统数、字段总数、最近数据更新时间等统计数 据,以及就诊人次的趋势、就诊类型的分布、 就诊人次最高的科室等统计图表;2 .查看全平台的数据字典,查看每个数据指标 的定义、中英文名称、值域、数据类型、数据 提取规则、来源;3 .透明化展示每个字段的填充率,支持查看每 个指标的数据填充率以及填充率历史变化趋 势,便于用户感知数据质量;4 .支持查看全平台接入的信息系统,及其包含 的数据表,以及对应系统覆盖的患者比例情况; 展示全平台上建设的科室数据库概览:1 .创建的科室数据库总数、数据库覆盖的科室 数量、覆盖的用户数量;.已创建的所有科室数据库的总列表;全平台日志记录的统计信息:1 .昨日数据
8、库总UV、昨日数据库总PV.近期访问的PV和UV趋势图;2 . ToplO活跃用户的列表;二、病例检索 支持管理者在数据中心层进行全院患者数据的导出三、病种库管 理(科室数据 库创建与管 理)检索、导出和分布情况:搜索查看:1 .提供信息科多种检索病例方式,包括关键词 搜索、条件树搜索(多指标And/Or/Not逻辑叠 加的漏斗式筛选)和事件搜索(定义关键诊疗事 件的时间顺序);.秒级返回搜索结果,并支持查看患者全生命 周期数据和时间轴2 .查看每条患者数据的取值(加工)逻辑和来 源;导出:3 .根据用户数据权限范围导出搜索到的患者 病例数据;数据分布情况;1 .支持对搜索到的病例数据进行筛选
9、;.对筛选好的病例数据进行统计,包括患者性 别分布、就诊年龄分布、诊断分布、用药分布、 手术分布等统计图表;管理者可以在平台上自助创建科室数据库:1 .平台管理员根据临床科室圈定的患者范围, 一键创建数据库2 .平台管理员统一分配数据库使用权限给临床科室团队;管理所有科室数据库:1 .可查看数据库创建状态和进度,并可设置在 创建完成时对创建者进行消息通知;2 .对科室数据库进行管理,包括复制已有数据 的创建配置和删除弃用的数据库;3 .支持查看科室数据库的整体使用情况,包括 数据库的总数、覆盖的科室数量、创建的科研 项目的数量统计;为临床科室团队中不同的角色提供所需、所关 一、首页注的内容及快
10、捷入口,帮助用户提高工作效率 专病库内的患者数据透视,帮助用户感知库内 患者的特征分布情况:1 .患者总数量、就诊时间跨度、患者纳排条件;科室数据库2 .关键指标BI分析,举例:男女分布、就诊 二、洞察分析年龄分布、就诊类型分布、就诊/入院时间趋势 图、就诊/入院科室分布图、疾病诊断分布等3 .将多个指标的值域作为筛选项,对全部指标 进行筛选三、患者科研患者科研全景和诊疗时间轴全景和诊疗时间轴1 . 一键查看患者360度科研全景数据;2 .患者诊疗时间轴,直观了解患者重点诊疗事件和结局,以及重点指标的时序进展情况3 .支持患者科研数据溯源、加工逻辑全透明患者搜索1 .支持简单搜索、多条件组合高
11、级搜索和条件 树可视化搜索等方式进行病例检索,支持秒级 搜索目标患者,快速定位人群,继续科研分析;.搜索患者数据并导出;2 .科研思路辅助查找:漏斗式搜索+实时样本 量计算,帮助用户一步步查找验证科研思路;四、病例检索4.事件检索:识别患者的关键医疗事件,如手 术、入出院等,通过定义TO事件与事件前后的 条件,精确搜索患者,并支持基于TO时间,在 其前后添加多个限定条件和配置条件之间的关 系,进行患者检索。5 .对搜索关键词推荐相关文献,帮助用户快速 找到与搜索人群相关的近年文献研究,探索科 研思路1.线上化支持科研课题流程,帮助用户完成科 研项目,提升科研效率;五、科研项目2.项目全流程支持
12、:创建项目一纳排患者一研 究指标选取一随访管理一项目数据补录一统计 分析f导出Excel;3 .多项目管理、任务提醒、进度统计等,帮助项目创建者直观及时了解项目进行情况4 .支持多种随访方式:电话/门诊随访、短信随访六、高级统计分析1 .统计分析时,为科研项目中的数据自动进行 编码(例如:将性别指标中的“男” “女”编 码为“0”和1” )2 .计算指标有效填充率,对于分类型指标和连 续型指标计算方式不同3 .为科研项目中的变量进行描述性分析,包括 平均值、标准差、最大值、最小值、Shapiro-Wilk 正态性检验、Kolmogorov-Smirnov正态性检验、 第1四分位数、中位数、第3四分位数、有效 填充率、值域分布、有效值占比。4 .支持单变量的单因素组间比较(单因素分 析),目前支持t检验、矫正t检验、 kruskal-wallis H 检验、Wilconxon 秩和检验、 单因素方差分析、Pearson卡方检验、Fisher 精确概率法、CMH线性趋势检验、Ridit分析法 等统计学检验方法。5 .支持两变量间的相关性分析,支持Pearson、 Spearman 列联系数、Phi、Cramer? s Eta