《临床科研大数据应用平台建设方案.docx》由会员分享,可在线阅读,更多相关《临床科研大数据应用平台建设方案.docx(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、临床科研大数据应用平台建设方案 和归一化处理,使之成为临床科研直接利用与分析的数据,包括:支 持基于自然语言处理技术的医疗文书类非结构化数据治理;支持非标 准化概念与标准化概念间的映射转换,实现数据标准化应用,支持术 语字典对照国家、国际标准编码完成映射,如诊断名称、病症名称、 检验名称、药品名称、检查名称、手术与操作等;(4)通过提供数据治理展示平台,支持直观展示数据治理过程 和结果,主要包括:数据整体结果及数据质量概览,包括集成数据总 览、结构化数据概览和非结构化数据概览、数据质量监控报告细节展 示及下钻上钻分析;支持元数据、主数据、数据映射等展示;支持 NLP中文本语义理解模型展示。5、
2、科研数据中心科研数据中心存储经过数据治理后形成高质量的结构化数据,同 时存储半结构化及非结构化的初级数据,须满足科研检索、科研工程、 统计分析等需要。(1)数据中心支持以分布式存储数据(包括结构化数据、半结 构化数据、非结构化数据),以患者为中心的包括基本信息、病历、 检验、检查、治疗、手术、随访、样本及CRF科研表单采集的数据 等在内的全生命周期全量数据,其中数据以结构化为主,提升科研应 用效率;(2)支持自定义字段的增加,自定义字段的工程能够手工补录 数据,支持取数逻辑的维护与修改;(3)支持以二维表形式进行专病库库变量的展示,包括患者基 本信息,就诊记录,病症,诊断,实验室检查,药物治疗
3、,影像学检 查,既往病史,个人史,嗜好品信息,婚育史,家族史,体格检查,生命体征,护理记录等;(4)支持对搜索结果进行高级筛选并进行导出,导出数据支持 数据组合为一个患者一条和一个患者多条;导出格式支持xlsx、CSV、 spss SASo6、大数据智能检索对输入的非结构化检索词,能够基于医学自然语言处理技术,使 其进行精确检索,保证检索速度和准确度,能够符合科研实际需求。 智能科研检索模块满足以下功能需求:(1)支持变量树的维护(非结构化、结构化)及常用变量、路 径、搜索选择,支持对疾病名进行归一化搜索,能够自动提示输入词 相应的归一化检索词;(2)支持快速检索,能够将既往检索历史、检索条件
4、存为模版, 进行记录、展示及方便下一次快速检索;(3)支持模糊检索,能够对疾病名、关键字、ICD编码等在指 定临床文本中进行模糊匹配;(4)支持多维度条件的检索功能,包括患者信息和诊疗信息等, 支持多个条件之间的复杂组合逻辑(如或、且、非)搜索;(5)支持病例的全文检索,可配置检索条件为病人的全部或单 份病历,并将病人和满足检索条件的病历展示在检索结果中;(6)支持对符合条件的病人和病历信息进行二次筛选,并支持 搜索结果的可视化图表,支持将符合条件患者加入队列或科研工程, 支持搜索结果订阅,即当有符合条件的新患者进入系统可将病人自动 加入指定队列。7、工程管理功能支持科研工程管理,包括科研工程
5、方案设计、工程设置、数据采集、质疑(任务)管理、受试者列表及CRF展示.(1)支持科研工程的创立及信息编辑,支持多种前瞻性和回顾 性医学研究设计,并有对应的研究设计模板,包括现况研究、病例对 照研究、队列研究、随机临床实验等,支持科研工程团队管理,包括 团队成员的创立、修改、删除、以及权限分级、分角色管理;(2)支持科研工程所需的病例报告表(CRF)的设计、编辑、 发布和控制,包括自定义CDISC等数据标准,并根据研究设计进行 随访/事件/时间的关联设置,完成CRF制作;支持CRF智能采集: CRF筛选及数据对照填写,具备数据录入、修改、保存、提交、清空 功能;(3)支持科研工程患者管理,包括
6、研究对象的纳入和分组、研 究对象基本信息预览、患者筛选、患者添加/删除,支持简单随机化 分组方法,支持研究样本量的计算,集成样本量计算模块;(4)支持研究基线信息相关变量选取的设置,包括患者基本信 息(性别、年龄)、基准事件相关就诊变量(是否患有某病)、基准事 件相关事件变量(是否接受某种治疗)、相关时间点或时间段等;(5)支持数据核查与质疑;具备系统核查及人工核查两种方式。 提供数据质疑管理,包括查看、回复、关闭、重启、导出质疑,并保 留数据稽查及修改痕迹,支持研究过程中质控方法的智能提示,如当 数据收集不完整时,提示研究者进行数据补充,当有多个数据来源不 一致时,能够提示研究者进行审核查看
7、。8、数据分析应用功能(1)支持数据分析的预处理,包括缺失值填补、剔除文本、记 录替换、变量分级、记录合并、类别转变量,支持清洗变量的数据可 视化,支持构建单次与全量变量树,支持变量选择,字段搜索,支持 多变量互斥逻辑判定;(2)支持在数据探索阶段更新数据,支持授权用户对查询结果 与数据进行导出,针对数据的分类模型,定制每种分类数据的导出模 式,基于关键事件处理、复杂逻辑计算、自动行列转换、智能标准 化值域输出等技术,替代统计学处理前大量的手工数据处理工作,可 导出Excel / CSV / SPSS / SAS等多种格式,假设设计阶段采用CDISC 等标准,同样于导出阶段支持;(3)支持描述
8、性、差异性分析、相关性分析、生存分析等统计 功能;支持包括Pearson卡方、Pearson校正卡方、Fisher精确概率、 Ridit 分析、Wilcoxon 秩和检验、Mann Whitney U 检验、Kruskal-Wallis H检验、CMH检验、t检验、校正t检验、单因素方差分析、LSD检 验、Bonfeironi 检验、Turkey 检验、Shapiro-Wilk 检验、Spearman 相 关、Kaplan-Meier检验等常见医学统计方法,支持随机森林、线性回 归、Logistic模型、COX回归模型;(4)支持分析结果的可视化与导出,如散点图、频数图、折线 图、森林图等,支
9、持统计任务复用与修改。9、数据展示功能提供数据治理可视化,科研数据概览,科研工程数据概览,医院 运营数据概览等信息,为管理部门和工程决策者提供决策支持。(1)支持数据概览,包括患者人数、就诊记录数、门诊记录数、 住院记录数展示,支持数据集成总览和多维度展示,包括数据中心总 记录数、就诊数量展示以及根据时间轴展示各数据项具体数据及同 比、环比比照增长;(2)支持患者主索引建设,包括患者的基本信息、主索引数、 信息字段覆盖率,支持数据标准化数量展示,包括诊断、手术及操作、 检验、检查和药品等标准化业务及归一化数据量,支持数据结构化数 量展示,包括病历文书、检查报告结构化相关统计数据;(3)支持科研
10、工程特征概况展示,包括科研工程列表、工程领 域分布、工程状态等。10、平台管理功能系统管理提供基于web界面的用户管理、角色与权限、数据策 略、院外访问设置和日志审计功能。(1)支持增删改用户,展示用户相关信息,支持角色增删、编 辑及功能权限配置,对各用户角色的权限按照系统功能进行配置管 理,包括主要研究者、协助研究、录入员、账号管理员等;(2)须遵循医疗行业的伦理规范和信息安全规范,支持数据权 限策略与配置,包括根据用户职称、职位及其他可定制化模式配置全 院、科室、个人的数据权限策略,能够根据用户权限、所属机构、及 个体设置等多个层级对实现用户访问控制,访问内容包括数据集根据 访问控制灵活、
11、动态、差异性展示,亦根据权限实现匿名化处理及展 示,支持访问审计;(3)支持患者信息灵活加密,患者隐私信息如信息姓名、家庭 地址、身份证、手机号码进行加密处理,加密处理措施实现可配置化, 灵活、动态展示相关信息,如患者姓名在随访时需要展示;(4)支持系统用户登录/登出/变更、智能搜索、数据导出等操作的日志审计。(二)技术能力要求1、产品总体技术要求1)系统需采用B/S架构,纯WEB版产品界面,需提供系统界 面截图;2)支持基于kubernetes和docker容器编排的部署方案,需提供 系统截图展示容器的运行状态;3)具备完善应用部署能力,提供应用部署管理平台的界面和部 署方案;4)支持与医院
12、信息系统数据的实时同步,需提供技术方案;5)支持集成多种数据库,如DB2、PostgreSQL、MySQL、ORACLE 和 SQL Server;6)提供性能监视器功能,能对设定的关键指标进行监控。2、自然语言处理技术要求系统要求采用自然语言处理(NLP)技术实现对医疗文本处理。具 体技术如下:1)支持处理多种病历类型的处理模型,展例如如入院病史、既 往史、病程录、体格检查、超声心动图、心电图等;2)系统支持单份文本分析结果进行可视化展示,包括医学实体 识别、医学实体与关联识别、概念展示等;3)支持治理好的文本变量的溯源功能,精确定位抽取的变量在 原文中的位置,并高亮显示;4)支持按专病模式
13、批量提取多种病历文本中的专病变量,如AKI 专病、房颤专病等,按患者纬度提取并混合展示病历类型变量,以及 有值变量的百分比;5)支持术语检索,满足诊断字典、实验室检查、药品字典等匹配模式;6)支持快速检索术语,展示术语及其同义词,点击其中某一条 结果,可在层级展示中查看该术语与疾病相关的图谱,在参考集链接 中查看该术语相关的conceptld code code_system中文、英文等 基本信息;7)以上病历类型、专病模式等关联的1或多个NLP模型,都可 以通过管理界面由用户创立和修改,修改后对应抽取的病历类型、专 病模式提取的变量均相应变化;8)将病历文本中提取的变量,可存储成JSON、二
14、维表格式。3、系统性能要求1)产品稳定性要求:系统支持7*24小时不间断运行;2)自然语言处理模型平均准确率较高、速度较快;3)系统的管理、操作界面应友善、易于使用,对使用人员的培 训时间保持在较短的时间内。4)系统应提供系统使用手册或操作视频来帮助用户熟悉系统的 使用;5)高峰期操作系统时无明显等待时间,查询操作进行预处理以 加快查询速度。额定用户同时运行时不能出现堵塞现象。各类日报表 统计及日常查询响应时间快,日常操作的系统响应时间不得超过5 秒;6)所有操作均需支持事务,不能产生垃圾数据。7)假设出现系统故障,能够在7X24小时保证由熟悉该系统且有能力进行维护的工程师负责提供系统维护。4
15、、数据标准化要求1)支持数据集成及整合过程的标准化:实现数据的集成,通过 各种数据治理手段,结合标准的医疗术语的标准规范管理,实现数据 的标准化、结构化,并实现数据治理过程中的完整性、自洽性、一致 性;支持科室、病区、诊断编码、疾病、药品、检验、检查等关键业 务编码的统一。2)支持不同数据来源的数据:充分考虑数据源格式的多样性, 比方各自不同的数据库格式、文本文件格式、XML格式、JSON格式 等,支持结构化数据、半结构化或非结构化数据。3)支持不同数据生成阶段的数据:由于数据生成的时期、部门、 设备、技术、能力等不同,数据存储管理极为分散,支持通过采用一 种通用的标准和规范,提供统一的数据接
16、口,支持多样的数据源。5、数据与信息安全1)系统仅允许院内部署,数据不可出院,系统仅允许本地维护。2)与医院信息系统对时应接遵循医院数据管理的要求,对医院 生产系统进行只读访问,不对医院生产系统进行数据写入。3)所有用户的密码在数据库中,采用摘要算法加密后再保存。4)支持用户的权限的设置:支持医院管理人员方便的管理各种 角色、用户的功能权限、数据访问和使用权限的定义。5)支持操作日志的记录:对所有用户操作记录日志,记录访问 IP地址、时间、用户名、操作涉及的模块等信息。6)支持患者去隐私管理:对于患者隐私,在应用或系统设计时充分考虑相关数据的隐私保护政策。一、工程概述3二、工程建设方案要求5三
17、、工程建设内容及要求6(一)功能技术要求61、数据集成功能62、科研随访功能73、科研助手功能84、数据治理功能95、科研数据中心106、大数据智能检索117、工程管理功能118、数据分析应用功能129、数据展示功能1310、平台管理功能14(二)技术能力要求151、产品总体技术要求152、自然语言处理技术要求153、系统性能要求164、数据标准化要求175、数据与信息安全17关于推动公立医院高质量开展的意见以及“十四五”优质 高效医疗卫生服务体系建设实施方案等明确指出:深度运用5G、 人工智能等技术,打造国际先进水平的智慧医院,建设主要疾病数据 库和大数据分析系统,加强智慧医院、信息化和科研
18、平台建设。我院 作为一家集医、教、研于一体的大型三甲医院,临床科研一直是支撑 医院开展的重要支柱之一。为进一步贯彻落实国家关于大数据、人工 智能方面的战略规划,实现从经验医学到精准医学的跨跃式开展。基 于呼吸内科、消化内科、心血管内科二病区、风湿免疫科、普外结直 肠病区、胸外科、妇科、肿瘤科、妇幼心血管内科、妇幼乳腺病科等 科室2022年科研专病库建设需求,医院通过顶层设计,拟在医院现 有临床业务系统、临床数据仓储基础上,构建基于人工智能的临床专 病数据中心平台。从而探索一条全新的科研临床协同开展路径,即以 大数据科研平台为依托,通过建立高质量专科专病数据库,搭建疾病 风险预测模型,实现对疾病
19、开展、转归等预测,辅助医生做出最正确 治疗决策,提升临床水平、改善患者结局。一、工程概述健康医疗大数据是国家重要的基础性战略资源。健康医疗大数据 应用开展将带来健康医疗模式的深刻变化,有利于激发深化医药卫生 体制改革的动力和活力,提升健康医疗服务效率和质量,扩大资源供 给,不断满足人民群众多层次、多样化的健康需求,有利于培育新的 业态和经济增长点。2021年6月7日,国务院新闻办公室公布关于推动公立医院 高质量开展的意见,内容包括“十四五”期间我国将实施四项重大工 程提到:一是公共卫生防控救治能力提升工程,二是公立医院高质量 开展工程。2021年7月1日,关于“四项重大工程”的具体政策“十 四
20、五”优质高效医疗卫生服务体系建设实施方案发布,对大数据、 信息互联互通的需求明确,信息化建设地位突出,建设任务中重点提 到:深度运用5G、人工智能等技术,打造国际先进水平的智慧医院, 建设重大疾病数据中心。推进跨地区、跨机构信息系统的互联互通、 互认共享、术语规范以及数据的整合管理,建设主要疾病数据库和大 数据分析系统,加强智慧医院、信息化和科研平台建设。我院作为一家集医、教、研于一体的大型三甲医院,临床科研一 直是支撑医院开展的重要支柱之一。调研发现我院目前临床数据中心 集成了海量的医学数据,但真正可以应用于临床科研的数据却较少。 这主要因为当前我院局部数据以表达性文本为主要形式,尚未实现结
21、 构化,缺乏数据质量控制,手术和随访数据有待完善等问题。止匕外, 每一个专科和每一种疾病在共性基础上,又具有其特性,每一个课题 组的研究方向也相对独立,对数据的收集也各有其特殊要求。因此, 传统的医学数据采集模式已经不适应现代医学的开展,建立符合疾病 特点和科研需求的专病数据库或专科病例收集系统,利用大数据进行 分析和挖掘,使海量数据真正转化为科研成果已是当务之急。因此,为进一步贯彻落实国家关于大数据、人工智能方面的战略 规划,实现从经验医学到精准医学的跨跃式开展。基于呼吸内科、消 化内科、心血管内科二病区、风湿免疫科、普外结直肠病区、胸外科、 妇科、肿瘤科、妇幼心血管内科、妇幼乳腺病科等科室
22、2022年科研 专病库建设需求,医院通过顶层设计,拟在医院现有临床业务系统、 临床数据仓储基础上,构建基于人工智能的临床专病数据中心平台。 从而探索一条全新的科研临床协同开展路径,即以大数据科研平台为 依托,通过建立高质量专科专病数据库,搭建疾病风险预测模型,实 现对疾病开展、转归等预测,辅助医生做出最正确治疗决策,提升临床 水平、改善患者结局。二、工程建设方案要求投标人应对本工程建设背景、建设目标、用户现状及业务、技术 需求有充分认识和理解,详细阐述工程的技术架构、设计理念,制定 合理、完整的工程功能设计方案,功能模块设计科学合理,易用性强。 需包含政策解读、标准规范、需求理解、建设目标、建
23、设原那么、整体 架构等。(1)政策解读需列出工程相关政策,并根据工程建设内容做出相应解读,阐述 工程需求方案对相关政策的遵循和实践。(2)标准规范根据工程建设内容列出系统建设所遵循的标准规范,并阐述工程 需求方案对相关标准规范的依循。(3)需求理解根据工程建设内容对工程需求做出分析,并提供针对需求要点的 需求理解方案,详细阐述投标方对需求要点的梳理和理解。(4)建设目标根据工程建设内容,列出明确的工程建设目标。(5)建设原那么根据工程建设内容,列出工程的建设原那么。(6)整体架构根据工程建设内容,对工程建设整体架构做出规划,并提供整体 架构图和基本说明。三、工程建设内容及要求本工程主要针对我院
24、呼吸内科、消化内科、心血管内科二病区、 风湿免疫科、普外结直肠病区、胸外科、妇科、肿瘤科、妇幼心血管 内科等科室需求,针对呼吸系统疾病、炎症性肠病、房颤、结缔组织 病相关肺间质病变、结直肠癌、肺结节、卵巢癌、胃癌、乳腺癌、心 力衰竭、乳腺病等11个病种构建以患者为中心的科研大数据创新应 用平台。建设内容如表1所示。表1工程建设内容序号功能模块1数据集成功能2科研随访功能3科研助手功能4数据治理功能5科研数据中心6大数据智能检索7工程管理功能8数据分析应用功能9数据展示功能10平台管理功能带号的为关键性技术参数。(一)功能技术要求1、数据集成功能根据工程数据范围及要求,以病人为中心集成患者临床数
25、据,集 成我院临床数据中心(CDR)中诊疗业务数据、患者数据、样本数据、 影像数据、实验室组学数据以及院外随访数据等,将各类不同来源的 数据资源汇聚并存储到统一的大数据平台,为数据分析、数据挖掘和 数据共享提供基础资源。(1)支持全量数据集成:患者临床数据和科研数据全覆盖,历 史数据和实时数据全覆盖,数据实时采集方式须对被采集系统的数据 库性能无影响;(2)支持历史科研数据的集成:针对现已采集的各类科研数据, 能够全量集成到系统中,无需重新录入采集;(3)支持不同数据类型的数据集成,如不同数据库格式、文本 格式、XML格式、JSON格式等,支持结构化数据、半结构化或非结 构化数据的解析与融合;
26、(4)支持数据集成全生命周期的监控与管理,实现数据管理标 准化、规范化,集成过程透明化、安全化,数据分析可视化。2、科研随访功能支撑以科研为目的院外数据收集,个性化配置随访表单和方案, 实现智能化的随访提醒和标准化数据采集,包括医生web端与患者 微信端。(1)支持随访表单自定义设置功能,包括随访类型、随访表单 和随访计划的设置,根据不同病种研究需求自定义表单内容,支持随 访计划的管理和筛选,包括随访计划的展示和根据随访患者姓名、所 属工程组、计划随访时间、随访状态等条件进行筛选;(2)支持人工及自动发送随访消息(微信或短信)、推送随访通 知和随访表单,同时具备个体及批量处理功能,科研人员、患
27、者可通过移动设备、电脑等多种方式填写随访表单,表单数据自动上传至平 台;(3)支持科研人员、患者通过移动端上传附件的功能,支持jpg、 pdf等文件格式;(4)治理后的院内数据可以根据随访计划实现随访数据的自动 填充,并增加手动填充和修改的功能,支持随访数据维护的提醒功能。3、科研助手功能支撑以科研为目的院内数据收集,配置专病科研变量模板,通过 与医生工作站对接,当医生结束书写电子病历的时候,以CRF表单 样式弹出提供浏览,满足诊疗过程中数据的采集。(1)支持针对每个专病数据库分别配置入排条件,支持对专病 数据库的入组条件、专病科研变量模板(eCRF表单)进行配置,支 持后台拖拽配置CRF的组
28、合和排列样式,支持查看时间段内变量的 数据质量;(2)支持针对不同专病库配置不同的病历模板,每个专病库可 配置根据文书类型配置多个CRF表单,支持与院方医生工作站进行 对接,当医生结束书写电子病历的时候,以CRF表单样式弹出提供 浏览,并展示当前CRF涉及的变量数、自动提取数、自动提取率等 的数据,医生可对自动提取的数据进行查看和修改;(3)根据配置的文书类型以及文书内容自动判断患者是否符合 专病库入组条件,将符合条件的患者自动提示医生加入专病数据库, 并提供入组条件配置项,支持科室、病区、医疗组、医疗组组长控制 功能;(4)支持对各域的未填写的必填项进行快速填写,支持必填项 完整性校验与提示
29、,必填项未填写那么无法提交该病历文书,经医生确 认提交后的CRF表单数据,会自动进入专病数据库,医生可查看患 者的历史数据和通过专病科研助手提取的数据;(5)支持查看不同专病数据库对应病历模板,在指定时间段的 数据量,包括域、变量、未提取率、改动率数据,支持将所选时间段 所选变量的数据质控报告以excel的形式导出至本地;(6)支持病历文书和变量获取结果核对功能,辅助院方数据管 理人员核对数据填充问题,以对取数逻辑做优化实现产品院内的持续 、, 一卜一1 吕O4、数据治理功能基于自然语言处理、机器学习等AI引擎的数据治理模块,支持 数据标准化、数据质控、元数据及数据安全管理等(标准版数据治理)
30、, 实现各类临床数据的结构化、标准化和归一化等处理。针对数据驱动 的临床科研场景,能够将医院积存的海量临床数据自动结构化、标准 化成可被临床科研直接分析、利用的数据。治理后的结果为后续的临 床应用提供了良好的数据基础。(1)支持变量中心取数逻辑可视化编写,能够可视化展示取数 规那么,验证取数内容,能够展示函数名、文本来源、函数类型等信息, 支持进行源码展示,能够与可视化视图灵活切换;(2)支持数据内涵校验,保障数据质量。提供可视化数据校验 规那么配置功能,通过对获取的数据内容进行标准性、规范性、完整性、 准确性、一致性等多维度校验,支持问题告警,第一时间处理问题, 保障数据质量;(2)支持基于人工智能技术将集成的数据进行结构化、标准化