《2018年医疗人工智能技术与应用白皮书.pdf》由会员分享,可在线阅读,更多相关《2018年医疗人工智能技术与应用白皮书.pdf(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 医疗人工智能技术与应用白皮书医疗人工智能技术与应用白皮书 (20182018 年)年)互联网医疗健康产业联盟 2018 年 1 月 互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 1 版权声明 本白皮书版权属于互联网医疗健康产业联盟,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源:互联网医疗健康产业联盟”。违反上述声明者,本院将追究其相关法律责任。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 2 前 言 2017 年医疗人工智能发展迅速,产业格局风起云涌。人工智能在医疗领域中的应用已非常广泛,包括医学影像、临床决策支持、语音识别、药物挖掘、健康管
2、理、病理学等众多领域。人工智能技术呈现与医疗领域不断融合的趋势,其中数据资源、计算能力、算法模型等基础条件的日臻成熟成为行业技术发展的重要力量。在新形势下,我国医疗人工智能的发展面临着机遇和挑战,技术能力不断增强,但产品和服务仍需完善。本白皮书梳理和研究国际、国内医疗人工智能的发展状况,总结医疗人工智能行业及基础设施领域国内外的技术发展特点和趋势,分析我国医疗人工智能产业面临的政策环境,为政府及产业界决策提供参考。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 3 目 录 一、人工智能的发展一、人工智能的发展.4(一)人工智能的技术演变.4(二)人工智能发展的三大因素.6(三)人工智能上
3、升为我国国家战略.10 二、医疗人工智能的宝贵价值二、医疗人工智能的宝贵价值.12(一)辅助医生诊断,缓解漏诊误诊问题.12(二)提高诊断效率,弥补资源供需缺口.13(三)疾病风险预警,提供健康顾问服务.14(四)支持药物研发,提升制药效率.15(五)手术机器人,提升外科手术精准度.15 三、国内外医疗人工智能发展状况及分析三、国内外医疗人工智能发展状况及分析.16(一)市场规模及发展趋势.16(二)国内外行业发展热点分析.17 四、我国医疗人工智能细分领域四、我国医疗人工智能细分领域.21(一)虚拟助理.22(二)病历与文献分析.25(三)医疗影像辅助诊断.27(四)药物研发.33(五)基因
4、测序.35 五、面临的问题与挑战五、面临的问题与挑战.37(一)数据是行业发展的瓶颈,积累与创新是解决问题的关键.37(二)医疗 AI 产品需要实现从试验向临床应用的突破.38(三)加深合作,可持续的商业模式亟待建立.39(四)明确医疗责任主体,划清权责范围.40(五)制定人才培养计划,抢占战略制高点.41 互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 4 一、人工智能的发展一、人工智能的发展 (一)人工智能的技术演变 从上世纪八九十年代的 PC 时代到二十一世纪的互联网时代,信息技术改造了人类的生产方式,提高了生产效率,改善了我们的生活。在进入移动互联网时代后,万物互联成为趋势,但技
5、术的限制导致移动互联网难以催生出更多的新应用和新业态。如今,人工智能俨然已经成为这个时代最炙手可热的技术,甚至将成为未来十年内信息技术产业发展的焦点。人工智能的概念诞生于上世纪 50 年代,从最初的神经网络和模糊逻辑,到现在的深度学习、图像搜索,人工智能技术经历了一系列的起伏。在 1956 年的一次科学会议上,人工智能的概念被首次确立:让机器像人那样思考和认知,用计算机实现对人脑的模拟。上世纪50 年代至 70 年代是人工智能的早期发展阶段,该阶段人工智能主要用于解决一些小型的数学问题和逻辑问题。此时人工智能出现了一些代表性应用,如机器定理证明、机器翻译、专家系统、模式识别等,但是该阶段人工智
6、能仍可以被归纳为“弱人工智能”时代,其发展和应用还远远不能达到人类的智慧水平。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 5 1972 年,用于传染性血液诊断和处方的知识工程系统 MYCIN 研发成功,该事件标志着人工智能进入“专家系统”时期。专家系统的出现使得计算机可以和人进行结合,通过对数据的分析解决一些实际的问题。但是专家系统的发展并不顺利,也并未得到广泛的应用。其原因主要有两个方面。一是专业知识的获取需要行业内长时间的积累,大量的行业数据在彼时难以全部植入专家系统。二是专家系统的程序主要由解释性语言“LIPS”编写,其开发效率和易用性较低,难以实现实际应用。人工智能技术发展在
7、彼时陷入的瓶颈使得人类开始思考,如何让计算机自发理解和归纳数据,掌握数据间的规律,即“机器学习”。上世纪 90 年代末,IBM“深蓝”计算机击败国际象棋大师卡斯帕罗夫再次引发了全球对人工智能技术的关注。但是受限于当时的技术条件,人工智能尚无法支撑大规模的商业化应用。2006 年,Geoffrey Hinton教授发表的论文 A Fast Learning Algorithm for Deep Belief Nets中提出了深层神经网络逐层训练的高效算法,使当时计算条件下的神经网络模型训练成为了可能。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 6(二)人工智能发展的三大因素 人工智能的
8、概念虽然在上世纪已经出现,但由于彼时软硬件条件的不成熟,数据资源的短缺,人工智能并未实现广泛的应用。如今,随着算法、算力等基础技术条件的日渐成熟,行业数据的积累,人工智能得以应用在各个领域。算力。算力。GPU(图形处理器)显著提升了计算机的性能,拥有远超CPU 的并行计算能力。由于处理器的计算方式不同,CPU 擅长处理面向操作系统和应用程序的通用计算任务,而 GPU 擅长完成与显示相关的数据处理。CPU 计算使用基于 x86 指令集的串行架构,适合快速完成计算任务。GPU 拥有多内核处理并行计算,适合处理 3D 图像中上百万的图像像素。此外,FPGA 也在越来越多地应用在 AI 领域。FPGA
9、(Field Programmable Gate Array)是在 PAL、GAL、CPLD 等可编程逻辑器件的基础上进一步发展的产物。它是作为专用集成电路领域中的一种半定制电路而出现的,既解决了全定制电路的不足,又克服了原有可编程逻辑器件门电路数有限的缺点。一方面,FPGA 是可编程重构的硬件,相比 GPU 有更强大的可调控能力;另一方面,与日增长的门资源和内存带宽使得它有更大的设计空间。由于深层神经网络包含多个隐藏层,大量神经元之间的联系计算具有高并行性的特点,具互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 7 备支撑大规模并行计算的 FPGA 和 GPU 架构已成为了现阶段深度学
10、习的主流硬件平台。FPGA 和 GPU 架构能够根据应用的特点定制计算和存储的结构,方便算法进行微调和优化,实现硬件与算法的最佳匹配,获得较高的性能功耗比。算法。算法。深度学习是当前研究和应用的热点算法,也是人工智能的重要领域。深度学习通过构建多隐层模型和学习海量训练数据,可以获取到数据有用的特征。通过数据挖掘进行海量数据处理,自动学习数据特征,尤其适用于包含少量未标识数据的大数据集。深度学习采用层次网络结构进行逐层特征变换,将样本的特征表示变换到一个新的特征空间,从而使分类或预测更加容易。深度学习驱动图像识别精度大幅度提升。2012 年,深度学习模型首次被应用在图像识别大赛(ImageNet
11、),将错误率降至 16.4%,一举夺冠。2015 年,微软通过152 层的深度网络,将图像识别错误率降至 3.57%,而人眼的辨识错误率约在 5.1%,Deep Learning 模型的识别能力已经超过了人眼。在2017 年的 ImageNet 挑战赛中,Momenta 团队利用 SENet 架构夺魁,他们的融合模型在测试集上获得了 2.251%的错误率,对比于去年第一名的结果 2.991%,获得了将近 25%的精度提升。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 8 图 1 2010-2017 年 ImageNet 竞赛图像识别错误率 自 Hinton 提出 DBN(深度置信网络)
12、以来,深度学习的发展经历了一个快速迭代的周期,其中卷积神经网络(Convolutional Neural Network,CNN)目前已成为图像识别领域应用最广泛的算法模型。在利用卷积神经网络(CNN)进行图像理解的过程中,图像以像素矩阵形式作为原始输入,第一层神经网络的学习功能通常是检测特定方向和形状的边缘的存在与否,以及这些边缘在图像中的位置;第二层往往会检测多种边缘的特定布局,同时忽略边缘位置的微小变化;第三层可以把特定的边缘布局组合成为实际物体的某个部分;后续的层次将会通过全连接层来把这些部分组合起来,实现物体的识别。目前,CNN 已广泛应用于医疗健康行业特别是医疗影像辅助诊断,用以实
13、现病变检测和特定疾病的早期筛查。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 9 大数据。大数据。机器学习是人工智能的核心和基础,而数据和以往的经验是机器学习优化计算机程序的性能标准。随着大数据时代的到来,来自全球的海量数据为人工智能的发展提供了良好的基础。据 IDC 统计,2011 年全球数据总量已经达到 1.8ZB,并以每两年翻一番的速度增长,预计到 2020 年全球将总共拥有 35ZB 的数据量,数据量增长近20 倍;数据规模方面,预计到 2020 年,全球大数据产业规模将达到2047 亿美元,我国产业规模将突破万亿元1。图 2 全球和中国大数据产业规模 随着电子病历的实施,CT
14、 影像、磁共振成像等放射图像的普及,医疗行业的数据量已呈现指数级增长。据统计,2013 年全球医疗健 1 数据来源:IDC 统计数据 互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 10 康数据量为 153EB,预计年增长率为 48%。通过自然语言理解、机器学习等技术,大量文本、视频、图像等非结构化数据得以分析利用。来源于三甲医院的电子病历数据库,基层医院和体检机构的健康档案数据库,国家各统计部门的人口数据库通过大数据技术可以实现互联互通,形成个人完整生命周期的医疗健康大数据,为人工智能技术在医疗健康行业的应用提供了有力的支撑。(三)人工智能上升为我国国家战略 2017 年 7 月 20
15、 日,国务院正式印发 新一代人工智能发展规划(以下简称规划),提出了面向 2030 年我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施,部署构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,描绘了我国新一代人工智能发展的蓝图。规划指出以提升新一代人工智能科技创新能力为主攻方向,构建开放协同的人工智能科技创新体系,把握人工智能技术属性和社会属性高度融合的特征,坚持人工智能研发攻关、产品应用和产业培育“三位一体”推进。其中,对于涉及民生需求的医疗、养老等方面,规划重点提出应加快人工智能创新应用,为公众提供个性化、多元化、高品质服务,包括:推广应用人工智能治疗新模式新手
16、段,建立快速精准的智能医疗体系;探索互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 11 智慧医院建设,开发人机协同的手术机器人、智能诊疗助手,研发柔性可穿戴、生物兼容的生理监测系统,研发人机协同临床智能诊疗方案,实现智能影像识别、病理分型和智能多学科会诊;基于人工智能开展大规模基因组识别、蛋白组学、代谢组学等研究和新药研发,推进医药监管智能化;加强流行病智能监测和防控。同时,国家也从重大科技专项角度支持医疗人工智能发展,医学人工智能成为了 2018 年科技部重大专项的重点。2017 年 5 月份,我国科技部发布“十三五”卫生与健康科技创新专项规划,提出加快引领性技术的创新突破和应用发展
17、,攻克一批急需突破的先进临床诊治关键技术。重点部署生命组学、基因操作、精准医学、医学人工智能、疾病早期发现、新型检测与成像、生物治疗、微创治疗等前沿及共性技术研发,提升我国医学前沿领域原创水平,增强创新驱动源头供给,加快前沿技术创新及临床转化。“十三五”卫生与健康科技创新专项规划对推进医学人工智能的技术发展指明了具体方向:开展医学大数据分析和机器学习等技术研究,开发集中式智能和分布式智能等多种技术方案,重点支持机器智能辅助个性化诊断、精准治疗辅助决策支持系统、辅助康复和照看等研究,支撑智慧医疗发展。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 12 二、医疗人工智能的宝贵价值二、医疗人
18、工智能的宝贵价值 医疗行业长期存在优质医生资源分配不均,诊断误诊漏诊率较高,医疗费用成本过高,放射科、病理科等科室医生培养周期长,医生资源供需缺口大等问题。随着近些年深度学习技术的不断进步,人工智能逐步从前沿技术转变为现实应用。在医疗健康行业,人工智能的应用场景越发丰富,人工智能技术也逐渐成为影响医疗行业发展,提升医疗服务水平的重要因素。与互联网技术在医疗行业的应用不同,人工智能对医疗行业的改造包括生产力的提高,生产方式的改变,底层技术的驱动,上层应用的丰富。通过人工智能在医疗领域的应用,可以提高医疗诊断准确率与效率;提高患者自诊比例,降低患者对医生的需求量;辅助医生进行病变检测,实现疾病早期
19、筛查;大幅提高新药研发效率,降低制药时间与成本。(一)辅助医生诊断,缓解漏诊误诊问题 医疗数据中有超过 90%的数据来自于医学影像,但是对医学影像的诊断依赖于人工主观分析。人工分析只能凭借经验去判断,容易发生误判。据中国医学会数据资料显示,中国临床医疗每年的误诊人数约为 5700 万人,总误诊率为 27.8%,器官异位误诊率为 60%。以心肌互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 13 绞痛病症为例,其早期临床表现轻微,除胸口痛外,常会伴随出现肩部到手部内侧疼痛,精神焦虑,血压异常等寻常体征现象,对于门诊医生而言很容易发生误诊。对于病理医生而言,从众多细胞中依靠经验找到微小的癌变
20、细胞难度较大,诊断错误现象时有发生。人工智能技术的出现已经在一定程度上缓解了以上问题。利用图像识别技术,通过大量学习医学影像,人工智能辅助诊断产品可以辅助医生进行病灶区域定位,有效缓解漏诊误诊问题。(二)提高诊断效率,弥补资源供需缺口 据统计,我国每千人平均医生拥有量仅为 2.1 人2,医生资源缺口问题较为严重。图 3 我国每千人平均医生拥有量 2 数据来源:卫计委统计数据 互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 14 医生资源缺口问题在影像科、病理科方面尤为严重。目前我国医学影像数据的年增长率约为 30%,而放射科医师数量的年增长率仅为4.1%。放射科医师数量的增长远不及影像数
21、据增长。这个现象意味着放射科医师在未来处理影像数据的压力会越来越大,甚至远远超过负荷。供需不对称的问题在病理方面表现尤甚。据统计,我国病理医生缺口达到 10 万,而培养病理医生的周期却很长,这意味着此问题短 期内将无法解决。面对严重的稀缺资源缺口问题,人工智能技术或将 带来解决这个难题的答案。人工智能辅助诊断技术应用在某些特定病种领域,甚至可以代替医生完成疾病筛查任务,这将大幅提高医疗机构、医生的工作效率,减少不合理的医疗支出。(三)疾病风险预警,提供健康顾问服务 多数疾病都是可以预防的,但是由于疾病通常在发病前期表征并不明显,到病况加重之际才会被发现。虽然医生可以借助工具进行疾辅助预测,但人
22、体的复杂性、疾病的多样性会影响预测的准确程度。人工智能技术与医疗健康可穿戴设备的结合可以实现疾病的风险预测和实际干预。风险预测包括对个人健康状况的预警,以及对流行病互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 15 等公共卫生事件的监控;干预则主要指针对不同患者的个性化的健康管理和健康咨询服务。图 4 人工智能+院前管理:预测+干预(四)支持药物研发,提升制药效率 利用传统手段的药物研发需要进行大量的模拟测试,周期长、成本高。目前业界已尝试利用人工智能开发虚拟筛选技术,发现靶点、筛选药物,以取代或增强传统的高通量筛选(HTS)过程,提高潜在药物的筛选速度和成功率。通过深度学习和自然语言
23、处理技术可以理解和分析医学文献、论文、专利、基因组数据中的信息,从中找出相应的候选药物,并筛选出针对特定疾病有效的化合物,从而大幅缩减研发时间与成本。(五)手术机器人,提升外科手术精准度 智能手术机器人是一种计算机辅助的新型的人机外科手术平台,主要利用空间导航控制技术,将医学影像处理辅助诊断系统、机器人互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 16 以及外科医师进行了有效的结合。手术机器人不同于传统的手术概念,外科医生可以远离手术台操纵机器进行手术,是世界微创外科领域一项革命性的突破。目前达芬奇机器人是世界上最为先进的微创外科手术系统之一,集成了三维高清视野、可转腕手术器械和直觉式
24、动作控制三大特性,使医生将微创技术更广泛地应用于复杂的外科手术。相比于传统手术需要输血,会带来传染疾病等危险,机器人做手术则出血很少。此外,手术机器人可以保证精准定位误差不到 1 毫米,对于一些对精确切口要求非常高的手术实用性很高。三、国内外医疗人工智能发展状况及分析三、国内外医疗人工智能发展状况及分析 (一)市场规模及发展趋势 据统计,到 2025 年人工智能应用市场总值将达到 1270 亿美元,其中医疗行业将占市场规模的五分之一。我国正处于医疗人工智能的风口:2016 年中国人工智能+医疗市场规模达到 96.61 亿元,增长37.9%;2017 年将超过 130 亿元,增长 40.7%;2
25、018 年有望达到 200亿元。投资方面,据 IDC 发布报告的数据显示,2017 年全球对人工智能和认知计算领域的投资将迅猛增长60%,达到125亿美元,在2020年将进一步增加到 460 亿美元。其中,针对医疗人工智能行业的投资互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 17 也呈现逐年增长的趋势。其中 2016 年总交易额为 7.48 亿美元,总交易数为 90 起,均达到历史最高值3。图 5 2012-2016 年全球医疗人工智能投融资情况(二)国内外行业发展热点分析 国内外科技巨头均重视人工智能技术在医疗领域的布局与应用。IBM在2006年启动Watson项目,于2014年投
26、资10亿美元成立Watson事业集团。Watson 是一个通过自然语言处理和机器学习,从非结构化数据中洞察数据规律的技术平台。Watson 将散落在各处的知识片段连接起来,进行推理、分析、对比、归纳、总结和论证,获取深入 3 数据来源:IDC 统计数据 互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 18 的洞察以及决策的证据。2015 年,沃森健康(Watson Health)成立,专注于利用认知计算系统为医疗健康行业提供解决方案。Watson 通过和一家癌症中心合作,对大量临床知识、基因组数据、病历信息、医学文献进行深度学习,建立了基于证据的临床辅助决策支持系统。目前该系统已应用于肿
27、瘤、心血管疾病、糖尿病等领域的诊断和治疗,并于 2016 年进入中国市场,在国内众多医院进行了推广。Watson 在医疗行业的成功应用标志着认知型医疗时代的到来,该解决方案不仅可以提高诊断的准确率和效率,还可以提供个性化的癌症治疗方案。此外,谷歌、微软等也都纷纷布局医疗 AI。2014 年谷歌收购DeepMind 公司,后开发知名的人工智能程序 AlphaGo。在基础技术层面,谷歌的开源平台 TensorFlow 是当今应用最广泛的深度学习框架。在医疗健康领域,Google 旗下的 DeepMind Health 和英国国家医疗服务体系 NHS(National Health Service)
28、展开合作,DeepMind Health可以访问 NHS 的患者数据进行深度学习,训练有关脑部癌症的识别模型。微软将人工智能技术用于医疗健康计划“Hanover”,寻找最有效的药物和治疗方案。此外,微软研究院有多个关于医疗健康的研究项目。Biomedical Natural Language Processing 利用机器学习从互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 19 医学文献和电子病历中挖掘有效信息,结合患者基因信息研发用于辅助医生进行诊疗的推荐决策系统。国内科技巨头也纷纷开始在医疗人工智能领域布局,各家公司均投入大量资金与资源,但各自的发展重点与发展策略并不相同。例如,阿
29、里健康以云平台为依托,结合自主机器学习平台 PAI2.0 构建了坚实而完善的基础技术支撑。同时,阿里健康与浙江大学医学院附属第一医院、浙江大学第二附属医院等医院、上海交通大学医学院附属新华医院以及第三方医学影像中心建立了合作伙伴关系,重点打造医学影像智能诊断平台,提供三维影像重建、远程智能诊断等服务。此外,阿里云联合英特尔、零氪科技联合举办了天池医疗 AI 大赛。该大赛面向全球第一高发恶性肿瘤肺癌,以肺部小结节病变的智能识别、诊断为课题,开展大数据与人工智能技术在肺癌早期影像诊断上的应用探索。大赛基于阿里云天池大数据平台,邀请全球生物、医疗、人工智能等众多领域的校内团队、专家学者、医疗企业参赛
30、。参赛者使用大赛提供的数千份胸部 CT 扫描数据集进行预训练,在此基础上开发算法模型,检测 CT 影像中的肺部结节区域。准确率排名靠前的参赛者将进入决赛,决赛要求参赛者提交诊断结果的 CSV 文件,并标记检测到的结节坐标,最终根据参赛者给出的坐标信息判断结节是否互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 20 检测正确,如果结节落在以参考标准为中心半径为 R 的球体中,则认为检测正确。大赛通过探索早期肺癌精确智能诊断的优秀算法,提升早期肺癌检测的准确度,降低临床上常见的假阳性的误诊发生,实现“早发现,早诊断,早治疗”。同时,本次大赛能够激发传统医学与机器学习的碰撞与融合,为整体学科发
31、展进行探路与思辨,推动了人工智能技术在医疗影像诊断上的应用。腾讯在人工智能领域的布局涵盖基础研究、产品研发、投资与孵化等多个方面。腾讯在 2016 年建立了人工智能实验室 AI lab,专注于 AI 技术的基础研究和应用探索。2017 年 11 月,在“2017 腾讯全球合作伙伴大会”上腾讯宣布了自己的“AI 生态计划”,旨在开放AI 技术,并结合资本机构孵化医疗 AI 创业项目。2017 年 4 月,腾讯向碳云智能投资 1.5 亿美元。碳云智能由原华大基因 CEO 王俊牵头组建,致力于建立人工智能的内核模型,并对健康风险进行预警、进行精准诊疗和个性化医疗。在产品研发方面,腾讯在 2017 年
32、 8 月推出了自己首个应用在医学领域的 AI 产品腾讯觅影。腾讯觅影把图像识别、深度学习等领先的技术与医学跨界融合,可以辅助医生对食管癌进行筛查,有效提高筛查准确度,促进准确治疗。除了食管癌,腾讯互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 21 觅影未来也将支持早期肺癌、糖尿病性视网膜病变、乳腺癌等病种的早期筛查。在国际上权威的肺结节检测比赛 LUNA 中,中国企业参赛队伍阿里云 ET 和科大讯飞均取得了优异的成绩。科大讯飞医学影像团队以92.3%的召回率刷新了世界记录。召回率是指成功发现的结节数在样本数据中总节结数的占比。召回率是评测诊断准确率的重要指标,召回率低代表遗漏了患者的关
33、键病灶信息,因此科大讯飞团队采用了多尺度、多模型集成学习的方法显著提升了召回率,同时针对假阳性导致的医生重复检测问题,创新性地使用结节分割和特征图融合的策略进行改善。在诊断效率方面,科大讯飞团队采用 3D CNN 模型来计算特征图,并在特征图上进行检测,并通过预训练大幅提升了检测效率,实现薄层 CT 的秒级别处理。四、我国医疗人工智能细分领域四、我国医疗人工智能细分领域 人工智能与医疗的结合方式较多,就医流程方面包括诊前、诊中、诊后;适用对象方面包括医院、医生、患者、药企、检验机构等;从赋能医疗行业的角度分析,包括降低医疗成本,提高诊断效率等多种互联网医疗健康产业联盟 医疗人工智能技术与应用白
34、皮书 22 模式。我国医疗人工智能企业聚焦的应用场景集中在虚拟助理、病历与文献分析、医疗影像辅助诊断、药物研发、基因测序等领域。(一)虚拟助理 虚拟助理是指通过语音识别、自然语言处理等技术,将患者的病症描述与标准的医学指南作对比,为用户提供医疗咨询、自诊、导诊等服务的信息系统。智能问诊是虚拟助理广泛应用的场景之一。智能问诊是指机器通过语义识别与用户进行沟通,听懂用户对于症状的描述,再根据医疗信息数据库进行对比和深度学习,对患者提供诊疗建议,包括用户可能患有的健康隐患,应当在医院进行复诊的门诊科目等。通用型的虚拟助手如苹果 Siri、微软 Cortana 等与用户沟通时,用户可以自由输入,由虚拟
35、助手进行语义理解。医疗领域的虚拟助手与通用型的虚拟助手和用户的沟通方式不同,因为普通用户难以使用准确的医学用语去描述自己的问题。因此,医疗虚拟助手在帮助用户进行智能问诊时通常采用选择题的形式。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 23 图 6 虚拟助理系统进行智能问诊 智能问诊在医生端和用户端均发挥了较大的作用。在医生端,智能问诊可以辅助医生诊断,尤其是受限于基层医疗机构全科医生数量、质量的不足,医疗设备条件的欠缺,基层医疗成为了我国分级诊疗发展的瓶颈。人工智能虚拟助手可以帮助基层医生进行对一些常见病的筛查,以及重大疾病的预警与监控,帮助基层医生更好地完成转诊的工作,这是人工智
36、能问诊在医生端的价值体现。在用户端,人工智能虚拟助手能够帮助普通用户完成健康咨询、导诊等服务。在很多情况下,用户身体只是稍感不适,并不需要进入医院进行就诊。人工智能虚拟助手可以根据用户的描述定位到用户的健康问题,提供轻问诊服务和用药指导。2017 年,康夫子、大数医达等公司研发的智能预问诊系统得到了在多家医院的落地应用。预问诊系统是基于自然语言理解、医疗知识图谱及自然语言生成等技术实现的问诊系统。患者在就诊前使用预问诊系统填写病情相关信息,由互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 24 系统生成规范、详细的门诊电子病历发送给医生。预问诊系统采用层次转移的设计架构模拟医生进行问诊,
37、既能有逻辑地像医生一样询问基本信息、疾病、症状、治疗情况、既往史等信息,同时可以围绕任一症状、病史等进行细节特征的问诊。除问诊外,预问诊系统基于自然语言生成技术自动生成规范、详细的问诊报告,主要包括:患者基本信息、主诉、现病史、既往史和过敏史五个部分。此外,语音识别技术为医生书写病历,为普通用户在医院导诊提供了极大的便利。当放射科医生、外科医生、口腔科医生工作时双手无法空闲出来去书写病历,智能语音录入可以解放医生的双手,帮助医生通过语音输入完成查阅资料、文献精准推送等工作,并将医生口述的医嘱按照患者基本信息、检查史、病史、检查指标、检查结果等形式形成结构化的电子病历,大幅提升了医生的工作效率。
38、科大讯飞的智能语音产品“云医声”为了应对医院科室内嘈杂的环境,达到更好的语音处理效果,开发了医生专用麦克风,可以过滤掉噪音及干扰信息,将医生口述的内容转换成文字。目前,讯飞医疗的语音转录准确率已超过 97%,同时推出了 22 种方言的版本,并已在北大口腔、瑞金医院等超过 20 家医院落地使用。科大讯飞的另一款产品“晓医”导诊机器人利用科大讯飞的智能语音和人工智能技术,能够通过与患互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 25 者进行对话理解患者的需求,实现智能地院内导诊,告诉患者科室位置、应就诊的科室,并解答患者就诊过程中遇到的其他问题,实现导医导诊,进一步助力分诊。“晓医”机器人
39、目前已在安徽省立医院、北京 301 医院等多家医院投入使用。(二)病历与文献分析 电子病历是在传统病历基础上,记录医生与病人的交互过程以及病情发展情况的电子化病情档案,包含病案首页、检验结果、住院记录、手术记录、医嘱等信息。其中既有结构化数据,也包括大量自由文本输入的非结构化数据。对电子病历及医学文献中的海量医疗大数据进行分析,有利于促进医学研究,同时也为医疗器械、药物的研发提供了基础。人工智能利用机器学习和自然语言处理技术可以自动抓取来源于异构系统的病历与文献数据,并形成结构化的医疗数据库。大数医达、惠每医疗、森亿智能等企业正是基于自己构建的知识图谱,形成了供医生使用的临床决策支持产品,为医
40、生的诊断提供辅助,包括病情评估、诊疗建议、药物禁忌等。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 26 图 7 医疗知识图谱构建及应用 构建医疗知识图谱的过程需经过医学知识抽取、医学知识融合的过程。在医学知识抽取过程中,传统的基于医学词典及规则的实体抽取方法存在诸多弊端。首先,目前没有医学词典能够完整地囊括所有类型的生物命名实体,此外同一词语根据上下文语境的不同可能会指代的是不同实体,因此简单的文本匹配算法无法识别实体。近年来,深度学习开始被广泛应用于医学实体识别,目前实验结果表明基于BiLSTM-CRF 的模型能够达到最好的识别效果。由于数据来源的多样性,在医学知识融合的过程中存在
41、近义词需要进行归类,目前分类回归树算法、SVM 分类方法在实体对齐的过程中可以实现良好的效果。和其他行业相比,分散在医疗信息化各个业务系统中的数据包含管理、临床、区域人口信息等多种数据,复杂性更高,隐藏价值更大。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 27 新华三等企业在 2017 年大力推进利用大数据技术挖掘医疗数据价值,助力人工智能与精准医疗。通过大数据平台充分挖掘各种类型数据的价值,帮助实现辅助诊断、精准医疗、临床科研等多种目标。大数据平台通过自然语言处理技术,对电子病历中的自由文本进行分词、实体识别、依存句法分析、信息提取等操作,实现自由文本结构化。在实现病历结构化的基础
42、上,利用机器学习聚类分析建立诊断建议模型,从而为医生的临床决策提供支持。对电子病历的结构化和数据挖掘,可以帮助一线人员及科研人员挖掘疾病规律,进行疾病相关性分析、患病原因分析、疾病谱分析等,并建立新的研究课题。例如,新华三在协助医院进行关于卵巢癌的相关课题研究时,得出血小板与淋巴细胞的关系对卵巢癌诊断具有重要价值。(三)医疗影像辅助诊断 医疗影像数据是医疗数据的重要组成部分,从数量上看超过 90%以上的医疗数据都是影像数据,从产生数据的设备来看包括 CT、X 光、MRI、PET 等医疗影像数据。据统计,医学影像数据年增长率为 63%,而放射科医生数量年增长率仅为 2%,放射科医生供给缺口很大。
43、人工智能技术与医疗影像的结合有望缓解此类问题。人工智能技术在医互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 28 疗影像的应用主要指通过计算机视觉技术对医疗影像进行快速读片和智能诊断。人工智能在医学影像中应用主要分为两部分:一是感知数据,即通过图像识别技术对医学影像进行分析,获取有效信息;二是数据学习、训练环节,通过深度学习海量的影像数据和临床诊断数据,不断对模型进行训练,促使其掌握诊断能力。目前,人工智能技术与医疗影像诊断的结合场景包括肺癌检查、糖网眼底检查、食管癌检查以及部分疾病的核医学检查和病理检查等。利用人工智能技术进行肺部肿瘤良性恶性的判断步骤主要包括:数据收集、数据预处理、
44、图像分割、肺结节标记、模型训练、分类预测。首先要获取放射性设备如 CT 扫描的序列影像,并对图像进行预处理以消除原 CT 图像中的边界噪声,然后利用分割算法生成肺部区域图像,并对肺结节区域进行标记。数据获取后,对 3D 卷积神经网络的模型进行训练,以实现在肺部影像中寻找结节位置并对结节性质进行分类判断。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 29 图 8 人工智能技术在肺结节检查中的应用 食管癌是常见恶性肿瘤之一,据统计,我国 2015 年新发食管癌人数为 47.7 万,占全球患病人数的 50%。针对食管癌的早期治疗是诊疗的关键,食管癌早期五年内治疗的生存率超过 90%,而进展期
45、/晚期五年生存率则小于 15%。但是由于基层医疗机构医生缺乏足够的认知以及筛查手段,导致我国对早期食管癌的检出率较低。利用人工智能技术辅助医生对食管癌进行筛查,可以有效提高筛查准确度与检测效率。腾讯公司研发的觅影 AI 针对食管癌的早期筛查准确率可超过 90%,并且完成一次内镜检查的时间已经可控制在数秒之内。根据拓扑特征分割初始兴趣区 手工输入大量标记数据对深度学习模型进行训练和调整 根据深度学习训练经验进行筛选,并分类 互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 30 图 9 腾讯觅影对食管癌的识别整体流程 阿尔茨海默病,俗称老年痴呆症,是一种发病进程缓慢、随着时间不断恶化的持续性
46、神经功能障碍,该疾病的真正成因至今仍不明确,没有可以阻止或逆转病程的治疗。在我国,对该病症的重视程度不高,现已造成就诊率低、诊断率低、治疗率低的“三低”局面。根据国际阿尔茨海默病联合会报告,2015 年中国阿尔茨海默病患者超过 950 万,患病人数已居世界第一,且仍在快速增长,2050 年或将达到 3000 万。阿尔茨海默症在患病早期是可以干预的,但检测却相对困难,越早检测出这种病症,患者就越有机会提早寻求治疗,减缓病情的影响。阿尔茨海默病的临床诊断需要通过神经心理学测验、血液学检查、结构影像学或功能影像学检查、脑电图等方式综合判断。阿尔茨海默病的诊疗难点在于症状以及检查指标等的非特异性,较难
47、实现早期诊断。雅森科技等企业通过输入核磁、脑电图和量表三种不互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 31 同类型的数据,综合运用机器训练、统计分析和深度学习的方法,找出患者是否患病与输入信息之间的关系。对于阿尔茨海默病诊断所用到的人工智能,已不只是传统意义上的深度学习对医学影像的识别,而是在此基础上找出多种信息源之间的联系,并基于这三种数据训练多模态神经网络训练模型,从而提前两至三年预测老年痴呆发病的可能性以及病情发展的阶段。糖网病是糖尿病引起的视网膜病变。据统计,我国约 5 亿人处于糖尿病前期,糖尿病患者约有 1.1 亿人,糖网病患者约有 3000 万。对糖尿病患者进行眼底筛查
48、具有重要意义,因为糖网病患者通常早期难以发觉患有疾病,症状表现不明显,只有经过眼底早期筛查,及时发现糖网病,及早干预,才能有效抵制疾病的发生。相较于其他疾病的诊断需要结合临床信息,人工智能在糖网眼底领域的检查具备更高的可操作性,因为仅针对眼部图像的检查就具备较高的诊疗价值。针对渗出或者出血等病变,AI 系统也可以实现较高的准确率。在 2017年,众多企业、科研机构均进行了关于此方面的研究。例如,中国移动通信有限公司研究院与沈阳何氏眼科医院有限公司深度合作,研发眼底图像质量评估、糖尿病视网膜病变严重程度分级、糖网病变病灶位置检测等智能算法。首先对所采集的眼底图像质量是否合格(即是互联网医疗健康产
49、业联盟 医疗人工智能技术与应用白皮书 32 否满足病理分析要求)进行评估,并对质量合格的眼底图像,分析其为左眼或右眼、是否存在眼底疾病、糖网病变严重程度的分级(如有糖网),并检测眼底图像中出现微动脉瘤、出血、渗出等糖网病变病灶的具体位置,最终自动生成结构化筛查报告,为患者提供转诊建议。中国移动研究院面向基层医院、眼视光中心、社区服务站、乡村诊所等基层筛查场景,将专业眼科影像设备采集的眼底图像通过固网或移动蜂窝网上传至云端,利用先进的人工智能、深度学习技术进行分析,实现眼底致盲疾病的自动筛查、糖尿病视网膜病变(如有)严重程度分级以及病灶位置检测和跟踪,其结果供临床医生参考,施行必要的干预、治疗,
50、使广泛、低成本、快速响应的规模化筛查成为可能。病理是医学界的金标准,也是许多疾病诊断的最终确定指标。但是,病理医生通常必须花费大量的时间检查病理切片,因为病理医生需要在上亿级像素的病理图片中识别微小的癌细胞。对于同一种疾病的病理诊断,不同的医生往往会得出不同的判断结论,足见病理诊断存在的误诊问题。人工智能技术为数字病理诊断带来了技术革新,帮助病理医生提高效率避免遗漏。相较于 CT、X 光等影像的人工智能辅助诊断,病理人工智能辅助诊断难度更大,因为病理的诊断既要观察整体,还要观察局部;不只要学习细胞特征,还要学习其生物行为。互联网医疗健康产业联盟 医疗人工智能技术与应用白皮书 33 我国已有兰丁