医疗大数据的发展阶段和行业现状分析

医观 2019/06/25 11:29

近年来, 健康医疗大数据相关产业已经被列入国家大数据战略布局, 和医疗健康大数据相关的政策频出。 在众多健康医疗大数据相关政策中, 其中比较著名的是 2014 年国家卫计委制定“ 46312”工程,即建设国家级、省级、地级市、县级 4 级 卫生信息平台, 构建电子监控档案数据库、 电子病历数据库、 全员人口个案数据库 3 个数据库, 建立一个安全的卫生网络, 加强卫生标准体系和安全体系建设。

2018 年 9 月 13 日,国家卫生健康委印发了《 国家健康医疗大数据标准、安全和服 务管理办法( 试行)》, 对医疗健康大数据行业从规范管理和开发利用的角度出发进行规范。《 办法》 从医疗大数据标准、 医疗大数据安全、 医疗大数据服务、医疗大数据监督四个方面提出指导意见, 直击目前医疗大数据领域的痛点, 未来对数据的统筹标准管理、 落实安全责任、 规范数据服务和管理具有重要意义。

本报告从医疗大数据行业的市场出发, 收集了国内参与医疗健康大数据的561 家企业的资料,从细分领域、大数据价值、大数据作用等维度进行梳理,分析医疗大数据的发展阶段和行业现状。

目录

第一章 汹涌而来的大数据洪流

第二章 医疗大数据沙漏模型

一、什么是医疗大数据

二、医疗大数据沙漏模型

三、医疗大数据的四大特征

四、顶层设计支持医疗大数据发展

第三章 医疗大数据的采集

一、医疗大数据的分类

二、医疗大数据来源详解

1.电子病历数据

2.检验数据

3.影像数据

4.费用数据

5.基因测序数据

6.医药研发数据

7.药品流通数据

8.智能穿戴数据

9.移动问诊数据

10.体检数据

第四章 治理数据形成知识

一、医疗大数据应用的主要挑战

二、大数据的治理

图片来源:阿里云

第五章 行动——医疗大数据的价值输出

一、临床诊断辅助系统

二、医生辅助工具

三、慢病管理

四、保险

五、医药研发

六、医院管理决策辅助

七、健康管理

八、智慧养老

九、药企市场营销

十、基因大数据

第六章 医疗大数据企业市场分析

一、医疗大数据企业市场布局

二、医疗大数据行业发展难点

三、医疗大数据产业目前处于发展的第二阶段

4、保持文印室、接待区域办公环境整齐、清洁。

第一章 汹涌而来的大数据洪流

人类的任何表现和行为都可以产生数据,只是之前这些体征和行为并没有被合适的设备数字 化,并收集和存储起来。21 世纪初,随着信息化技术的普及,人们已经关注到数据所能带来 的价值。此时所产生的数据,局限于计算机平台和互联网。此时所能收集的,也只是人类在互 联网环境中所产生的部分数据。

大数据,顾名思义就是数量非常庞大的数据。对这些数据进行合理的应用,同时挖掘出价值, 也就形成了大数据产业。

随着传感器技术的进步、数据处理能力的增强、计算和存储成本的降低、网络的扩大,使得数 据的收集、存储和分析能力不断提升。特别是进入万物智能互联的新时代之后,产生数据的终 端越来越多,也越来越智能。现在,数字化技术已经无处不在。同时,产生数据的主体也不再 仅仅是人,还有物体。各个细分行业、经济体、传感器、个人无时无刻不在产生数据,而且消 费者也正在从这些数据中受益。因此,在 2010 年前后,互联网开始出现了汹涌而来的大数据洪流。

从上世纪 80 年代开始,每隔 40 个月,世界上存储的数据容量就会翻倍(Hibert & Lopez,2011)。 IDC 在 2014 年的一份报告中提供了一份数据,2013 年全球数据总量达到了 4.4ZB,而从 2013年发展到 2020年,全球数据总量将会增长 10 倍,达到 44ZB。越来越多的数据产生设备通过 互联网传至数据存储商。数据量的爆发增长,首先为数据存储商带来了商业机会,营收也大幅 度增加。其次,大数据在经过价值挖掘之后,还能为经济发展提供显著的动力。

新知图谱, 医疗大数据的发展阶段和行业现状分析

这些数据来自哪里?每天有超过 9 亿的微信、4 亿的微博、20 亿的推特等社交软件的活跃用户在产生数据,每天还有 348亿 RFID设备、60亿台智能手机、数亿台支持 GPS的设备在产生数据。数据的产生源和单一数据的量级都在无限扩大。移动电话、智能手表、摄像头、音频设 备、定位设备被大量使用后,它可以方便地对人体和环境进行感知,将数据收集起来在互联网 上传送。通过工具捕获、存储、加工、管理和分析大数据之后,形成了新的大数据产业。从大 数据中萃取洞见来辅助决策,已经在各行各业发挥着重要的经济价值。数据可以为各行各业的 行为提供指导,提高效率,创造经济价值。

从产业层面来看,全球大数据领域的相关公司都在快速发展,中国信息通信研究院预估我国大 数据领域 2017年的产业规模为 4700 亿元,增长率约 30%。其中,大数据软硬件的产值约为

234 亿元人民币,增长率约为 39%。

新知图谱, 医疗大数据的发展阶段和行业现状分析

如此巨量的数据,里面存在着宝藏,也充斥着大量的垃圾。IDC 的报告显示,有意义的数据只 占全球数据量的 1.5%。大数据的价值还需要深入的挖掘,才能将其发挥出来。大数据就像是石 油,没有经过开采的原油埋藏在地里,就不会产生价值。但是,数据原油在经过加工和提炼之 后,所产生的知识沉淀,将会对全球经济的发展提供巨大的助力。而如今,医疗大数据领域也 已经开始进入到价值输出时代,在诊疗、医院管理的过程中发挥着重要的价值。

早期,IBM定义了大数据的特性有 3 个:大量性(Volume)、多样性(Variety)、快速性(Velocity)。 后来,对大数据的特点描述经过专家的进一步完善,总结为六个特征。

新知图谱, 医疗大数据的发展阶段和行业现状分析

高容量:数据的总容量大,单一数据集的数据总量在几十 GB,甚至几十 TB之间。未来,随着 采样率的提升,单一数据集的总量还会持续上升。

多样性:数据种类丰富,文本、日志、图片、视频等等,数字化和模拟化,结构化和非结构化 数据都有。

快速性:数据的创建速度快,更新频率快。很多数据的采样时间已经从周、月升级到分、秒, 甚至是连续性数据。同时,数据的转移速度快,也需要快速实时处理。

易变性:大数据具有多层结构,这意味着大数据会呈现出多变的形式和类型。相较传统的业务 数据,大数据存在不规则和模糊不清的特性,造成很难甚至无法使用传统的应用软件进行分析。

准确性:大数据可利用的基础是数据的准确性,大数据分析的前提是准确性要得到保证。数据 质量不高,会造成数据分析质量低下。

复杂性:数据量巨大,来源渠道多,数据的管理和操作复杂程度高。想要提炼出数据的有效价 值变得挑战性巨大。

大数据从哪里来?到哪里去?本报告将从医疗大数据这个细分领域,去探讨医疗大数据的流向 和价值输出,了解医疗大数据从产生、挖掘、治理、价值利用的全过程,让我们对医疗大数据 行业产生全面的认识。

第二章 医疗大数据沙漏模型

一、什么是医疗大数据

医疗大数据是指个人从出生到死亡的全生命周期过程中,因为免疫、体检、门诊、住院等健康 活动所产生的大数据。

通过对医疗大数据的分析和加工,可以挖掘出和疾病诊断、治疗、公共卫生防治等方面的重要 价值。医疗大数据的应用并不仅仅是在信息化时代才出现。早在 19 世纪,英国流行病学家、麻醉学家约翰·斯诺(John Snow)博士运用近代早期的数据科学,记录每天的死亡人数和伤患 人数,并将死亡者的地址标注在地图上,绘制了伦敦霍乱爆发的“群聚”地图。霍乱在过去被 普遍认为是由“有害”空气导致的,斯诺通过调查数据的汇总,确定了“霍乱”的元凶是被污 染的公共水井,并同时奠定了疾病细菌理论的基础。

从最早的手工统计,到计算机的出现,再到各种传感器技术的普及。数据的收集和存储更加方 便,变成了自动化、数字化、密集化的方式,来源也越来越广。在过去的十年里,随着电子病 历的实施,数字化的实验室幻灯片,高分辨率的影像图片、视频,医疗保健数据量呈指数级增 长。再加上制药企业和学术研究机构档案,以及数万亿的数据流从智能化设备、可穿戴式设备 的传感器中得到,数据洪流已经滚滚而来。

现阶段电子病历的广泛应用,使得有价值的医疗大数据实现了快速增长,可供医生、研究者和 患者使用的数据量极大地提升。EMC 和 IDC 发布的报告显示,2013 年全球医疗保健数据量为 153 EB,预计年增长率为 48%。这意味着到 2020 年,这个数字将达到 2314EB(2.26ZB)。因 此,我们计算出医疗数据的总量约占到全球所有数据容量的 5.1%。

大数据分析可以帮助医生确定治疗方案、药物种类和剂量、公共卫生防疫等临床指导。也可以 帮助医院的管理者制定更好的管理方式,帮助保险方制定更好的医疗保险支付模式。医疗服务 的提供者获取了更多的大数据信息之后,从经验医疗向循证医学进行转变。我们需要不断引入 新技术、新概念,提升对这些数据的管理和分析能力,为管理者和临床医务人员做出准确的工 作决策提供依据。

二、医疗大数据沙漏模型

动脉网从医疗大数据的从数据采集、数据治理和数据应用三个方面描述了医疗大数据的发展流 向,绘制了医疗大数据的沙漏模型。数据的采集、治理和应用这三步,反映了大数据的状态变 化,从数据形成知识,从知识指导行动的过程。

新知图谱, 医疗大数据的发展阶段和行业现状分析

更细分一些,大数据领域可以分成数据采集、数据存储、数据治疗、数据分析、数据应用五个 方面。医疗大数据的输入端,是各种信息化系统、传感器、智能设备所产生的医疗健康数据。 庞大的医疗大数据在收集完成后存储在数据中心,然后经过清洗加工之后,挖掘其内在有用的 数据。最后,通过大数据分析之后产生的知识来指导医疗行为,从而产生价值。

通常,人们只认识到医疗大数据的数据来源越来越丰富,也认识到医疗大数据可以为医疗服务 提供有价值的参考意见。前面我们提到,大数据量虽大,但是垃圾数据居多,有价值的数据比 例不高。医疗大数据如果能够经过中间步骤的清洗和加工,那么医疗大数据所能发挥的价值会 越大。所以,医疗大数据从输入、加工到应用三个步骤缺一不可。我们所绘制的医疗大数据沙 漏模型,描绘了医疗大数据从数据形成知识,再形成行动指导的三个重要步骤。

新知图谱, 医疗大数据的发展阶段和行业现状分析

医疗大数据行业不是一开始就形成的,在大数据解决方案出现之前,医疗大数据所能发挥的价 值很低。随着信息化、物联网、云计算、人工智能等技术的发展,大数据的利用价值在增大。 我们从数据获取时代,逐步向信息挖掘时代和价值输出时代过渡。而数据的价值,也从医疗行 为的总结,逐步升级为医疗决策的支持和全方位医疗辅助决策。

三、医疗大数据的四大特征

医疗大数据呈现以下四个特点:

第一,数据量大。从 TB 到 PB 到 EB,再到 ZB,医疗大数据以 48%的年增长率快速增长(IDC, 2014)。这些数据早已超过了人力所能处理的极限。预计到 2020 年,全球医疗大数据将达到

2314EB,已经达到了 ZB 级别。

第二,数据种类多。医疗数据中既有结构化的数据,也有非结构化的数据。结构化数据包括 Oracle、MySql 等数据库的数据,半结构化数据如 XML 文档,非结构化数据包括 Word、PDF、 音视频、影像等。多种类型的数据对数据的处理能力提出了更高的要求。

第三,数据产生快,处理快。医疗信息服务中会存在大量在线或实时数据分析处理的需求。需 对数据进行实时或准实时的处理、秒级的查询需求响应。例如临床中的诊断和处方数据,健康 指标预警等。

第四,数据缺乏标准。各个医生、各家医疗机构、各个地区的数据没有统一的规范标准,数据 的质量不佳。患者的基础信息和各种临床信息资源分散、重复、孤立,导致有效信息闲置、信 息重复或标准不一致,很难得到有效利用。

健康医疗大数据是一种高附加值的信息资产,虽然个体健康医疗数据对于医疗技术革新的价值 有限,但通过对海量、来源分散、格式多样的数据进行采集、存储、深度学习和开发,可以从 中发现新知识、创造新价值、提升新能力,从而进一步反哺健康医疗服务产业。因此,健康医 疗大数据的发展关乎国计民生,具有重大的战略性意义。

四、顶层设计支持医疗大数据发展

当前,社会整体信息化程度不断加深,信息技术对健康医疗事业的影响日趋明显,以大数据、 云计算、移动互联等新兴信息技术为核心的新一轮科技革命,推动了人口健康信息化和健康医 疗大数据应用发展,加速了健康医疗领域新模式、新业态、新技术的涌现。国家已陆续出台关 于扶持医疗大数据发展的相关政策,初步做好顶层设计并构建出医疗大数据发展的宏伟蓝图。

新知图谱, 医疗大数据的发展阶段和行业现状分析

2014 年国家卫计委制定“46312”工程,即建设国家级、省级、地级市、县级 4 级卫生信息平 台,依托于电子健康档案和电子病历,支撑公共卫生、医疗服务、医疗保障、药品管理、计划 生育、综合管理等 6 项业务应用,构建电子监控档案数据库、电子病历数据库、全员人口个案

数据库 3 个数据库,建立一个安全的卫生网络,加强卫生标准体系和安全体系建设。

人口数据库:主要包含人口信息,数据来源于各大部门(卫计委、公安、民政、统计、人力社 保、教育等)交互共享。

健康档案数据库:主要包含定期或不定期的健康体检记录、卫生服务过程中的各种服务记录、 专题健康或疾病调查记录。数据来源于体检机构、医院和基层。

电子病历数据库:主要包含医院诊断治疗全过程原始记录,数据来源于医院,其商业化价值最 高。

除此之外,近两年和医疗健康大数据相关的政策也出台不少,从顶层设计、具体规划指导、数 据隐私和安全、数据管理等多个方面提出了相关的指导意见。

2015 年,《“互联网+”行动计划》 第十二届全国人民代表大会上,总理提出制定“互联网+”行动计划,“互联网+医疗行业”进 一步推动互联网与传统医疗行业的融合。

2015 年 9 月,《关于促进大数据发展的行动纲要》 大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推 进数据资源向社会开放。推动大数据发展和应用,在未来 5 至 10 年打造精准治理、多方协作 的社会治理新模式。

2016 年 6 月,《关于促进和规范健康医疗大数据应用发展的指导意见》 健康医疗大数据是国家重要的基础性战略资源,规范和推动健康医疗大数据融合共享、开放应 用,将健康医疗大数据应用发展纳入国家大数据战略布局

2016 年 7 月,《国家信息化发展战略纲要》 实施国家大数据战略,从三个方面加快推进政府数据开放,尽快建立政府数据采集质量保障和 安全管理标准,加强政府数据开放的标准化,以方便社会各方面利用。

2016 年 10 月《“健康中国 2030”规划纲要》

“健康中国 2030”是我国未来 15 年推进健康中国建设的行动纲要,其中特别强调发展健康产 业和医疗大数据、培育健康医疗大数据应用新业态。由此可见,在国家政策的引导和激励下, 医疗大数据有潜力成为未来健康医疗产业发展新的增长极。但与此同时,纲要也明确指出,需 加强健康医疗大数据相关法规和标准体系建设。

2017 年 1 月,《“十三五”全国人口健康信息化发展规划》

《规划》将明确全面建成人口健康信息平台,从人口健康信息化和健康医疗大数据基础建设、 人口健康信息化和健康医疗大数据应用方向、创新发展等三个方面着手,规范和推动“互联网+健康医疗”应用等 13 项重点任务。

2018 年 9 月,《国家健康医疗大数据标准、安全和服务管理办法(试行)》 国家卫生健康委印发了《国家健康医疗大数据标准、安全和服务管理办法(试行)》,对医疗 健康大数据行业从规范管理和开发利用的角度出发进行规范。《办法》从医疗大数据标准、医 疗大数据安全、医疗大数据服务、医疗大数据监督四个方面提出指导意见,直击目前医疗大数 据领域的痛点,未来对数据的统筹标准管理、落实安全责任、规范数据服务和管理具有重要意 义。

目前,健康医疗大数据领域的法律法规存在明显的滞后性,因缺乏全面、细致、明确的指引和 规则,健康医疗大数据的发展受到严重制约。虽然很多民营企业和外资企业都已迫不及待投身 该领域并希望进行深耕布局,但受制于市场准入和产业政策的不确定性,目前尚在摸着石头过 河,市场热情和活力并未得到充分、有效的释放。

第三章 医疗大数据的采集

原国家卫计委副主任、中国卫生信息与健康医疗大数据学会会长金小桃预测,在我国人口总量 峰值达到 15 亿的时候,仅是我国的健康医疗大数据总量就会达到 ZB 以上。他认为,医疗健康 大数据,因其宏大的数据总量,将产生宏大的产业规模,取得宏大的经济效益。

医疗大数据的沙漏模型描绘了医疗大数据从数据形成知识,再形成行动指导的三个重要步骤。 第一个重要的步骤,就是收集和存储医疗数据。巧妇难为无米之炊,要获得有价值的诊疗行动 指导,需要增加医疗数据的来源,扩大数据所覆盖的范围。

医疗大数据是指个人从出生到死亡的全生命周期过程中,因疾病、体检、门诊、住院等健康活 动所产生的大数据。医疗大数据狭义上是从因疾病而产生的数据,现在已经扩展到健康状态下 的人体所有体征数据,以及和医疗健康相关的所有费用数据、行为数据。

一、医疗大数据的分类

通常是和医疗行为相关的数据才被称为医疗大数据,但是现在已经扩展到健康人群的健康数 据,以及和医疗健康相关的行为、物资数据。所以,医疗大数据按类型可以分为两种,个人医 疗健康数据和物资数据。

新知图谱, 医疗大数据的发展阶段和行业现状分析

疾病数据是生病的患者因为疾病就诊所产生的病历、影像、检验等数据,以及健康人群的通过

体检、智能设备所收集的体征、基因等健康大数据。生产数据的主体是人。

其他数据是由器械等设备的状态数据、医药流通数据组成,数据的产生主体不是个人,而是和 医疗行为相关的各种器械、物品、药品。

如果我们把医疗大数据按场景分,可以分成两类,包含院内数据和院外数据。

新知图谱, 医疗大数据的发展阶段和行业现状分析

院内数据是在医院所产生的数据。医院的信息化程度日趋成熟,医院信息系统(HIS)、电子 病历系统(EMR)、影像采集与传输系统(PACS)、实验室检查信息系统(LIS)、病理系统(PS)、 医疗器械等信息化系统和设备所记录下来的疾病、体征数据。还包括医院物资管理、医院运营 系统所产生的数据。

院外数据主要是人类在日常生活中所产生的数据。比如通过体检机构、智能穿戴获取的人体体 征数据。还包括医药流通数据、移动问诊等行为数据。物联网和互联网的发展,也让和医、药 相关的行为数据量大大提升。

基因数据其产生环境可能在院内,也可能在院外。根据其产生的目的,用于疾病的诊断、预测, 或者健康人群的个体特征。

国内医疗系统相对较为封闭,公立医院的医疗数据单独存储在院内,数据之间互不流通、不开 放。大量优质的患者健康数据封闭在医院的围墙之内,难以利用。这固然有对患者健康信息安 全性进行考虑的因素,但大量数据躺在医院,也造成了数据的浪费。

二、医疗大数据来源详解

1.电子病历数据 这是患者就医过程中所产生的数据,包括患者基本信息、疾病主诉、检验数据、影像数据、诊

断数据、治疗数据等,这类数据一般产生及存储在医疗机构的电子病历中,这也是医疗数据最 主要的产生地。电子化的医疗病历方便了病历的存储和传输,但是并未达到进行数据分析的要 求。大约 80%的医疗数据是自由文本构成的非结构化数据,其中不仅包括大段的文字描述,也 包括包含非统一文字的表格字段。通过医学自然语言理解技术,将非结构化医疗数据转化为适 合计算机分析的结构化形式是医疗大数据分析的基础。

电子病历中所采集的数据是数据量最多、最有价值的医疗数据。通过和临床信息系统的整合, 内容涵盖了医院内的方方面面的临床数据集。在电子病历的互通互联上,出于各自的利益性(限制病人转诊),各大电子病历企业也不愿意使数据互通互联。根据美国政府相关报告显示,其 电子病历共享比例也仅为 30%左右。

数据采集难度★★★☆☆

数据价值★★★★★

案例:联众电子病历系统 联众电子病历系统集成各种临床医疗系统的数据,以最终建立完整、共享的临床数据中心( CDR) 为软件的核心思想。系统以病人为中心,全面整合 HIS、LIS、PACS、RIS、病理、超声、内镜、 病案、输血、手麻、院感、医保、体检、合理用药等系统,实现医院业务数据的共享,消除医 院内部信息孤岛。联众电子病历涵盖患者在诊疗过程中的图片、文字、表格、语言等多媒体信 息的实时采集、传输、存储、处理、整合和利用。

2.检验数据 医院检验机构产生了大量患者的诊断、检测数据,也有大量存在的第三方医学检验中心也在产 生数据。检验数据是医疗临床子系统中的一个细分小类,但是可以通过检验数据直接患者的疾 病发展和变化。目前临床检验设备得到迅速发展,通过 LIS 系统对检验数据进行收集,可以对 疾病的早发现早诊断和正确诊断做出贡献。

数据采集难度★★☆☆☆

数据价值★★★★☆

案例:东软 LIS 系统

东软 LIS 系统由检验工作站系统、报告查询系统、采血系统、质量控制系统、微生物系统、试 剂管理系统组成。以 “服务临床”为核心,通过基于 TAT 检验样本全流程管理,以及智能化的 临床支持和精细化的检验科室管理能力。东软拥有电子病历、 LIS、EMR 等齐全的医疗信息化 系统,并在其基础上组建了东软医疗大数据科研分析平台。借助这个平台,整合全院来自不同 医疗业务系统的各类临床数据,借助大数据平台的海量数据并发处理能力,为科研医生提供一 个集数据获取、探索、处理、分析、挖掘于一体的自助式分析平台,支持 PB 级医疗数据的存 储管理,查询分析,特别适合于大型三甲医院的科研用户。

3.影像数据 随着数据库技术和计算机通讯技术的发展,数字化影像传输和电子胶片应运而生。医疗影像数 据是通过影像成像设备和影像信息化系统产生的,医院影像科和第三方独立影像中心存储了大 量的数字化影像数据。医学影像大数据,是由 DR、CT、MR 等医学影像设备产生所产生并存储

PACS 系统内的大规模、高增速、多结构、高价值和真实准确的影像数据集合。与检验信息 系统( LIS)大数据和电子病历(EMR)等同属于医疗大数据的核心范畴。

医学影像数据量非常庞大,影像数据增速快,标准化程度高。影像数据和临床其他数据比较起 来,它的标准化、格式化、统一性是最好的,价值开发也最早。

数据采集难度★★☆☆☆

数据价值★★★★★

案例:锐珂医疗 锐珂医疗前身是美国柯达医疗集团。锐珂医疗推出了全新的云网信息化解决方案 Carestream Vue Solution,涵盖了全面的专业影像处理和流程管理应用,为医院的所有医技临床科室提供 “一站式”的全 Web 工作平台。锐珂医疗全球从 2011 年开始,就从传统 PACS 逐渐转型到影像 云。迄今为止,锐珂在全球已经建设了 14 个影像云数据中心,管理的数据高达三亿人次,而 且数据量每天都在飞速地增加。

4.费用数据 医院门诊费用、住院费用、单病种费用、医保费用、检查和化验收入、卫生材料收入、诊疗费 用、管理费用率、资产负债率等和经济相关的数据。除了医疗服务的收入费用之外,还包含医 院所提供医疗服务的成本数据,包含药品、器械、卫生人员工资等成本数据。在 DRGs 按疾病 诊断相关组付费模式中,需要详细的成本数据核算。通过大样本量的测算,建立病种标准成本, 加强病种成本核算和精细化成本管理。

数据采集难度★★★★☆

数据价值★★★★☆

案例:东软望海

东软望海作为 1600 余家医院 HRP 与成本核算软件和服务的提供商,获得了 CN-DRG 官方授权, 通过 DRG 智能管理平台帮助中国医疗在支付方式上进行改革。东软望海 DRG 平台可以灵活支持全国各地不同编码类型的病案数据进行分组,为医疗机构、支付方和卫生部门提供成本监管、 绩效评估、审核等功能。 DRGs 医院绩效评价通过目标管理、绩效方案、绩效考核和绩效分析 等模块,可灵活设置绩效方案及其评价指标,促使医院提高医疗工作效率和整体医疗技术水平; DRGs 医院控费则依托大数据,建立病组医疗费用和成本的动态分析模型,提供区域、机构及 病组有效控费指标及参考值;而 DRGs 财政补偿可以精准测算医院补偿金额和政策性亏损,有 效防止重复补偿,提高补偿资金使用效率和投放准确性; DRGs 智能审核与支付从患者入院到 出院的全程信息跟踪,可帮助社保和商保提升其基金使用的有效性,同时,其对基金使用情况 进行实时监控,可针对异常病历进行深入挖掘分析和反馈。

5.基因测序数据 基因检测技术通过基因组信息以及相关数据系统,预测罹患多种疾病的可能性。基因测序会产 生大量的个人遗传基因数据,一次全面的基因测序,产生的个人数据则达到 300GB。一家基因 测序企业每月产生的数据量可以达到数百 TB 甚至 1PB。

测序技术的发展让基因数据以远超摩尔定律的速度在积累,海量的数据亟待深度解读和挖掘。

基因大数据的价值非常巨大,但是现在的数据利用和解读都在初级阶段。

数据采集难度★★★★☆

数据价值★★★★★

案例:华大基因

资料显示,华大基因目前拥有超过 200 台测序仪,是世界上最大的基因测序机构。其中用于新 生胎儿 NIPT 基因测序每天大约产生 10000 个样本,需要与数万个正常胎儿几十 TB 的基因组数 据进行差异统计分析,数据计算量巨大。每月产生的基因数据高达 300TB-1PB,目前累计基因 库数据 22PB。

6.医药研发数据 制药公司在新药研发及临床过程中产生的数据。制药公司主要对临床试验数据进行系统分析, 收集和解读非结构化数据,从而优化生产流程,最大限度地利用研发潜力。

数据采集难度★★★★☆

数据价值★★★★☆

案例:拜耳

拜耳公司依靠大数据分析,在 2017 年年底推出了既重点突出又多样化的开发战略,将 50 多个 项目几乎同期投入临床开发,最大限度地利用了研发潜力。拜耳公司的研发重点项目在肿瘤学、 心血管疾病和妇科学领域,同时在营销方面拜耳也在利用大数据进行推广的辅助决策。

7.药品流通数据 药品和疫苗的运输、流通、存储、销售、接种数据。药品运输、销售数据虽然和疾病的诊治无 关,但是医药流通企业可以通过物流数据、库存数据、销售数据中进行挖掘,获取药品流向、 用户健康等关键信息,实现系统智能化引导满足顾客准确选药、合理用药、健康保健的多元化 服务需求。

数据采集难度★★★★☆

数据价值★★★☆☆

案例:国药集团 国药集团通过大数据平台,搭建医药流通全过程的电子化追溯平台,探索实现医药产品从生产 完成到销售终端机构 (医院、药房、诊所等合法经营机构)之间的全程追踪、追溯与召回,有效 地提高医药流通的监管水平。同时,探索基于药品流通领域追溯大数据的应用,为药品紧急调 拨配送、药品流动趋势、医药储备可视化等提供数据支撑。

8.智能穿戴数据 各种智能可穿戴设备的出现,使得血压、心率、体重、体脂、血糖、心电图等健康体征数据的 监测都变成可能,患者的单一体征健康数据以及运动数据快速上传到云端,而且数据的采集频 率和分析速度大大提升。除了生命体征之外,还有其他智能设备收集的健康行为数据,比如每 天的卡路里摄入量、喝水量、步行数、运动时间、睡眠时间等等。

智能穿戴设备虽然在这两年遇冷,用户很难形成粘性,但是并不意味着智能穿戴设备所产生的 数据没有意义。提供健康数据和服务,可能是智能穿戴厂商未来的转型之路。健康大数据的收 集必须依靠硬件载体,智能穿戴设备还将会遇到自己的第二春。

数据采集难度★★★☆☆

数据价值★★☆☆☆

9.移动问诊数据

通过移动设备端或者 PC 端连接到互联网医疗机构,产生的轻问诊数据和行为数据。动脉网蛋 壳研究院就曾经通过互联网问诊企业春雨医生的数据,分析各地医生互联网问诊的活跃度、细 分疾病种的问诊行为。通过这些数据的分析,对行业发展、互联网问诊企业的决策有非常重要 的帮助。

数据采集难度★★★☆☆

数据价值★★☆☆☆

10.体检数据 体检数据是体检机构所产生的健康人群的身高、体重、检验和影像等数据。这部分数据来自医 院或者第三体检机构,大部分是健康人群的体征数据。随着亚健康人群、慢病患者的增加,越 来越多的体检者除了想从体检报告中了解自己的健康状况,还想从体检结果中获得精准的健康 风险评估,以及如何进行健康、慢病管理。

数据采集难度★★★☆☆

数据价值★★☆☆☆

案例:美年大健康

美年大健康是中国知名的专业健康体检和医疗服务集团,全国布局 400 余家体检中心, 2017

年完成 2160 万人次健康体检服务, 2018 年体检人次预计将突破 3000 万大关。美年大健康, 是中国最大的个人体检数据平台,通过建立了美年大健康研究院,开展基于健康大数据的科研 创新和公共卫生服务,加强在人工智能、基因检测、肿瘤早筛、智能诊断、健康服务、健康保 险等核心赛道的控制力。

2018 6 月,美年大健康和北大医学部共同发起成立 “北京大学医学部美年公众健康研究院”, 意在打造国际顶尖的公众健康与大数据研究和实践平台。通过这个数据研究平台,承担国家健 康领域科研项目、开展健康大数据挖掘分析等工作。

第四章 治理数据形成知识

医院信息化程度日趋成熟,医院信息系统( HIS)、电子病历系统(EMR)、影像采集与传输系 统( PACS)、实验室检查信息系统(LIS)、病理系统(PS)等等,甚至包括手术管理系统、 耗材及物流管理系统等等。这些信息系统每天产生大量的数据。多源异构的数据类型汇聚在一 起后,传统的计算分析方式已经很难处理快速增长的海量数据,这些大数据需要通过特殊的手 段进行清洗和加工,才能利用起来。

大数据平台以现有业务系统为基础,通过数据抽取的方式实现多源异构数据的采集和汇聚。目 前,医院的信息化系统大多采用关系型数据库,兼有少量的非关系型数据库架构,适合使用全 量或增量的方式进行抽取汇聚。数据清洗过程中的最大挑战,是不同机构、不同部门、不同业 务系统多源异构数据的标化融合。

一、医疗大数据应用的主要挑战

医疗大数据采集完成后,遇到的第一个问题就是数据集成阶段。现阶段医疗机构的信息化水平 不低,但是数据的互联互通是首先需要解决的问题。先不谈医疗机构之间的数据互联互通,就 是同一家医院在不同信息化系统中的数据,都很难实现互联互通。数据集成平台的出现解决了 不同信息化系统中的接口问题,让数据流动起来。但是这些数据分散、规模大,都是多系统的 异源异构数据,质量规模大,又参差不齐,不完整性显著。

新知图谱, 医疗大数据的发展阶段和行业现状分析

医院采用统一信息编码体系的情况。数据来源, CHIMA,《中国医院信息化状况调查,2017-2018 年度》

其次,难在数据的处理阶段。医疗大数据的标准化程度低,数据质量偏低。 CHIMA 发布的《中 国医院信息化状况调查, 2017-2018 年度》中调研数据显示,医院全部采用统一信息编码体系 的比例仅占 28.10%。临床数据大多是业务过程中产生的数据,录入目的不同,每家机构、每 个系统的标准、接口规范有差异,导致底层数据采集和整合困难。而通过移动终端收集的患者 行为数据和体征数据,数据的标准化程度更低,垃圾数据居多,标化融合困难。

医疗领域的数据专业化强,细分领域多。很多医院的电子病历系统对病种没有按标准疾病编码, 而且医疗器械、药品都没有标准的编码。各家厂商、医院,各个地区都采用不同的数据标准, 数据难以沉淀。数据处理更加困难。

第三,数据难以理解,医疗大数据中的病历信息以文本、图像等非结构化数据为主,处理与分 析困难。在具体应用中,标准复杂、数据量庞大、新技术攻关、管理协调庞杂都是实践过程中 需要面对和处理的问题。

当前,大数据的快速增长已经超出了传统的信息处理能力,因此医疗大数据需要不断引入新技 术、新概念,提升对运行数据的清洗、加工和分析能力,为管理者和临床医务人员做出准确的 工作决策提供依据。

二、大数据的治理

医疗机构的数据在质量上偏低是有其主观和客观原因的。医疗机构的信息化建设以业务流程、 医保支付和医管政策为核心驱动力,产生的数据是有客观限制的。如医保处方规定的出院带药 最大天数、跨科开药限制等因素导致开单医生不能如实开具反映实际情况的处方;分工细化, 数据价值链路过长,导致前端缺乏数据生产动力;数据生产者缺乏对数据对象进行完整和精确 描述的能力,导致关键信息缺失,标准化程度差的特点;信息系统难以学习和使用,缺少防错 设计,导致人为差错问题。因此,在二次利用的价值充分体现之前,数据的完整性、准确性、 一致性、关联性、规范性等方面的质量挑战将存在且长期存在。

如果数据不能及时进行结构化、标准化的治理和分类存储,那么带来的存储成本也是巨大的。 前面我们提到过,到 2020 年,数据存储将达到 44ZB,而其中的有价值的数据仅有 1.5%。如果 不能及时的发掘出其他数据的有效价值,那么垃圾数据将会过多的占据企业的存储成本。

医疗数据的治理分成两种,一种是前治理,一种是后治理。

后治理是将已经存储在数据平台的医疗数据的质量问题,通过清洗、校验、脱敏等常见方法, 结合二次应用需求,对数据的结构化、标准化进行数据质量的提升和优化。基于海量存储和计 算平台的集成能力,大数据平台应覆盖包括至少元数据管理、文件管理、检索设计、节点任务、 流程任务、任务调度、运行监控等功能,支撑后治理过程中数据的基础处理。

在治理过程中,需要基于通用标准和临床基础字段集,把症状、疾病生命体征、家族史、婚育 史、检验、检查、手术、输液、药品医嘱等文字内容进行结构化处理,对结构化和非结构化数 据、集中式和分布式数据进行统一建模,提取临床、科研分析所需特征,同时完成重点概念的 标准化和统一描述。后治理具有数据基础差、要求高、流程和环节复杂的特征,涉及的自动化 和人工处理的工作量极其巨大,二次污染难以避免,需建立针对数据处理环节的质控流程和工 具。通过溯源工具,追溯每个处理后数据到原生数据的血缘关系,定位和处理过程中引入的新 问题。

前治理是后治理能力、经验和治理工具到医疗机构的向前延伸,以原生数据质量问题的评价为 基础,解决数据在医疗业务信息系统中生产、传输、转化、存储等环节中产生的质量问题。前 治理可以显著提升医疗数据质量。

案例:医渡云数据智能平台 DPAP

医渡云利用数据人工智能技术,构建了可追溯、可监管的医学数据智能平台,该平台数据处理 量大、数据完整度高、开发流程透明,帮助政府、医院和整个产业界充分挖掘医疗大数据智能 化政用和民用价值,建立可覆盖全国、统筹利用、统一接入的医疗行业大数据生态平台。

医渡云已与全国 700 余家医疗机构、近 100 所顶级医院建立战略合作,为医院集成融合了横跨

10 余年的 3 亿多名患者、 12 亿人次的医学数据,覆盖了 30 余类重大病种,建立了 3000 多个 专科疾病模型、 2000 万个标准化字段,实现了医院近 200 种系统、几百个厂商的多种数据、 全量全周期的采集与数据结构化与标准化处理,可以说是在充分发挥 “医疗大脑”的作用下, 构建了中国数据处理量最大、数据完整度最高、开发流程最透明的可追溯、可监管的医学数据 智能平台。

在与数十家顶级医院的建设合作中,医渡云数据智能平台形成了一套成熟可控的方法轮和一支 经验丰富的数据抽取、清洗、汇聚的团队,能做到在完全可控的实施成本和周期的要求下,以 人工和自动的方式适配多源异构的数据源,自定义数据处理流程以及智能映射等工作。

该平台支持并行计算基础架构或混合式架构,可以基于传统分布式网络和云计算平台等多种模 式部署,支持大数据计算资源管理,支持资源预约、排队、按优先级抢占,支持资源占用分析、 计算瓶颈分析,使资源得到更充分利用。另外,架构还配备了多种算法库,具备大数据存储访 问及分布式计算任务调度等功能,支持多维索引数据的深度搜索、过滤、聚合、统计分析和全 文检索等功能,支持图形化界面大数据查询引擎,方便非技术人员利用大数据平台进行统计分 析工作。

新知图谱, 医疗大数据的发展阶段和行业现状分析

案例:阿里云数据中台

海量的医疗大数据来自于各个业务信息子系统,数据的标准化程度低,在完成数据收集之后, 随后就面向后续的数据的清洗和加工步骤。如何把这些海量数据按照统一的标准进行清洗,是 很多行业和企业现在面对的最大困境。阿里数据中台为的数据 ODS 层设计包含了三个特性:其 一是数据同步功能,支持结构化数据增量或全量同步到 ODPS;其二是实现全结构化数据转换, 能够将非结构化数据(如日志)进行结构化处理后再存储;其三是支持历史数据的积累和清洗, 能根据数据业务需求及稽核审计要求保存信息。总结阿里云数据中台的作用和功能如下:

全域数据采集与引入:以需求为驱动,以数据多样性的全域思想为指导,采集与引入全业务、多终端、多形态的数据;

标准规范数据架构与研发:统一基础层、公共中间层、百花齐放应用层的数据分层架构模式, 通过数据指标结构化规范化的方式实现指标口径统一;

连接与深度萃取数据价值:形成以业务核心对象为中心的连接和标签体系,深度萃取数据价值;

统一数据资产管理:构建元数据中心,通过资产分析、应用、优化、运营四方面对看清数据资 产、降低数据管理成本、追踪数据价值。

统一主题式服务:通过构建服务元数据中心和数据服务查询引擎,面向业务统一数据出口与数 据查询逻辑,屏蔽多数据源与多物理表;

第五章 行动 ——医疗大数据的价值输出

伴随万物的行为逐步被数据所量化,医疗大数据的形式和数量将极大地丰富起来,整个医疗领 域会迎来一个新的时期,就是持久而深远的大数据革命。医疗大数据在治理之后,接下来就需 要把有用的知识形成行动指南,让我们的诊断和治疗过程可以变得更精准。医疗大数据可以辅 助医生进行诊疗,辅助医院进行管理,或者辅助居民进行健康管理,我们不再摸着石头过河。

医疗大数据的价值,取决于使用者和应用场景。如果从使用对象来看,医疗大数据的应用者主 要包含五个对象。现阶段,医生、医院是医疗大数据的主要产生者和使用者。

一是为医生服务。提高他们的诊疗行为,优化诊疗决策。

二是为医疗机构的管理者服务。帮助他们进行人员、物资管理,辅助管理决策。

三是为个人服务。通过疾病和健康大数据,结合患者基因学数据,能针对不同疾病建立个性化 的治疗方式,为患者提供健康行为指导。

四是为药企服务。药企通过医疗大数据和销售大数据,降低医药研发成本,制定精准的市场营 销方案。

五是为保险服务。通过医疗大数据、医疗费用大数据,建立保险模型,降低保费的同时,提高 利润率,扩大保险覆盖范围。

新知图谱, 医疗大数据的发展阶段和行业现状分析

医疗大数据的价值还取决于数据,从数据的采集、存储、治理、分析,达到终端用户进行应用。 产业链条中的每个步骤都能产生相应的盈利模式,不同环节上的企业都可以向上下游延伸发展 出对应的医疗大数据解决方案。

医疗大数据可以用来做什么?我们总结了八个方面的内容,每一个领域,都可以通过数据的总 结,直接形成我们的行动指导。

一、临床诊断辅助系统

通过收集医院各信息化子系统的临床数据,将疾病的表征、患者体征和治疗方式的数据存储起 来,建立特定疾病的数据库。再根据数据的智能分析,可以对患者进行多种诊疗措施比较分析, 制定有效的诊疗路径,帮助医生进行决策。在临床诊断辅助系统中,人工智能技术是一项非常 重要的辅助技术,它可以通过知识的学习,进一步提炼数据的价值。

临床数据首先反映的是人的疾病特征,再辅以以往的医生诊疗数据,就可以实现辅助诊疗。医 疗大数据最大的价值输出,就是在临床诊断辅助系统方面。因为医疗大数据的应用,可以明显 提高医疗服务水平,降低失误。这类应用和医生、医院所追求的目标是一致的,所以医院的付 费意愿较强。医院内部的临床数据是存在数据孤岛的,系统和系统之间,医院和医院之间,医 院和社会公众之间均存在不同程度的数据壁垒。医院现在在政策、技术的推动下,有强烈的意 愿先消除内部的数据壁垒,建立医院临床数据中心,所以对临床数据的集成和应用有较为强烈 的需求。

1.临床数据辅助诊疗。医生在诊疗过程中,需要很多相关信息的辅助,最重要的信息来源是患 者的各种临床检验检查数据。这些检验检测数据,汇入到疾病数据库之后,能够形成疾病辅助 决策支持,对医生的工作进一步形成指导,从而准确判断疾病,给出诊疗方案。

临床数据反映了患者的疾病情况,但是疾病千变万化,疾病种类繁多,医生还需要一些临床指 南、知识库来辅助进行判断。医生在计算机(电子病历)中输入主诉的时候,系统结合症状等 患者综合信息并智能 “匹配”后台医疗大数据知识库,提示医生患者可能存在的疾病,避免漏 诊、误诊和医疗纠纷。医生在下医嘱的时候,利用规则引擎推出相应诊断的治疗方案,并对用 药、手术、护理等治疗方案进行详细指导,减少技术上的失误。

案例:惠每科技 CDSS 临床辅助决策系统

惠每科技 CDSS 临床辅助决策系统根据 Mayo Clinic(梅奥)知识体系和最新指南文献为知识 内核,基于病历数据不断运算更新的知识图谱,绘制更加符合临床经验的决策路径。可以实现 疾病的辅助诊断、推荐治疗方案、合理性审核、检验检查结果解读、病案缺陷提醒等功能。惠 CDSS 利用自然语言处理智能识别、分析非结构化病历文本,从 EMR、RIS、LIS 等医院数据 平台中读取患者病历数据,经结构化存储形成完整的、符合临床术语标准的中间数据平台,为 医生、医技人员、护士、管理者提供多维度决策支持。通过人工智能技术不断汲取病历经验, 丰富 AI 大脑,训练诊疗模型。开发满足各级医疗机构管理与临床需求的人工智能系统,融入 门诊、急诊、住院环节。通过惠每辅助决策支持系统,能有效提升医疗质量,保障患者安全, 降低医疗风险,助力医疗智能化建设。

案例:嘉和美康

嘉和美康专注于医疗临床信息系统的软件开发和系统建设,在电子病历系统、临床路径系统、 移动医疗系统、心电信息系统、手术麻醉系统、口腔专科化电子病历系统、医学科研平台、医

院信息集成平台、 CDSS 等领域建立了独立的产品线和专业实施团队。围绕临床数据处理的核 心能力,嘉和美康的产品在临床专科纵深方向和数据二次利用方向不断扩展,开发了集中部署 的基层医疗信息系统,区域心电采集报告系统和区域临床路径系统等临床信息化应用。在 CDSS 系统构成中,知识库是非常基础和重要的部分。但除以往的临床指南、循证医学、文献资料等 数据外,它还可通过自然语言处理、机器学习等技术,从医院各业务系统的历史病历数据中学 习、整理出更多的信息,导入知识库,形成一套从临床到用药等丰富的知识图谱体系,为后续 构建临床业务规则库及实现业务功能提供支撑。在知识库基础上,嘉和美康根据临床提出的业 务规则,将规则引擎和规则流作为基础核心,使用人工智能技术构建推理系统,形成临床预警 提示规则库、辅助诊断规则库、辅助诊疗规则库,满足业务逻辑的多变性。最终,实现 CDSS 在辅助诊断、辅助诊疗、医嘱追踪、诊疗提醒、依从规则设置、依从监控、临床指南、不良反 应监测、相似病例推荐等方面的功能。

2.影像数据辅助诊疗。影像数据虽然也是临床数据中的一种,但是市场的应用规模非常大,所 以在这里把它单列出来。影像在医院临床疾病的诊断过程中起到了非常重要的作用,无论是在 病情评估、病灶性质判定、手术方案的制定,或是评估治疗后效果,尤其在创伤性治疗过程中, 医学影像学结论都是必要的指征。影像数据主要辅助对象是影像科、病理科的医生,通过人工 智能对影像数据进行价值提炼,可以形成快速的诊断意见。

影像数据的利用也需要借助人工智能技术,在提高医生效率的同时,还可以提高准确率,替代 医生的重复劳动。目前,我国大部分的人工智能企业都是以影像数据入手,通过标注后的影像 数据库对人工智能产品进行训练。

案例:推想科技

推想科技是国内第一家形成临床应用的医学影像人工智能公司,成立于 2015 年年初。目前推 想科技的产品可以提供三个方面的服务:智能影像报告检验、智能辅助筛查、智能鉴别诊断。

推想科技智能 CT 线辅助筛查产品可自动标记出 CT 各层面上病灶的位置,辅助医生快速准确的 完成 CT 诊断。减少影像科重复性劳动,把时间用在重大疾病的诊治上,提高诊断准确度的同 时减低医生的疲劳度。

在诊断速度方面,一个医生完成 20 个病例的诊断需要 3 个半小时,利用推想人工智能产品就

算是最低配置的电脑也只需 6 15 秒。

在诊断准确率方面,人工智能针对大小结节综合灵敏度是 85%左右,针对不同大小的结节,情 况不同。推想科技 2017 3 9 日的测试数据显示,对于 0-3mm 的结节,推想科技模型敏感 度为 84.03%,3-6mm 的结节模型敏感度度为 88.31%,>6mm 的结节模型的敏感度为 100%。

随着算法模型的不断完善,迭代速度不断加快,推想科技的服务领域也逐渐向头部、腹部、股 骨头、病理、超声等领域延伸,覆盖 100 多种疾病。截至 2018 3 月,推想科技已经为近 45 万病患提供了影像辅助诊断服务。

案例:万里云

万里云由医疗影像器械企业万东医疗和阿里健康共同持股,通过构建医学影像大数据云平台, 提供远程影像诊断平台、移动影像诊断平台、影像学术、个人健康管理、影像综合解决方案等 服务,实现影像云存储、云共享。万里云首先提供的是影像数据的云存储、云诊断功能,后来 也是首个将医疗 AI 引入实际应用的远程影像诊断平台。万里云构建的医学影像大数据平台, 不仅提供疑难会诊、读片会,为临床诊断积累经验,为科研教学提供素材,还积极开展医生培 训和再教育业务。

二、医生辅助工具

通过对医疗大数据的整理,形成医生的辅助工具,帮助医生诊疗过程中更好地进行处方管理、 病历管理、手术规划,诊疗结束后对患者进行随访管理,或者加快科研数据分析进程,提高工 作效率,促进转化医学研究。

在单一病种的垂直领域中,临床科室往往缺少针对具体疾病的专业信息化工具,将患者的多源 头医疗数据、治疗方案、用药情况、治疗效果等信息全面整合起来。医生想要在繁忙的诊疗工 作中抽出时间来整理相关医疗数据、进行临床研究并不容易。

临床中还有一个常见的现象是由于行业标准不统一,不同医院、不同医生在病历书写时难免在 表述上会有差异,这就给数据录入和分析造成困难。要获取高质量的数据,就要建立统一病历 填写标准和规范,从源头保证数据的真实和准确。有企业对医疗机构所产生的电子病历进行数 据治理,形成有科研价值的结构化数据。虽然利用的仍然是临床数据,使用者也都是医生,但 是医生辅助工具的应用对象和临床辅助决策不同。临床辅助决策是医生为患者服务,而医生辅 助工具是为医生服务。

案例:博时医疗云

索闻博识科技(北京)有限公司致力于深度开发各类疾病专业信息化工具,打造医疗数据的收 -分析-应用-管理为一体的专业化平台,为医生们提供“疾病专业化、数据结构化”服务, 满足其科研与临床的需求。博识医疗云自主开发了底层数据架构和核心技术,产品功能完全以 医生需求为导向,最初通过结构化电子表单为临床科研提供数据分析工具入手,进而不断加入 了随访、查房、会诊、手术质控、多中心合作等多种功能。目前的博识医疗云平台已经涵盖临 床学术研究、科室运营分析、病患整合管理等多个模块,为医护人员的临床研究、患者管理、 科室管理、学术交流提供支持,极大缩短了医生的工作时间,让医生获益。 2017 6 月,索 闻博识获得经纬中国数千万人民币 A 轮融资,当时博识医疗云覆盖了全国超过 400 家三甲医院 的涵盖肿瘤,血液,骨科,神经内科、神经外科等重大疾病领域的超过 2700 个临床科室,为

国内超过 20000 名临床医生提供临床数据服务。

案例:零氪科技

零氪科技从肿瘤大数据出发,与医院合作,对临床数据进行集成、治理、分析,让沉睡的数据 发挥价值。零氪科技的思路是与医院、医生合作,搭建大数据平台,提供数据集成、数据结构 化、离院随访、数据管理与质控、数据交付与洞察等工具和服务。简而言之就是帮助医生从临 床中获取数据、处理数据、分析数据、应用数据。

医疗机构在临床数据应用方面主要有两大需求,其一是数据能够被处理,从病历转化为可用的

数据;其二是随访需求,能够打通院内、院外环节。

其一是数据治理。临床病历很多时候表现形式是大段的文字,但是大段的文字并不能被有效地 进行分析,需要转化为可用于建立疾病诊疗模型的数据 “点位”。过去病历很难被利用,但病 历结构化之后,就可以实现对病历的分析和发掘,这是临床科研的核心需求。零氪通过数据的 集成、治理、分析,为医生在科研、数据管理中提供可视化数据应用。截止 2017 下半年,零 氪科技为超过 500 家综合及专科三甲医院提供大数据解决方案,深度处理肿瘤科研级病历近 200 万份,帮助集成及清洗区域医疗数据超千万份,处理医学影像数据超千万份,形成了真正 高质量的科研级数据。

其二是患者管理,在重病尤其是肿瘤领域,患者很少会一直在一家医院进行治疗,而是在北京、 上海等地的多个医院 “迁徙”,得到综合性的诊疗意见或是寻求新的疗法。作为医生而言,希 望能够持续跟踪该患者的病情进展,看到后续治疗的疗效以及治疗的结局。零氪科技建立了 100 多人的专业随访队伍,在患者知情同意的情况下,主动去做患者随访,对患者院后、康复 进展进行跟踪咨询。从患者入院、院内治疗到院外治疗及康复,沉淀了完整的数据,院内外数 据可以进行合并,形成数据闭环,给医生更多治疗参考。

零氪科技的产品除了面向医疗机构和患者的服务之外,对药企、保险公司也提供基于人工智能 和大数据技术的服务。目前零氪科技产品线包括:

医疗机构大数据解决方案 ——医疗大数据一体化、标准化智能随访、医学影像智能诊断、一站 式医学科研服务;

制药企业大数据解决方案——患者招募、真实世界研究、数据洞察、药物临床研究; 保险企业大数据解决方案——保险精算、欺诈识别、药物经济学; 患者院外服务——互联网医院+DTP+门诊模式,建立医疗新模式和医药流通新渠道。

案例:梅斯医学

梅斯医学( MedSci)通过互联网和大数据计算等技术,为医生的临床科研和临床实践提供智慧、 精准的决策支持,让医生与患者受益。梅斯医学主要从事医学科研学术支持、推动临床医生职 业成长、智慧医疗和慢病管理等服务,推动和加速临床医生的职业成长。在科研学术层面,为 梅斯医学提供从临床研究设计、数据库建立、医学统计、以及发表计划支持等一系列服务。梅 斯医学团队从 2015 年就深入研究真实世界研究的特征,以及其价值产出。并开始与客户合作, 从事大量的真实世界研究的服务,从研究的设计, EDC 数据库建立,以及到项目管理与操作, 后期的统计分析,都具有丰富的经验。 同时,梅斯医学利用众多创新的技术,如人工智能化 随访,中心化数据转录等极大降低研究成本,提高效率。针对药企和医生,开展回顾性数据分 析,通过 HIS 等数据源导出数据,进行统计策略制订,数据分析处理等工作。在智慧医疗方面, 通过大数据技术和虚拟 /增强现实技术的应用,为临床提供辅助决策支持;在慢病管理方面, 采用大数据疾病发展预测等技术,为疾病发展提供精准地干预,改善患者生活质量,降低医疗 费用。

三、慢病管理

慢病的管理行为通常在院外发生,通过智能终端、数据管理系统、移动医疗设备和医疗健康应 用软件,实现多项检测数据的网络接入,同时对患者的行为习惯、用药记录进行智能的监护和 跟踪。通过数据监控,可以了解患者当前的体征状况,是否遵医嘱按时吃药。

慢病管理类型的医疗大数据企业,其数据可能来自于临床医疗机构,也可能来自于患者所使用 的智能设备积累而来。根据患者的当前体征数据、行为数据,结合慢病大数据,为患者提供定 制化用药及治疗方案。通过对慢病患者的院外管理,可以延长他们的生命,减少并发症。

案例:微糖

微糖是一家提供血糖健康解决方案的慢病管理公司。微糖通过慢病管理软件,收集了海量的糖 尿病患者的血糖数据,研发完成连接专业医护团队和用户的 “天雁”系统。微糖天雁系统基于 亚洲糖尿病基金会超过十年的大数据积累,通过专利算法提供并发症风险的预测和分析。微糖 还引进了业界领先的动态血糖技术雅培 “瞬感”,基于动态的数据分析和服务产品,提供针对 糖尿病患者的血糖健康解决方案,帮助患者稳定血糖。

四、保险

保险机构非常依赖于医疗大数据,通过大量的疾病发病率、治疗效果、费用等数据的帮助下, 才能制定出合适的保险产品,降低保险公司成本。特别是最近火热的健康险,更需要依托医疗 大数据和智能化的管理系统,将保险机构、医院、药房的数据进行整合,对目标人群进行精细 管理,有效控制医保费用。

案例:数联易康

成都数联易康科技有限公司是一家专注于利用大数据手段为各地医保、医疗机构和商业保险公 司提供智能审核、政策制定辅助决策、医疗行为监管等服务的医疗保险第三方服务提供商。拥 10 余年经验的数据挖掘、医疗行业、医疗保险、信息技术知名专家团队。经过多年数亿条 业务数据淬炼,自主研发数百种针对医疗保险的大数据算法模型,涉及行为模式识别、医学文 本解析、医疗图像处理、信任传播等,成功打造了基于大数据的医疗保险审核、监管、决策系 列解决方案。数联易康的大数据产品主要有三个,分别是易康云数据集成平台、医保业务精细 化管理方案和医保大数据监管方案。

云数据集成平台通过整合数据接入清洗、数据存储、分析挖掘、数据可视化展示四大模块,提 高数据的质量,完成数据清洗。医保业务精细化管理方案采用了智能审核引擎,使用医保审核 规则和临床医学规则识别医嘱数据中的违规行为。同时引入单病种管理,对单病种进行成本核 算监控,分析最优治疗方案的同时,控制治疗费用成本,提高单病种收益。医保大数据监管方 案这是针对当前的医保支付方式,进行大数据监管,通过数据分析进行事前动态感知,事中挖 掘分析,时候宏观调控的全方位监管方案。

通过医疗、医药大数据,利用人工智能深度学习能力的算法系统,对研发药物中各种不同的化 合物以及化学物质进行分析,预测药品研发过程中的安全性、有效性、副作用等,可以有效的 降低药品研发成本,缩短研发周期,降低药品价格。常见医药数据库包含临床数据、药物疾病 信息、临床医学实验数据、研发情报、医药专利信息、市场销售数据等类别。

案例:药渡数据

药渡网是一家专注于医药研发领域的 “互联网+”大数据信息平台,整合制药企业研发、结构 化学信息等和药物研发相关数十个学科专业数据和资源信息,为全球药物研发人员提供 “一站 式信息解决方案。药渡依托大数据分析,利用 “数据”链接“资源”,围绕医药研发领域不同 阶段对数据和资源的需求差异,建立起结构化药物研发大数据信息的综合服务平台。

六、医院管理决策辅助

“医院管理”顾名思义,是指以医院为对象的管理科学,它根据医院工作的客观规律,运用现 代的管理理论和方法,对人、财、物、信息、时间等资源,进行计划、组织、协调、控制,充 分利用医院的现有资源,实现医疗效用的最大化。通过对医院的临床数据、运营数据、物资数 据进行挖掘,解决医院管理中的各种问题,提高设备的使用效率,降低医院运营成本。

医院管理运营中,已经较早通过数据分析实现了 BI 商务智能。医疗信息化系统中, BI 已经是 一个非常重要部分,将医院信息化系统中的多源数据抽取、清洗后关联整合,建立医疗 BI 策系统。通过数据分析,实现人资、成本、绩效、医保、药事、门诊、住院、手术等多项管理, 实时监控医院的运营状态,并可为医院的发展方向和运营做出决策支持的依据。

医疗大数据在医院管理应用上主要有两个方向,分别是优化医疗资源配置和弥补医院管理漏 洞。第一种是优化医疗资源配置:人工智能根据医院的情况,制定实时的工作安排,其目的在 于优化医院的服务流程,最大限度利用好现有的医疗资源。第二种是弥补医院管理漏洞。通过 大数据分析总结医院存在的问题,并给出解决方案,降低医院成本,提高医院的营收。

案例:东软望海

北京东软望海科技有限公司是一家全心致力于医院及医疗集团高效运营及医疗生态价值链管 理的医疗大数据运营服务商,在 HRP、医院成本一体化、医疗卫生资源监管等领域保持优势地 位。目前为止,东软望海积累医疗机构客户数 2000 多家,其中三级医院 500 家,覆盖医院成 本管理绝大多数市场。

东软望海在医院管理方面推出过多款解决方案,包括医院成本监管、预算监管、绩效监管、医 疗服务价格调整、供应链监管、固定资源监管、医疗资源监管、财务核算监管等医院管理业务 中的方方面面。

比如在公立医院成本监管上,东软望海通过对区域内医院各科室的收入与成本、医疗服务项目 的收费与成本、病种收费与成本和 DRG 付费标准与成本的同比、环比、构成和挖掘分析,卫生 主管部门能够详细了解区域内各医院的运营状况、医院内部各成本对象的盈亏情况,对区域内 各医院医改重点监测指标达成情况进行监测和排名分析,为建立现代化医院管理制度、控制医 疗费用不合理增长、合理配置医疗资源、降低医院运行成本提供指导,为政府主管部门合理制 定医疗服务价格、研究财政补偿机制、进行按病种收费和按 DRG 付费等支付方式改革以及对医 院的绩效考核提供数据依据。

七、健康管理

之前所描述的医疗大数据应用,大多和疾病相关,是对患者的疾病体征、治疗方案等进行搜集 的数据。而健康大数据还关注健康人的体检数据、心理数据、运动数据、营养数据以及基因大 数据。通过数据的分析实现健康人的管理,让人不生病、少生病,是医疗大数据应用的终极方 向。借助物联网、智能医疗器械、智能穿戴设备,实时收集居民的健康大数据,通过对体征数 据的监控,实现健康管理。

案例:中科恒业

中科恒业成立于 1999 年,是一家健康体检系统平台建设与健康管理服务提供商,专注于软硬 件一体化的健康产品和健康 +互联网平台的建设和运营。在中科健康管理系统中,体检业务管 理、检验项目管理、医学影像管理、心电检查管理、健康档案动态管理、辅助功能检查管理、 总检报告管理、客户关系管理、智能导检、移动互联网健康管理、检后追踪、随访管理、健康 教育咨询等子系统融为一体,建立了标准化、规范化、人性化的健检业务流程;为健检机构运 营管理提供了 360 度的系统支撑,建立了一整套完善健全的健康管理体系。通过对体检客户数 据资料整合分析,对其健康状况进行评估,对健康、亚健康人群提供健康咨询,给予健康指导 并进行跟踪随访。对高端客户根据其需求制定专门的健康管理方案为康复期患者提供科学规范 的康复指导。对慢性病患者进行心理、情感、饮食营养、生活行为等各方面的健康指导。

案例:碳云智能

碳云智能是一家数字化生命管理的人工智能公司。碳云智能希望建立一个健康大数据平台,运 用人工智能技术处理这些数据,帮助人们做健康管理。王俊曾介绍,碳云智能的数据来源包括 两部分,一部分靠自己的技术能力获取,一部分靠合作伙伴获取。靠该团队的核心技术获取的 有基因数据、微生物数据(肠道、口腔、皮肤等)、蛋白及代谢数据(尿液、汗液、血液等) 等,合作伙伴包括研究机构、药厂、体检中心、医院、诊断公司、保险公司、健康管理公司等, 从合作伙伴处获取的数据有临床及体检数据、环境数据、运动数据、饮食数据等等。 2017 1

5 日,碳云智能对外发布觅我数字化健康管理平台,通过健康大数据、基因大数据对用户进

行健康管理应用,应用主题涵盖营养、运动、护肤、健康、医疗、慢病 6 大场景。

八、智慧养老

智慧养老和慢病管理领域是有结合的,不过智慧养老也关注健康的老年人。养老领域的企业在 大数据方面的应用仍比较粗浅,大部分企业都是通过智能穿戴设备或者其他传感器收集老年人 的体征数据、状态,然后通过数据评估和监管老年人的身体状况。结合父母对亲情、紧急救助、

健康检测服务等多方面的需求,通过后台大数据处理推送相应的资源,搭建共同的信息协作平 台,为老人和子女家人建立交流的空间。其数据价值略低,更多的是通过智能穿戴、物联网设 备进行一些简单的数据传输。

案例:所依养老

所依智能居家养老项目由蓝创科技推出,通过智能养老产品和智能养老服务为老年群体提供信 息化养老模式。所依智能养老平台将会积累大量的养老行业数据,打造大数据养老平台。所依 智能养老平台可无线链接第三方医疗设备如血压计、血糖仪、血氧仪、耳温枪、智能床垫等。 老人测量健康数据后,设备可自动将健康数据如血压、血糖、心率等上传所依智能养老平台, 形成每个老人的健康档案,实现用户标签化管理。通过大数据处理成周期性的健康信息,结合 数据库中的老人健康信息和区间值从而对老人健康数据进行智能分析,提供全天候监护。大数 据系统通过对老人健康数据进行分析比对,针对性的对老人提出健康干预方案:健康数据是否 出现异常、饮食如何调整、用药是否合理、日常应注意事项,运动计划、降血压、降血糖计划 等等,保障老人的健康生活。

九、药企市场营销

通过对医疗大数据、医药大数据进行深度挖掘,可以从产业纵向及横向整合医院、药品生产、 批发、零售全产业链资源,为医药行业提供集药品分销、零售品牌连锁、运营指导、医保对接 等全方位的数字化市场营销方案。

案例:医药魔方

医药魔方成立于 2013 年,为医药垂直行业的一站式药品数据服务平台,致力于以数据连接行

业,提升行业效率,打造连接全产业链的生态系统。医药魔方在 2014 年对分散的海量药品数 据进行了规模收集、标准化清洗、结构化转换,并串联整合为数据仓库,逐步搭建了从数据监 测、数据收集、数据清洗、数据挖掘到数据预测的大数据架构工作体系。通过数据平台,为医 药企业、上市公司和投资机构提供市场数据分析、产品管线规划、药品筛选、并购咨询和尽职 调查等市场服务。

十、基因大数据

基因测序技术的发展让基因测序成本迅速降低,数据也得到大量积累。海量的基因数据让医学 界了解了相当多人类的祖源、个体特征、罹患疾病的可能性、基因缺陷、病变基因等知识。人 类对基因数据的研究虽然还只是沧海一粟,但是也已经在疾病筛查、疾病诊断、精准治疗等方 面开始展现出实力。在基因检测行业中,上游是测序仪器、耗材的研发和生产商,被美国 Illumina 等公司所垄断,中游是提供测序服务和基因分析的公司,下游是为用户解读测序数 据报告输出的公司。大多数基因数据被保留在提供测序服务和解读数据服务的公司中。基因公 司更像是一家数据公司,而不是医疗企业,是通过数据的分析和比对提供报告。

基因大数据在应用层面主要分成两个部分。一是疾病的早期筛查、预防和诊断、动态监测、用 药指导、预后评估及生物信息学大数据分析等领域。这类业务的开展主要是在医院中展开,以

肿瘤、 NIPT 为主。一是健康人群的基因检测,对祖源、生理心理特征、遗传病、易感基因、 健康管理、个性化用药等方面进行解读,主要是面向个人用户,检测环境在院外

案例:贝瑞基因

北京贝瑞和康生物技术有限公司(以下简称贝瑞基因)成立于 2010 5 月,是致力于应用高 通量基因测序技术,为临床医学疾病筛查和诊断提供 “无创式”整体解决方案的研发型生物科 技公司,是将基因测序技术实现临床转化的行业领导者。在生物医药晋升为 “国家战略性新兴 产业 ”的行业背景下,贝瑞基因凭借自主研发的核心技术,率先将人类基因组测序技术实践于 临床检测。 2016 年,贝瑞基因在产前检测、孕前检测、遗传病检测以及肿瘤检测领域累积的 数据,已构建具有中国人群特色的 40 万人基因组大数据库。通过与贝勒医学院、阿里云等国 际领先的机构合作,贝瑞基因未来将借助云存储与云计算平台,实现基因组数据最简化的终端 应用和实时共享。 2017 年,贝瑞基因宣布在福建省福州市滨海新城,投资建设以中国人群致 病基因信息库的大数据为核心的基因大数据中心产业园。

案例:燃石医学

燃石医学专注于肿瘤患者个体化治疗指导,以二代测序及医学生物信息学为核心,常规肿瘤分 子病理检测为基石,致力于打造肿瘤个体化治疗临床检测服务及科研一站式解决方案。目前, 燃石医学已针对不同癌种、不同临床阶段开发了 30 余种检测产品,涉及肿瘤早筛、肿瘤良恶 性判断、肿瘤靶向用药伴随检测、肿瘤复发监控及肿瘤遗传检测。 2014 10 月,燃石医学的 第一款产品 ——“肺癌靶向药物基因检测 Panel”诞生,11 月产品正式销售,这是一款基于 二代测序技术的旨在为肺癌患者进行基因检测,辅助患者及其主治医生选择个体化疗效最佳的 靶向药物。 2018 7 月,在历经两年时间的努力之后,燃石医学终于成为中国首个获得 CFDA 批注的基于高通量测序技术(NGS)以及伴随诊断标准的多基因肿瘤突变联合检测试剂盒,即 “人 EGFR / ALK/BRAF / KRAS 基因突变联合检测试剂盒(可逆末端终止测序法)准产资格的 企业。该试剂盒将帮助非小细胞肺癌患者精准选择靶向药物治疗的方式。

第六章 医疗大数据企业市场分析

蛋壳研究院从动脉网企业数据库中筛选了一共 561 家和医疗大数据相关的企业数据,从企业融 资阶段、数据类型、应用方向等维度进行统计,然后根据统计数据洞察医疗大数据行业的趋势。 561 家企业中,包含了 243 家基因行业的测序企业。

一、医疗大数据企业市场布局

新知图谱, 医疗大数据的发展阶段和行业现状分析

新知图谱, 医疗大数据的发展阶段和行业现状分析

大部分医疗大数据企业都没有融资或者未公开融资状态,融资企业的比例不到 50% 。完成融资 的其中有 8 家企业是已经在二级市场中上市。其中即有创业软件、卫宁健康这样的传统医疗信 息化企业,通过信息化系统采集、集成医疗大数据,也有华大基因、贝瑞基因这样的基因测序 企业。

在已经融资的企业中,天使轮和 A 轮企业相对较多,这也符合一级市场的情况。而融资到 B 轮阶段的企业也比其他细分领域较多,其中绝大部分是基因行业的创业企业,占到了 32 家, 还有部分是同属于人工智能的医疗影像企业。而在临床数据集成、挖掘为主要业务的医疗大数 据企业融资到 B 轮或后期其他轮次的仍然偏少。

新知图谱, 医疗大数据的发展阶段和行业现状分析

从医疗大数据企业的数量气泡图来看,围绕基因大数据做文章的企业数量最多,目前该领域的 发展也非常快。但是,直到现在临床对基因大数据的需求并不强烈,只有很少部分的产品得到 了普及。基于临床数据的医疗大数据企业数量排第二,因为患者体征数据、病种数据、治疗方 案与治疗效果等临床所产生的大数据辅以应用场景后,是可以直接应用到诊断、治疗过程中的, 医疗机构有很强烈的数据需求。

新知图谱, 医疗大数据的发展阶段和行业现状分析

接下来进行融资金额的统计,我们从有融资记录的企业中计算融资金额,建立医疗大数据融资 气泡图。基因领域的企业融资金额仍然最大,达到了 209 亿 2083 万人民币。围绕健康数据做 健康管理的企业虽然数量少于数据服务类型的企业,但是两个领域的企业融资金额相差无几, 都在 70 亿人民币左右。排第四的是影像数据,也是人工智能的一种,在 2016-2017 受了市场

极高的关注度,总融资金额为 38 亿 4362 万。而其他偏冷门一些的应用领域,投资机构的关 注度较小,总融资金额偏低。

新知图谱, 医疗大数据的发展阶段和行业现状分析

我们把医疗大数据和基因大数据分开,看企业把数据应用在哪些方向上。医疗大数据应用最多 的是疾病的诊断和治疗,占到整体业务开展方向的 37% 。我们对疾病的认识经常是基于某一个 疾病的整体,忽视了疾病个体之间的差异。因此,从个体到群体再到个体这样一个循环,利用 大数据从疾病的整体认识中抽象出系统化的信息积累,然后再具体到个体。通过大数据分析, 医疗机构可以提高个体疾病诊断的准确性和治疗方案的准确性,是目前医疗行业亟需的技术革 新,而且发挥的作用也是立竿见影的。

临床数据管理是在医疗机构中常见的信息化技术应用,主要是通过信息化平台从各科室获取医 疗相关的原始数据,然后进行数据抽取按照统一的格式进行存储和集成。这部分工作主要的参 与者是医疗信息化领域相对比较老牌的信息化厂商。其后,会对整合好的数据进行加工、清洗、 挖掘和数据可视化,使其发挥最大的作用。这部分工作的主要参与者,大多数是新兴的创新企 业。临床数据管理方向的业务应用占到了医疗大数据企业的 25%

其他八种应用方向占了剩余医疗大数据企业的 1/3 ,但是能获得较高融资金额和较高估值的企 业是医生辅助工具和医院管理方向的。因为这两种应用和疾病诊疗一样,大数据总结的知识能 立即形成价值输出,使用方的付费意愿强烈。

新知图谱, 医疗大数据的发展阶段和行业现状分析

基因企业的应用属性按应用场景,分为院内和院外。院内应用是利用基因测试完成疾病的辅助 诊断和用药指导,以肿瘤患者的个性化治疗方案为主。这类企业在商业模式上更容易得到投资 机构的认可。院外应用是利用基因测试完成生理特征、易感基因等偏消费类的测试项目,企业 数量仅占基因大数据企业的 22%。

二、医疗大数据行业发展难点

虽然在宏观政策层面国家对于发展健康医疗大数据是鼓励和扶持的,但是具体到政策落地和具 体操作,尚有多项现实性难点和障碍需要攻克和破除。

1. 医疗大数据的壁垒深厚

医疗大数据生态链上的相关企业在蓬勃发展,国家也在大力支持大数据产业在医疗健康领域的 应用。电子病历数据是医疗大数据最大的来源,但是受制于相对传统的体制,医疗机构所产生 的数据并不能很好的向产业开放。医疗卫生机构很难有动力去共享这些数据,医疗机构和医疗 机构之间、医疗机构和社会公众领域之间,均存在不同程度的数据壁垒。数据孤岛效应一方面 造成了患者数据重复采集和医疗资源浪费,另一方面也阻碍了健康医疗大数据的后续利用和挖 掘。

2. 医疗大数据权属

目前的法律体系尚不能很好的解释和界定健康医疗数据的权属问题,特别是医疗数据的所有 权。实践中,存在医疗大数据的所有权到底属于患者个人还是医院的争议。有观点认为,医疗 大数据反应的是个人的健康状况,理应属于患者个人;有观点认为,医疗大数据是由医院采集、 录入才能产生的,存储和保存也在医疗机构,理应属于医疗机构;还有观点认为,医疗数据的 所有权在于患者个人、控制权在于医院、管理权在于政府,第三方机构需借助政府支持和医院 配合方能对其进行商业化开发和利用。实际应用中,医疗大数据的权属基本在医院方。医疗数 据权属的模糊性,一方面掣肘着健康医疗数据的授权使用,另一方面也给患者的个人信息权保 护提出难题并埋下了隐患。

3. 医疗大数据安全

《关于促进和规范健康医疗大数据应用发展的指导意见》中提出要用多项措施保障医疗大数据 的安全,建立数据安全管理责任制度,制定标识赋码、科学分类、风险分级、安全审查规则。 开展大数据平台及服务商的可靠性、可控性和安全性评测以及应用的安全性评测和风险评估, 建立安全防护、系统互联共享、公民隐私保护等软件评价和安全审查制度。加强大数据安全监 测和预警,建立安全信息通报和应急处置联动机制,建立健全 “互联网 + 健康医疗 ”服务安全 工作机制,完善风险隐患化解和应对工作措施,加强对涉及国家利益、公共安全、患者隐私、 商业秘密等重要信息的保护,加强医学院、科研机构等方面的安全防范。

4. 医疗大数据的隐私

目前围绕个人信息保护的立法正稳步开展并趋向完善:目前尚在审议中的《民法总则》草案有 望将个人信息权从隐私权中独立出来,专门进行保护;随着公民个人信息权利意识的提高,立 法机关可能会加快制定和出台个人信息保护单行法的进程。《网络安全法》已于 2017 6 正式实施,《网络安全法》规定, “网络运营者不得泄露、篡改、毁损其收集的公民个人信息; 未经被收集者同意,不得向他人提供公民个人信息。但是,经过处理无法识别特定个人且不能 复原的除外 ”。根据本条但书的规定,大数据应用必须对公民个人信息进行脱敏处理。由此可 见,立法者有意从制度设计层面为大数据的应用留下可行性空间,以取得个人信息保护和公众 利益之间的平衡

三、医疗大数据产业目前处于发展的第二阶段

健康医疗大数据是一种高附加值的信息资产,虽然个体健康医疗数据对于医疗技术革新的价值 有限,但通过对海量、来源分散、格式多样的数据进行采集、存储、深度学习和开发,可以从 中发现新知识、创造新价值、提升新能力,从而进一步反哺健康医疗服务产业。因此,健康医 疗大数据的发展关乎国计民生,具有重大的战略性意义。

新知图谱, 医疗大数据的发展阶段和行业现状分析

医疗大数据的目前处于发展的第二阶段,医院是医疗大数据最早产生和使用的主体。目前的医 疗大数据已经扩展到医疗相关的医药、流通企业。在未来,医疗大数据的机制不仅仅是为医生、 医院、药企服务,而是每一个人,用数据来全方位关注我们的身心健康。


新知图谱, 医疗大数据的发展阶段和行业现状分析

医观
+ 关注

更多新知