2017医疗大数据与人工智能报告【转】 – 三郎君的日常

面试 · 2023年5月26日 0

2017医疗大数据与人工智能报告【转】

研究背景:近年来,人工智能技术得到长足进步,逐步成为一项可应用和可普及的基础技术。在医疗健康领域,人工智能在疾病筛查、辅助诊疗、药物研发等领域取得了不俗的成绩。作为国内最早涉足医疗人工智能报道的媒体,动脉网从2014年开始关注这个产业,已采访业内人士超1000人,原创发布超过550篇关于人工智能和医疗大数据的文章。

2017 年7 月20 日,国务院发布了《新一代人工智能发展规划》,这是在国家层面首次对一项技术内容进行全盘布局。借此契机,我们决定对人工智能与医疗大数据在医疗健康领域的应用进行全面梳理,输出我们浸淫行业多年所得认知,希冀实现我们为行业鼓与呼的理想。

对象界定:本报告的研究对象为全球范围内医疗健康领域的人工智能企业,判断企业是否属于人工智能企业的标准为企业业务流程中是否使用到一种或多种人工智能算法。

数据来源:本报告信息基于于行业人士访谈、动脉网数据库、Crunchbase、学术文献以及相关产业报告。动脉网蛋壳研究院未对现有或提供给动脉网研究院的此信息做独立验证,且不就此类信息的准确性或完整性作任何明示或默示的陈述和保证。本报告中包含的分析和结论均基于上述信息。

研究方法:本次研究采用案头研究与田野调查同步进行的方法,以人工智能技术发展及实现形式为主线,探讨技术发展的外延产业发展,试图描绘当人工智能这一关键技术逐渐演进,经济运行模式发生改变,行业重新域定的过程。

主要研究成果

人工智能已经经历两次低谷,正在走上第三波浪潮

算力算法齐备,人工智能+医疗等待医疗大数据引爆

医疗数据获得途径多样,有待国家出台法规规范数据使用

中国人工智能学术研究全球领先

人工智能人才供需严重不平衡

单个细分领域聚集效应明显

人工智能+医疗创业门槛升至百万

巨头插足,多领域协同发展趋势渐成

绘制人工智能+医疗技术成熟度曲线

2017年人工智能+医疗技术成熟度曲线

注: 我们认为医疗影像在技术成熟度曲线上的位置应该在刚越过顶峰期的位置。而其他类型的人工智能+医疗企业,都还大部分处于技术萌芽之后的快速上升期。排名最后的疾病筛查和预测,因为难度最大,算法最复杂、需要数据最多,暂时还在学术机构的研究阶段。

以下是《2017医疗大数据与人工智能产业报告》精简版,包含报告的所有结构,在全文10万字的基础上进行缩减。

一、人工智能发展历程

人工智能已经历两次低谷

第一次人工智能浪潮,出现在1956~1974 年。其间,算法和方法论有了新的进展,特别是算法方面出现了很多世界级发明,其中包括一种称作增强学习的雏形(贝尔曼公式)。

第一次人工智能的冬天,出现在1974~1980 年。人们发现逻辑证明器、感知器和增强学习等,只能做很简单,领域很窄的任务,稍微超出范围就无法应对。

第二次人工智能的寒冬,系由1987 ~ 1993 年个人电(PC)出现“促成”的。计算机由此走入家庭,特别是费用远远低于专家系统所使用的Symbolics和Lisp等机器。于是,在美国,由于政府支持的经费数额开始下降,故又一次寒冬来临。虽然研究还在继续,但是人工智能已经很少被提及了。

21 世纪初,随着计算机周边的互联能力、大数据、计算性能、存储能力和传感器技术的大幅度进步,以及人工智能相关的图像识别、深度学习和神经网络算法等关键技术的突破,人工智能终于有了革命性发展。人工智能从过去的基于专家和人为设定规则中走出,开始从海量数据中自动寻找规则。

解放人类脑力的第四次工业革命

以人工智能为代表的智能互联技术被誉为是第四次工业革命的推动力。前三次革命主要解放了人类的体力,而这次革命,将要解放的是人类的脑力。

社会的生态构成,是以底层技术、在此基础上所形成的社会关系、协调社会运行的规则机制和法度组成的。而域,就是一个时期技术、方法、实践的总和。当域里的关键技术逐渐演进最终发生根本性改变的时候,旧域会跃迁到新域,经济运行模式会在此基础上达到新的稳定,这个过程被称为重新域定。

人工智能产业链一般来说划分为三个层次,分别是底层的基础层,中间的技术层和上层的应用层。但是,数据是人工智能产业链中非常重要的一环。它原本属于基础层,因为其重要性,我们把它提出来,和基础层并列。

人工智能在各行各业中的能力:一是高效率地辅助决策,二是对项目运营进行优化。

辅助决策。通过大数据收集,显著提高决策效率,并降低成本。全面的数据收集不会漏过蛛丝马迹,再用深度学习算法来洞察业务中的关键决策点,计算速度和准确性都要高于人类。

运营优化。通过图像、语音、物联网等各种传感器收集回来数据,对项目运营中的问题进行分析,并提出优化建议。

二、人工智能改变医疗未来

医疗领域最突出的问题就是优质医疗资源不足,同时,医生对疾病的诊断准确度和效率还有非常大的提升空间。长期以来,大多数国家和地区,特别是进入老龄化社会之后,对医生的需求量有增无减。解决医生资源不足的问题,除了增加供给量,别无他法。但是医生培养需要周期,而且供给量也不能无限增加。

于是,人们开始寄希望于机器。因为一旦能够实现机器看病,供给量将会无限增加。所以,人工智能+ 医疗健康的结合,是人工智能诸多应用场景中最重要一个。

三、算力算法齐备,人工智能+医疗等待医疗大数据引爆

算法、算力和数据,是人工智能快速发展的三个要素。

算力是人工智能的基础设施之一,目前每GFLOPS的算力成本已降至8 美分。

算法是人工智能发展的基础,算法框架中诸如Caffe、TensorFlow、Torch 等大多数已经实现了开源,成为大多数工程师的选择,对行业的加速发展和人才的培养起到了非常大的作用。

数据方面,人工智能系统必须通过大量的数据来“训练”自己,才能不断提升输出结果的质量。目前医疗数据还具有公开性不高,难以获得、清洗的特点。

医疗人工智能学习数据三大获取途径

一是企业自有数据。通过大量的人力采集,再对数据进行结构化处理,形成人工智能的训练基础。大部分人工智能企业在进入这个领域之前,正是在各自领域采集到了相当多的行业数据,才考虑对数据资源进行利用,形成人工智能业务。

二是各国政府的公共数据。美国联邦政府在Data.gov 数据平台开放了来自多个领域的13 万个数据集的数据,包含医疗、商业、农业、教育等领域。我国和其他国家也陆续开放了部分领域的公共数据。

三是产业合作数据。人工智能创业公司通过和行业公司,以及产业链上游的数据公司建立合作获取数据,比如医疗方面和医院建立合作关系。IBM Watson 一开始就是通过和纪念斯隆凯特琳癌症中心合作获取病历、文献等数据。

四、医疗人工智能的核动力:医疗大数据

医疗大数据是因健康活动而产生的数据,是有出生、免疫、体检、门诊、住院和其他活动所产生的数据。按照数据来源划分,可以将目前数据库分为三类,分别为电子健康档案数据库、电子病历数据库和全员人口个案数据库。

除了传统的以上三个来源之外,医疗大数据还包含通过“物联网”所收集的数据——医疗器械收集的健康数据,APP、远程监控、传感器提供的连续临床数据。

医疗数据呈爆发式增长

在过去的十年里,随着电子病历的实施,数字化的实验室幻灯片,高分辨率的放射图像、视频,医疗保健数据量呈指数级增长,整个医疗行业的数据量令人难以置信。再加上制药企业和学术研究机构档案,以及数万亿的数据流从可穿戴式设备的传感器中得到。EMC和IDC发布的报告显示,2013年全球医疗保健数据量为153EB,预计年增长率为48%。这意味着到2020年,这个数字将达到2314EB。

大数据成为国家战略,医疗进入大数据时代

健康医疗大数据是一种高附加值的信息资产,关乎国计民生,具有重大的战略性意义。目前,国家已陆续出台关于扶持医疗大数据发展的相关政策,初步做好顶层设计并构建出医疗大数据发展的宏伟蓝图。

虽然个体健康医疗数据对于医疗技术革新的价值有限,但通过对海量、来源分散、格式多样的数据进行采集、存储、深度学习和开发,可以从中发现新知识、创造新价值、提升新能力,从而进一步反哺健康医疗服务产业。

五、我国人工智能发展现状

我国人工智能学术研究世界领先

根据美国发布的《国家人工智能研究与发展策略规划》报告,从2013年到2015年,SCI 收录的人工智能方向论文,涉及“深度学习”的论文数量增长了约6倍。中国学者的论文发表数量从2014年开始超过美国,并大幅度领先于其他国家。

虽然中国学者人工智能论文SCI 发表数量有增加,但是影响力还没有得到相应的提升。在麦肯锡的《中国人工智能的未来之路》报告中显示,2015年中国学者发表的人工智能论文被引用量高达2124篇,远远超过美国的1116篇。但是去掉自我引用部分,美国学者的论文引用量将上升到第一。

人工智能是国家大力推动技术

虽然在人工智能的基础技术上,中国和美国之间还有一定的差距,但是中国政府已经从系统布局,整体部署我国的人工智能发展规划。2017年7月20日,国务院发布了《新一代人工智能发展规划》,这是在国家层面首次对一项技术内容进行全盘布局。

政策盲点

除了从国家层面推动人工智能的产业发展需要政策支持,人工智能在应用过程中所涉及到的法律法规问题也需要尽早规划和监管。特别是在监管严格的医疗行业中,人工智能的商业化应用,还有很多问题需要政策进行规范。

第一,人工智能的应用规范。医疗问题涉及到人的健康和生命,是一个复杂而谨慎的领域,任何问题都和患者的生命安全息息相关。所以,我们需要尽快在国家层面明确监管措施,用法规来监管人工智能在医疗上的应用范围是什么?监管范围是什么?风险的责任判定等等。

第二,数据的合理、合法应用。因为人工智能需要从过往数据中进行学习,才会使其拥有智能,并得到提高。所以,大量高质量的医疗数据是人工智能具有判断力的基础。

第三,产业政策扶持。目前,中国的高科技公司中,有超过半数的公司并没有将人工智能列入 战略计划之中。即使开始涉及人工智能,也可能在数据、人才、技术上还存在阻碍。如何引导数字医疗产业完成人工智能的变革,政府可以通过一些传统经济工具,帮助企业克服人工智能发展初期所面临的问题。

六、人工智能人才供需严重不平衡

领英发布《全球AI 领域人才报告》,中国人工智能领域专业技术人才总数超过5 万人,排名全球第七位,印度、英国、加拿大和澳大利亚分列2-5 位。而美国有超过85 万的AI 人才。

中国11 所高校和中科院4 所研究所(计算机所、声学所、软件所、自动化所),共15 家单位的AI 专家和硕博人才。47 名医疗人工智能创业公司的CTO 或者首席科学家,有30 名都在国外或者中国的香港、台湾进修过,占比63.8%,而与医学专业相关的人才仅有7 人,占比14.9%。美国毕业的学校多为麻省理工、卡内基梅隆、加州大学约翰霍金斯大学等高校。

据行业内人士透露,现阶段不仅人工智能人才短缺,医疗人工智能人才更加短缺。该人士所在实验室中,前后两届毕业生中只有他一人从事医疗行业。该现象在高校中比较普遍,AI 人才从事医疗行业的大约只占十分之一

七、九个和人工智能擦出火花的细分领域

1.虚拟助手

定义:虚拟助手是一种可以和人类进行沟通和交流的辅助机器人,它通过人工智能技术理解人类的想法,学习人类的需求,并输出各类知识和信息,辅助人类的生活和工作。

医疗型和通用型虚拟助手的区别:

应用场景分类:个人问诊、用药咨询、导诊机器人、分诊和慢病管理、电子病历语音录入。

交互方式:人们和虚拟助手的交互方法一般有语音和文字两种,医疗类型的虚拟助手还有另外一种交互方式,就是选择题。因为普通人很难用准确的语言来表达自己的问题,所以医疗健康类的虚拟助手大部分会使用选择题的方式和人进行沟通。

主要参与者:

个人问诊、用药咨询

个人问诊和用药咨询第一个步骤是自然语言处理,通过自然语言处理之后,再根据疾病数据库、医疗信息数据库或者外部的医疗数据库,进行对比和深度学习,对患者提供医疗和护理建议。

个人问诊类应用连接的后续服务是进行互联网就医导流,用药咨询类应用连接的后续服务是进行互联网或线下的药品购买导流。

智能分诊、导诊机器人

服务类机器人主要用于取代重复和简单的人力工作,大部分市场还处于空白状态。而且通过搭载医学相关知识体系,还可能用于家庭等服务场景。相比较而言,导诊类服务机器人和家庭用医疗服务机器人是研究的热点,创新度较高。

工作模式

医疗导诊类服务机器人主要是通过患者的语音输入进行语义分析,然后给出医院的分诊和导诊建议,节约人力,方便患者。更先进的导诊机器人还能通过传感器收集患者的生命体征信息,给出更准确的建议。

慢病管理

慢病管理环节中应用人工智能聊天机器人,则可以保证患者病情在已知、可控的情况下进行病情判断和处理。

慢病APP 作为医患沟通桥梁,当患者的数据发生变化的时候,人工智能可以及时发现问题,邀请医师或者药师人工介入。在人工智能的帮助下,慢病APP连接线下所要匹配的医护人员数量将得以降低,同时不会对服务体验造成不良影响。

电子病历语音录入

人工智能参与的智能语音录入通常由语音识别、语义分析、智能纠错三部分构成。智能语音录入全过程由医疗领域语言数据模型进行支撑,该数据由针对各个科室的业务进行了梳理,定制语音模型而来,覆盖各个科室常用的病症、药品名称、操作步骤等关键信息。

语音智能录入能够大幅提高医生录入病历的速度,从而节省医生的宝贵时间,使其能专注治疗。

2.疾病筛查和预测

现代医学,是从人们的各种生化、影像的检查结果中,去诊断是否患病。如果要实现疾病的未来发展预测,往往力不从心。

人工智能能够参与疾病的筛查和预测,需要从行为、影像、生化等检查结果中进行判断,依靠得最多的检查数据是MRI、CT、X 光等影像数据。根据筛查手段的不同,所以本节的企业类型也可以归纳到其他类型中。人工智能+ 影像领域也是参与企业最多,产品最丰富、涉及疾病种类最多的疾病诊断领域,我们将单独作一个章节进行详细讲解。

目前,人工智能参与的疾病筛查和预测上,绝大部分是人类尚无法攻克的严重疾病,一组数据说明了这一点。人工智能相关的医学论文中,肿瘤以892 篇遥遥领先,阿兹海默排名第二。

目前,疾病预测大多还处于实验室阶段,动脉网蛋壳研究院通过收集整理,发现人工智能在以下疾病预测方面获得了进展:

脑疝预测:《中国卫计统计》2014 年刊登了一篇名为《利用人工智能系统预测大面积脑梗死患者的转归》的论文,利用人工神经网络多层感知机建立多因素预测模型,对大面积脑梗患者的预后进行预测。

慢性肾病分级预测:华南农业大学食品学院的研究员曾经基于人工智能对肾小球过滤进行预测,通过BP 神经网络构造了预测模型,从而最终构建出一个实用性良好的慢性肾病分型预警模型。

心脏病患者死亡预测:英国科学家在《放射学(Radiology)》杂志上发表文章,研究结果认为人工智能可以预测心脏病人何时死亡。英国医学研究委员会下的MRC 伦敦医学科学研究所称,人工智能软件通过分析血液检测结果和心脏扫描结果,可以发现心脏即将衰竭的迹象。

骨关节炎发展预测:卡内基梅隆大学生物工程博士Shinjini Kundu 在一次会议上,展示了人工智能在骨关节炎发展方面进行预测的研究。在Shinjini Kundu 的研究中,通过收集大量人群10 年间的软骨MRI 影像数据,通过人工智能去寻找健康人群和患病人群的影像差别。人工智能通过大量图像数据的学习,能够发现正常人的软骨中的异常,从而预测出未来三年患有骨关节炎的概率。

流行病风险预测:中国平安与重庆疾控中心联合课题组研发的全球首个流感预测模型取得阶段性进展:利用平安的大医疗健康数据和人工智能技术,及重庆市疾控中心监测数据,能够提前一周预测流感发病趋势,并在验证中取得了准确的预测效果。

3.医学影像

现代医学是建立在实验基础上的循证医学,医生的诊疗结论必须建立在相应的诊断数据上,影像是重要的诊断依据,医疗行业80%~90% 的数据都来源于医学影像。所以临床医生有极强的影像需求,他们需要对医学影像进行各种各样的定量分析、历史图像的比较,从而能够完成一次诊断。

“人工智能+医学影像”便是计算机在医学影像的基础上,通过深度学习,完成对影像的分类、目标检测、图像分割和检索工作,协助医生完成诊断、治疗工作的一种辅助工具。

我们把人工智能在图像处理上的能力分为四类:影像分类、目标检测、图像分割和图像检索。将上述四项能力进行组合,便得到了人工智能在医学影像上的具体应用场景。

人工智能医学影像在实际操作中解决了三类问题:

1.把信息更好地呈现给医生。人工智能能够完成脏器的定位、分类以及分割工作并将可疑位置进行标注,相当于为医生去除了干扰项,将更为直接的信息呈现出来。

2.帮助医生定量分析。医生非常擅长定性分析,看到片子,医生1秒内就大致判断什么问题,但是需要一些工具做更精准的判断,定量的分析,靠眼睛很难做到。

3.人工智能影像能够解决的成像和智能图像识别的问题。这两个步骤很多年前是被分开的,技师拍片子,医生做分析。实际上,只有两者结合起来才能更有效的优化系统,帮助医生提供有效的服务。

人工智能在医学影像各领域的应用情况:

4.病历/ 文献分析

人工智能的切入主要是利用机器学习和自然语言处理技术自动抓取病历中的临床变量,智能化融汇多源异构的医疗数据,结构化病历、文献生成标准化的数据库将积压的病历自动批量转化为结构化数据库。

目前人工智能病历/ 文献分析的应用场景主要有三类:病历结构化处理、多源异构数据挖掘、临床决策支持。

病历结构化处理

人工智能系统参与到病历结构化的过程中,能够像一个有经验的医生一样,精准完整的读懂病历所表达的含义,并消解其中的歧义。系统利用自然语言处理技术,深度挖掘和分析医疗文本的信息,它可以快速批量抓取病历中的信息生成一个结构化数据库,这个抓取环节可以为医生节省数月的时间,把这个过程的耗时压缩到几秒。

多源异构数据挖掘

由于历史原因, 我国医院同时运行着过百种医疗信息化系统,这些多源、异构的系统彼此割裂,指使各医疗数据处于孤岛状态,无法得到有效利用。而且,信息化厂商往往通过接口收取高额的费用。

人工智能企业与医院合作,无需和原系统对接,利用大数据技术完成多源、结构和非结构数据的清洗、脱敏、结构化、标准化,使得医院能够一统原先分裂的医疗数据,形成互联互通的医疗大数据平台,为实现大数据处理和分析奠定数据基础。

临床决策支持

临床对于辅助诊断的要求甚高,医学数据或者说辅助诊断场景里,对于结论的可推测性——因果推测链条要求十分严格。在这个场景下,大数据里常用的基于相关性结论的应用和产品设计,并不适用于医学这个特殊领域。

5.医院管理

“医院管理”顾名思义,是指以医院为对象的管理科学,它根据医院工作的客观规律,运用现代的管理理论和方法,对人、财、物、信息、时间等资源,进行计划、组织、协调、控制,充分利用医院的现有资源,实现医疗效用的最大化。

人工智能在医院管理应用上主要有两个方向,分别是优化医疗资源配置和弥补医院管理漏洞。

优化医疗资源配置

传统的医院管理方式完全依靠人工,这带来的问题一方面是医护工作者不能将全部精力投入到医疗工作中,造成医疗资源的浪费;另一方面医护工作者的工作任务已经非常沉重,如果再给予他们更多行政事务,难免造成工作上的低效。

人工智能能够很好的弥补传统的人工进行医院管理带来的问题。人工智能应用机器学习等方式,根据医院已有的信息进行建模,训练出一套精准的算法,并在实际应用中不断自我更新,使模型更有针对性。

弥补医院管理漏洞

系统能够从点评网站、社交平台和新闻媒体等渠道收集客户对医院的评价,通过自然语言处理技术将非结构化的数据处理成能被系统识别的结构化数据,根据已经搭建好的模型,系统能够整理、分析出各种评价背后的真实含义。最后将信息总结成可视化的图表,呈现给医院的管理者,告诉他们根据客户的评价医院在哪些方面做的不到位,可以通过哪些方式进行整改。

在相对流程化的信息收集阶段,人工智能相比人工收集的优势是非常明显的。对信息的收集和清洗往往需要耗费人工几周甚至几个月的时间,而人工智能系统全部进行数字化处理,将时间缩短至几个小时或几天,大大减少了工作量。

6.智能化器械

智能化器械是指由现代通信与信息技术、计算机网络技术、行业技术、智能控制技术、人工智能技术汇集而成的针对医疗器械的应用。但是智能化器械不是指普通的拥有智能功能的医疗器械,它可以摆脱对医生操作的依赖,通过机器学习等底层技术实现自我的更新迭代。

智能化器械在两个方面能够大大提升医疗效率:首先,智能化器械能够帮助医生节省工作量。其次,智能化器械能够提高器械使用的精准度。

对于传统的器械公司来说,组建一个新部门研发产品的流程是比较复杂的,但是与人工智能公司合作,自己就无需耗费时间、财力和精力去做这个事情,通过合作的方式将人工智能系统搭载在器械上面销售,增加器械的竞争力。

对于医疗人工智能公司来说,产品研发出来以后,与器械厂商的合作有两种好处,一方面可以通过科研合作的方式,验证自己产品的实际临床效果。

7.药物发现

新药的开发流程可分为药物发现、临床前开发和临床开发三个部分。而现代药物发现在技术上又可以分为三个阶段:靶点的发现和确证、先导物的发现、先导物的优化三个阶段。

人工智能在新药研发上的应用主要可以是两个阶段:一个是新药发现阶段,另一个是临床试验阶段。共7种不同应用方向。

8.健康管理

个人的健康数据十分复杂,按照数据的来源我们可以将个人健康数据分为基因数据、生理数据 ( 比如血压、脉搏 )、环境数据 ( 比如每天呼吸的空气 )、社交数据等。有了这些个人健康数据,加上人工智能最终可以实现人们对健康的前瞻性管理。

健康管理是变被动的疾病治疗为主动的自我健康监控。通过带有医疗监控功能的可穿戴设备实时监控人体各项生理指标,结合其他个人健康数据,对潜在健康风险做出提示,并给出相应的改善策略。

根据人工智能应用在不同领域的健康管理,我们将AI 在健康管理上的应用分为:慢病健康管理、人口健康管理、母婴健康管理、精神健康管理、术后健康管理、运动健康管理六个细分领域。

9.人工智能+ 基因

近年来,基因领域的发展已经进入了快车道,基因检测技术得到不断发展和完善,落地应用多点开花,检测价格不断下降,基因检测趋向大众化发展,海量的基因数据的获得已不再是制约。

随着数据的不断积累,对数据的准确注释解读及其如何对临床产生应用价值成为了基因产业下一步发展的关键,分析能力和大数据库是遗传解读和咨询的关键,信息的解读与整合成为了基因相关企业的核心竞争力。

如何解读基因的奥秘,是当代生命科学界的一大难题;如何通过解读基因大数据,获取与疾病相关的变异,找到致病基因,是基因应用于精准治疗、药物研发、个人健康管理并产生影响的核心环节。

通常我们讲基因应用包含两个方面:基因测序和基因解读。基因检测已趋向

大众化,基因序列解读成为目前发展的瓶颈,人工智能便依靠其强大的数据处理能力和学习能力切入到了基因序列解读的进程中。

发展情况

目前,基因企业都意识到了基因解读的瓶颈,Illumina 、华大基因、贝瑞和康等龙头企业已经走在了前列,纷纷将人工智能纳入自己的分析体系。

人工智能在基因解读领域带来了人类不曾拥有的能力,让人类有机会用数字描述生命。相信在不远的将来,这样的场景将会出现,基因检测由专业检测机构完成,结果分析交给人工智能,临床医师只需要最终结论,用这个结论去指导治疗、进行精准的健康管理。

基因领域的企业融资理由绝大部分是因为基因技术和生物技术,和人工智能的关联度不大。基因行业本身近年来融资额度大,频率高。所以,在后续章节的人工智能企业融资盘点中我们没有考虑纳入基因行业。

八、医疗AI 创业公司的商业模式分析

人工智能+ 医疗创业公司的成本组成

医疗人工智能企业的成本主要有生产成本(数据成本、技术成本和人力成本等)和营销成本(运营成本和推广成本等),一般情况下生产成本占据全部成本的大部分。本章节的所有数据和内容来自于采访和研报。

数据成本

医学AI 创业公司涉及的领域有很多,各个领域用来训练模型的数据也不尽相同,这些数据包含放射影像数据、眼底图像数据、病理图像数据、语音数据、电子病例文本数据。因为目前国内尚未形成完整的数据归属权、使用权、隐私权等法规文件,所以各个公司获取数据的渠道和费用也不相同。

算力成本

算力成本也是人工智能创业者不可忽视的一笔费用,计算力又可以分为三个方面:芯片、超级计算机、云计算。创业者往往根据自己的公司数据量的大小,周期、费用、准确性来选择使用哪些计算方法。

据了解,出于成本考虑,购买芯片是大多数创业者的选择,他们购买5000-100000 之间的芯片,自己构建服务器,在本地运算进行模型训练,一般创业者会选择购买英伟达的GPU,适应性更好。

大部分创业者在起步阶段都会选择购买芯片,进行初步的运算,后期需要提高精度或者商业部署的时候,他们会租赁云服务器,这样会降低成本。

人力成本

今年开始,人工智能领域的人才价格暴涨,无论是哪个量级的公司面对上百万甚至几百万年薪的人工智能专家,都有人才招聘难的问题。

医疗AI 的盈利方式

医疗AI 企业的现实挑战

虽然人工智能在医疗领域的应用能产生巨大的潜在价值,但是在现实中让人工智能达到预期效果仍要面临一些问题。尤其是在人才、技术发展、客观基础条件、数据壁垒、政府监管和市场培育等挑战。

人才供需不平衡:人才供需不均衡,人才成本过高严重影响了人工智能公司的发展。

数据质量:人工智能可以对人的意识、思维的信息过程进行模拟,可以像人一样思考,人工智能学习医生的经验就像我们上学时学习课本知识,因此数据的质量至关重要。

数据标注问题:人工智能数据处理中80% 的时间都是在做数据预处理工作,标注的准确性关乎结果的准确性,近两年之内没有什么好的办法,还是要大量医生去标注。

算法方向选择问题:在医生的工作中,影像只是一部分,还有很多主诉和交流,但是目前人工智能尚处于弱人工智能阶段,并不能进行深入的沟通,因此选择辅助分析算法的时候需要选择更少沟通,更客观的方向。

数据监管问题:医疗技术监督管理是卫生监督体系的主要组成部门,是规范医疗服务市场秩序的重要手段和方式,而人工智能刚刚应用到医疗领域,很多监管政策还没有制定,在接下来的发展过程中一定会遇到医疗监管的问题。

市场培养:医疗被认为是人工智能最早落地的领域,但是医疗的特殊性对产品的要求会更高,从认识到被接受再到相应支付体系的完善,以及到医保的接入,都需要一个很长的过程。

政府监管:目前医疗人工智能行业还处于跑马圈地阶段,虽然国家出台了《新一代人工智能发展规划》,但是规划中指出,到2025 年,国家才会初步建立人工智能法律法规、伦理规范和政策体系,形成人工智能安全评估和管控能力。也就是说在这几年内,人工智能几乎 “无法可依”。

九、人工智能+ 医疗的行业布局

大公司分析

国外的科技巨头中,IBM 在人工智能+ 医疗领域的布局最早也最深入,谷歌和微软也有部分参与。Facebook、苹果、亚马逊等巨头在人工智能领域已经有长远考虑,但是主要布局在它们各自有竞争优势的行业,对于跨界应用于医疗行业的人工智能项目较少。

国内的科技巨头中,百度和阿里都推出了自己的人工智能+ 医疗解决方案,而腾讯主要以投资创业公司的形式在人工智能+ 医疗领域布局,最近也推出了具体的人工智能医疗产品。

人工智能+ 医疗初创公司分析

国内企业图谱

国内有83 家企业将人工智能应用于医疗领域,主要布局在医学影像、病历/ 文献分析和虚拟助手三个应用场景,而其中涉足医学影像类的企业数量达到40 家,远高于其他应用场景的企业数量。

根据动脉网数据库、IT 桔子和因果树等渠道的信息,截至2017 年8 月31 日,国内83 家企业的融资总额已经接近42亿人民币,历年的融资情况走势如下(其中2017 年为2017 年1月至8 月的融资金额,单位百万人民币):

2016 年是人工智能+ 医疗在国内形成投资风口的元年,有27 家企业在2016 年进行融资,其中16 家企业融资金额在千万级人民币或美元以上,医疗大数据公司碳云智能当年的融资金额高达10 亿人民币。

国内83 家人工智能+ 医疗企业中有61 家有公开的融资信息,它们目前的融资轮次集中于A轮和天使轮,国内企业在人工智能应用于医疗领域的商业竞赛才刚刚开始。

国外企业图谱

国外有109 家企业将人工智能应用于医疗领域,它们在健康管理、医学影像、新药发现、病历/ 文献分析等应用场景都有比较均衡的布局。

国外有109 家企业将人工智能应用于医疗领域,它们在健康管理、医学影像、新药发现、病历/ 文献分析等应用场景都有比较均衡的布局。根据动脉网数据库、Crunchbase 等渠道的信息,至2017 年8 月31 日,国外109 家企业的融资总额已经超过12 亿美元,历年的融资情况走势如左下图(其中2017 年为2017 年1月至8 月的融资金额,单位,百万美元)。

其中在2014 年肿瘤大数据公司Flatiron Health 融资1.3 亿美元,医学影像公司ButterflyNetwork 融资1 亿美元。排除这两笔融资后,2012 年至2017 年,国外的人工智能+ 医疗领域的融资规模逐年稳步增长。

国外109 家人工智能+ 医疗企业中有99 家有公开的融资信息,它们目前的融资轮次也集中于种子轮和A 轮。因此可见,全球的人工智能+ 医疗领域均处于早期发展的状态。如果仅以市场成熟度的标准观察,国外市场相比于国内市场基本不存在竞争优势。

投资机构盘点

国内和国外都没有出现大量布局在人工智能+ 医疗领域的投资机构,造成这种情况的原因一是人工智能+ 医疗是近年才逐渐成为投资者关注的话题,行业内的优质投资标的并不多;二是人工智能+ 医疗企业的融资金额普遍较高,但由于医疗固有的严谨性和人工智能技术的不确定性,商业化进程相对缓慢,因此投资风险较高。

人工智能+ 医疗技术成熟度曲线

从人工智能+ 医疗企业的投融资数据可以看出来,这个领域已经开始蓬勃发展。早期的人工智能初创公司主要负责基础研究,搭建人工智能学习平台进行算法及算法框架等。在研究成果出来不久,随即被大公司收购。比如Deepmind 和Wit.ai。第二波的人工智能企业负责技术层面的研究,在语音识别、图像识别等领域提升准确度。第三波的人工智能企业,则开始在各领域的应用层面推出产品。

而人工智能+ 医疗企业的蓬勃发展,也正是说明了人工智能的商业化应用正在逐渐接近成功。但是人工智能+ 医疗还有多种应用模式,不同细分领域的发展情况也有很大的差别。那么,这些细分领域之间的市场应用区别有多大?技术成熟度如何?动脉网蛋壳研究院尝试用Hype Cycles 技术成熟度曲线来衡量。

动脉网蛋壳研究院尝试用自己的方法论,来客观描述人工智能+ 医疗各细分领域的发展状况。技术成熟度判断的相关计算指标如下:

1)该细分领域企业的平均融资额。

2)该细分领域的企业数量。

3)该细分领域的行业分散度。

4)该细分领域商用的医院数量。

最后,我们通过自己的分析,列出了如下的人工智能+ 医疗技术成熟度分布。

目前企业数量最多的医疗影像和平均融资额最高的病历/ 文献分析类企业排在成熟度的第一位和第二位。

那么成熟度第一的医疗影像应该位于曲线上的那个位置?蛋壳研究院这样思考。

第一,蛋壳研究院在前面统计过人工智能医疗企业的合作医院数量和目前的产品临床应用情况。从医疗影像类的企业入驻医院数量来看,目前国内科研能力较强,医疗水平靠前的大型医院几乎都已经和企业开始了相关的临床实验。首批种子用户活跃度已经达到了顶峰;

第二,相关领域的大规模媒体报道大约出现在2015 ~ 2017 年,目前在一个平稳的高峰期;

第三,同时涉足医疗影像和病历/ 文献分析的人工智能标杆企业IBM Watson,和MD 安德森医院分手的负面报道开始在2017 年出现,质疑人工智能在医疗上的发挥作用。但是,其他的负面报道并不多见。

所以,我们认为医疗影像在曲线上的位置应该在顶峰期往下一点。投资者和创业者也应该谨慎,在人工智能+ 医疗影像行业目前初创企业扎堆的情况下,如何获得生存空间是值得思考的问题。这个领域算法和技术已经成熟,企业的瓶颈在于如何获取足够丰富的医疗影像数据,如何完成准确的标注,以及如何获取收益。

而其他类型的人工智能+ 医疗企业,都还大部分处于技术萌芽之后的快速上升期。排名最后的疾病筛查和预测,因为难度最大,算法最复杂、需要数据最多。报告中所举例的案例,也大部分还在大学、研究机构的研究阶段,所以位列最后也符合其市场表现。

参考资料

1.《The Big Data Revolution in Healthcare》,麦肯锡,2013年1月。

2.《基因+人工智能,Deep Genomics将会把精准医疗带往何处?》,周伦,2015年8月6日。

3.《人工智能 未来制胜之道》,波士顿咨询,2016年10月。

4.《IBM携手西门子共同打造医疗大健康最强人工智能Watson》,电子工程世界,2016年10月13日。

5.《中国高管眼中的人工智能》,麦肯锡,2016年12月。

6.《Artificial Intelligence》,高盛集团,2016年12月。

7.《人机共存的新纪元》,麦肯锡,2017年1月。

8.《2017年语音产业报告》,VoiceLabs,2017年3月。

9.《中国人工智能的未来之路》,麦肯锡,2017年3月。

10.《Why AI and robotics will define new health》,普华永道,2017年4月。

11.《AI Healthcare\’s New Nervous System》,埃森哲,2017年4月。

12.《Big Data and AI Approach to Investment Management》,J.P.摩根,2017年5月。

13.《Sizing the Prize》,普华永道,2017年6月。

14.《Artificial Intelligence Discussion Paper》,麦肯锡,2017年6月。

15.《Sherlock in Health》,普华永道,2017年6月。

16.《强人工智能的未来已来》,罗兰贝格,2017年6月23日。

17.《阿里云:大数据视觉智能实践及医学影像智能诊断探索》,行湘,2017年6月29日。

18.《人工智能技术在医学领域的应用与前景》,THU数据派,2017年6月30日。

19.《全球AI领域人才报告》,领英,2017年7月。

20.《全球首个流感预测模型落户重庆,平安人工智能助力疾病预测》,经济参考网,2017年7月25日。

21.《金蝶医疗易延华:电子病历与健康医疗大数据,区域化应用是未来》,动脉网,郝雪阳,2017年8月9日。

22.《健康医疗大数据领域的政策和法律问题》,动脉网,2016年11月10日。

23.《全球56%的医疗机构将在2020年前投资区块链技术,生命科学和制药行业优先获益》,动脉网,陈欣,2017年8月19日