AI赋能医疗的背后,临床大数据该如何“跑起来”

医疗健康 来源:医谷 作者:史士云

19世纪,英国流行病学家、麻醉学家约翰·斯诺运用近代早期的数据科学,记录每天的死亡人数和伤患 人数,并将死亡者的地址标注在地图上,绘制了伦敦霍乱爆发的“群聚”地图,霍乱在过去被普遍认为是由有害空气导致,斯诺通过调查数据的汇总,确定了霍乱的元凶是被污 染的公共水井,并同时奠定了疾病细菌理论的基础,这算是大数据运用的早期雏形之一。

斯诺大概不会想到,在近两百年后,大数据的应用早已不再是偶然,随着医疗卫生信息化的迅速发展,其通过与AI的结合在生物医药研发、疾病管理、公共卫生和健康管理等方面的渗透已逐渐常态化,但问题也相应地随之凸显。

信息孤岛仍存

近两年,关于医疗大健康数据的政策频出,从顶层设计、具体规划指导、数 据隐私和安全、数据管理等多个方面提出了相关的指导意见。

2016年6月,国务院办公厅下发《关于促进和规范健康医疗大数据应用发展的指导意见》指出,鼓励各类医疗卫生机构推进健康医疗大数据采集、存储,加强应用支撑和运维技术保障,打通数据资源共享通道,加快建设和完善以居民电子健康档案、电子病历、电子处方等为核心的基础数据库。

2018年9月, 国家卫生健康委印发《国家健康医疗大数据标准、安全和服务管理办法(试行)》,对医疗健康大数据行业从规范管理和开发利用的角度出发进行规范。《办法》从医疗大数据标准、医 疗大数据安全、医疗大数据服务、医疗大数据监督四个方面提出指导意见,直击目前医疗大数 据领域的痛点,未来对数据的统筹标准管理、落实安全责任、规范数据服务和管理具有重要意义。

然而,即使有专项政策的支持,但都限于宏观层面,相较于其他成熟领域而言,健康医疗大数据领域的法律法规依然存在明显的滞后性,缺乏比较全面、细致、明确的指引和规则,使其的发展受到严重制约。虽然现阶段,已有很多企业在医疗大数据领域进行深耕布局,但受制于市场准入和产业政策的不确定性,目前尚在摸着石头过河,市场热情和活力并未得到充分、有效地释放。

复旦大学上海医学院生物医学研究院教授刘雷认为,正是医疗大数据政策的不明朗,标准的不统一,也直接导致了各个系统之间难以进行数据交换和信息共享,产生了大量的“信息孤岛”。举个简单的例子,患者在A医院拍的片子到了B医院却不认,B医院的医生想要了解患者的信息则需要从零开始,患者曾在A医院做的检查需要在B医院重新再来一轮,“想要打通医疗机构间临床大数据资源的共享通道,至少在现阶段是一件挺困难的事情。”刘雷对医谷说道。

相似的困扰也发生在相距超过一万公里之外的美国,华盛顿大学医学院信息研究所所长Philip Paynes在接受医谷采访时表示:临床大数据间的彼此“孤立”给国家医保机构、患者和医院都带来了负担,实现大数据间的互通互用,是全世界范围内都在着力解决的问题。

作为两所顶尖大学的知名研究学者,刘雷和Paynes想在临床大数据领域做一些努力和尝试。

两人共有的想法迅速得到了学校层面的大力支持,2019年7月26-29日,由复旦大学医学院和圣路易斯华盛顿大学医学院联合授课的“应用临床信息学和数据分析研修班”进行了第一次开班。

复旦大学生物医学研究院教授、复旦大学大数据研究院医学信息与医学影像智能诊断研究所所长刘雷授课

据刘雷介绍,此次研修班得到了业界人士的积极响应,在第一届学员中,来自医院、医疗企业、高校各占了三分之一,“就是纯粹地想把对临床大数据分析和感兴趣的业界人士聚集在一起,通过共有的努力,能把临床大数据的有效运用更推进一步。”

圣路易斯华盛顿大学医学院信息学研究所主任Philip Paynes授课

“希望通过这种国际化的合作,能让临床大数据在医疗机构间甚至跨国间真正地’跑’起来多一种可能性。” Paynes说道。

各自所做的探索

而在这种可能性之前,刘雷和Paynes各自所在的研究机构均已做了大量的工作。

据悉,刘雷所在的复旦大学上海医学院生物医学研究作为一家致力于创建“中国第一、世界一流的生物医学交叉学术研究机构”,已经在生物医学交叉学科领域形成“代谢与肿瘤的分子细胞生物学”、“医学表观遗传学”、“系统生物医学”三个优势方向,并正在努力拓展转化医学研究和精准医学研究,包括老年医学、肿瘤和心血管疾病、出生缺陷、靶点结构与活性小分子、组学和大数据、生物治疗与干预,形成新的交叉学科生长点和下游技术。

“生物学研究从大的层面来说主要分为两种,一种是跟基础研究密切配合,通过诸如测序蛋白质组学等生物技术进行研究分析,另外一种则是跟医疗机构合作,进行临床大数据的整合和分析,这一块是目前我们研究所关注的重点。同时,自国家教育部、国家卫健委与上海市政府共建托管复旦大学上海医学院及其直属附属医院后,对于临床大数据的建设也得到了上海市政府的支持,”刘雷向医谷介绍道。

另悉,目前,复旦大学上海医学院生物医学研究还在申请一个超算中心的建设项目,以该项目来支撑生物学大数据的研究,“复旦大学有包括中山医院、华山医院、仁济医院等17所附属教学医院,这其中有一些医院也在做自身的临床大数据中心,从研究所层面,希望能够给他们提供一些人才培养和技术研究的有力支持。”刘雷表示。

Paynes所在的华盛顿大学医学院信息研究所则是华盛顿大学所有大数据计划的中心, “我们拥有世界上最好的基因组研究所和最具生产力和影响力的基础科学研究企业”,在医学信息技术方面的能力非常强,但在大数据的整合方面还有待加强。”而这也成了Paynes担任华盛顿大学医学院信息研究所第一届所长之后重点开展的工作。

自Paynes上任后,首先将研究所与旗下15所附属教学医院进行了打通联动,从临床大数据的收集到整合再到挖掘,最后到应用,铺设了一条全链式的临床大数据之路。

在Paynes看来:研究所下属的15所教学医院简直就是大数据来源的宝藏,这15家在全美医疗机构中排名比较靠前的医院每天产生大量的临床数据,依托这些已有的临床数据的回顾性研究,是分析研究疾病最基本、最重要的研究方法之一,通过将这些海量的临床数据进行统计分析,分析的结果又将反过来为医生临床诊疗全过程提供疾病共享的发病及治疗总体情况信息,帮助医生科学决策,实现精准医疗。

“我们的梦想是不仅仅是利用临床大数据帮助患者,而是希望这些临床大数能渗透到他们的生活和工作,甚至休闲娱乐,通过大数据的分析能够把他们患病的概率降到最低,让人们能一直保持健康的状态。” Paynes对医谷展望道。

未来发展构想

在刘雷、Paynes和其团队所做的大量临床数据整合的工作中,由于各自旗下拥有多所强大的教学医院,数据的来源已不是问题,然而,摆在他们面前更为现实的问题有两个,一是要解决多模态临床大数据的选择问题。临床大数据来源多样,是一种多模态数据,其包括有结构化很好的数据,比如化验单、处方;还有一些半结构化的数据,比如住院小结、出院小结;还有完全无结构化的数据,比如医疗影像;还有像基因测序这样的组学数据;以及时间序列数据,比如ICU里会看到患者插着各种各样的仪器测量血压心率脉搏等各种流数据。

怎样从这些不同模态的数据里面选出需要的数据,刘雷表示他们,他们需要的更多的是结构化很好的临床数据,为了得到这部分数据,会通过一定的技术平台会对数据进行一定的清洗,从中选取高质量的有效数据。

这个问题解决后,还有一个临床大数据一直以来绕不开的一个争议--安全和隐私问题。

对此,刘雷表示,依托现有的技术,目前收集的临床大数据基本都能做到“不出院”,这在一定程度程度上很好地保证了数据的安全性。Paynes也指出,美国对于医疗大数据有很严密的保护法规,患者的关键隐私数据,如姓名、住址、电话、身份证号等进入数据管理的时候必须要打马赛克,同时对数据进行强加密,数据即使被泄露也是不可解密的,对所有的数据访问(谁什么时间能访问什么)都要有一套严格的访问控制,通过这样的方式来保证数据安全性。

当技术的问题已不再是问题, 这意味着临床大数据和AI的结合会变得更为完美,因此,刘雷和Paynes更多希望监管层能在未来对基于大数据训练的AI能进行更多关于有效性和安全性方面的评估,也就是审批准入要做到严,同时,还要加强公众对医疗AI的认知,不管AI发展到多么先进的程度,总归存在一定的局限性,它永远不可能替代医生,只能是医生的一种辅助诊断工具。

尽管还有一段路要走,但对于临床大数据和AI的搭配,刘雷和Paynes都充满信心,至少在他们现有开展工作的规划里,“应用临床信息学和数据分析研修班”能最终逐步发展为一个硕士人才培养项目,为临床大数据和人工智能培养更多专业人才。同时,基于两个研究机构现阶段开展的工作,有天能实现跨国界的汇聚统一,可以把所有的临床大数据统一在同一个模型上,建立一个类似于联盟数据一样的联合体,这对于数据的整合和应用就会变得游刃有余。

医谷,分享创业的艰辛与喜悦,如果您是创业者,期望被更多的人关注和了解,请猛点这里  寻求报道

意见
反馈

扫码
关注

扫码关注医谷微信

手机访问

扫码访问手机版

返回顶部