建设|对话长征医院刘士远教授:数据库建设与医学影像AI的未来

2020年9月18-20日,由中国医学影像AI产学研用创新联盟(CAIERA)主办的第二届中国医学影像AI大会在上海国际会议中心盛大开幕。作为本次大会的战略合作媒体,雷锋网进行了全程报道。本届大会以“AI助力健康中国”为主题,吸引国内外数千名政、产、学、研、医及AI产业界代表参会。在第一天的开幕式上,中国医学影像AI产学研用创新联盟理事长、大会主席刘士远主任在现场重磅发布了《医学影像人工智能2020发展报告》,总结了2018年首届医学影像AI大会以来的最新行业变化与趋势。
建设|对话长征医院刘士远教授:数据库建设与医学影像AI的未来
文章插图
刘士远主任在接受雷锋网采访时,对这一要点作了进一步阐释:未来的趋势在于,是在信息化系统或者设备工作站系统中整合各类医疗AI应用,通过一个统一的入口来提升医生的工作效率,提升临床医生、影像医生的使用获得感。当然,解决这个问题的核心,还在于医院领导和信息化部门的思维创新,即开不开放信息化系统的接口;以及如何辨别不同医疗AI产品的差异性。而第二点,这就回到了产品考核体系的问题——建立一些客观的行业标准。标准,一直是医疗AI行业数年来一直讨论不断的话题。围绕数据库建设和行业标准的问题,刘士远主任非常健谈:“现在行业缺少的就是标准,每个环节都是。虽然已经有企业拿到三类证,但是这仅仅是一个开端。进入临床以前,任何一个医疗产品都要有效果考核体系,要考核有效性、安全性、稳定性。”在今年几款医疗AI产品获批的条件下,刘士远主任预判:在进入临床应用之前,医管局将会进一步加速评价体系的工作进度。然而,从微观层面来看,肺结节、冠脉、脑肿瘤,这些不同病种的评价标准不一致,数据库建设的维度很多、难度很高。因此,完成这件事情需要依赖行业协会的核心专家,如果没有核心专家的参与,标准的制定很难符合实际情况。除了监管和行业协会,从几年前起,不同的医疗AI公司也组织相关人力,对医学影像数据进行梳理、标注,形成了一个个的小数据库。但是,这样的数据库有若干问题:一、数据的采集、标注数据的质量如何界定?二、数据采集的合法、合规,是否存在“灰色地带”?当然,这只是在数据采集阶段面临的一些难题。除此之外,在产品的研发环节、验证环节、使用环节的标准都需要建立。这是因为,数据库系统建设是一项庞大的工程,需要逐步推进;其次,AI产品具有特殊性,本身的性能表现也具有波动性;再者,产品的敏感性和特异性是“一个跷跷板的两端”,评价AI产品的性能也是一个动态的过程。所有的一切都在变化,这就需要数据库建设的参与者,做好“持久战”的准备,不断更新思维、更新方法。刘士远主任表示,数据库建设是人工智能发展的一个核心问题。虽然人工智能的算法、算力在不断进步,但是数据永远是硬道理,数据库的建设是一件“非做不可”的事情。“高质量标注的数据,一定是AI上下游所最需要的,也是政府监测、检测、评价所需要。”基于这样的考虑,2018年,刘士远主任就曾牵头建设一个带有“示范性”和“实验性”的库,其中包含600多例放射影像数据。他坦言,这个库只是基于CT的肺结节小样本影像数据,更多的是摸索、试验并掌握建库的方法、路径和标准。而今年启动的肺结节数据库建设,则是由卫健委相关部门主导,希望从数据模态、数据规模和数据维度上完全不同的数据库。据雷锋网了解,目前卫健委放射影像数据库的第一个立项是肺结节数据库,未来冠脉、脑肿瘤、乳腺、肝脏都会单独立项。刘士远主任表示,未来形成的数据库将具备大样本、可挖掘、可拓展、多样性的特征,真正符合数据库建设的需求。“数据库是国家战略资源,需要行业上下游贡献力量,尤其是掌握数据且具备制定标准和标注规则的细分行业医生,更有不可推卸的责任,最终建成后医生也会成为最终的受益者。比如放射影像数据库,需要全国的放射医生本着责任性和情怀,不仅要积极参与标准和标注规则的制定,也要积极参与贡献数据,一旦建成十多个亚专业方向的数据库,其战略价值不仅是人工智能的应用,还可以用于多中心科研、医生的继续教育以及人才培养;它的价值也不只是全国性的,更会是全球性的。”以下为刘士远教授的大会演讲内容,雷锋网做了不改变原意的编辑和整理刘士远:中国医学影像的发展,经历了十年的深耕,到现在为止发生了很大的变化。