建设|对话长征医院刘士远教授：数据库建设与医学影像AI的未来中薪|高薪|ai|医学影像|数据库

2020年9月18-20日，由中国医学影像AI产学研用创新联盟（CAIERA）主办的第二届中国医学影像AI大会在上海国际会议中心盛大开幕。作为本次大会的战略合作媒体，雷锋网进行了全程报道。本届大会以“AI助力健康中国”为主题，吸引国内外数千名政、产、学、研、医及AI产业界代表参会。在第一天的开幕式上，中国医学影像AI产学研用创新联盟理事长、大会主席刘士远主任在现场重磅发布了《医学影像人工智能2020发展报告》，总结了2018年首届医学影像AI大会以来的最新行业变化与趋势。

文章插图
刘士远主任在接受雷锋网采访时，对这一要点作了进一步阐释：未来的趋势在于，是在信息化系统或者设备工作站系统中整合各类医疗AI应用，通过一个统一的入口来提升医生的工作效率，提升临床医生、影像医生的使用获得感。当然，解决这个问题的核心，还在于医院领导和信息化部门的思维创新，即开不开放信息化系统的接口；以及如何辨别不同医疗AI产品的差异性。而第二点，这就回到了产品考核体系的问题——建立一些客观的行业标准。标准，一直是医疗AI行业数年来一直讨论不断的话题。围绕数据库建设和行业标准的问题，刘士远主任非常健谈：“现在行业缺少的就是标准，每个环节都是。虽然已经有企业拿到三类证，但是这仅仅是一个开端。进入临床以前，任何一个医疗产品都要有效果考核体系，要考核有效性、安全性、稳定性。”在今年几款医疗AI产品获批的条件下，刘士远主任预判：在进入临床应用之前，医管局将会进一步加速评价体系的工作进度。然而，从微观层面来看，肺结节、冠脉、脑肿瘤，这些不同病种的评价标准不一致，数据库建设的维度很多、难度很高。因此，完成这件事情需要依赖行业协会的核心专家，如果没有核心专家的参与，标准的制定很难符合实际情况。除了监管和行业协会，从几年前起，不同的医疗AI公司也组织相关人力，对医学影像数据进行梳理、标注，形成了一个个的小数据库。但是，这样的数据库有若干问题：一、数据的采集、标注数据的质量如何界定？二、数据采集的合法、合规，是否存在“灰色地带”？当然，这只是在数据采集阶段面临的一些难题。除此之外，在产品的研发环节、验证环节、使用环节的标准都需要建立。这是因为，数据库系统建设是一项庞大的工程，需要逐步推进；其次，AI产品具有特殊性，本身的性能表现也具有波动性；再者，产品的敏感性和特异性是“一个跷跷板的两端”，评价AI产品的性能也是一个动态的过程。所有的一切都在变化，这就需要数据库建设的参与者，做好“持久战”的准备，不断更新思维、更新方法。刘士远主任表示，数据库建设是人工智能发展的一个核心问题。虽然人工智能的算法、算力在不断进步，但是数据永远是硬道理，数据库的建设是一件“非做不可”的事情。“高质量标注的数据，一定是AI上下游所最需要的，也是政府监测、检测、评价所需要。”基于这样的考虑，2018年，刘士远主任就曾牵头建设一个带有“示范性”和“实验性”的库，其中包含600多例放射影像数据。他坦言，这个库只是基于CT的肺结节小样本影像数据，更多的是摸索、试验并掌握建库的方法、路径和标准。而今年启动的肺结节数据库建设，则是由卫健委相关部门主导，希望从数据模态、数据规模和数据维度上完全不同的数据库。据雷锋网了解，目前卫健委放射影像数据库的第一个立项是肺结节数据库，未来冠脉、脑肿瘤、乳腺、肝脏都会单独立项。刘士远主任表示，未来形成的数据库将具备大样本、可挖掘、可拓展、多样性的特征，真正符合数据库建设的需求。“数据库是国家战略资源，需要行业上下游贡献力量，尤其是掌握数据且具备制定标准和标注规则的细分行业医生，更有不可推卸的责任，最终建成后医生也会成为最终的受益者。比如放射影像数据库，需要全国的放射医生本着责任性和情怀，不仅要积极参与标准和标注规则的制定，也要积极参与贡献数据，一旦建成十多个亚专业方向的数据库，其战略价值不仅是人工智能的应用，还可以用于多中心科研、医生的继续教育以及人才培养；它的价值也不只是全国性的，更会是全球性的。”以下为刘士远教授的大会演讲内容，雷锋网做了不改变原意的编辑和整理刘士远：中国医学影像的发展，经历了十年的深耕，到现在为止发生了很大的变化。