【动脉网】Clara怎么做,医疗AI开发原来这么容易,来看看NVIDIA

2003年 , 当一种冠状病毒引发的非典疫情席卷亚洲时 , 互联网尚处于萌芽期 , 互联网在医疗场景中还没有落地 , 人们仅能前往医院等待治疗 。 那时 , 影像科总是人潮涌动 , 很多患者因为在医院聚集而遭受感染 。
今年 , 一种新的冠状病毒带着更强的传染性席卷全球 , 但中国仅花费不到两个月 , 便控制住了病毒在湖北以外地区的传播 。 在AI的帮助 , 疫区影像科的诊断效率迅速上升 , 患者聚集情况大幅改善;新药研发公司也通过创新的基因分析手段探索病毒的RNA结构 , 短短数日便能筛选出1000多个RNA聚合酶核苷类抑制剂化合物的可编辑结构化数据 。
正如我们在疫情之中观察到的 , 人工智能辅助诊断、基因分析等技术正因为其广袤的前景而吸引着越多越多的研究人员进入其中 , 但由于行业自身的高门槛 , 许多拥有丰富经验的医生、学者难免在研究路上受挫 。
如今 , 为了让更多的开发者能够体验到NVIDIA的算力支持 , 并以更加简单的方式对数据进行编辑 , NVIDIA在EGX、DGX、云计算服务之上开发了Clara框架 , 为研究人员提供联邦学习、迁移学习等服务 , 通过降低数据门槛的方式 , 推动研究人员把重心回归研究本身 。
什么是ClaraNVIDIA正式发布Clara平台是在2018年的RSNA之上 , 那时NVIDIA的目的仅是为影像学AI研究者提供一个医学影像的软件开发工具 , 以标准化影像数据 , 并提升AI训练速度 。
随后 , NVIDIA的开发者发现 , 基因组是一个更为庞大的数据源 , 要处理亿级的碱基配对 , 必须找到更理想的算力来源 , 才能保证试验在成本上可行 。 在2019年苏州举办的GTC大会之上 , 基因组学已经成为Clara要啃掉的另一块蛋糕 。
到了今天 , NVIDIAClara的定位于面向医疗开发者的智能计算软件平台 。 接下来 , 所有医疗行业的解决方案都会整合进Clara , NVIDIA意欲打造一个全能的“医疗百宝袋” , 为更想要探索医疗领域的开拓者提供高效便捷的数据分析工具 。
【动脉网】Clara怎么做,医疗AI开发原来这么容易,来看看NVIDIA
文章图片
NVIDIAClara
从整体上看 , NVIDIAClara包含了GPU加速库、3个SDK以及一系列参考应用 。 在这一阶段下 , Clara能够为科研工作者提供的服务主要聚集于医学影像领域与基因分析领域 , 而这两个领域 , 正因为大数据的浪潮而飞速发展 。
医学影像应用:用AI帮助开发者标注3D影像在医学影像中 , 如果一个医院或者一个企业想利用AI技术构建一个深度学习算法 , 并将其投入使用 , 那么需要完成4个步骤的工作 。
【【动脉网】Clara怎么做,医疗AI开发原来这么容易,来看看NVIDIA】数据是构建AI的第一步 , 在获得原始数据后 , 研究人员首先需要对数据进行特定的标注 , 如标注出肺部CT影像中的结节部分 。 要构建一个运行优异的AI算法 , 这一步操作至关重要 。
有了标注数据后 , 研究人员便需要将数据导入到选定的AI模型中 , 开发适合于研究人员需求的深度学习算法 。 从国内的情况而言 , 很多研究人员通常是使用开源算法进行二次开发 , 或是借助于其他领域表现良好的算法进行迁移 。
第三步是通过测试集对已有的算法进行检验 。 研究人员需要把AI模型放到实际之中 , 观察AI的实际运行情况 , 如果算法不能很好满足测试集的要求 , 研究人员可能就需要修改算法参数 , 重新开始训练 。
当研究人员获得测试表现良好的算法后 , 便可以尝试将其部署于设备端 , 在真实的医疗诊断环境中进行推理工作 。 到此为止 , AI的开发工作便已基本完成 。
NVIDIA开发ClaraAI应用平台的目的就是为了让上述的四个步骤标准化、简单化 , 让研究人员可以更加专注于医学本身的研究 。
以数据标注为例 , 这一工作本是一件体力活 , 是“人工”跨向“智能”不可避免的重复性工作 , 而医生不可能将太多的时间花在像素点连线之上 。 所以 , 一般AI企业选择从医院寻找刚毕业的研究生进行勾画 , 其成本在每组数据20-30元 , 实习生处理一组低层数据通常需要20-40分钟 , 若要使勾画更精细 , 则需花费1-2小时的时间 。