小熊科技|AI 助力新冠研究!AIWIN 邀约全球 NLP 和知识图谱英雄参赛


小熊科技|AI 助力新冠研究!AIWIN 邀约全球 NLP 和知识图谱英雄参赛在刚刚过去的2020世界人工智能大会云端峰会 AIWIN 盛典上 , 上海市经济和信息化委员会副主任张英、上海市大数据股份有限公司总裁刘九评、AWS 亚马逊医疗及生命科学行业总监黄庆春、上海市人工智能产业投资基金总经理吴巍、AI SPACE 合伙人高丰共同启动了 AIWIN2021 赛季第一个比赛“抗新冠助科研 AI 大赛“(下简称 , 新冠 AI 大赛) 。
此次新冠 AI 大赛由 AIWIN 组委会和上海人工智能发展联盟医疗专委会共同主办 , 上海枫林生命健康产业发展(集团)有限公司、上海市大数据股份有限公司、亚马逊 AWS、上海人工智能产业投资基金、AI SPACE共同承办 。
新冠 AI 大赛将基于全球最大的开放性冠状病毒研究论文数据集 CORD-19 (Corvid-19 Open Research Dataset , 简称 CORD-19)开展 , 邀约全球 NLP 和知识图谱方向的企业和开发者 , 共同围绕该数据集产出前沿知识、工具和产品 。
CORD-19数据简介
新冠开放研究数据集(Corvid-19 Open Research Dataset , 简称 CORD-19)是一个开放的包含近 20 万篇有关冠状病毒学术论文(其中 8 万多篇为全文论文)的数据集 。 面对日益增多的新冠研究论文 , 科学社群已很难通过手动方式快速掌握第一手最新的关于新冠的实验资讯、科学结论等 , 因而这个数据集的开放就在于鼓励使用包括自然语言技术 NLP 在内的 AI 技术 , 帮助人们快速掌握最新的研究成果和内容 , 并为抗击新冠的持久战提供新的助力 。
这个数据集包含有来自以下渠道的论文 , 覆盖新冠以及 SARS、MERS 等冠状病毒的研究:
? PubMed 上通过关键词检索所返回的论文数据
? WHO 世卫组织所维护的论文
? 在 bioRxiv and medRxiv 上和 PubMed 执行相同管检测检索所返回的预印论文
这个数据集是 Allen 人工智能研究院和扎克伯格基金会、乔治敦大学安全与前沿科技中心、微软研究院、IBM、国立医疗图书馆、白宫科学与科技政策办公室的合作成果 。
本次赛事 , 推荐使用 AWS 适用于机器学习的完全集成式开发环境 Amazon SageMaker , 可以通过通过更少的工作量和更快地获得结果 。 AWS 也会对使用 Amazon SageMaker 的参赛企业选手 , 提供算力支持与技术指导 , 使之成为机器学习新技能专家 。
新冠 AI 大赛 赛事题目
赛事将向参赛者提供新冠肺炎科研论文开放数据(CORD-19) , 采用开放命题方式开展赛事 。
参赛项目应通过自然语言处理 , 对论文数据予以分析 , 从而产出和展示对科研成果解读、病毒研究、药物研发、公共卫生管理等方面有助益的新知识或新工具 。
任何有效提交均需基于 CORD-19 , 赛事同时不限制使用外部其他数据 , 但需在所提交的文档中明确列明数据来源、数据获取方式、数据基本元信息、数据使用方式 。
新冠 AI 大赛 参赛对象
参赛对象分为企业组和个人组:
? 企业组: 针对生物医疗方向的知识图谱类企业 , 能够通过CORD-19 数据的分析应用 , 展示自身知识图谱建设的技术能力 (技术型企业) 或针对生物医药方向的人工智能企业 , 能够通过 CORD-19 数据的分析应用 , 增强改善自身已有的人工智能应用在新冠症疗和防控方面 。 企业组参赛需提交企业营业执照副本 。
? 开发者:任何非企业组开发者(含在校生) , 可通过 CORD-19 数据的分析应用 , 展示自身人工智能技术能力和应用能力 。
新冠 AI 大赛 时间计划
01 赛事报名/初赛提交
7月 28 日 - 9 月 4 日
正式启动报名并接受初赛的提交 , 初赛阶段提交项目提案、初步成果(企业同步提交 BP)
02 初审
9月 5 日 - 9 月 21 日
初审 , 侧重于提案的可行性和初步结果