机器学习|百度闷声干大事( 二 )


尽管 20 多年前未能圆梦,但随着生物计算发展十分迅速,产生的大量数据(包括基因组学研究带来的人体数据、新药研发过程当中所累积的知识、以及新生的各类机器学习算法等)为认知复杂的生命系统打开了新的大门,也给计算技术带来了新的用武之地。
知名咨询公司埃森哲(Accenture)曾在预测报告中指出——到 2026 年,大数据与医学和制药领域的机器学习相结合将产生每年 1500 亿美元的惊人价值。
可见,生物计算是一个前景辽阔的领地。李彦宏也坚定认为,生物和计算的融合会带来巨大的突破和进步。因此,百图生科的业务发展规划也始终围绕这个核心展开。
雷峰网了解到,百图生科的业务发展分为两个阶段——

  • 第一个阶段:利用前沿 AI 技术构建完整的生物计算平台,并与提供新的数据轴和新的数据分析、药物设计工具的初创企业与研究机构携手,构建生物计算生态,为生命科学企业和科研用户提供丰富的工具能力和完整的解决方案,做好服务。
  • 第二个阶段:深度参与或主导发起新型精准药物和精准诊断产品的研发,携手合作伙伴,为社会贡献极具创新性的精准生命科学产品。
不仅如此,百图生科还计划大力投入关键底层数据设备和计算技术的研发,加速高通量类器官芯片、高分辨物质观测设备、新的组学采集分析设备、蛋白质模拟和生物计算专用芯片的研发。
这并非易事。
仅是 AI 制药,就需要突破三大技术门槛,包括高性能的生物计算引擎、干湿一体的生物数据生产能力、靶点挖掘 — 药物设计全流程的闭环能力。
“这是一个新兴的行业,没有一个成熟的解决方案可以直接套用”,百图生科首席 AI 科学家宋乐说道。
宋乐进一步向雷峰网解释道,要用 AI 发掘新药有三个问题需要提前考虑:
  • 一是了解复杂疾病的困难。
  • 二是对多维度、多尺度的数据进行复杂且多样化的融合处理,包括基因层面的基因测序、表观组,蛋白质表达、蛋白质代谢,组织层面、机理层面等。
  • 三是行业配合问题。数据分析与实验往往是两波人,他们之间的沟通缺乏一个非常高效的系统,将预测、模型输出和试验系统进行整合。
不难想见,即使背靠百度这座大山,百图生科依然步履维艰;毕竟,其要驶入的,是一片无人区。
而百图生科,仅刚刚开始。
没有尽头的投注公开资料显示,百图生科将与百度底层深度学习算法平台飞桨建立深度战略合作,飞桨将为百图生科提供 AI 底层技术和开发工具。同时,百度作为善于处理海量数据、知识图谱,具有巨型数据中心布局的 AI 平台公司,预计也将在底层架构上与百图生科产生协同。
从全球市场来看,企业耗费巨资建立研发中心的大研发模式已成过去。近年流行的趋势是 VIC 模式,即 “VC (风险投资)+IP (知识产权)+CRO (研发外包服务)” 相结合的新药研发模式。
在此模式之上,百图生科提出了“VIP”模式,即利用资本(Venture)+自行参与打造 IP + 生物计算及智能实验平台(Platform)加速药物和诊断管线的 IP 生成和转化——这或将成为百图生科生物计算平台的核心价值和盈利来源。
雷峰网了解到,百图生科有独立的投资部门 BioMap Ventures,其前身是百度风投的生物投资团队,目前在全球已投资了超过 50 家早期企业。

机器学习|百度闷声干大事
文章插图

除了联合生态合作伙伴,百图生科还在不断招兵买马。成立初期,百图生科就宣布两项领军人才招募计划,将分别用 100 万美元年薪及 100 万人民币年薪招兵买马。
值得一提的是,去年加入百图生科担任首席 AI 科学家宋乐就是世界知名的机器学习专家,他曾在 CMU 从事生物计算相关的研究,利用机器学习技术对靶点挖掘、药物设计取得了一系列突破性成果,获得 NeurIPS、ICML、AISTATS 等主要机器学习会议的最佳论文奖。
2021 年 5 月,百图生科还推出了“免疫图谱卓越计划”。百图生科提供自身研发的核心生物计算引擎、海量自有数据、10 亿元的资金补贴,与生态联盟合作伙伴共同推动免疫图谱的绘制,系统探寻癌症、自免等疾病的复杂免疫规律,进一步提高对应的靶点挖掘和药物设计效率。
机器学习|百度闷声干大事】截至 2020 年 7 月底,首批“卓越计划”就已收到来自中科院、协和、北大、清华、复旦等系统的近百个临床和研究团队的申报。