Nature | 贝叶斯反应优化在化学合成中的应用

原标题:Nature|贝叶斯反应优化在化学合成中的应用
原创水淼唯信计算4天前
收录于话题
#计算化学25#方法工具18

Nature | 贝叶斯反应优化在化学合成中的应用
文章图片
引言
贝叶斯优化算法是一种基于响应面的迭代全局优化算法 , 在机器学习模型的调整中表现出了卓越的性能 。 贝叶斯优化最近也在化学领域得到了应用 , 然而 , 它在合成化学反应优化中的应用和评价尚未得到研究 。 在这里 , 研究者报道了贝叶斯反应优化框架的开发和一个开源软件工具 , 它允许化学家轻松地将最先进的优化算法 , 集成到他们的日常实验室实践中 。
先睹为快
来自美国普林斯顿大学的RyanP.Adams&AbigailG.Doyle等研究者 , 为钯催化的直接芳基化反应收集了一个大型基准数据集 , 与人类在反应优化中的决策进行了系统的贝叶斯优化研究 , 并将贝叶斯优化应用于两个现实世界的优化工作(Mitsunobu和脱氧氟化反应) 。 基准测试是通过一款在线游戏完成的 , 该游戏将化学家和工程师所做的决定与实验室中的真实实验联系起来 。 研究结果表明 , 贝叶斯优化在平均优化效率(实验次数)和一致性(结果相对于初始可用数据的方差)两方面都优于人类决策 。
化学反应的优化 , 是一项复杂、多维的挑战 , 需要专家评估各种反应参数 , 如底物、催化剂、试剂、添加剂、溶剂、浓度、温度和反应器类型等(图1a) 。 然而 , 在一个典型的实验室里 , 由于时间和材料的限制 , 实验室化学家 , 在一个标准的优化过程中只能评估这些条件的一小部分 。 在高通量实验(HTE)的现代进步扩展了实验能力 , 在有限的条件下可收集几千个数据点 。 因此 , 化学家的艺术是在数百万种看似合理的构型之间进行区分 , 而实验室的设备只能运行其中很小一部分的可能性 。 为此 , 化学家通常通过查阅化学文献以寻找类似的反应 , 并根据经验、机理理解、经验数据和简单的启发式方法直觉出反应成功的最具影响力的维度(即反应参数)来进行实验(图1b) 。

Nature | 贝叶斯反应优化在化学合成中的应用
文章图片
图1.贝叶斯优化的反应
图片来源于Nature
化学家通常也使用系统的、模型驱动的方法来优化反应 。 例如 , 实验设计(DOE)试图对实验条件进行取样 , 以便于反应参数建模和相互作用的反褶积(图1b) 。 结合响应面模型 , DOE能够利用从以前的评估中获得的知识来指导未来实验的选择 。 然而 , 对反应空间的探索通常掌握在预先定义的优化设计、灵敏度分析、文献优先级和操作者的直觉之中 。 此外 , 尽管一个典型的反应需要大量的离散参数的微调 , 筛选要求随着使用最优设计的分类成分的数量呈指数增长 。 因此 , 在实践中 , 一些变量可能保持不变 , 以便在固定的实验预算上进行优化 。
Nature | 贝叶斯反应优化在化学合成中的应用】与反应优化相关的基本挑战并不是化学所独有的 。 机器学习是对从数据中学习的计算机算法的开发和研究 , 实践者的任务通常是找到模型超参数 , 从而优化性能 。 这个元挑战推动了算法优化的自动化方法的发展 。 贝叶斯优化是一种不确定性引导的响应面方法 , 用于优化计算成本较高的目标函数 , 该方法表现出了优异的性能 , 在许多情况下优于专业从业者和其他最先进的全局优化算法(图1c) 。 贝叶斯优化旨在平衡不确定性领域的探索和可用信息的利用 , 从而在较少的评估中实现高质量的配置 。 重要的是 , 贝叶斯优化算法可以应用于包括任意参数化反应域在内的多种搜索空间 , 并允许并行选择多个实验 。 因此 , 这种方法非常适合于化学过程的优化 。 然而 , 贝叶斯优化直到最近才引起化学学界的兴趣 。 选择的应用包括自动化学设计 , 高通量虚拟筛选和程序流化学 。 虽然研究人员已经开始探索机器学习方法在反应优化中的应用 , 但这些努力的目标是合成化学的一个有限子集 , 其中只包括连续过程参数 。 也就是说 , 据目前所知(1)没有应用于典型的批处理化学;(2)没有通用的软件平台 , 可以方便地为非专业人士使用;(3)没有系统地与专业化学家的性能进行比较 。
在此 , 报告了一个用于贝叶斯反应优化的模块化框架的开发 , 以及与自动化系统(例如 , 计算机实验)和人在闭环实验中(例如 , 小规模筛选)兼容的开源软件 。 该方法旨在整合现有的合成化学实践 , 适用于任意搜索空间 , 包括连续和分类编码的反应 , 并允许包括物理和领域专家 。