Nature | 贝叶斯反应优化在化学合成中的应用( 四 )


为了找到最佳的实验条件(约占实验空间的6%) , 每个参与者最多有20批反应 , 共100个实验 。 然而 , 在实践中 , 大多数参与者进行的实验少于20轮 , 例如 , 因为他们认为自己已经获得了全局最优解(图4c) 。 因此 , 除了比较原始的优化路径之外 , 研究者还试图为数据集中的平均人类性能计算最佳和最差情况的边界 。 假设提前停止的玩家 , 如果继续玩下去 , 就不会获得更高收益的条件 , 我研究者得到了图4d所示的下限 。 这个边界接近原始平均值 , 达到第11批 。 相反地 , 假设玩家继续下去 , 他们在下一批实验中会达到100%的产量 , 可得到图4d所示的上限 。 这个不切实际的上界 , 非常接近优化器的平均路径 。
有了原始数据和硬边界在手 , 研究者试图从统计学测试平均而言 , 是人类还是机器做出了最佳决策 。 为此 , 在优化的每一步 , 研究者进行韦尔奇t-检验 , 原假设是平均人类和贝叶斯优化性能是相同的 。 在图4e中 , 研究者绘制了每种情况的p值 。 p<0.05表示可以拒绝原假设 。 也就是说 , 人类和贝叶斯优化的性能在统计上是不同的 。 对于原始数据和下界 , 研究者推断出经过平均第五批实验后 , 该优化器的性能优于人工优化 。 相比之下 , 对于上界 , 我们发现两种集中趋势之间没有统计学上的显著差异 。 因此 , 在反应3的优化中 , 在追溯了游戏记录数据的不现实输入上限 , 得出结论:贝叶斯反应优化的平均表现优于人类专家 。
应用
在统计上验证了方法之后 , 研究者下一步进行了真实世界的贝叶斯优化测试案例 , 以优化与药物开发相关的反应 。 重要的是 , 研究者选择了 , 在不可能通过HTE详尽收集实验数据的更大反应空间上 , 应用贝叶斯优化 。
脂肪醇的普遍存在 , 使它们成为合成复杂分子的理想材料 。 因此 , 直接利用醇的杂原子取代反应 , 在药物化学中起着至关重要的作用 。 Mitsunobu反应尤其常用 , 因为有各种亲核试剂可以与脂肪醇发生立体定向偶联 。 然而 , 标准条件通常只能提供中等的收益率 。 因此 , 定义明确但可扩展的潜在试剂阵列 , 使Mitsunobu反应 , 成为贝叶斯优化的理想测试案例 。
研究者选择了3-溴-1H-吲哚-6-羧酸甲酯与苯甲醇偶联反应 , 反应空间由6个杂氮二羧酸、12个膦类化合物和5种溶剂组合而成(反应4;图5) 。 此外 , 研究者确定了基质浓度网格 , 杂氮二羧酸当量 , 磷类化合物当量和温度作为连续的工艺参数 , 给出了一个由18万个可能构型组成的反应空间 。
有了搜索空间 , 研究者下一步使用BMS最常用的反应条件进行控制:1.1当量DIAD,1.1当量PPh3,0.1MTHF和25°C 。 这些标准反应参数 , 给出了平均60%的产量 , 超过了两个重复实验(59%和60%) 。 随后 , 研究者使用DFT编码、高斯过程代理模型和预期改进 , 作为收集函数进行贝叶斯反应优化 , 每个批次并行进行10个实验 , 初始实验随机选择 。 值得注意的是 , 研究者发现优化器很快就超过了基准结果 , 识别出三组不同的反应条件 , 仅在10次实验的4轮中就产生了99%的预期产品(图5) 。 高产实验采用了非常规条件 , 包括P(Ph)2Me、高浓度和高温 。 因此 , 优化器识别了反应空间区域的定量条件 , 通常不会被搜索 。
有机化合物的氟化 , 由于其碳氟键的独特性质 , 在药物发现中起着重要作用 。 在此背景下 , 醇的脱氧氟化反应 , 是合成脂族氟化物最广泛使用的方法之一 。 在之前的一项研究中 , Doyle小组报道了试剂结构的调整 , 可以使用磺酰氟对许多复杂的醇类 , 进行有效的氟化 。 因此 , 该反应为贝叶斯优化 , 提供了一个理想的测试用例 。 研究者选择了1-(6-硝基苯[d][1,3]二氧酚-5-基)乙基-1-醇的氟化反应 , 其反应空间由10个磺酰氟化合物、10个有机碱、5种溶剂和一个连续参数(底物浓度、磺酰氟当量、碱当量和温度)网格定义 , 给出了一个包含312,500种可能构型的反应空间 。

Nature | 贝叶斯反应优化在化学合成中的应用
文章图片
图5.贝叶斯反应优化的应用
图片来源于Nature
接下来 , 研究者对通常用于商用试剂的PyFluor的反应条件进行了控制(1.1当量PyFluor,1.1当量DBU,0.5MTHF和20℃) 。 在这些标准条件下 , 在两个重复实验(35%和36%)的平均产量为36% 。 接下来 , 研究者使用DFT编码、高斯过程代理模型和预期改进 , 作为收集函数进行了贝叶斯反应优化 , 每个批次并行进行5个实验 , 初始实验随机选择 。 研究发现 , 在五次实验的三轮中 , 优化器超过了基准结果 , 最终确定了在十轮实验中产生69%的预期产物的反应条件(图5) 。 重要的是 , 在两个测试反应中 , 贝叶斯优化识别了一系列实验条件 , 其参数设置与标准条件有很大不同 。 此外 , 优化器提供了多种配置 , 这些配置在大多数维度上都有所不同 , 但提供了相同的良好结果 。