【名家案例】连续流工艺优化中的机器学习和人工智能
研究背景
近年来,对有机反应工艺的自主优化以及反应结果的大数据集的生成或使用都受到了重大关注。然而,对于反应优化仍然没有明确的“最佳方法”。
2021年,Astex制药公司和剑桥大学的合作研究,最大限度地将预先存在的数据和自我优化算法结合在一起,发表了多任务优化算法(多任务贝叶斯优化,MTBO)。MTBO被视为“小数据”反应优化的最佳算法模型,当时该模型仅使用计算机模拟示例进行了演示。
多任务贝叶斯优化MTBO
图1. 使用已有数据在流动反应器中进行自我优化
欧洲连续流大咖,格拉茨大学连续流合成中心(CC FLOW)和制药研究中心工程股份有限公司(RCPE)的C.Oliver Kappe教授,用于真正的合成化学优化问题,首次在实验室中验证了该方法。如(图1)。
使用连续流反应器来演示MTBO算法
流动化学反应器通常用于一些危险化学反应的高传质、传热和批量稳定生产的需求,但它也能为科学研究提供平台。与传统方法相比,流动反应器较少的反应物料、快速筛选反应条件有其独特的优势。
流动反应平台,可以对每个单独的实验条件进行设置,并且可实现自动化。使用液体处理器制备反应混合物也能够在优化分类变量(例如,溶剂和配体)得到充分的研究。这是标准优化方法非常难以处理的考量因素。
利用公开数据集进行计算机模拟与连续流实验优化演示
设想一下,在没有进行任何先行实验,只需按下一个按钮就能得到最佳的反应条件,还有什么工具比这更好的呢?
事实上,如果能使用现有的数据,例如开放Zenodo(由欧洲核子研究中心运作)反应数据库和存储库,计算机模拟就能实现这个目标。
本文作者首先利用公开的Suzuki偶合和Buchwald-Hartwig数据集,进行了计算机模拟演示,然后进行实验优化演示。
在计算机模拟的优化中,一个关键的发现是当存在多种不同的底物时就会生产更大的辅助数据集,MTBO算法似乎在更大的辅助数据集中运行得更好。这在Suzuki偶合案例中得到了很好的运用,当所有四个可用的数据集都用于辅助任务时,它提供了最佳的性能。
一般来说,人们会假设可用的数据越多,优化的效率就越高。因此,这自然而然地反映了一个科学家,尤其是工业界科学家多年来一直在努力解决的问题:我们如何有效地记录和利用过去实验的结果?阿斯利康、圣母大学和麻省理工学院的科学家最近发表的一篇论文也讨论了这个问题,特别是关于电子实验室笔记本(ELN),并确保包括负面数据也得到有效的使用。这将为未来的机器学习和人工智能提供有力的支持。
图2. 数据量的增加每个底物的优化时间相应减少
实验室演示的C-H活化反应在含有较高比例极性官能团的小片段上进行,这是常用的合成方法,意义重大。对于药物发现中的目标分子很适用。
尽管对不同反应性的底物来说,数据收集并不容易,但每个底物的辅助数据集的增长使优化速率提升。访问常用已公开的反应类型的实时数据集,可以减少对特定底物对实验的依赖,快速得到最佳工艺条件,为研究组带来巨大优势。
MTBO算法与连续流反应结合未来应用潜力
MTBO现已可供他人使用,但还在不断改进之中,不久我们将看到它巨大的潜力。改进包括,但不限于:
使用液滴流反应器等改进,以减少催化剂和原材料的消耗;
变量范畴的表示,目前是通过简单地分配“1”和“0”对应于每个分类变量(称为一个热变量编码、OHE)。其他选项,如主成分分析(PCA),可能有助于包括有关这些分类变量属性的信息;
反应物的描述符也可以用来优先考虑在辅助任务数据集中最相似反应伙伴的数据。
随着反应优化从经典方法演变,有机化学家将继续看到新的有效选项被添加到他们的优化工具箱中,使得该工具更加被广泛使用。
总结
随着自优化的连续流反应器频繁使用,利用先前的知识和数据(例如以前的试验记录结果),结合机器学习和人工智能来加快反应过程的优化,这已成为一个重要的研究方向。
自优化流动反应器的高效率可以通过利用预先存在的多任务贝叶斯优化方法中的反应数据。
本文就是选取了Suzuki偶合和Buchwald-Hartwig实验数据来进行计算机模拟演示,这些结果可以指导像MTBO(多任务贝叶斯优化)这样的算法进行有效的实验优化演示。
什么是多任务贝叶斯优化?
多任务贝叶斯优化是一种优化算法,主要应用于机器学习和人工智能领域。它是一种基于贝叶斯统计的优化方法,通过同时考虑多个目标或任务,来找到最优解。这种方法能够有效地处理多目标优化问题,特别是在目标之间存在一定的相关性时,可以大大提高优化的效率和准确性。
参考文献:ACS Cent. Sci. 2023, 9, 864?866
欢迎关注康宁AFR公众号
发现“分享”和“赞”了吗,戳我看看吧
全部评论(0条)
推荐阅读
-
- 【名家案例】连续流工艺优化中的机器学习和人工智能
- 研究背景近年来,对有机反应工艺的自主优化以及反应结果的大数据集的生成或使用都受到了重大关注。然而,对于反应优
-
- 机器学习与连续流连载系列丨机器学习:人工智能的驱动力
- 机器学习(Machine Learning, ML)作为人工智能(Artificial Intelligence, AI)的一个分支,正在逐渐改变我们与技术的互动方式。本文将探讨机器学习的核心概念、工作流程、类型、优势与局限。
-
- 【名家案例】连续流、釜式工艺,谁更胜一筹?
- 研究背景异噁唑是一类在药物化学中至关重要的五元杂环化合物,被广泛应用于众多上市药物中。虽然异噁唑的单取代或双
-
- 在显微成像和图像分析中运用人工智能和机器学习技术
- 徕卡显微成像新技术——欢迎进入多色同时成像新纪元
-
- 【名家案例】连续流技术合成高纯度手性药物
- 从CBD高产量制备Δ9-THC和Δ8-THC的连续流合成方案,利用连续流技术精确控制对产品选择性有关键影响的反应参数,该方法大大提高了反应性能,具备大规模的生产潜力。
-
- 机器学习与连续流连载系列丨使用康宁反应器集成在线光谱,通过半监督机器学习识别化学反应式计量和动力学模型
- 教育领域设备更新产品推荐:康宁连续流教学平台康宁星云?化学版设备预算:30万以内康宁星云化学版,可用于连续流
-
- 【默克案例】制药工业中连续流化学的展望和案例
- 连续制造是一种创新的科技平台,现在制药行业正在蓬勃发展。相比较传统间歇式生产,连续制造具有更高效、更安全、更环保、产品质量更好、占地面积更小等优点。
-
- 【名家案例】连续流制备BDMS在线合成氮杂环丙烷
- 溴化二甲基溴代硫(下称BDMS)由于其既能够作为氧化剂,同时又能提供溴离子,在有机合成中作为一种多功能试剂有着广泛的应用。BDMS在包括溴化、迈克尔加成、贝克曼重排等多种类型的反应中都有着出色的表现。
-
- 【名家案例】来观摩GABA合成中双氧水的在线使用
- 欧洲连续流名家C.Oliver Kappe教授团队,通过固载手性催化剂的方法,以及双氧水和甲酸在线生成过氧甲酸,再原位氧化的实验方案,开发两步叠缩的连续流工艺来制备光学活性的γ-硝基丁酸 - GABA
-
- “机器学习技术在高能物理中的应用研讨会”近日在京召开
- 9月18日至19日,高能所通过线上线下相结合的方式召开了“机器学习技术在高能物理中的应用研讨会”。
-
- 地质环境监测院举办“机器学习在水文地质调查中的应用”培训
- 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。
-
- 9月20-22日-上海-2024连续流技术及工艺开发案例与首次工艺论证培训班
- 9月20-22日-上海-2024连续流技术及工艺开发案例与首次工艺论证培训班
-
- 【新案例】康宁助力3,4-二甲基苯肼盐酸盐连续流工艺技术革新
- 康宁连续流反应器助力3,4-二甲基苯肼盐酸盐技术革新,连续流合成工艺可有效解决传统半间歇工艺中重氮化反应对温度的高敏感性,避免了反应温度控制困难、高潜在热失控风险带来的安全隐患,相对于传统间隙釜工艺总收率提升近20%。
①本文由仪器网入驻的作者或注册的会员撰写并发布,观点仅代表作者本人,不代表仪器网立场。若内容侵犯到您的合法权益,请及时告诉,我们立即通知作者,并马上删除。
②凡本网注明"来源:仪器网"的所有作品,版权均属于仪器网,转载时须经本网同意,并请注明仪器网(www.yiqi.com)。
③本网转载并注明来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
④若本站内容侵犯到您的合法权益,请及时告诉,我们马上修改或删除。邮箱:hezou_yiqi
最新话题
最新资讯
- 美天旎Miltenyi自动化细胞分选磁力架进口平替碳环智造自动细胞分离仪
- 核酸提取环节浓缩DNA/RNA用哪种真空离心浓缩仪好?
- 自动化细胞分选磁力架销冠碳环智造MX1-A自动细胞分离仪细胞分选器
- 适配美天旎miltenyiMS柱细胞分选磁力架哪个好
- 适配美天旎miltenyiLS柱LD柱全血柱细胞分选磁力架哪个好
- 有柱细胞分选和无柱细胞分选用哪种细胞分选磁力架好?
- 原生质体或者做菌液侵染的时候会用到哪种真空离心浓缩仪?
- permagen磁力架进口平替碳环智造96孔磁力架自动化仪器磁力架
- permagen磁力架进口平替碳环智造96孔磁力架自动化仪器磁力架
- Agilent 34970A 数据采集器 供应
作者榜
参与评论
登录后参与评论