深度原理 | 作者
在化學的微觀世界里,過渡態(tài)(TS)就像化學反應中的 "能量高峰"—— 當分子們?yōu)榱税l(fā)生奇妙的化學變化而劇烈碰撞時,必須跨越這個轉瞬即逝的能量頂峰。然而,這個關鍵的中間狀態(tài)就像閃電一樣難以捕捉:實驗儀器的 "快門速度" 跟不上它的變化節(jié)奏,而傳統的量子化學計算方法又如同用慢鏡頭拍攝煙花,即使是最強大的超級計算機,解析一個過渡態(tài)的結構也可能需要連續(xù)工作數小時甚至數天。這種困境讓科學家們在探索復雜反應網絡指導化工生產、設計性能更優(yōu)的催化劑時舉步維艱。
圖一|二維勢能面上的反應物(R),過渡態(tài)(TS),產物(P),以及最小能量路徑(minimal energy pathway)
近日,深度原理 Deep Principle聯合佐治亞理工大學,康奈爾大學等機構聯合提出了一種革新性的過渡態(tài)檢索方法--React-OT,采用最優(yōu)傳輸(Optimal Transport, OT)的方法,從反應物和產物的結構插值開始,推導出高度精確的過渡態(tài)結構,相關成果已作為封面文章發(fā)表在Nature Machine Intelligence上,同時MIT News也對文章的第一兼通訊作者,深度原理 Deep Principle的創(chuàng)始人兼CTO段辰儒博士進行了專訪報道。
本文將帶你深入了解 React-OT 的核心原理、與傳統方法的對比,以及它如何突破計算化學的瓶頸,大幅提升 TS 搜索的效率與精度,為反應機理研究和催化劑設計提供全新工具。
一、方法創(chuàng)新
從 OA-ReactDiff 到 React-OT
OA-ReactDiff是深度原理 Deep Principle于2023年推出的首個生成3D化學反應的擴散生成模型,這項成果已在Nature大子刊Nature Computational Science上發(fā)表,并被選為封面論文。OA-ReactDiff僅依賴反應物和產物的3D幾何形狀即可生成過渡態(tài)結構,比傳統量化方法預測過渡態(tài)速度提升1000倍。但是由于擴散模型采樣過程中的隨機性,OA-ReactDiff生成的過渡態(tài)也是隨機的,往往需要多次采樣才能獲得理想的過渡態(tài)結構。
作為OA-ReactDiff的迭代升級版本,React-OT在OA-ReactDiff的基礎上,針對給定的反應物和生成物(雙端搜索)進行了改進,基于最優(yōu)傳輸理論,通過流匹配方法,從反應物和產物直接推導TS結構,單次采樣即可生成確定性的TS結構。
最優(yōu)傳輸(OT)
最優(yōu)傳輸是一種數學理論和計算方法,用于描述兩個概率分布之間的距離或者對應關系。它的核心概念是如何以最佳方式將一組資源(如質量、能量等)從一個位置傳輸到另一個位置。類比初中學習的線性規(guī)劃問題:三個城市(A, B, C)分別有1、0.5、1.5噸煤,另外有兩個城市(D, E)分別需要2、1噸煤,由于不同城市之間的運輸成本不同,城市需求也不同,需要制定策略給出最優(yōu)運輸路線,這些“最優(yōu)路線”在化學反應中就代表了最合理化學反應路徑以其對應的過渡態(tài)結構。
技術亮點速覽
1. 初始過渡態(tài)結構:OA-ReactDiff從高斯噪音中隨機采樣,所以生成的過渡態(tài)也存在隨機性。React-OT則是從反應物和產物的線性插值出發(fā),并且通過平移旋轉等操作確保初始結構的等變性和唯一性,獲得相對合理的初始猜測,將采樣路徑推向更接近最優(yōu)傳輸的方向。
2. 采樣過程:OA-ReactDiff采用擴散模型,過渡態(tài)生成是一個隨機采樣過程。而React-OT將采樣過程模擬為常微分方程,而不是擴散模型中的隨機微分方程,將反應物、產物和過渡態(tài)的聯合分布視為動態(tài)傳輸問題,通過流匹配(flow matching)方法,直接從反應物和產物推導TS結構,不再需要多次隨機采樣。
3. 更大數據集的預訓練:使用RGD1-xTB 數據集對React-OT進行預訓練,然后再在Transition 1x數據集上進行模型的微調,RGD1-xTB包含95萬個基于 GFN2-xTB 計算的化學反應,對比訓練OA-ReactDiff使用的Transition1x 數據集(1 萬個反應),RGD1-xTB的數據量大幅增加,可為 React-OT 提供更廣泛的化學環(huán)境和結構信息。
圖二 | 擴散模型和最佳傳輸模型生成TS結構的工作概述(左)OA-ReactDiff的隨機推理過程。(右)React-OT的確定性推理過程
二、結果一覽
擠爆牙膏的性能提升
在使用Transition 1x訓練React-OT之前,先在RGD1-xTB 數據集上對 React-OT進行了預訓練,預訓練后,React-OT在TS預測精度上實現了顯著提升:生成結構的 RMSD 中位數和勢壘高度誤差降低 25%以上,相比未預訓練模型精度提升顯著。除了精度的提升之外,搜索過渡態(tài)所需運行時間也顯著減少。OA-ReactDiff在單張GPU上需6秒完成過渡態(tài)搜索,而React-OT的采樣過程消除了隨機性,只要0.4秒就可以得到正確的TS結構。對比OA-ReactDiff,React-OT能適應更復雜的化學反應類型,對未見過反應的預測能力也要更好。
圖三 | React-OT和OA-ReactDiff模型在生成過渡態(tài)的精度和速度方面的性能對比 a. React-OT得到滿足特定RMSD要求的TS結構的可能性高于兩種擴散模型。b. OA-ReactDiff和React-OT生成過渡態(tài)的質量。c. 兩種模型預測效果的對比。d. 運行速度的比較。
在反應網絡中的應用
在經過 RGD1-xTB 預訓練后,React-OT顯著提升了對未見反應類型的適應性和預測能力,即使在12 個非氫原子的復雜反應體系中,仍能準確生成TS結構,具備應對多步有機反應的能力。為了探索React-OT在反應網絡探索中的實際應用,這篇文章選擇γ-酮過氧化氫(KHP)作為研究對象。KHP 是一個備受關注的反應體系,近年來被廣泛用于基準測試。
圖四| KHP的反應網絡 其中紅色/黑色的數字分別為DFT計算/React-OT生成的過渡態(tài)上計算得到的活化能
可以看到,React-OT生成的反應網絡與文獻記載的KHP反應節(jié)點完全一致,表明其能夠準確捕捉所有關鍵反應,且兩者的平均絕對能量差僅為 3.84 kcal/mol。這一案例研究展示了 React-OT 在加速反應網絡探索中的應用潛力。
三、應用展望
段辰儒表示,“人類眨眼的平均時間是0.4秒。在這個時間內React-OT就可以精準的找到一個化學反應的過渡態(tài),這在之前是不可想象的。極致的加速會產生行為模式的質變,React-OT將改變我們對化學反應的理解和探索新材料的方式。”
應用場景前瞻
· 催化劑設計:快速篩選高活性反應路徑,加速清潔能源催化劑開發(fā)。
· 藥物合成:精準預測有機反應能壘,優(yōu)化合成路線,降低實驗成本。
· 材料探索:構建超大型反應網絡,發(fā)現新型功能材料(如MOFs、鈣鈦礦)。
未來已來
React-OT標志著化學反應TS搜索進入高效、精準的新紀元,有望成為計算化學領域的重要工具。歡迎關注深度原理 Deep Principle團隊,探索更多前沿研究!
拓展閱讀:Bohrium Notebook
如果對生成式模型感興趣,想進一步了解React-OT,復制下方鏈接,打開 Notebook:
https://bohrium.dp.tech/notebooks/47742251216
也可以通過Bohrium App或者深度原理 Deep Principle(DeepPrinciple)官方使用鏈接直接試用模型生成你想要的過渡態(tài):
https://bohrium.dp.tech/apps/bohriumweb/job?type=app
深度原理 Deep Principle(DeepPrinciple)官方使用鏈接:
http://reactot-dev.deepprinciple.com
AI+Science 讀書會
AI+Science 是近年興起的將人工智能和科學相結合的一種趨勢。 一方面是 AI for Science,機器學習和其他 AI 技術可以用來解決科學研究中的問題,從預測天氣和蛋白質結構,到模擬星系碰撞、設計優(yōu)化核聚變反應堆,甚至像科學家一樣進行科學發(fā)現,被稱為科學發(fā)現的“第五范式”。 另一方面是 Science for AI,科學尤其是物理學中的規(guī)律和思想啟發(fā)機器學習理論,為人工智能的發(fā)展提供全新的視角和方法。
集智俱樂部聯合斯坦福大學計算機科學系博士后研究員吳泰霖(Jure Leskovec 教授指導)、哈佛量子計劃研究員扈鴻業(yè)、麻省理工學院物理系博士生劉子鳴(Max Tegmark 教授指導),共同發(fā)起以”為主題的讀書會,探討該領域的重要問題,共學共研相關文獻。 讀書會已完結,現在報名可加入社群并解鎖回放視頻權限。
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.