聚合物為人類社會生活發展提供了不可或缺的物質基礎。在研發聚合物材料的過程中,龐大的結構空間、復雜的聚合機制為建立聚合物材料的構效關系帶來重大挑戰。
機器學習有望突破高分子合成研究的傳統范式,推進新型聚合物材料的化學創制,近年來成為了高分子化學家關注的前沿領域。機器學習技術實現了反應條件、化學結構、材料性能之間潛在關聯的發掘,提高了對聚合反應空間的研究效率,為反應條件優化、鏈結構設計提供了系統性指導。數據驅動的生物大分子結構解析是多領域關注的焦點,機器學習助力實現了蛋白質結構預測的跨越式進步,邁入了生物大分子研究的新階段。在此基礎上,結合自動化技術,發展數智化合成,進一步降低試錯成本,加速聚合物材料研發,推動理論知識發展。
本文對機器學習在(1)預測聚合物性能、(2)設計聚合物結構與合成條件、(3)生物大分子研究中取得的重要進展進行簡要介紹與討論。
l 在正向預測中,機器學習通過發掘聚合物結構-性能關系,實現了分析、預測聚合物性能(如光學、介電、力學等);
l 在逆向設計中,遺傳算法、貝葉斯優化等黑盒優化算法通過探索化學結構空間、反應條件空間,高效推薦聚合物結構、反應參數,加速了新型材料研發;
l 在生物大分子研究中,機器學習與定向進化方法相結合,實現了蛋白質結構預測的跨越式進步,有望開啟生物大分子研究的新階段。
機器學習輔助的高分子合成研究還處于發展初期,面臨諸多挑戰,如下列三個方面:
首先,開發計算機可讀的表達方法是機器學習應用于高分子合成的前提,對于結構精確的生物大分子,蛋白質、核酸的三維原子坐標信息被存儲于開放訪問的PDB等數據庫,為機器學習建模奠定了堅實基礎。但是表示合成聚合物的鏈結構仍是尚未突破的主要瓶頸,阻礙了正向預測、逆向設計策略中模型的建立。(1) 聚合物存在鏈結構、凝聚態結構差異,難以采用小分子編碼方式表達聚合物結構信息。以聚乙烯(均聚物)為例,即使對于重復單元相同的聚合物,不同鏈結構可導致分子量、分子量分布、拓撲結構等差異,凝聚態結構可存在晶態、非晶態等區別。對二元、三元等多元共聚物而言,隨著共聚單體種類、排列情況的不斷變化,再加上官能團、分子鏈之間的相互作用,鏈結構與凝聚態結構的復雜程度會急劇上升。上述均聚物與共聚物的豐富結構變化會對材料性質帶來影響,造成光學性能、力學性能、電學性能、界面性能、加工性能、生物相容性等差異。現有高分子結構表達方法通常只考慮重復單元結構,難以準確表達合成聚合物中的分子量分布、序列結構、拓撲結構等統計學結果;對描述分子鏈之間排列、堆砌的凝聚態結構而言,則更加挑戰。(2) 現有的表達方法要求研究者具備一定的編程基礎,為了讓更多合成化學家將機器學習融入科學研究,需降低計算機專業門檻,發展用戶友好的操作方法,讓機器學習成為便捷工具。
其次,數據稀缺導致難以建立高質量的機器學習預測模型,無法充分發揮人工智能優勢。(1) 現有聚合物的合成參數、性能數據是設計發展新材料的重要資源,而合成聚合物數據庫未完全開放權限(如PoLyInfo、Polymer Genome),為正向預測、逆向設計中初始數據集的獲取帶來不便;(2) 對新聚合反應與新聚合物結構而言,缺乏數據支持是機器學習技術面臨的常見問題。對此,可從三方面進行考慮:(a) 發展更強大、更逼真的計算模擬工具,為機器學習提供海量數據,采用抽樣實驗方法驗證模擬數據的可靠性,開展模型糾偏;(b) 將專業高分子知識更好地融入機器學習模型,利用高分子領域積累的經驗規律減少模型訓練時所需數據量;(c) 建立相關聚合物體系的機器學習模型,采用深度學習技術(如遷移學習、元學習)直接遷移或微調模型,推動實現對小數據集體系的高效正向預測。
最后,機器學習落地合成生產,需要結合自動化技術將人工智能集成到實驗流程中,但面臨自動化儀器功能單一、反應類型兼容性低、初始投資與維護成本較高等難題,迫切要求開展跨學科協作,優化自動化合成、純化、加工、表征等環節,便于實驗室靈活搭建自動化合成平臺,快速生成量大、質高的標準化數據。在此基礎上,發展機器學習決策方法,根據表征結果自動發出與反應條件、純化條件、加工條件相關的新指令,重新執行聚合實驗。不斷迭代上述過程,形成算法驅動的閉環研發系統,建立免除繁瑣人力操作的合成平臺,邁入人工智能助力高分子合成階段。
圖文導讀
圖1 預測聚合物構效關系示意圖:(a) 基于圖的表示,(b) 基于分層制作的分子指紋,(c) 基于Transformer模型
圖2 基于高通量計算方法逆向設計聚合物結構的流程示意圖
圖3 機器學習輔助的(a)聚合物逆合成分析平臺以及(b)自動化高通量合成平臺
圖4 人工智能輔助閉環體外蛋白質定向進化的示意圖
張澤熙,蔡展翔,張文彬*,呂華*,陳茂*. 機器學習輔助高分子合成研究進展. 科學通報, 2025, 70(4-5): 471–480
https://doi.org/10.1360/TB-2024-0800
轉載、投稿請留言
| 關注科學通報 | 了解科學前沿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.