作者 |AutoMat團隊
投稿單位 | 清華大學
編輯丨ScienceAI
在材料科學的微觀世界里,電子顯微鏡已能把原子「拍」得一清二楚;然而「看見」并不等于「理解」。要把這些亞埃級圖像轉成計算可用的晶體結構,研究者仍需逐像素判讀、手工搭建模型、比對參考模板。這個流程動輒耗費數小時到數天,且極易被噪聲與元素重疊誤導。這一解析瓶頸使得高分辨成像與理論模擬之間始終存在一道「真空帶」。
最新工作 AutoMat 則試圖用 AI 來填平這條鴻溝。AutoMat 團隊構建了一個「電鏡智能代理」:它接收原始 STEM 圖像,先用模式自適應去噪網絡澄清信號,再通過物理約束檢索模板、對稱感知重建原子坐標,最終輸出標準?CIF 并借助機器學習勢能模型給出形成能等關鍵物性。整個鏈條僅需數分鐘,就能完成過去依賴人工的「顯微成像 → 結構重建 → 性質預測」。
為了量化成效,作者們搭建了二維材料基準 STEM2Mat-Bench(超 450?種材料)——單層結構可最大限度減少多重散射與投影歧義,便于評測算法極限。
結果顯示,AutoMat在結構誤差與能量預測上均大幅優于現有多模態大模型及專用工具AtomAI;在最難的低劑量三元素場景下仍能穩定輸出可用結構。由此,實驗觀測首次與計算模擬形成高通量閉環,為「AI-驅動的材料發現」打開了真正的高速通道。
STEM2Mat-Bench:構造專為顯微→模擬打造的基準
- 超過 450 種高置信二維材料 | 覆蓋 67 種元素
- 統一三元組:圖像 – 結構 – DFT 能量
- 難度梯度↗(Tier?1?→?3):從單元素高劑量到三元素低劑量
- 讓模型在「圖像→結構→性質」全鏈路上一站式考核。
借助 STEM2Mat-Bench,AutoMat首次展示了在全難度段穩定重建與精準預測的能力,也為后續算法提供了統一、公正的比拼賽道。
AutoMat四步閉環——橋接顯微鏡與計算模擬的智能?Agent
性能評估:AutoMat壓倒性超越現有技術
為評估?AutoMat,團隊設置三條基準線:
一是多模態視覺?語言模型(GPT?4.1?mini、Qwen?2.5?VL?32B、LLama?4V?17B、ChemVLM?8B),輸入固定提示與 ?STEM? 圖像直接推斷材料性質,用于衡量「圖像→性質」推理水平;
二是 AtomAI,僅通過分割網絡定位原子中心并結合分辨率擬合晶格,專門考察結構重建精度;
三是「LabelCIF?+?MatterSim?MLIP」,即將真實 CIF 喂入機器學習勢能模型,給出形成能誤差的理論最優上限。
AutoMat 在形成能預測上的平均絕對誤差(MAE)為 332 ± 12 meV/atom(分層級為 344、320 和 333 meV),雖仍高于理論最佳值(48 meV),但遠低于視覺-語言模型普遍數 eV 級別的誤差,且后者誤差隨任務難度顯著增加,驗證了基準設計的合理性。進一步提升結構重建精度后,AutoMat 有望逼近理論誤差范圍,充分滿足下游性質預測需求。
對于結構重建,AutoMat 實現了大約 0.11 A 的平均投影 RMSDxy,比 AtomAI(43-44 A)低兩個數量級,大多數偏差可通過最終松弛校正。
成分正確性方面,AutoMat 在各層級上平均達到 83%(具體為 88.9%、85.9%、73.1%),而 AtomAI 僅在簡單的Tier 1情況下達到不到 2.7%。
結構成功率方面,考慮空間和成分一致性,AutoMat 總體達到 83.2%(各層級為 85.0%、84.0%、73.1%),而 AtomAI 幾乎不能產生有效結構。
總結來說,AutoMat 不僅優于所有現有基線,而且在具有挑戰性的 Tier 3 場景中保持高性能,這些場景涉及多元素組成和低成像劑量,展示了其在整個基準范圍內的穩健性和泛化能力。
挑戰和未來路線
瓶頸?① | 模板檢索失靈(39.3?%)
檢索未命中正確晶體,導致原子排布與元素完全錯位,形成能誤差最高飆至? 3130meV?/?atom(典型案例:U-F-O 結構被錯配為 P-系模板)。
瓶頸?② | 下游重建崩潰(60.7?%)
模板雖正確,但 2D 投影重疊或 C/O 等近似元素對比度過低,觸發原子混淆、結構松弛失真,CIF 直接輸出失敗。
下一步優化
- 不確定性檢索 + 多候選融合:先擴寬匹配范圍,再用置信度篩選,提高模板命中率。
- 3D-aware & 多模態融合:補足 z 軸深度信息,強化復雜體系的結構保真度與性質預測準確性。
邁向“智能實驗室”愿景
1.實驗-模擬-AI 全閉環
- AutoMat 負責 表征?→?結構?→?物性 的實時推斷;
- 機器人合成平臺自動制備候選材料;
- 在線表征(XRD、EELS、原位光譜)即時回流數據;
- LLM/貝葉斯優化代理決策下一輪實驗,實現「自驅迭代」。
2.擴展能力版圖
- 3D 體相 & 缺陷/界面:深度學習重建算法 + 斷層電鏡(ET)數據,解決真實晶體塊材與界面問題
- 多模態數據融匯:將譜學、成像、熱分析等多源信息拼成「材料全息圖」,提高預測精度;
- 高通量并行:結合固定床 / 微反應器陣列,日級別篩選上百組合物,實現催化與能源材料的快速迭代。
3.數據標準 & 開放平臺
- 建立統一「圖像-結構-性質」數據協議,兼容 AutoMat 與機器人實驗記錄;
- 開放 API 與 Benchmark,促成跨實驗室協同與模型可重復驗證。
未來圖景:顯微鏡不再只是觀測工具,而是閉環反饋設計方案和材料的重要一環;AutoMat 則成為連接表征、合成與計算的「中央神經」,驅動材料研發像自動駕駛一樣自我學習、持續優化。
代碼:https://github.com/yyt-2378/AutoMat
數據集:https://huggingface.co/datasets/yaotianvector/STEM2Mat
論文:https://arxiv.org/abs/2505.12650
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.