編輯丨coisini、&
最近幾年,生成式 AI 模型的進展日新月異。在思考 AI 未來的發展方向時,圖靈獎得主、Meta 首席人工智能科學家 Yann LeCun 提出「高級機器智能(AMI)」這一概念,指出 AI 不應該局限于數據處理與模式識別,還應具備規劃、推理和理解世界的能力。基于 AMI,科技巨頭 Meta 近來開展了多項推動基礎科學發展的 AI 研究工作。
今天,Meta 發布了多個面向基礎科研的人工智能研究成果,包括具有變革意義的模型、基準測試和數據集,致力于徹底改變分子屬性預測、語言處理和神經科學的研究范式。
具體來說,Meta 發布了推動分子發現的開源數據集 Open Molecules 2025(OMol25)、原子通用模型 UMA,以及適用于機器學習項目的擴散過程學習技術突破。此外,Meta 還發布了與羅斯柴爾德基金會醫院聯合開展的人類語言學習機制解碼研究。
OMol25 與 UMA
在應對新型分子研發、儲能材料探索以及氣候變化緩解等重大技術挑戰時,科學家和工程師必須進行原子尺度的精密設計。傳統的實驗發現與設計流程耗時漫長,從概念構想到規模化生產往往需要數十年時間。
Meta FAIR 團隊正通過開發高精度、可泛化的機器學習模型來加速這一進程。這些模型能預測原子尺度的運動與行為,從根本上縮短分子與材料發現的研發周期,為創新突破開辟全新可能。
Meta 今天發布的新型密度泛函理論(DFT)數據集 Open Molecules 2025(OMol25),將 Meta 開放科學模擬數據集系列(包含 Open Catalyst 2020-2022、Open DAC 2023 和 Open Materials 2024)拓展至分子化學領域。DFT 等基礎量子化學方法可用于原子級別的分子與材料特性預測,尤其在化學鍵斷裂與形成的復雜場景中具有獨特價值。
作為目前生物分子、金屬配合物和電解質領域規模最大、多樣性最豐富的高精度量子化學計算數據集,OMol25 為醫療健康和儲能技術的原子級設計提供了前所未有的精確度。
OMol25 數據集采用高性能量子化學程序包 ORCA 構建,突破了傳統技術對大型原子系統模擬的限制。既往分子數據集僅包含 20-30 個原子及有限元素,而 OMol25 實現了數量級突破 —— 其模擬構型規模擴大 10 倍,并能呈現多種元素間的復雜相互作用。
Meta 同時開源了原子通用模型(Universal Model for Atoms,UMA),該機器學習原子間勢能模型為跨材料與分子體系的原子相互作用建模樹立了新標準。UMA 基于 Meta 過去五年發布的所有數據集進行訓練,涵蓋分子與材料領域超 300 億原子樣本。UMA 不僅能提供更精確的分子行為預測與機理闡釋,還可作為多功能基礎模型支持下游場景的微調與應用開發。
伴隨采樣
生成模型往往通過分析數據特征來生成模擬樣本,但在專業領域中,訓練數據可能極度稀缺甚至不存在。此時僅能依賴標量獎勵信號來驗證生成質量,例如物理化學基礎模型的采樣優化。
FAIR 團隊因此提出了「伴隨采樣」技術,開創性地實現了無需原始數據、僅憑獎勵信號的可擴展生成建模。「伴隨采樣」技術不依賴現有數據模式,而是根據獎勵模型迭代優化自身樣本。基于嚴謹的理論框架,伴隨采樣不僅形成了可擴展的實用算法,更為獎勵驅動型生成建模研究奠定了新基礎。
「伴隨采樣」技術在基于 UMA 等大規模能量模型的分子生成任務中表現出色,能夠高效產生多樣化分子結構。為了推動計算化學領域取得更多突破性進展,Meta 開源了算法代碼并發布了全新大規模基準測試。
揭秘人類大腦語言發育機制
為了探究人類大腦的語言學習機制,Meta FAIR 團隊與羅斯柴爾德基金會醫院聯合開展了首個大規模神經記錄研究,通過系統化測繪大腦發育過程中的語言表征形成規律,揭示了其與大規模語言模型(LLM)驚人的相似性。
研究人員通過 40 余名癲癇患者治療期間植入的皮層記錄設備,采集了 7000 多個電極在受試者聆聽有聲書時的神經信號。這項工作首次系統揭示了語言神經表征從兒童期開始的演化軌跡。
這項研究標志著 AI 與腦科學關系的范式轉變:受大腦啟發的 AI 模型,正成為揭示大腦運作機制的新工具。
從推動分子發現的開源數據集、原子通用模型,到人類語言學習機制解碼研究,這些進展標志著 Meta 在 AMI 道路上又邁出了一步。Meta 表示期望這些進展能加速分子屬性預測、語言處理和神經科學等領域的進步,促進跨學科合作,推動創新突破。
相關報道:https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/
OMol25 研究論文:https://arxiv.org/pdf/2505.08762
UMA 研究論文:https://ai.meta.com/research/publications/uma-a-family-of-universal-models-for-atoms/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.