導語
今日,Nature發文報道了 DeepMind 最新推出的通用科學人工智能體 AlphaEvolve。 AlphaEvolve 是在他們2013年提出的 FunSearch 系統基礎上發展而來。它不僅能在人類尚未解決的數學問題上超越人類,并且能夠處理更大規模的代碼,并在更多復雜算法和廣泛的科學領域具有普適性。AlphaEvolve 還幫助團隊改進了下一代張量處理單元,找到了更高效利用 Google 全球計算資源的方法。部分研究者表示有被 AlphaEvolve 的表現驚艷到,另有一部分學者則期待體驗開源版本來評估它的實際效用。
上海科學智能研究院、集智科學研究中心和阿里云聯合發布了《》,梳理出35個研究前沿,其中包括,專題對智能體在科學與計算領域的發展進行了回顧與展望,歡迎你來閱讀。
研究領域:AI,大語言模型
Elizabeth Gibney | 作者
彭晨
| 譯者
Nature news| 來源
圖 1. 白皮書封面
AlphaEvolve:用于科學與算法發現的通用AI智能體 https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf。
Google DeepMind 利用聊天機器人模型提出了解決數學和計算機科學重大難題的方案。這一名為 AlphaEvolve 的系統,將大語言模型(LLM)的創造力,與能夠評估模型輸出、篩選并優化解法的算法相結合。該系統在公司于 5 月 14 日發布的一份白皮書中進行了闡述。
“這篇論文相當驚艷,”德國埃朗根馬克斯·普朗克光學科學研究所人工科學家實驗室負責人 Mario Krenn 說,“我認為 AlphaEvolve 是基于通用型 LLM 實現新發現的首個成功示例。”倫敦 DeepMind 科學負責人 Pushmeet Kohli 表示,除了用該系統發現開放數學問題的解法外,DeepMind 已將這一人工智能技術應用于自身的實踐挑戰。
AlphaEvolve 幫助改進了公司下一代張量處理單元(TPU——專為 AI 研發的計算芯片)的設計,并找到了更高效利用 Google 全球計算資源的方法,節省了 0.7% 的整體資源。“它產生了顯著影響,”Kohli 說道。
圖 2. DeepMind公司稱,AlphaEvolve幫助改進了人工智能芯片的設計,但尚未對公司外部的研究人員開放。圖片來源:Christian Ohde/IMAGO via Alamy
通用目標的AI
迄今為止,AI 在科學領域的大多數成功應用,包括蛋白質設計工具 AlphaFold,都采用了為特定任務專門手工打造的學習算法,Krenn 說道。但 AlphaEvolve 是通用型的,它利用大語言模型(LLM)生成代碼的能力,在廣泛的領域中解決問題。
DeepMind 將 AlphaEvolve 稱為“智能體(agent)”,因為它涉及多個 AI 模型之間的交互。但它所針對的科學流程環節,與許多其他“智能體式”AI 科學系統不同,后者多用于文獻綜述和假說生成。
AlphaEvolve 構建于 DeepMind 自家的 Gemini 系列 LLM 之上。每項任務都由用戶輸入問題、評估標準和初步解法,LLM 隨后提出數百乃至數千種修改方案。然后,“評估器”算法根據優良解法的度量標準(例如,在分配 Google 計算任務時希望盡量減少資源浪費)對這些方案進行打分。DeepMind 的 AI 科學家、該研究的聯合負責人 Matej Balog 表示,LLM 會基于最優方案繼續提出新思路,隨著時間推移,系統就演化出一組更強大的算法。“我們探索了一系列多樣化的問題解決可能方案。”他如此描述。
圖 3. AlphaEvolve 發現流程。用戶提供初始程序(并在其中標記待迭代的部分)、評估代碼和可選配置。AlphaEvolve 隨即啟動進化循環。Prompt 采樣器從程序數據庫中抽取程序,構建豐富的提示。基于這些提示,LLM 生成代碼修改,并應用于創建新程序。然后,評估器對這些新程序進行打分,并將表現優異的解法重新注冊回程序數據庫,從而推動程序的迭代優化,發現更佳的解決方案。
Balog 指出,AlphaEvolve 是在公司 2023 年推出的 FunSearch 系統基礎上發展而來;后者曾用類似的進化方法在人類尚未解決的數學問題上超越人類。與 FunSearch 相比,AlphaEvolve 能處理更大規模的代碼,并在更多復雜算法和廣泛的科學領域中發揮作用。
DeepMind 表示,AlphaEvolve 還提出了一種矩陣乘法的計算方法,在某些情況下比 1969 年德國數學家 Volker Strassen 提出的最快算法更快。矩陣乘法是將數字按網格相乘,廣泛用于神經網絡訓練。盡管 AlphaEvolve 是通用性的,它在矩陣運算方面的表現仍優于 2022 年 DeepMind 專為矩陣運算設計的 AI 工具 AlphaTensor。這一方法可用于解決各類優化問題,或任何在科學中存在“具體度量”或“仿真評估”以判斷解法優劣的場景。這還可能包括新型顯微鏡、望遠鏡甚至材料的設計.
圖 4. 使用 AlphaEvolve 發現的打破最先進水平(SOTA)的數學構造示例。AlphaEvolve 的多功能性能夠解決:分析學中的自相關與不確定性不等式問題;幾何學中的填充與最小/最大距離問題;組合數學中的 Erd?s 最小重疊問題以及有限集的和與差問題。
應用:待向廣泛群體開放
牛津大學數學家兼 AI 研究員 Simon Frieder 表示,在數學領域,AlphaEvolve 似乎能顯著加速某些問題的解決。但他認為,它大概只會應用到那些可以“通過代碼來表述”的有限任務上。其他研究者則對該工具的真正效用持保留態度,認為要等到它在 DeepMind 以外的環境中經受考驗后才能下定論。“在系統被更廣泛的社區測試之前,我會保持懷疑,并對報道的結果持保留態度,”美國俄亥俄州立大學的 AI 研究員 Huan Sun 這樣說。Frieder 也表示,他會等到研究者們重現出一個開源版本,而不依賴可能隨時變動或下線的 DeepMind 專有系統。
DeepMind 科學主管 Pushmeet Kohli 說,盡管 AlphaEvolve 的運行算力需求低于 AlphaTensor,但它仍然過于耗費資源,不適合免費托管在 DeepMind 的服務器上。不過,DeepMind 希望通過發布這套系統,激勵研究者們提出更多可將 AlphaEvolve 應用于各種科學領域的想法。“我們非常希望讓科學界盡可能多的人都能使用到它,”Kohli 說道。
參考文獻
1. Romera-Paredes, B. et al.Nature625, 468–475 (2024).
2. Strassen, V. Numer. Math.13, 354–356 (1969).
3. Fawzi, A. et al.Nature610, 47–53 (2022).
關于集智俱樂部
集智俱樂部成立于 2003 年,是一個從事學術研究、享受科學樂趣的探索者的團體,也是國內最早的研究人工智能、復雜系統的科學社區。它倡導以平等開放的態度、科學實證的精神,進行跨學科的研究與交流,力圖搭建一個中國的 “ 沒有圍墻的研究所 ”。集智科學研究中心(民辦非營利企業)是集智俱樂部的運營主體,長期運營社區生態,催化理論創新。使命:營造跨學科探索小生境,催化復雜性科學新理論。
大語言模型與多智能體系統讀書會
集智俱樂部聯合西湖大學工學院特聘研究員趙世鈺、浙江大學教授任沁源、鵬城實驗室高級工程師崔金強,共同發起,探究大語言模型給機器人領域帶來的新思想新價值。讀書會已完結,現在報名可加入社群并解鎖回放視頻權限。
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.