【編者按】繼 AlphaGo、AlphaFold 之后,谷歌 DeepMind 帶來的全新 AI 編程智能體 AlphaEvolve 橫空出世,它巧妙地結合了大型語言模型(LLM)的創造力與自動化評估機制,不僅在矩陣乘法等經典數學問題上取得新突破,更在谷歌數據中心優化、芯片設計乃至 AI 自身訓練等實際應用中展現出驚人實力,為我們揭示了 AI 驅動算法發現的廣闊前景。
整理 | 夢依丹
出品丨AI 科技大本營(ID:rgznai100)
5 月 14 日,Google DeepMind 正式官宣推出 AlphaEvolve——一款由 Gemini 強力驅動、專注于算法發現的編碼智能體。 這款全新的 AI 智能體,堪稱算法設計領域的一位“進化大師”。
不僅是直接寫代碼,而是進化出的「解決方案」
與傳統的代碼生成工具不同,AlphaEvolve 并不追求“直接產出答案”,而是像演化生物一樣迭代出越來越優秀的解決策略。它的背后是 Google DeepMind 最新的大語言模型家族 Gemini——其中 Gemini 2.0 Flash 負責高效率生成大量思路,Gemini 2.0 Pro 則在關鍵節點提供更深層的方案優化。
其核心能力有:
能夠設計出更快的矩陣乘法算法;
能夠為懸而未決的開放性數學問題找到全新的解決方案;
更能夠顯著提升谷歌數據中心、芯片設計乃至AI自身訓練的整體效率。
那么,AlphaEvolve 是如何實現這些強大功能的呢?其背后精妙的系統設計主要包含三大支柱:
大型語言模型 (LLMs)核心趨動: AlphaEvolve 巧妙利用了Gemini 等先進大語言模型。這些 LLM 負責深度理解問題、綜合分析過往的嘗試與解決方案,并在此基礎上創造性地提出新版本的算法代碼。
自動化評估 (Automated Evaluation): 對于那些進展可以被清晰、系統化衡量的問題(尤其在數學和計算機科學領域),AlphaEvolve 配備了自動化評估系統。它能夠對 LLM 生成的每個算法方案進行客觀、量化的打分,精準評估其準確性與效率。
進化機制 (Evolution): 這也是 AlphaEvolve 的“靈魂”所在。它并非止步于單個好方案,而是采用進化策略,不斷迭代改進當前表現最佳的算法。更關鍵的是,它還會從不同的優秀方案中汲取靈感、重組“基因”(即核心思路),從而“進化”出更為強大、甚至出人意料的更優算法。
這種“LLM 創造 + 自動化評估 + 進化迭代”的協同工作模式,使得 AlphaEvolve 能夠從最初的設想,一步步進化出高度優化的復雜算法。與前代工具 FunSearch 主要生成簡短代碼片段不同,AlphaEvolve 能夠進化出包含數百行代碼的完整程序,從而應對更復雜、更廣泛的挑戰。
谷歌 DeepMind 副總裁、領導其 AI 賦能科學團隊的 Pushmeet Kohli 將AlphaEvolve 形容為一個“超級編碼智能體”。英國華威大學的數學家 Jakob Moosbauer 表示:AlphaEvolve 的強大之處在于它并非直接去尋找問題的答案,而是去搜索那些能產生特定解決方案的“算法”本身,這使得它威力倍增。“這種方法讓它能廣泛適用于各種各樣的問題,”他說,“AI 正日益成為數學和計算機科學領域不可或缺的工具。”
從數據中心到芯片,AlphaEvolve 實戰成績單亮眼
雖然 AlphaEvolve 的“算法探索”能力首先用于攻克基礎數學難題(例如矩陣乘法優化),但 Google DeepMind 表示,它已經將 AlphaEvolve 的成果投入到多個真實場景中,帶來了實際收益。
AlphaEvolve 如何幫助 Google 提供更高效的數字生態系統,從數據中心調度和硬件設計到 AI 模型訓練。
1. 提升全球數據中心調度效率
Google 的數據中心任務調度系統 Borg,一直是全球最復雜的調度系統之一。AlphaEvolve 提出了一種人類未曾發現的啟發式策略,目前已在 Google 全球部署超過一年,平均提升了 0.7% 的計算資源使用率。
別看這個數字不大,但在 Google 級別的基礎設施下,這種提升意味著巨大的能源與算力節省。
2. 助力芯片設計:直接修改 Verilog 代碼
AlphaEvolve 還成功地重寫了一段用于矩陣乘法的 Verilog 硬件描述代碼,刪除了冗余的比特位,同時保持電路功能正確。這一修改已被集成至下一代 TPU(Tensor Processing Unit)設計中,為 AI 芯片的自動化設計開啟新可能。
3. AI 模型訓練提速:從幾周縮短到幾天
在 AI 模型訓練方面,AlphaEvolve 優化了 Gemini 模型中的關鍵矩陣計算過程,使訓練時間縮短了 1%,核心 kernel 的運行速度提升了 23%。此外,它還對 FlashAttention 這一 Transformer 模型中的核心組件進行了優化,帶來高達 32.5% 的加速效果。
更重要的是,這一過程原本需要工程師數周才能完成的底層優化,現在通過 AlphaEvolve 的自動化探索只需幾天,極大提升了 AI 研究迭代速度。
挑戰數學前沿:AlphaEvolve 破解百年難題,刷新算法認知
AlphaEvolve 在數學方面也展現出驚人的解題能力和創新潛力。它還可以為復雜的數學問題提出新方法,只需提供一段最簡代碼框架,它就能設計出一種新的基于梯度的優化流程中的多個關鍵組件,進而發現了多種全新的矩陣乘法算法——這是計算機科學中的基礎性問題。
AlphaEvolve 為發現更快的矩陣乘法算法而提出的一系列修改建議。在此示例中,AlphaEvolve 對多個核心組件都進行了大幅度的修改,包括優化器(optimizer)與權重初始化(weight initialization)、損失函數(loss function)以及超參數掃描(hyperparameter sweep)。這些修改絕非微不足道的簡單調整,其背后是進化過程中多達 15 次的復雜“突變”(mutations)。
破矩陣乘法記錄:超越經典
矩陣乘法是無數應用的核心,但其最快算法仍是未解之謎。AlphaEvolve在此領域取得重大突破。針對 4x4 復數矩陣乘法,AlphaEvolve 找到了一種僅需 48 次標量乘法的算法,超越了 1969 年 Strassen 提出的經典算法,刷新了該場景下的最優記錄。
攻克開放性數學難題:從重現頂尖解到刷新紀錄
為了驗證 AlphaEvolve 的廣度,研究團隊將其應用于 50 多個數學分析、幾何、組合數學和數論中的開放問題。得益于其靈活性,大部分實驗僅需數小時即可設置完成。據我們了解,在約 75% 的情況下,AlphaEvolve 成功重現了當前最優解。
更令人驚喜的是,在約 20% 的問題中,AlphaEvolve 提出了優于現有解的新方案,推動了相關開放問題的研究進展。例如,它在已有 300 多年歷史的幾何難題「接吻數問題(kissing number problem)」上取得突破:該問題研究的是在不重疊的前提下,最多能有多少個球同時接觸一個單位球。AlphaEvolve 找到 了一個包 含 593 個外接球的新構型,并在 11 維空間中建立了該問題的最新下界。
是終點嗎?或只是起點
AlphaEvolve 代表了通用算法發現邁出的關鍵一步,也為大模型與自動化推理結合開辟了全新路徑。在 X(原 Twitter)上,Grok 大模型官方賬號也轉發并評論了 AlphaEvolve 的成果,稱其為 “AI 在自主設計與優化算法領域的一大飛躍”,并指出其表現“令人印象深刻”。
正如我們昨天報道的那樣,。”而 AlphaEvolve 的出現,似乎正在讓這一觀點變為現實。在這個由代碼構建的世界里,誰來編寫下一代算法的“源代碼”?或許,這一次,答案真的來自 AI 自己。
https://www.technologyreview.com/2025/05/14/1116438/google-deepminds-new-ai-uses-large-language-models-to-crack-real-world-problems/
https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.