網易首頁 > 網易號 > 正文申請入駐

破解百年數學難題，刷新算法認知！DeepMind 發布超級編碼智能體 AlphaEvolve

2025-05-16 16:35:57　來源: CSDN

北京舉報

分享至

【編者按】繼 AlphaGo、AlphaFold 之后，谷歌 DeepMind 帶來的全新 AI 編程智能體 AlphaEvolve 橫空出世，它巧妙地結合了大型語言模型（LLM）的創造力與自動化評估機制，不僅在矩陣乘法等經典數學問題上取得新突破，更在谷歌數據中心優化、芯片設計乃至 AI 自身訓練等實際應用中展現出驚人實力，為我們揭示了 AI 驅動算法發現的廣闊前景。

整理 | 夢依丹

出品丨AI 科技大本營（ID：rgznai100）

5 月 14 日，Google DeepMind 正式官宣推出 AlphaEvolve——一款由 Gemini 強力驅動、專注于算法發現的編碼智能體。這款全新的 AI 智能體，堪稱算法設計領域的一位“進化大師”。

不僅是直接寫代碼，而是進化出的「解決方案」

與傳統的代碼生成工具不同，AlphaEvolve 并不追求“直接產出答案”，而是像演化生物一樣迭代出越來越優秀的解決策略。它的背后是 Google DeepMind 最新的大語言模型家族 Gemini——其中 Gemini 2.0 Flash 負責高效率生成大量思路，Gemini 2.0 Pro 則在關鍵節點提供更深層的方案優化。

其核心能力有：

能夠設計出更快的矩陣乘法算法；
能夠為懸而未決的開放性數學問題找到全新的解決方案；
更能夠顯著提升谷歌數據中心、芯片設計乃至AI自身訓練的整體效率。

那么，AlphaEvolve 是如何實現這些強大功能的呢？其背后精妙的系統設計主要包含三大支柱：

大型語言模型 (LLMs)核心趨動： AlphaEvolve 巧妙利用了Gemini 等先進大語言模型。這些 LLM 負責深度理解問題、綜合分析過往的嘗試與解決方案，并在此基礎上創造性地提出新版本的算法代碼。
自動化評估 (Automated Evaluation)：對于那些進展可以被清晰、系統化衡量的問題（尤其在數學和計算機科學領域），AlphaEvolve 配備了自動化評估系統。它能夠對 LLM 生成的每個算法方案進行客觀、量化的打分，精準評估其準確性與效率。
進化機制 (Evolution)：這也是 AlphaEvolve 的“靈魂”所在。它并非止步于單個好方案，而是采用進化策略，不斷迭代改進當前表現最佳的算法。更關鍵的是，它還會從不同的優秀方案中汲取靈感、重組“基因”（即核心思路），從而“進化”出更為強大、甚至出人意料的更優算法。

這種“LLM 創造 + 自動化評估 + 進化迭代”的協同工作模式，使得 AlphaEvolve 能夠從最初的設想，一步步進化出高度優化的復雜算法。與前代工具 FunSearch 主要生成簡短代碼片段不同，AlphaEvolve 能夠進化出包含數百行代碼的完整程序，從而應對更復雜、更廣泛的挑戰。

谷歌 DeepMind 副總裁、領導其 AI 賦能科學團隊的 Pushmeet Kohli 將AlphaEvolve 形容為一個“超級編碼智能體”。英國華威大學的數學家 Jakob Moosbauer 表示：AlphaEvolve 的強大之處在于它并非直接去尋找問題的答案，而是去搜索那些能產生特定解決方案的“算法”本身，這使得它威力倍增。“這種方法讓它能廣泛適用于各種各樣的問題，”他說，“AI 正日益成為數學和計算機科學領域不可或缺的工具。”

從數據中心到芯片，AlphaEvolve 實戰成績單亮眼

雖然 AlphaEvolve 的“算法探索”能力首先用于攻克基礎數學難題（例如矩陣乘法優化），但 Google DeepMind 表示，它已經將 AlphaEvolve 的成果投入到多個真實場景中，帶來了實際收益。

AlphaEvolve 如何幫助 Google 提供更高效的數字生態系統，從數據中心調度和硬件設計到 AI 模型訓練。

1. 提升全球數據中心調度效率

Google 的數據中心任務調度系統 Borg，一直是全球最復雜的調度系統之一。AlphaEvolve 提出了一種人類未曾發現的啟發式策略，目前已在 Google 全球部署超過一年，平均提升了 0.7% 的計算資源使用率。

別看這個數字不大，但在 Google 級別的基礎設施下，這種提升意味著巨大的能源與算力節省。

2. 助力芯片設計：直接修改 Verilog 代碼

AlphaEvolve 還成功地重寫了一段用于矩陣乘法的 Verilog 硬件描述代碼，刪除了冗余的比特位，同時保持電路功能正確。這一修改已被集成至下一代 TPU（Tensor Processing Unit）設計中，為 AI 芯片的自動化設計開啟新可能。

3. AI 模型訓練提速：從幾周縮短到幾天

在 AI 模型訓練方面，AlphaEvolve 優化了 Gemini 模型中的關鍵矩陣計算過程，使訓練時間縮短了 1%，核心 kernel 的運行速度提升了 23%。此外，它還對 FlashAttention 這一 Transformer 模型中的核心組件進行了優化，帶來高達 32.5% 的加速效果。

更重要的是，這一過程原本需要工程師數周才能完成的底層優化，現在通過 AlphaEvolve 的自動化探索只需幾天，極大提升了 AI 研究迭代速度。

挑戰數學前沿：AlphaEvolve 破解百年難題，刷新算法認知

AlphaEvolve 在數學方面也展現出驚人的解題能力和創新潛力。它還可以為復雜的數學問題提出新方法，只需提供一段最簡代碼框架，它就能設計出一種新的基于梯度的優化流程中的多個關鍵組件，進而發現了多種全新的矩陣乘法算法——這是計算機科學中的基礎性問題。

AlphaEvolve 為發現更快的矩陣乘法算法而提出的一系列修改建議。在此示例中，AlphaEvolve 對多個核心組件都進行了大幅度的修改，包括優化器（optimizer）與權重初始化（weight initialization）、損失函數（loss function）以及超參數掃描（hyperparameter sweep）。這些修改絕非微不足道的簡單調整，其背后是進化過程中多達 15 次的復雜“突變”（mutations）。

破矩陣乘法記錄：超越經典

矩陣乘法是無數應用的核心，但其最快算法仍是未解之謎。AlphaEvolve在此領域取得重大突破。針對 4x4 復數矩陣乘法，AlphaEvolve 找到了一種僅需 48 次標量乘法的算法，超越了 1969 年 Strassen 提出的經典算法，刷新了該場景下的最優記錄。

攻克開放性數學難題：從重現頂尖解到刷新紀錄

為了驗證 AlphaEvolve 的廣度，研究團隊將其應用于 50 多個數學分析、幾何、組合數學和數論中的開放問題。得益于其靈活性，大部分實驗僅需數小時即可設置完成。據我們了解，在約 75% 的情況下，AlphaEvolve 成功重現了當前最優解。

更令人驚喜的是，在約 20% 的問題中，AlphaEvolve 提出了優于現有解的新方案，推動了相關開放問題的研究進展。例如，它在已有 300 多年歷史的幾何難題「接吻數問題（kissing number problem）」上取得突破：該問題研究的是在不重疊的前提下，最多能有多少個球同時接觸一個單位球。AlphaEvolve 找到了一個包含 593 個外接球的新構型，并在 11 維空間中建立了該問題的最新下界。

是終點嗎？或只是起點

AlphaEvolve 代表了通用算法發現邁出的關鍵一步，也為大模型與自動化推理結合開辟了全新路徑。在 X（原 Twitter）上，Grok 大模型官方賬號也轉發并評論了 AlphaEvolve 的成果，稱其為 “AI 在自主設計與優化算法領域的一大飛躍”，并指出其表現“令人印象深刻”。

正如我們昨天報道的那樣，。”而 AlphaEvolve 的出現，似乎正在讓這一觀點變為現實。在這個由代碼構建的世界里，誰來編寫下一代算法的“源代碼”？或許，這一次，答案真的來自 AI 自己。

https://www.technologyreview.com/2025/05/14/1116438/google-deepminds-new-ai-uses-large-language-models-to-crack-real-world-problems/

https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.