新智元報道
編輯:Aeneas
【新智元導讀】太瘋狂了,AlphaGo的「第37步」時刻,已經來臨。谷歌的AlphaEvolve,讓我們從此進入AI創造科學的時代,人類科研將徹底顛覆!背后的研究者也首次接受采訪,揭秘研究過程中的一些驚人細節。
這周,谷歌DeepMind扔出了重磅炸彈——AlphaEvolve。
但許多人,仿佛還未意識到這個AI的意義。
可以這么說,AlphaEvolve,就是數學界AlphaGo的「第37步」時刻,堪稱瘋狂。
谷歌的這個AI,取得了人類未曾發現的數學成果。
比如,它改進了改進了4x4矩陣乘法,將運算次數從49次減少到48次,這是自1969年Strassen算法提出以來,56年內的突破!
另外,它還推進了六邊形填充問題的研究,找到了在更大六邊形內排列11個和12個六邊形的更優解法,超越了人類的解決方案(在停滯16年之后)!
甚至,它一舉改進了困擾數學家300多年的「接吻數問題」。
而這一切,都是靠AI自我進化、訓練自己所使用的LLM而得到的。
通過自我對弈,它擁有了超人的編碼能力,甚至讓人預言——
十年內,編程將迎來自己的AlphaGo時刻。
而且,跟AlphaGo的「第37步」不同,AlphaEvolve展現出AI自主優化算法的能力,或將徹底改變芯片設計和數據中心效率。
谷歌CEO Pichai,對「AI訓練AI」進行了生動的解釋:由Gemini驅動的編碼agent,優化了Gemini的訓練,形成了一個數據飛輪
跟以往成果不同的是,谷歌DeepMind這次直接弄出一個通用武器。
從此,AI不僅能解決問題,還能發現新的前沿領域。這就代表著,人類集體智慧發生了一次真正的飛躍!
接下來的劇本,或許就是AI橫掃各大科學難題,直接顛覆人類科研。
谷歌DeepMind
引領全人類未來
谷歌DeepMind,一直在AI改造世界這個方向引領著前沿。可以說,在將近30年里,他們都在指引著人類文明的方向。
AlphaGo通過學習人類對弈,甚至自我對弈,擊敗了人類冠軍李世石。
AlphaZero通過自我對弈,學會圍棋、國際象棋和日本將棋,被稱為一種人類從未見過的智慧。
AlphaFold預測了數百萬種從未通過實驗測量過的蛋白質三維結構。
AlphaDev則發現了更快的排序算法。
AlphaTensor用于進行科學發現,將尋找更快矩陣乘法算法的問題構造成一個游戲,實現了重大突破。
FunSearch則將我們帶到更遠,通過代碼演化,利用LLM尋找新的數學解決方案。
谷歌DeepMind的下一個Alpha,更是令人無比期待。
OpenAI研究員Jason Wei就表示,AlphaEvolve對于像我這樣的強化學習鐵桿粉絲來說,確實令人不安
所以,這次打造出AlphaEvolve的團隊,究竟有哪些人物,經歷了哪些探索?
就在最近,Youtube上的人氣大V「Machine Learning Street Talk」,就提前獲取了谷歌DeepMind的這篇論文,并采訪了這項工作的研究者。
半個世紀矩陣乘法突破,研究者當場驚呆
在計算機科學領域,幾乎沒有問題能像矩陣乘法一樣基礎。
半個多世紀以來,此領域的一個特定基準,一直被認為難以突破。
因為最優算法的搜索空間極為龐大,使得窮舉在實踐中幾乎不可能,即使對相對較小的矩陣也是如此。
1969年,Strassen通過發現一種算法,徹底改變了這一領域。該算法僅需七次標量乘法,即可乘以兩個二乘二矩陣。
而就在今天,這一紀錄被Alpha Evolve打破了!
而它能做到一點,連谷歌DeepMind的研究者都沒想到。
對于通常情況下的矩陣,仍然沒有比使用四十九次乘法進行兩次Strassen更好的辦法。
開始,研究者們也壓根沒有期待,它能找到比四十九次更好的結果,因為他們已經用AlphaTensor嘗試了很長時間了。
所以,他們只是出于完整性試了一下,因為想在論文中展示這個表格而已。
結果,出乎所有人意料,一個更快的算法,居然被它發現了!
這次,算法使用了48次,而不是49次乘法,徹底打破紀錄。
當看到一位同事發消息通知這一結果時,研究者表示自己簡直不敢相信。
反復檢查三遍后,他們終于確認——
AI不斷增強的能力,可以生成全新的、可證明準確的算法,從而推動科學的邊界!
跟第一版本有何區別?
根據論文,AlphaEvolve是一種進化編程智能體,顯著提升了預訓練LLM在復雜任務上的能力。
要知道,此前團隊曾有過第一篇論文,講的是FunSearch,原理與之非常類似。
所以,二者的區別在哪里呢?
研究者介紹說,FunSearch只是在搜索一個單一的函數,但AlphaEvolve,本質上可以作用于整個代碼庫。
它會在代碼庫中你標記的區域中進行搜索,甚至優化這些函數之間的交互。
谷歌昂貴的服務器,不用閑置了
所以,AlphaEvolve有沒有可能進化出一個方法,來優化谷歌的計算基礎設施呢?
出于嘗試,谷歌工程師將一個候選方案放進這個AI,令人驚喜的是,它果然進化出了一個更聰明的啟發式方法!
現在,這個方法已經被運用于優化谷歌內部的計算基礎設施了。
要知道,在谷歌龐大的數據中心,高效安排計算任務是一項非常復雜的操作。如果操作不當,昂貴的服務器就會閑置。
而現在結果正式,這個全新方法利用了谷歌服務器群計算資源的0.7%,對于谷歌來說,這是一項巨大的節省。
盜夢空間成真?
甚至,在另一個自我改進的實例中,它甚至找到了加速Gemini模型訓練的方法,這,就為AlphaEvolve本身提供了動力。
這個實例之所以如此有趣,是因為它不僅生成了解決方案,還生成了產生這些方案的程序。
也就是說,Alpha Evolve像《盜夢空間》一樣。
甚至研究者表示,在檢查代碼時,他不僅想到,這看起來完全就是一種數學洞察,或者一種數學假設!
事實也證明了,它們的確對改進結果非常關鍵。
而Alpha Evolve另外一個有趣的點,就是它仍然非常依賴「人類參與其中」。
過程中,人類負責識別哪些內容是有趣的,找到那些有明確評估標準的問題,將候選解決方案納入循環中。
然后,Alpha Evolve就會遍歷這個可能性的錐體,在過程中不斷跳躍,將這個循環繼續下去。
所以,Alpha Evolve也預示了一種AI的未來——人類和AI之間,有著強大的協作循環。
曾經有一個「死掉的互聯網」的理論,指的是在未來,網上大部分內容都將由AI生成,而且非常表面化、非常膚淺。
而此時,就需要人類來指導AI、改進結果,進行迭代。
而讓Alpha Evolve如此酷炫且強大的,也正是人與機器之間的這種互動。
AlphaEvolve,為何如此適合科學發現
在訪談中,主持人向研究者提問道:究竟是什么促使你們走上了進化算法的道路呢?
研究者回答說,這就跟科學發現的過程一樣,是一個非常自然的選擇。
進化算法能為探索過程帶來多樣性,確保你不會在早期就鎖定在某種特定方法上,因為這種方法有可能是次優解。
最終,我們仍然需要不斷探索所有的可能性,尤其是想要做出新的科學發現時。
言簡意賅地說,AlphaEvolve就是一個進化算法,對于系統給出代碼片段,我們都可以自動測試它好不好,有多好。
一方面,它可以把你限制在你可以解決的問題集上,而另一方面,它涵蓋的問題范圍又非常廣泛。
LLM會給你提出各種想法,通過這個評估器,我們就可以篩選出真正重要的、能做出改變的想法。
最有潛力的代碼,將被識別出來,然后專注于改進這些部分。
接下來,采訪者就提出了一個重要的問題:我們什么時候才知道,這個過程要結束?
比如,可能我們覺得該終止了,但如果再多等五分鐘,就會得到一個近乎完美的算法。
研究者解答了他的疑惑。
從理論上講,的確永遠無法確定如何讓算法運行更久,以及會得到什么結果。
但在實踐中,這并未造成任何問題。
比如可以這樣設置問題:我正在嘗試解決這個數學中的開放性問題,尋找能取得進展的搜索算法,但我希望10分鐘內就能取得進展。
也就是說,其實我們只探索了能在10分鐘內做出進展的算法空間。
當然的確存在這種可能性:如果運行更長時間,說不定還會有表現更好的算法。這個可能性永遠無法消除。
那一刻,AI發生了想象力驚人的跳躍
主持人問道:你可以舉出一些系統做出真正有想象力的跳躍的例子嗎?
研究者表示,一個具體的例子,AlphaEvolve如何發現矩陣乘法算法的。
實際上,他們只是讓它設計了一個基于梯度的搜索算法,也即一個能找出的算法的算法,或者說元算法。
第一個搜索算法,是從一個非常簡單的代碼框架開始的。
研究者并未給它任何東西,只告訴它「用梯度」,然后,它就寫出了這些復雜的損失函數和更新函數,而且以完全出人意料的方式引入了隨機性。
就在那一刻,研究者驚呼:太厲害了!
當然,這種代碼也有可能是人類寫出的,但他們真的會想到寫出這段特定代碼嗎?
那一刻,他仿佛頓悟了——AlphaEvolve做的,是一些類似人類的事情,但又顯然不是人類會嘗試的東西。
人類具體是怎樣指導AI的呢?
研究者提及了一個實驗,在這個實驗中,他們請幾個人花了30分鐘思考這個問題,記下筆記,然后指導系統完成整個過程。
可以理解為,AI榨出了這個想法的全部精華,理解了它的本質,于是引導LLM得出了這樣的目標,同時做了很多優化。
聽起來,這就是智能的本質——嘗試很多事情,總有一件會成功。
最震撼之處:改變世界,就在當下
研究者表示,在以往,通常我們很難開發出某種科研工具,直接、立刻應用到現實世界的挑戰,并產生巨大影響。
而AlphaEvolve的意義就在于,在開箱時就能同時在數學和科學問題上做出新發現,甚至還能發現可以直接部署到谷歌核心計算架構中的算法。
這,是他們此前從未經歷過的事情。
AI奇點,或許已經到來了。
參考資料:
https://www.youtube.com/watch?v=vC9nAosXrJw&t=2s
https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.