新智元報道
編輯:KingHZ
【新智元導讀】在5月中旬,谷歌發布了AlphaEvolve。不僅30天內攻克了18年未解的難題,或將開啟了一場無需「靈感」的科學革命:未來,科學家將不再依賴直覺,而是靠AI解決難題!
利用Gemini模型,它發現全新的算法。
對此,知名華人數學家陶哲軒略感驚訝。
不僅在計算機科學和數學取得重大進展,AI甚至可能影響到更廣泛的科學領域。
它不僅僅是生成文本工具,更不是簡單的模板生成器。它喻示了AI的無限可能,就像AlphaGo的「神之一手」,展現了人類從未做過的突破。
這甚至可能是邁向AI自我改進的一步。
在深度對話中,華人投資家Sarah Guo(郭睿)采訪了谷歌DeepMind科學與戰略副總裁Pushmeet Kohli(下圖左),以及研究科學家Matej Balog(下圖右)。
他們分享了AlphaEvolve的背后故事。 除了數學和計算機科學,他們也進一步暢想:AlphaEvolve背后的理念,是否還能顛覆更多基礎科學領域?
AlphaEvolve證明靠智能取代「運氣」,也能顛覆科學。 AlphaEvolve,或許正開啟一場不靠「靈感」的科學革命。
AlphaEvolve:陶哲軒震驚的進步
DeepMind的使命是負責任地構建人工智能,造福人類。這些年來,DeepMind一直在科學領域尋找新算法。
AlphaEvolve有什么不一樣?
Pushmeet Kohli認為區別可以從歷史上來看。
一切從AlphaGo說起。
AlphaGo不僅能夠高效地探索圍棋的所有可能局面,而且能夠提出當時最佳走法。在幾十年的圍棋歷史中,人類都沒有發現這種下法。
某種意義上,AlphaGo是AI智能體。在龐大的搜索空間中,它可以高效探索并提出最優解。這種能力讓人們感到驚訝,因為圍棋非常復雜,科學家們認為AI能夠在這一領域取得突破還需要很長時間。
從AlphaGo的工作中,DeepMind得到啟發:
如果AI能夠如此高效地搜索圍棋的所有可能局面,那么是否可以利用類似的思想去搜索算法空間呢?
這就是開始研發AlphaTensor工作的基礎。
幾十年來,人們認為矩陣乘法的復雜度是立方級別的。也就是說,如果你有兩個矩陣,矩陣的維度是n,那么計算的時間復雜度是n3。
50多年前,德國數學家Strassen提出了一種非常反直覺的方法,證明了:實際上,矩陣乘法的復雜度比原來預想的要低。
通過搜索,AlphaTensor發現了比之前所知的算法更高效的解決方案。它不僅在效率上超越了傳統算法,而且這個結果還證明了AI可以實現超人級別的突破。
但問題是,AlphaTensor專門針對矩陣乘法設計。那么,能否將這種方法推廣到更一般的問題中呢?這就引出了對AlphaEvolve的進一步探索。
AlphaEvolve不僅能夠處理特定的任務,它更具普適性,可以處理更廣泛的問題。
AlphaEvolve利用了與AlphaTensor相似的進化算法。但它不再局限于矩陣乘法的特定問題,而是能夠在更廣泛的編程空間中搜索,提出解決方案。
不斷進化,自我改進
聽起來AlphaEvolve類似于進化選擇對吧?它是如何進行每一代的改進的?
在每一代過程中,AlphaEvolve不斷改進,每一代都基于上一代的強解進行優化。
通過基因池和評估函數,確保每一代的改進都能夠提高整體的解的質量,同時保持了多樣性,以便在龐大的搜索空間中發現最佳解決方案。
那這種進化過程的規模如何呢?如何控制模型的迭代次數?
關于這個問題,AlphaEvolve有一個很棒的特性,就是它能夠適應問題的難度。
如果AlphaEvolve被要求解決一個相對簡單的問題,它幾乎能立即得到答案;但如果是一個非常復雜的問題,那么解決方案可能需要更長時間,更多的代次來不斷改進。
但令人欣慰的是,AlphaEvolve可以持續改進,即使是在面對難度極大的問題時,它仍能不斷提高。
這非常有價值,因為在持續優化時,許多傳統的系統往往會在早期就遇到瓶頸,無法繼續改進。
至于預測需要多少代才能達到最優解,這個問題比較復雜。問題的難度,無法預料,尤其是在科學領域,一些看似簡單的問題實際上可能非常難,反之亦然。但幸運的是,只要持續運行AlphaEvolve,它會隨著時間的推移不斷得到更好的結果。
對編碼智能體的意義
與一般的編碼智能體相比,AlphaEvolve有何不同之處?
與一般的編碼智能體相比,AlphaEvolve的優勢在于它能夠處理更復雜的任務,并且具有更高的效率和創造性。
在面對復雜或模糊的任務時,大多數通用編碼智能體,容易陷入困境或產生錯誤,因為它們通常依賴于直接的任務說明,而這些說明往往不夠精確,或者它們沒有很強的判斷能力。
而AlphaEvolve則依賴嚴格的評估函數。它能夠區分有效的解決方案與無效的解決方案。
它的「創造性」不僅僅體現在提出新算法上,還表現在對解決方案進行有效評估和優化的能力上。
每當提出一個新解決方案時,評估函數會幫助判斷它是否有效。
例如,在優化數據中心調度時,評估函數可能是一個模擬器,它能夠根據給定的調度算法來判斷該算法在現實中的表現如何。
這個評估過程幫助Alpha Evolve更準確地搜索解決方案空間。
那對于開發者來說,設計好的評估函數確實非常具有挑戰性。你需要明確什么樣的結果才是好的解決方案。在某些情況下,開發者可以使用現有的模擬器來進行評估,而在其他更復雜的情況下,可能需要開發定制化的評估工具。
評估函數不僅要能判斷方案的好壞,還要能夠在不同的任務中靈活應用。比如,在數據中心調度優化問題中,評估函數的復雜性可能遠高于一些較簡單的任務。
這也是為什么強調評估函數在AI系統中的重要性,只有擁有了精確的評估函數,AI才能有效地進行創新。
左圖:AlphaEvolve為谷歌的工作負載和容量量身定制的啟發式函數;右圖:對該啟發式評分函數的可視化展示
科學家轉變角色
Matej Balog和Pushmeet Kohli都認為:未來,科學家的角色會發生一些變化。
可以想象,在未來,科學家們將更多地專注于如何定義問題、設計評估函數,以及如何解釋AI生成的結果。
AI將成為科學家們的強大工具,幫助他們更快解決復雜的問題。
AI不僅僅給出答案,還提供算法,科學家們可以通過研究算法來理解背后的原理,這對于深入理解問題和解決方案非常重要。
這正是AlphaEvolve稱霸多個領域的原因。
數學家和科學家不僅能看到最終的解決方案,還能理解到達這個解的路徑,這種新的視角對推動科學發展至關重要。
此外,AlphaEvolve不僅僅推動技術創新,還有助于科學家發掘新的思維方式,挑戰現有的認知框架。
AlphaEvolve的問世,標志著科學研究進入了一個嶄新的時代。它不僅在算法領域創造了奇跡,更為未來的科學革命鋪設了道路。
在AlphaEvolve的推動下,或許我們即將見證:科學,不再依賴「靈感」,而是靠「智能」。
參考資料:
https://www.youtube.com/watch?v=2Fs6VZpsiMQ
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.