新智元報(bào)道
編輯:Aeneas
【新智元導(dǎo)讀】太瘋狂了,AlphaGo的「第37步」時(shí)刻,已經(jīng)來(lái)臨。谷歌的AlphaEvolve,讓我們從此進(jìn)入AI創(chuàng)造科學(xué)的時(shí)代,人類科研將徹底顛覆!背后的研究者也首次接受采訪,揭秘研究過(guò)程中的一些驚人細(xì)節(jié)。
這周,谷歌DeepMind扔出了重磅炸彈——AlphaEvolve。
但許多人,仿佛還未意識(shí)到這個(gè)AI的意義。
可以這么說(shuō),AlphaEvolve,就是數(shù)學(xué)界AlphaGo的「第37步」時(shí)刻,堪稱瘋狂。
谷歌的這個(gè)AI,取得了人類未曾發(fā)現(xiàn)的數(shù)學(xué)成果。
比如,它改進(jìn)了改進(jìn)了4x4矩陣乘法,將運(yùn)算次數(shù)從49次減少到48次,這是自1969年Strassen算法提出以來(lái),56年內(nèi)的突破!
另外,它還推進(jìn)了六邊形填充問(wèn)題的研究,找到了在更大六邊形內(nèi)排列11個(gè)和12個(gè)六邊形的更優(yōu)解法,超越了人類的解決方案(在停滯16年之后)!
甚至,它一舉改進(jìn)了困擾數(shù)學(xué)家300多年的「接吻數(shù)問(wèn)題」。
而這一切,都是靠AI自我進(jìn)化、訓(xùn)練自己所使用的LLM而得到的。
通過(guò)自我對(duì)弈,它擁有了超人的編碼能力,甚至讓人預(yù)言——
十年內(nèi),編程將迎來(lái)自己的AlphaGo時(shí)刻。
而且,跟AlphaGo的「第37步」不同,AlphaEvolve展現(xiàn)出AI自主優(yōu)化算法的能力,或?qū)氐赘淖冃酒O(shè)計(jì)和數(shù)據(jù)中心效率。
谷歌CEO Pichai,對(duì)「AI訓(xùn)練AI」進(jìn)行了生動(dòng)的解釋:由Gemini驅(qū)動(dòng)的編碼agent,優(yōu)化了Gemini的訓(xùn)練,形成了一個(gè)數(shù)據(jù)飛輪
跟以往成果不同的是,谷歌DeepMind這次直接弄出一個(gè)通用武器。
從此,AI不僅能解決問(wèn)題,還能發(fā)現(xiàn)新的前沿領(lǐng)域。這就代表著,人類集體智慧發(fā)生了一次真正的飛躍!
接下來(lái)的劇本,或許就是AI橫掃各大科學(xué)難題,直接顛覆人類科研。
谷歌DeepMind
引領(lǐng)全人類未來(lái)
谷歌DeepMind,一直在AI改造世界這個(gè)方向引領(lǐng)著前沿。可以說(shuō),在將近30年里,他們都在指引著人類文明的方向。
AlphaGo通過(guò)學(xué)習(xí)人類對(duì)弈,甚至自我對(duì)弈,擊敗了人類冠軍李世石。
AlphaZero通過(guò)自我對(duì)弈,學(xué)會(huì)圍棋、國(guó)際象棋和日本將棋,被稱為一種人類從未見(jiàn)過(guò)的智慧。
AlphaFold預(yù)測(cè)了數(shù)百萬(wàn)種從未通過(guò)實(shí)驗(yàn)測(cè)量過(guò)的蛋白質(zhì)三維結(jié)構(gòu)。
AlphaDev則發(fā)現(xiàn)了更快的排序算法。
AlphaTensor用于進(jìn)行科學(xué)發(fā)現(xiàn),將尋找更快矩陣乘法算法的問(wèn)題構(gòu)造成一個(gè)游戲,實(shí)現(xiàn)了重大突破。
FunSearch則將我們帶到更遠(yuǎn),通過(guò)代碼演化,利用LLM尋找新的數(shù)學(xué)解決方案。
谷歌DeepMind的下一個(gè)Alpha,更是令人無(wú)比期待。
OpenAI研究員Jason Wei就表示,AlphaEvolve對(duì)于像我這樣的強(qiáng)化學(xué)習(xí)鐵桿粉絲來(lái)說(shuō),確實(shí)令人不安
所以,這次打造出AlphaEvolve的團(tuán)隊(duì),究竟有哪些人物,經(jīng)歷了哪些探索?
就在最近,Youtube上的人氣大V「Machine Learning Street Talk」,就提前獲取了谷歌DeepMind的這篇論文,并采訪了這項(xiàng)工作的研究者。
半個(gè)世紀(jì)矩陣乘法突破,研究者當(dāng)場(chǎng)驚呆
在計(jì)算機(jī)科學(xué)領(lǐng)域,幾乎沒(méi)有問(wèn)題能像矩陣乘法一樣基礎(chǔ)。
半個(gè)多世紀(jì)以來(lái),此領(lǐng)域的一個(gè)特定基準(zhǔn),一直被認(rèn)為難以突破。
因?yàn)樽顑?yōu)算法的搜索空間極為龐大,使得窮舉在實(shí)踐中幾乎不可能,即使對(duì)相對(duì)較小的矩陣也是如此。
1969年,Strassen通過(guò)發(fā)現(xiàn)一種算法,徹底改變了這一領(lǐng)域。該算法僅需七次標(biāo)量乘法,即可乘以兩個(gè)二乘二矩陣。
而就在今天,這一紀(jì)錄被Alpha Evolve打破了!
而它能做到一點(diǎn),連谷歌DeepMind的研究者都沒(méi)想到。
對(duì)于通常情況下的矩陣,仍然沒(méi)有比使用四十九次乘法進(jìn)行兩次Strassen更好的辦法。
開(kāi)始,研究者們也壓根沒(méi)有期待,它能找到比四十九次更好的結(jié)果,因?yàn)樗麄円呀?jīng)用AlphaTensor嘗試了很長(zhǎng)時(shí)間了。
所以,他們只是出于完整性試了一下,因?yàn)橄朐谡撐闹姓故具@個(gè)表格而已。
結(jié)果,出乎所有人意料,一個(gè)更快的算法,居然被它發(fā)現(xiàn)了!
這次,算法使用了48次,而不是49次乘法,徹底打破紀(jì)錄。
當(dāng)看到一位同事發(fā)消息通知這一結(jié)果時(shí),研究者表示自己簡(jiǎn)直不敢相信。
反復(fù)檢查三遍后,他們終于確認(rèn)——
AI不斷增強(qiáng)的能力,可以生成全新的、可證明準(zhǔn)確的算法,從而推動(dòng)科學(xué)的邊界!
跟第一版本有何區(qū)別?
根據(jù)論文,AlphaEvolve是一種進(jìn)化編程智能體,顯著提升了預(yù)訓(xùn)練LLM在復(fù)雜任務(wù)上的能力。
要知道,此前團(tuán)隊(duì)曾有過(guò)第一篇論文,講的是FunSearch,原理與之非常類似。
所以,二者的區(qū)別在哪里呢?
研究者介紹說(shuō),F(xiàn)unSearch只是在搜索一個(gè)單一的函數(shù),但AlphaEvolve,本質(zhì)上可以作用于整個(gè)代碼庫(kù)。
它會(huì)在代碼庫(kù)中你標(biāo)記的區(qū)域中進(jìn)行搜索,甚至優(yōu)化這些函數(shù)之間的交互。
谷歌昂貴的服務(wù)器,不用閑置了
所以,AlphaEvolve有沒(méi)有可能進(jìn)化出一個(gè)方法,來(lái)優(yōu)化谷歌的計(jì)算基礎(chǔ)設(shè)施呢?
出于嘗試,谷歌工程師將一個(gè)候選方案放進(jìn)這個(gè)AI,令人驚喜的是,它果然進(jìn)化出了一個(gè)更聰明的啟發(fā)式方法!
現(xiàn)在,這個(gè)方法已經(jīng)被運(yùn)用于優(yōu)化谷歌內(nèi)部的計(jì)算基礎(chǔ)設(shè)施了。
要知道,在谷歌龐大的數(shù)據(jù)中心,高效安排計(jì)算任務(wù)是一項(xiàng)非常復(fù)雜的操作。如果操作不當(dāng),昂貴的服務(wù)器就會(huì)閑置。
而現(xiàn)在結(jié)果正式,這個(gè)全新方法利用了谷歌服務(wù)器群計(jì)算資源的0.7%,對(duì)于谷歌來(lái)說(shuō),這是一項(xiàng)巨大的節(jié)省。
盜夢(mèng)空間成真?
甚至,在另一個(gè)自我改進(jìn)的實(shí)例中,它甚至找到了加速Gemini模型訓(xùn)練的方法,這,就為AlphaEvolve本身提供了動(dòng)力。
這個(gè)實(shí)例之所以如此有趣,是因?yàn)樗粌H生成了解決方案,還生成了產(chǎn)生這些方案的程序。
也就是說(shuō),Alpha Evolve像《盜夢(mèng)空間》一樣。
甚至研究者表示,在檢查代碼時(shí),他不僅想到,這看起來(lái)完全就是一種數(shù)學(xué)洞察,或者一種數(shù)學(xué)假設(shè)!
事實(shí)也證明了,它們的確對(duì)改進(jìn)結(jié)果非常關(guān)鍵。
而Alpha Evolve另外一個(gè)有趣的點(diǎn),就是它仍然非常依賴「人類參與其中」。
過(guò)程中,人類負(fù)責(zé)識(shí)別哪些內(nèi)容是有趣的,找到那些有明確評(píng)估標(biāo)準(zhǔn)的問(wèn)題,將候選解決方案納入循環(huán)中。
然后,Alpha Evolve就會(huì)遍歷這個(gè)可能性的錐體,在過(guò)程中不斷跳躍,將這個(gè)循環(huán)繼續(xù)下去。
所以,Alpha Evolve也預(yù)示了一種AI的未來(lái)——人類和AI之間,有著強(qiáng)大的協(xié)作循環(huán)。
曾經(jīng)有一個(gè)「死掉的互聯(lián)網(wǎng)」的理論,指的是在未來(lái),網(wǎng)上大部分內(nèi)容都將由AI生成,而且非常表面化、非常膚淺。
而此時(shí),就需要人類來(lái)指導(dǎo)AI、改進(jìn)結(jié)果,進(jìn)行迭代。
而讓Alpha Evolve如此酷炫且強(qiáng)大的,也正是人與機(jī)器之間的這種互動(dòng)。
AlphaEvolve,為何如此適合科學(xué)發(fā)現(xiàn)
在訪談中,主持人向研究者提問(wèn)道:究竟是什么促使你們走上了進(jìn)化算法的道路呢?
研究者回答說(shuō),這就跟科學(xué)發(fā)現(xiàn)的過(guò)程一樣,是一個(gè)非常自然的選擇。
進(jìn)化算法能為探索過(guò)程帶來(lái)多樣性,確保你不會(huì)在早期就鎖定在某種特定方法上,因?yàn)檫@種方法有可能是次優(yōu)解。
最終,我們?nèi)匀恍枰粩嗵剿魉械目赡苄裕绕涫窍胍龀鲂碌目茖W(xué)發(fā)現(xiàn)時(shí)。
言簡(jiǎn)意賅地說(shuō),AlphaEvolve就是一個(gè)進(jìn)化算法,對(duì)于系統(tǒng)給出代碼片段,我們都可以自動(dòng)測(cè)試它好不好,有多好。
一方面,它可以把你限制在你可以解決的問(wèn)題集上,而另一方面,它涵蓋的問(wèn)題范圍又非常廣泛。
LLM會(huì)給你提出各種想法,通過(guò)這個(gè)評(píng)估器,我們就可以篩選出真正重要的、能做出改變的想法。
最有潛力的代碼,將被識(shí)別出來(lái),然后專注于改進(jìn)這些部分。
接下來(lái),采訪者就提出了一個(gè)重要的問(wèn)題:我們什么時(shí)候才知道,這個(gè)過(guò)程要結(jié)束?
比如,可能我們覺(jué)得該終止了,但如果再多等五分鐘,就會(huì)得到一個(gè)近乎完美的算法。
研究者解答了他的疑惑。
從理論上講,的確永遠(yuǎn)無(wú)法確定如何讓算法運(yùn)行更久,以及會(huì)得到什么結(jié)果。
但在實(shí)踐中,這并未造成任何問(wèn)題。
比如可以這樣設(shè)置問(wèn)題:我正在嘗試解決這個(gè)數(shù)學(xué)中的開(kāi)放性問(wèn)題,尋找能取得進(jìn)展的搜索算法,但我希望10分鐘內(nèi)就能取得進(jìn)展。
也就是說(shuō),其實(shí)我們只探索了能在10分鐘內(nèi)做出進(jìn)展的算法空間。
當(dāng)然的確存在這種可能性:如果運(yùn)行更長(zhǎng)時(shí)間,說(shuō)不定還會(huì)有表現(xiàn)更好的算法。這個(gè)可能性永遠(yuǎn)無(wú)法消除。
那一刻,AI發(fā)生了想象力驚人的跳躍
主持人問(wèn)道:你可以舉出一些系統(tǒng)做出真正有想象力的跳躍的例子嗎?
研究者表示,一個(gè)具體的例子,AlphaEvolve如何發(fā)現(xiàn)矩陣乘法算法的。
實(shí)際上,他們只是讓它設(shè)計(jì)了一個(gè)基于梯度的搜索算法,也即一個(gè)能找出的算法的算法,或者說(shuō)元算法。
第一個(gè)搜索算法,是從一個(gè)非常簡(jiǎn)單的代碼框架開(kāi)始的。
研究者并未給它任何東西,只告訴它「用梯度」,然后,它就寫出了這些復(fù)雜的損失函數(shù)和更新函數(shù),而且以完全出人意料的方式引入了隨機(jī)性。
就在那一刻,研究者驚呼:太厲害了!
當(dāng)然,這種代碼也有可能是人類寫出的,但他們真的會(huì)想到寫出這段特定代碼嗎?
那一刻,他仿佛頓悟了——AlphaEvolve做的,是一些類似人類的事情,但又顯然不是人類會(huì)嘗試的東西。
人類具體是怎樣指導(dǎo)AI的呢?
研究者提及了一個(gè)實(shí)驗(yàn),在這個(gè)實(shí)驗(yàn)中,他們請(qǐng)幾個(gè)人花了30分鐘思考這個(gè)問(wèn)題,記下筆記,然后指導(dǎo)系統(tǒng)完成整個(gè)過(guò)程。
可以理解為,AI榨出了這個(gè)想法的全部精華,理解了它的本質(zhì),于是引導(dǎo)LLM得出了這樣的目標(biāo),同時(shí)做了很多優(yōu)化。
聽(tīng)起來(lái),這就是智能的本質(zhì)——嘗試很多事情,總有一件會(huì)成功。
最震撼之處:改變世界,就在當(dāng)下
研究者表示,在以往,通常我們很難開(kāi)發(fā)出某種科研工具,直接、立刻應(yīng)用到現(xiàn)實(shí)世界的挑戰(zhàn),并產(chǎn)生巨大影響。
而AlphaEvolve的意義就在于,在開(kāi)箱時(shí)就能同時(shí)在數(shù)學(xué)和科學(xué)問(wèn)題上做出新發(fā)現(xiàn),甚至還能發(fā)現(xiàn)可以直接部署到谷歌核心計(jì)算架構(gòu)中的算法。
這,是他們此前從未經(jīng)歷過(guò)的事情。
AI奇點(diǎn),或許已經(jīng)到來(lái)了。
參考資料:
https://www.youtube.com/watch?v=vC9nAosXrJw&t=2s
https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.