新智元報道
編輯:定慧 犀牛
【新智元導讀】在谷歌I/O大會后,創始人謝爾蓋·布林驚喜現身,與Hassabis深入探討AI的推理能力、規模與算法、測試時計算及多模態智能體的應用前景。布林強調AI時代是計算科學家不應退休的黃金期,AI影響將遠超互聯網與手機。
谷歌的I/O大會證明藍星的科技正統還在谷歌。
除了發布Gemini 2.5最新版本繼續遙遙領先OpenAI的奧特曼以外,還掏出兩幅眼鏡來拳打蘋果,腳踢Meta。
會后還把谷歌的「開山老祖」謝爾蓋·布林(Sergey Brin)請了出來,逼Demis Hassabis趕緊在2030年前(也就5年內了)實現AGI。
主持人:AGI在2030年之前實現還是之后?
布林:好吧,如果你真以此為線的話,我認為是在之前實現吧。
Hassabis:我說之后吧。
兩人相視一笑。
Hassabis:那我得回去努力的工作了。
谷歌I/O大會后,Demis Hassabis和謝爾蓋·布林被叫到一起聊了一會。
涉及到AGI可能的實現日期、建立更多的數據中心、測試時計算讓模型的能力更強、谷歌眼鏡的時機成熟以及謝爾蓋·布林為何選擇這個時機重返谷歌。
謝爾蓋·布林認為當前時期是人類最為特殊的一個時期,他認為:
現在任何的計算機科學家都不應該退休,而是要加入到AI研究中來。
人類世界還從來沒有出現過如此大的機遇和技術突破。
謝爾蓋·布林可以說是互聯網1.0時代的締造者和2.0時代的見證者,但是他依然認為AI時代會完全不一樣。
網絡和手機已經改變了世界,但是AI將會帶來更大的變革,尤其是想到AGI的到來。
主持問謝爾蓋·布林假如回到谷歌后,每天的工作是什么,謝爾蓋·布林說我每天的工作就是「折磨」像Hassabis這樣的人來早日實現AGI。
下面就來看看布林和Hassabis的高能對話。
規模與算法之爭
訪談一開始,主持人Alex提出了最近大家一直在討論的「規模」問題:模型的規模是主要因素還是只是個「配角」?
Hassabis認為數據規模與計算規模兩者缺一不可,目前還沒有發揮到極致。
但他同時認為也得投入大量精力去探索未來的突破,「可能在半年到一年后會有創新,能帶來10倍的飛躍。」
布林也認為,算法的進步和計算能力的提升缺一不可。
更好、更多的芯片、更大的數據中心,這些都很重要。布林猜測,算法的突破可能比計算能力的提升更關鍵。
「不過現在兩者都在快速發展,我們正在享受雙重紅利。」他說。
Hassabis說我們還需要更多的數據中心,不僅僅是為了訓練,大家對模型的需求也非常大,比如Gemini 2.5 Pro。
尤其是最新的Gemini 2.5 Pro「Deep Think」模式,給它更多思考時間,表現會更好。
「這確實需要很多芯片支持?!?/p>
推理范式:測試時計算
推理模型已經成為當前AI的主流范式。
實驗以及模型已經證實,更多的測試時計算,即給予模型更多的時間「思考」,在傳統大型語言模型(LLM)上加入推理機制能帶來提升。
推理范式帶來的改進有多大?
Hassabis表示他一直很相信這種「思考范式」。
回顧谷歌早期在AlphaGo和AlphaZero上的工作,以及在游戲領域的智能體研究,這些系統都有一個「思考」屬性。
這個效果是可以量化的。
以象棋或圍棋為例,Hassabis說他們測試過關閉思考功能的AlphaGo和AlphaZero版本,模型只會直接給出第一個想法,表現也就大概是大師級別。
但一旦開啟思考功能,表現就遠超世界冠軍級別,差距大概有600分。
這在游戲中已經很顯著了,而現實世界比游戲復雜得多,加入思考范式的潛力可能會更大。
當然,測試時計算的挑戰在于這種對比測試中的基礎模型需要首先是一種「世界模型」,這比建一個簡單游戲模型難得多。
就像Gemini一開始就選擇走多模態的路線,雖然當時文本模型如日中天,但是谷歌DeepMind還是決定做正確但艱難的決定。
謝爾蓋·布林說DeepMind確實在強化學習方面開創了很多先河。
他舉了個例子,就像我們大多數人一樣,思考后再說話總是有好處的,雖然我們并不經常這么做。
AI一旦有了這種「思考」能力,顯然會變得更強大。
謝爾蓋·布林覺得我們現在才剛觸及冰山一角。
這些推理模型真正出現還不到一年(DeepSeek-R1是今年2月的事情)。
關于世界模型,Hassabis也提到了I/O大會上剛剛發布的Veo 3。
Veo 3能直覺地理解光線和重力的物理規律,以前制作電腦游戲,記得那時候得手動編程所有的光影效果、物理計算,超級復雜。
現在模型居然能自己「領悟」這些,真的很不可思議。
AGI
提到AGI,Hassabis認為這更像是一個理論上的概念:它指的是人類大腦這種結構本身,到底具備什么樣的能力?
人類大腦之所以是一個重要的參照點,是因為它可能是宇宙中唯一證明了通用智能存在的證據。
那么,要達到這個標準,就必須證明系統能夠做到那些歷史上最杰出的人類——比如愛因斯坦、莫扎特、居里夫人等等——能夠做到的各種事情。
Hassabis說,現在的系統顯然還沒到這步。
另外,他也覺得AGI的炒作有點過頭了。因為現在的系統還不夠穩定,不足以被稱為「通用」。
它們能做很多事情,但你很容易在幾分鐘之內就能發現一些顯而易見的缺陷。比如解不出一道高中數學題,或者玩不好某些簡單的游戲。
對于Hassabis而言,一個系統要想被稱為AGI,需要在各個方面都表現得比現在穩定一致得多,也許得讓一個專家團隊花上好幾個月才能在里面找到一個明顯的漏洞。
「而現在呢,普通人幾分鐘就能發現問題了?!?/p>
接著主持人問了一個更適合布林的問題:AGI會是一家公司「一統江湖」,還是谷歌、OpenAI、Anthropic等等人手一個?
布林說這是個好問題。他認為AGI不是一個特別精確的點,可能會有多個玩家同時接近那個水平。
之后會咋樣呢?很難預測。
布林認為,AI領域現在競爭很激烈,一旦一家公司有了突破,其他公司很快就會跟上。這種競爭會讓更多公司跨過門檻。
主持人Alex比較感興趣的問題則是:AI需要有情感才能算是AGI嗎?
Hassabis覺得AI可以理解情感,但是否需要模仿情感,需要選擇。
Alex接著提到他上周看到Alpha Evolve的新聞,「嚇得差點從椅子上掉下來?!?/p>
這個AI能幫助設計出更好的算法,甚至改進大模型的訓練方式。
「你是想搞個『智能爆炸』嗎?」他問Hassabis。
Hassabis大笑著說,這是個很有趣的實驗,把進化編程技術跟最新的基礎模型結合,確實有意思。
他希望看到更多組合式的探索。
確實,自我改進式的發現可能會讓事情加速。
Hassabis之前在AlphaZero上見過類似的事情。它能從零開始,在不到24小時內自學國際象棋、圍棋等雙人游戲。
不過,那些都是規則清晰的游戲領域。現實世界則復雜得多,這種方法到底能不能更通用,還得看。
布林重回谷歌
主持人Alex問到布林,現在有很多很厲害的AI,大家都在賽跑,這就是你回谷歌的原因嗎?
正如開頭所說,布林說作為一個計算機科學家,現在是個很特別的歷史時刻。
「任何一個搞計算機科學的人,現在都不應該退休,應該投身AI。」
布林說他重回谷歌倒不是因為競賽——雖然他們絕對想讓Gemini第一個實現AGI,但能參與這場技術革命,就足以激動人心了。
「我經歷過Web 1.0,那會兒覺得挺激動,后來還有移動互聯網什么的,也挺熱鬧。但AI從科學角度看,興奮度完全不是一個級別!」布林說。
他認為AI對世界的影響會比網絡和智能手機大得多。網絡和手機已經改變了很多,但AI的變革會更徹底。
布林調侃他在谷歌的主要事情是「折磨」像Hassabis這樣的人。
他表示自己每天都與Gemini文本模型、預訓練、后訓練的工作團隊混在一起,偶爾也會摻和一些多模態的工作,比如Veo 3。
關于智能體
其他的科技公司做智能體,展示的通常是能理解上下文、語音交互、主要在屏幕上操作的系統。
但谷歌的演示常常是通過攝像頭,特別強調視覺。
對此,Hassabis解釋說DeepMind一直都對智能體很感興趣,目標是打造AGI。
顯然,這種智能體得理解你周圍的世界。
在Hassabis看來,這有兩個超級重要的應用場景:
一個真正有用的助理。能在你的日常生活中跟著你,而不是困在電腦或者某個設備上。它得在各種場景下都好用,理解你的物理環境。
機器人。隨著最新版本的Gemini 2.5 Pro及即將推出的視頻技術等,Hassabis覺得終于有了讓機器人真正「開竅」的算法了,能夠釋放出巨大的潛力。
最終,AGI能做到所有這些事。
DeepMind一開始就定下了這個方向,所以Gemini從最早的版本就是多模態的。
「一開始做多模態比純文本難多了,但現在我們開始看到回報了?!?/p>
關于谷歌最新的「八卦消息」
在這次采訪中,謝爾蓋和Hassabis也分享了一些關于谷歌的其他消息。
谷歌眼鏡:時機成熟了嗎?
雖然蘋果發布了AppleVision,Meta發布了Meta Rayban,但要說起來第一家搞智能眼鏡還是谷歌。
謝爾蓋·布林承認那個時候犯了很多錯誤,謝爾蓋說最大的問題是第一代的谷歌眼鏡「太不像」眼鏡。
現在的AI眼鏡就沒有過去那個復雜的臃腫的部分。
而且確實當時存在比較大的技術壁壘,2013年發布第一代谷歌眼鏡時,大模型連影子都看不到。
另一個方面就是謝爾蓋·布林承認他當時對電子供應鏈一無所知。(這就不得不想到庫存大師庫克,蘋果后來的成功很大一部分真的是依賴于庫克的供應鏈能力。)
現在谷歌在I/O發布了Android XR系列的AI眼鏡,一個是對標蘋果Apple Vision Pro的頭戴設備,一個是對標Meta的正常眼鏡。
Hassabis趕緊安慰老板,谷歌過去在玻璃眼鏡上的經驗都很有幫助,他們準備在產品完全準備好以后,再進行發布。
Hassabis解釋說,為什么現在推出谷歌眼鏡的時機成熟。
因為通用AI助手才是智能眼鏡的殺手級應用,過去即使是硬件準備好,但是軟件不夠用。
而現在「模型即產品」的大模型能力加上越來越成熟的硬件技術,真正的智能眼鏡馬上就會到來。
數據管理
Hassabis也提到谷歌對于數據管理是非常嚴格的。
谷歌給他們所有的AI生成的視頻都附加了一種隱形水印,可以用工具檢測出來,并且這個工具也會同時公布出來。
這對于打擊虛假和深度偽造信息非常重要。
最后主持問謝爾蓋·布林,你覺得十年后的網絡會是什么樣子?
不管是謝爾蓋還是Hassabis都覺得按照現在AI的發展速度,沒有人能夠想象10年后會是什么樣子。
回望互聯網走過的這三十年,似乎一切都是為了AI的到來做準備,是否人類是活在一種更高維生物制定的「模擬」之中?
Hassabis是如此認為的,他覺得物理學的終點就是信息論,人類生活在一個計算模擬宇宙之中,但目前還無法解釋。
他說他將會在未來寫一篇文章來介紹這么多年AlphaGo、AlphaFold以及AlphaEvolve系列真正意味著什么,以及他對模擬的看法。
謝爾蓋說如果人類生活在模擬之中,那遞歸的想,模擬人類的物種也生活在另一個模擬之中,那么這個系統將無限遞歸下去,所以需要一個停止標準,但這個標準是什么?所以他并不認為人類活在這種模擬中。
從另一個角度,如果真的有一個比我們更高級的智慧生命在操縱人類,他具備某種和人類相似的欲望和意識,謝爾蓋說如果現實真是這樣,他還是挺失望的。
也許AGI的最終實現能幫他回答這個問題。
參考資料:
https://www.youtube.com/watch?v=M2ZtBQI2-GY&list=PLADd6sStSis77HKfbf4KCY6SvthfxeUgn&index=2
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.