久違的 Lex Fridman 又來采訪 AI 行業的關鍵人物了。
這次是 Google CEO Sundar Pichai。過去半年,Google 憑借 Gemini 2.5 完成了 AI 競賽的追趕,某種意義上說,Google 和 OpenAI 現在站在了同一起跑線。
Lex 的播客一向聊的廣且深,這次也不例外,Pichai 這一年的困境、核心產品搜索的未來方向、模型和 Sclaing Law,AI 編程、具身智能、AGI、ASI 還是 AJI 的探討。
很多時候,問對了問題,好的采訪就完成了一大半。Pichai 的回復,確實有蠻多干貨。
2 小時多的播客,編譯時我們做了一些刪減。
原始播客:https://www.youtube.com/watch?v=9V6tWC4CdFQ&t=2711s
TLDR:
谷歌對于未來搜索的設想是,在搜索中部署了最強的模型,這些模型會圍繞每一個查詢執行多路徑檢索,并整合信息,最終把用戶引向真正有價值的內容。
隨著 AI Mode 功能的成熟,谷歌會將其遷移到主頁面上,可以看作是一個連續的統一體:AI 模式會為用戶提供最前沿的體驗,而其中驗證有效的部分會流入 AI 概覽與主搜索體驗中。
從第一性原理角度出發,模型的深度思考、推理不是靠人為地堆規則,而是從科學角度去構建模型的推理能力——比如處理數學、物理、歷史這類話題時,要確保模型的理解和推理邏輯是扎實的。
大約 30% 的代碼是在 AI 提示的幫助下生成的。但最重要的指標,也是我們仔細衡量的,是我們如何評估 AI 對公司整體工程開發速度的影響。
計算領域最好的創新往往都來自于范式 IO 的變革,比如從命令行到圖形界面(GUI),再到移動設備上的多點觸控和后來的語音交互。AR(增強現實)是下一個 IO (交互)范式。「Project Astra」項目對于未來的 Android XR 生態至關重要。
我們現在正處于 AJI 階段,即 Artificial Jagged Intelligence(非均衡人工智能)。盡管整體進步顯著,但仍然存在不少不足。到 2030 年我們可能還達不到 AGI,需要更長的時間。
AI 最獨特的核心在于,它能夠遞歸式地自我改進。AI 是第一種能極大地加速「創造」本身的技術,創造新事物、構建新東西,它可以自行改進和實現。它最終產生的影響將遠遠超過我們以前見過的任何技術。
一種說法是,未來內容會極大豐富,有時你會為了效率去消費 AI 生成的內容。但你所珍視的頂級體驗,可能還是源自于人類本質的某種體現。
超 6000 人的「AI 產品市集」社群!不錯過每一款有價值的 AI 應用。
邀請從業者、開發人員和創業者,飛書掃碼加群:
進群后,你有機會得到:
最新、最值得關注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準的AI產品曝光渠道
01
從輸到贏,
Pichai 這一年做了什么
Lex Fridman:去年我們一起散步時,我不記得有沒有談到這個,但我記得在那之后,我看到了幾十篇由分析師和專家撰寫的文章,說 Sundar Pichai 應該下臺。因為當時人們普遍認為,在快速發展的技術格局中,Google 已經明確地輸掉了 AI 競賽,失去了它的魔力。
而現在,一年后,情況變得瘋狂。你展示了過去一年發布的所有產品的圖表,這太不可思議了。就在我們今天談話的時候,Gemini Pro 在許多基準測試和產品上都處于領先地位。帶我回顧一下那段經歷,當所有文章都說你是領導 Google 度過難關的錯誤人選,說 Google 迷失了方向,完蛋了的時候,到今天 Google 再次獲勝。在那段時間里,有哪些低谷時刻?
Sundar Pichai:這里有很多東西可以細說。顯然,我作為 CEO 做出的主要賭注就是確保公司以「AI 優先」的方式處理一切事務,為負責任地發展 AGI 做好準備,并確保我們推出的產品能體現這一點,即對人們非常非常有用的東西。所以,即使在去年那樣的時刻,我對自己內部正在構建的東西也有很好的了解。
我已經做出了許多重要決定,比如將 Brain 和 DeepMind 這樣高水平的團隊整合在一起,成立了 Google DeepMind。還有像我們十年前就決定投資 TPU 這樣的事情,所以我們知道我們正在擴大規模并構建大模型。
我很擅長排除噪音,從噪音中分離信號。管理 Google,就像執教巴塞羅那或皇家馬德里一樣,總會有賽季不佳的時候。所以有這方面的原因。你要能排除噪音,同時留意信號。從噪音中分離信號很重要。有時外面會有優秀的人提出很好的觀點,所以你想聽取,想吸取那些反饋。但你必須專注于內部所做的一系列重大決策。
作為領導者,你要做很多決定,大部分其實是例行性事務,推動日常運營,但隨著時間的推移,你發現日常做的大多數決定并不重要,你做它們只是為了讓事情繼續運轉。但你必須做出少數幾個關鍵的、有深遠影響的決定。我們已經組建了正確的團隊,有了正確的領導者,我們擁有世界一流的研究人員,我們正在訓練 Gemini。
內部有一些因素,是外部人士可能沒有意識到的。比如,TPU 很了不起,但我們也需要擴大 TPU 的規模,這需要時間來實際擴展以獲得所需的計算能力。但我能從內部看到我們所處的發展軌跡,我對公司未來的可能性感到非常興奮。對我來說,那一刻感覺是我們公司未來最大的機遇之一。未來十年、二十年的機遇空間比過去發生的一切都要大。我認為我們比世界上大多數公司都更有能力去實現那個愿景。
Lex Fridman:你確實做出了一些重大而果斷的決定,比如你提到的合并 DeepMind 和 Google Brain。也許是我的看法,僅僅是基于對人性的了解,我確信這其中涉及了很多個人意志和自尊,合并團隊是非常困難的,而且我肯定你做出了一些艱難的決定。你能帶我了解一下你思考這個問題的過程嗎?你是如何下定決心并做出那個決定的?其中有哪些痛苦的時刻?
Sundar Pichai:我們很幸運擁有兩支世界級的團隊,但你說得對,這就像有人來告訴你,把斯坦福和麻省理工合在一起,創建一個頂尖的系,說起來容易做起來難。但我們很幸運,這兩支團隊都很了不起,各有優勢,運營方式也截然不同。Brain 當時有很多多樣化的項目,自下而上,從中誕生了許多重要的研究突破。而 DeepMind 當時對于如何構建 AGI 有著清晰的愿景,他們在追求自己的方向。但幸運的是,在那些時刻,Jeff 表達了想回歸更偏向科學的個人貢獻者角色的愿望,他覺得管理工作占用了他太多時間。而 Demis 自然而然地,他當時在運營 DeepMind,成為了一個自然的人選。
但你說得對,我們花了一段時間才把團隊整合起來。這要歸功于 Demis、Jeff、Koray 以及所有在那里的優秀人才。他們非常努力地工作,在組建那個新團隊時,結合了兩個團隊的精華。在整合的過程中,確實有過一些不眠之夜。我們很有耐心地處理這件事,以確保它能長期良好地運作。
Lex Fridman:在那段時期,無論是合并團隊還是應對外界的噪音,有沒有過讓你感到挫敗感爆棚的時候?
Sundar Pichai:也許有,你說得對。在某種程度上,確實有一段時間我們都在全力以赴。當你在戰壕里滿懷激情地工作時,總會有意見不合、爭論的日子。但所有這些,都只是高強度工作過程中的一部分。歸根結底,我們所有人做我們正在做的事情,都是因為它可能產生的影響,我們被此所激勵。
對我們許多人來說,這是一段長期的旅程,所以它一直非常激動人心。積極的時刻遠遠超過了那些充滿壓力的時刻。就在今年年初,我有幸在兩天內接連慶祝了 Geoff Hinton 獲得諾貝爾獎,第二天又慶祝了 Demis 和 John Jumper 獲得諾貝爾獎。當你和這樣的人一起工作時,所有的一切都非常鼓舞人心。
Lex Fridman:有沒有過那種情況,你必須堅定立場,也許是用更少的話語,或者直接說:「我是 CEO,我們就這么做」?
Sundar Pichai:回到我之前提到的那些有深遠影響的決定,有些決定你做出后,人們可能會激烈地反對,但到某個時候,你做出了一個明確的決定,然后就要求大家去執行。
你可以不同意,但現在是時候「求同存異,付諸行動」(disagree and commit),這樣我們才能繼續前進。至于這算不算「堅定立場」,這是我們所有人都必須做的自然而然的一部分。我認為你可以平靜而又非常堅定地做出決定,如果你能清晰地做出決定,隨著時間的推移,人們實際上會尊重這一點。
我發現在做這類決定的會議上,聽取每個人的意見非常有效。有時你聽到的東西實際上會影響你的思考方式,你會反復斟酌并做出決定。有時你有一個明確的信念,你就會說出來,比如「看,這是我的感受,這是我的信念」,然后你就下注,繼續前進。
Lex Fridman:有沒有類似這樣的重大決策?我猜合并團隊就是其中之一。
Sundar Pichai:我認為合并團隊是當時我們能為公司做出的最關鍵決策之一。還有很多其他的事情,比如我們成立了一個 AI 基礎設施團隊,擴大我們所需的計算能力。
我們還讓不同地區的人物理上聚集在一起,比如讓 DeepMind 團隊留在倫敦,而我們在山景城的團隊則聚在 Gradient Canopy 辦公大樓,那是 Google DeepMind 的總部。我每周都例行去幾次,那里聚集著我們最頂尖的研究人員,他們正在訓練模型,Sergey 也經常在他們中間,關注最新的模型進展、查看損失曲線等。我認為,讓團隊重新凝聚起來,帶著活力,這種文化部分最終也發揮了重要作用。
02
搜索和廣告,
未來都會遷移切到 AI 模式
Lex Fridman:Google 搜索可以說是互聯網的門戶。那個極簡的頁面,上面只有十個藍色鏈接,已經成為一種傳奇。當人們想到互聯網時,他們就會想到那個頁面,而現在你們開始改變它了:AI 模式(AI Mode)作為一個獨立的標簽頁,然后又將 AI 集成到搜索結果中,我猜在你們的會議上,一定引發了不少爭論吧?
Sundar Pichai:在某種程度上,當移動時代開始,人們希望得到更多問題的答案,所以我們其實一直在不斷地演進。但你說得對,在這個時刻,由于底層技術變得更加強大,這種變化變得更加顯著。AI 可以提供大量的上下文信息,但我們一個重要的設計目標是,當你來到 Google 搜索時,你會得到極其豐富的上下文,但你最終還是會去網絡上發現很多東西。無論是在 AI 模式下,還是在 AI 概覽(AI overviews)中,這一核心原則始終不變。
回到我們之前的對話,我們仍然提供傳統的網頁鏈接,但 AI 成為了一個輔助層,它能夠整合上下文和摘要。在 AI 模式下,你甚至可以通過對話方式一步步探索信息,但整個過程依然圍繞著「讓用戶更好地了解世界」。所以我們在原則上并沒有背離搜索的初衷。我們在搜索中部署了最強的模型,這些模型會圍繞每一個查詢執行多路徑檢索,并整合信息,最終把你引向真正有價值的內容。這是我們對搜索未來的思考方式。
Lex Fridman:我有機會聽了 Elizabeth Reid (Liz) 的一些講解,有兩點讓我印象深刻。一點是「查詢扇出」(query fan-out),我之前都沒想過,就是它能為你整合網絡上的大量信息,這非常強大。它提供了上下文,讓你能決定接下來要訪問哪個頁面。另一點非常重要,是生產力的飛躍。
你可能不太了解的一點是,AI 模式特別有助于非英語用戶,在搜索信息時也能將英文網頁內容納入推理過程。當然,你可以用翻譯工具閱讀頁面內容沒錯,但在信息檢索的早期階段,這種語言能力才是真正的「能力解鎖」。如果你設身處地去體會世界上大多數非英語用戶的處境,就會發現他們在互聯網上能獲取的內容范圍其實小得多。而現在,借助像 Gemini 這樣的模型,這個障礙在逐漸消失。
Sundar Pichai:是的。Gemini 的多模態能力、翻譯能力、推理能力,正在融入到搜索流程中,深度嵌入至產品中。特別是 AI 概覽(AI overviews)功能,我們看到產品變得好多了,用戶反饋也非常積極。從多個指標來看,它確實推動了產品的增長。同時,我們一直在測試 AI 模式,現在已經有數百萬人用上了,早期的指標非常鼓舞人心。所以,我對搜索的下一個篇章感到興奮。
Lex Fridman:對于不了解當前搜索變化的人來說,可以這樣理解:現在的模式是在十個藍色鏈接的頂部有一個 AI 概覽,它提供了一個很好的摘要,你也可以展開查看更多信息。
Sundar Pichai:是的,而且現在摘要里還嵌入了來源和鏈接。
Lex Fridman:我記得 Liz 曾經提到過,AI 概覽里其實也包含廣告。我倒是沒注意到。AI 模式目前好像沒有廣告。Sundar,你覺得什么時候會在 AI 模式中加入廣告?畢竟,廣告讓我們可以免費使用大量服務,廣告不僅提供收入,也在理想情況下提供了相關信息,而且形式優雅、不打擾。你覺得未來 AI 模式里,廣告會以怎樣的方式出現?
Sundar Pichai:有兩點。在 AI 模式的早期階段,我們顯然會更專注于原生的體驗,以確保我們把它做對。我認為廣告的價值在于它支撐起了服務的大規模部署,能服務數十億用戶。
其次,我們一直認真對待廣告的原因是,我們視廣告為商業信息,但它仍然是一種信息。所以我們用同樣的質量標準來衡量它。對于 AI 模式,我認為 AI 本身將幫助我們找到最自然、最優雅的方式來呈現廣告。AI 提供豐富的上下文,因此也能解釋清楚,「這里有一條商業信息」。這就像你主持播客時在特定時段插入廣告,找到最契合節奏的方式一樣。這種做法未來也許會遷移到 AI 模式中。
不過,我們會重新思考廣告的形式。你已經看到我們在 YouTube 上現在采用了訂閱和廣告混合的模式。顯然,現在我們的多個產品線也都在引入訂閱機制,因此整個商業模型的平衡點也會發生變化。
Lex Fridman:在未來某個時間點,AI模式可能會完全取代現在的「十個藍色鏈接+AI 概覽」這種組合形式嗎?
Sundar Pichai:我們目前的計劃是,AI 模式將作為一個獨立的標簽頁存在,供那些真正想體驗的用戶使用,但它目前還沒有達到我們主搜索頁面的水平。但隨著功能的成熟,我們會繼續將它遷移到主頁面上,所以你可以把它看作一個連續統一體:AI 模式會為你提供最前沿的體驗,而其中驗證有效的部分會流入 AI 概覽與主搜索體驗中。
Lex Fridman:而 AI 模式依然會把用戶引導到人類創作的網站內容上,這一理念還會保留嗎?
Sundar Pichai:是的,這將是我們的一個核心設計原則。
Lex Fridman:所以最終還是由用戶決定,對吧?他們來驅動這一切。
Sundar Pichai:是的。
Lex Fridman:這很令人興奮。但也有點嚇人,因為它可能會改變互聯網,因為 Google 一直以來都以一種非常特定的外觀和理念主導著互聯網的樣貌。當你轉向 AI 模式時,那是一種完全不同的體驗。我想 Liz 談到過,你也提到過,你會問更多的問題,問更長的問題。
Sundar Pichai:是的,而且是完全不同類型的問題。
Lex Fridman:確實如此,它甚至激發了我的好奇心。我會不斷向這個「黑盒」一樣的系統提出問題。AI概覽也很有趣,因為我依然重視人類內容,最終我還是會回到那些由人類創作的網頁。但就像你說的,AI 提供的上下文實在太有幫助了。
Sundar Pichai:它幫助我們提供更高質量的引薦,人們更容易找到他們真正想要的信息。他們在探索,他們充滿好奇,他們的意圖得到了更好的滿足。從各項用戶指標來看,我們都看到了正向變化。
Lex Fridman:你之前還有 Dennis 都提到,未來的網絡會有一部分專門為AIagents 服務。我們可以把互聯網分為兩個層次:一個面向人類,另一個面向 Agent。你覺得未來為 Agent 構建的那一層會持續擴張嗎?五到十年后,為人類創作的網頁還會有意義嗎?還是最終一切都由 Agent 掌控?
Sundar Pichai:就像今天,不是所有人都在線購物,有些人還是喜歡去商店里走走、挑選商品,享受那個過程。但與此同時,你也在用外賣或電商平臺。所以這兩種體驗是并行存在的。網站設計也會因人類使用而變得更友好——AI 實際上可能會幫助網站變得「更適合人類」。
所以我期望網絡會變得更豐富、更有趣、更好用。同時,我認為也會有一個「Agent 網絡」出現,但要讓它良性發展,就需要建立清晰的商業價值體系與激勵機制,讓更多人愿意參與其中。
但我認為兩者會共存。當然,AI Agent 不需要像人類那樣的 UI 和交互設計范式。
03
Less Structure,
More Intelligence
Lex Fridman:早期版本的 Gemini 在回答某些問題上有點過于謹慎。但我很高興地發現,Gemini 1.5 Pro 變得不那么謹慎了。我最近研究成吉思汗、阿茲特克人以及兩次世界大戰,那段歷史充滿暴力。早期 Gemini 會表現出一種「你確定要了解這些嗎」的感覺,而現在它非常實事求是、客觀,能夠深入、細致地談論人類歷史上艱難的部分,這真的很好。
但我想 Google 必須把握好一個度,如何在大規模上應對各種奇怪查詢,這也是一個工程挑戰。你能談談這個挑戰嗎?如何讓 Gemini 在說一些「瘋狂」的東西的同時,又不會太過火?
Sundar Pichai:我認為這里一個很好的見解是,隨著模型變得越來越強大,它們實際上非常擅長處理這類事情。所以在某種程度上,也許一年前,模型還沒有完全到位,所以它們會更頻繁地犯一些愚蠢的錯誤。因此,你試圖處理那些邊緣案例,但你在處理這些邊緣案例時又會犯錯,導致問題疊加。但我們特別發現,對于 1.5 版本,一旦模型的智能和復雜性超過某個水平,它們就能夠很好地對這些微妙的問題進行推理。
我覺得用戶其實是希望能盡可能接近「原始模型」的,他們希望看到模型真正的能力和判斷力。未來,我們也應該讓用戶能更多地自定義提示、進行實驗等等,這也是我們持續探索的方向。
我們想要思考的第一性原理是,不是靠人為地堆規則,而是從科學角度去構建模型的推理能力——比如處理數學、物理、歷史這類話題時,要確保模型的理解和推理邏輯是扎實的。這才是構建 AI 系統的正確方式,而不是讓一小部分人硬編碼一些東西在上面。我認為這是我們一直在采取的方向,你會看到我們繼續朝這個方向努力。
Lex Fridman:我做了一堆筆記,然后把它們交給 Gemini 說:「你能不能根據這些筆記,再問一個我沒想到的問題?」結果它真的提出了一個很特別的問題——「你曾說過,Gemini 每月處理 480 萬億個 token。那么,在這片信息海洋中,是否存在一句由五個詞組成、足以改變人生的話?」這問題是 Gemini 問的,挺哲學的。
雖然我知道你不可能真的回答這個問題,但它讓我意識到,這些 token 的背后,其實是一個個小小的「頓悟」時刻。人們通過好奇心發問,然后發現某些東西,有可能就此改變人生。
Sundar Pichai:是的,很多年前,我剛接觸搜索的時候就有類似的感受。在過去的 12 個月里,我們每月處理的 token 量增長了 50 倍。
Lex Fridman:順便問一下,那個 480 萬億的數字準確嗎?
Sundar Pichai:是的,是準確的。我很高興它算對了。12 個月前,這個數字是每月 9.7 萬億個 token。現在已經增長到 480 萬億,這是 50 倍的增長。人類的好奇心是無限的。我認為現在就是這樣一個時刻,雖然今天還沒到,但也許有一天,會有一個五個詞的短語,說出宇宙的真相或某些非常有意義的東西,但我覺得我們還沒到那一步。
04
Scaling Laws 仍然有效,
算力依然受限
Lex Fridman:你認為規模法則(scaling laws)在預訓練和后訓練階段是否依然有效?換句話說,AI的進步會不會在某個階段遭遇瓶頸?
Sundar Pichai:這是我們偶爾會在公司茶水間常聊的話題,比如 Demis 來訪時,或者當 Demis、Koray、Jeff、Norm、Sergey 這些人聚在一起時,我們就會聊這個。我們的共識是,前方還有很大的提升空間。我們一直在優化和改進所有方面:預訓練、后訓練、測試時計算、工具使用,以及隨著時間的推移,讓這些模型更具「Agentic」。我們的目標是朝著更通用的「世界模型」方向發展。
比如 Veo 3 在物理理解上比 Veo 1 就有了顯著提升。幾乎所有維度上都在進步,而我們也認為,還有更多空間可挖掘。更重要的是,我很幸運能和這個星球上一些最優秀的研究人員一起工作,他們也認為這里還有更多的發展空間。所以我認為我們未來的發展軌跡會非常激動人心。很難說具體會怎樣,但每年我都會問自己:如果我們在明年投入 10 倍算力,是否會看到明顯進展?目前看來,答案是肯定的。我對未來一年的進展抱有很大信心。
Lex Fridman:你有沒有感受到某些方面的限制,比如算力、數據或研究上的瓶頸?還是說現在一切都在順利推進?
Sundar Pichai:我認為在某種意義上是受算力限制的。我們之所以推出 Flash、Nano Flash 和 Pro 模型,而沒有推出 Ultra 模型,部分原因就在于此。
Pro 模型的能力大約可以達到 Ultra 模型的 80%-90%,但速度更快、使用成本更低。而 Ultra 雖然更強,但推理速度慢、服務成本高。
所以我們的方法是,在下一代產品中,讓 Pro 模型達到上一代 Ultra 的水平,同時又能以快速、易用的方式提供服務。所以我確實認為 Scaling laws 是有效的,但在任何一個時間點,我們最常使用的模型可能都比我們能提供的最強能力落后幾個月,因為最強的那個版本不會是最快、最容易使用的。
Lex Fridman:是的,而且在智能方面,衡量「性能」也變得越來越難。就像你們的 Gemini Flash,雖然比 Pro 更輕量,但因為延遲極低、反應非常快,它在很多實際場景下的「影響力」甚至更大。
有時候,低延遲比「更聰明」更重要,尤其當智能水平差距不大的時候。而 Flash 本身也已經足夠聰明了。所以衡量模型能力,已經不能只靠傳統的基準測試,而是要看它在現實世界里的影響力、實用性和效果。
05
AI 編程
讓谷歌的工程效率提效 10%
Lex Fridman:我得問你一個關于編程的問題。AI 在編程方面正變得非常出色。Gemini,無論是作為Agent還是作為大型語言模型,表現都令人驚艷。所以很多程序員非常擔心他們會失去工作。你覺得他們該有多擔心?如何適應一個 AI 編寫大量代碼的新世界?
Sundar Pichai:我認為有幾點。以 Google 為例,我們給出了各種統計數據,大約 30% 的代碼是在 AI 提示的幫助下生成的。但最重要的指標,也是我們仔細衡量的,是我們如何評估 AI 對公司整體工程開發速度的影響。雖然這很難衡量,但我們嚴格地嘗試去衡量它,結論是目前我們整體的工程效率提升了大約 10%。
在整個公司層面上,10% 的開發效率提升已經非常顯著了。而且我們計劃明年招聘更多的工程師,因為我們能做的事情的機會空間也在擴大。
所以我認為,至少在短期到中期,對于許多工程師來說,AI 會釋放出更多時間和精力——哪怕是在編碼領域,也總有一些部分是枯燥的,比如重復性的工作。相比之下,架構設計、系統構建、問題求解,這些才是更有趣的部分。AI 的加入,能夠把繁瑣的部分自動化,讓你有更多時間去專注于創造性工作、解決復雜問題,以及和同事們集思廣益。
其次,我認為 AI 能讓創造力的門檻降低,讓更多人都能參與進來。這意味著會有更多的工程師做更多的事情。所以 AI 會不會取代人類,很難完全預測。但總的來說,目前,人們會采納這些 AI 工具,成為更好的程序員。至少從我們在 Google 的觀察來看,現在的趨勢整體是積極的。
Lex Fridman:確實。我聽說一些非常優秀的程序員已經能生成大量代碼,雖然他們不一定用得上全部代碼,還是需要很多編輯,但就算對我這種把編程當副業的人來說,我也感覺自己的生產效率提高了五倍。我想,對于像 Google 這樣擁有龐大代碼庫的公司來說,未來的生產力應該會有更大提升。
Sundar Pichai:最大的突破,會出現在我們讓「AI Agent」能力更強的那一刻。我認為,那將開啟下一波真正的飛躍。別看只是 10%,但當你有成千上萬名工程師時,10% 就是一個驚人的數字。人們常提到「AI 編寫了多少比例的代碼」,但我更關注的是實際的生產力。這是兩個完全不同的維度,而后者才是更重要的衡量標準。但我相信效率還會繼續提升。沒有哪個工程師在效率翻倍后會就此止步,相反,他們會去創造更多有價值的東西,從而在工作中獲得更深的滿足感。
Lex Fridman:是的,還有很多方面會隨之改變。比如 Google 的代碼庫本身也可能變得更標準化,更易于理解和維護。AI 能在這方面發揮很大作用,幫助工程師在整個代碼庫中快速理解上下文,也會進一步增強 AI 自身對代碼的理解。
我一直在大量使用 Cursor 作為一種用 Gemini 和其他模型編程的方式。它強大的地方之一是它能感知整個代碼庫,這讓你能向它提問。它允許 Agent 以一種非常強大的方式在代碼庫中「自由穿行」。我的意思是,這是一個巨大的突破。
Sundar Pichai:是的沒錯。比如說做代碼遷移、重構老舊代碼庫等。一旦我們能以一種比今天更好、更穩健的方式完成所有這些工作,就會帶來巨大價值。
Lex Fridman:重構,是的。最終,我猜所有程序都將用JavaScript寫,然后在 Chrome 里運行。說到這個,Google 以對工程師面試嚴格著稱,尤其是白板面試非常有名。在AI時代,這種面試方式會發生變化嗎?我猜白板上是不能用 AI 提示的吧?
Sundar Pichai:這是一個很好的問題。我們正在確保至少為人們引入一輪現場面試,只是為了確保基礎知識扎實。我認為這最終會很重要,但這也是一項同等重要的技能。如果你能利用這些工具生成更好的代碼,我認為這是一種資產。所以總的來說,我認為 AI 的出現對于工程師來說是一個巨大的積極因素。
Lex Fridman:那對于那些對編程感興趣,但不是全職從業者的人,或者我們說「氛圍編程」(vibe coding)愛好者,你是否還建議他們去接受傳統的計算機科學教育呢?
Sundar Pichai:我會建議的。如果你對計算機科學有熱情,那就值得去學習。計算機科學遠不止編程,它更多的是一種對系統性思維和底層邏輯的訓練。所以我不認為 AI 會改變學習這些東西的價值。而且,AI 的影響是跨領域的,它正在影響所有行業。未來具體會如何變化,現在很難預測。但任何能夠訓練你「第一性原理」思維能力的教育,我認為都是非常值得的。
06
AR 是下一個重要的 IO 范式
Lex Fridman:你和團隊改變了很多行業,其中 Android 系統更是顛覆性的。它的未來會是什么樣?會更加以 AI 為中心嗎?尤其是在加入了支持 AR 和 VR 的 Android XR 之后。
Sundar Pichai:計算領域最好的創新往往都來自于范式 IO 的變革。比如從命令行到圖形界面(GUI),再到移動設備上的多點觸控和后來的語音交互。我認為,AR(增強現實)就是下一個 IO(交互)范式。
之前它一直受兩方面制約。一方面,制造好的 AR 設備的系統集成挑戰非常非常大;另一方面,你需要 AI 的輔助。否則,傳統的輸入輸出方式太復雜,無法為 AR 提供自然無縫的交互體驗。因此,AI 變得至關重要,這也是為什么「Project Astra」項目對于未來的 Android XR 生態如此關鍵。
我相信,當你戴上 AR 眼鏡時,你會驚訝于它的實用性。所以,我認為這對 Android 來說是一個真正的機會。XR 是一種讓它真正實現的方式,但同時,它也給了我們一個重新思考移動操作系統的機會。我們一直生活在應用程序和快捷方式的范式中,所有這些都不會消失。
但同樣,如果你想在操作系統層面完成一些事情,它需要更具「Agentic」,這樣你就可以描述你想做什么,或者它能主動理解你試圖做什么,從你一遍又一遍的做事方式中學習,并不斷實現個性化。這正是我們需要解鎖的潛力。
Lex Fridman:我體驗過那款 AR 眼鏡的原型,非常驚艷。那種毫無延遲、信息呈現恰到好處的流暢感,背后一定是在操作系統層面解決了很多難題,才能讓AI如此無縫地整合進來吧?
Sundar Pichai:這是一個很好的登月項目,你知道嗎?
Lex Fridman:是的,這太瘋狂了。
Sundar Pichai:我喜歡這個挑戰。而且我相信,相比其他「登月項目」,我們離現實更近。我們預計今年晚些時候能將眼鏡交到開發者手中,明年交到消費者手中。所以這是一個激動人心的時刻。
07
自動駕駛最困難的部分
在于最后的 20%
Lex Fridman:Waymo 是我見過最瘋狂、最具遠見的登月項目之一。十多年前,當我第一次看到一輛 Waymo 車輛,也就是 Google 的自動駕駛汽車時,對我來說,那是一個關于機器人的「頓悟」時刻。它讓我比以前更愛機器人技術,讓我窺見了未來的一角。同時,恭喜你們完成了 1000 萬次付費的機器人出租車(Robotaxi)服務。你從這個長期項目中獲得了哪些重要的教訓?
Sundar Pichai:我對 Waymo 的進展感到無比自豪。自動駕駛的挑戰在于最后的 20%,它比前面 80% 更難、更耗時。我認為我們當時確實在 Waymo 上經歷了那個階段,我意識到了這一點,但我們知道正處于那個階段。
我們知道,盡管當時有很多其他自動駕駛公司,且技術差距是存在的。在別人質疑 Waymo 的那一刻,我反而做出了更多投資 Waymo 的決定。所以在某種程度上,這有點反直覺。但我認為,我們一直是一家深耕技術的公司,而Waymo 就是構建一個能良好工作的AI機器人的一個版本,所以我們會被這類問題所吸引。那里的團隊水平非常高,都是現象級的團隊。
我們始終將宏偉目標和安全性放在同等重要的位置,對兩者都同等投入并努力推進。今年,我們確實擴大了很多規模,并且在 2026 年會繼續擴大。
Lex Fridman:特斯拉也在推進 Robotaxi 項目。你怎么看待他們的進展?你喜歡這種技術上的競爭嗎?
Sundar Pichai:我們其實是 SpaceX 的早期投資者,對他們一直都很支持。我認為,我們不直接與特斯拉競爭。我們不生產汽車,而是專注于開發通用的 L4/L5 自動駕駛系統。
我一直默認埃隆無論做什么都會成功,所以我對此毫不懷疑。這個領域足夠廣闊,我看到的是一個巨大的藍海市場,特斯拉會做得很好,Waymo 也會做得很好。
Lex Fridman:其實 Waymo 本質上就是一個「有四個輪子的機器人」。你認為,未來下一個機器人領域的突破會在哪里發生?
Sundar Pichai:Demis 和 Google DeepMind 團隊非常專注于 Gemini 機器人技術。我們正在開發基礎模型,也在這方面投入了大量資金,我認為我們的研究也處于相當前沿的水平。我們在思考和布局機器人的應用,目前正在與一些公司合作,這是一個值得期待的領域。
我們還沒有完全向外界闡述我們的計劃,我認為 AI 最終會推動機器人的巨大進步。這個領域已經被耽擱了一段時間。硬件已經取得了非凡的進步,軟件一直是挑戰。基礎模型的出現給機器人領域帶來了突破的可能性。
08
我們正處于非均衡人工智能階段
Lex Fridman:很多人在討論 AGI(通用人工智能)或 ASI(超級人工智能)的到來時間。AGI 的寬泛定義是在人類追求的許多主要領域達到專家水平,而 ASI 是指在這些領域中遠超人類智能的階段,可能是通過 AGI 的自我改進演化而來。你覺得我們什么時候能擁有 AGI?2030 年有希望嗎?
Sundar Pichai:我們應該再加一個術語,雖然我不知道最早是誰提的,也許是 Karpathy,叫做 AJI——Artificial Jagged Intelligence(非均衡人工智能)。
你聽說過這個說法嗎?有時候這確實是個很貼切的描述。我們看到模型在某些方面取得巨大突破,但同時它們還會犯很低級的錯誤,比如搞錯數字,或者數不清「strawberry」里有幾個「r」——這類問題大多數模型仍然搞不定。
所以我覺得,我們現在正處于 AJI 階段,盡管整體進步顯著,但仍然存在不少不足。不過,如果你的問題是:到 2030 年我們能否實現 AGI?這就要看你怎么定義 AGI 了。我們其實一直在不斷重新定義它的邊界。比如我在舊金山街頭坐上一輛 Waymo,車子在人群中穿梭,有時候似乎還有點「不耐煩」,努力尋找出路;或者你在使用 Gemini Live 的 Astra,向它提問世界上的各種問題,那些時刻你會覺得:「這不就是 AGI 的影子嗎?」
你能看到一些端倪,所以我用 AJI 這個詞,但同時也很清楚,顯然我們離 AGI 還很遠。因此,我喜歡用「AJI」這個詞來描述現在的狀態,因為它反映出這種非對稱的智能表現。
至于你的問題,我還是想回答一下。我的判斷是,到 2030 年我們可能還達不到 AGI,那需要更長一點的時間。當然,我也不覺得「是否達到 AGI」這個定義本身那么重要,更重要的是:到 2030 年,我們將在許多維度上取得飛躍式的進步,無論是積極的效應,還是我們必須認真應對的負面影響,這些變化都將是巨大的,我對此深信不疑。
你可能會說,也許到時候 Gemini 會告訴我們,「現在就是 AGI 的時刻」。但在我看來,即便它不能那樣宣布,變化也將是深遠的。我記得 2010 年 DeepMind 初創時,就曾設想 20 年內實現 AGI,如今已過去一大半,那種回望過去的視角本身也很有趣。
比如 2012 年,Jeff Dean 展示了神經網絡能夠識別出貓的照片,那是 Google Brain 的早期成果。到 2014 年,我們收購了 DeepMind。對于我來說,這是一段我們已經談論了十幾年的旅程,我不認為 AGI 會在 2030 年完全實現,更可能再晚一些。
不過我再次強調,重點不在于「定義是否成立」,而是:我們正處于快速演進的階段,也許 AI 到時候已經可以自動生成視頻了。我們作為一個社會,需要有相應的機制來標注和披露這些內容,否則我們如何區分現實和 AI 生成內容?
Lex Fridman:你說得非常有意思。回顧 Google Brain 的早期成果,當時 TensorFlow 還沒開源,連工具都很原始。后來 GitHub 的興起促進了代碼共享,再到 Transformer 的問世,現在是 Diffusion 模型。也許未來又會有一個看似簡單但徹底改變一切的新想法,比如在訓練后期或推理階段的突破。
我記得 shadcn 發過一條推文,說 Google 其實只差一個出色的 UI(用戶界面)就能贏得AI戰爭,這其實也是強調 UI 在整個系統中的重要性。現在我們發布的是LLM模型,但未來的發布可能是完整的系統。在你看來,系統的呈現方式、它如何展示自己給世界,是不是特別重要?
Sundar Pichai:非常重要。有很多簡單的 UI 創新改變了世界,未來幾年我們會看到更多進步,因為 AI 本身就是一個能夠自我改進的系統,UI 也包含在其中。今天,我們在某種程度上還在限制模型的表達能力,讓它們無法通過 UI 真正展示自己。但從理論上講,既然模型本身具備編程能力,它們應該能寫出最適合表達自身思想的界面。
Lex Fridman:這是一個絕妙的想法。API已經開放了,所以你可以創建一個非常好的Agent系統,不斷改進你與AI對話的方式。但說到底,核心問題還是界面本身。而 Google 一直在推動的是那種真正多模態的交互方式。
Sundar Pichai:是的,這些模型是原生多模態的。它們可以輕松接收任何格式的輸入,并生成各種形式的輸出,它們可以設計出優雅的 UI,未來甚至可以理解你的個人偏好。所以這一切都是未來的發展方向。這也回到了我們談話的起點,我認為未來幾年將會有巨大的演變。
Lex Fridman:現在有個挺熱的話題叫做 「P(doom)」(災難概率),即AI導致人類滅絕的可能性。你對這個說法怎么看?你認為它被夸大了嗎?還是說,人類確實存在被 AI 摧毀的風險?
Sundar Pichai:是的,我有想過。我一直對 AI 非常興奮,但同時也一直覺得,對于這項技術,你必須更多地思考其風險。
關于 p(doom) 的問題,這也是我們在茶水間偶爾會談起的話題,這并不奇怪。畢竟這項技術太強大了。也許我們該換個角度思考:當你運營一個大型組織時,如果你能協調好組織的激勵機制,你幾乎可以實現任何事情。如果你能讓所有人都朝著一個目標、以一種使命驅動的方式前進,那簡直無所不能。
但要以這種方式組織全人類是非常困難的。不過我認為,如果 p(doom) 真的很高,到某個時刻,全人類都會團結起來,確保這種情況不會發生。因此,我們實際上會在應對這個問題上取得更多進展。所以諷刺的是,這里面存在一個自我調節的因素。我認為,如果人類集體下定決心去解決一個問題,無論是什么問題,我們都能做到。因此,我對于 p(doom) 的情景持樂觀態度。我認為潛在的風險確實很高,但我對人類能夠奮起迎接那一刻抱有很大的信心。
Lex Fridman:說得非常好。當威脅變得更加具體和真實時,人類確實會團結起來,把事情辦好。另外,我認為人們不常談論的是沒有 AI 的毀滅概率。人類還有很多其他方式可以自我毀滅,而且很有可能,至少我這么認為,AI 會幫助我們變得更聰明,對彼此更友善,更有效率。它將幫助世界上更多地區繁榮發展,減少資源限制,而資源限制往往是軍事沖突和緊張局勢的根源。所以我們也要考慮到這一點,沒有 AI 的 p(doom) 是多少?因為很有可能 AI 將是拯救我們,拯救人類文明免受所有其他威脅的東西。
Sundar Pichai:我同意你的看法,這確實很有啟發性。就像你說的,我覺得要解決一些最棘手的問題,最好有 AI 來幫助你,比如 Pear 一類復雜系統。
09
AGI 到來時,
問的第一個問題是什么?
Lex Fridman:如果有一天,谷歌真的創造出了能回答任何問題的通用人工智能(AGI),你會想和它聊些什么?
Sundar Pichai:這是個很好的問題。也許到那時它已經很主動了,會告訴我一些我應該知道的事情。但如果非要我問它,我想它會幫助我們以一種會讓我們驚訝的方式更好地了解自己。所以也許是這個。你已經看到人們在用產品這么做了,但在 AGI 的背景下,我認為那會非常強大。
Lex Fridman:是在個人層面,還是關于普遍的人性?
Sundar Pichai:個人層面。
Lex Fridman:好的。
Sundar Pichai:所以你和 AGI 交談,我認為它很有可能以一種非常深刻的方式理解你,我認為這是一種可能性。當然,還有一個顯而易見的事情,也許它能幫助我們更好地理解宇宙,以一種拓展我們對世界理解邊界的方式。那將是超級令人興奮的事情。但說實話,我真的不知道。我還沒接觸過那么強大的東西,但我認為這些都是可能性。
Lex Fridman:我認為在個人層面上,問一些關于自己的問題,一系列關于什么讓我快樂的問題,我想我們會非常驚訝地通過一系列問答發現,我們可能會探索一些深刻的真理,就像有時偉大的藝術、偉大的書籍、與愛人的偉大對話向我們揭示的那樣。那些事后看來顯而易見,但在被說出來時卻很美好的東西。
但對我來說,首要問題是,宇宙中有多少外星文明?百分之百。
Sundar Pichai:這會是你的第一個問題?
Lex Fridman:第一個,有多少存活的和已經滅亡的外星文明?可能還有一堆后續問題,比如它們有多近?它們危險嗎?如果沒有外星文明,為什么?或者如果沒有先進的外星文明,但到處都有類似細菌的生命,為什么?阻止它們發展到那個階段的障礙是什么?是不是因為當你變得足夠聰明時,你最終會自我毀滅?因為你需要競爭才能發展出先進的文明,而競爭會導致軍事沖突,沖突最終會殺死所有人。我不知道,我會進行那樣的討論。
Sundar Pichai:給費米悖論找個答案,是吧。
Lex Fridman:正是如此。并且就此進行一場真正的討論。我現在意識到你的答案更具建設性,因為我不確定我會用那些信息做什么。但也許它揭示了 Liz 談到的普遍的人類好奇心,我們都只是非常好奇,而讓世界信息變得可及,能讓我們一部分好奇心得到滿足。有了AI,我們可以變得更好奇,更多地了解世界,了解我們自己。這樣做的時候,我總是在想,不知道你是否能評論,是否有可能衡量,不是我們談到的 GDP 生產力的提升,而是 Google 通過 Google 搜索,以及現在通過 AI 模式和 Gemini,所解鎖的人類知識的廣度和深度。這是一個很難衡量的事情。
Sundar Pichai:很多年前,我記得是麻省理工學院的一項研究,他們估算了 Google 搜索的影響。他們基本上說,這相當于,按人均計算,每年為每個人創造了數千美元的價值。但是,是的,這些東西很難捕捉,對吧?當這些東西出現時,你把它視為理所當然,而前沿在不斷移動。但你如何衡量像 AlphaFold 這樣的東西隨時間推移的價值呢?
Lex Fridman:還有當你學到更多東西時生活質量的提升。我得說,在我用AI完成的一些編程工作中,出于某種原因,我反而對編程更感興趣了。
Sundar Pichai:是的。
Lex Fridman:對于知識也是如此,發現關于世界的事情,會讓你對活著更感興奮。它讓你更好奇,而你越好奇,生活和體驗世界就越有意思。這很難……我不知道這是否讓你更有生產力,可能遠不及它讓你對活著感到快樂的程度。而衡量生活質量的提升是很難的,但其中一些東西確實做到了。
10
放在人類史,
AI 將是比電還要重要的科技發明
Lex Fridman:縱觀人類數萬年的技術創新史,從農業革命到工業革命,再到電力,誕生了無數生產力倍增器。你認為,一千年后,當后人修史時,人工智能(AI)能否位列榜首?
Sundar Pichai:這是個很好的問題。大概在 2017、2018 年左右,我當時說,AI 是人類將要面對的最深刻的技術,它將比火或電更具深遠影響。我現在仍然這么認為。
你問這個問題時,我確實也在思考,我們是否存在「新近度偏誤」(recency bias)?在體育界,人們很容易將當前看到的球員稱為史上最佳。但我從第一性原理出發,依然認為,AI 將比所有那些發明都更重要。當然,我沒有經歷過那些時代。兩年前,我做了一次手術,我當時在想,曾經人們在做這些手術時是沒有麻醉的。那一刻,我覺得麻醉一定是人類有史以來最偉大的發明。我們無法體會生活在那個時代是什么感覺。
你提到的很多東西,比如電力或互聯網,都是普適性的,幾乎影響了所有領域。但我認為,我們見過過一種技術,它既發展得如此之快,能力變得如此強大,以至于其上限都難以估量。
AI 最獨特的核心在于,它能夠遞歸式地自我改進。
事實上,它是第一種能極大地加速「創造」本身的技術。創造新事物、構建新東西,它可以自行改進和實現。我認為這是它最與眾不同的一點。所以,它最終產生的影響將遠遠超過我們以前見過的任何技術。當然,隨之而來的是許多需要我們思考和應對的重要問題,但我對此深信不疑。
Lex Fridman:尤其是當 AI 在自身研究上,展現出超越人類的能力時。它或許有能力日復一日地,以比昨天更高效的方式創造自己。
Sundar Pichai:就像 AlphaGo 研究中的第 37 手棋一樣,AI 能夠進行新穎的、自我導向的研究。當然,在很長一段時間里,我們都希望人類能始終參與其中。這些都是需要討論的復雜問題。但是,當你親眼目睹 AlphaGo 如何從零開始,在一天之內變得比任何人都強時,那種震撼是發自內心的。
即使是像 Veo 3 這樣的模型,如果你在它們完成 30% 和 60% 時分別審視其生成的內容,再對比最終的成品,你會看到這一切是如何融合在一起的。作為人類,我會說這既鼓舞人心,又有點令人不安。我想,這兩種感受都是真實存在的。
Lex Fridman:回顧第一次農業革命,它并不是單一的技術,而是催生了陶器、社會等級、早期政府等一系列連鎖效應的「技術包」。盡管難以預測,但你認為我們今天能看到「AI 技術包」中哪些早期的二階或三階效應?
Sundar Pichai:其實大部分我們今天可能還不知道,但有一點我們現在可以切實看到的是,隨著編程能力的進步,有一點已經可以切實感受到:將你頭腦中的想法轉化為實際存在的東西將變得非常容易。這是「AI 技術包」的一部分,它將賦予幾乎全人類創造和表達的能力。
過去你可能只能用語言表達,未來你可以將想法直接構建成現實。也許今天還不能完全做到,我們還處于「氛圍編程」(vibe coding)的早期階段。但我對人們用 Veo 3 在網上發布的作品感到驚訝。雖然目前還需要一些技巧,比如將一系列提示詞拼接起來,但這一切都將持續進步。我一直在想:在任何特定時刻,AI 都處于它有史以來最差的狀態。
Lex Fridman:你首先想到的是創造力獲取的指數級增長,這很有趣。
Sundar Pichai:無論是編寫軟件、創作內容,還是開發未來的游戲,所有這些創造性活動的門檻都將大大降低。
Lex Fridman:我認為最重要的是它降低了門檻,解鎖了全部 80 億人的認知能力。
Sundar Pichai:我同意。想想 40 年前,也許在美國只有五個人能做你現在做的事情。
想想看,今天通過 YouTube 和其他產品,有多少人在做同樣的事。我認為這就是科技的作用。當互聯網催生了播客,你聽到了更多人的聲音。但有了 AI,我認為這個數字將不再是幾十萬,而是數千萬,甚至可能是十億人,以更深刻的方式向世界展示他們的作品。
Lex Fridman:這種創造力格局的改變,讓許多傳統媒體感到緊張,因為任何人都有可能成為創作者。未來甚至可能出現比人類制作更出色的 AI 播客。創作者必須不斷進化,這雖然帶來了壓力,但也預示著一個激動人心的未來。
Sundar Pichai:但我想說的是,在一個擁有AI的世界里,人類會更加珍視和主動選擇某些東西。就像在國際象棋中,你我絕不會去看 Stockfish 10 和 AlphaGo 兩個 AI 對弈,那對我們來說會很無聊。但馬格努斯·卡爾森和古克什的比賽會更有趣。所以,這很難說。
一種說法是,未來內容會極大豐富,有時你會為了效率去消費AI生成的內容。但你所珍視的頂級體驗,可能還是源自于人類本質的某種體現。比如梅西的運球,也許未來會有機器人的球技遠超梅西,但我不確定它能否在我們心中喚起同樣的情感。這會是一個值得觀察的有趣現象。
Lex Fridman:或許未來,播客中純粹的信息傳遞部分可由AI高效完成,而人類的價值則體現在努力理解、解讀信息并與自身情感結合的過程中。就像 YouTube 改變了媒體一樣,AI 會繼續重塑我們發現、消費和創造信息的方式。
Sundar Pichai:YouTube 成就了無數的創作者,這一點你比任何人都清楚。我毫不懷疑,AI 將成就比以往任何時候都多的電影制作人。我們會賦予更多人力量。所以我認為,AI 的賦能和擴張潛力,其價值被低估了。它將以前所未有的方式釋放人類的創造力。這其中的深遠意義,我們今天還很難完全領會。唯一的類比是,如果你把一個上世紀四五十年代的人帶到今天,讓他看看 YouTube,他一定會被徹底震驚。同理,在未來一二十年里,我們也將被 AI 所開啟的可能性深深震撼。
Lex Fridman:你認為未來多少年后,頂尖的優質內容中可能會有一半是由Veo系列模型生成?
Sundar Pichai:我認為這取決于內容是什么。也許你看看今天的電影,里面大量使用 CGI,但仍然有偉大的電影制作人。你仍然會關注導演是誰,以及他們如何使用這些技術。有些電影制作人根本不用它,而你也珍視這一點。還有些人則運用得令人難以置信。而另一些人,比如詹姆斯·卡梅隆,則能將技術運用到極致。
但我認為會有更多的內容被創造出來。就像今天的作家使用 Google Docs 一樣自然,未來的創作者也會無縫地使用這些 AI 工具的升級版本,對他們來說,這根本不是什么大不了的事。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.