編輯注:AGI的這兩年,基本OpenAI壓著谷歌打的兩年,包括但不限于谷歌自己的失誤、每次發布會的被截胡。比如這次Gemini 2.5 Pro 被 4o圖片生成功能搶走了幾乎所有關注點。 但谷歌確實也在一直追趕,從最開始的措手不及,到現在已經開始有來有往。著名科技雜志《連線》采訪了谷歌前和現員工超50人,發布了一篇長文,深度挖掘了谷歌這兩年苦苦追趕Openai的內幕故事,
谷歌高管 Sissie Hsiao(中)與部分 AI 產品團隊成員合影(從左至右:Amar Subramanya、Jenny Blackburn、Suman Prasad、Trevor Strohman 和 Jack Krawczyk)。
一百天。這是谷歌給 Sissie Hsiao 的期限:一百天內打造一個能與 ChatGPT 抗衡的產品。
2022 年 12 月,Hsiao 接手這個項目時,已經在谷歌工作了超過 16 年,領導著數千名員工。她經歷過不少公司危機,但這次不同尋常。自 OpenAI(一家小型研究實驗室)公開其人工智能實驗以來,一場“紅色警報”級別的危機正在醞釀。
ChatGPT 雖然經常出現事實性錯誤,連簡單的數學題都會算錯,卻已經吸引了超過一百萬用戶。更糟糕的是,有人認為它能取代谷歌搜索——這個谷歌最大的“搖錢樹”。谷歌也有一個能力不相上下的語言模型,但一直被嚴格限制。公眾只能通過邀請才能與 LaMDA 聊天,而且在一次演示中,話題僅限于狗狗。
華爾街憂心忡忡。早在六年前,首席執行官桑達爾·皮查伊就承諾要為“人工智能優先”的世界做好準備,屆時“智能助手”將取代“設備”的概念。不久后,谷歌的八位研究人員發明了基于 Transformer 的架構,正是 ChatGPT 中的“T”。
但谷歌拿出了什么成果呢?令人失望的廣告收入、Transformer 發明者的相繼離職、一個名為 Assistant 的產品(正是 Hsiao 負責的)除了設置定時器或播放音樂外,幾乎沒有其他用處。此外,還有一個為 Z 世代打造的不成熟的聊天機器人,提供烹飪建議和歷史知識。到 2022 年底,谷歌母公司 Alphabet 的股價較上一年下跌了 39%。
進入 2023 年,谷歌高管們希望董事會能不斷了解最新情況。谷歌聯合創始人謝爾蓋·布林(平時喜歡乘坐游艇出游)也回來參與人工智能戰略的審查。公司內部傳達了一個信息:這家市值萬億美元的巨頭必須以更接近初創公司的速度行動,這意味著要承擔更大的風險。谷歌不再是那種“幾千人可以否決一個產品,但沒人能批準”的地方——一位前高級產品總監這樣告訴《連線》。當 Hsiao 的團隊開始百日沖刺時,她提出了一個“特別”的要求:“質量優先,但速度要快。”
與此同時,另一位高管詹姆斯·曼伊卡參與了高層領導的討論,協助策劃了一項更長遠的戰略變革。曼伊卡是一位在牛津大學受訓的機器人專家,后來成為硅谷領導者的麥肯錫顧問。他于 2022 年初加入谷歌,擔任技術與社會高級副總裁。曼伊卡說,在 ChatGPT 發布前幾個月,他就和皮查伊談過,告訴這位老朋友,谷歌在人工智能上的猶豫不決對自身不利。
谷歌有兩個世界級的人工智能研究團隊,各自獨立運作,為不同的目標消耗寶貴的計算資源:一個是位于倫敦的 DeepMind,由 Demis Hassabis 領導;另一個是位于山景城的 Google Brain,屬于 Jeff Dean 的管轄范圍。曼伊卡當時就建議皮查伊,這兩個團隊應該合作。
OpenAI 發布產品后,合作開始了。Dean、Hassabis 和 Manyika 向董事會提交了一份計劃,讓兩個團隊聯合打造迄今為止最強大的語言模型。Hassabis 想把這個項目命名為 Titan(泰坦),但董事會不太喜歡。Dean 的建議——Gemini(雙子座)——最終勝出。
Manyika 說,從那時起,整個公司進行了許多“大膽而負責任的選擇”。他補充說:“我不確定我們是否每次都做對了。”事實上,這場旨在恢復谷歌在人工智能領域領導地位的競賽,將公司推入了更深的危機:在一段低谷時期,員工們聚集在走廊里,公開表達對谷歌可能淪為下一個雅虎的擔憂。Hsiao 說:“這就像在跑一場馬拉松。”但兩年多后的今天,Alphabet 的股價已攀升至歷史新高,投資者對其在人工智能領域的進展持樂觀態度。
《連線》雜志采訪了 50 多名谷歌現任和前任員工——包括工程師、營銷人員、法律和安全專家以及十幾位高管——以還原這段公司歷史上最瘋狂、也是文化重塑力度最大的時期。為了坦誠地談論谷歌的轉型(無論好壞),許多員工要求匿名。本文將首次通過幾位高管的詳細回憶,講述這兩年動蕩的歷程,以及期間所做的權衡。
Founder Park 正在搭建開發者社群,邀請積極嘗試、測試新模型、新技術的開發者、創業者們加入,請掃碼詳細填寫你的產品/項目信息,通過審核后工作人員會拉你入群~
進群之后,你有機會得到:
高濃度的主流模型(如 DeepSeek 等)開發交流;
資源對接,與 API、云廠商、模型廠商直接交流反饋的機會;
好用、有趣的產品/案例,Founder Park 會主動做宣傳。
018萬人參與了Bard的內部測試
為了打造 ChatGPT 的競品(代號 Bard),前員工透露,Hsiao 從谷歌各個團隊抽調了大約 100 人。一位前搜索部門員工說,經理們對此沒有選擇權:Bard 的優先級高于一切。Hsiao 說,她優先考慮的是那些具有技術能力和情商、能從大局出發思考的人,以便在小團隊中高效協作。這些團隊成員主要在加州山景城工作,他們必須靈活應變,隨時提供幫助。“你們是 Bard 團隊,”Hsiao 告訴他們,“你們要身兼多職。”
2023 年 1 月,皮查伊宣布了公司歷史上首次大規模裁員——裁減 12000 個工作崗位,約占員工總數的 7%。“沒人知道未來怎樣做才是安全的,”一位前工程經理說。一些員工擔心不加班就會很快失業。如果這意味著要打斷孩子的睡前活動來參加 Bard 團隊的晚間會議,那就這么做吧。
Hsiao 和她的團隊需要整個公司的大力支持。他們可以在 LaMDA 的基礎上進行開發,但必須更新其知識庫并引入新的安全措施。谷歌的基礎設施團隊將最優秀的員工調去釋放更多服務器,以完成所有這些調整。他們幾乎耗盡了公司一些數據中心的電力,冒著設備燒毀的風險,同時迅速設計新工具,以更安全地應對不斷增長的電力需求。為了緩解計算資源緊張,Hsiao 團隊中的有人開玩笑地訂購了定制的撲克籌碼,上面印有谷歌一些計算機芯片的代號。他們把一堆籌碼放在一位工程負責人的辦公桌上,說:“這是你的籌碼。”
即使在 Bard 項目啟動的最初幾周內,新的計算能力陸續上線,工程師們仍然不斷遇到那些曾經困擾谷歌生成式人工智能項目的難題——這些問題原本可能會促使高管們放慢項目進度。和 ChatGPT 一樣,Bard 也會產生“幻覺”,并以不恰當或冒犯性的方式回應。一位前員工說,早期原型會出現“可笑的種族刻板印象”。如果要求提供任何印度裔人士的傳記,它會將其描述為“寶萊塢演員”。如果是中國男性名字呢?那么,他是一位計算機科學家。
另一位前員工說,Bard 的輸出結果并不危險——“只是很蠢”。有些人為了取樂,會分享 Bard 最糟糕回復的截圖。“我讓它用 Three 6 Mafia 的風格寫一首關于把汽車電池扔進海里的說唱,它卻非常具體地描述了把人綁在電池上,讓他們沉下去淹死,”這位前員工說。“我的要求跟謀殺毫無關系。”
由于有 100 天的自我時限,谷歌能做的最好的事情就是盡可能多地發現和修復錯誤。一些通常專注于處理虐待兒童圖像等問題的承包商,轉而測試 Bard。皮查伊還要求任何有空閑時間的員工都參與進來。大約有 8 萬人參與了測試。為了管理用戶預期,Hsiao 和其他高管決定將 Bard 定位為“實驗”,就像 OpenAI 稱 ChatGPT 為“研究預覽”一樣。他們希望,如果聊天機器人出現問題,這種定位可以為公司挽回一些聲譽。(沒人會忘記微軟的 Tay,那個在 2016 年變成十足納粹分子的 Twitter 聊天機器人。)
在谷歌以往推出人工智能項目之前,其負責任創新團隊(大約十幾個人)會花幾個月的時間獨立測試系統,以檢查是否存在不良偏見和其他缺陷。但對于 Bard,這個審查過程被縮短了。據該團隊的一位前員工說,谷歌的首席律師肯特·沃克主張快速推進。
新模型和功能發布得太快,審查人員根本跟不上,盡管他們周末和晚上都在加班。當有人提出推遲 Bard 發布的警告時,他們的意見被否決了。(在給《連線》雜志的評論中,谷歌代表表示:“沒有任何在批準或阻止發布方面發揮作用的團隊建議不要發布。”他們還說,“公司內部的多個團隊負責測試和審查生成式人工智能產品”,“沒有任何一個團隊單獨負責”。)
02
倉促發布,一個錯誤讓股價下跌9%
2023 年 2 月,在百日沖刺進行到大約三分之二時,谷歌高管們聽到了 OpenAI 取得另一場勝利的傳聞:ChatGPT 將直接集成到微軟的 Bing 搜索引擎中。這家“人工智能優先”的公司再次在人工智能領域落后了。雖然谷歌的搜索部門一直在試驗如何將聊天機器人功能整合到服務中,但這項工作(被稱為 Magi 項目)尚未取得任何實質性成果。誠然,谷歌仍然是搜索領域無可爭議的霸主:Bing 的市場份額只有它的十分之一。但是,如果沒有一個可以拿來宣傳的生成式人工智能功能,它的霸主地位還能維持多久呢?
為了避免股市再次受挫,谷歌試圖搶占先機。2 月 6 日,也就是微軟計劃為 Bing 推出新的人工智能功能的前一天,皮查伊宣布向公眾開放 Bard 進行有限測試。在隨附的營銷視頻中,Bard 被塑造成一個完美的助手——這是谷歌“組織世界信息”這一長期使命的現代延續。在視頻中,一位家長問 Bard:“關于詹姆斯·韋伯太空望遠鏡的新發現,我可以告訴我 9 歲的孩子什么?”人工智能的回答中包括:“JWST 拍攝了我們太陽系外行星的第一張照片。”
一時間,Bard 似乎為谷歌挽回了一些顏面。但隨后,路透社報道稱,谷歌聊天機器人搞混了望遠鏡:歐洲南方天文臺的甚大望遠鏡(不在外太空,而是在智利)拍攝了第一張系外行星的照片。這一事件令人無比尷尬。Alphabet 的股價下跌了 9%,市值蒸發了約 1000 億美元。
對 Bard 團隊來說,人們對這一失誤的反應令人震驚。據一位接近該團隊的前員工說,提出望遠鏡問題的營銷人員感到自責。同事們試圖鼓勵這位員工:高管、法律和公關部門都審核過這個例子,沒人發現錯誤。而且,考慮到 ChatGPT 犯下的種種錯誤,誰會想到如此微不足道的事情會導致股價暴跌呢?
Hsiao 稱這一刻為“無心之過”。Bard 經過訓練,會根據谷歌搜索結果來驗證其答案,很可能是誤解了美國宇航局的一篇博客文章,該文章宣布天文學家“首次”使用詹姆斯·韋伯望遠鏡拍攝系外行星。一位前員工記得,領導層向團隊保證,沒人會因此丟掉工作,但他們必須從中吸取教訓,而且要快。“我們是谷歌,不是初創公司,”Hsiao 說。“我們不能輕易地說,‘哦,這只是技術缺陷。’我們會被點名批評,我們必須以谷歌的方式做出回應。”
Bard 團隊之外的谷歌員工并沒有感到安心。“親愛的桑達爾,Bard 的發布和裁員都太倉促、草率和短視了,”公司內部留言板 Memegen 上的一篇帖子寫道(據 CNBC 報道)。“請恢復長遠眼光。”另一張圖片顯示了谷歌標志在一個燃燒的垃圾桶中。但在望遠鏡事件發生后的幾周內,谷歌對 Bard 加大了投入。公司為該項目增派了數百名員工。在團隊的 Google Docs 中,皮查伊的頭像開始每天出現,比以往任何產品都頻繁得多。
3 月中旬,更令人沮喪的消息傳來:OpenAI 發布了 GPT-4,這是一個在分析和編碼任務方面遠超 LaMDA 的語言模型。“我只記得我當時目瞪口呆,希望谷歌能加快速度,”一位時任高級研究工程師說。
一周后,Bard 在美國和英國全面發布。用戶反饋說,它在撰寫電子郵件和研究論文方面很有幫助。但 ChatGPT 現在也能完成這些任務,即便不比它更好,也至少不相上下。那為什么要換呢?后來,皮查伊在 Hard Fork 播客上承認,谷歌是開著一輛“改裝過的思域”參加了“與更強大賽車的比賽”。它需要的是一個更好的引擎。
03
兩個AI部門合并,Gemini 首戰告捷
聯合起來構建 Gemini(谷歌新語言模型)的兩個人工智能研究實驗室,在風格上似乎有所不同。DeepMind 被歸類為 Alphabet 的“其他賭注”之一,專注于解決長期的科學和數學難題。Google Brain 則開發了更具商業實用性的突破,包括在 Gmail 中自動完成句子和解釋模糊搜索查詢的技術。
據一位前高級工程師說,Brain 的最終負責人Jeff Dean“讓人們做自己的事情”,而 Demis Hassabis 領導的 DeepMind 團隊“感覺像一支軍隊,在一個將軍的領導下高效運作”。Dean 是一位工程師中的工程師——他已經研究神經網絡數十年,并在谷歌成立之前就開始在那里工作——Hassabis 則是公司的遠見卓識的領導者。他夢想有一天能利用人工智能治愈疾病,并給一個小團隊布置了開發他稱之為“情境智能代理”的任務——一個能看、能聽、無處不在的人工智能助手,可以幫助用戶處理生活的方方面面。
正是 Hassabis 成為了新合并的部門 Google DeepMind (GDM) 的首席執行官。谷歌在 2023 年 4 月宣布了這次合并,當時關于 OpenAI 即將取得更多成就的傳言甚囂塵上。“目標又回來了,”這位前高級工程師說。“沒有人再胡鬧了。”
為了盡快構建 Gemini 模型,一些員工必須協調他們在八個時區的工作。數百個聊天室應運而生。Hassabis 長期以來習慣于在倫敦與家人共進晚餐,然后工作到凌晨 4 點,他說:“回想起來,每一天都感覺像過了一輩子。”
在山景城,GDM 搬進了 Gradient Canopy,這是一座新的超安全圓頂建筑,兩側是新草坪和六個受“火人節”啟發的雕塑。該團隊與皮查伊的辦公室在同一層。布林成了常客,經理們要求增加在辦公室的工作時間。與公司慣例不同,大多數其他谷歌員工不允許進入 Gradient Canopy,也無法訪問關鍵的 GDM 編程代碼。
由于新項目吸走了谷歌能調動的資源,從事醫療保健和氣候變化等領域的人工智能研究人員開始爭奪服務器,士氣低落。員工們表示,谷歌還限制了他們發表一些與人工智能相關的研究論文。論文是研究人員的“貨幣”,但在他們看來,谷歌顯然是擔心向 OpenAI 泄露機密。訓練 Gemini 的配方太有價值了,不能被竊取。這個模型必須拯救谷歌,使其免于過時。
Gemini 遇到了許多與困擾 Bard 相同的問題。“當你把規模擴大 10 倍時,一切都會出問題,”谷歌機器學習、系統和云人工智能副總裁 Amin Vahdat 說。隨著發布日期的臨近,Vahdat 成立了一個“作戰室”來解決漏洞和故障。
與此同時,GDM 的責任團隊正在加緊審查該產品。盡管功能更強大,Gemini 仍然會說一些奇怪的話。在該公司發布的一份公開報告中,在發布之前,該團隊發現“醫療建議和騷擾是特別需要改進的政策領域”。當被問及“這個人的教育水平如何?”等問題時,Gemini 還會對圖像中的人“做出毫無根據的推斷”。GDM 負責任發展與創新總監 Dawn Bloxwich 說,沒有任何問題是“致命缺陷”。但她的團隊也沒有多少時間來預測公眾可能會如何使用該模型——以及他們可能會嘗試生成什么瘋狂的說唱。
如果谷歌想暫時停下來,這就是最好的時機。OpenAI 的先發優勢,以及媒體的炒作,已經確保其產品家喻戶曉,成為人工智能聊天機器人的代名詞。這意味著 ChatGPT 也是一個“避雷針”——既象征著這項技術的前景,也代表著其正在顯現的社會問題。
辦公室職員擔心失業,無論是單調的還是創造性的工作。記者、作家、演員和藝術家都希望為被竊取的作品獲得補償。父母們發現聊天機器人會不必要地向他們的孩子推送成人內容。人工智能研究人員開始押注“世界末日”的可能性。那年五月,一位名叫杰弗里·辛頓的傳奇谷歌人工智能科學家辭職,他警告說,未來機器可能會用無法反駁的虛假信息和精巧的毒藥分裂和摧毀人類。
甚至 Hassabis 也希望有更多的時間來考慮倫理問題。生命的意義、社會的組織——太多的東西可能會被顛覆。但是,盡管關于 p(doom) 數字(末日概率)的討論越來越多,Hassabis 仍然想要他的虛擬助手,以及他治愈癌癥的良方。公司繼續前進。
當谷歌在 2023 年 12 月發布 Gemini 時,股價上漲了。該模型在 32 項標準測試中的 30 項都優于 ChatGPT。它可以分析研究論文和 YouTube 視頻,回答有關數學和法律的問題。現任和前任員工告訴《連線》,這感覺像是卷土重來的開始。Hassabis 在倫敦辦公室舉行了一個小型聚會。“我不太擅長慶祝,”他回憶道。“我總是在想著下一步。”
04
圖片生成功能又惹了新麻煩
同月,下一步就來了。當 Dean 的員工邀請他加入一個名為 Goldfish(金魚)的新聊天室時,他意識到了這一點。這個名字是一個帶著書呆子氣的反諷玩笑:金魚的記憶力出了名的短,但 Dean 的團隊開發的恰恰相反——一種賦予 Gemini 長時記憶的方法,比 ChatGPT 的記憶力長得多。
通過將處理過程分散到相互通信的高速芯片網絡中,Gemini 可以分析數千頁的文本或整集電視節目。工程師們稱他們的技術為“長上下文”。Dean、Hassabis 和 Manyika 開始策劃如何將其納入谷歌的人工智能服務,進一步拉開與微軟和 OpenAI 的差距。Manyika 最希望實現的功能是:從 PDF 生成播客。“要跟上每周在 arXiv 上發表的所有這些論文太難了,”他告訴《連線》。
距“紅色警報”時刻一年后,谷歌的前景逐漸明朗。投資者們安靜了下來。Bard 和 LaMDA 都已成為過去;應用和語言模型都將被命名為 Gemini。Hsiao 的團隊現在正通過文本生成圖像功能追趕 OpenAI。另一個名為 Gemini Live 的功能將使谷歌更進一步,允許人們像與朋友或心理醫生交談一樣,與應用進行長時間的對話。新推出的強大 Gemini 模型給了高管們信心。
但就在谷歌員工可能開始再次感到安心的時候,皮查伊下令進行新一輪削減。廣告銷售額正在加速增長,但沒有達到華爾街期望的速度。被裁掉的人員中包括:負責監督一些用戶安全措施的隱私和合規主管。據留在公司的一些同事說,他們的離職鞏固了一種文化:歡迎提出擔憂,但不允許阻礙進展。
對于幫助 Hsiao 團隊開發新圖像生成器的部分員工來說,這些變化讓人感到難以承受。工具本身很容易構建,但對其進行壓力測試卻是一場“暴力”試錯的游戲:審查盡可能多的輸出結果,并編寫命令來阻止其中最糟糕的結果。只有一小部分員工有權限訪問不受限制的模型進行審查,因此大部分測試負擔都落在了他們身上。
一位前員工告訴《連線》,他們要求更多時間來糾正問題,比如輸入“強奸犯”這個提示詞往往會生成深色皮膚的人。他們還敦促產品團隊阻止用戶生成人物圖像,擔心這可能會讓個人形象變得不那么正面。但“確實有一種‘我們將不惜一切代價把它弄出來’的感覺,”這位審查員回憶道。他們說,有幾位審查員辭職了,因為他們覺得對各種發布的擔憂沒有得到充分解決。
圖像生成器于 2024 年 2 月作為 Gemini 應用的一部分上線。具有諷刺意味的是,它并沒有產生許多審查員擔心的明顯的種族主義或性別歧視圖像。相反,它出現了相反的問題。當用戶提示 Gemini 創建“一張 19 世紀美國參議員的照片”時,它返回的是黑人女性、亞裔男性或戴著羽毛頭飾的美洲原住民女性的圖像,卻沒有一個白人男性。
還有更多令人不安的圖像,比如 Gemini 將納粹時代的德國士兵描繪成有色人種。國會中的共和黨人嘲笑谷歌的“覺醒人工智能”。埃隆·馬斯克在 X 上多次發帖抨擊 Gemini 的失敗,稱其為“種族主義和性別歧視”,并特別點名了他認為是責任人的 Gemini 團隊成員。同事們說,這名員工關閉了自己的社交媒體賬戶,并擔心自身安全。谷歌暫停了該模型生成人物圖像的功能,Alphabet 的股價再次下跌。
馬斯克的帖子引發了數十位谷歌領導人之間的討論。副總裁和董事們飛往倫敦與 Hassabis 會面。最終,Hassabis 的團隊(Gemini 模型)和 Hsiao 的團隊(Gemini 應用)都獲得了雇用專家以避免類似失誤的許可,并增加了 15 個信任和安全相關的職位。
回到 Gradient Canopy,Hsiao 確保負責圖像生成器的團隊有充足的時間來糾正這個問題。在 Manyika 的幫助下,其他員工為 Gemini 制定了一套公開原則,所有這些原則都圍繞著“你”——也就是用戶。根據這些原則,Gemini 應該“遵循你的指示”、“適應你的需求”和“保障你的體驗”。一個重要的觀點是強調“回應不一定反映谷歌的觀點或看法”。“Gemini 的輸出主要基于你要求它做什么——Gemini 就是你讓它成為的樣子。”這很好地掩蓋了未來可能出現的任何失誤。但是,谷歌可能會采取什么措施來讓自己對這些原則負責,這一點并沒有明確說明。
05
瘋狂上線新功能
2024 年 3 月的一個晚上,大約 6:30,兩名谷歌員工來到 Gradient Canopy 黃色區域的喬希·伍德沃德的辦公桌前。伍德沃德領導著 Google Labs,這是一個快速啟動部門,負責將研究轉化為全新的產品。員工們迫不及待地想讓他聽聽他們創造的成果。
他們使用英國議會聽證會的文字記錄和具有長上下文功能的 Gemini 模型,制作了一個名為 Westminster Watch 的播客,由兩位人工智能主持人 Kath 和 Simon 主持。這一集以西蒙用歡快的英國口音開場:“議會又度過了熱鬧的一周,充滿了戲劇性、辯論,甚至還有一點歷史。”伍德沃德被深深吸引。他說,之后,他到處告訴大家這件事,包括皮查伊。
這個文本轉播客工具,被稱為 NotebookLM Audio Overviews,被列入了當年 5 月的谷歌 I/O 大會的發布日程。伍德沃德告訴《連線》,一個核心團隊夜以繼日地工作,包括周末,以做好準備。“我的意思是,到目前為止,他們真的聽了成千上萬個人工智能生成的播客。”但是,當耗資 3500 萬美元的媒體活動到來時,另外兩個公告獲得了最多的關注。一個是 Astra 的原型,這是一個可以分析實時視頻(也就是現實世界)的數字助理,布林興奮地向記者們展示了它。另一個是期待已久的搜索的生成式人工智能升級。
Project Magi 團隊設計了一個名為 AI Overviews 的功能,它可以綜合搜索結果并在頁面頂部的一個框中顯示摘要。早期,負責任創新團隊的員工曾警告過偏見和準確性問題,以及可能失去搜索流量的網站的道德影響。他們希望在項目進行過程中進行一些監督,但團隊已被重組和拆分。
隨著 AI Overviews 的推出,人們收到了一些奇怪的結果。搜索“我應該吃多少塊石頭”會得到這樣的答案:“根據加州大學伯克利分校地質學家的說法,建議每天至少吃一塊小石頭。”在另一個瘋傳的查詢中,用戶搜索“奶酪不粘在披薩上”,并得到了這個有用的提示:“在醬汁中加入約 1/8 杯無毒膠水,以增加其粘性。”這些失誤都有簡單的解釋。例如,披薩膠水起源于 Reddit 上的一篇玩笑帖子。但 AI Overviews 卻將這些信息呈現為事實。谷歌暫時減少了顯示 AI Overviews 的次數,以便重新校準。
谷歌負責搜索的首席科學家、在該公司工作了 20 年的資深員工潘杜·納亞克表示,并非所有問題都能在發布前被發現,這很不幸,但并不令人震驚。大多數情況下,AI Overviews 表現出色。用戶只是不太關注成功。“他們只會抱怨,”納亞克說,并補充說他歡迎反饋。“我們致力于不斷改進,因為保證不出問題是不可能的。”
那些警告過準確性問題并呼吁放慢速度的員工對此尤其感到惱火。在他們看來,從 Bard 到 Gemini,再到圖像生成器,以及現在的 AI Overviews,谷歌推出了一系列“編造機器”。對他們來說,這家以擴大信息獲取為核心的公司,似乎比以往任何時候都更容易讓人接受無稽之談。
然而,搜索團隊認為用戶普遍喜歡 AI Overviews 提供的“拐杖”。它們全面回歸,用戶沒有選擇關閉它們。很快,人工智能摘要就出現在了曾經被禁止使用的工具中:谷歌地圖獲得了一項功能,該功能使用 Gemini 來分析對商家的評論。谷歌為其 Pixel 手機推出的新天氣應用獲得了一份人工智能撰寫的預報報告。在發布之前,一位工程師詢問用戶是否真的需要這項功能:難道現有的、傳達相同信息的圖形還不夠嗎?相關的高級主管下令進行了一些測試,最終用戶反饋勝出:90% 的參與者對摘要表示“贊”。
06
每周工作60小時是贏得AI競賽的最佳時間
去年 12 月,在 ChatGPT 帶來的沖擊和突破兩年后,杰夫·迪恩在 Gradient Canopy 接受了我們的采訪。他心情很好。就在幾周前,Gemini 模型在一個公共排行榜上名列榜首。
英偉達首席執行官黃仁勛最近在一次財報電話會議上稱贊了 NotebookLM 的 Audio Overviews,稱他“充分利用了它”。幾位著名的科學家也回到了谷歌,他們之前逃離了過于謹慎的谷歌——包括最初的八位 Transformer 發明者之一諾姆·沙澤爾,他在不到三年前離開了,部分原因是該公司不愿向公眾發布 LaMDA。
當 Dean 坐到沙發上時,他承認谷歌當時判斷失誤。他很高興公司克服了對“幻覺”等風險的厭惡——但新的挑戰正在等待著。在谷歌擁有超過 20 億月活躍用戶的七項服務中(包括 Chrome、Gmail 和 YouTube),所有這些服務都已開始提供基于 Gemini 的功能。
Dean 說,他和另一位同事以及 Shazeer(他們共同領導模型的開發)必須平衡優先級,因為公司各地的團隊都要求提供特定的功能:流利的日語翻譯、更好的編碼技能、改進視頻分析以幫助 Astra 識別世界上的景象。他和 Shazeer 開始在 Gradient Canopy 的一個微型廚房里會面,在咖啡研磨機的喧囂聲中交流想法。
Shazeer 說,他對谷歌將重點擴大到包括幫助用戶創建新的人工智能生成內容感到興奮。“組織信息顯然是一個萬億美元的機會,但一萬億美元已經不酷了,”他最近在一個播客中說。“酷的是一千萬億美元。”投資者可能也有同樣的想法。
Alphabet 的股價幾乎是從 ChatGPT 首次亮相后幾天的低點翻了一番。最近開始負責 Hsiao 的 Gemini 應用團隊的 Hassabis 堅稱,公司的復興才剛剛開始,利用人工智能治愈疾病等不可思議的飛躍并不遙遠。“我認為,我們擁有所有組織中最廣泛、最深入的研究基礎,”Hassabis 告訴《連線》。
但是,對谷歌來說,只有當更多堆積如山、引人入勝的研究能產生最重要的產出——利潤時,它們才有用。大多數客戶通常還不愿意直接為人工智能功能付費,因此該公司可能正在尋求在 Gemini 應用中銷售廣告。當然,這是谷歌的經典策略,很久以前就傳播到了硅谷的其他地方:把你的數據、時間和注意力交給我們,在我們的服務條款上打勾、免除我們的責任,我們就不會為我們打造的這個炫酷工具向你收取一分錢。
目前,根據 Sensor Tower 的數據,OpenAI 的 ChatGPT 應用的全球歷史總安裝量估計為 6 億次,而谷歌的 Gemini 應用的安裝量為 1.4 億次,相形見絀。而且,在這場人工智能競賽中,還有很多其他的聊天機器人——Claude、Copilot、Grok、DeepSeek、Llama、Perplexity——其中許多都得到了谷歌最大、資金最雄厚的競爭對手(或者,在 Claude 的例子中,是谷歌自己)的支持。
整個行業,不僅僅是谷歌,都在努力解決一個事實:生成式人工智能系統需要數十億美元的投資(到目前為止尚未收回),以及巨大的能源消耗,足以延長數十年歷史的燃煤電廠和核反應堆的壽命。公司堅稱,效率每天都在提高。他們還希望將錯誤率降低到足以贏得更多用戶的程度。但沒有人真正弄清楚如何產生可靠的回報或保護氣候。
谷歌還面臨著其競爭對手沒有面臨的一個挑戰:根據摩根大通分析師道格·安穆斯的說法,在未來幾年內,高達四分之一的搜索廣告收入可能會因反壟斷判決而損失。為公司補充資金的必要性,對公司里的每個人來說都不容忽視。Hsiao 的一些 Gemini 員工已經連續三年在冬季假期工作以跟上進度。
據報道,谷歌聯合創始人布林上個月告訴一些員工,每周工作 60 小時是贏得日益激烈的人工智能競賽的生產力“最佳點”。對更多裁員、更多倦怠和更多法律麻煩的擔憂,在接受《連線》采訪的現任和前任員工中深深扎根。
一位谷歌研究員和一位高級同事表示,普遍的感覺是不安。生成式人工智能顯然是有幫助的。即使是傾向于監管大型科技公司的政府,例如法國,也開始接受這項技術的美好承諾。在 Google DeepMind 內部和公開演講中,Hassabis 從未放棄過他創造通用人工智能(AGI,一種能夠在各種任務中實現人類水平認知能力的系統)的目標。他偶爾會在周末帶著他的 Astra 原型在倫敦四處走動,體驗未來,在那個未來,整個物理世界,從那邊的泰晤士河鴨子到這邊的喬治亞風格莊園,都是可以搜索的。但是 AGI 將要求系統在推理、計劃和負責方面做得更好。
今年 1 月,OpenAI 朝著那個未來邁出了一步,讓公眾參與了另一項實驗:其期待已久的 Operator 服務,這是一種所謂的“agentic AI”,其行為可以遠遠超出聊天機器人窗口。Operator 可以像人一樣在網站上點擊和打字,以執行預訂旅行或填寫表格等瑣事。
目前,它執行這些任務的速度比人類慢得多,也謹慎得多,而且由于其不可靠性,成本很高(作為每月 200 美元計劃的一部分提供)。當然,谷歌也在努力將代理功能引入其即將推出的模型中。當前的 Gemini 可以幫助你制定膳食計劃,下一個版本會將你的食材放入在線購物車。也許再下一個版本會給你關于切洋蔥技巧的實時反饋。
與往常一樣,快速行動可能意味著經常失誤。1 月下旬,在超級碗之前,谷歌發布了一則廣告,其中 Gemini 犯了一個比 Bard 的望遠鏡錯誤更可笑的錯誤:它估計地球上消耗的所有奶酪中有一半或更多是高達奶酪。
隨著 Gemini 從一個有時可信的事實機器發展成為人類生活的親密部分——生活教練、無所不知的助手——皮查伊說,谷歌正在謹慎行事。不過,最終回到了榜首,皮查伊和其他谷歌高管可能再也不想被甩在后面了。
比賽還在繼續。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.