當奧特曼讓OpenAI寧可選擇日活十億的應用,而不是頂尖的大模型時,是不是大模型的歷史已經終結了?
大模型最前沿的對決,將發生在谷歌與OpenAI之間。OpenAI在大模型性能稍稍領先,谷歌在基礎設施與應用生態優勢明顯,雙方都在加速奪取對方陣地控制權。在巨頭這里,AGI的探索人類智能邊界的意義已經褪色,它自己的問題還遠未解決,卻聲稱要準備解決人類的許多問題。
短兵相接的節奏,已經要以天來計。差不多一周時間,谷歌推出了,迭代了一大串多模態模型,又推出了更省算力的思考模型Gemini 2.5 Flash;OpenAI讓ChatGPT記住用戶告訴過它的一切,發布了號稱要淘汰GPT-4.5的GPT-4.1系列,以及會用圖像思考的滿血版o3與o4-mini。好幾次都臉貼臉發布,火藥味濃厚。
如今,在Scale AI打造的“人類最后的考試”(Humanity's Last Exam)中,排在最前列的,只有谷歌與OpenAI的前沿模型,包括這周的o4-mini與Gemini-2.5-Flash。其他能進入前十的,只有Anthropic的Cloude-3.7-Sonnet,以及DeepSeek的R1(僅限文本類排名)。
來源:scale.com,人類最后考試(僅文本)模型評測
如此快節奏的發布,以及逐步趨同的功能,預示著在擴展定律邊際效應減弱后,這個行業的技術路線開始收斂。這個時候,比拼的就是執行力了。員工主觀意愿雖然重要,但是客觀的基礎設施與應用生態,在很大程度上又可以“縮放”主觀意愿的效果。
下一代大模型的預訓練,越來越依賴于團隊對基礎設施的熟悉程度與優化能力。近日,OpenAI公開討論了GPT-4.5的訓練經驗,以及據此對訓練下一代模型的展望。大模型參數規模越大,預訓練數據集越大,硬件故障導致的損失也就越大;而基礎設施的規模增長,也在放大硬件故障的復雜度,計算、存儲、通信、能源,需要系統性考慮;當算力需求超出單集群的供給能力時,就不得不轉向多集群訓練架構,這又是全新的挑戰。。
因此,即使擁有無限的GPU、網絡和電力,也“無法在GPT-4的技術棧上訓練GPT-4.5”。不從基礎設施的起點解決這個問題,GPT-5.5或許就是OpenAI上限。
行業正在進入推理時代。在大模型商品化趨勢明顯的當下,性價比是擴大用戶規模的關鍵之一。對于AI應用來說,用更低的成本提供相近的服務,也是增厚利潤率的來源之一。這就意味著,誰能盡可能地壓榨基礎設施的單位成本的算力,誰的優勢就更明顯。
目前看來,優勢也在谷歌這一邊。盡管在解決編碼問題時,o3以微弱的優勢領先于Gemini 2.5 Pro,但代價是需要用戶付出近20倍的成本。反觀主打小巧高效的o4-mini,與Gemini相比,結果不僅更貴,水平也略低一點。o4-mini所謂的高性價比,是相對OpenAI自身的產品體系而言的,不是相對整個市場而言的,這無疑削弱了它的競爭力。
目前無法完全將其歸因于谷歌的硬件優勢。在算法與產品層面,整個行業也還有不小降本空間。谷歌今天發布的Gemini-2.5-Flash就是如此,開發者可以通過設置預算上下限,來控制模型在思考階段的推理深度;模型也會根據提示的復雜度,自動判斷所需推理量和思考時間。
但最終競爭還是會落到芯片與基礎設施上。半導體分析機構Semianalysis認為谷歌的定制TPU,總擁有成本要低于英偉達的通用GPU。“剖析數據中心,就像是窺探AGI的核心……在AI的軍備競賽中,不同公司(數據中心的)架構差異非常大。”今年2月,該機構的Dylan Patel在X上寫道。當時,谷歌尚未發布專為推理而設計的AI芯片Ironwood,它的能效是上一代的TPU的2倍,Pathways技術可以助其實現高效分布式計算。
OpenAI仍是追趕者,采購英偉達的GPU,租用微軟、甲骨文等的基礎設施,無法最大程度地獲益于芯片與基礎設施優化。去年,它,但是即使一切順利,它與博通合作的定制芯片,也要等到2026年才能啟動規模量產;而且,初代自研芯片達不到成熟水平,無法迅速規模部署,至少經歷三次迭代。亞馬遜的Trainium已經迭代到第二代,,但實際總擁有成本仍然遠不及英偉達。,目前采購的仍是英偉達的Blackwell架構芯片。
時間站在谷歌這一邊。在追趕基礎設施的兩三年時間里,OpenAI的對策是培育更為龐大的應用生態。這不僅關系到規?;儸F,讓自己活著見到那一天,還因為這是提升用戶粘性的有效手段。只有這樣,才能將用戶關于“性價比”的比較,鎖定在自己的產品體系內。無論是豐富軟硬件生態中的蘋果用戶,還是社交媒體網絡效應下的Meta用戶,不會輕易因為價格就離開這個生態。
從去年開始,,為的正是孵化或并購出“一整套圍繞AI打造的生態”,包括新的搜索框與硬件設備。
OpenAI加入了。搜索是生成式AI最有希望的爆款應用之一,也是奧特曼產品矩陣理念中關鍵拼圖。去年初,市場就流傳著出OpenAI要做搜索的消息,媒體還打探到OpenAI正在積極地挖谷歌的員工;7月,SearchGPT正式內測;年底,ChatGPT上線搜索,奧特曼稱這是他自ChatGPT發布兩年以來最喜歡的功能,讓他的使用頻次翻了番。今年,OpenAI進一步將搜索與智能體組合起來,包裝成最高月薪2萬美元的博士級的研究助手。
近日,OpenAI還被傳出正在開發一個類似X的社交網絡項目。在更早一點時間,奧特曼看到Meta計劃為其AI助手添加社交動態時表示,“也許我們會做一個社交應用”;他還在與馬斯克斗嘴的時候反擊,。這都讓傳言變得更具體生動。
智能體是大模型應用落地的確定性路徑。, OpenAI仍然在構筑自己的智能體生態。o3與o4-mini擁有智能體級別的工具使用能力(agentic tool use),相較以往大模型往往是被動執行指令,它們能夠思考何時以及如何使用工具。直播中,OpenAI總裁布洛克曼(Greg Brockman)還提到,o3在解決一個復雜任務時,曾被觀察到連續調用了高達600次工具。1個月前OpenAI還發布了Responses API,將OpenAI模型和內置工具的互動變得更為輕松。
日前,奧特曼在接受Stratechery專訪時聲稱,“一款10億日活的產品,比最頂尖的AI模型更有價值”。OpenAI正在接近這個目標。去年底,OpenAI周活用戶達到3億,今年2月突破4億;在剛過去的TED 2025大會上,奧特曼稱全球10%人口頻繁使用ChatGPT,短短幾周內就實現翻倍。
但這一切,仍然都沒有逃出谷歌的勢力范圍。在今年2月的財報會議上,谷歌稱Gemini已經接入旗下七個擁有超過20億用戶的產品和平臺。在其他產品逐步將搜索作為AI對話框的其中一項功能后,谷歌一方面繼續用AI增強搜索,AI 概覽覆蓋了10億月活用戶,超過2億部安卓手機可以使用“畫圈即搜索”的AI功能;另一方面,去年底率先推出Deep Research功能,讓它幾乎成為行業標配。谷歌的A2A協議也號稱比MCP更懂如何讓智能體與智能體互動。
在技術仍然發散式創新的階段,谷歌曾短暫地迷失過方向,倉促起舞,幾場災難性的發布會,成為了笑料。但在技術逐步收斂的階段,估值3000億美元的OpenAI,想要對決市值1.8萬億的谷歌,每一天都是挑戰。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.