英偉達成為了全球第一家市值突破4萬億美元的公司,從而打破了蘋果保持的紀錄——后者是全球第一家市值突破2萬億美元、3萬億美元的公司,以及第一家市值突破1萬億美元的科技公司。今年以來,蘋果是美國科技巨頭當中表現較差的,主要還是對生成式AI的應用不達預期,被寄予厚望的Apple Intelligence至少至今沒有體現出冠軍相。
時間過得真快!此時此刻,距離DeepSeek R1推出之后,英偉達一度大跌16%,才只過去了不到半年。從那時起,英偉達的市值累計又增長了約40%。當初市面上廣為流傳的“DeepSeek戳穿了英偉達泡沫”,“算力將不再是瓶頸”,乃至“CUDA已經被完美繞過”,種種奇談怪論猶在耳邊,現在回憶起來仿佛弱智成年人的一場盛大狂歡。這再次說明科技行業的發展需要遵循客觀規律,不以任何人的意志為轉移。(當然,DeepSeek是一個非常成功的大模型,其成功的一個立足點就是英偉達的軟硬件一體化解決方案。)
英偉達的市值增長顯然是業績推動的:對于AI訓練和推理算力的需求在短期內有增無減,即便我們不考慮智能機器人、自動駕駛等新興領域的長期算力需求,眼前的需求也足以再支撐一段時間的高增長。至于英偉達目前的估值是否合理,那不是本文討論的話題。在此我更關心的是:誰會成為英偉達之下的“第二名”?哪怕第一名和第二名的差距有十倍,那第二名的日子也會非常滋潤。何況第一名和第二名不一定是互相替代的關系,也可以是互補或平行關系。
顯然,AMD不太可能是那個“第二名”,盡管從2022年至今,華爾街一直期待它扮演這個角色。AMD的數據中心級GPU不但收入規模遠小于英偉達,增速也遠遠不及,甚至在2025年上半年暫時陷入停滯。而且,這種差距不是出于供給問題——過去幾個季度,經常有分析師問蘇姿豐“你們的GPU是否存在供給瓶頸”,得到的回答都是“不存在”。許多客戶寧可排隊等待英偉達顯卡,或者配置英偉達的上一代顯卡,也不愿采購供給更充足的AMD顯卡。AMD相對于英偉達最大的優勢是開源生態,因為英偉達至今僅在極小范圍內開源了顯卡驅動程序。遺憾的是,這一點優勢不足以拉近二者的距離。
至于英特爾就更沒有希望了。此時此刻,所有英特爾股東和老員工最想做的一件事情大概就是:退回到二十多年前,阻止當時的管理層關閉獨立顯卡業務;如果做不到,至少要在2010年前后重開,那是為數據中心級顯卡業務打下基礎的最晚時間節點。時間是不能倒流的,所以英特爾在這個問題上早已出局了。
有人會提到華為、阿里等名字。在此我無意討論它們的顯卡算力與英偉達是否有差距、性價比如何,但我只想指出一點:哪怕它們的產品在各方面均能與英偉達并駕齊驅,由于眾所周知的原因,其市場主要將限于中國大陸,而且任何一家恐怕都難以獨占國內市場。我們現在要討論的是誰能當第二名,而僅僅占據半個或者四分之一個中國市場,尚不足以成為全球第二名。
迄今為止,我們的結論是:市面上的通用GPU廠商與英偉達的差距都遠遠超過了十倍。我知道有人會提到博通以及ASIC的名字,但是ASIC是一個集體概念,我們不能把整個ASIC加起來并聲稱其超過了英偉達。不過,這個思路是正確的:英偉達真正的挑戰者(或曰互補者),只能到in-house silicon當中去找;所謂in-house silicon, 就是科技大廠內部研發的定制芯片,它們構成了市面上所謂的ASIC的主力軍。我不是這方面的專家,這個話題輪不到我下結論。但是從諸多跡象看來,我認為谷歌最具潛力。嚴格地說,谷歌的TPU正在超越傳統的ASIC范疇,有成為一種廣泛的通用計算產品的潛力。
OpenAI正在使用谷歌TPU提供算力支持,這是前幾天非常熱門的新聞。Meta也與谷歌展開了合作,盡管它也有自己的TPU。我們知道,算力產品的競爭從來就不止局限于硬件層面,如果只看硬件,市面上貌似超過了英偉達旗艦產品的硬件非常多,就連英偉達自己的低線產品往往也能超過旗艦產品——這就是某些半吊子分析師和博主常犯的錯誤。在可見的未來,沒有人能“擊敗”英偉達;但是,如果你想對英偉達實現部分替代和補充,還是做得到的,而那一定是以“生態系統”的方式,而非單純堆砌硬件的方式做到。
而谷歌的優勢就在于一體化生態。事實上,TensorFlow社區的發布時間,比初代TPU還要早半年。2023年以前,TensorFlow一度是最流行的深度學習框架,遠遠超過Meta旗下的PyTorch;但是2023年以后形勢逆轉了,PyTorch后來居上。當時,許多大模型從業者對我感嘆,谷歌的整個深度學習帝國有傾覆之勢:TPU的使用范圍有限,TensorFlow的社區維護和易用性遠遠落在PyTorch之后,而大模型本身(當時還不叫Gemini, 叫Bard)也被OpenAI乃至Claude拉出了好幾個身位。有一位朋友告訴我,這些競爭都是彼此相關的——Bard競爭不過OpenAI,TensorFlow競爭不過PyTorch, Bard (Gemini)競爭不過GPT。他認為一個關鍵指針是OpenAI的選擇:只要OpenAI不選擇TPU,就證明TPU的技術路線有問題。
現在形勢出現了轉折,OpenAI竟然真的在一定程度上使用了TPU!盡管我相信,它的絕大部分算力還是基于英偉達平臺。差不多同一時間,Gemini也在大幅拉近與GPT的差距,真正進入了第一梯隊。2024年上半年還風雨飄搖、乏善可陳的谷歌生成式AI體系,經過這一年多的調整,穩住了每一條戰線并有了很大進步。這一方面應該歸功于谷歌在深度學習領域的深厚積累,另一方面要歸功于現任管理層(以及重出江湖的創始人)的及時調整。至于哪一個因素更重要,在外部的我們不得而知。
在穩住戰線并確保技術路線正確之后,谷歌的體量和資源優勢可能將成為勝負手。就像在第二次世界大戰當中,只要渡過了前期措手不及的參戰期,蘇聯和美國的體量就被證明是難以擊敗的。不要誤會,我不是說英偉達的體量不夠大;我的真實意思是,谷歌具備的財務資源、基礎研發能力和生態系統的“三位一體”,將是它在整個生成式AI長跑當中取勝的關鍵。這場長跑既包括算力,也包括云服務和開發環境,還包括大模型本身。
接下來,我們可能會目睹一個“正循環”:Gemini的性能持續增強(甚至有一天成為最強的大模型),促使第三方客戶更有動力使用TPU(因為在Gemini上面得到了驗證),這兩者加起來又會促使TensorFlow社區迎來復興。其實上面三條做到一條就很了不起了,若三條都能做到,對谷歌來說簡直是夢幻般的成就。現在還只走了一小步,但是至少在算力這個方向上,谷歌已經明顯有可能超過AMD的高度,甚至可能已經超過。
谷歌最近一年多的大轉折,再次證明了一點:從互聯網時代成長起來的科技巨頭,普遍帶有很強的韌性。它們可能因為一時的決策失誤、執行力低下或經濟環境問題而蒙受慘重損失,乃至被資本市場宣判“死緩”;可是只要懸崖勒馬,它們往往能在幾個季度內趕上來。過去四年,我們已經先后看到奈飛、Meta和谷歌上演這一幕“先抑后揚”的大反轉了。一家科技巨頭若真的要衰落,那必須像雅虎那樣,連續犯下多個難以饒恕的錯誤、錯過多個風口才行。
我再強調一次:我們現在討論的不是“誰能替代英偉達”,這樣的公司很可能還沒被創辦出來;而是“誰能成為英偉達之后的第二名”,因為AMD與它的差距實在太大,大到難以相提并論。如果谷歌能憑借TPU成為英偉達之后的“AI算力第二名”,那么哪怕對于它這個體量的公司而言,也是一筆彌足珍貴的增量。目前的不確定性因素還太多,我們只能說它具備這樣的潛質,什么時候兌現還不好說。
本文作者目前并不持有谷歌和英偉達的股份,但是很有可能透過基金持有,因為眾所周知,此類基金幾乎不可能不配置谷歌和英偉達。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.