出品|虎嗅科技組
作者|宋思杭
編輯|苗正卿
頭圖|視覺中國(guó)
5月中,關(guān)稅暫停的 90 天窗口期,一場(chǎng)圍繞算力核心資源的爭(zhēng)奪戰(zhàn)驟然升溫。
“服務(wù)器價(jià)格波動(dòng)劇烈,前段時(shí)間每臺(tái)價(jià)格已上浮 15%-20%。隨著關(guān)稅暫停,我們計(jì)劃恢復(fù)原價(jià)銷售。” 某南部地區(qū)芯片供應(yīng)商向虎嗅透露。
與此同時(shí),市場(chǎng)供給端也迎來新變量。虎嗅獨(dú)家獲悉,英偉達(dá) Hooper 系列高端產(chǎn)品與 Blackwell 系列已悄然現(xiàn)身國(guó)內(nèi)市場(chǎng),前者的現(xiàn)身時(shí)間點(diǎn)大約在2024年9月,而后者就發(fā)生在最近。華銳智算相關(guān)高管表示,“不同供應(yīng)商的獲取貨源渠道都各不相同。”而這背后的復(fù)雜供應(yīng)鏈網(wǎng)絡(luò)無從探尋。
(虎嗅注:從2023年10月17日開始,華盛頓方面分階段叫停了英偉達(dá)對(duì)華出售的芯片,包括A100、A800、H800、H100、H200;近期Hooper系列最后一張能夠?qū)θA出售的H20也列入到限制出口名單)
其中,英偉達(dá)Hooper高端系列通常指H200,是H100芯片的升級(jí)版,前者比后者價(jià)格僅高出二十幾萬,但效率卻高出30%。而Blackwell系列屬于英偉達(dá)的高端系列,其中B200價(jià)格高達(dá)300多萬,也是目前“流通受限”最嚴(yán)的產(chǎn)品,其流通路徑更為隱秘。這兩款均用于大模型預(yù)訓(xùn)練,而B200更是“一卡難求”。
回溯時(shí)間線,2024年4月,一張黃仁勛與OpenAI CEO奧特曼(Sam Altman)、聯(lián)創(chuàng)布羅克曼(Greg Brockman)的合影流傳在推特上。這張合照背后是H200首批產(chǎn)品的關(guān)鍵交付節(jié)點(diǎn)——英偉達(dá)CEO黃仁勛親自送貨上門,而OpenAI正是H200的第一批用戶。
短短5個(gè)月后,大洋彼岸就傳來了H200的貨源消息。如今,國(guó)內(nèi)已有供應(yīng)商具備每周 100 臺(tái) H200 服務(wù)器的供應(yīng)能力。據(jù)該供應(yīng)商透露,隨著 H100 停產(chǎn),市場(chǎng)需求正加速向 H200 轉(zhuǎn)移,目前掌握 H200 貨源的供應(yīng)商不超過十家,供需缺口進(jìn)一步拉大。
“現(xiàn)在市場(chǎng)上最缺的就是H200,而且據(jù)我所知,有一家云廠最近正在各處找H200。”一位從事算力行業(yè)18年的老玩家告訴虎嗅,他們長(zhǎng)期為百度、阿里、騰訊、字節(jié)供應(yīng)算力服務(wù)。
在這場(chǎng)算力軍備賽中,交易鏈條籠罩著神秘面紗。某國(guó)內(nèi)頭部算力供應(yīng)商表示,行業(yè)通行的算力計(jì)價(jià)規(guī)則是,合同中僅標(biāo)注算力單位 “P”,將服務(wù)器交易轉(zhuǎn)化為抽象的算力交易。(虎嗅注:P是算力的計(jì)算單位)比如在算力使用方與算力供應(yīng)商進(jìn)行算力交易時(shí),并不會(huì)直接將卡的型號(hào)寫進(jìn)合同內(nèi),而是用多少P的算力來代替,也就是說在明面上并不會(huì)把具體的卡型號(hào)寫進(jìn)去。
深入產(chǎn)業(yè)鏈底層,隱秘的交易網(wǎng)絡(luò)浮出水面。此前有媒體披露,部分中國(guó)經(jīng)銷商通過特殊采購渠道,經(jīng)多層轉(zhuǎn)售與包裝,實(shí)現(xiàn)服務(wù)器 “曲線上市”。而虎嗅進(jìn)一步了解到,還有部分經(jīng)銷商另辟蹊徑,借助第三方企業(yè),通過將模組嵌入產(chǎn)品的方式,獲取服務(wù)器。
在暗流涌動(dòng)的產(chǎn)業(yè)鏈背后,國(guó)內(nèi)算力產(chǎn)業(yè)的發(fā)展也正在呈現(xiàn)新的走向。
智算泡沫從何而來?
2023年末,來自大洋彼岸的“英偉達(dá)禁令”,如同一塊巨石投入平靜的湖面,一場(chǎng)圍繞算力核心資源的暗戰(zhàn)隨之打響。
最初的幾個(gè)月,市場(chǎng)呈現(xiàn)出一種原始的混亂與躁動(dòng)。暴利的誘惑之下,一些嗅覺敏銳的個(gè)體開始鋌而走險(xiǎn)。“當(dāng)時(shí)市場(chǎng)上充斥著各種背景的‘供應(yīng)商’,有海外歸來的留學(xué)生,也有一些消息靈通的個(gè)人倒?fàn)敚币晃徊辉妇呙男袠I(yè)人士回憶道,“他們的流轉(zhuǎn)方式相對(duì)簡(jiǎn)單粗暴,雖然交易依然隱秘,但遠(yuǎn)未形成后來那種層層轉(zhuǎn)包的復(fù)雜鏈條。”
這些早期的“拓荒者”們,利用信息差和各種非正規(guī)渠道,將英偉達(dá)高端顯卡,輾轉(zhuǎn)供給到市場(chǎng)。由此,顯卡的價(jià)格自然水漲船高。據(jù)一些媒體報(bào)道,在他們當(dāng)中,一些個(gè)人供應(yīng)商甚至將英偉達(dá)A100顯卡標(biāo)價(jià)至12.8萬元人民幣,遠(yuǎn)超其約1萬美元的官方建議零售價(jià)。更有甚者,有人在社交媒體平臺(tái)中手持H100芯片,稱其單片售價(jià)高達(dá)25萬元人民幣。在當(dāng)時(shí),上述的種種行為和姿態(tài)可以說近乎炫耀式的。
在這種隱秘流通之下,一些大型算力供應(yīng)商已經(jīng)開始具備類似的交易網(wǎng)絡(luò)渠道,而由此引發(fā)的智算熱潮也在同時(shí)期興起。2022~2024年間,多地?fù)尳ㄖ撬阒行摹S袛?shù)據(jù)顯示,單單是2024年,智算中心項(xiàng)目就超過了458個(gè)。
然而,這場(chǎng)轟轟烈烈的“炒卡及智算熱潮”并未持續(xù)太久。到了2024年末,尤其是在DeepSeek等國(guó)產(chǎn)大模型以其高性價(jià)比橫空出世后,一些單純依賴“囤卡居奇”或缺乏核心技術(shù)支撐的算力供應(yīng)商發(fā)現(xiàn),他們的故事越來越難講下去了。智算的泡沫,也逐漸出現(xiàn)破裂跡象。
有數(shù)據(jù)統(tǒng)計(jì),2025年第一季度,中國(guó)大陸共有165個(gè)智算中心項(xiàng)目出現(xiàn)新動(dòng)態(tài),其中高達(dá)58%(95個(gè))的項(xiàng)目仍處于已審批或籌建狀態(tài),另有33%(54個(gè))處于在建或即將投產(chǎn)狀態(tài),而真正實(shí)現(xiàn)投產(chǎn)或試運(yùn)行的,僅有區(qū)區(qū)16個(gè),占比不足10%。
當(dāng)然,呈現(xiàn)出泡沫破裂跡象的不只是國(guó)內(nèi)。近半年來,Meta、微軟等都傳出暫停部分全球數(shù)據(jù)中心項(xiàng)目。泡沫的另一面是令人擔(dān)憂的低效與閑置。
有行業(yè)人士告訴虎嗅,“目前智算中心的點(diǎn)亮率不足50%,國(guó)產(chǎn)芯片由于性能短板,根本無法用于預(yù)訓(xùn)練。而且有些智算中心使用的是相對(duì)落后的服務(wù)器。”
這種“有卡用不起來”的現(xiàn)象,被行業(yè)人士歸結(jié)為“結(jié)構(gòu)性錯(cuò)配”——并非算力絕對(duì)過剩,而是有效的、能滿足高端需求的算力供給不足,同時(shí)大量已建成的算力資源因技術(shù)代差、生態(tài)不完善或運(yùn)營(yíng)能力不足而無法被充分利用。
然而,在喧囂與隱憂并存的智算版圖上,科技巨頭們卻展現(xiàn)出截然不同的姿態(tài)。
據(jù)報(bào)道,字節(jié)跳動(dòng)計(jì)劃在2025年在AI基礎(chǔ)設(shè)施上投入超過123億美元(約合892億元人民幣),其中400億元預(yù)算將用于在中國(guó)采購AI芯片,另有約500億元計(jì)劃用于購買英偉達(dá)芯片。對(duì)此,字節(jié)方面向虎嗅回應(yīng)稱,消息不準(zhǔn)確。
同樣在AI方面大手筆投入的還有阿里。CEO吳泳銘在2月24日公開宣布,未來三年阿里巴巴擬投入3800億元建設(shè)AI基礎(chǔ)設(shè)施。這一數(shù)字甚至超過了過去十年的總和。
但面對(duì)大手筆采購,供給端的壓力也在突顯。"市場(chǎng)的供貨都來不及供給大廠們,好多公司簽約了都交不出貨。"一位智算供應(yīng)商的銷售人員對(duì)虎嗅說道。
對(duì)比之下,上述的智算泡沫與如今大廠這種大手筆地投入AI基建,似乎形成鮮明對(duì)比:一邊是以A股為首的算力供應(yīng)商紛紛叫停大型智算項(xiàng)目,另一邊大廠則在積極投入AI基建。
而這背后的原因并不難理解。因?yàn)橹撬慵眲〗禍氐臅r(shí)間點(diǎn)恰出現(xiàn)在DeepSeek前后。從今年開始,再也沒有人提出“百模大戰(zhàn)”相關(guān)概念了,DeepSeek戳破的是訓(xùn)練需求的泡沫。如今還留在牌桌的只剩下大廠和個(gè)別AI模型公司。
對(duì)此,常壘資本管理合伙人馮博也對(duì)虎嗅說道,“當(dāng)訓(xùn)練不是百花齊放的時(shí)候,那真正有訓(xùn)練能力和資格的人還會(huì)繼續(xù)買卡訓(xùn)練,比如阿里和字節(jié),而那些沒有能力做訓(xùn)練的人就曲終人散了,這些人手里的算力就變成了泡沫。”
被退租的算力
任何"泡沫"的誕生都根植于人類對(duì)稀缺性的非理性想象。炒茅臺(tái)和囤算力的人本身并非是茅臺(tái)愛好者、算力消納方,而都共同有著投機(jī)心理。
截止到2024年底、2025一季度,飛利信、蓮花控股、錦雞股份等多家公司又相繼終止了數(shù)億元的算力租賃合同。與此同時(shí),有算力供應(yīng)商告訴虎嗅,“在算力租賃的生意里,退租是常有的事。”
這些終止租賃的企業(yè)并非真正的算力需求終端。隨著 DeepSeek 引發(fā)的行業(yè)震蕩,AI 行業(yè)泡沫逐漸破裂,眾多算力供應(yīng)商不得不直面算力過剩難題,四處尋覓穩(wěn)定客源,探索新的算力消納路徑。
虎嗅在調(diào)查中發(fā)現(xiàn),一位算力供應(yīng)商創(chuàng)始人的名片上,除了三家智算、云計(jì)算領(lǐng)域的企業(yè),還赫然印著一家投資公司。進(jìn)一步深挖發(fā)現(xiàn),該投資公司的被投項(xiàng)目涵蓋一家機(jī)器人公司與一家專注大模型和云系統(tǒng)研發(fā)的企業(yè)。該創(chuàng)始人向虎嗅透露,“這兩家被投企業(yè)的全部算力需求,均由自家的算力供應(yīng)體系來滿足;而且被投企業(yè)通常會(huì)以市場(chǎng)低價(jià)購買自家供應(yīng)的算力。“
實(shí)際上,在智算產(chǎn)業(yè)里,像智算+投資綁定的形式絕非孤例。對(duì)于不少算力供應(yīng)商而言,“這是目前消納卡很好用的方式,只不過沒有被擺到臺(tái)面上。”馮博對(duì)虎嗅表示。
不過,在上述的故事中,這是一種“壟斷式”的算力消納路徑,即算力供應(yīng)商通過投資鎖定算力需求,并直接滿足被投項(xiàng)目的全部算力需求。但并非只有這一種方式。
馮博認(rèn)為,還有一種模式是,”算力供應(yīng)商以 LP 身份切入產(chǎn)業(yè)基金,構(gòu)建閉環(huán)式算力需求鏈條的模式值得關(guān)注。“
具體而言,該商業(yè)模式呈現(xiàn)出資本聯(lián)動(dòng)特征:算力供應(yīng)商 A 作為潛在有限合伙人(LP),與產(chǎn)業(yè)基金 B 達(dá)成合作意向。在 B 基金的投資版圖中,AI 應(yīng)用廠商 C 作為被投企業(yè),其業(yè)務(wù)發(fā)展對(duì)算力資源存在剛性需求。此時(shí),A 通過戰(zhàn)略投資 B 基金,間接綁定 C 公司未來的算力采購需求,構(gòu)建起“資本投入 - 算力采購”的閉環(huán)。
若交易落地,A 公司將憑借 LP 身份獲得優(yōu)先服務(wù)權(quán),成為 C 公司算力采購的首選供應(yīng)商。這種模式本質(zhì)上形成了資金的循環(huán)流動(dòng) ——A 公司對(duì)基金 B 的出資,最終通過 C 公司的算力采購回流。
“這不是一種主流方式,但卻是一種還比較好用的方式。”馮博坦言。
泡沫快破了,然后呢?
“談智算泡沫就不能只談算力,它是一個(gè)產(chǎn)業(yè)鏈的問題,想讓算力用起來,需要把斷掉的點(diǎn)串起來,現(xiàn)在這條產(chǎn)業(yè)鏈還并未形成閉環(huán)。”一位深耕行業(yè)多年的算力供應(yīng)商首席營(yíng)銷官向虎嗅精辟地指出了當(dāng)前智算產(chǎn)業(yè)的核心癥結(jié)。
進(jìn)入2025年上半年,AI領(lǐng)域一個(gè)顯著的趨勢(shì)是,曾經(jīng)被各大AI公司掛在嘴邊的“預(yù)訓(xùn)練”一詞,其熱度正逐漸被“推理”所取代。無論是面向廣闊的C端消費(fèi)市場(chǎng),還是賦能千行百業(yè)的B端企業(yè)級(jí)應(yīng)用,推理需求的增長(zhǎng)曲線都顯得異常陡峭。
“不妨做一個(gè)簡(jiǎn)單的推演,”一位行業(yè)分析人士估算道,“以目前市場(chǎng)上主流AI應(yīng)用的體量來計(jì)算,如豆包、DeepSeek等為例,假設(shè)其每個(gè)活躍用戶平均每日生成10張圖片,這背后所牽引的算力需求,便可能輕易達(dá)到百萬P級(jí)別。這僅僅是圖像生成這一單一場(chǎng)景,若疊加文本、語音、視頻等多模態(tài)交互,其需求量級(jí)更是難以估量。”
這還僅是C端用戶的推理需求。對(duì)于B端用戶,推理需求更是海量。華銳智算某高管告訴虎嗅,車廠建設(shè)智算中心都是萬P規(guī)模起步,“而且我們的客戶中除了大廠,有最多算力需求的就是車廠。”
然而,再將海量的推理需求與算力泡沫聯(lián)想到一起,故事就顯得異常荒謬。為什么這么多的推理需求還是會(huì)產(chǎn)生算力泡沫?
某算力供應(yīng)商對(duì)虎嗅表示,像這樣海量的推理需求,需要智算服務(wù)商通過工程化技術(shù)對(duì)算力進(jìn)行優(yōu)化,比如壓縮起跑時(shí)間、提高存儲(chǔ)量、縮短推理延遲、提高吞吐量和推理精度等等。
不僅如此,上文提到的供需錯(cuò)配問題,還有一大部分是來自于芯片問題。對(duì)此,有行業(yè)知情人士向虎嗅表示,一些國(guó)產(chǎn)卡和英偉達(dá)的差距還是比較大,它們自身表現(xiàn)發(fā)展不勻,同一品牌即使堆再多的卡短板依然存在,這就導(dǎo)致了單一集群無法有效完成AI的訓(xùn)練和推理。
這種‘短板效應(yīng)’意味著,即便通過大規(guī)模堆疊芯片來構(gòu)建算力集群,如果短板問題得不到有效解決,整個(gè)集群的綜合效能依然會(huì)受限,難以高效支撐AI大模型的復(fù)雜訓(xùn)練與大規(guī)模推理任務(wù)。
事實(shí)上,算力層面的工程挑戰(zhàn)和芯片瓶頸固然嚴(yán)峻,但許多深層次的算力需求未能得到有效滿足,其真正的“斷點(diǎn)”往往出現(xiàn)在算力層之上的應(yīng)用生態(tài),特別是L2層(即針對(duì)特定行業(yè)或場(chǎng)景的)垂類模型的嚴(yán)重缺口。
在醫(yī)療產(chǎn)業(yè)就有這樣一個(gè)需要填補(bǔ)的巨大“窟窿”,人才虹吸效應(yīng)是國(guó)內(nèi)醫(yī)療體系里長(zhǎng)期被詬病的結(jié)構(gòu)性問題,優(yōu)秀醫(yī)生都集中在一線城市的三甲醫(yī)院里。但當(dāng)業(yè)界寄希望于醫(yī)療大模型實(shí)現(xiàn)優(yōu)質(zhì)醫(yī)療資源下沉?xí)r,一個(gè)更根本的挑戰(zhàn)浮出水面:如何構(gòu)建可信醫(yī)療數(shù)據(jù)空間?
因?yàn)橄胍?xùn)練出具備全病程診療能力的垂類大模型,數(shù)據(jù)是關(guān)鍵前提。但問題是,必須要有全病程、全年齡段、全性別、全地域的海量數(shù)據(jù)才能在大模型里形成知識(shí)。而現(xiàn)實(shí)是醫(yī)療數(shù)據(jù)開放率不足5%。
某三甲醫(yī)院信息科主任透露,其醫(yī)院每年產(chǎn)生的500TB診療數(shù)據(jù)中,真正能用于AI訓(xùn)練的脫敏結(jié)構(gòu)化數(shù)據(jù)不足3%。更嚴(yán)峻的是,占疾病圖譜80%價(jià)值的罕見病、慢性病數(shù)據(jù),因其敏感性長(zhǎng)期沉睡在各醫(yī)療機(jī)構(gòu)的"數(shù)據(jù)孤島"中。
而像這樣的斷點(diǎn)無法解決,產(chǎn)業(yè)鏈就無法形成閉環(huán)。算力需求自然也就得不到滿足,顯然,這顯然已經(jīng)遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)意義上那些僅僅提供“卡和電”的算力基礎(chǔ)設(shè)施供應(yīng)商所能獨(dú)立應(yīng)對(duì)的范疇。
不過,如今市場(chǎng)已經(jīng)有一批新型的智算服務(wù)商正悄然崛起。這些企業(yè)不再將自身定位局限于單純的硬件提供或算力租賃,他們還能更組建專業(yè)的算法團(tuán)隊(duì)和行業(yè)專家團(tuán)隊(duì),深度參與到客戶的AI應(yīng)用開發(fā)與優(yōu)化過程中。
與此同時(shí),面對(duì)各種資源錯(cuò)配和算力利用率等問題,各地其實(shí)也在根據(jù)當(dāng)?shù)禺a(chǎn)業(yè)需求出臺(tái)各種各樣的算力補(bǔ)貼政策,其中,“算力券”作為一種直接降低企業(yè)使用算力成本的補(bǔ)貼方式。只是對(duì)于當(dāng)前階段的中國(guó)智算產(chǎn)業(yè)而言,單純的政策“急救藥”恐怕已難以從根本上扭轉(zhuǎn)局面。
如今,智算產(chǎn)業(yè)所需要的是“造血式”培育生態(tài)。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4367570.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.