DeepSeek針對英偉達GPU在CUDA平臺上所施加的庖丁解牛式的優化,正在倒逼國內AI Infra企業,跟上AI開源的加速度。
全國都在搶著接入 DeepSeek,跑步進入 AI時代。不過,部署 DeepSeek并提供服務的 AI Infra 公司,都在虧錢,且 “月虧四億 ”。這個驚人的結論,來自潞晨科技 CEO尤洋的估算,引起了其他 AI Infra公司的質疑。硅基流動 CEO袁進輝認為這種計算方法不對,基于了錯誤的架構。該公司聯合華為,最早行動起來,第一個推出滿血版 DeepSeek的第三方服務,并將 API價格打至與官網同價。
DeepSeek用了 ,一連五天,手把手教大家,如何從計算到通信到存儲,優化基礎設施。第六天自然就是前五天學習的結果, DeepSeek故意用了一個不大常用的 “成本利潤率 ”(利潤 /成本)指標:不考慮折扣等因素, ,相當于 85%的毛利率(利潤 /收入)。
它代表了 DeepSeek壓榨算力效率的極限,也是國內一眾 AI Infra企業需要對齊的目標。投資者會將前者的數據視為后者估值的錨點,以判斷在開源周之前,團隊技術是否足夠領先,在開源周之后,團隊跟隨與執行是否足夠迅速。
在 DeepSeek開源成本與利潤率后,尤洋堅持此前 “不賺錢 ”的立場,并與袁進輝再次打起嘴仗,最后從技術爭論與商業爭論,發展成為牽扯陳年舊案的情緒化輸出。目前,潞晨科技宣布將在一周后停供 DeepSeek API。硅基流動則宣布繼續積極擴展資源,讓用戶敞開用。
但這只是 DeepSeek開源所開啟的芯片 -云 -應用的國內閉環生態的小插曲。方向已經挑明,生態上下游的抱團進化仍是主旋律。盡管反對 “月虧 4億說 ”,但袁進輝也承認, “現在很多供應商還做不到這個水平 ”, “幸好這周 DeepSeek五連發 ”。
DeepSeek是大模型研發的頂尖團隊,也是基礎設施優化的頂尖團隊,甚至被戲稱比英偉達還懂英偉達。早在搭建 “螢火二號 ”的時候, DeepSeek ,如何榨干 A100的算力。在美國逐步收緊先進 AI芯片后, DeepSeek又針對 H800與 H20的特點,對大模型與基礎設施做了底層優化,最大程度地提升訓練與推理效率,將成本降至硅谷同行無法想象的地步。
目前,數據中心的存量的算力設施,還暫時無法充分釋放 DeepSeek的精妙之處。它們需要抓緊領會消化 DeepSeek公布的整套代碼。此外,目前正在涌現大量 DeepSeek模型一體機,這是能夠迅速落地的增量解決方案。硅基流動就推出了同類產品,除了離線部署等賣點外, “從硬件層到模型層的全棧調優 ”也是關鍵宣傳點。
DeepSeek目前的優化,幾乎都是針對英偉達的 Hopper架構的,甚至可以做到比英偉達還強。當然,為了賣出更多的卡,在缺乏競爭的情況下,英偉達也不會主動大幅優化,這將降低下一代芯片的銷量。
影響 DeepSeek毛利率的關鍵,就是 H800的吞吐效率。按照 DeepSeek第六天公開的數據,它的推理集群的平均吞吐,輸入吞吐是 73.7kt/s,輸出吞吐是 14.8kt/s。而英偉達自己匆忙上線的 R1模型,用 H200只能輸出 5.9kt/s的峰值吞吐,僅為 DeepSeek調優后的閹割版的 H800的 1/3,只有它最先進的 B200才能勉強趕上。
對于國內芯片廠商來說,提升空間就更大了,需要整個生態的協同創新。袁進輝回憶稱,在 DeepSeek爆火前一個月,梁文鋒曾建議硅基流動部署 DeepSeek-V3,至少準備 20臺 H800, 80臺最好。但他錯過了。最終找到了華為,整個春節期間,硅基流動團隊沒有休息過一天,在昇騰芯片上,完成適配工作,承接住了第一波流量。
不過,尤洋的估算也并非完全沒有道理。他提到, DeepSeek自身的 API算不上 MaaS(模型即服務),因為 MaaS服務需要足夠穩定,而 DeepSeek官方服務,除了短暫的幾個小時閑置,始終處于飽和狀態。這意味著 DeepSeek目前提供的 “理論利潤率 ”,并沒有考慮冗余的成本。
但即使如此,相比同行,在相似的算力成本的統計口徑下, DeepSeek“理論利潤率 ”仍然占據優勢。據 TD Cowen對 Anthropic的財務數據的分拆,后者最近一年的的利潤率或為 61%;按照 the information對 OpenAI的財務數據的分拆,后者最近一年的利潤率或為 50%。
據國內分析人士對負載率與折扣率等多種情況的推演, DeepSeek完全可以做到 60%的真實毛利率。 Semianalysis分析 DeepSeek V2時就指出,它的毛利可以達到 70%。事實上,梁文鋒此前接受采訪時也稱, “我們只是按照自己的步調來做事,然后核算成本定價。我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。 ”
更低的推理成本,有利于應用的繁榮,進一步提振整個生態的活力。按 H800約 2美元 /小時的市場化租賃價格計算,當前, DeepSeek模型的單日算力總成本約為 8.7萬美元。有機構算了一筆賬:如果日活用戶 3000萬,那么單個用戶每日算力成本約為 0.003美元,折合每年 1.1美元。如果付費率為 3%,那么付費用戶平均年費約為 35美元,即可回收算力成本。這遠低于目前 OpenAI的 ChatGPT Plus月費 20美元, Pro月費 200美元的定價。
DeepSeek開源了模型與技術,忙壞了國內 AI生態企業在技術上對齊,如今開源了財務數據,那就看國內 AI企業自己能不能賺到錢了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.