網易首頁 > 網易號 > 正文申請入駐

跟上DeepSeek，國內算力要加油

2025-03-04 00:16:39　來源: 未盡研究

上海舉報

分享至

DeepSeek針對英偉達GPU在CUDA平臺上所施加的庖丁解牛式的優化，正在倒逼國內AI Infra企業，跟上AI開源的加速度。

全國都在搶著接入 DeepSeek，跑步進入 AI時代。不過，部署 DeepSeek并提供服務的 AI Infra 公司，都在虧錢，且 “月虧四億 ”。這個驚人的結論，來自潞晨科技 CEO尤洋的估算，引起了其他 AI Infra公司的質疑。硅基流動 CEO袁進輝認為這種計算方法不對，基于了錯誤的架構。該公司聯合華為，最早行動起來，第一個推出滿血版 DeepSeek的第三方服務，并將 API價格打至與官網同價。

DeepSeek用了，一連五天，手把手教大家，如何從計算到通信到存儲，優化基礎設施。第六天自然就是前五天學習的結果， DeepSeek故意用了一個不大常用的 “成本利潤率 ”（利潤 /成本）指標：不考慮折扣等因素，，相當于 85%的毛利率（利潤 /收入）。

它代表了 DeepSeek壓榨算力效率的極限，也是國內一眾 AI Infra企業需要對齊的目標。投資者會將前者的數據視為后者估值的錨點，以判斷在開源周之前，團隊技術是否足夠領先，在開源周之后，團隊跟隨與執行是否足夠迅速。

在 DeepSeek開源成本與利潤率后，尤洋堅持此前 “不賺錢 ”的立場，并與袁進輝再次打起嘴仗，最后從技術爭論與商業爭論，發展成為牽扯陳年舊案的情緒化輸出。目前，潞晨科技宣布將在一周后停供 DeepSeek API。硅基流動則宣布繼續積極擴展資源，讓用戶敞開用。

但這只是 DeepSeek開源所開啟的芯片 -云 -應用的國內閉環生態的小插曲。方向已經挑明，生態上下游的抱團進化仍是主旋律。盡管反對 “月虧 4億說 ”，但袁進輝也承認， “現在很多供應商還做不到這個水平 ”， “幸好這周 DeepSeek五連發 ”。

DeepSeek是大模型研發的頂尖團隊，也是基礎設施優化的頂尖團隊，甚至被戲稱比英偉達還懂英偉達。早在搭建 “螢火二號 ”的時候， DeepSeek ，如何榨干 A100的算力。在美國逐步收緊先進 AI芯片后， DeepSeek又針對 H800與 H20的特點，對大模型與基礎設施做了底層優化，最大程度地提升訓練與推理效率，將成本降至硅谷同行無法想象的地步。

目前，數據中心的存量的算力設施，還暫時無法充分釋放 DeepSeek的精妙之處。它們需要抓緊領會消化 DeepSeek公布的整套代碼。此外，目前正在涌現大量 DeepSeek模型一體機，這是能夠迅速落地的增量解決方案。硅基流動就推出了同類產品，除了離線部署等賣點外， “從硬件層到模型層的全棧調優 ”也是關鍵宣傳點。

DeepSeek目前的優化，幾乎都是針對英偉達的 Hopper架構的，甚至可以做到比英偉達還強。當然，為了賣出更多的卡，在缺乏競爭的情況下，英偉達也不會主動大幅優化，這將降低下一代芯片的銷量。

影響 DeepSeek毛利率的關鍵，就是 H800的吞吐效率。按照 DeepSeek第六天公開的數據，它的推理集群的平均吞吐，輸入吞吐是 73.7kt/s，輸出吞吐是 14.8kt/s。而英偉達自己匆忙上線的 R1模型，用 H200只能輸出 5.9kt/s的峰值吞吐，僅為 DeepSeek調優后的閹割版的 H800的 1/3，只有它最先進的 B200才能勉強趕上。

對于國內芯片廠商來說，提升空間就更大了，需要整個生態的協同創新。袁進輝回憶稱，在 DeepSeek爆火前一個月，梁文鋒曾建議硅基流動部署 DeepSeek-V3，至少準備 20臺 H800， 80臺最好。但他錯過了。最終找到了華為，整個春節期間，硅基流動團隊沒有休息過一天，在昇騰芯片上，完成適配工作，承接住了第一波流量。

不過，尤洋的估算也并非完全沒有道理。他提到， DeepSeek自身的 API算不上 MaaS（模型即服務），因為 MaaS服務需要足夠穩定，而 DeepSeek官方服務，除了短暫的幾個小時閑置，始終處于飽和狀態。這意味著 DeepSeek目前提供的 “理論利潤率 ”，并沒有考慮冗余的成本。

但即使如此，相比同行，在相似的算力成本的統計口徑下， DeepSeek“理論利潤率 ”仍然占據優勢。據 TD Cowen對 Anthropic的財務數據的分拆，后者最近一年的的利潤率或為 61%；按照 the information對 OpenAI的財務數據的分拆，后者最近一年的利潤率或為 50%。

據國內分析人士對負載率與折扣率等多種情況的推演， DeepSeek完全可以做到 60%的真實毛利率。 Semianalysis分析 DeepSeek V2時就指出，它的毛利可以達到 70%。事實上，梁文鋒此前接受采訪時也稱， “我們只是按照自己的步調來做事，然后核算成本定價。我們的原則是不貼錢，也不賺取暴利。這個價格也是在成本之上稍微有點利潤。 ”

更低的推理成本，有利于應用的繁榮，進一步提振整個生態的活力。按 H800約 2美元 /小時的市場化租賃價格計算，當前， DeepSeek模型的單日算力總成本約為 8.7萬美元。有機構算了一筆賬：如果日活用戶 3000萬，那么單個用戶每日算力成本約為 0.003美元，折合每年 1.1美元。如果付費率為 3%，那么付費用戶平均年費約為 35美元，即可回收算力成本。這遠低于目前 OpenAI的 ChatGPT Plus月費 20美元， Pro月費 200美元的定價。

DeepSeek開源了模型與技術，忙壞了國內 AI生態企業在技術上對齊，如今開源了財務數據，那就看國內 AI企業自己能不能賺到錢了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.