人們以為DeepSeek的開源周,五連發到上周五已經結束,卻沒有想到,它周六又來了一個one more thing,把AI開放拉滿到一個新的境界:公布推理成本和收入利潤!
DS計算,如果每一次推理服務都能收到錢,公司日進賬約410萬元人民幣,年化收入近15億元,V3/R1的理論 成本利潤率(收入除以成本)達到545%!不過OpenAI人員很快指出這可能存在誤導,如果用正常的利潤率計算,相當于推理部分的 毛利率達到了84%。
嗯,這也不低。
而就在頭一天,OpenAI發布了最大最貴、情商最高的GPT-4.5,其價格是4o和Claude的15-20倍,是DS的200-1000倍!孫正義正準備投資OpenAI數百億美元,他會后悔嗎?
DS公布解決了三大問題:大規模跨節點專家并行,計算-通信重疊,最佳負載平衡,從而實現了推理更高的吞吐量和更低的延遲。跑在H800上的token輸出速度達到了20-22 token每秒。
(*理論收入 依據 R1 標準 API 定價計算,涵蓋 Web、APP 和 API 端的所有 token 計算量,并非實際收入)
DS估值至少百億美元
這一結果再次引爆了AI圈。美國的AI企業過去的一周肯定都在抄DS的作業,之后中國的開源AI將會以更快的加速度創新,美國和中國,要比學趕超了。
DS再一次激發對于算力的需求的質疑和重估。有人靜態地算了筆賬,如果達到這樣的效率,全中國只需要25萬張GPU就可以解決AI推理需求了。當然,還是需要動態地估算,成本下降了,會加快技術的部署和商品化,人們使用更多,也會推高對GPU的需求。但是,之前的估算,許多前提假設也都將修正。
這可能讓不少風險投資大佬有些抓狂,之前給那些AI企業的投資,都是建立在前沿大模型的護城河的假設之上,但是,DS似乎在毀掉護城河,因為它一周內”把大模型的秘方快遞到了每個人的家門口“,可能會抹去一些AI企業的估值。
還有對DS的估值。MenloVenture投資人Deedy Das認為,DS在硅谷就是一家價值超過百億美元的獨角獸公司。
以技術和工程提升毛利率
具體而言,DS采用了一種被稱為跨節點專家并行(Expert Parallelism)的方法,簡稱EP,提高GPU在推理時的吞吐量,并減低延遲。
EP 顯著擴大了批量大小,提高了 GPU 矩陣計算效率并提高了吞吐量。EP 又能將專家分布在 GPU 上,每個 GPU 只處理一小部分專家(減少內存訪問需求),從而降低延遲。
但是,EP又增加了系統的復雜性,它引入了跨節點通信,為了優化吞吐量,DS設計出的計算工作流程,能將通信與計算重疊。
EP又涉及多個節點,本質上需要數據并行 (DP) ,DS實現了不同的 DP 實例之間進行負載平衡。
(DS在線推理系統圖)
具體技術細節,可以在開源周的One More Thing獲得 : https://github.com/deepseek-ai/open-infra-index/tree/main/202502OpenSourceWeek
在白天的波峰時段,所有節點都會處理推理請求。在晚上,當推理需求下降時,資源重新分配到研究和訓練任務上。根據每天在線的”波峰“與”波谷“期所占有的H800節點數量,DS計算了它的每天總成本:
DS選擇的上周五的24 小時內(UTC+8 2025 年 2 月 27 日 12:00 PM 至 2025 年 2 月 28 日 12:00 PM),V3 和 R1 推理服務的合并峰值節點占用總數達到 278,平均占用率為 226.75 個節點(每個節點包含 8 塊 H800 GPU)。假設一塊 H800 GPU 的租賃成本為每小時 2 美元,則每天的總成本為 87,072 美元。
DS這樣綜合統計V3和R1:
? 總輸入token數:608B,其中 342B 個token(56.3%)命中磁盤 KV 緩存。
? 總輸出 token 數:168B,平均輸出速度為 20-22 個 token/s,平均每個輸出 token 的 kvcache (健值緩存) 長度為 4989 個 token。
? 每個 H800 節點在預填充期間提供平均約 73.7k 個token/秒的輸入(包括緩存命中),或在解碼期間提供平均約 14.8k 個token/秒的輸出。 平均每個用戶請求的輸出速度,可以達到20-22token每秒。
以上數據包括所有來自網頁、APP、API的用戶請求,若所有代幣按照DeepSeek-R1定價計費(*),則日總收益為562,027美元,成本利潤率為545%。
R1 定價:0.14 美元/M 輸入token(緩存命中)、0.55 美元/M 輸入token(緩存未命中)、2.19 美元/M 輸出token。
然而,DS的實際收入遠低于此,因為DeepSeek-V3 的定價明顯低于 R1;網頁和APP訪問占了服務的大頭,仍然免費;夜間的應用“波谷”時段價格打了折扣。
語言模型沒有護城河
AI公司披露成本和潛在收入及盈利數據,這非常罕見,連科技巨頭都吞吞吐吐。盡管DS公布的是理論上的推測數量,但它為研究人工智能的成本和潛在盈利能力,提供了一種重要參考。
從DS不同尋常的透明度中,也可以看出行業動態:雖然AI模型理論上可以產生可觀的利潤率,但要獲得這種價值卻很困難。在市場競爭、分級定價結構和提供免費服務的需求之間,實際利潤往往會大幅縮水。
從 OpenAI 到 Anthropic 等公司都在嘗試各種盈利模式,從訂閱制到按使用收費再到收取許可費,它們競相打造越來越復雜的人工智能產品。但投資者對這些商業模式及其投資回報率提出了質疑,能否在短期內實現盈利,一直令人放心不下。
相比之下,OpenAI 最近的定價策略尤其值得關注,最新的GPT-4.5 的價格遠高于其前代產品和 DS等競爭對手,盡管性能改進不大。
DS的數據表明,語言模型正在演變為商品服務,高價不再反映實際的性能優勢。這給 OpenAI 等硅谷AI公司帶來了額外壓力,它們多數都虧損了數十億美元,面臨著巨大的運營成本。
OpenAI 已經感受到了巨大的壓力,難怪 GTM 經理 Adam Goldberg 最近強調AI 的成功需要控制整個價值鏈(從基礎設施和數據到模型和應用程序)。隨著語言模型商品化,競爭優勢可能不再在于模型本身,而在于公司在整個技術堆棧中進行集成和優化的能力。
參考:
https://github.com/deepseek-ai/open-infra-index/blob/main/202502OpenSourceWeek/day_6_one_more_thing_deepseekV3R1_inference_system_overview.md#large-scale-cross-node-expert-parallelism-ep
https://the-decoder.com/deepseeks-language-models-could-deliver-massive-profits-even-priced-far-below-openai/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.