“舊世界正在分崩離析,新時代正在光速到來。”2024年底,DeepSeekR1大模型即將推出之際,DeepSeek(深度求索)創始人梁文鋒罕見地在朋友圈轉發了一篇文章并評論道。
圖片來源:梁文鋒朋友圈
曾經被寄予厚望的“AI新貴”,似乎正在陷入“傷仲永”式的困境。
近期未來圖靈發現,小紅書有傳言稱,DeepSeek主打一個有錢豪橫的企業,完全不需要融資和上市,企業規劃類似華為。這種表述之下,外界對DeepSeek的發展前景產生了諸多猜測。
AI界的“現象級”崛起
時間回到2024年5月,DeepSeek還只是一家鮮為人知的AI初創公司。當時,AI大模型市場競爭激烈,頭部企業如百度、阿里、字節跳動等已經在該領域投入大量資源,并取得了一定的市場份額。然而,DeepSeek卻在這個時候做出了一個大膽的決策,打響大模型“降價潮”的第一槍。
2024年5月,DeepSeek宣布開源第二代MoE大模型DeepSeek-V2,該模型在性能上比肩GPT-4Turbo,價格卻只有GPT-4的僅百分之一,這一極具性價比的產品迅速吸引了市場的關注,也讓DeepSeek收獲了“AI界拼多多”的名號。
隨后,智譜以及阿里、字節、百度等紛紛跟進,大模型市場的競爭格局由此發生了微妙的變化。
盡管DeepSeek在價格和性能上取得了一定優勢,但在當時,其行業地位仍然相對邊緣。
接受媒體采訪時,智譜COO張帆將自己公司視為“主流廠商中第一個降價的”,言下之意,DeepSeek并不在主流廠商之列。即便到今年初,DeepSeek 的行業地位也僅僅和面壁智能并列,位列大模型“六小虎”之后。
轉折發生在2025年1月10日,DeepSeek正式發布官方App并上線iOS與安卓應用市場。1月20日,DeepSeek正式發布DeepSeek-R1模型,該模型在數學、代碼、自然語言推理等任務上,性能比肩OpenAIo1正式版。
隨著R1模型的發布,DeepSeek的用戶數量開始呈現爆發式增長。僅僅上線20天,DeepSeek應用的日活就突破了2000萬,包括阿里、騰訊、華為、百度等國內多個云巨頭均宣布接入DeepSeek,形成強大的“朋友圈”。QuestMobile數據顯示,2月1日,DeepSeek日活躍用戶數突破3000萬大關,成為史上最快達成這一里程碑的應用。截至2月9日,DeepSeekApp的累計下載量超1.1億次,周活躍用戶規模最高近9700萬。
DeepSeek火了,然后呢?
在DeepSeek迅速躥紅的同時,質疑聲也紛至沓來。首當其沖的便是訓練成本爭議。
在DeepSeek研發團隊發表的論文中,我們可以看到其僅僅使用了550萬美元的算力訓練成本就完成了6710億參數大模型的訓練。這一數據引發了業內的廣泛討論,部分人認為這一成本低得難以置信。
Anthropic首席執行官達里奧·阿莫迪(Dario Amodei)發布了一篇長文討論了DeepSeek的進展,他指出DeepSeek并沒有“用600萬美元做到美國AI公司花費數十億美元才能實現的事情”。以Anthropic為例,Claude 3.5 Sonnet是一個中等規模的模型,訓練成本達數千萬美元,遠不是數十億美元級別。
他還表示,如果AI訓練成本的下降趨勢是每年4倍,如果DeepSeek-V3的訓練成本比一年前開發的美國當前模型低約8倍,那其實完全符合正常趨勢......即使接受DeepSeek的訓練成本數據,他們也只是處于趨勢線上,甚至可能還未完全達到。
其次,模型性能方面也受到了一些質疑。雖然DeepSeek-R1在諸多任務上表現出色,但也有觀點認為,在某些特定場景下,其性能表現并未達到宣傳中的水平。例如,在一些對模型推理速度和準確性要求極高的金融風險預測場景中,有用戶反饋DeepSeek-R1的表現不盡如人意,推理結果的時效性和精準度無法滿足實際業務需求。
再者,DeepSeek一體機市場也陷入了困境。
2025年,DeepSeek一體機成為了市場熱點,眾多企業紛紛入局。然而,這一市場卻迅速遇冷。算力百科發文稱,從甲方視角來看,許多采購了DeepSeek一體機的企業發現設備難以使用,機房里的設備大量閑置,淪為“電子廢鐵”。機房里的IT小哥已對著積灰的AI設備陷入沉思,這玩意兒這么貴到底咋用?是我能力不行么?下一份工作在哪里?!
從乙方視角而言,銷售商面臨著產品難以賣出的困境,雖然朋友圈宣傳熱鬧,但實際銷售情況卻十分慘淡。
此外算力百科還表示,DeepSeek一體機還面臨著法律風險。眾多廠商將開源項目Dify進行簡單的界面篡改,搖身一變成了自家的“DeepSeek一體機”推向市場。這種違反開源協議的行為,嚴重侵犯了知識產權。開源不等于免費,不是讓大家為所欲為。已經購買了相關一體機的甲方,如果乙方不能提供dify官方商業授權,將面臨退貨退款甚至法律訴訟的風險。
DeepSeek豪言“日賺56萬”?
3月1日,DeepSeek官方發布《DeepSeek-V3 / R1推理系統概覽》,首次披露成本利潤率情況,稱“若所有Tokens按 DeepSeek R1定價計算,理論上一天總收入為56.2027萬美元,成本利潤率545%。當然實際收入沒這么多,因V3定價更低,收費服務占比部分,夜間還有折扣”。
圖片來源:DeepSeek知乎主頁
消息一出,網友們紛紛在評論區@北京潞晨科技有限公司董事長尤洋。
時間回溯到2月9日,潞晨科技創始人尤洋在社交媒體發表了一條“暴論”:MaaS(Model as a Service)在中國短時間內可能是最差的商業模式。
尤洋通過計算指出,現階段通過Token(文本單元)計費獲得的收入難以覆蓋大模型算力成本,以滿血版DeepSeek R1每日輸出1000億Token為例,每月機器成本4.5億,虧損約4億,呈現出“用戶越多,虧損越多”的態勢。
如今DeepSeek官方公布的理論成本利潤率與尤洋此前計算結果大相徑庭,將尤洋和潞晨推向輿論風口浪尖。
針對這一爭議,關于DeepSeek官方與潞晨計算結果為何天差地別成為輿論焦點。尤洋解釋,劍指AGI的DeepSeek與基于開源模型做To B生意的MaaS廠商面臨情況本質不同。DeepSeek可專注模型研發,對用戶體驗影響考慮較少,而MaaS廠商因ToB業務特性,需將客戶體驗置于首位,畢竟To B業務對服務穩定性和低延遲要求極高。并且在復雜現實場景中,機器吞吐率受任務類型、輸入輸出序列長度、聯網需求等因素影響而變化,這些差異最終致使雙方在成本和盈利計算上分歧巨大。
2月28日,面對網友相關提問,尤洋再次強調按2025年2月初狀態,該業務不可能盈利,虧損源于測試速度與實際場景差距、機器利用率峰值和波谷差距大以及機器不穩定等。
DeepSeek文章發布后,尤洋發文指出《DeepSeek-V3 / R1 推理系統概覽》中的數據對計算MaaS成本無參考價值,將DeepSeek網頁、APP和MaaS API的Token數相加計算不合理,還提及使用體驗不佳,稱其并非合格MaaS產品。
3月1日下午,潞晨科技微信公眾號宣布將暫停DeepSeek API服務,并會對未使用完余額的用戶全額退款。不過,3月2日凌晨尤洋重新編輯內容,強調DeepSeek是中國最好的模型之一,自己并非貶低DeepSeek,而是抨擊倒賣DeepSeek API卻賠本賺吆喝且吹噓推理速度快的中小云廠商,卻被友商引導至與DeepSeek對立。
圖片來源:潞晨科技微信公眾號
3月2日早間,或許是意識到自己此前言論的不妥,尤洋再次發文稱,“本人昨天情緒太沖動,說了一些讓人誤解Deepseekinfrastructure團隊的話。Deepseek infrastructure團隊技術一流并給開源社區做出巨大貢獻。本人誠摯道歉,已經刪除不當表述,感謝大家提醒!”
不僅僅是尤洋,在前述DeepSeek文章下面,硅基流動創始人袁進輝回復寫道,“DeepSeek官方披露大規模部署成本和收益,又一次顛覆了很多人認知。現在很多供應商還做不到這個水平,主要是V3/R1架構和其它主流模型差別太大了,由大量小Expert組成,導致瞄準其它主流模型結構開發的系統都不再有效,必須按照DeepSeek報告描述的方法才能達到最好的效率,而開發這樣的系統難度很高,需要時間,幸好這周DeepSeek五連發已經把主要模塊開源出來了,降低了社區復現的難度”。
值得一提的是,去年還在深度求索任職的羅福莉,在2024年5月曾在知乎發文提到,“大家不用擔心模型斷更,也不用擔心API漲價(目前就是大規模服務的價格,不虧本,利潤率超50%)”。
圖片來源:攝圖網
千年前,王安石筆下的神童方仲永,五歲便可賦詩,指物成文,天賦異稟,卻因急功近利,最終“泯然眾人”。
如今,本土AI界的“現象級選手”DeepSeek,憑借驚艷實力迅速崛起,卻也深陷輿論爭議的漩渦。不禁令人發問:它是否會步方仲永后塵,陷入發展“尷尬”?
這并不是杞人憂天,訓練成本爭議、市場遇冷、商業模式質疑等問題,正如同暗礁,隨時可能沖擊其前行的航線。
作為備受矚目的本土AI企業,國人無不期待DeepSeek能突破重圍,在全球AI競爭中嶄露頭角。但歷史的經驗告訴我們,越是處于行業風口,越需保持清醒與審慎。只有避免因盲目追求高光時刻而過度透支潛力,DeepSeek才能真正跨越“傷仲永”的預言。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.