99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek流量暴跌?AI大模型全球霸主離奇遇冷,外媒曝出真相

0
分享至


新智元報道

編輯:Aeneas 好困

【新智元導讀】曾以低價高性能震撼市場的DeepSeek,為何在自家平臺遇冷,市場份額下滑?背后隱藏的「Token經濟學」和這場精心策劃的戰略轉移,正悄然改變著AI的價值鏈與分發模式。

最近,全世界的大廠都在蠢蠢欲動了!

GPT-5、Grok 4,甚至Claude,都已經紛紛有了消息,一場惡戰仿佛就在眼前!


DeepSeek這邊,似乎也有新動靜了。

就在昨天,一個疑似DeepSeek的新模型現身LM Arena。


也有人猜測,這個模型更可能是DeepSeek V4,而DeepSeek R2會稍后發布。

套路很可能和之前是一樣的,先在第一個月發布V3,然后在下個月發布R1。

所以,曾經轟動全球AI圈的中國大模型DeepSeek R1,如今怎樣了?

到今天為止,DeepSeek R1已經發布超過150天了。

當時一經問世,它就以OpenAI同等級的推理能力和低90%的價格而迅速出圈,甚至一度撼動了西方的資本市場。

可是如今,它在用戶留存和官網流量上卻雙雙遇冷,市場份額持續下滑。

DeepSeek就這樣曇花一現,紅極一時后迅速衰落了?

其實不然,在這背后,其實隱藏著另一條增長曲線——

在第三方平臺上,R1已經成爆炸性增長,這背后,正是折射出AI模型分發與價值鏈的悄然變革。

SemiAnalysis今天發布的這篇文章,挖出了不少一手的內幕信息。


DeepSeek,盛極而衰?

DeepSeek發布后,消費者應用的流量一度激增,市場份額也隨之急劇上升。

為此,SemiAnalysis做出了下面這份統計曲線。

當然,他們也承認,由于中國的用戶活動數據難以追蹤,且西方實驗室在中國無法運營,下面這些數據實際上低估了DeepSeek的總覆蓋范圍。

不過即便如此,曾經它爆炸性的增長勢頭也未能跟上其他AI應用的步伐,可以確定,DeepSeek的市場份額此后已然下滑。


而在網絡瀏覽器流量方面,它的數據就更為慘淡了:絕對流量一直在下降,但其他頂尖模型的用戶數卻噌噌飛漲,十分可觀。


不過,雖然DeepSeek自家托管模型的用戶增長乏力,但在第三方平臺那里,就完全是冰火兩重天了。

可以看到,R1和V3模型的總使用量一直在持續快速增長,自R1首次發布以來,已經增長將近20倍!


如果進一步深挖數據,就會發現:只看由DeepSeek自己托管的那部分Token流量,那它在總Token中的份額的確是逐月下降的。


那么,問題來了:為何在DeepSeek模型本身越來越受歡迎、官方價格非常低廉的情況下,用戶反而從DeepSeek自家的網頁應用和API流失,轉向了其他開源提供商呢?

SemiAnalysis點出了問題關鍵——

答案就在于「Token經濟學」,以及在平衡模型服務的各項KPI時所做的無數權衡。

這些權衡意味著,每個Token的價格并非一個孤立的數字,而是模型提供商根據其硬件和模型配置,在對各項KPI進行決策后得出的最終結果。

Token經濟學基礎

我們都知道,Token是構成AI模型的基本單元。AI模型通過讀取以Token為單位的互聯網信息進行學習,并以文本、音頻、圖像或行為指令等Token形式生成輸出。

所謂Token,就是像「fan」、「tas」、「tic」這樣的小文本片段。LLM在處理文本時,并非針對完整的單詞或字母,而是對這些片段進行計數和處理。

這些Token,便是老黃口中數據中心「AI工廠」的輸入和輸出。

如同實體工廠一樣,AI工廠也遵循一個「P x Q」(價格 x 數量)的公式來盈利:其中,P代表每個 Token的價格,Q代表輸入和輸出Token的總量。

但與普通工廠不同,Token的價格是一個可變參數,模型服務商可以根據其他屬性來設定這個價格。

以下,就是幾個關鍵的性能指標(KPI)。

  • 延遲(Latency)或首個Token輸出時間(Time-to-First-Token)

指模型生成第一個Token所需的時長。這也可以理解為模型完成「預填充」階段(即將輸入提示詞編碼到KVCache中)并開始在「解碼」階段生成第一個Token所需的時間。

  • 吞吐量(Throughput)或交互速度(Interactivity)

指生成每個Token的速度,通常以「每個用戶每秒可生成的Token數量」來衡量。

當然,有些服務商也會使用其倒數——即生成每個輸出Token的平均間隔時間(Time Per Output Token, TPOT)。

人類的閱讀速度約為每秒3-5個單詞,而大部分模型服務商設定的輸出速度約為每秒20-60個Token。

  • 上下文窗口(Context Window)

指在模型「遺忘」對話的早期部分、并清除舊的Token之前,其「短期記憶」中能夠容納的Token數量。

不同的應用場景需要大小各異的上下文窗口。

例如,分析大型文檔和代碼庫時,就需要更大的上下文窗口,以確保模型能夠對海量數據進行連貫的推理。


對于任何一個給定的模型,你都可以通過調控這三大KPI,設定出幾乎任何價位的單位Token價格。

因此,單純基于「每百萬Token的價格」($/Mtok)來討論優劣,并沒有什么意義,因為這種方式忽略了具體工作負載的性質,以及用戶對Token的實際需求。

DeepSeek的策略權衡

所以,DeepSeek在R1模型服務上采用了何種Token經濟學策略,以至于市場份額會不斷流失?

通過對比延遲與價格的關系圖,可以看到,在同等延遲水平上,DeepSeek的自有服務已不再是價格最低的選擇。

事實上,DeepSeek之所以能提供如此低廉的價格,一個重要原因在于,用戶等待數秒后,才能收到模型返回的第一個Token。

相比之下,其他服務商的延遲會短得多,價格卻幾乎沒有差別。

也就是說,Token消費者只需花費2-4美元,就能從Parasail或Friendli這類服務商那里,獲得近乎零延遲的體驗。

同樣,微軟Azure的服務價格雖比DeepSeek高2.5倍,但延遲卻減少了整整25秒。

這樣看來,DeepSeek現在面臨的處境就尤為嚴峻了。

原因在于,現在幾乎所有托管R1 0528模型的實例都實現了低于5秒的延遲。


沿用同一圖表,但這次我們將上下文窗口的大小用氣泡面積來表示。

從中可以看到,DeepSeek為了用有限的推理算力資源來提供低價模型,所做的另一項權衡。

他們采用的64K上下文窗口,幾乎是主流模型服務商中最小的之一。

較小的上下文窗口限制了編程等場景的發揮,因為這類任務需要模型能夠連貫地記憶代碼庫中的大量Token,才能進行有效推理。

從圖表中可見,若花費同樣的價格,用戶可以從Lambda和Nebius等服務商那里獲得超過2.5倍的上下文窗口大小。


如果深入硬件層面,在AMD和英偉達芯片上對DeepSeek V3模型的基準測試,就可以看清服務商是如何確定其「每百萬Token價格」($/Mtok)的——

模型服務商會通過在單個GPU或GPU集群上同時處理更多用戶的請求(即「批處理」),來降低單位Token的總成本。

這種做法的直接后果,就是終端用戶需要承受更高的延遲和更慢的吞吐量,從而導致用戶體驗急劇下降。


之所以DeepSeek完全不關心用戶的體驗到底如何,實際上是一種主動作出的戰略選擇。

畢竟,從終端用戶身上賺錢,或是通過聊天應用和API來消耗大量Token,并不是他們的興趣所在。

這家公司的唯一焦點就是實現AGI!

而通過采用極高批處理方式,DeepSeek可以最大限度地減少用于模型推理和對外服務的計算資源消耗,從而將盡可能多的算力保留在公司內部,從而用于研發。

另外還有一點:出口管制也限制了中國AI生態系統在模型服務方面的能力。

因此,對DeepSeek而言,開源就是最合乎邏輯的選擇:將寶貴的計算資源留作內部使用,同時讓其他云服務商去托管其模型,以此贏得全球市場的認知度和用戶基礎。

不過,SemiAnalysis也承認,這卻并沒有削弱中國公司訓練模型的能力——無論是騰訊、阿里、百度,還是小紅書最近發布的新模型,都證明了這一點。

Anthropic也一樣?

和DeepSeek一樣,Anthropic的算力也是同樣受限的。

可以看到,它產品研發的重心顯然放在了編程上,而且已經在Cursor等應用中大放異彩。

Cursor的用戶使用情況,就是評判模型優劣的終極試金石,因為它直接反映了用戶最關心的兩個問題——成本與體驗。

而如今,Anthropic的模型已雄踞榜首超過一年——在瞬息萬變的AI行業里,這個時長仿佛已經如十年。

而在Cursor上大獲成功后,Anthropic立馬順勢推出了Claude Code,一款集成在終端里的編程工具。

它的用戶量一路飆升,將OpenAI的Codex模型遠遠甩在身后。

為了對達Claude Code,谷歌也緊急發布了Gemini CLI。

它與Claude Code功能相似,但因為背靠谷歌TPU,卻有非凡的算力優勢——用戶能免費使用的額度,幾乎無上限。


不過,盡管Claude Code的性能和設計都十分出色,價格卻不菲。

Anthropic在編程上的成功,反而給公司帶來了巨大壓力——他們在算力上已經捉襟見肘。

這一點,在Claude 4 Sonnet的API輸出速度上就已經體現得淋漓盡致。自發布以來,它的生成速度已下降了40%,略高于每秒45個Token。

背后的原因,也和DeepSeek如出一轍——為了在有限的算力下處理所有涌入的請求,他們不得不提高批處理的速率。

此外,編程類的使用場景往往涉及更長的對話和更多的Token數量,這就進一步加劇了算力的緊張狀況。

無論是何種原因,像o3和Gemini 2.5 Pro這類對標模型的運行速度要快得多,這也反映出OpenAI和谷歌所擁有的算力規模要龐大得多。


現在,Anthropic正集中精力獲取更多算力,已經和亞馬遜達成了協議。它將獲得超過五十萬枚Trainium芯片,用于模型訓練和推理。

另外,Claude 4模型并非在AWS Trainium上預訓練的,而是在GPU和TPU上訓練。

速度劣勢可由效率彌補

Claude 的生成速度雖然暴露了其算力上的局限,但總體而言,Anthropic的用戶體驗(UX)要優于 DeepSeek。

  • 首先,其速度雖然偏低,但仍快于DeepSeek的每秒25個Token。

  • 其次,Anthropic的模型回答同一個問題所需的Token數量遠少于其他模型。

這意味著,盡管生成速度不占優,用戶實際感受到的端到端響應時間反而顯著縮短了。

值得一提的是,在所有領先的推理模型中,Claude的總輸出Token量是最低的。

相比之下,Gemini 2.5 Pro和DeepSeek R1 0528等模型的輸出內容,「啰嗦」程度都是Claude的三倍以上。

Token經濟學的這一方面揭示出,服務商正在從多個維度上改進模型,其目標不再僅僅是提升智能水平,而是致力于提高「每單位Token所承載的智能」。


隨著Cursor、Windsurf、Replit、Perplexity等一大批「GPT套殼」應用(或稱由AI Token驅動的應用)迅速流行并獲得主流市場的認可。

我們看到,越來越多的公司開始效仿Anthropic的模式,專注于將Token作為一種服務來銷售,而不是像ChatGPT那樣以月度訂閱的方式打包。

參考資料:

https://semianalysis.com/2025/07/03/deepseek-debrief-128-days-later/


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
金正恩訪問越南,乘專列耗時65時40分,為什么不坐飛機?大有講究

金正恩訪問越南,乘專列耗時65時40分,為什么不坐飛機?大有講究

文史達觀
2025-07-05 06:45:03
當年說出“不是你撞的,干嘛去扶”的法官,19年后,他過得怎樣?

當年說出“不是你撞的,干嘛去扶”的法官,19年后,他過得怎樣?

坦然風云
2025-03-26 14:38:55
49歲小因扎吉咆哮抗議!2次巨大爭議:點球變假摔 含冤出局

49歲小因扎吉咆哮抗議!2次巨大爭議:點球變假摔 含冤出局

葉青足球世界
2025-07-05 06:01:01
國家衛健委:醫生薪酬改革加速,績效為王的日子結束了!

國家衛健委:醫生薪酬改革加速,績效為王的日子結束了!

醫脈圈
2025-07-05 12:06:04
韓紅撞臉Labubu玩偶,本人認證:這太像了!

韓紅撞臉Labubu玩偶,本人認證:這太像了!

紅星新聞
2025-07-03 16:21:21
有情有義!利物浦決定承擔若塔剩余2年1400萬鎊薪資 支付給其家人

有情有義!利物浦決定承擔若塔剩余2年1400萬鎊薪資 支付給其家人

我愛英超
2025-07-05 10:37:58
朱拉尼僅僅用了半年時間,家族帝國已經建立,在敘利亞站穩了腳跟

朱拉尼僅僅用了半年時間,家族帝國已經建立,在敘利亞站穩了腳跟

阿芒娛樂說
2025-07-05 05:36:44
4種身體的求救信號,你聽懂了嗎

4種身體的求救信號,你聽懂了嗎

十點讀書
2025-07-04 19:33:27
普京都驚嘆:泰國流亡女總理變成中國公司董事長,其傳奇讓人稱贊

普京都驚嘆:泰國流亡女總理變成中國公司董事長,其傳奇讓人稱贊

boss外傳
2025-07-04 21:10:03
2025“強基”錄取第一校!北航公布錄取線和錄取標準,你上線了嗎

2025“強基”錄取第一校!北航公布錄取線和錄取標準,你上線了嗎

史海流年號
2025-07-05 10:24:40
很重要!近兩年不要買車!

很重要!近兩年不要買車!

七叔東山再起
2025-07-04 20:52:04
最近天氣為何這么熱?山東還要熱多久?

最近天氣為何這么熱?山東還要熱多久?

日照日報
2025-07-05 19:02:38
破產的二代和跳樓的機長,租二代碰上飛二代

破產的二代和跳樓的機長,租二代碰上飛二代

美第奇效應
2025-07-04 21:11:48
新人佐藤衣栞正式出道,第一部作品yyds,你有看過嗎?

新人佐藤衣栞正式出道,第一部作品yyds,你有看過嗎?

說真話的小陳
2025-07-05 10:03:11
房地產如何透支50年社會財富?留下的除了房奴老賴還有什么?

房地產如何透支50年社會財富?留下的除了房奴老賴還有什么?

詩意世界
2025-07-04 19:14:18
三大贏家!三大輸家!ESPN評休賽期操作,湖人拉胯,雄鹿激進

三大贏家!三大輸家!ESPN評休賽期操作,湖人拉胯,雄鹿激進

籃球圈里的那些事
2025-07-05 21:37:45
“蘇超”觀眾人數紀錄再刷新,南京主場觀眾達60396人

“蘇超”觀眾人數紀錄再刷新,南京主場觀眾達60396人

澎湃新聞
2025-07-05 21:16:27
聽我一句勸:不要買續航700km以上的純電車,這些坑你根本扛不住

聽我一句勸:不要買續航700km以上的純電車,這些坑你根本扛不住

侃故事的阿慶
2025-07-05 04:23:42
金正恩豁出去了,比普京還狠,派3萬朝鮮精銳,俄緊急改裝運輸機

金正恩豁出去了,比普京還狠,派3萬朝鮮精銳,俄緊急改裝運輸機

文雅筆墨
2025-07-05 00:40:16
被外界嚴重低估的泰王:花心蒼老都是偽裝,毫不費力讓余瓦達團滅

被外界嚴重低估的泰王:花心蒼老都是偽裝,毫不費力讓余瓦達團滅

生活新鮮市
2025-07-04 11:57:55
2025-07-05 21:56:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12996文章數 66082關注度
往期回顧 全部

科技要聞

盤古團隊回應抄襲事件:嚴格遵循開源要求

頭條要聞

繼越南之后 柬埔寨宣布與美國達成關稅協議

頭條要聞

繼越南之后 柬埔寨宣布與美國達成關稅協議

體育要聞

史上最真實的F1電影,是怎么拍出來的?

娛樂要聞

汪小菲帶娃出游 馬筱梅小玥兒感情超好

財經要聞

特朗普簽署 美國萬億減稅支出法來了

汽車要聞

31.6萬元起售 蔚來新ET5/ET5T/EC6冠軍紀念版上市

態度原創

親子
房產
健康
藝術
公開課

親子要聞

6 歲左右孩子突然小便失禁,寶媽們要高度警惕!!

房產要聞

湖畔微醺夜,與全球大生活家共赴世界莊園理想生活之約

呼吸科專家破解呼吸道九大謠言!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 颍上县| 休宁县| 德庆县| 多伦县| 永修县| 二连浩特市| 星子县| 黄龙县| 兴宁市| 阳东县| 铁力市| 博客| 临夏市| 凤凰县| 武功县| 宜章县| 彝良县| 景宁| 龙泉市| 偃师市| 沭阳县| 兴山县| 扶沟县| 永兴县| 资溪县| 增城市| 高台县| 斗六市| 平泉县| 芮城县| 漠河县| 大连市| 闻喜县| 香港 | 精河县| 辽阳市| 平利县| 广汉市| 古丈县| 交城县| 通城县|