2025 年已經過半, 文本生成大模型是否已經進入下半場了? OpenAI 完全不重視 API 市場? Grok3 根本沒人用? 「大模型戰」未來的走向如何?
近期,推特博主「karminski-牙醫」發布了一篇關于 2025 年上半年大模型 API 市場數據分析帖子,基于 OpenRouter 數據,「karminski-牙醫」分析了上半年大模型的總 Token 使用量排名及趨勢、不同大模型的市場份額占比、細分領域模型的應用偏好、以及 API 接口使用趨勢,得出了一些非常有趣的觀察結論。以下為具體分析內容。
來源:https://x.com/karminski3/status/1942612077241311386
超 9000 人的「AI 產品市集」社群!不錯過每一款有價值的 AI 應用。
邀請從業者、開發人員和創業者,飛書掃碼加群:
進群后,你有機會得到:
最新、最值得關注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準的AI產品曝光渠道
01一季度 AI 總 Token 使用量增長近 4 倍,存在活躍長尾需求
首先,我們來看看最熱門模型的趨勢。最新數據顯示,Gemini-2.0-Flash 排在首位,其次是 Claude-Sonnet-4,然后是 Gemini-2.5-Flash-Preview-0520。
排在第 4 位和第 5 位的分別為 DeepSeek V3 0324 的免費版和付費版,如果將兩者的使用量加在一起,DeepSeek-V3 的使用量可能達到第二名的水平。
此外,我們還可以從趨勢圖中得出一些獨特的觀察結論:
2025 年第一季度,AI 出現絕對的爆發式增長,2025年第一季度 OpenRouter 的總 Token 使用量相較于上一季度增長四倍,之后穩定在每周 2T Token 的水平。此后沒有再顯著增長的情況。
其他模型的用量在第一季度爆發后,穩定在了 600-700B Token 的使用量。這個情況在一定程度上反映了市場需求的多樣性,龐大的長尾量證明了模型市場的活躍度,以及存在細分需求。
DeepSeek-V3 自發布以來,一直穩定在 Top 10 中,用戶留存率極高。
Gemini-2.0-Flash 因為其低定價(輸出每百萬 Token 0.4 美元)、大容量和速度快等特點,保持了非常穩定的使用量,一直排在模型用量的前三位。
Gemini-2.5-Flash 勢頭強勁,考慮到它很可能在價格下降后取代 Gemini-2.0-Flash,谷歌的模型策略定位非常好。
Gemini-2.5-Pro 取代了之前的實驗版本,但使用量沒有顯著增長。
Claude-3.5-Sonnet 在今年 3 月底完成了其歷史使命,而 Claude-3.7-Sonnet 也正接近其生命周期的尾聲。
Claude-Sonnet-4 現在已經接替了之前 Claude 系列模型的市場位置,但其使用量保持穩定,沒有持續顯著增長。
OpenAI 的模型無法保證每周使用量能有一款穩定保持在 Top 10。
GPT-4o-mini 的使用量波動很大,尤其是在 5 月份表現突出,可能源自于 OpenAI 市場營銷的結果。
02谷歌 Gemini 系列穩居市場份額第一,OpenAI 波動明顯
市場份額方面,谷歌以 43.1%的份額穩居第一,DeepSeek 和 Anthropic 分別以 19.6%和 18.4%的份額占比位列第二和第三。
從市場份額數據中,我們發現:
谷歌目前正在強勢擠壓屬于 Anthropic 的市場份額。
DeepSeek 自 DeepSeek-V3 發布以來,一直保持著一定的市場份額,并且在持續擴大。
OpenAI 的份額波動尤其劇烈,盡管排名第四,但和前一名 Anthropic 差距顯著。
Llama 的份額持續萎縮,已縮減至其峰值的約五分之一。
其他模型的總份額占比不超過 10%。
專注于微調模型的組織 Gryphe 已經在排名上消失了 ,Gryphe 基于 llama2 模型微調的 MythoMax13B 模型曾一度在 AI 角色扮演場景中特別受歡迎。
03四家巨頭分占不同細分領域
在細分領域模型的用量數據方面,我們發現:
在編程領域,Claude-Sonnet-4 是絕對的領先者,占據 44.5%的份額,其次是 Gemini-2.5-Pro。
在文本翻譯領域,Gemini-2.0-Flash 占據絕對優勢,主要是源于其用量大、價格實惠且速度快。此外,還有一個令人驚訝的發現是,排名中除了第二名占據 20%份額的模型外,前幾名中有七款都是谷歌的模型。推測部分翻譯軟件可能已經默認集成谷歌模型。
在角色扮演領域,市場呈現高度碎片化的現狀,小眾模型合計占據 26.6%的份額。其次是 DeepSeek 憑借高幻覺傾向,在角色扮演領域領先。第三名則是價格實惠、用量大的 Gemini-2.0-Flash。
在營銷領域,GPT-4o 是無可爭議的絕對領先者,擁有 32.5%的份額,這可能反映了 OpenAI 在非編程專業領域的訓練相當有效,用戶確實很喜歡 GPT-4o 的輸出。
編程領域的模型調用量
翻譯領域的模型調用量
角色扮演領域的模型調用量
市場營銷領域的模型調用量
04API接口使用趨勢:代碼編寫工具占據主流
最后,來看看大家在 OpenRouter 上主要使用哪些接口(界面):
排在前兩名的是 Cline 和 RooCode,兩者都主要用于編寫代碼。
第三名是 liteLLM,這是一個用于構建各種應用程序的路由庫。
第四名 KiloCode,同樣是用于編寫代碼。
第五名是 SillyTavern,這是一個類似于 Ollama 的本地大型語言模型(LLM)接口,可以通過它連接并與大模型進行交互。
05總體觀察
基于以上數據觀察,我們得出了幾點結論:
目前,谷歌幾乎占據了大模型 API 市場近一半的份額,其解決方案模型覆蓋多個領域,甚至包括價格實惠、價值高的 Gemini-2.0-Flash(比 DeepSeek 更便宜)。
Anthropic 則專注于編程領域,其 Claude-3.5、Claude-3.7 和 Claude-4 模型實現了新舊版本之間的平穩過渡。
OpenAI 在大模型 API 市場的表現并不強勢,可能由于多種限制因素,比如最新版的模型需要在其官網申請 AccessKey,或者定價問題等。
DeepSeek 模型擁有強大的用戶粘性。令人驚訝的是,DeepSeek-V3 在市場中最受歡迎而不是 DeepSeek-R1,可能是由于 DeepSeek-R1 可能需要過長的處理時間,首個有效 Token 輸出過慢,導致用戶量不如 V3。
Meta 的 Llama 系列模型已經日漸式微。
Mistral AI 的模型出人意料地占據了大約 3%的市場份額,就我個人接觸到 Mistral AI 用戶的范圍相對有限,主要是一些喜歡微調開源模型的歐洲用戶。
X-AI 的 Grok 系列模型雖然取得了一些進展,但市場定位不明確。如果 X-AI 的目標是成為 SOTA 模型,那他們還有很長的路要走。
通義千問(Qwen)系列模型占據了 1.6%的市場份額,需要繼續努力。
轉載原創文章請添加微信:founderparker
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.