AI 工具聚合平臺 Poe 發布了其最新一期的人工智能模型使用趨勢報告。這次的報告分析匯總了從 2025 年 1 月至 2025 年 5 月期間,Poe 用戶在文本、推理、圖像、視頻和音頻領域的每周使用數據。
在各種能力測評榜單之下,模型在真實場景下的能力如何?哪些模型更好用?Poe 的報告數據,反映了用戶使用大模型時的一些真實需求和使用模式。
報告得出的幾個核心觀察點:
隨著時間的發展,DeepSeek 模型的「爆紅期」已經過去,同時其他定價合理、支持長上下文的推理模型也陸續發布, DeepSeek R1 的消息份額從 2 月中旬的 7% 峰值下降到 4 月底的 3%。
同一提供商發布的新一代旗艦模型往往會搶占其上一代模型/產品的市場份額。在此趨勢下,Poe 訂閱用戶會迅速地轉向使用新一代模型;
在 Poe 中,用戶發給推理模型的文本消息總份額從約 2%上升到了約 10%,在 DeepSeek 熱度高峰期達到頂峰。具備混合推理能力的模型已初步得到應用,但目前在子類別中的總體使用量仍然較小,占比約為 1%。
GPT 圖像生成模型 GPT-Image-1 于 4 月末開放了 API 接口。在短短兩周時間內,該模型的圖像生成使用率迅速達到了 17%;
快手發布的視頻生成模型 Kling-2.0-Master 在其發布后的三周內,在 Poe 的所有視頻生成請求中占比迅速達到了 21%;
在音頻生成領域,ElevenLabs 更受用戶青睞,處理了約 80% 的訂閱用戶的 TTS 請求。
Founder Park 正在搭建「AI 產品市集」社群,邀請從業者、開發人員和創業者,掃碼加群:
進群后,你有機會得到:
最新、最值得關注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準的AI產品曝光渠道
01
模型新版本推出速度太快,
市場份額消長明顯
隨著 OpenAI 的 GPT-4.1 系列和谷歌的 Gemini 2.5 Pro 模型在編程任務中的能力表現的提升,兩者在發布后數周內的消息份額迅速增長,分別接近 10%和 5%。
與此同時,Anthropic 的 Claude 系列模型(例如 Claude 3.5 Sonnet 和 Claude 3.7 Sonnet)在同一時期內受到影響,絕對份額下降了接近 10%。
隨著時間的發展,DeepSeek 模型的「爆紅期」已經過去,同時其他定價合理、支持長上下文的推理模型也陸續發布, DeepSeek R1 的消息份額從 2 月中旬的 7% 峰值下降到 4 月底的 3%。
與 Poe 在今年 3 月發布的上一份報告的觀察類似,我們發現到同一提供商發布的新一代旗艦模型往往會搶占其上一代模型/產品的市場份額。在此趨勢下,Poe 訂閱用戶迅速地轉向使用新一代模型 Claude-3.7-Sonnet,但 Claude-3.5-Sonnet 在大語言模型中仍保持了約 12% 的總體使用率。
02
推理模型勢頭正勁,
市場份額顯著擴大
2025 年以來,前沿實驗室推出了更多能夠投入時間和計算資源以更精準、更可靠地處理復雜任務的模型。推理模型的數量顯著增加。
值得注意的是,在 Poe 中,用戶發給推理模型的文本消息總份額從約 2%上升到了約 10%,在 DeepSeek 熱度高峰期達到頂峰。
以下是具備推理能力的模型在文本消息中的份額占比情況。
在 Poe 訂閱用戶中, Gemini 2.5 Pro 的使用量迅速增長,該模型發布后的 6 周里,獲得了約 30%的推理消息份額。
OpenAI 在 2024 年末發布了具有標志性意義的推理模型 o1-preview 后,隨后又迅速推出了一些性能更強大且價格更合理的推理模型,在 2025 年相繼發布了 o1-pro、o3-mini、o3-mini-high、o3 和 o4-mini。
在 OpenAI 的推理模型中,訂閱用戶正迅速轉向使用 OpenAI 最新發布的模型,例如,從 o3-mini 到 o4-mini,從 o1 到 o3。
2025 年 2 月,xAI 的 Grok 3 公開發布時,模型在多項問題解決基準測試中表現出色, Grok-3-mini 仍然是該系列中唯一支持通過 xAI API 進行推理的模型,這或許是導致其在推理模型總使用量中占比不足 1% 的一個因素。
我們注意到,具備混合推理能力的模型已初步得到應用,例如 Gemini 2.5 Flash Preview 和 Qwen 3,這些模型能夠根據對話內容靈活調整推理能力,并支持受控決策。但目前它們在子類別中的總體使用量仍然較小,占比約為 1%。
03
隨著生成質量和準確性的提升,
圖像生成模型競爭加劇
GPT 圖像生成模型 GPT-Image-1 于 4 月末開放了 API 接口。在短短兩周時間內,該模型的圖像生成使用率迅速達到了 17%。
谷歌的 Imagen 3 系列模型在 2025 年期間使用量穩定增長,從約 10% 增長至 30%,其使用率與 Black Forest Labs 的 FLUX 系列圖像生成模型大致持平,后者在 4 月最后一周的總市場份額約為 35%。
圖像生成領域的 FLUX 家族在 Poe 平臺上的總使用份額出現了小幅下滑,從約 45% 降至約 35%,但在整體市場中的份額依然可觀。
04
視頻生成領域「黑馬」:
Kling 2.0 三周內迅速占據三成的使用份額
在視頻方面,快手發布的 Kling 視頻生成系列模型迅速占據了約 30% 的使用份額,特別是 Kling-2.0-Master 模型,該模型在 2025 年 4 月末發布后的三周內,在 Poe 的所有視頻生成請求中占比達到了 21%。
谷歌的 Veo 2 模型在今年 2 月發布后的幾個月時間內,保持了約 20% 的強勁使用份額。
作為定義視頻生成領域的先行者, Runway 在報告期內的使用份額下降了約 40%,跌至了約 20%。
05
ElevenLabs 保持領先,
音頻生成領域新玩家競爭激烈
在音頻生成領域(尤其是文本轉語音,TTS), ElevenLabs 更受用戶青睞,處理了約 80% 的訂閱用戶的 TTS 請求。
同時,音頻生成領域的競爭也十分激烈,例如 Cartesia、 Unreal Speech、 PlayAI 和 Orpheus 等,這些平臺提供了獨特的聲音選項、音效以及不同的性能和價格方案。
注:
[1] 所有用戶信息均按照 Poe 的隱私政策進行處理,該政策明確禁止模型提供方將用戶通過 Poe 提交的任何輸入用于模型訓練。
[2] 我們歡迎各界對我們的方法論提出任何評論或批評。所有展示的使用數據均基于 Poe 訂閱用戶的使用行為。圖表中每個條形代表一周(從周一到周日)的使用數據。所有圖表的數據均已標準化為百分比份額,以便更好地反映模型在訂閱用戶總使用量中的相對占比,并控制總訂閱用戶數隨時間增長帶來的影響。需要注意的是,在報告期間模型的價格點可能發生變化,這或許會對使用情況產生影響。在進行文本模式分析時,發送給 Poe 助手機器人的消息已被排除在外,這是為了更準確地體現用戶對特定命名模型的明確偏好和需求所驅動的使用情況。
[3] 在文本消息份額圖中,GPT-4.1 涵蓋 GPT-4.1、GPT-4.1-mini 和 GPT-4.1-nano;GPT-4o 包含 GPT-4o、ChatGPT-4o-最新 和 GPT-4o-mini;GPT-4 包含 GPT-4-Classic 和 GPT-4-Turbo;o1 包含 o1、o1-預覽 和 o1-mini;o3 包含 o3、o3-mini 和 o3-mini-high;Claude-3.7-Sonnet 分組包含所有發送給 Claude-3.7-Sonnet 和 Claude-3.7-Sonnet-推理 的消息,不論其是否被標記為推理請求;而在專門的推理類別統計中,只有推理參數(如推理 token 數)設定為非零值的請求才會被計入;Gemini-2.5 包含其 Pro 和 Flash 變體;Gemini-2.0 包含 Gemini-2.0-Flash、Gemini-2.0-Flash-Lite 和 Gemini-2.0-Flash-Exp;Gemini-1.5 包含其 Pro 和 Flash 變體;Grok-3 包含 Grok-3 和 Grok-3-Mini。
[4] 為更準確地反映用戶直接的偏好和需求,由 Poe 平臺的動畫按鈕或其他自動后續操作觸發的視頻生成請求已在此分析中排除。
[5] 截至本報告發布時, Poe 平臺上的 Runway 機器人仍連接到 Gen-3-Alpha-Turbo API 端點,尚未更新至 Gen-4-Alpha-Turbo 端點。
[6] 為更準確地體現用戶直接的偏好和需求,由 Poe 平臺的說話按鈕或其他自動后續操作觸發的音頻生成請求已在此分析中排除。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.