網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

2025年哪款模型最受歡迎？Poe最新報告：DeepSeek降溫、可靈成黑馬

2025-05-15 19:39:24　來源: FounderPark

北京舉報

分享至

AI 工具聚合平臺 Poe 發(fā)布了其最新一期的人工智能模型使用趨勢報告。這次的報告分析匯總了從 2025 年 1 月至 2025 年 5 月期間，Poe 用戶在文本、推理、圖像、視頻和音頻領域的每周使用數(shù)據(jù)。

在各種能力測評榜單之下，模型在真實場景下的能力如何？哪些模型更好用？Poe 的報告數(shù)據(jù)，反映了用戶使用大模型時的一些真實需求和使用模式。

報告得出的幾個核心觀察點：

隨著時間的發(fā)展，DeepSeek 模型的「爆紅期」已經(jīng)過去，同時其他定價合理、支持長上下文的推理模型也陸續(xù)發(fā)布， DeepSeek R1 的消息份額從 2 月中旬的 7% 峰值下降到 4 月底的 3%。
同一提供商發(fā)布的新一代旗艦模型往往會搶占其上一代模型/產(chǎn)品的市場份額。在此趨勢下，Poe 訂閱用戶會迅速地轉(zhuǎn)向使用新一代模型；
在 Poe 中，用戶發(fā)給推理模型的文本消息總份額從約 2%上升到了約 10%，在 DeepSeek 熱度高峰期達到頂峰。具備混合推理能力的模型已初步得到應用，但目前在子類別中的總體使用量仍然較小，占比約為 1%。
GPT 圖像生成模型 GPT-Image-1 于 4 月末開放了 API 接口。在短短兩周時間內(nèi)，該模型的圖像生成使用率迅速達到了 17%；
快手發(fā)布的視頻生成模型 Kling-2.0-Master 在其發(fā)布后的三周內(nèi)，在 Poe 的所有視頻生成請求中占比迅速達到了 21%；
在音頻生成領域，ElevenLabs 更受用戶青睞，處理了約 80% 的訂閱用戶的 TTS 請求。

Founder Park 正在搭建「AI 產(chǎn)品市集」社群，邀請從業(yè)者、開發(fā)人員和創(chuàng)業(yè)者，掃碼加群：

進群后，你有機會得到：

最新、最值得關(guān)注的 AI 新品資訊；
不定期贈送熱門新品的邀請碼、會員碼；
最精準的AI產(chǎn)品曝光渠道

模型新版本推出速度太快，

市場份額消長明顯

隨著 OpenAI 的 GPT-4.1 系列和谷歌的 Gemini 2.5 Pro 模型在編程任務中的能力表現(xiàn)的提升，兩者在發(fā)布后數(shù)周內(nèi)的消息份額迅速增長，分別接近 10%和 5%。

與此同時，Anthropic 的 Claude 系列模型（例如 Claude 3.5 Sonnet 和 Claude 3.7 Sonnet）在同一時期內(nèi)受到影響，絕對份額下降了接近 10%。

隨著時間的發(fā)展，DeepSeek 模型的「爆紅期」已經(jīng)過去，同時其他定價合理、支持長上下文的推理模型也陸續(xù)發(fā)布， DeepSeek R1 的消息份額從 2 月中旬的 7% 峰值下降到 4 月底的 3%。

與 Poe 在今年 3 月發(fā)布的上一份報告的觀察類似，我們發(fā)現(xiàn)到同一提供商發(fā)布的新一代旗艦模型往往會搶占其上一代模型/產(chǎn)品的市場份額。在此趨勢下，Poe 訂閱用戶迅速地轉(zhuǎn)向使用新一代模型 Claude-3.7-Sonnet，但 Claude-3.5-Sonnet 在大語言模型中仍保持了約 12% 的總體使用率。

推理模型勢頭正勁，

市場份額顯著擴大

2025 年以來，前沿實驗室推出了更多能夠投入時間和計算資源以更精準、更可靠地處理復雜任務的模型。推理模型的數(shù)量顯著增加。

值得注意的是，在 Poe 中，用戶發(fā)給推理模型的文本消息總份額從約 2%上升到了約 10%，在 DeepSeek 熱度高峰期達到頂峰。

以下是具備推理能力的模型在文本消息中的份額占比情況。

在 Poe 訂閱用戶中， Gemini 2.5 Pro 的使用量迅速增長，該模型發(fā)布后的 6 周里，獲得了約 30%的推理消息份額。

OpenAI 在 2024 年末發(fā)布了具有標志性意義的推理模型 o1-preview 后，隨后又迅速推出了一些性能更強大且價格更合理的推理模型，在 2025 年相繼發(fā)布了 o1-pro、o3-mini、o3-mini-high、o3 和 o4-mini。

在 OpenAI 的推理模型中，訂閱用戶正迅速轉(zhuǎn)向使用 OpenAI 最新發(fā)布的模型，例如，從 o3-mini 到 o4-mini，從 o1 到 o3。

2025 年 2 月，xAI 的 Grok 3 公開發(fā)布時，模型在多項問題解決基準測試中表現(xiàn)出色， Grok-3-mini 仍然是該系列中唯一支持通過 xAI API 進行推理的模型，這或許是導致其在推理模型總使用量中占比不足 1% 的一個因素。

我們注意到，具備混合推理能力的模型已初步得到應用，例如 Gemini 2.5 Flash Preview 和 Qwen 3，這些模型能夠根據(jù)對話內(nèi)容靈活調(diào)整推理能力，并支持受控決策。但目前它們在子類別中的總體使用量仍然較小，占比約為 1%。

隨著生成質(zhì)量和準確性的提升，

圖像生成模型競爭加劇

GPT 圖像生成模型 GPT-Image-1 于 4 月末開放了 API 接口。在短短兩周時間內(nèi)，該模型的圖像生成使用率迅速達到了 17%。

谷歌的 Imagen 3 系列模型在 2025 年期間使用量穩(wěn)定增長，從約 10% 增長至 30%，其使用率與 Black Forest Labs 的 FLUX 系列圖像生成模型大致持平，后者在 4 月最后一周的總市場份額約為 35%。

圖像生成領域的 FLUX 家族在 Poe 平臺上的總使用份額出現(xiàn)了小幅下滑，從約 45% 降至約 35%，但在整體市場中的份額依然可觀。

視頻生成領域「黑馬」：

Kling 2.0 三周內(nèi)迅速占據(jù)三成的使用份額

在視頻方面，快手發(fā)布的 Kling 視頻生成系列模型迅速占據(jù)了約 30% 的使用份額，特別是 Kling-2.0-Master 模型，該模型在 2025 年 4 月末發(fā)布后的三周內(nèi)，在 Poe 的所有視頻生成請求中占比達到了 21%。

谷歌的 Veo 2 模型在今年 2 月發(fā)布后的幾個月時間內(nèi)，保持了約 20% 的強勁使用份額。

作為定義視頻生成領域的先行者， Runway 在報告期內(nèi)的使用份額下降了約 40%，跌至了約 20%。

ElevenLabs 保持領先，

音頻生成領域新玩家競爭激烈

在音頻生成領域（尤其是文本轉(zhuǎn)語音，TTS）， ElevenLabs 更受用戶青睞，處理了約 80% 的訂閱用戶的 TTS 請求。

同時，音頻生成領域的競爭也十分激烈，例如 Cartesia、 Unreal Speech、 PlayAI 和 Orpheus 等，這些平臺提供了獨特的聲音選項、音效以及不同的性能和價格方案。

注：

[1] 所有用戶信息均按照 Poe 的隱私政策進行處理，該政策明確禁止模型提供方將用戶通過 Poe 提交的任何輸入用于模型訓練。

[2] 我們歡迎各界對我們的方法論提出任何評論或批評。所有展示的使用數(shù)據(jù)均基于 Poe 訂閱用戶的使用行為。圖表中每個條形代表一周（從周一到周日）的使用數(shù)據(jù)。所有圖表的數(shù)據(jù)均已標準化為百分比份額，以便更好地反映模型在訂閱用戶總使用量中的相對占比，并控制總訂閱用戶數(shù)隨時間增長帶來的影響。需要注意的是，在報告期間模型的價格點可能發(fā)生變化，這或許會對使用情況產(chǎn)生影響。在進行文本模式分析時，發(fā)送給 Poe 助手機器人的消息已被排除在外，這是為了更準確地體現(xiàn)用戶對特定命名模型的明確偏好和需求所驅(qū)動的使用情況。

[3] 在文本消息份額圖中，GPT-4.1 涵蓋 GPT-4.1、GPT-4.1-mini 和 GPT-4.1-nano；GPT-4o 包含 GPT-4o、ChatGPT-4o-最新和 GPT-4o-mini；GPT-4 包含 GPT-4-Classic 和 GPT-4-Turbo；o1 包含 o1、o1-預覽和 o1-mini；o3 包含 o3、o3-mini 和 o3-mini-high；Claude-3.7-Sonnet 分組包含所有發(fā)送給 Claude-3.7-Sonnet 和 Claude-3.7-Sonnet-推理的消息，不論其是否被標記為推理請求；而在專門的推理類別統(tǒng)計中，只有推理參數(shù)（如推理 token 數(shù)）設定為非零值的請求才會被計入；Gemini-2.5 包含其 Pro 和 Flash 變體；Gemini-2.0 包含 Gemini-2.0-Flash、Gemini-2.0-Flash-Lite 和 Gemini-2.0-Flash-Exp；Gemini-1.5 包含其 Pro 和 Flash 變體；Grok-3 包含 Grok-3 和 Grok-3-Mini。

[4] 為更準確地反映用戶直接的偏好和需求，由 Poe 平臺的動畫按鈕或其他自動后續(xù)操作觸發(fā)的視頻生成請求已在此分析中排除。

[5] 截至本報告發(fā)布時， Poe 平臺上的 Runway 機器人仍連接到 Gen-3-Alpha-Turbo API 端點，尚未更新至 Gen-4-Alpha-Turbo 端點。

[6] 為更準確地體現(xiàn)用戶直接的偏好和需求，由 Poe 平臺的說話按鈕或其他自動后續(xù)操作觸發(fā)的音頻生成請求已在此分析中排除。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.