西風 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
用1/8成本比肩Claude 3.7,剛剛,“歐洲OpenAI”Mistral AI發(fā)布多模態(tài)新模型。
MistralMedium3,主打編程和多模態(tài)理解,且在性能和成本間進行了平衡。
官方稱,在各類基準測試中,Mistral Medium 3性能達到或超越Claude Sonnet 3.7的90%,且成本大大降低。
Claude 3.7 Sonnet的價格為每百萬輸入token 3美元,每百萬輸出token 15美元,而Mistral Medium 3:
每百萬輸入token僅0.4美元,每百萬輸出token 2美元
整體性能,不管是和領(lǐng)先開源模型Llama 4 Maverick還是和企業(yè)級模型Cohere Command A相比,Mistral Medium 3都能打得有來有回。
目前,Mistral Medium 3 API已在Mistral La Plateforme和Amazon Sagemaker上線,不久后還將在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。
具備一系列企業(yè)級能力
下面具體來看看基準測試。
Mistral Medium 3在編程和STEM任務中尤為突出。
官方原話是“其性能甚至接近非常大且運行速度慢得多的競爭對手”。
不過呢,既不開放模型權(quán)重,也沒有透露模型大小
另外,Mistral AI還發(fā)布了第三方人類評估。
人類評估中,Mistral Medium 3依舊是在編程方面占優(yōu)勢。
在多模態(tài)和其他人語言任務中,相比Llama 4 Maverick,Mistral Medium 3的表現(xiàn)也占上風。
除了測試數(shù)據(jù)之外,官方還特別強調(diào)了其適應企業(yè)環(huán)境的能力,包括:
- 混合部署或本地 / 虛擬私有云(VPC)內(nèi)部署
- 定制化后期訓練
- 與企業(yè)工具和系統(tǒng)集成
企業(yè)可以輕松將智能全面集成到系統(tǒng)中,借助Mistral的應用AI解決方案,該模型可以持續(xù)進行預訓練、全面微調(diào),并融入企業(yè)知識庫,使其成為針對特定領(lǐng)域訓練、持續(xù)學習和自適應工作流程的高保真解決方案。
官方稱,金融服務、能源和醫(yī)療保健領(lǐng)域的客戶正在使用該模型測試,通過深入的背景信息來豐富客戶服務、實現(xiàn)業(yè)務流程的個性化,并對復雜的數(shù)據(jù)集進行分析。
另外,他們還推出了Le Chat Enterprise,這是一項面向企業(yè)的聊天機器人服務,提供了AI Agent建造器之類的工具,并將Mistral的模型與Gmail、Google Drive、SharePoint等第三方服務集成。
據(jù)了解,Le Chat Enterprise將很快支持 MCP。
Mistral Medium 3發(fā)布后引發(fā)大批網(wǎng)友關(guān)注,有網(wǎng)友為其“高性價比”點贊。
不過也有不少網(wǎng)友吐槽模型沒說開源結(jié)果又高調(diào)地和開源模型比較,有點奇怪。
還有行動派網(wǎng)友,想看什么自己比較。
StabilityAI創(chuàng)始人翻出了Gemini 2.5 Flash的基準測試結(jié)果:
看后表示:
- 與Gemini 2.5 Flash競爭是多么困難,Gemini 2.5 Flash成本比Mistral Medium 3低70%。
- 期待開源模型的發(fā)布,這是Mistral的關(guān)鍵優(yōu)勢。
One More Thing
繼三月份推出Mistral Small、今日推出Mistral Medium后,Mistral AI透露接下來幾周正著手開發(fā)“大型”項目。
[1]https://mistral.ai/news/mistral-medium-3
[2]https://x.com/MistralAI/status/1920119463430500541
[3]https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.