網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Mistral的首個強推理模型：擁抱開源，推理速度快10倍

2025-06-11 14:16:26　來源: 機器之心Pro

北京舉報

分享至

機器之心報道

編輯：澤南

強推理終于要卷速度了。

大模型強推理賽道，又迎來一位重量級玩家。

本周二，歐洲人工智能公司 Mistral AI 發(fā)布了 Magistral，這是一個全新的大語言模型（LLM）系列，展現(xiàn)了強大的推理能力。它能夠進行不斷反思，并解決更復雜的任務。

此次發(fā)布包含兩個版本：面向企業(yè)客戶的大型專有模型 Magistral Medium，以及一個 24B 參數(shù)的開源版本 Magistral Small。其中開源版本使用 Apache 2.0 許可，可以自由使用、商用化；Magistral Medium 則可通過 Mistral 的 Le Chat 界面和 La Plateforme API 訪問。

直接使用：https://chat.mistral.ai/chat
模型開源：https://huggingface.co/mistralai/Magistral-Small-2506
論文：https://mistral.ai/static/research/magistral.pdf

在基準測試中，新模型取得了不錯的成績。這里主要是 Magistral 與其前身 Mistral-Medium 3 和 DeepSeek 系列的對比。Magistral Medium 在 AIME2024 上的得分為 73.6%，其中多數(shù)投票為 64%，得分為 90%。Magistral Small 的得分分別為 70.7% 和 83.3%。

新模型在一些其他高要求測試中也表現(xiàn)出色，包括研究生水平的問答基準測試 GPQA Diamond 和用于編程挑戰(zhàn)的 LiveCodeBench。

Mistral 進一步展示了一些實際使用的案例。

Magistral Medium 展示了自身的編程能力，一次生成輸出的代碼就能模擬出重力、摩擦力。

除了通過 Benchmark 和編程等「必考題」，Magistral 模型還擅長在多種語言中保持高保真推理。它尤其適合用于英語、法語、西班牙語、德語、意大利語、阿拉伯語、俄語、中文等語言的推理。

借助 Le Chat 中的 Flash Answers，Magistral Medium 還能實現(xiàn)比大多數(shù)競爭對手多達 10 倍的 token 吞吐量。Mistral 稱，這基本可以實現(xiàn)大規(guī)模的實時推理和用戶反饋。

因為以上一系列特性，Mistral 認為 Magistral 非常適合需要長時間思考和更高準確度的通用任務，相比非推理類的大模型，提升更為明顯。

在技術(shù)報告中，Mistral 表示 Magistral 應用了自主研發(fā)的可擴展強化學習流水線，其并非依賴現(xiàn)有實現(xiàn)和從先前模型中提煉出的強化學習痕跡，而是采用自下而上的方法，完全依賴自己的模型和基礎設施。

在 Magistral 工作中研究人員發(fā)現(xiàn)，基于文本的強化學習能夠保持甚至提升多模態(tài)理解、指令遵循和函數(shù)調(diào)用能力。

有趣的是，Magistral 的核心設計原則是使用與用戶相同的語言進行推理。在未經(jīng)任何處理的數(shù)學和編程問題上進行強化學習通常會導致模型在推理過程中出現(xiàn)混合語言。在沒有語言限制的初步實驗中，Mistral 工程人員也經(jīng)常觀察到混合英語、中文和俄語單詞的輸出。雖然這些輸出是連貫的，但為了避免語言切換，他們在計算對話（由問題、想法、答案組成）的獎勵時，首先通過刪除 LaTeX 內(nèi)容和代碼塊對這三個部分進行歸一化，然后對每個部分應用 fastText 分類器。如果分類器指示所有三個部分都使用相同的語言，則會額外給予 0.1 的獎勵。

這樣簡單的修改足以使模型能夠緊密跟蹤用戶的語言，最大限度地減少代碼切換，同時保持推理任務的性能。盡管只將原始英語問題翻譯成幾種語言，但我們能觀察到 Magistral 模型能夠成功生成任意語言的思維鏈、系統(tǒng)提示。

Mistral 進一步在系統(tǒng)提示中指定了格式和語言要求，如下圖所示。實驗發(fā)現(xiàn)強化學習訓練對這些系統(tǒng)提示非常敏感。例如，系統(tǒng)提示中的「盡可能隨意，盡可能長」部分增加了模型的熵，從而改善了模型的探索能力。

Mistral 正在把 Magistral Medium 模型應用于包括 Amazon SageMaker 在內(nèi)的主流云平臺，Azure AI、IBM WatsonX 和 Google Cloud Marketplace 也將緊隨其后。

在使用成本方面，Mistral 把 Magistral Medium 定位為一款獨特的高端產(chǎn)品，因此價格也是大幅上漲。

它的每百萬輸入 token 價格為 2 美元，每百萬輸出 token 是 5 美元，相比老款 Mistral Medium 3 價格大幅上漲，后者輸入成本僅為 0.4 美元，輸出成本為 2 美元。

然而，與外部競爭對手相比，Magistral Medium 的定價策略卻顯得極具競爭力。它的輸入成本比 OpenAI 最新型號便宜，與 Gemini 2.5 Pro 的價格處于同一水平，輸出成本也遠低于這兩款產(chǎn)品。

看起來，推理速度比競品快 10 倍的競爭優(yōu)勢確實很大。

Magistral API 與其他領先 LLM 的推理成本對比。

在 Magistral 推出之后，Mistral 的目標是從此版本開始快速迭代模型。

參考內(nèi)容：

https://mistral.ai/news/magistral

https://venturebeat.com/ai/mistrals-first-reasoning-model-magistral-launches-with-large-and-small-apache-2-0-version

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.