99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Mistral的首個強推理模型:擁抱開源,推理速度快10倍

0
分享至



機器之心報道

編輯:澤南

強推理終于要卷速度了。

大模型強推理賽道,又迎來一位重量級玩家。

本周二,歐洲人工智能公司 Mistral AI 發(fā)布了 Magistral,這是一個全新的大語言模型(LLM)系列,展現(xiàn)了強大的推理能力。它能夠進行不斷反思,并解決更復雜的任務。

此次發(fā)布包含兩個版本:面向企業(yè)客戶的大型專有模型 Magistral Medium,以及一個 24B 參數(shù)的開源版本 Magistral Small。其中開源版本使用 Apache 2.0 許可,可以自由使用、商用化;Magistral Medium 則可通過 Mistral 的 Le Chat 界面和 La Plateforme API 訪問。

  • 直接使用:https://chat.mistral.ai/chat
  • 模型開源:https://huggingface.co/mistralai/Magistral-Small-2506
  • 論文:https://mistral.ai/static/research/magistral.pdf

在基準測試中,新模型取得了不錯的成績。這里主要是 Magistral 與其前身 Mistral-Medium 3 和 DeepSeek 系列的對比。Magistral Medium 在 AIME2024 上的得分為 73.6%,其中多數(shù)投票為 64%,得分為 90%。Magistral Small 的得分分別為 70.7% 和 83.3%。



新模型在一些其他高要求測試中也表現(xiàn)出色,包括研究生水平的問答基準測試 GPQA Diamond 和用于編程挑戰(zhàn)的 LiveCodeBench。

Mistral 進一步展示了一些實際使用的案例。



Magistral Medium 展示了自身的編程能力,一次生成輸出的代碼就能模擬出重力、摩擦力。

除了通過 Benchmark 和編程等「必考題」,Magistral 模型還擅長在多種語言中保持高保真推理。它尤其適合用于英語、法語、西班牙語、德語、意大利語、阿拉伯語、俄語、中文等語言的推理。



借助 Le Chat 中的 Flash Answers,Magistral Medium 還能實現(xiàn)比大多數(shù)競爭對手多達 10 倍的 token 吞吐量。Mistral 稱,這基本可以實現(xiàn)大規(guī)模的實時推理和用戶反饋。



因為以上一系列特性,Mistral 認為 Magistral 非常適合需要長時間思考和更高準確度的通用任務,相比非推理類的大模型,提升更為明顯。

在技術(shù)報告中,Mistral 表示 Magistral 應用了自主研發(fā)的可擴展強化學習流水線,其并非依賴現(xiàn)有實現(xiàn)和從先前模型中提煉出的強化學習痕跡,而是采用自下而上的方法,完全依賴自己的模型和基礎設施。

在 Magistral 工作中研究人員發(fā)現(xiàn),基于文本的強化學習能夠保持甚至提升多模態(tài)理解、指令遵循和函數(shù)調(diào)用能力。

有趣的是,Magistral 的核心設計原則是使用與用戶相同的語言進行推理。在未經(jīng)任何處理的數(shù)學和編程問題上進行強化學習通常會導致模型在推理過程中出現(xiàn)混合語言。在沒有語言限制的初步實驗中,Mistral 工程人員也經(jīng)常觀察到混合英語、中文和俄語單詞的輸出。雖然這些輸出是連貫的,但為了避免語言切換,他們在計算對話(由問題、想法、答案組成)的獎勵時,首先通過刪除 LaTeX 內(nèi)容和代碼塊對這三個部分進行歸一化,然后對每個部分應用 fastText 分類器。如果分類器指示所有三個部分都使用相同的語言,則會額外給予 0.1 的獎勵。

這樣簡單的修改足以使模型能夠緊密跟蹤用戶的語言,最大限度地減少代碼切換,同時保持推理任務的性能。盡管只將原始英語問題翻譯成幾種語言,但我們能觀察到 Magistral 模型能夠成功生成任意語言的思維鏈、系統(tǒng)提示。

Mistral 進一步在系統(tǒng)提示中指定了格式和語言要求,如下圖所示。實驗發(fā)現(xiàn)強化學習訓練對這些系統(tǒng)提示非常敏感。例如,系統(tǒng)提示中的「盡可能隨意,盡可能長」部分增加了模型的熵,從而改善了模型的探索能力。



Mistral 正在把 Magistral Medium 模型應用于包括 Amazon SageMaker 在內(nèi)的主流云平臺,Azure AI、IBM WatsonX 和 Google Cloud Marketplace 也將緊隨其后。

在使用成本方面,Mistral 把 Magistral Medium 定位為一款獨特的高端產(chǎn)品,因此價格也是大幅上漲。

它的每百萬輸入 token 價格為 2 美元,每百萬輸出 token 是 5 美元,相比老款 Mistral Medium 3 價格大幅上漲,后者輸入成本僅為 0.4 美元,輸出成本為 2 美元。

然而,與外部競爭對手相比,Magistral Medium 的定價策略卻顯得極具競爭力。它的輸入成本比 OpenAI 最新型號便宜,與 Gemini 2.5 Pro 的價格處于同一水平,輸出成本也遠低于這兩款產(chǎn)品。

看起來,推理速度比競品快 10 倍的競爭優(yōu)勢確實很大。



Magistral API 與其他領先 LLM 的推理成本對比。

在 Magistral 推出之后,Mistral 的目標是從此版本開始快速迭代模型。

參考內(nèi)容:

https://mistral.ai/news/magistral

https://venturebeat.com/ai/mistrals-first-reasoning-model-magistral-launches-with-large-and-small-apache-2-0-version

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
剛剛,全線爆發(fā)!美國,重大發(fā)布!

剛剛,全線爆發(fā)!美國,重大發(fā)布!

券商中國
2025-06-11 21:20:24
對話高考后挑行李回家的女生:包里三床被子要帶回家,媽媽當時就在我身后

對話高考后挑行李回家的女生:包里三床被子要帶回家,媽媽當時就在我身后

極目新聞
2025-06-11 16:52:59
醫(yī)生研究發(fā)現(xiàn):老年人一旦做過白內(nèi)障手術(shù),這5件事就別再做了

醫(yī)生研究發(fā)現(xiàn):老年人一旦做過白內(nèi)障手術(shù),這5件事就別再做了

艾米手工作品
2025-06-12 08:16:44
成本15賣1000!年銷30萬坑害全國,央視最新曝光,趕緊告訴家里人

成本15賣1000!年銷30萬坑害全國,央視最新曝光,趕緊告訴家里人

任紀煙
2025-06-11 19:16:08
告別“韋爾股份”

告別“韋爾股份”

經(jīng)濟觀察報
2025-06-12 14:14:38
94年我在山里救了一位算命先生,他離開時反復叮囑我:離那女人遠點

94年我在山里救了一位算命先生,他離開時反復叮囑我:離那女人遠點

詭譎怪談
2025-06-11 08:24:02
熱浪來襲!未來7天多地氣溫將超40℃,部分地區(qū)或破紀錄

熱浪來襲!未來7天多地氣溫將超40℃,部分地區(qū)或破紀錄

新京報
2025-06-12 19:53:59
阿里巴巴門口雕塑:一個畏畏縮縮的中年男人,提著一個公文包……

阿里巴巴門口雕塑:一個畏畏縮縮的中年男人,提著一個公文包……

翻開歷史和現(xiàn)實
2025-06-07 10:12:32
堅持不上市的美國工業(yè)巨頭:年入9140億,家族財富超蓋茨、巴菲特

堅持不上市的美國工業(yè)巨頭:年入9140億,家族財富超蓋茨、巴菲特

清游說娛
2025-06-12 14:18:31
突然發(fā)現(xiàn)全國人民都不敢接電話了!

突然發(fā)現(xiàn)全國人民都不敢接電話了!

振華觀史
2025-04-15 13:29:07
高考遲到1分鐘被拒后續(xù):男孩父母去世無人叫,不是1分鐘是16分鐘

高考遲到1分鐘被拒后續(xù):男孩父母去世無人叫,不是1分鐘是16分鐘

麥小柒
2025-06-12 13:36:51
“我們班一個家長昨天跳樓了......”

“我們班一個家長昨天跳樓了......”

LULU生活家
2025-06-12 18:29:39
載有53名英國公民的印度客機墜毀,英國首相:場面令人震驚

載有53名英國公民的印度客機墜毀,英國首相:場面令人震驚

環(huán)球網(wǎng)資訊
2025-06-12 18:37:44
俄媒:印度一架飛往英國客機墜毀,普京表達深切慰問

俄媒:印度一架飛往英國客機墜毀,普京表達深切慰問

環(huán)球網(wǎng)資訊
2025-06-12 20:24:14
建國后最大礦難:1400多人搶救7天7夜,684人喪生,被列為絕密

建國后最大礦難:1400多人搶救7天7夜,684人喪生,被列為絕密

談史論天地
2024-01-04 14:59:35
滅頂之災!俄軍要爆破基輔,美情報部認為,俄軍將發(fā)射奧列什尼克導彈

滅頂之災!俄軍要爆破基輔,美情報部認為,俄軍將發(fā)射奧列什尼克導彈

天擇雜談
2025-06-08 00:13:43
醫(yī)生坦言:男性若長期不喝酒,用不了多長時間,身體或有4個變化

醫(yī)生坦言:男性若長期不喝酒,用不了多長時間,身體或有4個變化

明月聊史
2025-06-07 16:12:23
器官移植的前提條件是公開器官來源的身份,這是基本的道德底線!

器官移植的前提條件是公開器官來源的身份,這是基本的道德底線!

逍遙論經(jīng)
2025-06-08 09:30:22
云A車鬧大了!獨庫公路故意堵車,有人超車還惡意別車并開窗罵人

云A車鬧大了!獨庫公路故意堵車,有人超車還惡意別車并開窗罵人

火山詩話
2025-06-12 10:53:15
兩年狂撈32億,這對抖音頂流夫婦決定躺平

兩年狂撈32億,這對抖音頂流夫婦決定躺平

野山歷史
2025-06-06 17:29:52
2025-06-13 00:27:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
10630文章數(shù) 142337關(guān)注度
往期回顧 全部

科技要聞

一鏡雙目捅破天,華為最快明年Q2超越蘋果

頭條要聞

男子給兩孩子灌農(nóng)藥致死 孩子小姨:女孩眼睛都沒閉上

頭條要聞

男子給兩孩子灌農(nóng)藥致死 孩子小姨:女孩眼睛都沒閉上

體育要聞

沒有人會不喜歡TJ-麥康奈爾

娛樂要聞

鄧紫棋自爆因官司6年沒收到版稅, 重錄舊作反擊

財經(jīng)要聞

787客機首起空難 波音飛機事故頻發(fā)引質(zhì)疑

汽車要聞

方程豹最大SUV比豹8便宜?鈦7搭華為智駕

態(tài)度原創(chuàng)

教育
數(shù)碼
家居
時尚
房產(chǎn)

教育要聞

4.2w贊!人民日報報道的“扁擔女孩”,高考后為何引發(fā)全網(wǎng)熱議?

數(shù)碼要聞

PCI-SIG數(shù)據(jù)庫新增配備PCIe 5.0 x16接口的英特爾 Arc Battlemage GPU

家居要聞

精致奢華 豐富的連貫空間

黃圣依自曝初戀是賈乃亮!20年前北電校園戀情曝光

房產(chǎn)要聞

18位頂級買家瘋搶!凱旋新世界,憑何成為廣州頂豪終極價值錨點?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 公主岭市| 金阳县| 浪卡子县| 拉萨市| 巩义市| 淮北市| 会理县| 建始县| 安新县| 平顶山市| 惠州市| 仙居县| 巩义市| 阜南县| 缙云县| 平定县| 灵璧县| 井研县| 武山县| 威海市| 芜湖县| 晋城| 剑川县| 犍为县| 海宁市| 万荣县| 离岛区| 越西县| 土默特左旗| 永昌县| 曲阜市| 肇东市| 迁西县| 石阡县| 荥阳市| 寿阳县| 彭山县| 阜宁县| 酒泉市| 万盛区| 阜新|