99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

新“SOTA”推理模型避戰(zhàn)Qwen和R1?歐版OpenAI被噴麻了

0
分享至


文章轉(zhuǎn)載于量子位(QbitAI)

作者:聞樂

“歐洲的OpenAI”Mistral AI終于發(fā)布了首款推理模型——Magistral

然而再一次遭到網(wǎng)友質(zhì)疑:怎么又不跟最新版Qwen和DeepSeek R1 0528對比?

(此前該公司發(fā)布Ministral 3B/8B時,聲稱“始終優(yōu)于同行”,卻沒有對比Qwen2.5)



在該模型發(fā)布的前幾個小時,Mistral AI的CEO Arthur Mensch在接受爐邊訪談時聲稱即將發(fā)布的Magistral能夠與其他所有競爭對手相抗衡。

在官方展示的基準(zhǔn)測試結(jié)果中,DeepSeek-R1的數(shù)據(jù)確實不是最新的(在AIME-25數(shù)學(xué)測試中,DeepSeek-R1-0528的準(zhǔn)確率已經(jīng)從舊版的70%提升至87.5%),并且比較行列里完全不見Qwen的身影。


不過,與同公司初期模型Mistral Medium 3相比,該框架在AIME-24上的準(zhǔn)確率提升了50%。

此次Magistral發(fā)布了兩種版本:

Magistral Small——24B參數(shù)的開源權(quán)重版本,可在Apache 2.0許可下自行部署。

Magistral Medium——更強大的、面向企業(yè)的版本,在Amazon SageMaker上提供。


1

專為透明推理而設(shè)計

在Magistral發(fā)布之前,Mistral AI的CEO Arthur Mensch在訪談中提到:

“從歷史上看,我們看到美國的模型用英語進行推理,中國的模型更擅長用中文進行推理。”

于是,這次Magistral的一個亮點就是支持多語言推理,尤其是解決了主流模型用歐洲語言的推理效果不如本土語言的缺陷。


下面的例子展示了在Le Chat中,使用Magistral Medium的阿拉伯語提示和響應(yīng)。


與通用模型不同的是,Magistral針對多步邏輯進行了微調(diào),提升了可解釋性,并在用戶的語言中提供了可追溯的思考過程,能夠?qū)崿F(xiàn)大規(guī)模實時推理。

下面的例子展示了重力、摩擦和碰撞的單次物理模擬,在預(yù)覽中使用的是Magistral Medium。


就好像Magistral不是黑箱預(yù)言家,而是一個能陪你「擺事實、講道理」的智能伙伴。

并且,在Le Chat中,通過Flash Answers,Magistral Medium的token吞吐量比大多數(shù)競爭對手快10倍。

這就能夠?qū)崿F(xiàn)大規(guī)模的實時推理和用戶反饋。


作為Mistral推出的首個基于純強化學(xué)習(xí)(RL)訓(xùn)練的推理大模型,Magistral采用改進的Group Relative Policy Optimization(GRPO)算法。

直接通過RL訓(xùn)練,不依賴任何現(xiàn)有推理模型的蒸餾數(shù)據(jù)(如DeepSeek-R1需SFT預(yù)熱)。

通過消除KL散度懲罰、動態(tài)調(diào)整探索閾值和基于組歸一化的優(yōu)勢計算,在AIME-24數(shù)學(xué)基準(zhǔn)上實現(xiàn)從26.8%到73.6%的準(zhǔn)確率躍升。


首創(chuàng)異步分布式訓(xùn)練架構(gòu),通過Generators持續(xù)生成、Trainers異步更新的設(shè)計,配合動態(tài)批處理優(yōu)化,實現(xiàn)高效的大規(guī)模RL訓(xùn)練。

還反直覺地發(fā)現(xiàn)純文本RL訓(xùn)練可提升多模態(tài)性能(如MMMU-Pro-Vision提升12%),并驗證RL對小模型同樣有效(24B的Magistral Small在AIME-24準(zhǔn)確率達(dá)70.7%)。


這些創(chuàng)新使Magistral在無需預(yù)訓(xùn)練蒸餾的情況下,以純RL方式為LLM的強化學(xué)習(xí)訓(xùn)練提供了新范式。

1

One More Thing

官方?jīng)]有給出Magistral與最新版Qwen和R1的對比,網(wǎng)友來代勞了。


從結(jié)果可以看出,Qwen 4B與該模型相近,小型的30B MoE效果更好,R1最新版就更不用說了(doge

并且,由于“歐洲的OpenAI”越來越不Open,Stability AI前CEO建議Mistral AI應(yīng)該爭取真正的開源來占據(jù)開源的領(lǐng)導(dǎo)地位。


參考鏈接:
[1]https://mistral.ai/news/magistral
[2]https://x.com/dylan522p/status/1932563462963507589
[3]https://x.com/arthurmensch/status/1932451932406415531

點個愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
朝陽國資委13年塵封300套新房集中出售!均價5.5萬起,引發(fā)中介排隊搶購

朝陽國資委13年塵封300套新房集中出售!均價5.5萬起,引發(fā)中介排隊搶購

大峰
2025-07-21 12:49:56
青島雙驕!宋茜陳夢街頭擼貓引爆熱搜:奧運冠軍的松弛感絕了

青島雙驕!宋茜陳夢街頭擼貓引爆熱搜:奧運冠軍的松弛感絕了

傳遞滿滿正能量
2025-07-21 10:55:35
腦梗去世的人飆升!醫(yī)生含淚苦勸:無論多大年紀(jì),天熱堅守4原則

腦梗去世的人飆升!醫(yī)生含淚苦勸:無論多大年紀(jì),天熱堅守4原則

艾米手工作品
2025-07-21 12:57:54
廣東順德確診超2000例!基孔肯雅熱如何預(yù)防?

廣東順德確診超2000例!基孔肯雅熱如何預(yù)防?

大象新聞
2025-07-21 20:48:24
蔚來喜獲200億,李斌又回一口血

蔚來喜獲200億,李斌又回一口血

快刀財經(jīng)
2025-07-21 22:41:44
善惡終有報,曾經(jīng)在求職節(jié)目里咄咄逼人的老板,如今竟淪落成這樣

善惡終有報,曾經(jīng)在求職節(jié)目里咄咄逼人的老板,如今竟淪落成這樣

大笑江湖史
2025-07-21 07:56:12
張繼科打了翻身仗!人民日報為其發(fā)聲,但這次動了誰的蛋糕?

張繼科打了翻身仗!人民日報為其發(fā)聲,但這次動了誰的蛋糕?

夕落秋山
2025-07-21 17:49:36
謝霆鋒發(fā)文官宣!劉嘉玲驚呼OMG!網(wǎng)友:這下睡不著了

謝霆鋒發(fā)文官宣!劉嘉玲驚呼OMG!網(wǎng)友:這下睡不著了

瓜農(nóng)娟姐
2025-07-21 12:21:40
上海一家公司成功上市,員工僅4人,上市首日股價接近腰斬!

上海一家公司成功上市,員工僅4人,上市首日股價接近腰斬!

胡華成
2025-07-21 16:40:12
直到宗慶后人設(shè)崩塌,才懂賭王臨終前,把私生子交給何超瓊含金量

直到宗慶后人設(shè)崩塌,才懂賭王臨終前,把私生子交給何超瓊含金量

攬星河的筆記
2025-07-18 22:29:50
郭德綱一家近照曝光,王惠母子滿臉橫肉嘴歪臉斜,和郭麒麟沒得比

郭德綱一家近照曝光,王惠母子滿臉橫肉嘴歪臉斜,和郭麒麟沒得比

春秋論娛
2025-07-21 19:44:18
敘政權(quán)宣布立即全面停火

敘政權(quán)宣布立即全面停火

揚子晚報
2025-07-19 17:56:23
申花官方:張威等4名球員夏窗外租,希望他們不斷提升自我

申花官方:張威等4名球員夏窗外租,希望他們不斷提升自我

雷速體育
2025-07-21 14:24:17
眾叛親離,愛情受挫,退圈5年后,70歲費玉清和56歲閨蜜生活幸福

眾叛親離,愛情受挫,退圈5年后,70歲費玉清和56歲閨蜜生活幸福

手工制作阿殲
2025-07-21 18:02:11
卡車父子遇難后續(xù):貨值3千萬,保險不予理賠,知情人透更多內(nèi)幕

卡車父子遇難后續(xù):貨值3千萬,保險不予理賠,知情人透更多內(nèi)幕

攬星河的筆記
2025-07-21 21:46:40
對話量旋科技項金根:黃仁勛預(yù)測太保守,10年后將實現(xiàn)百萬物理比特的容錯量子計算機

對話量旋科技項金根:黃仁勛預(yù)測太保守,10年后將實現(xiàn)百萬物理比特的容錯量子計算機

鈦媒體APP
2025-07-21 18:52:13
羅德里戈與女友歡樂度假:沙地騎行四輪摩托

羅德里戈與女友歡樂度假:沙地騎行四輪摩托

懂球帝
2025-07-21 20:27:13
研究發(fā)現(xiàn),每天飯后要午睡的人,不出6個月,身體或有3種改變!

研究發(fā)現(xiàn),每天飯后要午睡的人,不出6個月,身體或有3種改變!

醫(yī)學(xué)原創(chuàng)故事會
2025-07-22 00:12:22
安全繩脫落,合肥女童從攀爬項目三層墜落骨折!父親:我們自行墊付醫(yī)藥費,多方回應(yīng)

安全繩脫落,合肥女童從攀爬項目三層墜落骨折!父親:我們自行墊付醫(yī)藥費,多方回應(yīng)

瀟湘晨報
2025-07-21 19:44:06
被騙至緬甸19歲高考生已回國與家人團聚,自述進園區(qū)連續(xù)4天背詐騙話術(shù);家屬回應(yīng)開直播

被騙至緬甸19歲高考生已回國與家人團聚,自述進園區(qū)連續(xù)4天背詐騙話術(shù);家屬回應(yīng)開直播

浙江之聲
2025-07-21 15:21:45
2025-07-22 06:51:00
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個星球。
2351文章數(shù) 10352關(guān)注度
往期回顧 全部

科技要聞

劉強東闊氣出手!兩月投了4家具身智能公司

頭條要聞

男子為終身質(zhì)保花60萬買蔚來 1年跑17萬公里權(quán)益沒了

頭條要聞

男子為終身質(zhì)保花60萬買蔚來 1年跑17萬公里權(quán)益沒了

體育要聞

這四位大兄弟,你們真敢要3000萬吶

娛樂要聞

五哈全員為寶石老舅送祝福

財經(jīng)要聞

炒港美股"補稅潮"突襲?一文了解始末

汽車要聞

勞斯萊斯前設(shè)計師全新力作 榮威M7正式亮相

態(tài)度原創(chuàng)

親子
本地
藝術(shù)
時尚
公開課

親子要聞

看這小孩調(diào)皮的想上窗臺,媳婦炒幾個菜給公婆送,炒蘑菇太好吃啦

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調(diào)色盤?

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

二搭的風(fēng)正在吹向你的CP

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 乳山市| 台南县| 铅山县| 顺昌县| 麻栗坡县| 蓬安县| 镇远县| 五河县| 买车| 白山市| 方山县| 江陵县| 凌源市| 永安市| 洪雅县| 封丘县| 芦溪县| 汉寿县| 中超| 洞口县| 盈江县| 台江县| 德安县| 新丰县| 宜都市| 买车| 丰宁| 赤壁市| 犍为县| 蕉岭县| 特克斯县| 方山县| 南开区| 东乡族自治县| 牙克石市| 恭城| 赫章县| 水城县| 奉节县| 积石山| 若尔盖县|