99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

MiniMax深夜開源!首個推理模型,4560億參數(shù)、百萬上下文、價格低至0.8元

0
分享至


智東西
作者 程茜
編輯 心緣

智東西6月17日報道,今日凌晨,“大模型六小虎”之一MiniMax發(fā)布全球首個開源大規(guī)模混合架構(gòu)的推理模型MiniMax-M1,并官宣了為期五天的連更計劃。


M1參數(shù)規(guī)模為4560億,每個token激活459億參數(shù),原生支持100萬上下文輸入以及業(yè)內(nèi)最長的8萬token推理輸出,輸入長度與閉源模型谷歌Gemini 2.5 Pro一致,是DeepSeek-R1的8倍。此外,研究人員訓(xùn)練了兩個版本的MiniMax-M1模型,其思考預(yù)算分別為40K和80K。

MiniMax在標(biāo)準(zhǔn)基準(zhǔn)測試集上的對比顯示,在復(fù)雜的軟件工程、工具使用和長上下文任務(wù)方面,MiniMax-M1優(yōu)于DeepSeek-R1和Qwen3-235B等開源模型。


其博客提到,在M1的整個強化學(xué)習(xí)階段,研究人員使用512塊H800訓(xùn)練了三周,租賃成本為53.74萬美金(折合人民幣約385.9萬元),相比其一開始的成本預(yù)期少了一個數(shù)量級。

M1在MiniMax APP和Web上支持不限量免費使用。API價格方面,第一檔0-32k的輸入長度時,輸入0.8元/百萬token, 輸出8元/百萬token;第二檔32k-128k的輸入長度時,輸入1.2元/百萬token, 輸出16元/百萬token;第三檔128k-1M輸入長度時,輸入2.4元/百萬token, 輸出24元/百萬token。


DeepSeek-R1輸入長度是64k,輸出默認(rèn)32k最大64k,因此可以對標(biāo)M1第一檔和第二檔價格。不過,M1第一檔、第二檔價格相比DeepSeek-R1優(yōu)惠時段都沒有優(yōu)勢

在標(biāo)準(zhǔn)時段,M1第一檔輸入價格是DeepSeek-R1的80%、輸出價格為50%;第二檔輸入價格是DeepSeek-R1的1.2倍、輸出價格相同。

第三檔是M1的絕對優(yōu)勢區(qū),DeepSeek-R1不支持128k-1M的輸入長度


▲MiniMax-M1和DeepSeek-R1 API價格對比

幾乎與MiniMax同時,“大模型六小虎”另外一家月之暗面,也發(fā)了開源代碼模型Kimi-Dev,編程能力強過DeepSeek-R1。


體驗地址:https://chat.minimax.io/

GitHub地址:https://github.com/MiniMax-AI/MiniMax-M1

Hugging Face地址:https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094

技術(shù)報告地址:https://github.com/MiniMax-AI/MiniMax-M1/blob/main/MiniMax_M1_tech_report.pdf

一、Agent工具使用能力一騎絕塵,數(shù)學(xué)、編程略遜

基于業(yè)內(nèi)主流17個評測集,MiniMax-M1的評測結(jié)果在軟件工程、長上下文、工具使用等方面的表現(xiàn)優(yōu)于其他開源或閉源模型。

OpenAI發(fā)布的MRCR測試集中,M1的表現(xiàn)略遜于Gemini 2.5 Pro,相比其他模型效果更好。MRCR評估的是大語言模型區(qū)分隱藏在長上下文中多個目標(biāo)的能力,要求模型在極其復(fù)雜且多重干擾的長文本中,準(zhǔn)確區(qū)分多條幾乎相同的信息,還需識別其順序。

評估軟件工程能力的測試集SWE-bench Verified中,MiniMax-M1-40k和MiniMax-M1-80k的表現(xiàn)略遜于DeepSeek-R1-0528,優(yōu)于其他開源模型

Agent工具使用方面,在航空業(yè)的測試集TAU-bench(airline)中,MiniMax-M1-40k表現(xiàn)優(yōu)于其余的開源和閉源模型,零售業(yè)測試集TAU-bench(retail)中,與DeepSeek-R1表現(xiàn)相當(dāng)。

但在數(shù)學(xué)、編程能力等方面,其得分相比Qwen3-235B-A22B、DeepSeek-R1、Claude 4 Opus等都較低。


▲MiniMax-M1評測結(jié)果

與此同時,MiniMax-M1-80k在大多數(shù)基準(zhǔn)測試中始終優(yōu)于MiniMax-M1-40k,這可以驗證其擴展測試時計算資源的有效性。

二、閃電注意力機制高校擴展計算,擅長處于長輸入+廣泛思考

M1是基于MiniMax-Text-01模型開發(fā),采用了混合專家(MoE)架構(gòu)和閃電注意力機制

M1的閃電注意力機制可以高效擴展測試時計算。例如,與DeepSeek-R1相比,M1在10萬個token的生成長度下只需消耗25%的FLOP,使得M1適合于需要處理長輸入和廣泛思考的復(fù)雜任務(wù)。

另一個技術(shù)重點是使用大規(guī)模強化學(xué)習(xí)(RL)進(jìn)行訓(xùn)練,其應(yīng)用范圍可涵蓋從傳統(tǒng)數(shù)學(xué)推理到基于沙盒的真實軟件工程環(huán)境等問題。

MiniMax為M1開發(fā)了RL擴展框架,重點包括:提出CISPO新算法,可通過裁剪重要性采樣權(quán)重而非token更新來提升性能,其性能優(yōu)于其他競爭性RL變體;其混合注意力機制設(shè)計能夠提升RL效率,并利用混合架構(gòu)來應(yīng)對擴展RL時面臨的挑戰(zhàn)。

此外MiniMax提到,在AIME的實驗中,他們發(fā)現(xiàn)CISPO比字節(jié)近期提出的DAPO等強化學(xué)習(xí)算法收斂性能快了一倍,顯著優(yōu)于DeepSeek早期使用的GRPO

研究人員在基于Qwen2.5-32B-base模型的AIME 2024任務(wù)上,對GRPO、DAPO以及CISPO進(jìn)行了對比,結(jié)果表明:在相同訓(xùn)練步數(shù)下,CISPO的性能優(yōu)于GRPO和DAPO;而當(dāng)使用50%的訓(xùn)練步數(shù)時,CISPO可達(dá)到與DAPO相當(dāng)?shù)男阅鼙憩F(xiàn)。


結(jié)語:多Agent協(xié)作面臨超長上下文、數(shù)百輪推理挑戰(zhàn)

為了支持日益復(fù)雜的場景,大語言模型在測試或推理階段,往往需要動態(tài)增加計算資源或計算步驟來提升模型性能,MiniMax在研究報告中提到,未來大模型尤其需要“Language-Rich Mediator”(富語言中介)來充當(dāng)與環(huán)境、工具、計算機或其他與Agent交互的Agent,需要進(jìn)行數(shù)十到數(shù)百輪的推理,同時集成來自不同來源的長上下文信息。

在這樣的背景下,作為MiniMax推出的首個推理模型,MiniMax-M1正是其面對這一行業(yè)發(fā)展趨勢在算法創(chuàng)新上的探索。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
可笑不?明明是她的成就,人民日報的標(biāo)題里卻沒有她的姓名

可笑不?明明是她的成就,人民日報的標(biāo)題里卻沒有她的姓名

娛樂故事
2025-06-22 12:11:43
智駕“小藍(lán)燈”來了,將于7月1日正式實施

智駕“小藍(lán)燈”來了,將于7月1日正式實施

大象新聞
2025-06-23 20:54:07
西媒評論員:庫爾圖瓦不該當(dāng)眾批阿森西奧,姆巴佩被罰下時他沒這么說

西媒評論員:庫爾圖瓦不該當(dāng)眾批阿森西奧,姆巴佩被罰下時他沒這么說

雷速體育
2025-06-23 20:45:47
美軍基地遭襲!伊朗求助俄羅斯!普京給出承諾,中國外交部發(fā)聲!

美軍基地遭襲!伊朗求助俄羅斯!普京給出承諾,中國外交部發(fā)聲!

林子說事
2025-06-23 22:56:46
3年1.9億超級頂薪,和火箭形成默契!有了杜蘭特,你也該來奪冠了

3年1.9億超級頂薪,和火箭形成默契!有了杜蘭特,你也該來奪冠了

老梁體育漫談
2025-06-24 00:11:02
羅斯威爾事件:外星人透露驚人內(nèi)幕,地球是牢獄,靈魂永恒存在

羅斯威爾事件:外星人透露驚人內(nèi)幕,地球是牢獄,靈魂永恒存在

吳學(xué)華看天下
2023-07-12 14:16:30
公布了!公布了!上海不少人第一時間曬圖,注意這些時間節(jié)點→

公布了!公布了!上海不少人第一時間曬圖,注意這些時間節(jié)點→

鬼菜生活
2025-06-23 17:55:14
廣東清遠(yuǎn)發(fā)生4.3級地震,多地有震感 一廣州市民:當(dāng)時在公司10樓加班,以為是頭暈

廣東清遠(yuǎn)發(fā)生4.3級地震,多地有震感 一廣州市民:當(dāng)時在公司10樓加班,以為是頭暈

紅星新聞
2025-06-23 20:00:14
剛剛 | 又震了!3天地震超160次!當(dāng)?shù)貧庀笈_:有強震可能

剛剛 | 又震了!3天地震超160次!當(dāng)?shù)貧庀笈_:有強震可能

天津廣播
2025-06-23 09:39:24
停戰(zhàn)即死:內(nèi)塔尼亞胡該何去何從

停戰(zhàn)即死:內(nèi)塔尼亞胡該何去何從

老吳教育課堂
2025-06-22 07:10:16
“服用半小時后眼前清晰無比”,“速攻藍(lán)莓”是真有用還是“智商稅”?

“服用半小時后眼前清晰無比”,“速攻藍(lán)莓”是真有用還是“智商稅”?

新京報
2025-06-23 10:51:22
荔枝的“死對頭”,醫(yī)生提醒:二者萬不可同吃,吃荔枝禁忌要牢記

荔枝的“死對頭”,醫(yī)生提醒:二者萬不可同吃,吃荔枝禁忌要牢記

阿龍美食記
2025-06-16 15:19:56
骨質(zhì)疏松可打針:一年/半年一針!專家提醒:針劑雖便捷,不按時治療骨流失更快

骨質(zhì)疏松可打針:一年/半年一針!專家提醒:針劑雖便捷,不按時治療骨流失更快

極目新聞
2025-06-23 20:03:31
伊朗議會批準(zhǔn)關(guān)閉霍爾木茲海峽,這是嫌死得還不夠快嗎?

伊朗議會批準(zhǔn)關(guān)閉霍爾木茲海峽,這是嫌死得還不夠快嗎?

歷史總在押韻
2025-06-23 01:43:14
李帥一語直戳猴哥肺管子!武磊干過類似的事 被三哥戴老板教育了

李帥一語直戳猴哥肺管子!武磊干過類似的事 被三哥戴老板教育了

刀鋒體育
2025-06-23 19:33:06
連續(xù)7個漲停板!股民:妖股再現(xiàn)江湖!

連續(xù)7個漲停板!股民:妖股再現(xiàn)江湖!

數(shù)據(jù)挖掘分析
2025-06-23 15:10:38
德黑蘭多地同時發(fā)生爆炸

德黑蘭多地同時發(fā)生爆炸

財聯(lián)社
2025-06-23 16:59:12
2.8萬轉(zhuǎn)運費后續(xù)!唐先生要求患者網(wǎng)友刪質(zhì)疑視頻,想降低影響…

2.8萬轉(zhuǎn)運費后續(xù)!唐先生要求患者網(wǎng)友刪質(zhì)疑視頻,想降低影響…

火山詩話
2025-06-23 05:54:15
中國籃協(xié):今年的CBA俱樂部杯賽將實現(xiàn)擴軍

中國籃協(xié):今年的CBA俱樂部杯賽將實現(xiàn)擴軍

雷速體育
2025-06-23 15:39:26
北京街頭發(fā)生群毆事件!

北京街頭發(fā)生群毆事件!

美麗大北京
2025-06-23 20:14:00
2025-06-24 01:56:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
10056文章數(shù) 116781關(guān)注度
往期回顧 全部

科技要聞

售出千萬臺!他卻說"只想做下一代AI終端"

頭條要聞

玉淵譚天:美軍轟炸伊朗的武器僅美國有 但掏空了老本

頭條要聞

玉淵譚天:美軍轟炸伊朗的武器僅美國有 但掏空了老本

體育要聞

比起雷霆三少,他才是真正隊魂

娛樂要聞

魏大勛和秦嵐沒分手!

財經(jīng)要聞

以伊沖突升級,對經(jīng)濟和股市影響有多大?

汽車要聞

真香價格+質(zhì)保承諾 別克E5很難讓人拒絕了

態(tài)度原創(chuàng)

數(shù)碼
教育
健康
家居
公開課

數(shù)碼要聞

最小的 13 代酷睿主板:AAEON de next-RAP8 發(fā)布,銀行卡大小

教育要聞

老師解答難題時,全班同學(xué)認(rèn)真聽講,教室里充滿了求知的欲望

呼吸科專家破解呼吸道九大謠言!

家居要聞

山水之間 墨染風(fēng)雨云間

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 浦江县| 墨江| 江门市| 阿拉尔市| 清镇市| 恩平市| 康马县| 如皋市| 临沂市| 武义县| 南宁市| 天峨县| 开远市| 江达县| 绥德县| 蒲城县| 论坛| 沙湾县| 龙州县| 临海市| 张家港市| 平原县| 武宁县| 绍兴市| 鸡泽县| 天水市| 特克斯县| 时尚| 冕宁县| 兖州市| 涟水县| 正定县| 沂南县| 安西县| 永兴县| 分宜县| 卓尼县| 濉溪县| 海晏县| 辽阳县| 湟中县|