99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

開源大模型, 重量級選手+1

0
分享至


大家好,我是 Ai 學習的老章

今天大模型開源世界又迎來 1 個重量級選手 MiniMax- M1

我們一起看看

MiniMax-M1 簡介

MiniMax-M1 采用了創新的混合專家模型(MoE)架構結合閃電注意力機制(Lightning Attention),優勢有三:

  • 高效計算:閃電注意力機制顯著提升推理效率

  • 參數激活優化:雖然總參數量巨大,但每次只激活必要的專家模塊

  • 線性擴展:時間和空間復雜度隨序列長度近似線性增長

模型總參數 4560 億(456B),比 Qwen3 還龐大,每 token 激活參數:459 億(45.9B),基礎模型:MiniMax-Text-01.MiniMax-M1 中的閃電注意力機制能夠高效擴展測試時計算,與 DeepSeek R1 相比,M1 在 10 萬 token 生成長度下僅消耗 25% 的 FLOPs。

最大亮點是超長上下文支持

  • 輸入上下文:原生支持 100 萬 token,是 DeepSeek R1 的 8 倍

  • 輸出長度:支持最多 8 萬 token 輸出

  • 處理效率:在單臺機器上就能處理超過 100 萬 token

MiniMax-M1 原生支持 100 萬 token 的上下文長度,是 DeepSeek R1 上下文大小的 8 倍。

最大輸入與 Gemini 2.5 Pro 并列第一

最大輸出僅次于 OpenAI o3

綜合妥妥第一

它還支持:

  • 深度思考:支持復雜邏輯推理和深度分析

  • 長文檔處理:能夠高效處理和分析超長文本

  • 多輪對話:支持復雜的多輪對話場景

  • 工具調用:具備強大的工具調用能力

MiniMax-M1 測評


官方數據來看:

MiniMax-M1在復雜推理和長上下文處理方面表現突出,其核心優勢在于高思考預算和原生百萬 token 支持。80K 版本的思考預算達到行業頂級水平,在數學推理任務中接近 DeepSeek-R1 和 OpenAI-o3 等頂級模型,MATH-500 測試成績達 96.8%。

在編碼任務中,其 FullStackBench 68.3% 的表現與 Claude 4 Opus 差距不足 2 個百分點。特別值得注意的是其長上下文能力,在百萬 token 級任務中與 Gemini 2.5 Pro 持平,OpenAI-MRCR 測試中 40K 版本甚至以 58.6% 略超 80K 版本。

工具調用方面,零售場景的 TAU-bench 測試顯示 40K 版本反超 80K 版本達 67.8%,展現出色的任務適配性。

不過在軟件工程和事實性任務方面,與行業頂尖模型仍存在約 15-20% 的差距。

MiniMax-M1 部署

模型文件 910GB+,比 R1 還大

官方推薦本地部署設備:單臺配備 8 個 H800 或 8 個 H20 GPU 的服務器

搭載 8 個 H800 GPU 的服務器可處理長達 200 萬 token 的上下文輸入

配備 8 個 H20 GPU 的服務器則能夠支持高達 500 萬 token 的超長上下文處理能力。

vllm 部署代碼:

#https://huggingface.co/MiniMaxAI/MiniMax-M1-80k/blob/main/docs/vllm_deployment_guide_cn.md export SAFETENSORS_FAST_GPU=1 export VLLM_USE_V1=0 python3 -m vllm.entrypoints.openai.api_server \ --model \ --tensor-parallel-size 8 \ --trust-remote-code \ --quantization experts_int8  \ --max_model_len 4096 \ --dtype bfloat16
MiniMax-M1 實測

部署成本太高了,我沒這個實力

想要測試的話可以去官方網站:https://chat.minimax.io/


這里面有兩個模式:

智能搜索:就是聯網搜索,官方建議當需要 MiniMax AI 進行創意寫作時關閉此功能 Think 模式:就是深度思考

我讓他生成黑客帝國數字雨 html,效果非常一般



DeepSeek-R1-0528-Qwen3-8B強,比 Qwen3:32B 弱,更是完全比不上 DeepSeek-R1-0528

不過其Agent模式還是很OK的


然后讓其設計知識卡片

提示詞:閱讀全文,文中共幾次父親的背影?分別有何深意,輸出 SVG 格式,3:4,小紅書風格:——省略 1328 字


它剛開始也是沒有找到第四次的背影,不過在漫長的思考中,它發現并修復了

最終效果還行吧,比 Qwen3-235b、Qwen3:32、GPT4.1 都要強很多

我發現 minimax 也新出了一個 Agent 模式:https://agent.minimax.io/


它是類似 manus 的通用智能體工具,可以生成網頁、游戲代碼,可以做 Research,寫報告,可以做 PPT,可以做多模態任務。

初看確實蠻驚艷的

比如這個復刻 minimax 官網


比如可以極簡 prompt 輸入

創作一本 20 頁的兒童圖畫書,主角是一只善良的狐貍。用你生成圖像的能力,以溫暖明亮的風格創作 20 幅插圖,將它們與故事文本結合,并以網頁形式完整呈現給我。

生成一個故事網頁


費用方面:

免費用戶有 1,000 免費積分,這一點不如 manus 誠意,后者除了 1000 免費積分,每天還會刷新贈送 300.

總結,我個人可能只會偶爾在網頁端用用它

公司本地化部署的話,鐵定還是首選DeepSeek-R1-05-28

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
長沙男子下載APP開網店“進貨”近55萬元后無法提現,警方已立案

長沙男子下載APP開網店“進貨”近55萬元后無法提現,警方已立案

澎湃新聞
2025-06-27 20:52:30
瘋狂!C羅新合同曝光:日薪480萬元 2年入賬50億元 體壇史上最貴

瘋狂!C羅新合同曝光:日薪480萬元 2年入賬50億元 體壇史上最貴

風過鄉
2025-06-27 06:58:56
滅了三大文明古國的雅利安人,前來華夏挑釁,被商朝扔進了殉葬坑

滅了三大文明古國的雅利安人,前來華夏挑釁,被商朝扔進了殉葬坑

文史道
2024-05-27 06:45:02
9.5分封神!BBC新劇,懸疑天花板,阿加莎新作視覺化!

9.5分封神!BBC新劇,懸疑天花板,阿加莎新作視覺化!

君笙的拂兮
2025-06-27 10:50:24
西媒:阿隆索終于在皇馬啟用352陣型,這是他在德國時的法寶

西媒:阿隆索終于在皇馬啟用352陣型,這是他在德國時的法寶

雷速體育
2025-06-27 11:55:23
交了35000元準備種牙,當天滿口牙齒就被拔完,廣東一男子牙被拔光后診所卷錢跑路

交了35000元準備種牙,當天滿口牙齒就被拔完,廣東一男子牙被拔光后診所卷錢跑路

極目新聞
2025-06-25 16:43:53
高價買的Labubu,竟然成了“Lababa”!掉坑掉坑,滬上消費者連連掉坑

高價買的Labubu,竟然成了“Lababa”!掉坑掉坑,滬上消費者連連掉坑

新民晚報
2025-06-27 18:23:30
抗癌網紅“游云”去世,僅37歲,自學中醫出名,生前不結婚不生娃

抗癌網紅“游云”去世,僅37歲,自學中醫出名,生前不結婚不生娃

180視角
2025-06-26 17:35:18
真被中國預測對了:特朗普撒彌天大謊,話音剛落,以色列又挨揍了

真被中國預測對了:特朗普撒彌天大謊,話音剛落,以色列又挨揍了

阿離家居
2025-06-27 19:37:26
油價大降超0.22元/升,7月1日油價調整,漲幅大幅回落超260元/噸

油價大降超0.22元/升,7月1日油價調整,漲幅大幅回落超260元/噸

油價早知道
2025-06-26 09:47:22
微胖女生玩真人CS破防開槍掃射路人,嘴臉爆火后“黑料”被扒又是抑郁癥…

微胖女生玩真人CS破防開槍掃射路人,嘴臉爆火后“黑料”被扒又是抑郁癥…

浪花媽媽
2025-06-24 23:41:41
大連又有一家外資企業要撤離了,大概150多人,已經陸續在裁員了

大連又有一家外資企業要撤離了,大概150多人,已經陸續在裁員了

星河也燦爛
2025-06-26 19:45:55
北京市副市長馬駿任市委常委,曾任北師大校長

北京市副市長馬駿任市委常委,曾任北師大校長

澎湃新聞
2025-06-27 19:48:30
小學生作文《熱死了》走紅,老師看后直接給滿分:我拜你為師吧!

小學生作文《熱死了》走紅,老師看后直接給滿分:我拜你為師吧!

深度知局
2025-06-25 00:03:58
不少儲戶“坐不住”了?存款新政迎來4大變化,有存款的人咋辦?

不少儲戶“坐不住”了?存款新政迎來4大變化,有存款的人咋辦?

搬磚營Z
2025-06-26 19:42:12
亞洲獨苗!2-0,49歲小因扎吉發威:率西亞勁旅晉級世俱杯16強

亞洲獨苗!2-0,49歲小因扎吉發威:率西亞勁旅晉級世俱杯16強

側身凌空斬
2025-06-27 10:57:57
烏軍在赫爾松擊沉黑海艦隊軍艦!空襲俄軍指揮部

烏軍在赫爾松擊沉黑海艦隊軍艦!空襲俄軍指揮部

項鵬飛
2025-06-26 20:36:32
婚房被小叔子借住2年,我要回時他說已過戶,我只好撥通110

婚房被小叔子借住2年,我要回時他說已過戶,我只好撥通110

云姐說情
2025-05-29 16:53:16
上映第7天,《醬園弄》就丟了冠軍,陳思誠新片9小時票房僅55萬

上映第7天,《醬園弄》就丟了冠軍,陳思誠新片9小時票房僅55萬

靠譜電影君
2025-06-27 09:46:24
這下俄羅斯應該滿意了!北約各國同意將國防開支提高至GDP的5%!

這下俄羅斯應該滿意了!北約各國同意將國防開支提高至GDP的5%!

翻開歷史和現實
2025-06-27 01:00:12
2025-06-27 21:48:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
3014文章數 11024關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

炸裂!榜一大姐深夜怒錘頂流

財經要聞

合新鐵路建設材料以次充好 多家單位被罰

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

時尚
房產
手機
本地
軍事航空

到了夏天,中年女人穿過膝裙不配運動鞋,才能美得優雅又得體

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

手機要聞

小米MIX Flip2線下上手:體驗后,說說真實感受

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

軍事要聞

美媒揭美軍37小時奔襲伊朗細節

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 色达县| 新竹县| 洛川县| 安图县| 姚安县| 西青区| 鲜城| 苏尼特右旗| 阿瓦提县| 南阳市| 昌江| 西乌| 怀安县| 长海县| 平顶山市| 临高县| 荣成市| 柘城县| 新乡县| 辉县市| 无极县| 沁源县| 花莲县| 防城港市| 上犹县| 清河县| 凤翔县| 清丰县| 长丰县| 保定市| 乐山市| 如皋市| 綦江县| 岱山县| 呈贡县| 怀远县| 贞丰县| 新巴尔虎右旗| 灵宝市| 修文县| 大英县|