99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

憋大招,MiniMax發布全球首個混合架構開源模型M1 能后來者居上嗎?

0
分享至

總部位于上海的人工智能獨角獸企業MiniMax突然放了個大招。

6月17日,MiniMax正式發布其自主研發的MiniMax-M1(以下簡稱M1)系列模型。根據MiniMax方面的介紹,M1被定義為“全球首個開源的大規模混合架構推理模型”。

此外,技術報告顯示:M1模型在處理百萬Token(大模型處理文本時的最小單位)級長文本的能力方面實現了重大突破,成為上下文最長的推理模型;其RL(強化訓練)成本下降一個量級,成本僅53萬美金,推理效率則數倍于競爭對手。

今年開年以來,DeepSeek持續沖擊著大模型行業的格局,接入DeepSeek-R1一度被很多企業視為擁抱AI(人工智能)的標志。

如今,MiniMax推出號稱具備“全球最長上下文”的M1模型,有可能后來者居上嗎?

當前上下文最長的推理模型 價格還主打性價比

據了解,MiniMax不僅開源了模型權重,還提供了API(應用程序編程接口)服務,價格主打性價比。

其定價策略為:

在0~3.2萬(含)Token范圍,輸入時0.8元/百萬Token,輸出時8元/百萬Token;

在3.2萬~12.8萬(含)Token范圍,輸入時1.2元/百萬Token,輸出時16元/百萬Token;

在12.8萬~100萬Token范圍,輸入時2.4元/百萬Token,輸出時在24元/百萬Token。

據介紹,前兩個檔位的定價均低于DeepSeek-R1,而第三個超長文本檔位則是該模型目前尚未覆蓋的領域。此外,MiniMax宣布,在其自有的App(應用程序)和Web(網絡)端,M1模型將保持不限量免費使用。

此外,在長文本能力上,M1模型原生支持高達100萬Token的上下文窗口,這一數字與谷歌最新的Gemini 2.5 Pro持平,是DeepSeek-R1(12.8萬Token)的近8倍。同時,它還支持業內最長的8萬Token推理輸出。


圖片來源:開源技術報告截圖

MiniMax方面表示,實現這一突破的關鍵在于獨創的“Lightning Attention”混合構架。傳統的“Transformer”模型在處理長序列時,注意力機制的計算量會隨序列長度呈平方級增長,成為制約性能和成本的主要瓶頸。M1的混合架構,特別是注意力機制,能夠顯著優化長下文輸入的計算效率。

就這一模型,知名數字經濟學者、工信部信息通信經濟專家委員會委員盤和林對《每日經濟新聞》記者表示,之前大模型采用的“PPO/GRPO”裁剪方式有一些缺陷,MiniMax通過“CISPO”(Clipped IS-weight Policy Optimization)對這些缺陷進行了一些優化,其目的還是為了降低訓練成本和推理成本。

據記者了解,MiniMax此次提出的CISPO算法是另辟蹊徑,它沒有采用傳統算法中調整Token的更新方式,而是通過裁剪重要性采樣權重來提升、強化學習的效率、穩定性。

“這是進步,但這個進步是否能夠轉化為商業價值暫時還不清楚。要看具體工具在應用層面的反饋。”盤和林說。

值得一提的是,今年4月,阿里巴巴開源新一代通義千問模型Qwen3(以下簡稱千問3),參數量僅為DeepSeek-R1的1/3,成本大幅下降,據稱性能全面超越DeepSeek-R1、OpenAI o1等全球頂尖模型。

3月16日,百度正式發布“文心大模型4.5”“文心大模型X1”。據介紹,文心大模型4.5是百度首個原生多模態大模型,API調用價格僅為GPT-4.5的1%。文心大模型X1為深度思考模型,性能對標DeepSeek-R1,調用價格約為其一半。


圖片來源:視覺中國-VCG211431510188

大模型還有優化空間,誰找對方向就是下一科技巨頭

或許可以說,M1是MiniMax憋了許久的大招之一。

在DeepSeek的沖擊之下,大模型創業公司今年一開年就面對著戰略方向的轉折點:是做技術還是做產品?

今年1月,MiniMax創始人兼CEO閆俊杰在接受媒體采訪時表示,在更明確“智能水平的提升,沒那么依賴很多用戶”后,他做出了取舍,結束了整整半年多的焦慮。閆俊杰明確,現在MiniMax最重要的目標不是增長,也不是收入,是“加速技術迭代”。

同樣在1月,MiniMax發布并開源新一代“01系列”模型,包含基礎語言大模型“MiniMax-Text-01”和視覺多模態大模型“MiniMax-VL-01”。

到了3月,MiniMax對品牌進行了更清晰的拆分,據悉,MiniMax將旗下AI應用“海螺AI”正式更名為“MiniMax”,國內版和國際版同步調整。

5月,MiniMax發布新一代語音大模型“Speech-02”。據介紹,基于超強技術與足夠泛化的模型能力,Speech-02為用戶帶來超擬人、個性化、多樣性的語音服務。

雖說在重要性上讓步于技術攻堅,但在商業化上,MiniMax在B端(商業端)和C端(消費者端)上皆有布局,對國內市場和海外市場皆有涉獵。

此外,在今年1月發布并開源新一代01系列模型時,MiniMax方面便提及,2025年,AI將迎來至關重要的發展節點,AI Agent(智能體)有望成為新一年最重要的產品形態,引領AI從傳統的“工具”角色向更具互動性與協作性的“伙伴”角色轉變。

當時,MiniMax便表示:“首先,我們認為這有可能啟發更多長上下文的研究和應用,從而更快促進Agent時代的到來;第二,開源也能促使我們努力做更多創新,更高質量地開展后續的模型研發工作。”

國泰海通證券在近期的研報中提及,大模型在多模態理解和復雜推理上的突破,為AI Agent的發展提供了核心技術支撐。AI 應用雖尚處于落地初期,但未來發展路徑明晰,當前處于B端萌芽期,未來C端有望大規模爆發,最終將實現B端與C端并行發展,全面推動AI產業繁榮。

MiniMax剛剛推出的M1是否能助力其在AI Agent這一方向上的發展?對此,盤和林肯定其“有幫助”,但認為還沒有到革命性的程度,屬于漸進性算法優化。

早在今年1月接受采訪時,閆俊杰就明確了技術和產品的關系,他表示,更好的模型可以導向更好的應用,但更好的應用和更多用戶并不會導向更好的模型。

在DeepSeek火爆全網時,MiniMax堅持將目標定為“加速技術迭代”。半年后,MiniMax終于來到了自己的“主場時刻”。據記者了解,M1的發布僅僅是拉開了MiniMax“開源周”的序幕。在接下來的4個工作日里,MiniMax計劃每天發布一項新技術或產品更新。

就MiniMax堅持技術攻堅的前景,盤和林表示,他看好加碼大模型的創業公司。盤和林進一步分析說:“現階段的基礎模型依然有很大的提升空間,很多用戶并不喜歡用AI來干活,因為AI不聰明且很慢。之前,有人用所謂的智能體來生成報告,這些智能體卻用了數天乃至數周的時間還沒有完成,這效率并不比真人高。如今很多人用AI,也只能解決一部分工作,無法做到直接交付工作的程度。”

在盤和林看來,大模型一定還有優化空間,誰找對了大模型算法優化的方向,誰就是下一個科技巨頭。“DeepSeek向前走了一步,但還不夠。”盤和林說。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
兒子被“中考分流”后,我才明白:為人父母,千萬不要欠這三本賬

兒子被“中考分流”后,我才明白:為人父母,千萬不要欠這三本賬

詩詞中國
2025-06-17 12:55:55
巴列維王黨活躍!內塔尼亞胡:伊朗內部將發生巨大變化

巴列維王黨活躍!內塔尼亞胡:伊朗內部將發生巨大變化

鷹眼Defence
2025-06-17 18:38:08
敢打就滅了以色列?中東一夜變天:伊朗終于醒悟,再不動手就晚了

敢打就滅了以色列?中東一夜變天:伊朗終于醒悟,再不動手就晚了

帥先工場
2025-06-15 16:01:47
李新翔:主帥在定位球方面做出了特別部署,客場拿下3分不容易

李新翔:主帥在定位球方面做出了特別部署,客場拿下3分不容易

直播吧
2025-06-18 21:48:11
音樂人科欽夫疑回應數學考10分,自稱曾三次高考,數理化加起來不夠60分

音樂人科欽夫疑回應數學考10分,自稱曾三次高考,數理化加起來不夠60分

現代快報
2025-06-17 18:00:17
19歲漂亮女孩失聯超70小時!又是消失在大橋,種種跡象讓人悲憫…

19歲漂亮女孩失聯超70小時!又是消失在大橋,種種跡象讓人悲憫…

火山詩話
2025-06-18 06:05:34
讓領導先走:以色列的終極“斬首藝術”

讓領導先走:以色列的終極“斬首藝術”

望岳
2025-06-17 11:55:50
一家四口緊急入院,小心夏日隱形“廚房殺手”

一家四口緊急入院,小心夏日隱形“廚房殺手”

人民日報健康客戶端
2025-06-17 16:35:11
第12波打擊開始!伊朗越打越猛,以色列迎不眠之夜,川普大怒威脅

第12波打擊開始!伊朗越打越猛,以色列迎不眠之夜,川普大怒威脅

史紀文譚
2025-06-18 20:58:32
大捷!伊朗打出王牌,官宣奪占以方領空!美航母被曝正駛向波斯灣

大捷!伊朗打出王牌,官宣奪占以方領空!美航母被曝正駛向波斯灣

愛下廚的阿釃
2025-06-18 20:38:07
24GB+1TB!小米新機公布:6月20日,正式發布!

24GB+1TB!小米新機公布:6月20日,正式發布!

科技堡壘
2025-06-16 11:38:51
夫妻花200w買下廢棄別墅,入住時發現少了個次臥,把墻砸開后蒙了

夫妻花200w買下廢棄別墅,入住時發現少了個次臥,把墻砸開后蒙了

櫻桃講堂
2025-06-18 17:24:22
以軍變本加厲,伊朗新司令,僅上臺96小時就殉國

以軍變本加厲,伊朗新司令,僅上臺96小時就殉國

科技有趣事
2025-06-18 11:56:28
高鐵保衛戰!“休想換走我的F座”,說出多少人的“領土宣言”

高鐵保衛戰!“休想換走我的F座”,說出多少人的“領土宣言”

削桐作琴
2025-06-18 13:11:28
海港超流暢配合!李新翔破82天球荒,萊昂納多神助攻,蒯紀聞策動

海港超流暢配合!李新翔破82天球荒,萊昂納多神助攻,蒯紀聞策動

奧拜爾
2025-06-18 20:16:24
56歲白巖松發生意外

56歲白巖松發生意外

最江陰
2025-06-18 21:35:29
國乒WTT崩盤被零封,三大主力爆冷出局,何卓佳死磕韓國

國乒WTT崩盤被零封,三大主力爆冷出局,何卓佳死磕韓國

新語愛八卦
2025-06-18 17:16:01
9000億灰飛煙滅!五糧液,還有戲嗎?

9000億灰飛煙滅!五糧液,還有戲嗎?

看財經show
2025-06-18 15:23:30
厲害!《哪吒》又爬回了第一名,《哪吒2》全球票房已破159億

厲害!《哪吒》又爬回了第一名,《哪吒2》全球票房已破159億

影視高原說
2025-06-17 13:55:39
內蒙古自治區政府主席王莉霞:認真反思、深刻汲取通遼市毀林毀草問題嚴重典型案例教訓

內蒙古自治區政府主席王莉霞:認真反思、深刻汲取通遼市毀林毀草問題嚴重典型案例教訓

新京報政事兒
2025-06-18 08:52:28
2025-06-18 22:19:00
每日經濟新聞 incentive-icons
每日經濟新聞
中國主流財經全媒體平臺。
1268238文章數 2715123關注度
往期回顧 全部

科技要聞

別叫我互聯網公司,京東的野心藏不住了

頭條要聞

廣東懷集出現55.22米洪峰水位 洪水已漫入周邊居民樓

頭條要聞

廣東懷集出現55.22米洪峰水位 洪水已漫入周邊居民樓

體育要聞

高僧下山了!文班結束少林寺10日修行

娛樂要聞

前老板舉報李雪琴欠190萬轉移公司財產

財經要聞

被爆添加毒原料后相宜本草高管先后出走

汽車要聞

燈光技術升級還有插混版本 全新奧迪Q3預計明年國產

態度原創

時尚
數碼
本地
游戲
軍事航空

這些才是氣質女人都喜歡的穿搭!不花哨、不俗艷,舒適又自然

數碼要聞

安卓唯一,小米平板 7S Pro 支持 PC 級懸浮鍵盤

本地新聞

黎錦匠人鄭春榮:經緯千年 我在海島織黎錦

《法環》電影導演正在打七周目:女武神最難 碎星簡單

軍事要聞

特朗普呼吁伊朗無條件投降

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 西乌珠穆沁旗| 襄汾县| 普定县| 合阳县| 将乐县| 中江县| 舞阳县| 二连浩特市| 上蔡县| 华宁县| 合山市| 满城县| 兴义市| 阿克苏市| 阿合奇县| 洪洞县| 蓬安县| 电白县| 常熟市| 茶陵县| 宜兴市| 赣榆县| 天镇县| 青川县| 武清区| 晋州市| 大方县| 龙江县| 伊金霍洛旗| 竹山县| 上杭县| 台安县| 武功县| 新丰县| 堆龙德庆县| 团风县| 花垣县| 梁山县| 水城县| 商水县| 济源市|