99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

閆俊杰不甘心

0
分享至



從AI六小龍縮減為AI四小強后,四家明星大模型創業公司終于都要上線自己的推理模型了。

在智譜AI、月之暗面和階躍星辰相繼上線自研推理模型后,近期虎嗅爆料MiniMax籌備半年多的文本推理模型也即將發布。

有接近MiniMax的知情人士向字母榜(ID:wujicaijing)確認了上述爆料的真實性。

字母榜曾在《無人再談AI六小龍》一文中率先指出,原本被冠以六小龍稱號的隊伍中,因為有人明顯掉隊(零一萬物明確放棄追逐AGI,百川智能專注醫療垂類賽道),剩下的四家(智譜AI、MiniMax、月之暗面和階躍星辰),也失去了如一條過江龍般,足以挑戰乃至對抗大廠的資本和技術底氣。曾經的AI六小龍,已經在新一輪大模型競賽中滑落成了新的“AI四小強”。

曾幾何時,四小強中的MiniMax一度引領行業之先。2023 年下半年,大部分國內大模型廠商還在繼續迭代稠密模型(dense model)之際,MiniMax創始人兼CEO閆俊杰就把80%以上的研發和算力資源投到了一件不確定的事情上—— MoE(Mixture of Experts 混合專家模型)。



圖注:MiniMax創始人閆俊杰

2024年 1 月,MiniMax上線的abab6,成為國內首個MoE大模型。此后,MoE架構徹底取代稠密架構,成了大模型領域技術迭代的新方向,年初爆火出圈的DeepSeek,應用的也是MoE。

但在DeepSeek R1掀起的新一輪推理模型浪潮中,MiniMax卻成了那個后來者。當騰訊等玩家紛紛靠接入DeepSeek賺取用戶關注之際,不甘心的MiniMax選擇了一種折中方案:國內C端應用上堅持不接入DeepSeek,只在海外的AI應用上選擇接入DeepSeek。

MiniMax的此番操作,不免讓人聯想到字節,后者同樣選擇不在國內主力C端應用豆包上接入DeepSeek,而是堅持等到后續自研推理模型的上線,才補上了深度思考的能力短板。

如今,閆俊杰也等來了一個如字節一般的機會,即嘗試通過借助自家推理模型的上線,來重新證明MiniMax的技術底色。

A

缺失推理模型的影響,正從多個方面左右著大模型玩家的發展狀態。

首當其沖的便是外界對其高估值和后續融資是否可持續的質疑

2024年3月,MiniMax拿下6億美元A輪融資后,投后估值來到25億美元,這是MiniMax最后一次公開披露的投融資和估值信息。

2025年年初,外界有傳聞MiniMax估值已經超過30億美元,不過,據字母榜從接近MiniMax知情人士處獲悉的消息,當前MiniMax估值已經超過40億美元,仍然是當前四小強中估值最高的一家,“(MiniMax)全棧技術價值更高一些。”恒業資本管理合伙人江一如此評價道。



但遲遲未上推理模型,資本市場也開始重估MiniMax的估值體系。

比上線推理模型更難的是,不僅要有,作為后來者,還要做到比R1更好才行,“Kimi就是一個例子,盡管跟R1同時期上線了K1.5推理模型,但效果對比上顯然敗給了R1。”人工智能專家林峰博士說。

這也成了拖住MiniMax自家推理模型未能更早上線的因素之一。在MiniMax前員工李俊(化名)回憶中,去年中公司就開啟了推理模型的研發工作。MiniMax高級研究總監鐘怡然更是曾對外劇透,公司有望在4月到5月間,推出深度推理模型。

但現實的情況是,在技術迭代優化過程中,MiniMax食言了。按照當前進度來看,樂觀情況下,MiniMax自研推理模型也要到6月中旬左右上線了。

因缺失推理模型所帶來的深度思考能力短板,還使得MiniMax在應用側難以吸引并聚攏起更多用戶,考慮到國內應用還堅持不接入DeepSeek,這一難題無疑被進一步放大。

對比騰訊元寶,靠著率先接入DeepSeek的舉動,其月活用戶一躍從去年AI原生APP陣營中的others,變成了當前的行業TOP3(僅次于DeepSeek和豆包)。

B端的影響也在逐步顯現。因為無法提供推理模型選項,公司可能會被迫將更多模型調用需求推向對手。

因模型能力短板或性價比因素而轉投新陣營的事例比比皆是。去年5月DeepSeek掀起價格戰后,作為第一家在旗艦模型上跟進降價的玩家,字節就曾靠著性價比優勢,從MiniMax手中分潤走了一部分AI兒童玩具公司Haivivi的語音模型調用需求。

B

拖累MiniMax推理模型更早上線的原因,一部分要歸因于閆俊杰更大的賭性。

當DeepSeek、Kimi們著手研發推理模型之際,MiniMax則將重心放在了架構創新上。“相同的算力和資源的情況下,內部沒有太多人力去做深度推理的,這導致我們跟隨深度推理的腳步慢一點。”MiniMax高級研究總監鐘怡然曾對外如此解釋。



早于DeepSeek R1發布近一周,1月15日,MiniMax發布了MiniMax-01并正式開源,在新模型中首次嘗試使用線性注意力架構Linear Attention。

官方介紹,MiniMax-01是首次在4000億以上參數的大模型中,使用了線性注意力機制新架構(ChatGPT采用的標準Transformer是非線性注意力機制),能高效處理全球最長的 400萬token上下文。

就像當年冒險賭注MoE一樣,閆俊杰將籌碼再次押在了Linear Attention上。

2024年4月,MiniMax成為第一批鉆研Linear Attention的AI公司。隨著MiniMax-01發布,公司內部也開始迎來新架構的更換,即從此前abab系列模型采用的Transformer架構,逐步更換為MiniMax-01模型采用的線性架構,后續視頻、音樂等多模態模型更新,都將基于全新架構。

這也是MiniMax內部沒有選擇立馬跟進OpenAI o1的原因之一。“我們認為單純強調推理能力,可能僅會在某些特定方面增強模型性能。”鐘怡然解釋說。

然而,R1的發布,給了MiniMax一個措手不及,“我們發現融入這些推理能力,模型的外推能力顯著提升,泛化能力更好。”為了追趕行業新態勢,鐘怡然所在的模型研發團隊,整個春節期間都在趕工,以圖加快推理模型上線。“內部給出的目標是,要做出比R1更好、甚至要達到o1或o3相近水準的推理模型,且實現多模態推理能力。”

不甘心的閆俊杰決定再次冒險:試圖趕在DeepSeek前面,推出一個原生多模態深度推理模型,既能實現文本推理能力,又具備視覺理解能力。

但在虎嗅爆料中,MiniMax即將發布的推理模型則指具備文本理解能力。后續是否會加入視覺理解,還是分階段逐步推出,目前仍留有懸念。

C

除了因冒險押注新架構帶來的資源分散之外,在應用上的豪賭布局,也分散了MiniMax追求模型迭代的精力。

AI六小龍中,MiniMax布局幾乎最廣:既做To C,又做to B;既做國內,又做海外。龐大的業務策略,帶來的代價之一便是產品和模型團隊之間的“打架”。

MiniMax前員工李俊告訴字母榜,2024年,公司將收入和產品日活視為兩大重要指標,甚至會出現這月追求收入,下月強調用戶增長的頻繁變動情況。



從2023年開始,圍繞娛樂和生產力工具賽道,MiniMax一個都不打算放過:Talkie、星野、海螺AI相繼問世,堪比AI圈的新APP工廠。

為了打造產品,閆俊杰還特意挖來前今日頭條用戶產品負責人張前川,給其賦予了公司合伙人的身份。

但豪賭一年后,閆俊杰為公司設立的2024年收入過億美元和產品日活過千萬兩大目標,均未能實現。這也成為公司后續人員變動和組織架構調整的新導火索。

今年3月份,MiniMax負責商業化的合伙人兼副總裁魏偉離職,更早之前,從去年9月份開始,MiniMax產品負責人張前川,便淡出公司事務,改任產品顧問一職。

兩大合伙人相繼變動之下,MiniMax在應用側也改變了策略:旗下AI應用“海螺AI”一分為二,拆分為一個主打AI助手的“MiniMax”,和側重視頻創作的“海螺AI”。

幾次豪賭過后,閆俊杰吸取到的最大教訓之一是,對技術品牌沒有很深的認知。在2023年初認識梁文鋒后,后者有兩件事對閆俊杰一直帶來啟發:一是DeepSeek品牌做得非常好;另一個是DeepSeek一開始沒有產品,所以更聚焦。

DeepSeek爆火并在短短時間內成為國內月活第一AI原生APP后,閆俊杰糾正了自己過去兩年來的一個誤區:即認為用戶越多,模型能力提升越快。實際則是“更好的模型可以導向更好的應用,但更好的應用和更多用戶并不會導向更好的模型。”

基于這一新的判斷,閆俊杰重新做了取舍,不再將用戶規模和商業化視作重點,而是重新將技術迭代確立為MiniMax的最重要目標。

D

但新的挑戰接踵而至。

當下大模型賽道正進入淘汰賽,資金持續承壓已成為行業現實。恒業資本管理合伙人江一爆料稱,魏偉的離職原因之一,是因為融資KPI考核未達標。

但被融資困住的不只有MiniMax。“本質上是市夢率的時代在短短兩年內已經結束。現在面臨的是融資放緩+收入壓力+戰略調整的新階段。”在江一看來,外界對大模型公司的考核標準,正從交付MaaS變成交付結果,競爭焦點也從過去比參數大小、多模態能力,偏向現在比誰能真正解決用戶問題。

“最后市場狀態,基礎模型市場上正常情況下應該不超過三家。”怎么能確保繼續留在這場大模型牌桌之上,持續獲取融資的能力便成了決定勝負的關鍵手。

畢竟,無論是更新迭代模型能力,還是打造能夠解決用戶真實需求的Agent,無一例外都需要人才和算力資源的支撐,這些要素都得靠源源不斷的金錢來維系運轉。

稍有松懈,這些大模型廠商就可能面臨被迫落后的局面:要么核心研發人員出走創業,要么在重要技術迭代方向上慢人一步。

即便解決好內部人才和資源問題,但隨著DeepSeek重新激起大廠的AI熱情,如MiniMax一般的初創公司,該如何在競爭中繼續做出自己的技術亮點并保持領先地位,正變得越來越難。

MiniMax當前正寄望于用新的原生多模態推理模型重回舞臺中央,但在這一領域,字節、阿里,騰訊,提前一步已經在文本推理模型之外,上線了圖像推理模型:3月份,阿里通義千問團隊推出QVQ-Max視覺推理模型;4月份,豆包深度思考模型專門打造了視覺版,具備視覺推理能力;5月份,騰訊混元T1-Vision上線元寶,可深度理解圖片內容。



更大的競爭還在后面。延期后的MiniMax推理模型,即將直面DeepSeek R2和GPT-5的競爭,后兩者都有望在今年下半年上線。

近期在墨西哥舉辦的AI Summit上,OpenAI代表確認正在開發下一代基礎模型GPT-5,并有望年內上線。

DeepSeek R2的推出步伐也越來越近。按照DeepSeek以往內部模型每7個月一更新的節奏,新一代V4模型有望在今年7月份亮相。如果梁文鋒希望在V4版本上訓練R2,以R1與V3相隔1個月的推出時間差評估,R2最快便有望在8月份上線。

對于想要繼續留在牌桌上的閆俊杰而言,這場AI大模型的競爭還遠沒到盡頭。

參考資料:

《MiniMax正暗戳戳憋大招》虎嗅

《奧特曼逼梁文鋒出大招》直面AI

《晚點對話 MiniMax 閆俊杰:創業沒有天選之子》晚點對話

《3700 次預訓練尋找 “線性注意力” 非共識,MiniMax-01 開發者講述 4 年探索》晚點LatePost

《MiniMax-01開源:新架構開啟Agent時代》MiniMax稀宇科技

《MiniMax:7000萬美金營收下的甜蜜和隱憂》智能涌現

《MiniMax大模型每日與世界的30億次交互》MiniMax稀宇科技

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
準備大開眼界吧!今年九三大閱兵可不一般,東風-41都得坐小孩桌

準備大開眼界吧!今年九三大閱兵可不一般,東風-41都得坐小孩桌

健身狂人
2025-07-21 05:38:29
河南南陽女孩“七七”的媽媽隱藏多條視頻,否認“接商演2小時酬勞8000元”稱只是逛街,商場回應

河南南陽女孩“七七”的媽媽隱藏多條視頻,否認“接商演2小時酬勞8000元”稱只是逛街,商場回應

極目新聞
2025-07-23 17:37:49
曝楊議早就入不敷出了,沒繼承上億遺產,老爹去世14天就原形畢露

曝楊議早就入不敷出了,沒繼承上億遺產,老爹去世14天就原形畢露

火之文
2025-07-23 17:20:03
你碰到最巧的事是什么?連科學都解釋不了的巧合,像是提前安排的

你碰到最巧的事是什么?連科學都解釋不了的巧合,像是提前安排的

特約前排觀眾
2025-07-23 00:05:10
杜建英同學發聲,稱宗馥莉沒教養是惡人,杜建英多年一直愁眉不展

杜建英同學發聲,稱宗馥莉沒教養是惡人,杜建英多年一直愁眉不展

大笑江湖史
2025-07-18 07:37:43
上海就“外賣大戰”約談餓了么?市監局:只是了解情況,防范不正當競爭

上海就“外賣大戰”約談餓了么?市監局:只是了解情況,防范不正當競爭

澎湃新聞
2025-07-23 19:52:27
宗澤后又曝大瓜,宗馥莉結過婚,前夫身份不簡單,網友反應一邊倒

宗澤后又曝大瓜,宗馥莉結過婚,前夫身份不簡單,網友反應一邊倒

查爾菲的筆記
2025-07-21 19:02:15
金庸武俠13位男主排名,楊過才第七,第一名打沉了一座島

金庸武俠13位男主排名,楊過才第七,第一名打沉了一座島

小李大俠
2025-07-16 11:06:33
廣東基孔肯雅熱確診已超2000例 記者探訪定點收治機構

廣東基孔肯雅熱確診已超2000例 記者探訪定點收治機構

極目新聞
2025-07-22 22:53:57
事實證明,從央視“消失”的李七月,已經走上事業的另一條大道

事實證明,從央視“消失”的李七月,已經走上事業的另一條大道

七公子娛樂
2025-07-07 10:28:44
日媒:石破茂稱有意與特朗普舉行會談

日媒:石破茂稱有意與特朗普舉行會談

參考消息
2025-07-23 18:18:36
切爾西4位“躺王”!周薪66萬鎊,總價2.3億歐!廢將難清洗啊

切爾西4位“躺王”!周薪66萬鎊,總價2.3億歐!廢將難清洗啊

萬花筒體育球球
2025-07-24 00:15:22
諾基亞發了臺169元的新機,這操作把網友們整不會了

諾基亞發了臺169元的新機,這操作把網友們整不會了

鋒潮評測
2025-07-23 18:29:58
方媛曬三胎孕期生活,臥室床大獨居,吃葉酸喝雞尾酒穿小紅高跟鞋

方媛曬三胎孕期生活,臥室床大獨居,吃葉酸喝雞尾酒穿小紅高跟鞋

二月侃事
2025-07-23 07:49:05
杜江夫婦攜狗狗參加比賽,霍思燕身著抹胸裙,網友:胸快到肚子了

杜江夫婦攜狗狗參加比賽,霍思燕身著抹胸裙,網友:胸快到肚子了

塞外書娛
2025-07-23 12:06:47
賴亞文離開,趙勇又換人,蓋洋干擾國家隊用人?

賴亞文離開,趙勇又換人,蓋洋干擾國家隊用人?

風風拒絕焦慮
2025-07-22 18:10:49
【德國】被冤枉了,9年前中國夫婦在天鵝堡失蹤,誤以為被殺害,沒想到今天在荷蘭突然現身

【德國】被冤枉了,9年前中國夫婦在天鵝堡失蹤,誤以為被殺害,沒想到今天在荷蘭突然現身

魯曉芙看歐洲
2025-07-23 05:14:35
為啥中國用戶這么偏愛喜歡Intel,而中國以外的市場卻非常慘淡?

為啥中國用戶這么偏愛喜歡Intel,而中國以外的市場卻非常慘淡?

創業者李孟
2025-07-23 02:12:48
不踢了!中超巨星即將退出國家隊,與主帥不和,專心俱樂部比賽

不踢了!中超巨星即將退出國家隊,與主帥不和,專心俱樂部比賽

國足風云
2025-07-23 08:30:48
49歲趙薇,傳來新消息!

49歲趙薇,傳來新消息!

山西晚報
2025-07-21 18:51:54
2025-07-24 01:32:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
1948文章數 8006關注度
往期回顧 全部

科技要聞

別自嗨了!XREAL徐馳:AI眼鏡只有5歲智商

頭條要聞

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

頭條要聞

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

體育要聞

英格蘭最紅球星 也是加勒比島國驕傲

娛樂要聞

汪峰森林北同游日本 各帶各娃互不耽誤

財經要聞

律師解析娃哈哈遺產案:遺囑是最大變數

汽車要聞

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

房產
親子
本地
公開課
軍事航空

房產要聞

海南自由貿易港全島封關,2025年12月18日正式啟動!

親子要聞

醫學科普中醫脾胃育兒

本地新聞

這雙丑鞋“泰”辣眼,跪求內娛不要抄作業

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國核彈頭重回英國牽動全球神經

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 鹰潭市| 江孜县| 彰武县| 和林格尔县| 宁晋县| 那曲县| 措美县| 新兴县| 综艺| 杭锦后旗| 黄石市| 垫江县| 德令哈市| 济宁市| 乌兰县| 南郑县| 托克逊县| 苏尼特右旗| 霞浦县| 栖霞市| 宜昌市| 南川市| 应城市| 兴义市| 郸城县| 诏安县| 黎城县| 临猗县| 元谋县| 来宾市| 盱眙县| 紫云| 罗甸县| 灌阳县| 古田县| 黔西| 沁阳市| 安国市| 灵山县| 银川市| 朝阳县|