網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

月之暗面開源 Kimi-K2：萬億參數(shù)，超強Agent，全線 SOTA

2025-07-16 17:54:09　來源: 大數(shù)據(jù)文摘

北京舉報

分享至

大數(shù)據(jù)文摘出品

2023年成立的中國AI初創(chuàng)公司月之暗面，剛剛發(fā)布了其最新重量級產(chǎn)品Kimi-K2。

這是一款參數(shù)規(guī)模高達一萬億的開源大模型，以挑戰(zhàn)GPT-4.1和Claude Sonnet 4為目標。

Kimi-K2沒有配備專門的“推理模塊”，卻依然在多個關(guān)鍵領(lǐng)域打破性能壁壘，這一策略讓人想起早前Deepseek的發(fā)布。

該模型采用“專家混合”（Mixture-of-Experts）架構(gòu)，每次推理時動態(tài)激活320億參數(shù)。

Kimi-K2的權(quán)重完全開放，允許研究者和開發(fā)者進行自定義微調(diào)與本地部署。

擊穿基準：沒有“推理模塊”的強者

Kimi-K2在多個通用語言模型評測中與閉源頂級模型并肩而立，甚至在編程與數(shù)學領(lǐng)域表現(xiàn)出壓倒性優(yōu)勢。

在被廣泛采用的SWE-bench Verified測試中，Kimi-K2-Instruct在“Agent模式”下獲得65.8%的得分，僅次于Claude Sonnet 4，遠超GPT-4.1的54.6%。

這個測試評估的是模型在真實開源項目中識別與修復(fù)代碼錯誤的能力，難度極高。

在LiveCodeBench測試中，Kimi-K2以53.7%的得分領(lǐng)跑所有模型，OJBench的得分也達到了27.1%。

這兩個評測分別模擬互動式編程任務(wù)與傳統(tǒng)競賽題，進一步證明了Kimi-K2在軟件工程場景中的適配能力。

更重要的是，官方強調(diào)“non-thinking”，意味著在無需顯式推理的基礎(chǔ)上，完成這些高復(fù)雜度任務(wù)。這對“推理模塊”至上的傳統(tǒng)語言模型設(shè)計提出了深刻反思。

在數(shù)學和科學領(lǐng)域，Kimi-K2在AIME、GPQA-Diamond和MATH-500等測評中穩(wěn)定優(yōu)于主要對手，展示出深度數(shù)學建模的潛力。

在多語言測試如MMLU-Pro中，它同樣進入領(lǐng)先梯隊，兼具多語言與跨學科能力。

值得一提的是，在一項非正式評測中，Kimi-K2能完整生成騎自行車的鵜鶘SVG圖像，而其他主流模型常常只畫出模糊形狀。

圖像生成的正確性在眾多模型中極為罕見，這也印證了Kimi-K2的空間理解與復(fù)雜結(jié)構(gòu)表達能力。

月之暗面強調(diào)，Kimi-K2專為Agent工作流而非日常對話而設(shè)計。

它能自主調(diào)用工具、執(zhí)行命令、生成與調(diào)試代碼，甚至完成復(fù)雜的多步驟流程。

在一場演示中，Kimi-K2完成了一整套薪資數(shù)據(jù)分析任務(wù)，包括：數(shù)據(jù)抓取、統(tǒng)計建模、并生成交互式HTML頁面，內(nèi)嵌可定制的推薦工具，全流程無需人工干預(yù)。

它不僅僅能“理解指令”，還能構(gòu)建復(fù)雜流程，從想法到產(chǎn)品，Kimi-K2一次完成。

媒體報道稱，這一切并非依賴龐大的推理系統(tǒng)，而是源于其在Agent環(huán)境中進行的強化學習訓(xùn)練，重點在于“工具協(xié)作”而非“邏輯演繹”。

分析認為，這種以“任務(wù)完成”為核心的訓(xùn)練方向，可能比傳統(tǒng)的“思考過程訓(xùn)練”更適用于實際場景。盡管如此，Kimi-K2仍有局限：如果任務(wù)本身不明確，或者工具調(diào)用鏈條過長，模型可能輸出拖沓或不完整。

此外，Kimi-K2在持續(xù)對話中的表現(xiàn)遠優(yōu)于單輪問答，這更加印證了其Agent化定位。

意思是：自研的 Muon 優(yōu)化器，在訓(xùn)練大模型時表現(xiàn)明顯好于主流的 AdamW。如果預(yù)訓(xùn)練語料是有限的，模型結(jié)構(gòu)也不變，那么“更省 token 的優(yōu)化器”能訓(xùn)練出“更聰明的模型”

Kimi-K2使用名為MuonClip的新訓(xùn)練算法，在規(guī)模達到15.5萬億tokens的訓(xùn)練中保持穩(wěn)定。該算法通過定期調(diào)整注意力機制中的關(guān)鍵參數(shù)，成功避免了大模型常見的“訓(xùn)練崩潰”問題。

one more thing

Kimi-K2目前提供兩個版本：Kimi-K2-Base用于研究與微調(diào)，Kimi-K2-Instruct適用于通用任務(wù)與Agent部署。

兩者均可通過月之暗面的OpenAI兼容API調(diào)用，價格分級明確。

緩存命中輸入每百萬tokens僅需$0.15，未命中為$0.60，輸出為$2.50，符合商業(yè)化預(yù)期。

月之暗面還允許開發(fā)者使用vLLM、SGLang、KTransformers或TensorRT-LLM在本地部署。

在GitHub上可查閱完整的部署說明。

模型遵循MIT開源協(xié)議，但對超大規(guī)模部署有附加條款：若產(chǎn)品用戶超過1億，或月營收超2000萬美元，需在界面明確展示“Kimi-K2”名稱。

這對于大多數(shù)初創(chuàng)公司或開發(fā)者來說不構(gòu)成障礙，反而是品牌信用的體現(xiàn)。

不過，Kimi-K2并非輕裝上陣：推理需調(diào)用320億參數(shù)，高效推理通常需多卡Hopper或同級GPU。

據(jù)蘋果開發(fā)者Awni Hannun透露，其4-bit量化版本可在兩臺配備512GB內(nèi)存的Apple M3 Ultra機器上運行，但門檻依然顯著。

作者長期關(guān)注 AI 產(chǎn)業(yè)與學術(shù)，歡迎對這些方向感興趣的朋友添加微信Q1yezi，共同交流行業(yè)動態(tài)與技術(shù)趨勢！

GPU 訓(xùn)練特惠！

H100/H200 GPU算力按秒計費，平均節(jié)省開支30%以上！

掃碼了解詳情?

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

剛剛，阿里最強編程模型開源！

智東西 2025-07-23 07:14:46
267 跟貼 267
造福or替代程序員？實測阿里新模型

虎嗅APP 2025-07-23 22:42:47
4 跟貼 4

Qwen3小升級即SOTA，開源大模型王座快變中國內(nèi)部賽了

量子位 2025-07-22 13:06:32
24 跟貼 24

開源Qwen凌晨暴擊閉源Claude！刷新AI編程SOTA，支持1M上下文

量子位 2025-07-23 08:37:45
12 跟貼 12
英偉達GPU被曝嚴重漏洞，致模型準確率暴跌99.9%

量子位 2025-07-23 15:34:19
4 跟貼 4

演講生成黑科技，PresentAgent從文本到演講視頻

機器之心Pro 2025-07-18 18:09:38
0 跟貼 0

微信能自動發(fā)消息了？不愛打字的用戶有福了！

雷科技 2025-07-23 12:22:56
3 跟貼 3
通義千問深夜“王炸”更新！Qwen3升級版全面超越Kimi-K2，Agent能力亮眼

華爾街見聞官方 2025-07-22 08:33:01
89 跟貼 89

杭州市余杭區(qū)部分小區(qū)供水異常調(diào)查情況通報

界面新聞 2025-07-23 17:44:30
26316 跟貼 26316
王楚欽已屏蔽所有社交軟件，坦言脫離賽場希望能做一個普通人

炫音新鮮事 2025-07-23 15:45:19
1 跟貼 1
網(wǎng)友稱未被云南大學錄取，查詢界面?zhèn)渥@示“總分低”

熱搜速報 2025-07-22 18:25:30
0 跟貼 0
幫你識別一下關(guān)于AI的那些“裝腔作勢”

秦朔朋友圈 2025-07-24 00:15:09
1 跟貼 1
印度一枚布拉莫斯導(dǎo)彈，被巴基斯坦拆解，相關(guān)參數(shù)全部破譯

全局觀 2025-07-21 16:11:47
0 跟貼 0
夸克健康大模型萬字調(diào)研報告:透視主任醫(yī)師級AI大腦背后的工程化

機器之心Pro 2025-07-23 17:22:20
0 跟貼 0
可靈ReCamMaster在海外爆火，帶你從全新角度看好萊塢大片

機器之心Pro 2025-07-23 19:04:22
0 跟貼 0
醉酒父親街頭摟著亭亭玉立女兒不時親手親臉:我生的

臺海大林 2025-07-23 08:47:56
6314 跟貼 6314
CVPR 2025 多模態(tài)大一統(tǒng)：斯坦福 x 復(fù)旦符號主義建模生成式任務(wù)

機器之心Pro 2025-06-13 10:11:44
0 跟貼 0
國內(nèi)120+AI Agent開發(fā)/構(gòu)建平臺大盤點（上）：互聯(lián)網(wǎng)、云計算、AI、傳統(tǒng)軟件廠商推出的智能體平臺

鈦媒體APP 2025-07-22 19:40:28
11 跟貼 11
迷你四驅(qū)車創(chuàng)始人田宮俊作去世，開創(chuàng)了日本塑料拼裝模型

澎湃新聞 2025-07-22 18:31:06
0 跟貼 0
游客被卷進滾水壩無法脫離男子直呼：已經(jīng)沒力氣了

臺海青年 2025-07-23 20:10:30
1407 跟貼 1407
封關(guān)后到海南出差、旅游等不需要額外辦理證件

央視新聞客戶端 2025-07-23 10:42:44
7408 跟貼 7408
理想i8上市倒計時：VLA技術(shù)成“致命賭注”？

汽車維基 2025-07-23 23:32:41
1 跟貼 1
黑人男友的恐怖，受教了，思想完全不在一個界面，可憐女人

思念幻化 2025-07-24 04:48:20
0 跟貼 0
主鋼筋被切斷？長沙一小區(qū)多棟精裝房存在安全隱患！住建局已介入

封面新聞 2025-07-23 12:58:04
2514 跟貼 2514
宇樹科技G1機器人展示武打動作：算法升級任意動作任意學

財聯(lián)社 2025-02-25 23:59:43
0 跟貼 0
24省份半年報陸續(xù)出爐：廣東穩(wěn)居首位四川守住第五

時代周報 2025-07-23 15:24:30
2569 跟貼 2569
三成年薪超50萬，AI技術(shù)人才狂攬金，國內(nèi)缺口仍超500萬人

智東西 2025-07-23 15:39:47
2 跟貼 2
“瀕死感”爆棚！有醫(yī)院僅一周30多人被“放倒”，最小才7歲！這個習慣趕緊改

極目新聞 2025-07-23 08:39:33
440 跟貼 440
理想汽車李想：我們比傳統(tǒng)汽車廠商更懂大型軟件

每日經(jīng)濟新聞 2025-03-29 12:03:06
50 跟貼 50
外網(wǎng)熱議：印度防長批準五代機執(zhí)行模型計劃.mp4

野模之家 2025-07-21 14:20:50
1 跟貼 1
7號臺風生成，直奔浙江！剛剛確認：這天起影響寧波，務(wù)必當心

魯中晨報 2025-07-23 11:20:05
272 跟貼 272
漲薪到 5W 后你才會發(fā)現(xiàn)，所謂工作能力強，其實就 5 點：1、接受工作，只問標準。2、請示工作，必帶方案

互聯(lián)網(wǎng)思維 2025-07-23 23:35:20
0 跟貼 0
聊聊AI Coding的現(xiàn)狀與未來｜沙龍招募

量子位 2025-07-22 13:08:01
0 跟貼 0
伊朗總統(tǒng)稱將繼續(xù)進行本土鈾濃縮

界面新聞 2025-07-23 16:07:10
5156 跟貼 5156
理想汽車OTA7.5版本更新?輔助駕駛 AD Pro車位隨心畫上線

旭車評 2025-07-23 17:48:50
8 跟貼 8
南京變“徽京”、大冶成“大治”？江蘇一博物館回應(yīng)地圖錯誤

揚子晚報 2025-07-23 07:32:25
478 跟貼 478
王楚欽接受新華社專訪表示基本屏蔽掉所有的社交軟件

大眼瞄世界 2025-07-23 23:58:53
7 跟貼 7
印度對華簽證門檻：不少于10萬元的6個月銀行流水

環(huán)球網(wǎng)資訊 2025-07-24 00:15:43
378 跟貼 378
殲36推廣價值何在？從反隱技術(shù)到體系適配看空天博弈邏輯

小郝的科普日常 2025-07-24 03:15:42
1 跟貼 1
智駕大升級！領(lǐng)克08配激光雷達+700TOPS芯，但185km續(xù)航成槽點

念寒車評 2025-07-23 22:53:56
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

月之暗面開源 Kimi-K2：萬億參數(shù)，超強Agent，全線 SOTA

別自嗨了！XREAL徐馳：AI眼鏡只有5歲智商

宗馥莉被質(zhì)疑讀的是“野雞大學” 校方回應(yīng)

宗馥莉被質(zhì)疑讀的是“野雞大學” 校方回應(yīng)

英格蘭最紅球星 也是加勒比島國驕傲

汪峰森林北同游日本 各帶各娃互不耽誤

律師解析娃哈哈遺產(chǎn)案:遺囑是最大變數(shù)

德系大招放盡 場地極限測試全新奧迪A5L

態(tài)度原創(chuàng)

《光環(huán)無限》美術(shù)組曾用辭職"逼宮"：要求用虛幻引擎

熱聞|清明假期將至，熱門目的地有哪些?

AppleCare+ 為 iPad 和 Apple Watch 帶來防盜和丟失選項

這雙丑鞋“泰”辣眼，跪求內(nèi)娛不要抄作業(yè)

英格蘭最紅球星也是加勒比島國驕傲

汪峰森林北同游日本各帶各娃互不耽誤

德系大招放盡場地極限測試全新奧迪A5L