99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

月之暗面開源 Kimi-K2:萬億參數,超強Agent,全線 SOTA

0
分享至


大數據文摘出品

2023年成立的中國AI初創公司月之暗面,剛剛發布了其最新重量級產品Kimi-K2。

這是一款參數規模高達一萬億的開源大模型,以挑戰GPT-4.1和Claude Sonnet 4為目標。

Kimi-K2沒有配備專門的“推理模塊”,卻依然在多個關鍵領域打破性能壁壘,這一策略讓人想起早前Deepseek的發布。

該模型采用“專家混合”(Mixture-of-Experts)架構,每次推理時動態激活320億參數。

Kimi-K2的權重完全開放,允許研究者和開發者進行自定義微調與本地部署

擊穿基準:沒有“推理模塊”的強者

Kimi-K2在多個通用語言模型評測中與閉源頂級模型并肩而立,甚至在編程與數學領域表現出壓倒性優勢。


在被廣泛采用的SWE-bench Verified測試中,Kimi-K2-Instruct在“Agent模式”下獲得65.8%的得分,僅次于Claude Sonnet 4,遠超GPT-4.1的54.6%

這個測試評估的是模型在真實開源項目中識別與修復代碼錯誤的能力,難度極高。


在LiveCodeBench測試中,Kimi-K2以53.7%的得分領跑所有模型,OJBench的得分也達到了27.1%

這兩個評測分別模擬互動式編程任務與傳統競賽題,進一步證明了Kimi-K2在軟件工程場景中的適配能力。

更重要的是,官方強調“non-thinking”,意味著在無需顯式推理的基礎上,完成這些高復雜度任務。這對“推理模塊”至上的傳統語言模型設計提出了深刻反思。


在數學和科學領域,Kimi-K2在AIME、GPQA-Diamond和MATH-500等測評中穩定優于主要對手,展示出深度數學建模的潛力。

在多語言測試如MMLU-Pro中,它同樣進入領先梯隊,兼具多語言與跨學科能力


值得一提的是,在一項非正式評測中,Kimi-K2能完整生成騎自行車的鵜鶘SVG圖像,而其他主流模型常常只畫出模糊形狀。

圖像生成的正確性在眾多模型中極為罕見,這也印證了Kimi-K2的空間理解與復雜結構表達能力。

月之暗面強調,Kimi-K2專為Agent工作流而非日常對話而設計

它能自主調用工具、執行命令、生成與調試代碼,甚至完成復雜的多步驟流程。

在一場演示中,Kimi-K2完成了一整套薪資數據分析任務,包括:數據抓取、統計建模、并生成交互式HTML頁面,內嵌可定制的推薦工具,全流程無需人工干預。


它不僅僅能“理解指令”,還能構建復雜流程,從想法到產品,Kimi-K2一次完成

媒體報道稱,這一切并非依賴龐大的推理系統,而是源于其在Agent環境中進行的強化學習訓練,重點在于“工具協作”而非“邏輯演繹”。

分析認為,這種以“任務完成”為核心的訓練方向,可能比傳統的“思考過程訓練”更適用于實際場景。盡管如此,Kimi-K2仍有局限:如果任務本身不明確,或者工具調用鏈條過長,模型可能輸出拖沓或不完整。

此外,Kimi-K2在持續對話中的表現遠優于單輪問答,這更加印證了其Agent化定位。


意思是:自研的 Muon 優化器,在訓練大模型時表現明顯好于主流的 AdamW。如果預訓練語料是有限的,模型結構也不變,那么“更省 token 的優化器”能訓練出“更聰明的模型”

Kimi-K2使用名為MuonClip的新訓練算法,在規模達到15.5萬億tokens的訓練中保持穩定。該算法通過定期調整注意力機制中的關鍵參數,成功避免了大模型常見的“訓練崩潰”問題。


one more thing

Kimi-K2目前提供兩個版本:Kimi-K2-Base用于研究與微調,Kimi-K2-Instruct適用于通用任務與Agent部署。

兩者均可通過月之暗面的OpenAI兼容API調用,價格分級明確。

緩存命中輸入每百萬tokens僅需$0.15,未命中為$0.60,輸出為$2.50,符合商業化預期。

月之暗面還允許開發者使用vLLM、SGLang、KTransformers或TensorRT-LLM在本地部署。

在GitHub上可查閱完整的部署說明。

模型遵循MIT開源協議,但對超大規模部署有附加條款:若產品用戶超過1億,或月營收超2000萬美元,需在界面明確展示“Kimi-K2”名稱

這對于大多數初創公司或開發者來說不構成障礙,反而是品牌信用的體現

不過,Kimi-K2并非輕裝上陣:推理需調用320億參數,高效推理通常需多卡Hopper或同級GPU。

據蘋果開發者Awni Hannun透露,其4-bit量化版本可在兩臺配備512GB內存的Apple M3 Ultra機器上運行,但門檻依然顯著。

作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

GPU 訓練特惠!

H100/H200 GPU算力按秒計費,平均節省開支30%以上!

掃碼了解詳情?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
官方價沒套路,捷豹XEL官降,15.98w起

官方價沒套路,捷豹XEL官降,15.98w起

熱點科技
2025-07-17 17:59:31
用鮮血換來的獎章,公安部一級英模甘鐵古親歷1982年美姑縣5.10案

用鮮血換來的獎章,公安部一級英模甘鐵古親歷1982年美姑縣5.10案

顧氏造船廠廠長
2025-07-19 08:00:06
奇葩下海理由,Melody Marks居然是男友推薦下海的,身材演技一流

奇葩下海理由,Melody Marks居然是男友推薦下海的,身材演技一流

說真話的小陳
2025-07-16 09:49:31
2007年,18歲男生每日到45歲女老師家補課,1年后男生被判死刑

2007年,18歲男生每日到45歲女老師家補課,1年后男生被判死刑

柳絮憶史
2025-07-19 10:34:07
澳大利亞率先挺進決賽!13分擊退強敵,靜候中國女籃,奇兵空砍20+3+5!

澳大利亞率先挺進決賽!13分擊退強敵,靜候中國女籃,奇兵空砍20+3+5!

野渡舟山人
2025-07-20 01:50:15
皇馬球員年薪排行榜:姆巴佩第一,阿諾德第五&懷森900萬第十六

皇馬球員年薪排行榜:姆巴佩第一,阿諾德第五&懷森900萬第十六

直播吧
2025-07-20 00:11:06
宗馥莉被曝育有三子    宏勝上市“在醞釀中”

宗馥莉被曝育有三子 宏勝上市“在醞釀中”

鄧如山
2025-07-18 15:01:30
滕帥首戰慘敗!球迷:笑炸了;居然有老曼聯球迷支持他而不是C羅

滕帥首戰慘敗!球迷:笑炸了;居然有老曼聯球迷支持他而不是C羅

直播吧
2025-07-19 16:04:07
發現沒有,搭伙過日子的夫妻都是這樣過夫妻生活的,沒有例外

發現沒有,搭伙過日子的夫妻都是這樣過夫妻生活的,沒有例外

伊人河畔
2025-07-19 15:39:33
25上海高考上海院校普通批次投檔線漲跌排行榜,最高漲18分

25上海高考上海院校普通批次投檔線漲跌排行榜,最高漲18分

馬蹄燙嘴說美食
2025-07-19 17:44:52
脫下口罩那一刻,有震驚到你嗎?

脫下口罩那一刻,有震驚到你嗎?

貴圈真亂
2025-07-17 09:55:38
宗慶后原配明知二房生子,仍公開示愛,與宗家恩斷21年前已成定數

宗慶后原配明知二房生子,仍公開示愛,與宗家恩斷21年前已成定數

鋭娛之樂
2025-07-19 23:54:06
美國大使放下狠話:只要中國不聽話不低頭,就讓十四億人挨餓受窮

美國大使放下狠話:只要中國不聽話不低頭,就讓十四億人挨餓受窮

趣知史館
2025-07-18 10:00:03
你有沒有發現,父母有穩定養老金的家庭,好像過得特別“帶勁”?

你有沒有發現,父母有穩定養老金的家庭,好像過得特別“帶勁”?

西莫的藝術宮殿
2025-07-19 14:05:58
中美軍事實力有多大差距?張召忠:我可以負責任地講,別再被誤導

中美軍事實力有多大差距?張召忠:我可以負責任地講,別再被誤導

混沌錄
2025-05-12 18:38:14
孩子媽媽錯把36E低胸吊帶自拍發家長群,群內截圖流出被老司機玩壞了哈哈

孩子媽媽錯把36E低胸吊帶自拍發家長群,群內截圖流出被老司機玩壞了哈哈

經典段子
2025-06-19 23:20:08
杭州母子為電話手表,相隔1000多公里吵架:什么人你都加好友?!

杭州母子為電話手表,相隔1000多公里吵架:什么人你都加好友?!

魯中晨報
2025-07-19 15:48:07
機關事退人員有職業年金,為什么企退大多沒有企業年金?正常嗎?

機關事退人員有職業年金,為什么企退大多沒有企業年金?正常嗎?

碎月導師
2025-07-18 19:36:15
古加:這是中超最高水平的對決,這種強強對話就是細節改變結果

古加:這是中超最高水平的對決,這種強強對話就是細節改變結果

直播吧
2025-07-19 21:54:12
湖南5歲男孩被父親從29樓扔下,生前哭喊:爸爸,放我下來

湖南5歲男孩被父親從29樓扔下,生前哭喊:爸爸,放我下來

星宇共鳴
2025-07-18 18:27:21
2025-07-20 03:07:00
大數據文摘 incentive-icons
大數據文摘
專注大數據,每日有分享!
6702文章數 94442關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

緬甸園區老板送回19歲高考生:你前途光明 不該留在這

頭條要聞

緬甸園區老板送回19歲高考生:你前途光明 不該留在這

體育要聞

女籃無緣亞洲杯決賽 韓旭淚灑發布會

娛樂要聞

肖戰微博改名:去掉X玖少年團頭銜

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

數碼
手機
游戲
親子
公開課

數碼要聞

三星Galaxy Buds 3 FE渲染圖曝光 黑牌配色新增AI功能

手機要聞

小米16系列獨占9月:驍龍8 Elite2+多款版本,友商或晚一步!

LPL第三階段:宇智波柴,摧毀極影村!TES三局擊潰IG!

親子要聞

孩子突然不愿意上學?4個深層原因+4步拯救法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 新乡县| 招远市| 京山县| 甘孜县| 双柏县| 洛隆县| 蒙城县| 伊吾县| 延津县| 南康市| 民权县| 汶川县| 开江县| 聂荣县| 平定县| 镶黄旗| 五原县| 龙井市| 张家界市| 化隆| 云龙县| 淮阳县| 福建省| 行唐县| 桃园县| 离岛区| 泾阳县| 怀集县| 林甸县| 扶风县| 资兴市| 伊春市| 阳朔县| 文水县| 温宿县| 兖州市| 格尔木市| 渝北区| 邵东县| 南京市| 靖边县|