99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

AI大家說 | Kimi K2:全球首個完全開源的Agentic模型

0
分享至



7月11日,Moonshot AI正式發布了Kimi K2模型,并同步開源。它具備更強代碼能力、更擅長通用Agent任務的MoE(Mixture-of-Experts,混合專家)架構基礎模型,總參數1T(1萬億),激活參數32B。

“大”參數在AI界其實已經算不上什么新聞了,Kimi K2真正引起廣泛驚嘆的,是它作為“Agentic AI”的定位——它專為Agent工作流而設計,能夠更準確地理解你的復雜意圖,拆解任務,并自主調用工具去完成它,甚至完成復雜的多步驟流程。

也就是說,它不只是一個聊天機器人,更是一個能理解復雜指令、自主調用工具來解決問題的“數字員工”。

我們認為,Moonshot AI的Kimi K2是一個為Agentic任務設計的MoE大模型, 具有很強的自主執行多步任務與工具調用的能力,同時編程任務中也表現出非常卓越的性能,具備和Claude Sonet 4、Gemini 2.5和GPT 4.1同等水準的能力。作為Agentic model里面唯一一個完全開源的模型,推動了全球開源社區的進步。從它的身上,我們看到了中國的新一代優秀的創業者在曲折中保持著一路向上的力量。

“行動派”AI,不止于“大”

首先,它采用了典型的稀疏MoE架構。這種架構將不同專家網絡分配給不同輸入,使得模型能夠根據任務需求動態激活相應的專家模塊,從而實現更高效的參數利用率。具體而言,Kimi K2擁有1萬億總參數量,激活參數為320億,模型包含384個專家,每個token會選擇8個專家進行計算,同時設置1個共享專家以提高模型的通用性。

你可以把它想象成一個擁有1萬億個“專家”的智囊團。當你提出一個問題時,系統會激活其中最相關的320億參數來為你服務。這樣做的好處是,既能擁有巨大模型的知識和能力,又能保持很高的運行效率。


來源: Sebastian Raschka

同時,Kimi K2還進行了大規模Agentic Tool Use數據合成,構建了可大規模生成多輪工具使用場景的合成pipeline,覆蓋數百領域、數千工具。高質量樣本由LLM評估篩選后用于訓練。

Kimi K2不僅在可驗證任務上(代碼、數學)強化學習,還通過引入自我評價機制(self-judging),解決了不可驗證任務的獎勵稀缺問題。通過可驗證任務持續優化critic,提升泛化任務表現。

其次,在訓練過程中,Kimi K2使用了改進的MuonClip優化器,有效解決了大規模優化過程中梯度不穩定與收斂困難的問題,使得模型能夠在15.5萬億tokens的預訓練規模下保持穩定。該算法通過定期調整注意力機制中的關鍵參數,成功避免了大模型常見的“訓練崩潰”問題。


Kimi K2在使用MuonClip優化器預訓練15.5萬億個token期間的損失曲線。這條平滑下降的軌跡——沒有不穩定的峰值或平臺期——表明MuonClip能夠在數萬億個token的訓練過程中,維持大規模大語言模型訓練的穩定性。

當然,超長上下文能力也很重要。Kimi K2的最大上下文長度達到128K,這使其能夠更好地處理長文檔理解、長對話以及大規模檢索任務。

性能表現方面,在SWE Bench Verified、Tau2、AceBench等基準性能測試中,Kimi K2均取得開源模型中的SOTA成績,展現出在代碼、Agent、數學推理任務上的領先能力。

AI圈掀討論熱潮

Kimi K2的橫空出世,已在全球AI圈掀起討論熱潮。這種熱度的背后,是業界對其技術突破的認可,更是對其開源價值的期待。

英偉達創始人黃仁勛在在北京參加鏈博會期間多次高度評價Kimi。他表示,開源具有全球性的影響。開源模型不僅助力中國的生態系統,也在為全球各地的生態系統提供支持。Moonshot AI的Kimi非常出色,是當今世界上最優秀的推理模型之一。


這種認可正在轉化為實際的合作動能。隨著Kimi K2的發布,其海外影響力快速滲透至產業端:OpenRouter、Cline、微軟旗下Visual Studio Code等全球知名編程平臺紛紛宣布接入Kimi K2。

在開發者與研究者圈層,Kimi K2的口碑同樣突出。AI從業者紛紛表達對這一新型開源模型的贊美。獨角獸公司Perplexity CEO Aravind Srinivas表示,基于Kimi K2模型的出色表現,公司將會利用K2進行后訓練。


全球最大開源AI社區Hugging Face聯合創始人Thomas Wolf表示,不斷突破極限挑戰閉源的K2模型令人難以置信,Kimi團隊在過去幾個月里推出的系列模型讓人印象深刻。


國際頂尖學術期刊《自然》在網站上刊登文章稱“Kimi K2引起轟動,是‘又一個DeepSeek時刻’”。文章還引用了美國知名AI研究員Nathan Lambert的點評稱,Kimi K2是“全球最新最好的開源模型”。


科技媒體人Azeem Azhar在文章中表示,Moonshot AI的Kimi K2模型成本低廉、性能卓越且開源。尤其是K2在使用MuonClip優化器預訓練15.5萬億個token期間的損失曲線,被AI研究員Cedric Chee稱為“機器學習史上最優美的損失曲線之一”。

下面,就讓我們一起看看Kimi K2在其他不同能力測試中的表現:


Kimi K2 在一系列基準測試中的表現。

編程能力

Kimi K2在編程領域的表現尤為出色。在LiveCodeBench編程基準測試中,Kimi K2的準確率達到了53.7%,超越了GPT-4.1(44.7%)。Kimi K2在OJBench的得分也達到了27.1%。

這兩個評測分別模擬互動式編程任務與傳統競賽題,進一步證明了Kimi K2在軟件工程場景中的適配能力。

在前端開發任務中,Kimi K2擅長生成兼具設計感與視覺表現力的代碼,支持粒子系統、可視化和3D場景等表現形式,具備較強的圖形能力與交互性。以下是用Kimi K2生成的山川峽谷3D景觀,支持晝夜循環:

提示詞參考:創建一個3D HTML山脈場景,包含懸崖、河流和晝夜光照變化。支持拖動和縮放、動畫過渡、真實感漸變色,并可切換等高線顯示...

Agent工具調用能力

Kimi K2現已具備穩定的復雜指令解析能力,可將需求自動拆解為一系列格式規范、可直接執行的ToolCall結構。在SWE-bench Verified測試中Kimi K2的單次嘗試準確率達到了65.8%,不僅超越了大多數開源模型,還與某些專有模型表現相當。

這個測試評估的是模型在真實開源項目中識別與修復代碼錯誤的能力,難度極高。

比如,將13萬行的原始數據丟給Kimi K2,它可以幫你分析遠程辦公比例對薪資的影響,分析顯著差異,自動生成統計圖表與回歸模型解讀,并用統一色調做出小提琴圖(violin plot) 、箱線圖(box plot)、散點圖(scatter plot)等專業圖表,整理成報告。

多任務綜合表現


  • 在Tau2-bench的加權平均值測試中,Kimi K2的表現達到了66.1%,顯示出其在復雜STEM任務上的強大能力

  • 在AceBench(英文)測試中,Kimi K2的準確率達到了80.1%,進一步證明了其在語言理解和生成方面的優勢

  • 在多語言測試如MMLU-Pro中,它同樣進入領先梯隊,兼具多語言與跨學科能力,同時也印證了Kimi K2的空間理解與復雜結構表達能力

  • 在數學和科學領域,Kimi K2在AIME、GPQA-Diamond和MATH-500等測評中穩定優于主要對手,展示出深度數學建模的潛力

  • Kimi K2還登頂了EQ-Bench3和Creative Writing v3這兩個評測集。EQ-Bench3是用來測試LLM情商的基準測試,Creative Writing v3是用來測試LLM創意性寫作能力的基準測試。

如今,Moonshot AI已經將Kimi K2的模型權重和代碼都放在了Hugging Face和Github上,采用非常寬松的MIT許可證。這意味著任何開發者都可以免費使用、修改和分發這個模型,用它來打造自己的AI應用。而其API及定價也是以4元/百萬輸入tokens16元/百萬輸出tokens“驚艷”了海內外。

從國內開發者基于其搭建個性化應用,到海外平臺爭相接入,再到學術界與產業界的一致認可,Kimi K2的影響正沿著開源的脈絡向全球擴散。

未來,隨著開發者生態的持續壯大,以及模型在思維鏈推理等方向的進一步優化,Kimi K2或許會帶來更多驚喜。而它所開啟的“行動派 AI”時代,也將讓AI從“對話工具”走向“生產力引擎”,在代碼開發、數據分析、復雜任務處理等場景中,為全球用戶創造更具體的價值——這,正是Kimi K2留給行業的最大啟示:AI的終極競爭力,從來不止于“大”,更在于“能做事、做成事”。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
錢多真的有用嗎?趙本山如今的家庭現狀,給所有男人都提了個醒

錢多真的有用嗎?趙本山如今的家庭現狀,給所有男人都提了個醒

何嗀愛捕漁
2025-07-12 04:16:02
洪森慌了!還沒完全開打,柬軍的兩處據點就被F16端了!

洪森慌了!還沒完全開打,柬軍的兩處據點就被F16端了!

九把勺子
2025-07-26 01:04:08
佟麗婭9歲兒子新疆首曝光!側顏殺復刻陳思成,網友:基因照妖鏡

佟麗婭9歲兒子新疆首曝光!側顏殺復刻陳思成,網友:基因照妖鏡

TVB的四小花
2025-07-25 18:55:26
別好了傷疤忘了疼!國際奧委會暗示中國申奧,燙手山芋沒人接?

別好了傷疤忘了疼!國際奧委會暗示中國申奧,燙手山芋沒人接?

娛樂看阿敞
2025-07-25 12:24:57
紀實 老人狂扇未讓座小伙4個耳光后猝死,家屬索賠50萬,法院判了

紀實 老人狂扇未讓座小伙4個耳光后猝死,家屬索賠50萬,法院判了

談史論天地
2025-06-24 19:05:02
王毅會見東盟秘書長高金洪

王毅會見東盟秘書長高金洪

界面新聞
2025-07-25 16:39:06
好消息,湖人隊布朗尼·詹姆斯將進軍德魯聯賽

好消息,湖人隊布朗尼·詹姆斯將進軍德魯聯賽

好火子
2025-07-26 01:54:34
他是梁山上唯一的好人,一生毫無污點,武松和魯智深也自嘆不如

他是梁山上唯一的好人,一生毫無污點,武松和魯智深也自嘆不如

耳東文史
2025-06-28 00:04:02
中美最關鍵一戰降臨,27號決戰前,中方出手將軍,李嘉誠如履薄冰

中美最關鍵一戰降臨,27號決戰前,中方出手將軍,李嘉誠如履薄冰

顧蔡衛
2025-07-25 11:22:18
不可思議,63歲比利時名帥被解雇,已報名競聘國足主帥

不可思議,63歲比利時名帥被解雇,已報名競聘國足主帥

寒律
2025-07-26 00:45:51
再次言中:美國提供3500億美金武器、歐盟掏錢、主要送往烏克蘭

再次言中:美國提供3500億美金武器、歐盟掏錢、主要送往烏克蘭

邵旭峰域
2025-07-25 15:48:21
當年掏空家底,舉債120億收購沃爾沃,如今15年過去,吉利賺了多少

當年掏空家底,舉債120億收購沃爾沃,如今15年過去,吉利賺了多少

毒sir財經
2025-04-13 19:25:48
“吳姐拌粉”南昌多家門店閉店

“吳姐拌粉”南昌多家門店閉店

江西晨報
2025-07-25 09:47:18
兩大司令部被炸毀,柬軍敗局已定?中方及時開金口,送泰柬一句話

兩大司令部被炸毀,柬軍敗局已定?中方及時開金口,送泰柬一句話

影孖看世界
2025-07-25 22:31:43
中國首位博物院女院長,一生未婚,跳塔身亡,死前給司機留下紙條

中國首位博物院女院長,一生未婚,跳塔身亡,死前給司機留下紙條

鬼谷子思維
2025-07-24 20:15:03
火箭欲再簽強援!3屆東部全明星聯手杜蘭特,休城沖擊總冠軍

火箭欲再簽強援!3屆東部全明星聯手杜蘭特,休城沖擊總冠軍

埃文凱爾
2025-07-26 00:34:47
記者:除非紐卡改變伊薩克非賣品標簽,否則利物浦只能保持觀望

記者:除非紐卡改變伊薩克非賣品標簽,否則利物浦只能保持觀望

直播吧
2025-07-26 02:40:05
活塞將裁掉雙向合同鋒線新星,他的弟弟正是馬刺的新科榜眼郎?

活塞將裁掉雙向合同鋒線新星,他的弟弟正是馬刺的新科榜眼郎?

稻谷與小麥
2025-07-26 01:12:11
二湘:宗澤后再爆料,宗馥莉的恨可能成為回旋鏢

二湘:宗澤后再爆料,宗馥莉的恨可能成為回旋鏢

二湘空間
2025-07-24 10:55:44
陳芋汐也沒想到,全紅嬋一缺席,自己連好好比賽的資格都要被質疑

陳芋汐也沒想到,全紅嬋一缺席,自己連好好比賽的資格都要被質疑

大笑江湖史
2025-07-25 07:39:46
2025-07-26 02:52:49
紅杉匯
紅杉匯
創業者背后的創業者。
1892文章數 2505關注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

體育要聞

3年過去了,她還是歐洲杯上最酷的姐

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態度原創

家居
教育
時尚
藝術
軍事航空

家居要聞

環繞設計 空間動線合理

教育要聞

再獲國際物理奧賽金牌,南師附中學子勇登世界之巔!

今年夏天一定要有這件衣服,好看又復古!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

軍事要聞

吳謙少將任中國駐埃及使館國防武官

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 庄浪县| 武隆县| 台中县| 新余市| 扶余县| 昌图县| 虞城县| 类乌齐县| 通辽市| 石台县| 甘洛县| 延川县| 馆陶县| 浦江县| 万年县| 濮阳市| 望江县| 济南市| 榆树市| 宁城县| 玉田县| 固阳县| 安顺市| 沅陵县| 龙岩市| 绍兴县| 佛冈县| 广德县| 香港 | 上杭县| 南陵县| 江都市| 阜新| 揭东县| 曲周县| 益阳市| 富裕县| 兰州市| 南康市| 乡城县| 溧水县|