99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Kimi首個萬億參數模型開源!免費可用,超強Agent推理,附實測體驗

0
分享至


智東西
作者 陳駿達
編輯 心緣

智東西7月12日報道,昨夜,國內大模型獨角獸月之暗面發布并開源了其最新一代MoE架構基礎模型Kimi K2,總參數量達到1萬億(1T),激活參數為32B。Kimi K2已在Kimi Web端和App端中可用。

Kimi K2是月之暗面首款開源發布的旗艦模型,在SWE Bench Verified(編程)、Tau2(智能體)、AceBench(工具調用)這三項基準測試中,這一模型取得開源模型中的SOTA成績。

在自主編程(Agentic Coding)、工具調用(Tool Use)和數學推理(Math & Reasoning)這三個能力維度上,Kimi K2的表現超過了DeepSeek-V3-0324、Qwen-235B-A22B等模型,但在部分基準測試中略遜于Claude 4 Opus、OpenAI GPT-4.1等模型。


Kimi K2在預訓練階段使用了“MuonClip”優化器實現萬億參數模型的訓練。這一優化器能提高Token利用效率,緩解高質量人類數據的短缺問題。月之暗面還應用了大規模Agentic Tool Use數據合成和引入自我評價機制的通用強化學習等技術。

Kimi K2 API服務也同步上線。Kimi K2 API支持最長128K上下文,計費方案為每百萬輸入tokens/4元,每百萬輸出tokens/16元,輸入輸出價格均為DeepSeek V3的2倍。

Kimi K2系列中的兩個模型版本現已開源,包括未經過指令微調的基礎預訓練模型Kimi-K2-Base和通用指令微調版本Kimi-K2-Instruct(非思考模型)。前者適合科研與自定義場景,后者則可用于大多數問答與Agent任務。

Kimi K2現已上線無問芯穹Infini-AI異構云平臺(cloud.infini-ai.com/genstudio/),用戶能以與官方API同樣的價格調用Kimi K2。

開源鏈接:

https://huggingface.co/moonshotai/Kimi-K2-Instruct

體驗鏈接:

https://www.kimi.com/

一、編程能力迎提升,實測效果差強人意

根據月之暗面博客文章,在前端開發任務中,Kimi K2能生成有設計感與視覺表現力的代碼,支持粒子系統、可視化和3D場景等表現形式。官方Demo中,Kimi K2開發了一個支持晝夜循環的山川峽谷3D景觀:


還生成了粒子特效銀河:


為驗證上述能力,智東西向Kimi K2發送了如下提示詞:


最終,Kimi K2交付的網頁渲染效果并未如官方Demo中那般逼真,交互性和功能豐富度也略遜一籌。


在難度較低的個人網站開發任務上,Kimi K2展現出一定規劃能力。在未收到明確指示的情況下,Kimi K2主動梳理了網站的目錄結構,打造出的網站可擴展性更好。


就智東西進行的個人網站開發測試而言,Kimi K2相較Kimi K1.5的UI審美水平進步有限。


▲上方為Kimi K2生成結果,下方為Kimi K1.5生成結果

同樣的任務交由DeepSeek-V3-0324進行處理,最終生成的結果如下:


二、Agent工具調用能力增強,擴展風格化寫作能力

月之暗面稱,Kimi K2現具備復雜指令解析能力,可將需求自動拆解為一系列格式規范、可直接執行的ToolCall結構。

開發者可將Kimi K2接入owl、Cline、RooCode等Agent/Coding框架,完成復雜任務或自動化編碼。

Agent能力已可通過API使用,更多工具能力即將在Kimi上線。在月之暗面內部測試環境中的實際演示里,Kimi K2展現出一定體驗Agentic能力。

比如,將13萬行的原始數據丟給Kimi K2,它可以幫用戶分析遠程辦公比例對薪資的影響,分析顯著差異,自動生成統計圖表與回歸模型解讀,并用統一色調做出小提琴圖(violin plot) 、箱線圖(box plot)、散點圖(scatter plot)等專業圖表,整理成報告。


再比如,如果用戶是Coldplay粉絲,Kimi K2可以幫忙制定今年的追星計劃,完成演唱會所在城市的機酒與旅游規劃,并且生成日歷,再用html概括完整行程規劃并發送郵件。


Kimi K2還擁有了更強的風格化寫作能力。官方提供的Demo中,Kimi K2模仿了蘋果廣告文案風格:


此外,Kimi K2在通用知識推理、數學、規劃等任務中的表現亦有提升,比數字大小的題目已經難不住Kimi K2了。


結語:探索新型優化器,未來將新增思考與視覺理解

根據月之暗面博客文章,Kimi K2用MuonClip優化器支撐萬億參數模型訓練,提升token利用效率。結合大規模Agentic數據合成與通用強化學習,這一模型的通用智能能力獲得提升。

為了緩解大規模訓練中的attention logits偏大問題,月之暗面拋棄了傳統的Adam優化器,提出MuonClip優化器,并將其擴展到萬億參數規模,提升了訓練穩定性和token使用效率。Kimi K2完成了15.5T token的訓練,全程無loss spike。

月之暗面還構建了可大規模生成多輪工具使用場景的合成pipeline,其大規模Agentic Tool Use數據合成可覆蓋數百領域、數千工具,樣本由LLM評估篩選后用于訓練。

Kimi K2在可驗證任務上(代碼、數學)使用了強化學習,還通過引入自我評價機制(self-judging),解決了不可驗證任務的獎勵稀缺問題,實現通用強化學習,提升泛化任務表現。

目前,Kimi K2尚不支持視覺理解和思考能力,月之暗面稱這些能力將在未來陸續加入。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
土地財政的本質是土地金融

土地財政的本質是土地金融

風向觀察
2025-07-12 09:20:11
流落在中國的外國公主,拒絕回國:我是中國人,中國就是我的家!

流落在中國的外國公主,拒絕回國:我是中國人,中國就是我的家!

淼犇小牛
2025-07-12 10:33:06
親歷臺灣告訴你:這些流言蜚語都是假的,別再被網絡誤導了!

親歷臺灣告訴你:這些流言蜚語都是假的,別再被網絡誤導了!

天下霸奇
2025-07-10 09:02:07
724分河南女狀元,清北不要就奔軍裝?官網錄取通知書掛出來了!

724分河南女狀元,清北不要就奔軍裝?官網錄取通知書掛出來了!

手工制作阿愛
2025-07-08 15:42:30
澤連斯基對華制裁猝不及防,不給中企一點活路,沒有說明任何理由

澤連斯基對華制裁猝不及防,不給中企一點活路,沒有說明任何理由

混沌錄
2025-07-11 00:17:04
曝楊少華帶貨報價,30天播27場,給兒子各買一套房,郭德綱說對了

曝楊少華帶貨報價,30天播27場,給兒子各買一套房,郭德綱說對了

一娛三分地
2025-07-11 22:20:08
重磅速覽:韓朝兩國“雇傭兵”在庫爾斯克開始交火

重磅速覽:韓朝兩國“雇傭兵”在庫爾斯克開始交火

史政先鋒
2025-07-12 11:18:48
捂不住了!西方謊言被戳破,以色列損失慘重,伊朗才是大贏家?

捂不住了!西方謊言被戳破,以色列損失慘重,伊朗才是大贏家?

歷史求知所
2025-07-11 12:15:08
俄羅斯給中國提了個醒:若美武力介入臺海,高超彈摧毀美西太基地

俄羅斯給中國提了個醒:若美武力介入臺海,高超彈摧毀美西太基地

博覽歷史
2025-07-11 10:50:45
菲律賓做夢也想不到,自己安排的“仁愛礁”破船,對中國幫助很大

菲律賓做夢也想不到,自己安排的“仁愛礁”破船,對中國幫助很大

boss外傳
2025-06-19 08:55:03
蒯曼4-0戰勝陳幸同,晉級美國大滿貫四強將戰陳熠

蒯曼4-0戰勝陳幸同,晉級美國大滿貫四強將戰陳熠

懂球帝
2025-07-12 09:58:35
名記:詹姆斯原諒了湖人用濃眉換東契奇的交易 因為他很尊重后者

名記:詹姆斯原諒了湖人用濃眉換東契奇的交易 因為他很尊重后者

直播吧
2025-07-12 00:16:06
特朗普撒彌天大謊,越南并沒跟美簽協議?越外長對王毅說掏心窩話

特朗普撒彌天大謊,越南并沒跟美簽協議?越外長對王毅說掏心窩話

星辰夜語
2025-07-12 03:48:08
美國倒吸一口涼氣!中國“飛天-2”高超音速導彈方面取得重大突破

美國倒吸一口涼氣!中國“飛天-2”高超音速導彈方面取得重大突破

大道無形我有型
2025-07-12 11:09:26
起飛后是誰切斷雙發供油?印航空難初步調查報告發布

起飛后是誰切斷雙發供油?印航空難初步調查報告發布

娛樂八卦木木子
2025-07-12 10:42:59
別再忽視!蒙古國的暗中操作,正在吞噬中國人40年的奮斗成果!

別再忽視!蒙古國的暗中操作,正在吞噬中國人40年的奮斗成果!

鯨探所長
2025-07-11 21:12:28
蒙古西征時侵犯突厥女性, 造出一新民族, 成為了俄國人的噩夢

蒙古西征時侵犯突厥女性, 造出一新民族, 成為了俄國人的噩夢

阿燕姐說育兒
2025-07-10 06:06:33
4萬股東踩雷!昨晚兩家公司被立案調查,其中一家有強制退市風險

4萬股東踩雷!昨晚兩家公司被立案調查,其中一家有強制退市風險

小舟談歷史
2025-07-12 09:45:29
290公里外癱瘓指揮系統,央視放出風聲,或將成為中國“殺手锏”

290公里外癱瘓指揮系統,央視放出風聲,或將成為中國“殺手锏”

史紀文譚
2025-07-09 17:18:25
臺灣要員曾放話:滿足這三條件,臺灣自動回歸

臺灣要員曾放話:滿足這三條件,臺灣自動回歸

三毛看世界
2025-07-09 13:32:47
2025-07-12 12:56:49
智東西 incentive-icons
智東西
聚焦智能變革,服務產業升級。
10147文章數 116799關注度
往期回顧 全部

科技要聞

黃仁勛警示AI風險:沒新想法,就集體失業

頭條要聞

牛彈琴:越南或在最后一刻遭特朗普暗算 十分失望憤怒

頭條要聞

牛彈琴:越南或在最后一刻遭特朗普暗算 十分失望憤怒

體育要聞

從無畏金蘭到薪火相傳,中國女籃新的花期來了

娛樂要聞

王晶曝張國榮自殺原因 抑郁癥只是其一

財經要聞

中國超半數城市人口下滑,什么信號?

汽車要聞

小米YU7深度試駕:優點很多缺點也很多

態度原創

游戲
健康
旅游
家居
公開課

LOL-MSI:Oner蝎子節奏完美主導決勝局,T1 3-2擊敗AL挺進決賽

呼吸科專家破解呼吸道九大謠言!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

家居要聞

生活憧憬 自由浪漫之境

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 土默特右旗| 商城县| 宜昌市| 井研县| 萝北县| 青田县| 平原县| 石柱| 横峰县| 梅州市| 郴州市| 贺兰县| 贵州省| 清流县| 泗洪县| 团风县| 陇南市| 土默特左旗| 肇庆市| 临颍县| 怀集县| 桓台县| 平江县| 获嘉县| 荆州市| 沁阳市| 东乌珠穆沁旗| 通辽市| 博客| 来宾市| 万安县| 苏尼特右旗| 鄂托克旗| 中西区| 金川县| 古交市| 德令哈市| 丹棱县| 泰兴市| 马公市| 鹤山市|