7月11日晚,月之暗面宣布正式發布新一代基礎模型 Kimi K2,并同步開源。該模型采用稀疏激活(MoE)架構,總參數1T,激活參數32B。
據悉,Kimi K2具備更強代碼能力、更擅長通用 Agent 任務的 MoE 架構基礎模型,在 SWE Bench Verified、Tau2、AceBench 等多個權威基準測試中取得當前開源模型中的最佳成績(SOTA),在數學推理與復雜任務理解方面也表現優異。
據介紹,該模型訓練過程中采用 MuonClip 優化器,有效解決大參數量模型的穩定訓練問題,提升 token 利用效率,在優質數據稀缺的背景下進一步拓展 Scaling 上限。
技術上,Kimi K2結合大規模 Agentic Tool Use 數據合成、自我評價機制下的通用強化學習等方法,構建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是構建通用 Agent 的關鍵基石,未來還將加入思考與多模態能力。
目前,Kimi K2模型已集成至 Kimi App 與官網平臺,并提供 API 接入服務。API 兼容 OpenAI 與 Anthropic 的 Chat 接口,最長支持128K上下文窗口,費用為每百萬輸入tokens 4元,輸出tokens 16元。(袁寧)