7月11日晚,月之暗面宣布正式發(fā)布新一代基礎(chǔ)模型 Kimi K2,并同步開源。該模型采用稀疏激活(MoE)架構(gòu),總參數(shù)1T,激活參數(shù)32B。
據(jù)悉,Kimi K2具備更強(qiáng)代碼能力、更擅長(zhǎng)通用 Agent 任務(wù)的 MoE 架構(gòu)基礎(chǔ)模型,在 SWE Bench Verified、Tau2、AceBench 等多個(gè)權(quán)威基準(zhǔn)測(cè)試中取得當(dāng)前開源模型中的最佳成績(jī)(SOTA),在數(shù)學(xué)推理與復(fù)雜任務(wù)理解方面也表現(xiàn)優(yōu)異。
據(jù)介紹,該模型訓(xùn)練過程中采用 MuonClip 優(yōu)化器,有效解決大參數(shù)量模型的穩(wěn)定訓(xùn)練問題,提升 token 利用效率,在優(yōu)質(zhì)數(shù)據(jù)稀缺的背景下進(jìn)一步拓展 Scaling 上限。
技術(shù)上,Kimi K2結(jié)合大規(guī)模 Agentic Tool Use 數(shù)據(jù)合成、自我評(píng)價(jià)機(jī)制下的通用強(qiáng)化學(xué)習(xí)等方法,構(gòu)建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是構(gòu)建通用 Agent 的關(guān)鍵基石,未來還將加入思考與多模態(tài)能力。
目前,Kimi K2模型已集成至 Kimi App 與官網(wǎng)平臺(tái),并提供 API 接入服務(wù)。API 兼容 OpenAI 與 Anthropic 的 Chat 接口,最長(zhǎng)支持128K上下文窗口,費(fèi)用為每百萬輸入tokens 4元,輸出tokens 16元。(袁寧)