日前,月之暗面正式發(fā)布新一代MoE架構(gòu)基礎(chǔ)模型Kimi K2,并同步開源。據(jù)了解,Kimi K2總參數(shù)達(dá)1T、激活參數(shù)為32B,同時也是月之暗面發(fā)布、并開源的首個萬億參數(shù)模型。
據(jù)悉,目前月之暗面方面已開源 Kimi K2系列中的兩個模型版本,包括Kimi-K2-Base、Kimi-K2-Instruct。其中,Kimi-K2-Base是未經(jīng)過指令微調(diào)的基礎(chǔ)預(yù)訓(xùn)練模型,適合科研與自定義場景,Kimi-K2-Instruct是通用指令微調(diào)版本(非思考模型),在大多數(shù)問答與 Agent 任務(wù)中表現(xiàn)卓越。
根據(jù)月之暗面方面公布的相關(guān)信息顯示,Kimi K2在自主編程(Agentic Coding)、工具調(diào)用(Tool Use)和數(shù)學(xué)推理(Math & Reasoning)三項能力維度的基準(zhǔn)性能測試中取得優(yōu)秀表現(xiàn)。例如在 SWE Bench Verified、Tau2、AceBench等基準(zhǔn)性能測試中,Kimi K2均取得了開源模型中的SOTA成績。
除了基準(zhǔn)性能測試,Kimi K2還宣稱在多個實際場景中也展現(xiàn)出更強的能力泛化和實用性。以前端開發(fā)任務(wù)為例,Kimi K2擅長生成兼具設(shè)計感與視覺表現(xiàn)力的代碼,支持粒子系統(tǒng)、可視化和 3D 場景等表現(xiàn)形式,具備較強的圖形能力與交互性。
值得一提的是,Kimi K2的預(yù)訓(xùn)練階段使用MuonClip優(yōu)化器實現(xiàn)了萬億參數(shù)模型的穩(wěn)定高效訓(xùn)練,從而在人類高質(zhì)量數(shù)據(jù)成為瓶頸的背景下,有效提高Token利用效率,找到新的Scalin空間。
目前用戶訪問月之暗面旗下智能助手Kimi官網(wǎng)或下載App,即可體驗全新Kimi K2模型。同時Kimi K2 API服務(wù)也已同步上線,其支持最長128K上下文,具備更強的通用性與工具調(diào)用能力,價格為每百萬輸入tokens 4元,每百萬輸出tokens為16元。
面向未來,月之暗面指出,Kimi K2是構(gòu)建通用Agent能力的堅實基礎(chǔ),但通用Agent還需要更高級的能力,比如思考和視覺理解。為此,未來其將為Kimi K2加入這些能力,“我們希望通過全面開源性能更強的模型,進(jìn)一步加速AGI研究與應(yīng)用落地的整體進(jìn)程”。
【本文圖片來自網(wǎng)絡(luò)】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.