99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

深夜開源首個萬億模型K2,壓力給到OpenAI,Kimi時刻要來了?

0
分享至

機器之心報道

編輯:澤南、杜偉

沒想到,Kimi 的首個基礎大模型開源這么快就來了。

昨晚,月之暗面正式發布了 Kimi K2 大模型并開源,新模型同步上線并更新了 API,價格是 16 元人民幣 / 百萬 token 輸出。





這次發布趕在了最近全球大模型集中發布的風口浪尖,前有 xAI 的 Grok 4,下周可能還有谷歌新 Gemini 和 OpenAI 開源模型,看起來大模型來到了一個新的技術節點。或許是感受到了 Kimi K2 的壓力,就在剛剛,奧特曼發推預告了自家的開源模型。不過,網友似乎并不看好。





本次開源的共有兩款模型,分別是基礎模型 Kimi-K2-Base 與微調后模型 Kimi-K2-Instruct,均可商用

  • 博客鏈接:https://moonshotai.github.io/Kimi-K2/
  • GitHub 鏈接:https://github.com/MoonshotAI/Kimi-K2

根據 Hugging Face 頁面數據顯示,Kimi K2 的下載量在前 20 分鐘便接近了 12K。



從 LiveCode Bench、AIME2025 和 GPQA-Diamond 等多個基準測試成績來看,此次 Kimi K2 超過了 DeepSeek-V3-0324、Qwen3-235B-A22B 等開源模型,成為開源模型新 SOTA;同時在多項性能指標上也能趕超 GPT-4.1、Claude 4 Opus 等閉源模型,顯示出其領先的知識、數學推理與代碼能力。







Kimi 展示了 K2 的一些實際應用案例,看起來它能自動理解如何使用工具來完成任務。它可以自動地理解所在的任務環境,決定如何行動,在下達任務指令時,你也不需要像以往那樣為智能體列出詳細的工作流程。

在完成復雜任務工作時,Kimi K2 會自動調用多種工具實現能力邊界的擴展。昨天上線后,網友們第一時間嘗試,發現可以實現不錯的效果:





值得關注的是,就在昨天 Grok 4 發布后,人們第一時間測試發現其代碼能力飄忽不定,但看起來 Kimi K2 的代碼能力經住了初步檢驗。



網友使用 Claude Code 鏈接 Kimi K2,發現效果不錯。

從網友第一時間的測試來看,K2 代碼能力是個亮點,因為價格很低,大家發現它可能是 Claude 4 Sonnet 的有力開源平替。有網友直接說 K2 是代碼模型的 DeepSeek 時刻:



HuggingFace 聯合創始人 Thomas Wolf 也表示,K2 令人難以置信,開源模型正在挑戰最新的閉源權重模型。



在技術博客中,Kimi 也介紹了 K2 訓練中的一些關鍵技術。

預訓練數據 15.5T tokens

沒用傳統 Adam 優化器

首先,為了解決萬億參數模型訓練中穩定性不足的問題,Kimi K2 引入了 MuonClip 優化器

Muon 優化器作為一種優化算法,可以幫助神經網絡在訓練過程中更好地收斂,提升模型準確性和性能。今年 2 月,月之暗面推出了基于 Muon 優化器的高效大模型 Moonlight,證明這類優化器在 LLM 訓練中顯著優于當前廣泛使用的 AdamW 優化器。

此次,Kimi K2 在開發過程中進一步擴展 Moonlight 架構。其中基于 Scaling Laws 分析,月之暗面通過減少 Attention Heads 數量來提升長上下文效率,同時增加 MoE 稀疏性來提高 token 利用效率。然而在擴展中遇到了一個持續存在的挑戰:Attention logits 爆炸會導致訓練不穩定,而 logit 軟上限控制和 query-key 歸一化等現有方案對此的效果有限。

針對這一挑戰,月之暗面在全新的 MuonClip 中融入了自己提出的 qk-clip 技術,在 Muon 更新后直接重新縮放 query 和 key 投影組成的權重矩陣,從源頭上控制 Attention logits 的規模,實現穩定的訓練過程。

改進后的 MuonClip 優化器不僅可以擴展到 Kimi K2 這樣萬億參數級別的 LLM 訓練,還將大幅度提升 token 效率。一個更具 token 效率的優化器更能提升模型智能水平,這正是當前業界(如 Ilya Sutskever)看重的延續 Scaling Laws 的另一關鍵系數。

Kimi K2 的實驗結果證實了這一點:MuonClip 能夠有效防止 logit 爆炸,同時保持下游任務的性能。官方稱,Kimi K2 順利完成 15.5T tokens 的預訓練,過程中沒有出現任何訓練尖峰,形成了 LLM 訓練的一套新方法。



token 損失曲線

因此,相較于原始 Muon,MuonClip 取長補短,進一步放大其在預訓練過程中的優勢。自大模型技術爆發以來,優化器的探索方向不再是熱門,人們習慣于使用 Adam,而如果想要進行替換,則需要大量的驗證成本。Kimi 的全新探索,不知是否會成為新的潮流。

其次,為了解決真實工具交互數據稀缺的難題,Kimi K2 采用大規模 Agentic 數據合成策略,并讓模型學習復雜工具調用(Tool Use)能力

本周四,我們看到 xAI 的工程師們在發布 Grok 4 時也強調了新一代大模型的多智能體和工具調用能力,可見該方向正在成為各家公司探索的焦點。

Kimi 開發了一個受 ACEBench 啟發的綜合 pipeline,能夠大規模模擬真實世界的工具使用場景。具體來講,該流程系統性地演化出涵蓋數百個領域的數千種工具,包括真實的 MCP 工具和合成工具,然后生成數百個具有多樣化工具集的智能體。



大規模 Agentic 數據合成概覽

接下來,這些智能體與模擬環境、用戶智能體進行交互,創造出逼真的多輪工具使用情景。最后,由一個大語言模型(LLM)充當評判員,根據任務評分標準(rubrics)評估模擬結果,篩選出高質量的訓練數據。

一整套流程走下來,這種可擴展的 pipeline 生成了多樣化、高質量的數據,有效填補特定領域或稀缺場景真實數據的空白。并且,LLM 對數據的評估與篩選有效減少低質量數據對訓練結果的負面影響。這些數據層面的增強為大規模拒絕采樣和強化學習鋪平了道路。

最后,Kimi K2 引入了通用強化學習(General RL),通過結合 RL 與自我評價(self-judging)機制,在可驗證任務與不可驗證任務之間架起了一座橋梁

在數學、編程等可驗證任務上,我們可以根據正確答案、任務完成情況等可驗證的獎勵信號持續更新并改進對模型能力的評估。但是,傳統強化學習由于依賴明確的反饋信號,因而在生成文本、撰寫報告等不可驗證任務中很難給出客觀、即時的獎勵。

針對這一局限,通用強化學習通過采用自我評價機制,讓模型充當自己的評判員(critic),提供可擴展、基于 rubrics 的反饋。這種反饋替代了外部獎勵,解決了不可驗證任務中獎勵稀缺的問題。 與此同時,基于可驗證獎勵的策略回滾(on-policy rollouts),持續對評判員進行更新,使其不斷提升對最新策略的評估準確性。

這種利用可驗證獎勵來改進不可驗證獎勵估計的方式,使得 Kimi K2 既能高效地處理傳統可驗證任務,又能在主觀的不可驗證任務中自我評估,從而推動強化學習技術向更廣泛的應用場景擴展。

從長遠來看,Kimi K2 的這些新實踐讓大模型具備了在各種復雜環境中持續優化的能力,可能是未來模型智能水平繼續進化的關鍵。

接下來,基模卷什么

Kimi 的發布,讓我們想起前天 xAI 的 Grok-4 發布會,馬斯克他們宣傳自己大模型推理能力時,列出了基于通用 AI 難度最高的測試「人類最后的考試」Humanities Last Exam(HLE)上幾個重要突破節點。

其中 OpenAI 的深度研究、Gemin 2.5 Pro 和 Kimi-Reseracher 都被列為了重要的突破:



Kimi-Researcher 在上個月剛剛發布,其采用端到端自主強化學習,用結果驅動的算法進行訓練,擺脫了傳統的監督微調和基于規則制或工作流的方式。結果就是,探索規劃的步驟越多,模型性能就越強。

而在 Kimi K2 上,月之暗面采用了與 Grok 4 類似的大規模工具調用方式。

另外,我們可以看到,由于國內算力資源的緊缺局面,新一波大模型技術競爭已經逐漸放棄單純的堆參數、算力規模擴大的方式,在推動模型 SOTA 的過程中,通過算法上的創新來卷成本和效率成為趨勢。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
朱雨玲父親一番話,說出奪冠真因!難怪國乒女隊9大巨星贏不了她

朱雨玲父親一番話,說出奪冠真因!難怪國乒女隊9大巨星贏不了她

嘴炮體壇
2025-07-14 17:42:17
CCTV5直播國足VS中國香港!宋凱督戰,廖錦濤+于金永不上天理不容

CCTV5直播國足VS中國香港!宋凱督戰,廖錦濤+于金永不上天理不容

刀鋒體育
2025-07-14 09:54:16
2.4億頂級雙中場!24歲恩佐+23歲凱塞多攻防結合,制霸中場斬巴黎

2.4億頂級雙中場!24歲恩佐+23歲凱塞多攻防結合,制霸中場斬巴黎

直播吧
2025-07-14 13:23:06
70歲的王健林也沒想到,37歲夜夜笙歌的王思聰,終于給他爭了口氣

70歲的王健林也沒想到,37歲夜夜笙歌的王思聰,終于給他爭了口氣

白面書誏
2025-06-26 12:50:35
積塔半導體工程師在意大利被逮捕!

積塔半導體工程師在意大利被逮捕!

中國半導體論壇
2025-07-14 22:19:38
照片:張大千39歲嬌妻徐雯波,身穿旗袍,雙膝跪地拜師,格外優雅

照片:張大千39歲嬌妻徐雯波,身穿旗袍,雙膝跪地拜師,格外優雅

另子維愛讀史
2025-07-13 18:48:13
房價,尷尬了!

房價,尷尬了!

地產觀點
2025-07-14 08:30:11
特朗普賭輸了!巴西反制教科書級操作,中國“反霸權”秘方外泄?

特朗普賭輸了!巴西反制教科書級操作,中國“反霸權”秘方外泄?

娛樂看阿敞
2025-07-14 15:38:34
外媒:中國6月大豆進口量創歷史同期新高

外媒:中國6月大豆進口量創歷史同期新高

參考消息
2025-07-14 21:27:34
克耶高斯炮轟男網比賽乏味,稱女網更激烈,盛贊拉杜卡努大戰薩巴

克耶高斯炮轟男網比賽乏味,稱女網更激烈,盛贊拉杜卡努大戰薩巴

網球之家
2025-07-14 23:11:48
半年倒貼250萬,獎金不夠付教練費,鄭欽文,花錢買來的冠軍夢?

半年倒貼250萬,獎金不夠付教練費,鄭欽文,花錢買來的冠軍夢?

山河月明史
2025-07-05 23:38:25
這三個戰犯在電視里不能用真名:兩個是老紅軍,一個是李宗仁愛將

這三個戰犯在電視里不能用真名:兩個是老紅軍,一個是李宗仁愛將

半壺老酒半支煙
2025-07-13 19:40:03
卡納瓦羅覺得阿隆索缺乏動力性,豐塞卡能否挺過上半程?

卡納瓦羅覺得阿隆索缺乏動力性,豐塞卡能否挺過上半程?

任意球后
2025-07-14 23:47:15
一天不到,第2艘巨輪被擊沉,中方強勢表態,警告也門胡塞武裝

一天不到,第2艘巨輪被擊沉,中方強勢表態,警告也門胡塞武裝

荷蘭豆愛健康
2025-07-14 04:11:39
王楚欽4比0戰勝張本智和,生涯第三次大滿貫男單奪冠

王楚欽4比0戰勝張本智和,生涯第三次大滿貫男單奪冠

澎湃新聞
2025-07-14 11:08:31
真要成水貨了!NBA現役這5大年輕球員仍無法兌現天賦,庫明加上榜

真要成水貨了!NBA現役這5大年輕球員仍無法兌現天賦,庫明加上榜

大衛的籃球故事
2025-07-13 22:24:13
北大女博士說破股市:長期持股,反復輪動“做T”,賺到懷疑人生

北大女博士說破股市:長期持股,反復輪動“做T”,賺到懷疑人生

股經縱橫談
2025-07-14 13:18:34
高溫下的東北空調荒

高溫下的東北空調荒

吳曉波頻道
2025-07-13 08:35:22
6個志愿軍兵團司令員回國后,4人的職位獲得升職,2人卻被降職

6個志愿軍兵團司令員回國后,4人的職位獲得升職,2人卻被降職

小莜讀史
2025-07-14 10:06:26
宗馥莉被起訴只是表象,實質是老宗提前布下的苦肉計!

宗馥莉被起訴只是表象,實質是老宗提前布下的苦肉計!

深析古今
2025-07-14 21:41:03
2025-07-15 00:23:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10856文章數 142376關注度
往期回顧 全部

科技要聞

DeepSeek流量下滑,這半年梁文鋒都干了啥

頭條要聞

學者:九三閱兵不但要請特朗普 最好把日本首相也叫上

頭條要聞

學者:九三閱兵不但要請特朗普 最好把日本首相也叫上

體育要聞

高考數學滿分的他,說要成為1/3個鄧肯

娛樂要聞

秦嵐辛芷蕾聚餐熱聊 結束直奔魏大勛家

財經要聞

探究新茶飲賽道爆發的“內核”

汽車要聞

余承東親發預告:鴻蒙智行首款旅行車享界S9T來了

態度原創

數碼
藝術
本地
時尚
房產

數碼要聞

華為穿戴產品發貨超兩億只,其中 GT 系列超 5200 萬只

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

褲子那里鼓鼓的,當代都市麗人都被女裝做局了

為什么她身材不好,依然把吊帶裙穿的很高級

房產要聞

三亞,開啟新一輪大征收!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 闽侯县| 响水县| 汶川县| 嵊州市| 石泉县| 巩留县| 句容市| 区。| 甘泉县| 习水县| 改则县| 八宿县| 永年县| 武城县| 成武县| 禹城市| 乌拉特中旗| 堆龙德庆县| 萨迦县| 澄迈县| 徐闻县| 遂昌县| 凤城市| 永清县| 镇坪县| 淮阳县| 绍兴市| 安宁市| 临朐县| 收藏| 北碚区| 涞源县| 马关县| 新安县| 河津市| 丹棱县| 张家港市| 玛曲县| 邹平县| 定西市| 濉溪县|