99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<sub id="2ee7a"></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Kimi新模型拿下代碼開源SOTA，僅僅72B，發(fā)布即開源

2025-06-17 12:58:38　來源: 量子位

北京舉報

0

分享至

克雷西發(fā)自凹非寺
量子位 | 公眾號 QbitAI

深夜，沉寂已久的Kimi突然發(fā)布了新模型——

開源代碼模型Kimi-Dev，在SWE-bench Verified上以60.4%的成績取得開源SOTA。

參數量只有72B，但編程水平比最新的DeepSeek-R1還強，和閉源模型比較也表現優(yōu)異。

有網友看到后表示，感覺月之暗面的實力被低估了，其水平應該比xAI強。

Kimi-Dev采用MIT協議，目前權重和代碼均已發(fā)布，還有網友制作的量化版本也已在抱抱臉上線。

那么，Kimi-Dev是如何做到的呢？

模型扮演兩種角色，在測試中自我博弈

目前，Kimi-Dev的完整技術報告暫未出爐，不過官方透露了其中的一些關鍵技術。

Kimi-Dev-72B的設計核心是BugFixer和TestWriter兩種角色的結合，BugFixer和TestWriter都遵循一個共同的最小框架，包含兩個階段：

文件定位（File Localization）：首先找到需要修改的正確文件；
代碼編輯（Code Edits）：修正現有代碼中的問題或潛在缺陷（BugFixer），以及編寫并添加新的單元測試代碼（estWriter）。

為了增強Kimi-Dev-72B作為BugFixer和TestWriter的先驗知識，Kimi團隊以Qwen 2.5-72B基礎模型為起點使用約1500億高質量真實數據進行中期訓練。

具體來說，Kimi團隊收集了數百萬個GitHub issue和PR提交，目的是讓Kimi-Dev-72B能夠學習人類開發(fā)人員如何推理并解決GitHub問題。

另外，Kimi團隊還進行了嚴格的數據凈化，確保訓練數據當中不包含SWE-bench Verified里的內容。

經過中期訓練和監(jiān)督微調（SFT）后，Kimi-Dev-72B在文件定位方面已經表現出色，之后的強化學習階段主要側重于提升其代碼編輯能力。

強化學習訓練采用了Kimi k1.5中的策略優(yōu)化方法，主要有三個關鍵設計：

一是僅基于結果的獎勵（Outcome-based Reward Only）——訓練中僅使用代碼在Docker環(huán)境中的最終執(zhí)行結果（成功為 1，失敗為 0）作為獎勵，而不考慮任何與代碼格式或編寫過程的因素。

這確保了模型生成的解決方案的正確性以及與實際開發(fā)標準的一致性。

二是采用了高效提示集（Efficient Prompt Set），過濾掉在多樣本評估下成功率為零的提示，以更有效地進行大批量訓練。

此外，強化學習階段還采取了循序漸進的策略，逐步引入新提示，逐步增加任務難度。

三是正向示例強化（Positive Example Reinforcement），也就是在后面的訓練過程中，Kimi-Dev會將它之前已經解決的問題的方案重新納入當前的訓練批次中進行學習，從而鞏固和強化之前有效的、成功的解決模式和方法。

經過強化學習后，Kimi-Dev-72B能夠同時掌握兩種角色。在測試過程中，它會采用自我博弈機制，協調自身Bug修復和測試編寫的能力。

Kimi-Dev-72B會遵循標準Agentless設置，為每個問題生成最多40個補丁候選（patch candidates）和40個測試候選（test candidates）。

在測試時間自我博弈中，觀察到了規(guī)模效應（scaling effect）。

以上就是Kimi團隊介紹的Kimi-Dev背后的關鍵，更多細節(jié)將在后續(xù)的技術報告中揭曉，感興趣的話可以關注Kimi團隊的發(fā)布。

下一步，Kimi團隊還計劃探索更復雜的軟件工程任務，并將于與流行的IDE、版本控制系統和CI/CD流水線進行更深入的集成。

項目主頁：
https://moonshotai.github.io/Kimi-Dev/
GitHub：
https://github.com/MoonshotAI/Kimi-Dev
HuggingFace：
https://huggingface.co/moonshotai/Kimi-Dev-72B

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

ACI.dev能一站直連600+工具，讓你的智能體秒變全能王！

機器之心Pro 2025-04-30 17:13:00
35 跟貼 35
網頁編程眾測排名：DeepSeek-R1超越Claude 4加冕全球第一

量子位 2025-06-17 16:05:25
40 跟貼 40

SFT+RL雙管齊下：ReasonGen-R1如何破解文生圖「指令不遵」難題？

機器之心Pro 2025-06-16 17:22:48
0 跟貼 0

想知道你的LLM API被過度收費了嗎？隱藏Tokens終于可以被審計了

機器之心Pro 2025-06-17 17:03:06
1 跟貼 1
Gemini 2.5系列模型更新，最新輕量版Flash-Lite實時編寫操作系統

機器之心Pro 2025-06-18 10:20:43
0 跟貼 0

谷歌搜索集成音頻概覽，40秒生成播客總結內容

智東西 2025-06-17 20:56:17
0 跟貼 0

12名工程師，估值190億，AI黑馬的夢幻故事

智東西 2025-01-14 20:23:26
45 跟貼 45
手機谷歌商店首個PS3模擬器發(fā)布！推薦12GB內存

游民星空 2025-06-16 15:23:11
0 跟貼 0

同一天開源新模型，一推理一編程，MiniMax和月之暗面開卷了

機器之心Pro 2025-06-17 11:43:49
26 跟貼 26
GitHub上一個獲得3.8w個star的項目，收錄了課本教材

一網一匠 2025-06-16 20:31:20
17 跟貼 17
文件泄露：克格勃將中國列為敵人？普京不清醒，王毅外長定調

忠誠TALK 2025-06-16 22:43:54
0 跟貼 0
國家安全與反間諜策略：伊朗與中國處理方式的對比與啟示

時光會帶走回憶 2025-06-17 05:48:41
30 跟貼 30
又一開源AI神器！將機器學習論文自動轉為可運行代碼庫

量子位 2025-05-01 11:42:03
31 跟貼 31
央視記者：德黑蘭已經沒有安全的地方了

央視新聞 2025-06-17 18:28:27
44767 跟貼 44767
AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
向印度提供蘇57源代碼！俄羅斯軍工殺瘋了，巴鐵40架殲35夠嗎？

地球班往事 2025-06-16 19:03:38
0 跟貼 0
矛盾加劇，印軍增派兵力藏南，中方突然改變策略，莫迪后悔已晚

軍武時間線 2025-06-17 11:19:13
0 跟貼 0
2025.6.14日報第一集（共四集，注意查看主頁）

獨夫之心 2025-06-15 21:50:32
0 跟貼 0
獨家對話光輪智能：合成數據如何破解AI“數據饑渴”｜50x50

鈦媒體APP 2025-05-30 18:20:12
0 跟貼 0
對話開源中國馬越：DeepSeek不是國運級的創(chuàng)新，年輕人才是

36氪 2025-03-13 18:14:13
14 跟貼 14
DeepSeek又沖上第一！

智東西 2025-06-17 17:04:51
39 跟貼 39
洗碗池上放個水果網套，作用太厲害，一年省下不好費用，漲知識了

妙招酷 2025-06-17 00:28:52
7 跟貼 7
真正的智能體軟件工程師：OpenAI研發(fā)A-SWE能寫代碼、測試質量、修復Bug

量子位 2025-04-14 19:04:43
0 跟貼 0
外網熱議：中國裸辭大哥太猛！親手打造航母模型

神秘莫測的世界 2025-06-17 05:42:14
1 跟貼 1
敘利亞大馬士革，一切恢復原樣，沒有太大的變化

小奶羊 2025-06-17 12:47:00
7843 跟貼 7843
職場現實問題，你想過嗎，2025年，你憑什么不被AI淘汰？

細說職場 2025-06-14 08:13:37
0 跟貼 0
一名美國男子指出穆斯林女子占用了兩個停車位，隨后被打！

ConfusionMax 2025-06-18 02:07:42
6659 跟貼 6659
王曼昱和孫穎莎分開參賽：鍛煉年輕選手與檢驗外戰(zhàn)實力的新策略

子水體娛 2025-06-16 17:35:51
1 跟貼 1
美軍疑準備介入以伊沖突航母突然帶5000美軍駛向中東

紅星新聞 2025-06-17 18:17:19
4868 跟貼 4868
景區(qū)游客遭“激光射眼”，劇組拍戲沒有“清場特權”！

上觀新聞 2025-06-17 14:29:09
350 跟貼 350
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
當著英首相的面，特朗普把文件掉地上，又把美英協議說成美歐協議

現場直擊X 2025-06-17 09:23:22
0 跟貼 0
國際足聯：C羅你來嘛。C羅：我不

中國新聞周刊 2025-06-17 17:18:18
282 跟貼 282
220. 恐怖分子搶奪機密文件卻被養(yǎng)豬兵截胡

長河觀影 2025-06-17 10:19:05
1 跟貼 1
第一批“掃墓式追星”的人，給內娛上了一課

網易槽值 2025-06-18 12:45:58
0 跟貼 0
小升初數學考試題，可以用金字塔模型，也可以用沙漏模型

公考客棧店小二 2025-06-14 12:31:21
1 跟貼 1
越南在中美貿易博弈中的策略與智慧：尋找產業(yè)鏈平衡點

烽火三月佳人三千 2025-06-18 03:54:55
0 跟貼 0
新一代載人飛船"夢舟"零高度逃逸飛行試驗成功

央視新聞客戶端 2025-06-17 14:02:26
1982 跟貼 1982
全金屬飛機渦扇發(fā)動機模型全金屬飛機渦扇發(fā)動機模型

制造科技 2025-06-17 12:56:21
0 跟貼 0
教育孩子要有策略，媽媽的此招一出，孩子這不乖乖聽話了！

日常逗趣集 2025-06-17 11:42:36
2 跟貼 2

多所高?？荚嚱褂眉t米手機，小米連夜回應：認知有待刷新

多所高?？荚嚱褂眉t米手機，小米連夜回應：認知有待刷新

說說史事

2025-06-17 12:46:05

白宮要求德黑蘭立即無條件投降！伊朗出現3大詭異現象！

白宮要求德黑蘭立即無條件投降！伊朗出現3大詭異現象！

頭條爆料007

2025-06-18 12:05:34

戴一天輻射劑量相當于拍117次胸片？這5種首飾盡量別戴！

戴一天輻射劑量相當于拍117次胸片？這5種首飾盡量別戴！

溫讀史

2025-06-11 10:14:23

我爸出軌秘書已經45年，我媽不哭不鬧，在他70歲生日這天絕地反擊

我爸出軌秘書已經45年，我媽不哭不鬧，在他70歲生日這天絕地反擊

詭譎怪談

2025-05-02 15:13:52

突降名校！房價猛漲56%！西安學區(qū)房連夜跳漲88萬~

突降名校！房價猛漲56%！西安學區(qū)房連夜跳漲88萬~

愛看劇的阿峰

2025-06-18 09:40:38

深度：各地瘋卷短劇拍攝基地

新腕兒

2025-06-17 10:39:22

說實話，當初蔚來搞換電，就注定了今天的局面

說實話，當初蔚來搞換電，就注定了今天的局面

互聯網.亂侃秀

2025-06-17 12:17:16

700枚導彈狂轟以色列！伊朗攻勢讓美意識到：解放軍實力深不見底

700枚導彈狂轟以色列！伊朗攻勢讓美意識到：解放軍實力深不見底

生活魔術專家

2025-06-17 10:54:07

G7峰會上演戲劇一幕：馮德萊恩說盡中國壞話，特朗普沒敢接一句茬

G7峰會上演戲劇一幕：馮德萊恩說盡中國壞話，特朗普沒敢接一句茬

聞識

2025-06-18 11:51:27

新的風暴已到來，中國必須面對！專家：有3個棘手的挑戰(zhàn)已經出現

新的風暴已到來，中國必須面對！專家：有3個棘手的挑戰(zhàn)已經出現

聯友說娛

2025-06-17 10:13:27

第一批瘋搶城市之光的業(yè)主，開始虧本賣房了！

第一批瘋搶城市之光的業(yè)主，開始虧本賣房了！

房二娃

2025-06-18 10:17:50

哈利伯頓&基德成最近總決賽唯二30+分鐘0進球的后衛(wèi)

哈利伯頓&基德成最近總決賽唯二30+分鐘0進球的后衛(wèi)

雷速體育

2025-06-18 09:05:40

馬斯克意外公布尿檢結果，配文“哈哈”，剛被特朗普批重度癮君子

馬斯克意外公布尿檢結果，配文“哈哈”，剛被特朗普批重度癮君子

譯言

2025-06-18 10:43:13

據說，這是一個排名世界第一的“笑話”！

據說，這是一個排名世界第一的“笑話”！

霹靂炮

2025-06-10 10:49:04

印度空難真相出爐？機長生前發(fā)出信號，消息一出，特朗普一語定調

印度空難真相出爐？機長生前發(fā)出信號，消息一出，特朗普一語定調

冰雪財經官方

2025-06-17 18:11:22

自從懂了中醫(yī)之后，這些食物就再沒碰過

自從懂了中醫(yī)之后，這些食物就再沒碰過

太極本草

2025-05-09 20:21:10

史詩級超級工程:川藏鐵路有望提前完工，解決藏南問題提速!

史詩級超級工程:川藏鐵路有望提前完工，解決藏南問題提速!

童童聊娛樂啊

2025-06-18 11:43:48

她年輕又貌美，為什么要嫁給欠債的李亞鵬？

她年輕又貌美，為什么要嫁給欠債的李亞鵬？

不畏將來不念過去

2025-06-17 14:28:17

美航母剛趕往中東，中方雙航母突然大動作，美軍緊急呼叫日方支援

美航母剛趕往中東，中方雙航母突然大動作，美軍緊急呼叫日方支援

頭條爆料007

2025-06-17 22:33:15

飛天茅臺電商促銷價跌破1850元：經銷商稱線下影響有限，高端白酒如何破局？

飛天茅臺電商促銷價跌破1850元：經銷商稱線下影響有限，高端白酒如何破局？

澎湃新聞

2025-06-18 07:42:28

追蹤人工智能動態(tài)

10688文章數 176167關注度

往期回顧全部

科技要聞

別叫我互聯網公司，京東的野心藏不住了

頭條要聞

受賄數額特別巨大教育部原副部長杜玉波被公訴

頭條要聞

受賄數額特別巨大教育部原副部長杜玉波被公訴

體育要聞

從春晚秧歌到拳擊擂臺，中國機器人打服老外

娛樂要聞

S媽曬慈善照疑似躲避大S遺產風波

財經要聞

"高端國貨"林清軒IPO:虛假宣傳成"慣犯"

汽車要聞

六色可選!秦L EV發(fā)布限定改色車膜 1999元包安裝

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

時尚

房產

教育

公開課

本地新聞

黎錦匠人鄭春榮：經緯千年我在海島織黎錦

生活越難，越需要“經濟上行的美”

房產要聞

硬核補貨！?？谥鞒琴I入低密洋房的機會，終于等到了！

教育要聞

忻州市招生考試管理中心提示

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
指紋識別有可能認錯人嗎？
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：赣榆县| 安乡县| 武汉市| 清丰县| 色达县| 读书| 石楼县| 重庆市| 孝感市| 繁峙县| 南雄市| 唐河县| 昆山市| 怀远县| 武川县| 沂水县| 泰宁县| 绥棱县| 桑植县| 孝昌县| 金堂县| 江安县| 游戏| 宁安市| 轮台县| 岑溪市| 德江县| 海阳市| 望奎县| 元阳县| 全南县| 平武县| 策勒县| 曲松县| 垫江县| 廉江市| 杭州市| 阿拉善右旗| 东丰县| 霞浦县| 泰来县|

<ruby id="p2ne7"></ruby>

<s id="p2ne7"><li id="p2ne7"></li></s>

<th id="p2ne7"><style id="p2ne7"></style></th>

<s id="p2ne7"></s>

<p id="p2ne7"><rp id="p2ne7"><pre id="p2ne7"></pre></rp></p>

<u id="p2ne7"></u>