99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<var id="tac68"><strong id="tac68"><legend id="tac68"></legend></strong></var>

<wbr id="tac68"></wbr>

<tr id="tac68"><dfn id="tac68"></dfn></tr>

<thead id="tac68"><span id="tac68"><strong id="tac68"></strong></span></thead>

<thead id="tac68"><option id="tac68"></option></thead>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

月之暗面開源 Kimi-K2：萬億參數，超強Agent，全線 SOTA

2025-07-16 17:54:09　來源: 大數據文摘

北京舉報

0

分享至

大數據文摘出品

2023年成立的中國AI初創公司月之暗面，剛剛發布了其最新重量級產品Kimi-K2。

這是一款參數規模高達一萬億的開源大模型，以挑戰GPT-4.1和Claude Sonnet 4為目標。

Kimi-K2沒有配備專門的“推理模塊”，卻依然在多個關鍵領域打破性能壁壘，這一策略讓人想起早前Deepseek的發布。

該模型采用“專家混合”（Mixture-of-Experts）架構，每次推理時動態激活320億參數。

Kimi-K2的權重完全開放，允許研究者和開發者進行自定義微調與本地部署。

擊穿基準：沒有“推理模塊”的強者

Kimi-K2在多個通用語言模型評測中與閉源頂級模型并肩而立，甚至在編程與數學領域表現出壓倒性優勢。

在被廣泛采用的SWE-bench Verified測試中，Kimi-K2-Instruct在“Agent模式”下獲得65.8%的得分，僅次于Claude Sonnet 4，遠超GPT-4.1的54.6%。

這個測試評估的是模型在真實開源項目中識別與修復代碼錯誤的能力，難度極高。

在LiveCodeBench測試中，Kimi-K2以53.7%的得分領跑所有模型，OJBench的得分也達到了27.1%。

這兩個評測分別模擬互動式編程任務與傳統競賽題，進一步證明了Kimi-K2在軟件工程場景中的適配能力。

更重要的是，官方強調“non-thinking”，意味著在無需顯式推理的基礎上，完成這些高復雜度任務。這對“推理模塊”至上的傳統語言模型設計提出了深刻反思。

在數學和科學領域，Kimi-K2在AIME、GPQA-Diamond和MATH-500等測評中穩定優于主要對手，展示出深度數學建模的潛力。

在多語言測試如MMLU-Pro中，它同樣進入領先梯隊，兼具多語言與跨學科能力。

值得一提的是，在一項非正式評測中，Kimi-K2能完整生成騎自行車的鵜鶘SVG圖像，而其他主流模型常常只畫出模糊形狀。

圖像生成的正確性在眾多模型中極為罕見，這也印證了Kimi-K2的空間理解與復雜結構表達能力。

月之暗面強調，Kimi-K2專為Agent工作流而非日常對話而設計。

它能自主調用工具、執行命令、生成與調試代碼，甚至完成復雜的多步驟流程。

在一場演示中，Kimi-K2完成了一整套薪資數據分析任務，包括：數據抓取、統計建模、并生成交互式HTML頁面，內嵌可定制的推薦工具，全流程無需人工干預。

它不僅僅能“理解指令”，還能構建復雜流程，從想法到產品，Kimi-K2一次完成。

媒體報道稱，這一切并非依賴龐大的推理系統，而是源于其在Agent環境中進行的強化學習訓練，重點在于“工具協作”而非“邏輯演繹”。

分析認為，這種以“任務完成”為核心的訓練方向，可能比傳統的“思考過程訓練”更適用于實際場景。盡管如此，Kimi-K2仍有局限：如果任務本身不明確，或者工具調用鏈條過長，模型可能輸出拖沓或不完整。

此外，Kimi-K2在持續對話中的表現遠優于單輪問答，這更加印證了其Agent化定位。

意思是：自研的 Muon 優化器，在訓練大模型時表現明顯好于主流的 AdamW。如果預訓練語料是有限的，模型結構也不變，那么“更省 token 的優化器”能訓練出“更聰明的模型”

Kimi-K2使用名為MuonClip的新訓練算法，在規模達到15.5萬億tokens的訓練中保持穩定。該算法通過定期調整注意力機制中的關鍵參數，成功避免了大模型常見的“訓練崩潰”問題。

one more thing

Kimi-K2目前提供兩個版本：Kimi-K2-Base用于研究與微調，Kimi-K2-Instruct適用于通用任務與Agent部署。

兩者均可通過月之暗面的OpenAI兼容API調用，價格分級明確。

緩存命中輸入每百萬tokens僅需$0.15，未命中為$0.60，輸出為$2.50，符合商業化預期。

月之暗面還允許開發者使用vLLM、SGLang、KTransformers或TensorRT-LLM在本地部署。

在GitHub上可查閱完整的部署說明。

模型遵循MIT開源協議，但對超大規模部署有附加條款：若產品用戶超過1億，或月營收超2000萬美元，需在界面明確展示“Kimi-K2”名稱。

這對于大多數初創公司或開發者來說不構成障礙，反而是品牌信用的體現。

不過，Kimi-K2并非輕裝上陣：推理需調用320億參數，高效推理通常需多卡Hopper或同級GPU。

據蘋果開發者Awni Hannun透露，其4-bit量化版本可在兩臺配備512GB內存的Apple M3 Ultra機器上運行，但門檻依然顯著。

作者長期關注 AI 產業與學術，歡迎對這些方向感興趣的朋友添加微信Q1yezi，共同交流行業動態與技術趨勢！

GPU 訓練特惠！

H100/H200 GPU算力按秒計費，平均節省開支30%以上！

掃碼了解詳情?

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

訓練太復雜？對圖片語義、布局要求太高？圖像morphing一步到位

機器之心Pro 2025-07-18 17:53:42
0 跟貼 0
楊植麟摸著DeepSeek過河

36氪 2025-07-19 12:31:08
0 跟貼 0

演講生成黑科技，PresentAgent從文本到演講視頻

機器之心Pro 2025-07-18 18:09:38
0 跟貼 0

One image is all you need多模態指令數據合成，只管給圖給Oasis

機器之心Pro 2025-07-18 18:03:34
0 跟貼 0
代碼碾壓一切！OpenAI神秘模型o3-alpha一夜刷屏，卻遭41歲大神絕地反殺

新智元 2025-07-19 14:12:17
1 跟貼 1

OpenAI放“王炸”！ChatGPT Agent重磅發布：能上網搜、會做PPT、精通Excel，甚至能規劃全美看球路線！但炒股？它說“NO”！

每日經濟新聞 2025-07-18 07:31:03
2 跟貼 2

你的模型評測搭子上線：Evaluation Agent懂你更懂AI

機器之心Pro 2025-07-17 19:07:55
0 跟貼 0
上下文工程的關鍵及發展趨勢

白駒談人機 2025-07-20 00:04:05
0 跟貼 0

本來以為是個小工程，沒想到是大壩漏水，這玩意得墊資幾億修吧

樹心全觀 2025-07-18 10:04:27
3774 跟貼 3774
AI開發圈地震！Cursor多款模型在中國大陸不能用了，程序員要求退錢

智東西 2025-07-18 12:52:19
56 跟貼 56
上海最貴？一碗面1588元，另收10%服務費，網友直呼：太瘋狂

環球網資訊 2025-07-16 09:10:08
13167 跟貼 13167
DeepMind讓AI當「上帝」，導演一場只有AI演員的「西部世界」

機器之心Pro 2025-07-16 13:55:45
0 跟貼 0
黃仁勛與王堅對話！盛贊Kimi、DeepSeek，對年輕人提了這些建議

每日經濟新聞 2025-07-17 17:42:22
25 跟貼 25
無需NeRF/高斯點后處理，視頻秒變游戲模型成現實

量子位 2025-07-19 19:18:42
0 跟貼 0
Muon作者僅用一篇博客，就被OpenAI看中了

機器之心Pro 2025-06-16 14:27:12
0 跟貼 0
大模型轉行土木工程！首個「打灰人」評估基準：檢驗讀、改工程圖紙能力

新智元 2025-07-18 06:27:15
1 跟貼 1
Kimi，熹妃回宮

數字力場 2025-07-17 20:45:43
0 跟貼 0
顧客遭香奈兒柜姐群毆后續，現場慘烈，知情人發聲，原因不簡單

老鵜愛說事 2025-07-19 17:17:02
2142 跟貼 2142
官方通報自來水異味原因多篇論文顯示藻類確可造成水體嗅味，并出現沼澤或化糞池味

紅星新聞 2025-07-19 17:47:14
17212 跟貼 17212
河北邯鄲初中數學求值題，構造零零模型來解題！

三樂大掌柜 2025-07-17 07:48:11
5 跟貼 5
飛書WPS們大戰AI辦公：不拼功能拼「閉環」

雷科技 2025-07-18 22:31:07
2 跟貼 2
關于x的根式方程有解，求參數的取值范圍

三樂大掌柜 2025-07-17 07:47:58
3 跟貼 3
Manus“刪博、裁員、跑路新加坡”后，創始人首次復盤經驗教訓

虎嗅APP 2025-07-20 00:38:11
0 跟貼 0
上海一日料店，倆女子誤認為是自助餐，專門撿貴的點，結賬時4302

好賢觀史記 2025-07-19 16:41:42
784 跟貼 784
大學"硬核"派送錄取通知書：殲16飛行員親自上門派送

上游新聞 2025-07-19 14:27:14
2970 跟貼 2970
中美競爭中的戰略困境：美國牽制策略與中國穩健發展的對比

春曉暖語聲 2025-07-18 21:23:13
0 跟貼 0
美國大滿貫丟了2枚金牌，王勵勤意識到2個“策略失誤”

兩個腦花 2025-07-17 13:51:15
1 跟貼 1
美國"海歸"后怕：在校園被白人男子大吼"滾回去"

上觀新聞 2025-07-19 14:11:21
603 跟貼 603
印巴電子偵察船技術較量：自主研發與外購的策略對比

夏末的晨溪 2025-07-19 04:04:47
0 跟貼 0
杭州的這口臭水，可別白喝了

黑噪音 2025-07-19 06:02:20
3810 跟貼 3810
蘋果發布2025基礎模型報告，揭開Apple Intelligence技術全貌

DeepTech深科技 2025-07-19 21:04:10
8 跟貼 8
專家：兩個宗教政黨接連出走內塔尼亞胡面臨倒臺危機

中國新聞周刊 2025-07-19 18:28:13
1047 跟貼 1047
以色列停火協議：3天237人陣亡后，強硬策略終結沖突

九天攬月1 2025-07-18 21:29:33
0 跟貼 0
河南焦作三家雞蛋灌餅店同時歇業回鄉參加婚禮，網友笑稱7天沒餅吃了，當事人回應

魯中晨報 2025-07-19 07:40:19
384 跟貼 384
韓國主動爆料：被迫限制中國？到底是誰的談判策略？

陌上桃花開的 2025-07-18 04:44:58
0 跟貼 0
新方法讓趕羊變輕松，鋼管隧道助力現代養殖大獎策略

科普快跑 2025-07-18 09:16:42
1 跟貼 1
被約談后首個周末外賣平臺補貼仍在繼續

極目新聞 2025-07-19 16:37:13
1141 跟貼 1141
初中數學代數式求值題，如何構造零零模型是關鍵！

三樂大掌柜 2025-07-18 08:08:23
2 跟貼 2
計算機軟件面子信息有什么區別？看看張雪峰老師是怎么說的

仍歌韻 2025-07-19 04:24:57
0 跟貼 0
精仿的模型，做的太像了

小楊視頻剪輯 2025-07-18 16:40:35
1 跟貼 1

官方價沒套路，捷豹XEL官降，15.98w起

官方價沒套路，捷豹XEL官降，15.98w起

熱點科技

2025-07-17 17:59:31

用鮮血換來的獎章，公安部一級英模甘鐵古親歷1982年美姑縣5.10案

用鮮血換來的獎章，公安部一級英模甘鐵古親歷1982年美姑縣5.10案

顧氏造船廠廠長

2025-07-19 08:00:06

奇葩下海理由，Melody Marks居然是男友推薦下海的，身材演技一流

奇葩下海理由，Melody Marks居然是男友推薦下海的，身材演技一流

說真話的小陳

2025-07-16 09:49:31

2007年，18歲男生每日到45歲女老師家補課，1年后男生被判死刑

2007年，18歲男生每日到45歲女老師家補課，1年后男生被判死刑

柳絮憶史

2025-07-19 10:34:07

澳大利亞率先挺進決賽！13分擊退強敵，靜候中國女籃，奇兵空砍20+3+5！

澳大利亞率先挺進決賽！13分擊退強敵，靜候中國女籃，奇兵空砍20+3+5！

野渡舟山人

2025-07-20 01:50:15

皇馬球員年薪排行榜：姆巴佩第一，阿諾德第五&懷森900萬第十六

皇馬球員年薪排行榜：姆巴佩第一，阿諾德第五&懷森900萬第十六

直播吧

2025-07-20 00:11:06

宗馥莉被曝育有三子宏勝上市“在醞釀中”

宗馥莉被曝育有三子宏勝上市“在醞釀中”

鄧如山

2025-07-18 15:01:30

滕帥首戰慘敗！球迷：笑炸了；居然有老曼聯球迷支持他而不是C羅

滕帥首戰慘敗！球迷：笑炸了；居然有老曼聯球迷支持他而不是C羅

直播吧

2025-07-19 16:04:07

發現沒有，搭伙過日子的夫妻都是這樣過夫妻生活的，沒有例外

發現沒有，搭伙過日子的夫妻都是這樣過夫妻生活的，沒有例外

伊人河畔

2025-07-19 15:39:33

25上海高考上海院校普通批次投檔線漲跌排行榜，最高漲18分

25上海高考上海院校普通批次投檔線漲跌排行榜，最高漲18分

馬蹄燙嘴說美食

2025-07-19 17:44:52

脫下口罩那一刻，有震驚到你嗎？

脫下口罩那一刻，有震驚到你嗎？

貴圈真亂

2025-07-17 09:55:38

宗慶后原配明知二房生子，仍公開示愛，與宗家恩斷21年前已成定數

宗慶后原配明知二房生子，仍公開示愛，與宗家恩斷21年前已成定數

鋭娛之樂

2025-07-19 23:54:06

美國大使放下狠話：只要中國不聽話不低頭，就讓十四億人挨餓受窮

美國大使放下狠話：只要中國不聽話不低頭，就讓十四億人挨餓受窮

趣知史館

2025-07-18 10:00:03

你有沒有發現，父母有穩定養老金的家庭，好像過得特別“帶勁”？

你有沒有發現，父母有穩定養老金的家庭，好像過得特別“帶勁”？

西莫的藝術宮殿

2025-07-19 14:05:58

中美軍事實力有多大差距？張召忠：我可以負責任地講，別再被誤導

中美軍事實力有多大差距？張召忠：我可以負責任地講，別再被誤導

混沌錄

2025-05-12 18:38:14

孩子媽媽錯把36E低胸吊帶自拍發家長群，群內截圖流出被老司機玩壞了哈哈

孩子媽媽錯把36E低胸吊帶自拍發家長群，群內截圖流出被老司機玩壞了哈哈

經典段子

2025-06-19 23:20:08

杭州母子為電話手表，相隔1000多公里吵架：什么人你都加好友？！

杭州母子為電話手表，相隔1000多公里吵架：什么人你都加好友？！

魯中晨報

2025-07-19 15:48:07

機關事退人員有職業年金，為什么企退大多沒有企業年金？正常嗎？

機關事退人員有職業年金，為什么企退大多沒有企業年金？正常嗎？

碎月導師

2025-07-18 19:36:15

古加：這是中超最高水平的對決，這種強強對話就是細節改變結果

古加：這是中超最高水平的對決，這種強強對話就是細節改變結果

直播吧

2025-07-19 21:54:12

湖南5歲男孩被父親從29樓扔下，生前哭喊：爸爸，放我下來

湖南5歲男孩被父親從29樓扔下，生前哭喊：爸爸，放我下來

星宇共鳴

2025-07-18 18:27:21

大數據文摘

專注大數據，每日有分享！

6702文章數 94442關注度

往期回顧全部

科技要聞

工信部等約談17家車企巨頭，競爭劃新紅線

頭條要聞

緬甸園區老板送回19歲高考生：你前途光明不該留在這

頭條要聞

緬甸園區老板送回19歲高考生：你前途光明不該留在這

體育要聞

女籃無緣亞洲杯決賽韓旭淚灑發布會

娛樂要聞

肖戰微博改名：去掉X玖少年團頭銜

財經要聞

娃哈哈爭產大戰：杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

手機

游戲

親子

公開課

數碼要聞

三星Galaxy Buds 3 FE渲染圖曝光黑牌配色新增AI功能

手機要聞

小米16系列獨占9月：驍龍8 Elite2+多款版本，友商或晚一步！

LPL第三階段：宇智波柴，摧毀極影村！TES三局擊潰IG！

親子要聞

孩子突然不愿意上學？4個深層原因+4步拯救法

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
你到底該和什么樣的人做朋友？
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：新乡县| 招远市| 京山县| 甘孜县| 双柏县| 洛隆县| 蒙城县| 伊吾县| 延津县| 南康市| 民权县| 汶川县| 开江县| 聂荣县| 平定县| 镶黄旗| 五原县| 龙井市| 张家界市| 化隆| 云龙县| 淮阳县| 福建省| 行唐县| 桃园县| 离岛区| 泾阳县| 怀集县| 林甸县| 扶风县| 资兴市| 伊春市| 阳朔县| 文水县| 温宿县| 兖州市| 格尔木市| 渝北区| 邵东县| 南京市| 靖边县|

<meter id="v4plu"></meter>

<wbr id="v4plu"><menu id="v4plu"></menu></wbr>