網易首頁 > 網易號 > 正文申請入駐

阿里發布Qwen3-Coder：4800億參數，實現開源代碼模型新SOTA

2025-07-23 18:41:43　來源: DeepTech深科技

北京舉報

分享至

今天，阿里全新開源代碼模型 Qwen3-Coder 正式發布。

（來源：X）

Qwen3-Coder 擁有多個尺寸，此次發布的是最強大的版本，名為 Qwen3-Coder-480B-A35B-Instruct（以下簡稱 Qwen3-Coder）。

它是一款混合專家（MoE）模型，總參數量高達 4,800 億，激活參數為 350 億，原生支持 256K token 的上下文，并可通過 YaRN 擴展到高達 1 百萬 token，支持 358 種編程語言。

圖 | Qwen3-Coder 在測試中的表現（來源：資料圖）

由于 Qwen3 系列模型的整體調整，Qwen3-Coder 僅支持非思考模式，不生成思考過程。

在注意力機制方面，Qwen3-Coder 采用了分組查詢注意力（GQA）方案，配備 96 個查詢（Q）注意力頭和 8 個鍵/值（KV）注意力頭，并擁有 160 個專家（Expert），其中 8 個專家被激活。

圖 | Qwen3-Coder 模型總覽（來源：Qwen）

據介紹，預訓練階段，Qwen3-Coder 從數據、上下文、合成數據三個不同角度進行擴展（scaling），以提升模型的代碼能力。

在后訓練階段，研究團隊選擇在更豐富的真實代碼任務上擴展代碼強化學習（Code RL）訓練。通過自動擴展測試樣例，他們構造了大量高質量的訓練實例，成功釋放了強化學習的潛力：不僅顯著提升了代碼執行成功率，還對其他任務帶來增益。

此前網友挖出線索，阿里團隊在代碼中介紹 Qwen3-Coder 時寫道：“Qwen3-Coder-480B-A35B-Instruct 是一個強大的編碼專用語言模型，在代碼生成、工具使用和代理任務方面表現出色。”

圖 | 網友先前挖出 Qwen3-Coder 的線索（來源：X）

阿里表示，該模型“擁有卓越的代碼和代理能力”。Qwen3-Coder 在代理式編碼、代理式瀏覽器使用和代理式工具使用上成為了開源模型的 SOTA，可以媲美 Claude Sonnet 4。

Qwen3-Coder 也是受到了網友的大力追捧，代碼庫上線一小時就收獲了 5.1k Star。

（來源：GitHub）

與此同時，阿里還推出并開源了一款用于代理式編程的命令行工具：Qwen Code。

“Qwen Code 基于 Gemini Code 進行二次開發，但我們進行了提示詞和工具調用協議適配，使得 Qwen Code 可以最大程度激發 Qwen3-Coder 在代理式編程任務上的表現。”阿里在官網上表示。

（來源：資料圖）

另外，Qwen3-Coder 也可以和 AI 社區優秀的編程工具結合使用，如 Claude Code、Cline 等。開發者也可以通過阿里云 Model Studio 調用 Qwen3-Coder API。

目前，Qwen3-Coder 網頁版已經上線，筆者第一時間嘗試了它的編程水平。

（來源：https://chat.qwen.ai/）

在只提供一句“克隆推特網頁設計和UI”提示的情況下，Qwen3-Coder 給出的結果還是不錯的：

圖 | Qwen3-Coder 生成的仿推特 UI（來源：資料圖）

相比之下，ChatGPT（免費版）給出的結果則是有些簡陋，雖然文本和幾個功能區域都有，但幾乎沒有視覺元素：

圖 | ChatGPT 生成的仿推特 UI（來源：資料圖）

筆者還讓 Qwen3-Coder 做了一個簡單的網頁版乒乓球游戲，同樣只是一句話提示：“開發一個可以在網站上運行的乒乓球游戲”。

代碼生成后直接在 Artifact 上無縫運行，整個過程不到 20 秒，效果很驚艷，直接用鍵盤就能控制，支持兩人對戰，它還自主發揮加上了獲勝規則：

而 ChatGPT 生成的雖然也能運行，但無論是美觀還是完整性，都遠不及 Qwen3-Coder：

圖 | ChatGPT 生成的乒乓球游戲截圖（來源：資料圖）

最后是官方給出的兩段代碼運行效果，分別是地球 3D 模擬和 Flappy Bird 游戲：

此次發布的 Qwen3-Coder 屬于阿里 Qwen3 系列。

三個月前，阿里發布了千問 3（Qwen3）系列模型，包括兩款混合專家 MoE 模型、六款密集模型和若干模型變種，例如后訓練、FP8 版本等等。

其中的旗艦模型 Qwen3-235B-A22B，總參數量高達 2,350 億（235B），其中激活參數為 220 億（A22B），分布在 94 個深層網絡層中。

另外一個 MoE 模型 Qwen3-30B-A3B，尺寸較小，總參數量 300 億，激活參數量 30 億。

（來源：Qwen3）

當時，Qwen3 系列引入了一種混合方法來解決問題，一個模型同時支持思考模式和非思考模式。但現在這種模式已經被取消。

就在 Qwen3-Coder 發布的前一天，阿里同樣更新了 Qwen3 系列，新模型名為 Qwen3-235B-A22B-Instruct-2507（簡稱 Qwen3-2507），迭代速度令人驚喜。

阿里在官網表示，“經過與社區溝通和深思熟慮后，我們決定停止使用混合思維模式。取而代之的是，我們將分別訓練 Instruct 和 Thinking 模型，以獲得最佳質量。所以我們發布了 Qwen3-235B-A22B-Instruct-2507 及其 FP8 版本，供大家使用。”

（來源：資料圖）

Qwen3-2507 在主流基準測試中表現優異。作為一款“沒有思考能力”的開源模型，它在 GPQA、AIME25 和 LiveCodeBench v6 等測試中均超越了未開啟思考模式的 Claude Opus 4。

可以說，無論是Qwen3-Coder 還是 Qwen3-2507，再加上 DeepSeek 和 Kimi，都是 AI 開源社區寶貴的財富。

在閉源模型各種刷榜的今天，它們難得的推動了大模型技術的普及化，為AI 社區開發者和研究人員提供了強大的免費工具。更重要的是，它們的廣受歡迎讓中國在全球 AI 開源領域占據了重要一席。

（來源：資料圖）

這不僅能促進 AI 技術的普惠發展，還能有效降低創新門檻，讓更多開發者參與進來，共同構建一個更加開放和繁榮的 AI 生態系統。

反過來，這些模型未來在產業應用、學術研究和人才培養等方面都將發揮不可估量的作用，進一步加速中國在 AI 領域的進步。

參考資料：

https://qwenlm.github.io/blog/qwen3-coder/

https://qwenlm.github.io/blog/qwen3/

https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

https://arxiv.org/pdf/2505.09388

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

造福or替代程序員？實測阿里新模型

虎嗅APP 2025-07-23 22:42:47
3 跟貼 3
Qwen3小升級即SOTA，開源大模型王座快變中國內部賽了

量子位 2025-07-22 13:06:32
24 跟貼 24

One image is all you need多模態指令數據合成，只管給圖給Oasis

機器之心Pro 2025-07-18 18:03:34
0 跟貼 0

英偉達GPU被曝嚴重漏洞，致模型準確率暴跌99.9%

量子位 2025-07-23 15:34:19
2 跟貼 2
微信能自動發消息了？不愛打字的用戶有福了！

雷科技 2025-07-23 12:22:56
3 跟貼 3

阿里夸克健康大模型通過主任醫師評測，醫療板塊領漲全場

新浪財經 2025-07-23 18:17:18
0 跟貼 0

小米要做中國家電前三，和美的相互學習

每日經濟新聞 2025-05-19 23:45:08
653 跟貼 653
阿里瓴羊企業級Agent出道！企業迎來“超級員工”時代

雷科技 2025-07-23 17:25:48
0 跟貼 0

美年健康：公司已與阿里巴巴達摩院達成合作，有序推動落地“一掃多查”醫療AI技術

每日經濟新聞 2025-07-23 23:31:41
1 跟貼 1
新的CodeBuddy IDE測了，我們感受到騰訊搞定創意人士的野心

機器之心Pro 2025-07-23 17:38:17
2 跟貼 2
何小鵬和雷軍真正的塑料兄弟

雷科技 2025-06-06 21:23:05
67 跟貼 67
AI理解語言的終極密碼，千問3向量模型開源，性能超谷歌OpenAI

機器之心Pro 2025-06-11 19:17:56
0 跟貼 0
哈曼丹到底多有錢，一塊車牌頂王思聰一個車庫，馬云都得靠邊站！

惠娥輕笑 2025-07-22 14:48:30
4 跟貼 4
馬云：AI會改變一切，但不會決定一切

每日經濟新聞 2025-07-01 14:52:36
0 跟貼 0
比亞迪李云飛：要忙在正道上，拒絕陰陽

每日經濟新聞 2025-06-06 17:55:12
251 跟貼 251
比爾蓋茨曾是熊孩子：16歲徒步數百英里，邊走腦中邊寫BASIC代碼

量子位 2025-02-13 14:31:27
81 跟貼 81
天工不止造物,也能修bug:Skywork-SWE給代碼智能體補上軟件工程課

機器之心Pro 2025-06-20 10:50:40
0 跟貼 0
靜悄悄的餓了么，戰斗力到底有多強？

華商韜略 2025-04-30 14:18:35
0 跟貼 0
Agent RL與智能體進化關鍵一步：TaskCraft實現復雜任務自動生成

機器之心Pro 2025-07-04 13:05:41
0 跟貼 0
杭州市余杭區部分小區供水異常調查情況通報

界面新聞 2025-07-23 17:44:30
24829 跟貼 24829
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
0 跟貼 0
金牌模型三位核心華人光速離職！谷歌IMO奪金24h即遭小扎閃電抄家

新智元 2025-07-23 10:24:25
0 跟貼 0
同樣1GB文本，為何中文訓練效果差？對話EleutherAI研究員Catherine，看懂多語言模型的“詛咒”與“祝福”

AI科技大本營 2025-07-23 16:05:53
0 跟貼 0
AI編程平臺Lovable成立8個月估值18億美元，成歐洲最新獨角獸

DeepTech深科技 2025-07-23 18:33:44
0 跟貼 0
吉利控股副總裁楊學良：長城汽車魏建軍是行業吹哨人

每日經濟新聞 2025-06-07 16:30:19
163 跟貼 163
誰是開源界的杠把子？

虎嗅APP 2025-04-11 23:29:08
3 跟貼 3
DeepMind奪得IMO官方「唯一」金牌，卻成為OpenAI大型社死現場

機器之心Pro 2025-07-22 14:10:04
3 跟貼 3
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
搭載本地大模型科大訊飛X5辦公本可離線AI辦公

經濟觀察報 2025-07-23 20:29:03
0 跟貼 0
對話開源中國馬越：DeepSeek不是國運級的創新，年輕人才是

36氪 2025-03-13 18:14:13
14 跟貼 14
特斯拉超級充電站餐廳來了！馬斯克：計劃未來開遍全球！

財聯社 2025-07-22 15:45:54
0 跟貼 0
比亞迪王傳福：做大產業，做出中國制造業應有的位置

每日經濟新聞 2025-07-22 17:51:59
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
0 跟貼 0
幫你識別一下關于AI的那些“裝腔作勢”

秦朔朋友圈 2025-07-24 00:15:09
0 跟貼 0
AI刪庫跑路！硅谷CEO控訴Replit引熱議

量子位 2025-07-22 18:54:56
0 跟貼 0
理想汽車李想：我們比傳統汽車廠商更懂大型軟件

每日經濟新聞 2025-03-29 12:03:06
50 跟貼 50
人機編程大戰，人類苦戰三天險勝OpenAI

機器之心Pro 2025-07-18 18:21:43
0 跟貼 0
大模型如何落地醫療行業，解放醫生？

量子位 2025-07-21 15:11:21
0 跟貼 0
余承東：我有一個夢想馬路上的所有車里都有華為的技術

每日經濟新聞 2025-07-23 17:06:16
0 跟貼 0
會「進化」的合成數據！無需上傳隱私，也能生成高質量垂域數據

機器之心Pro 2025-07-11 18:44:13
3 跟貼 3

DeepTech深科技

麻省理工科技評論獨家合作

15442文章數 513921關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

旅游

家居

時尚

數碼

手機 / 數碼

房產 / 家居

阿里發布Qwen3-Coder：4800億參數，實現開源代碼模型新SOTA

別自嗨了！XREAL徐馳：AI眼鏡只有5歲智商

宗馥莉被質疑讀的是“野雞大學” 校方回應

宗馥莉被質疑讀的是“野雞大學” 校方回應

英格蘭最紅球星 也是加勒比島國驕傲

汪峰森林北同游日本 各帶各娃互不耽誤

律師解析娃哈哈遺產案:遺囑是最大變數

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

方媛三胎日常曝光！37歲穿高跟喝調酒，孕媽圈新標桿?

熱聞|清明假期將至，熱門目的地有哪些?

晨曦生活 明媚而放松

搶戲《醬園弄》、尬演《長安荔枝》，雷佳音的舒適圈正在反噬

AppleCare+ 為 iPad 和 Apple Watch 帶來防盜和丟失選項

英格蘭最紅球星也是加勒比島國驕傲

汪峰森林北同游日本各帶各娃互不耽誤

德系大招放盡場地極限測試全新奧迪A5L

晨曦生活明媚而放松