今天,阿里正式發(fā)布 Qwen3-Coder,這是阿里迄今為止最具代理能力的代碼模型。
Qwen3-Coder 擁有多個(gè)尺寸,其中當(dāng)前最強(qiáng)大的版本為Qwen3-Coder-480B-A35B-Instruct。這是一個(gè) 480B 參數(shù)激活 35B 參數(shù)的 MoE 模型,原生支持 256K token 的上下文并可通過 YaRN 擴(kuò)展到 1M token,擁有卓越的代碼和 Agent 能力。
Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了開源模型的 SOTA 效果,可以與 Claude Sonnet4 媲美
據(jù)阿里官方介紹,借助Qwen3-Coder,剛?cè)胄械某绦騿T一天就能完成資深程序員一周的工作,生成一個(gè)品牌官網(wǎng)最快只需5分鐘。
與此同時(shí),阿里還推出并開源了一款用于代理式編程的命令行工具:Qwen Code。
Qwen Code 基于 Gemini Code 進(jìn)行二次開發(fā),但阿里進(jìn)行了 prompt 和工具調(diào)用協(xié)議適配,使得 Qwen Code 可以最大程度激發(fā) Qwen3-Coder 在 Agentic Coding 任務(wù)上的表現(xiàn)。
另外,Qwen3-Coder 可以和社區(qū)優(yōu)秀的編程工具結(jié)合,如 Claude Code、Cline 等。這一模型已在阿里云旗下大模型服務(wù)平臺百煉上線,其API采用了階梯計(jì)費(fèi)的方式,根據(jù)輸入token量調(diào)整價(jià)格。
在256K~1M一檔,其輸入價(jià)格為6美元/百萬token,輸出價(jià)格為60美元/百萬token。相比之下,Claude Sonnet 4的輸入輸出價(jià)格分別為3美元/百萬token、15美元/百萬token,與Qwen3-Coder 128k~256k一檔的價(jià)格持平。
Qwen3-Code的大規(guī)模強(qiáng)化學(xué)習(xí)
這次阿里從不同角度對Qwen3-Coder進(jìn)行Scaling,以提升模型的代碼能力:
- 數(shù)據(jù)擴(kuò)展:總計(jì) 7.5T(代碼占比 70%),在保持通用與數(shù)學(xué)能力的同時(shí),具備卓越的編程能力;
- 上下文擴(kuò)展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,專為倉庫級和動態(tài)數(shù)據(jù)(如 Pull Request)優(yōu)化,助力 Agentic Coding;
- 合成數(shù)據(jù)擴(kuò)展:利用 Qwen2.5-Coder 對低質(zhì)數(shù)據(jù)進(jìn)行清洗與重寫,顯著提升整體數(shù)據(jù)質(zhì)量。
此外,與當(dāng)前社區(qū)普遍聚焦于競賽類代碼生成不同,阿里認(rèn)為所有的代碼任務(wù)天然適合執(zhí)行驅(qū)動的大規(guī)模強(qiáng)化學(xué)習(xí)。因此阿里選擇在更豐富的真實(shí)代碼任務(wù)上擴(kuò)展 Code RL 訓(xùn)練。
通過自動擴(kuò)展測試樣例,阿里構(gòu)造了大量高質(zhì)量的訓(xùn)練實(shí)例,成功釋放了強(qiáng)化學(xué)習(xí)的潛力:不僅顯著提升了代碼執(zhí)行成功率,還對其他任務(wù)帶來增益。
在Long-Horizon RL階段,模型學(xué)會了在真實(shí)軟件工程環(huán)境中進(jìn)行多輪交互——規(guī)劃、執(zhí)行、接受反饋、再決策。阿里在 Qwen3-Coder 的后訓(xùn)練階段執(zhí)行了 Agent RL,鼓勵(lì)模型通過多輪交互的方式利用工具解決問題。
而Agent RL 的主要挑戰(zhàn)在于 Environment Scaling,阿里實(shí)現(xiàn)了可驗(yàn)證環(huán)境的擴(kuò)展系統(tǒng),借助阿里云的基礎(chǔ)設(shè)施,實(shí)現(xiàn)同時(shí)運(yùn)行 20k 獨(dú)立環(huán)境。這一套基礎(chǔ)設(shè)施可以提供大規(guī)模的強(qiáng)化學(xué)習(xí)反饋和評測,最終阿里在 SWE-bench Verified 上實(shí)現(xiàn)了開源模型 SOTA 的效果。
Qwen3-Coder的生態(tài)集成
Qwen3-Coder推出多元化的使用方案,降低開發(fā)者接入門檻。自研的Qwen Code工具基于Gemini Code進(jìn)行優(yōu)化,通過prompt和工具調(diào)用協(xié)議適配,最大化激發(fā)模型在代理式編程任務(wù)上的表現(xiàn)。
該模型同時(shí)支持與Claude Code的集成使用,開發(fā)者可通過阿里云百煉平臺申請API密鑰,采用兩種接入方案實(shí)現(xiàn)無縫對接。此外,Qwen3-Coder還兼容Cline等主流編程工具。
通過百煉API平臺,開發(fā)者可直接調(diào)用該模型服務(wù),阿里云提供了完整的示例代碼和配置指南,支持快速部署和測試:
Qwen Code 是一個(gè) CLI工具,修改自Gemini CLI,針對 Qwen3?Coder系列的模型增強(qiáng)了解析器和工具支持。
step1:安裝Qwen Code
確保已安裝 Node.js 20 及以上版本,可以通過以下命令安裝:
step2:通過 npm 管理器安裝 Qwen Code
從 npm 包安裝:
從源碼安裝:
step3:配置環(huán)境變量(使用 OpenAI SDK 調(diào)用 LLM)
Qwen Code 支持 OpenAI SDK 調(diào)用 LLM,你可以導(dǎo)出以下環(huán)境變量,或者簡單地將其放在 .envfile 中。
除了 Qwen?Code 之外,現(xiàn)在還可以將 Qwen3?Coder 與 Claude?Code 搭配使用。只需在阿里云百煉平臺申請?API? Key,并安裝?Claude?Code,即可開始暢享編碼體驗(yàn)。阿里提供了兩種接入方式,幫助無縫地用 Qwen3?Coder 進(jìn)行編碼:
方案?1:使用dashscope提供的代理 ?API
只需要將Anthropic的base url替換成dashscope上提供的endpoint即可。
至此就可以直接輸入claude 開始使用 Qwen3-Coder & Claude Code
方案?2:使用 claude-code-config 自定義路由
claude-code-router是一個(gè)第三方的路由工具,用于為?Claude?Code?靈活地切換不同的后端 API。dashscope平臺提供了一個(gè)簡單的擴(kuò)展包 claude-code-config,可為 claude-code-router 生成包含 dashscope 支持的默認(rèn)配置。
生成配置文件和插件目錄:
該命令會自動生成 ccr 所需的配置文件和插件目錄。你也可以手動調(diào)整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/中的配置。
最后,通過 ccr 開始使用 Claude Code:
至此即可通過 ccr 使用 Claude?Code 暢享 Qwen3?Coder 的強(qiáng)大編碼能力。而如果開發(fā)者想通過百煉API平臺,可接調(diào)用該模型服務(wù),阿里云也提供了完整的示例代碼和配置指南,支持快速部署和測試:
Demo示例
正式發(fā)布時(shí),Qwen官方也提供了Qwen3-Coder的部分用例。
例如,可以讓其打造一個(gè)基于物理的煙囪拆除模擬,按照實(shí)際需求受控爆炸。
還有網(wǎng)友讓Qwen3-Coder出了一道3D HTML開發(fā)題,內(nèi)容是創(chuàng)建一個(gè)3D旋轉(zhuǎn)的立方體展示臺,六個(gè)面顯示不同顏色,自動旋轉(zhuǎn),添加光照效果和陰影等。
Qwen3-Coder交付的結(jié)果完成度不錯(cuò),基本實(shí)現(xiàn)了主要功能,旋轉(zhuǎn)動效、陰影等處理到位。
市場前景:瞄準(zhǔn)編程AI助手增長空間
阿里云表示將繼續(xù)提升Coding Agent效果,希望承擔(dān)更多復(fù)雜軟件工程任務(wù),釋放開發(fā)者生產(chǎn)力。公司計(jì)劃推出更多模型尺寸版本,在保證效果的同時(shí)降低部署成本。
該公司正積極探索Coding Agent的自我改進(jìn)能力,這一技術(shù)方向被視為編程AI發(fā)展的關(guān)鍵突破點(diǎn)。隨著企業(yè)對自動化編程需求的增長,代碼生成模型市場預(yù)期將迎來快速擴(kuò)張。
Qwen3-Coder的發(fā)布時(shí)機(jī)正值全球科技公司加速布局AI編程助手,該產(chǎn)品的開源策略和多工具兼容性有望在激烈的市場競爭中獲得差異化優(yōu)勢。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.