網易首頁 > 網易號 > 正文申請入駐

造福or替代程序員？實測阿里新模型

2025-07-23 22:42:47　來源: 虎嗅APP

北京舉報

分享至

題圖｜視覺中國

坦白說，過去幾年，作為一名開發者，我感覺自己越來越像一個高薪的“代碼搬運工”。

我的日常，是在StackOverflow的問答、GitHub的開源項目和公司陳舊的代碼庫之間，進行無休止地“搬運”。

Ctrl+C，Ctrl+V，然后花上數小時修復那些瑣碎的bug，搭建那些千篇一律的腳手架。這不僅枯燥，更是對創造力的一種緩慢扼殺——我們本該是創造未來的建筑師，但“復制粘貼”卻占據了工作的絕大部分。

我們都用過Copilot類的工具，它們很棒，能幫你補全下一行代碼，甚至一小段函數。但它們始終是“副手”，無法理解你真正的意圖，更別提獨立承擔一項完整的任務。你依然是那個殫精竭慮的“主駕駛”。

但如果，AI不再只是一個幫你補全代碼的“副駕駛”，而是能理解整個任務、獨當一面的“全棧工程師”呢？

就在今天，我體驗到了阿里剛剛開源的Qwen3-Coder。說實話，一開始我只是抱著“又一個國產模型”的心態去嘗試。但經過一天的深度體驗后，這個HuggingfaceCEO點贊的Qwen3-Coder 新模型徹底震撼到我了。

它的意義，不僅僅是評測表單中的超越GPT-4.1，比肩全球最強Claude4的全球第一梯隊強勁性能，更重要的是，是它讓我親眼看到了終結“搬磚”日常的曙光。

這，可能就是那場我們期待已久的、真正的生產力革命。

上手即封神，我的Qwen3-Coder“初體驗”

先說說我跟幾個程序員朋友最直觀的共同感受。

速度很快，沒有思考過程，體驗比Gemini還好。雖然寫出來的代碼偶爾有一點點小問題，但跟它說下現象就能自己糾正好了。而且隨著對能力的探索，token使用量大幅增加。

它已經是一個完整版的生產力工具了。

你可以通過三種方式與這位新來的“AI開發者”協作：在QwenChat網頁端和它免費暢聊；通過阿里云百煉的API將其能力注入萬物；或者，如果你偏好本地部署的話，也可以直接從HuggingFace或魔搭社區下載模型，讓它在你的本地為你工作，數據絕對安全。

我選擇了最直接的網頁端，開始了我這一天的“瘋狂測試”。

1.開胃菜：會動的“天氣預報卡”

我給它的第一個指令很簡單：“創建一個帶動畫效果的天氣預報卡，能根據不同天氣（晴天、雨天、多云）顯示不同的動畫。”

過去，這種任務AI通常能生成個靜態框架，但動畫和交互邏輯總是一團糟。

然而Qwen3-Coder幾乎是瞬間就給出了結果——一個漂亮的卡片，上面不僅有城市和溫度，點擊不同的天氣按鈕，背景真的會流暢地切換成陽光、雨滴和云朵的動畫。代碼一次性跑通，零bug。

這感覺就像，你讓助理幫你畫個草圖，他直接給了你一個可以交互的精美原型。

2.硬菜：一個完整的科技新聞官網首頁

接下來，我提升了難度，用了我最喜歡測AI代碼工具的案例：“給我創建一個科技新聞媒體產品的官網首頁，要有導航欄、HeroSection、媒體介紹、會員定價表格和頁腳。”

這是檢驗AI設計品味和布局能力的“照妖鏡”。還記得幾個月前，AI生成的頁面還停留在上世紀90年代的審美嗎？布局混亂，配色辣眼。

但Qwen3-Coder的出品，讓我驚掉了下巴。

一個設計現代、響應式布局、UI/UX考究的完整頁面呈現在我眼前。它甚至貼心地加入了微交互動畫。

如果我不說，你絕對會以為這是出自一位資深前端設計師之手。而如今，一個開源模型就能輕松做到，而且是免費的。

時代真的變了。

3.炫技時刻：可視化“神經網絡”

“用p5.js創建一個可視化的神經網絡，節點和連接要有脈沖和發光的動畫效果。”這個任務考驗的是它整合多語言（HTML/CSS/JS/p5.js）和實現復雜邏輯與動畫的能力。

很快，一個帶控制面板的交互式神經網絡模擬器誕生了。你可以重置網絡、開始/暫停動畫，甚至調節動畫速度。代碼邏輯清晰，藝術與技術的結合堪稱完美。

它不僅理解了“神經網絡”這個技術概念，還理解了“脈沖”和“發光”這種感性的藝術表達。

4.生產力測試：秒建“CSV數據看板”

最后，我扔給它一份包含姓名、郵件、性別的模擬CSV數據，要求它“構建一個單頁Web應用，能解析用戶上傳的CSV文件，并動態生成多種圖表（條形圖、折線圖等）來可視化數據。”

這幾乎是每個數據分析師和后端開發者的日常工作。Qwen3-Coder幾乎在瞬間就構建了一個功能完備的數據看板。它不僅正確解析了我提供的數據，還生成了條形圖和對比圖，整個儀表盤的設計模塊化且交互性十足。

一天測試下來，我的結論顯而易見：它不再是‘生成代碼’，而是在‘交付產品’。Qwen3-Coder已經進入了功能、設計和用戶體驗的層面。

為什么Qwen3-Coder能這么強？

Qwen3-Coder的真正革命性在于，它已經從一個“代碼補全器(Copilot)”進化為了一個“自主開發者(Agent)”。

它思考的不再是“下一行代碼該寫什么”，而是“為了完成這個任務，我需要分幾步，調用哪些工具，如何驗證結果”。

這背后，是三大核心技術支柱的支撐：

1.架構選擇：混合專家（MoE）帶來的規模與效率

Qwen3-Coder是千問系列首個采用混合專家（MoE）架構的代碼模型。其最強版本總參數規模高達4800億（480B），但在每次推理時，僅激活其中的350億（35B）參數。

這種架構的優勢是顯而易見的。

它允許模型擁有巨大的知識容量和參數規模，從而在處理復雜問題時具備更強的泛化能力和更高的天花板。同時，通過稀疏激活的機制，它又將單次推理的計算成本控制在了一個相對合理的范圍內。

這是一種在模型能力和推理效率之間取得精妙平衡的先進架構，也是Qwen3-Coder能夠實現頂級性能的關鍵基礎。

2.能力核心：為Agent能力打造的強化學習（RL）設施

Qwen3-Coder卓越的Agent能力并非偶然。阿里Qwen團隊認為，編程任務“天然適合執行驅動的強化學習”，因為代碼的正確性可以通過實際運行結果來直接驗證。

基于此，他們構建了一個能夠并行運行2萬個獨立環境的大規模強化學習基礎設施。在這個設施中，模型可以模擬真實的軟件工程流程：接收任務、規劃解決方案、調用外部工具（如代碼執行器、測試框架）、獲取環境反饋（成功、失敗、錯誤信息），并根據反饋進行迭代和改進。

通過在這種大規模、高并發的真實編碼環境中進行海量訓練，Qwen3-Coder成功地學會了如何解決復雜、多步驟的“長視距”任務。這直接使其代碼執行成功率和工具使用效率得到顯著提升，也解釋了為何它在處理需要自主規劃和工具調用的Agent任務時，表現得比許多競爭對手更加出色和高效。

3.上下文長度：處理大規模代碼庫的基石

軟件工程往往涉及對龐大代碼庫的理解。Qwen3-Coder在這方面具備了物理層面的優勢：它原生支持256K tokens的上下文窗口，并通過技術手段可擴展至1M tokens。

這意味著模型可以在一次交互中處理數百萬字符的代碼和文檔。它能夠完整地通觀大型項目，閱讀整個代碼庫、需求文檔甚至多個文件的變更歷史，從而實現對項目全局的理解和跨文件的代碼生成。

這種處理“倉庫級”代碼的能力，是解決復雜系統級問題、進行代碼重構和深入理解遺留系統的先決條件，也是許多上下文窗口較小的模型所不具備的。

新王登基，阿里再次展現自己AI的強大能力

是的，是時候談談最激動人心的部分了。

Qwen3-Coder不僅在體驗上令人驚艷，在評測數據上，它更是直接向美國最頂尖的模型發起了挑戰，并且成功站上了全球第一梯隊——超預GPT4.1，與Claude 4并駕齊驅。

1.正面硬剛，數據說話

·對決GPT-4.1:

在衡量代碼模型解決真實世界軟件問題的權威榜單SWE-Bench、以及其他多項Agent編碼基準測試中，Qwen3-Coder的得分實現了對GPT-4.1的明確超越。

這意味著，在處理復雜、真實的編程任務時，這個來自中國的開源模型，比OpenAI最強的閉源模型之一更有效。

·比肩Claude4:

Claude一直是AgenticCoding領域的標桿。

然而，Qwen3-Coder在多個編程智能體任務上，已經可以和Claude4平起平坐。更關鍵的是，在Agent的核心能力——工具調用上，實測數據顯示其調用的工具數量甚至“比Claude多幾倍”。

這意味著在解決同一個復雜問題時，Qwen3-Coder的自主規劃和問題分解能力更強，解決問題的手段更多樣。

2.成本的“降維打擊”

如果說性能上的超越已經足夠震撼，那么成本上的優勢則是“致命一擊”。

Claude4很強，但它也很“貴”。而Qwen3-Coder呢？

·API價格：以約200K輸入為例，Qwen3-Coder的API輸入價格約為Claude4的1/2，輸出價格接近1/3。綜合成本優勢巨大。

·終極殺招：完全免費：別忘了，它是一個開源模型，遵循Apache-2.0許可。只要你愿意，你可以一分錢不花地在本地擁有這個世界頂級的編程大腦，并可免費商用。

“免費”與“最強”，這兩個本不該同時出現的詞，被阿里硬生生地捏合在了一起。這對昂貴的閉源API服務來說，無異于一場降維打擊。

3.戰略的勝利：開源即是王道

在OpenAI等競爭對手日益封閉的今天，阿里選擇了一條截然相反的道路——將自己最頂尖、最具生產力的產品，無償分享給全世界。

這背后，是期待通過定義下一代開發工具的標準，來構建一個繁榮的全球開發者生態。

當全世界的開發者都開始基于Qwen構建應用、插件和工具時，它就成了這個時代的“Android”或“Linux”，成為了不可或逾越的“新基建”。

而阿里云作為基礎，自然將受益這個token消耗快速增長的時代。

Qwen3-Coder，讓我看到中國推理流量爆發的潛力

Qwen3-Coder的發布，影響的絕不僅僅是技術圈的排名，是我們每一個人。

對于開發者來說，我想說，請忘掉那些關于“AI 取代程序員”的陳舊焦慮吧。Qwen3-Coder 的出現，不是為了取代誰，而是為了武裝誰。它把一個資深開發團隊的綜合能力，壓縮進一個任何人都可以調用的工具里，然后交到你的手上。

你將從一個敲擊鍵盤的“代碼工人”，升級為一名運籌帷幄的“創意指揮家”。你負責提出構想、定義架構、指揮AI執行，而那些繁重、重復的實現細節，將由你的AI伙伴高效完成。你的價值，將更多地體現在創造力、審美和系統性思考上。

對于普通人來說，一個激動人心的“氛圍編程(VibeCoding)”時代正在到來。

你不需要懂

或for循環，你只需要用最自然的大白話描述你的想法——“我想要一個記錄寶寶成長的網站，粉色主題，能上傳照片和視頻”——AI就能為你構建出應用的雛形。創造的門檻，從未如此之低。

今天我們看到的是編程領域的革命，明天，當這些強大的Agent被應用于更多領域時，制藥、新材料、金融建模、科學研究……所有行業的生產力都將被重新定義。

Qwen3-Coder的發布，為全球AI發展設定了一個全新的、更高的基準線。最強的力量，第一次以最開放的形式，普惠給了每一個人。

AI 革命的入場券，從未如此便宜，也從未如此強大。

我想，它一定會催生一個“超級個體”的時代。無論你是一個開發者、一個產品經理，還是一個只有絕妙創意的普通人，你都可以借助這種前所未有的強大工具，以驚人的效率，將腦海中的想法變為現實。

對了，經過這一天的嘗試，Qwen3-Coder讓我看到了中國推理流量，像美國過去半年一樣暴增的潛力。

也就在今天的晚間，阿里云官網掛出了更低的定價，比目前最主流編程模型Claude Sonnet4下降了很多。

我想現在，你最該做的，就是立刻去魔搭社區或Hugging Face下載它，或者打開它的網頁。去試試看，用一句話，創造一個屬于你的世界。

本內容為作者獨立觀點，不代表虎嗅立場。未經允許不得轉載，授權事宜請聯系 hezuo@huxiu.com

本文來自虎嗅，原文鏈接：https://www.huxiu.com/article/4611051.html?f=wyxwapp

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

阿里發布Qwen3-Coder：4800億參數，實現開源代碼模型新SOTA

DeepTech深科技 2025-07-23 18:41:43
5 跟貼 5
英偉達GPU被曝嚴重漏洞，致模型準確率暴跌99.9%

量子位 2025-07-23 15:34:19
4 跟貼 4

微信能自動發消息了？不愛打字的用戶有福了！

雷科技 2025-07-23 12:22:56
3 跟貼 3

程序員會被AI取代嗎？MIT研究揭示三大現實挑戰

DeepTech深科技 2025-07-22 14:49:08
1 跟貼 1
阿里夸克健康大模型通過主任醫師評測，醫療板塊領漲全場

新浪財經 2025-07-23 18:17:18
0 跟貼 0

阿里瓴羊企業級Agent出道！企業迎來“超級員工”時代

雷科技 2025-07-23 17:25:48
0 跟貼 0

一個把復雜的理科知識可視化的網站，完全免費

一網一匠 2025-07-21 21:29:18
156 跟貼 156
新的CodeBuddy IDE測了，我們感受到騰訊搞定創意人士的野心

機器之心Pro 2025-07-23 17:38:17
5 跟貼 5

哈曼丹到底多有錢，一塊車牌頂王思聰一個車庫，馬云都得靠邊站！

惠娥輕笑 2025-07-22 14:48:30
4 跟貼 4
馬云：AI會改變一切，但不會決定一切

每日經濟新聞 2025-07-01 14:52:36
0 跟貼 0
杭州市余杭區部分小區供水異常調查情況通報

界面新聞 2025-07-23 17:44:30
24989 跟貼 24989
美年健康：公司已與阿里巴巴達摩院達成合作，有序推動落地“一掃多查”醫療AI技術

每日經濟新聞 2025-07-23 23:31:41
1 跟貼 1
AI理解語言的終極密碼，千問3向量模型開源，性能超谷歌OpenAI

機器之心Pro 2025-06-11 19:17:56
0 跟貼 0
與中方簽完20多份文件，普京立刻安排下屬，給了中國最緊缺的東西

大地解密站 2025-07-23 21:54:49
0 跟貼 0
又一開源AI神器！將機器學習論文自動轉為可運行代碼庫

量子位 2025-05-01 11:42:03
0 跟貼 0
老板把軟件部程序員教訓了個遍，唯獨沒教訓我，您猜我什么感受？

程序員古耕 2025-07-22 10:56:05
11 跟貼 11
AI編程平臺Lovable成立8個月估值18億美元，成歐洲最新獨角獸

DeepTech深科技 2025-07-23 18:33:44
0 跟貼 0
程序員深夜加班回家，小區保安對話亮了，保安也是個深藏不露職業

湛藍笑談生活 2025-07-22 17:56:21
0 跟貼 0
醉酒父親街頭摟著亭亭玉立女兒不時親手親臉:我生的

臺海大林 2025-07-23 08:47:56
6313 跟貼 6313
特朗普搞清算！報“胯下之辱”？機密文件曝光，奧巴馬真叛國了嗎

究竟誰主沉浮 2025-07-22 15:49:34
0 跟貼 0
最受騰訊、阿里等雇主青睞的英國大學畢業生！

英國大學申請中心 2025-07-23 22:10:19
2 跟貼 2
幫你識別一下關于AI的那些“裝腔作勢”

秦朔朋友圈 2025-07-24 00:15:09
1 跟貼 1
特朗普公開呼吁逮捕奧巴馬，一場由機密文件引爆的政治復仇

瑩瑩觀點 2025-07-21 17:26:11
0 跟貼 0
對話開源中國馬越：DeepSeek不是國運級的創新，年輕人才是

36氪 2025-03-13 18:14:13
14 跟貼 14
清華畢業，柬埔寨某科技公司CTO，回國后被“封閉管理”一年多

螞蟻大喇叭 2025-07-23 20:25:17
0 跟貼 0
王楚欽已屏蔽所有社交軟件，坦言脫離賽場希望能做一個普通人

炫音新鮮事 2025-07-23 15:45:19
1 跟貼 1
【精度降低=性能暴跌？】1小時搞懂AI大模型數值精度那些事！混合訓練如何平衡性能與成本！大模型微調

盧菁老師 2025-07-21 13:47:12
0 跟貼 0
數學不是“數”學，是人類對宇宙的壓縮語言

軍武數據庫 2025-07-23 10:24:08
5 跟貼 5
大模型如何落地醫療行業，解放醫生？

量子位 2025-07-21 15:11:21
0 跟貼 0
若f(x)為偶函數,對任意x都有xf(x+1)=(1+x)f(x),求函數的值

三樂大掌柜 2025-07-23 08:36:28
1 跟貼 1
UWA?DAY?2025?游戲開發者大會｜全議程

侑虎科技UWA 2025-07-22 18:46:29
1 跟貼 1
華裔工程師30天竊取3600份導彈絕密文件，暴露美國軍工安保漏洞

Hi秒懂科普 2025-07-23 15:19:32
0 跟貼 0
24省份半年報陸續出爐：廣東穩居首位四川守住第五

時代周報 2025-07-23 15:24:30
2557 跟貼 2557
封關后到海南出差、旅游等不需要額外辦理證件

央視新聞客戶端 2025-07-23 10:42:44
7408 跟貼 7408
豐田研究院發布機器人大行為模型研究，單一模型掌握數百項任務

DeepTech深科技 2025-07-22 18:37:08
12 跟貼 12
嫌疑人欺負民警不懂代碼，當著面偷刪資料，民警亮出學歷當場回懟

尋藏官 2025-07-23 16:30:26
0 跟貼 0
1764研究生入學考試數學題，求二元函數極值點。數學二和三都考

我服子佩 2025-07-22 23:32:51
1 跟貼 1
主鋼筋被切斷？長沙一小區多棟精裝房存在安全隱患！住建局已介入

封面新聞 2025-07-23 12:58:04
2513 跟貼 2513
AI刪庫跑路！硅谷CEO控訴Replit引熱議

量子位 2025-07-22 18:54:56
0 跟貼 0
迷你四驅車創始人田宮俊作去世，開創了日本塑料拼裝模型

澎湃新聞 2025-07-22 18:31:06
0 跟貼 0

細節曝光！喬布斯27歲女兒將舉辦婚禮，男方是奧運馬術冠軍！婚禮預算超4800萬元，哈里斯、比阿特麗斯公主等政要名流齊聚

虎嗅APP

個性化商業資訊與觀點交流平臺

24574文章數 686581關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

時尚

房產

數碼

游戲

手機 / 數碼

房產 / 家居

造福or替代程序員？實測阿里新模型

別自嗨了！XREAL徐馳：AI眼鏡只有5歲智商

宗馥莉被質疑讀的是“野雞大學” 校方回應

宗馥莉被質疑讀的是“野雞大學” 校方回應

英格蘭最紅球星 也是加勒比島國驕傲

汪峰森林北同游日本 各帶各娃互不耽誤

律師解析娃哈哈遺產案:遺囑是最大變數

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

光宗耀祖！女生收到錄取通知書，送的不是快遞員，而是兩位飛行員

搶戲《醬園弄》、尬演《長安荔枝》，雷佳音的舒適圈正在反噬

海南自由貿易港全島封關，2025年12月18日正式啟動！

AppleCare+ 為 iPad 和 Apple Watch 帶來防盜和丟失選項

《光環無限》美術組曾用辭職"逼宮"：要求用虛幻引擎

英格蘭最紅球星也是加勒比島國驕傲

汪峰森林北同游日本各帶各娃互不耽誤

德系大招放盡場地極限測試全新奧迪A5L