阿里Qwen3如何改寫AI生產(chǎn)力格局?
作者|田思奇
編輯|栗子
當(dāng)AI從實(shí)驗(yàn)室走向全場景應(yīng)用,如何兼顧性能與成本,成為每一個(gè)開發(fā)者與企業(yè)共同的難題。
4月29日凌晨,伴隨著全球互聯(lián)網(wǎng)的猜測與期待,阿里巴巴正式開源新一代通義千問模型Qwen3(以下簡稱“千問3”),并同步發(fā)布了多個(gè)版本,力圖改寫上述困境。
這款模型以DeepSeek-R1三分之一的參數(shù)量,實(shí)現(xiàn)了數(shù)學(xué)、代碼、多語言理解等核心能力對全球頂尖模型的全面超越,并憑借“混合推理”架構(gòu)與全場景部署方案,將大模型的應(yīng)用成本降至歷史最低水平。
這不僅意味著中國AI首次登上全球開源模型性能巔峰,也是AI從實(shí)驗(yàn)室走向產(chǎn)業(yè)規(guī)模化落地的關(guān)鍵。
1.快與慢之間:千問3首次集成“混合推理”
在AI模型結(jié)構(gòu)設(shè)計(jì)中,過往的競爭主要集中在“推理速度”和“推理深度”之間的取舍:要么快,要么深,但難以兼得。
作為國內(nèi)首個(gè) “混合推理模型”,千問3創(chuàng)造性地將 “快思考” 與 “慢思考” 集成于同一框架,如同賦予模型人類般的思維靈活性:面對簡單咨詢時(shí),模型以低算力快速響應(yīng);處理復(fù)雜問題時(shí),則可啟動(dòng)多步驟深度推理。這種設(shè)計(jì)不僅大幅降低算力消耗,更解決了傳統(tǒng)模型在任務(wù)適配中的效率瓶頸。
LangGPT社區(qū)創(chuàng)始人云中江樹對「甲子光年」表示,「混合推理」是通義千問模型更新中最大的變化。千問3問世以前,該系列的推理模型為QwQ,非推理模型是Qwen2.5, 現(xiàn)在推理和非推理能力合二為一。
這也預(yù)示著,AI應(yīng)用將告別“一刀切”的粗放模式。在產(chǎn)業(yè)落地環(huán)節(jié),它能以更智能、更經(jīng)濟(jì)的方式滲透到金融風(fēng)控、醫(yī)療診斷等對精度要求極高的領(lǐng)域。
對于“千問3是否會弱化提示詞價(jià)值”的問題,云中江樹認(rèn)為,模型本身越強(qiáng),提示詞能發(fā)揮的價(jià)值越高。這里的“弱化”,更多指代的是“工程”,也就是弱化提示詞工程中的一些復(fù)雜、奇特的提示技巧,迭代調(diào)優(yōu)的精力。
千問3背后的混合專家(MoE)架構(gòu)同樣功不可沒??倕?shù)量235B的千問3,實(shí)際激活僅需22B,結(jié)合36T數(shù)據(jù)預(yù)訓(xùn)練與多輪強(qiáng)化學(xué)習(xí),實(shí)現(xiàn)性能飛升的同時(shí),也將成本大幅降低。
在測試奧數(shù)水平的AIME25測評中,千問3斬獲81.5分,刷新開源紀(jì)錄;代碼能力測試中,千問3 LiveCodeBench得分突破70分,超越Grok3;人類偏好對齊測評里,ArenaHard 95.6分的成績更是超越OpenAI-o1及DeepSeek-R1。
為了適配不同場景需求,千問3同步開源了8款不同規(guī)模的模型版本,包括0.6B、1.7B、4B、8B、14B、32B密集模型,以及30B-A3B、235B-A22B兩款MoE大模型,每款模型均斬獲同尺寸開源模型SOTA(最佳性能),并在多任務(wù)處理、系統(tǒng)集成與模型壓縮等方面做了針對性優(yōu)化,使得開發(fā)者與企業(yè)用戶可以根據(jù)資源條件靈活選擇,快速落地各類創(chuàng)新應(yīng)用。
以上所有千問3模型都是混合推理模型。經(jīng)「甲子光年」實(shí)測,用戶可按需設(shè)置“思考預(yù)算”(即預(yù)期最大深度思考的tokens數(shù)量),進(jìn)行不同程度的思考,靈活滿足AI應(yīng)用和不同場景對性能和成本的多樣需求。
這一布局,為AI從“能用”到“好用”的過程提供了關(guān)鍵支撐——模型不僅要算得準(zhǔn),還應(yīng)以更低的成本部署到更多真實(shí)場景之中。
2.產(chǎn)業(yè)智能化,從千問3開始
技術(shù)創(chuàng)新的終極目標(biāo)是服務(wù)產(chǎn)業(yè)。當(dāng)千問3以突破性的架構(gòu)刷新開源模型性能天花板后,其多版本、低成本的特性,也將成為撬動(dòng)各行業(yè)智能化轉(zhuǎn)型的支點(diǎn)。
具體來看,千問3的不同版本將分別適配于不同場景,尤其對手機(jī)、智能眼鏡、智能駕駛、人形機(jī)器人等智能設(shè)備和場景的部署更為友好。
- 小型模型(0.6B/1.7B):適合學(xué)術(shù)探索與輕量級移動(dòng)應(yīng)用;
- 中型模型(4B/8B):適配筆記本電腦、車載系統(tǒng)等端側(cè)部署;
- 大型模型(14B/32B):服務(wù)于企業(yè)級部署與高性能推理任務(wù);
- MoE模型(30B-A3B/235B-A22B):面向云端服務(wù)與大型本地部署,兼顧極致性能與極高推理效率。
此外,傳統(tǒng)印象中,頂級大模型部署動(dòng)輒需要上千萬元的硬件投入,而千問3打破了這一魔咒。
以其最大規(guī)模的235B-A22B模型為例,在典型部署環(huán)境下,僅需4張H20顯卡即可滿血運(yùn)行,整體部署成本僅為同期滿血版DeepSeek-R1的25%至35%。
簡而言之,幾十萬元的預(yù)算,就可以擁有全球最強(qiáng)開源大模型的推理與服務(wù)能力。
在成本控制上,千問3的API“思考預(yù)算” 設(shè)置堪稱點(diǎn)睛之筆。開發(fā)者可根據(jù)任務(wù)復(fù)雜度動(dòng)態(tài)調(diào)整推理深度,在性能與成本間自由權(quán)衡。結(jié)合MoE架構(gòu)的低部署成本,即使中小企業(yè)也能以較低門檻接入頂尖AI能力,加速行業(yè)智能化轉(zhuǎn)型。
云中江樹對「甲子光年」表示,相比DeepSeek、Llama模型來說,千問3具有更豐富的譜系選擇,能夠更好的支持全場景的落地應(yīng)用需求。
同時(shí),千問3所有模型均在Apache2.0許可下開源,是非常寬松的開源協(xié)議,不但允許商業(yè)使用,還允許修改和分發(fā)代碼,不需要分享修改后的源代碼。并且Apache 2.0的法律全面性、專利保護(hù)更好,是大型企業(yè)開源的常用選擇。
更值得關(guān)注的是,千問3原生支持MCP協(xié)議,并通過Qwen-Agent框架降低智能體開發(fā)門檻。
在BFCL評測中,Qwen3以70.8分超越Gemini2.5-Pro等模型,證明其在智能體工具調(diào)用上的領(lǐng)先優(yōu)勢。這意味著開發(fā)者可基于MCP協(xié)議,快速構(gòu)建手機(jī)助手、辦公機(jī)器人等智能體應(yīng)用,為即將爆發(fā)的Agent生態(tài)提供核心技術(shù)支撐。
MCP協(xié)議如同智能體的“通用語言”,而Qwen-Agent框架則是“翻譯器”與“工具箱”。兩者結(jié)合,使得開發(fā)者只需通過簡單配置,就能將千問3的能力快速轉(zhuǎn)化為智能客服、智能辦公等場景應(yīng)用,開發(fā)周期大幅縮短。
總結(jié)來看,千問3向產(chǎn)業(yè)提供了“人人可用、處處能跑”的全新范式,必將推動(dòng)AI真正走出技術(shù)象牙塔,奔赴產(chǎn)業(yè)最前線。
3.3800億元豪賭:AI重估阿里云
技術(shù)能力之外,千問3的發(fā)布,也標(biāo)志著阿里云向全球AI中樞的戰(zhàn)略轉(zhuǎn)型全面提速。
千問3的開源,無疑是阿里通義千問開源戰(zhàn)略的又一里程碑。自2023年起,阿里已開源200余個(gè)模型,全球下載量超3億次,千問衍生模型突破10萬個(gè),超越Llama成為全球第一開源模型家族;支持119種語言的千問3,更打破語言壁壘,為缺乏自研能力的國家和地區(qū)提供了全球頂尖的AI模型能力。
時(shí)至今日,通義千問Qwen在全球下載量超過3億,在HuggingFace社區(qū)2024年全球模型下載量中千問Qwen占比超30%,穩(wěn)居第一。在2025年2月的Huggingface全球開源大模型榜單(Open LLM Leaderboard)中,排名前十的開源模型全部都是基于千問Qwen二次開發(fā)的衍生模型。
在李飛飛領(lǐng)銜的斯坦福HAI研究所發(fā)布的《2025年人工智能指數(shù)報(bào)告》顯示,2024年重要大模型(Notable Models)中,阿里入選6個(gè),按照模型貢獻(xiàn)度排名,阿里AI貢獻(xiàn)位列全球第三。
「甲子光年」觀察到,全球AI產(chǎn)業(yè)已從單點(diǎn)突破、封閉競爭,轉(zhuǎn)向開放協(xié)作、平臺化競爭。開源大模型成為構(gòu)建開放生態(tài)、搶占行業(yè)標(biāo)準(zhǔn)制高點(diǎn)的關(guān)鍵。千問3以其領(lǐng)先的性能、完善的產(chǎn)品線和極致的成本優(yōu)勢,為阿里巴巴在AI生態(tài)系統(tǒng)建設(shè)中,提供了強(qiáng)有力的技術(shù)底座。
上線開源數(shù)小時(shí)后,華為已宣布昇騰支持千問3全系列模型部署,開發(fā)者在MindSpeed和MindIE中開箱即用,實(shí)現(xiàn)千問3的0Day適配。英偉達(dá)、英特爾、聯(lián)發(fā)科、AMD等多家頭部芯片廠商已成功適配千問3,在不同硬件平臺和軟件棧上的推理效率均顯著提升,可滿足移動(dòng)終端和數(shù)據(jù)中心場景的AI推理需求。
在技術(shù)生態(tài)建設(shè)上,就在不久之前,阿里云百煉剛剛上線業(yè)界首個(gè)全生命周期MCP服務(wù),無需用戶管理資源、開發(fā)部署、工程運(yùn)維等工作,5分鐘即可快速搭建一個(gè)連接MCP服務(wù)的Agent(智能體)。中國第一AI開源社區(qū)魔搭更是上線了國內(nèi)最大的中文MCP廣場,支付寶、MiniMax等MCP服務(wù)首發(fā)魔搭。
今年2月,阿里巴巴集團(tuán)CEO吳泳銘還剛剛宣布,未來三年,阿里將投入超過3800億元,用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施。由此,阿里從算力基建,到模型研發(fā),再到應(yīng)用落地的全鏈條布局逐步清晰——不僅是要從電商巨頭向智能服務(wù)提供商邁進(jìn),更要成為全球AI技術(shù)領(lǐng)導(dǎo)者。
如今的阿里,也將憑借千問3的技術(shù)優(yōu)勢與開源生態(tài),重新定義自身價(jià)值。在AI重估浪潮下,其全球競爭力已不僅限于云計(jì)算資源,更在于通過技術(shù)創(chuàng)新驅(qū)動(dòng)產(chǎn)業(yè)升級的能力。隨著夸克、通義 APP 等業(yè)務(wù)全面接入千問3,一個(gè)以阿里云為核心的智能生態(tài)正在成型,而這或許只是阿里主導(dǎo)新一輪AI產(chǎn)業(yè)周期的起點(diǎn)。
更重要的是,人工智能將不再是少數(shù)巨頭的專屬技術(shù),而是每一位開發(fā)者、每一家企業(yè)、每一個(gè)普通用戶都能觸手可及的創(chuàng)新力量。
未來兩到三年,我們一定能見證AI原生應(yīng)用的爆發(fā)式增長,人工智能成為個(gè)人生產(chǎn)力工具的標(biāo)配,同時(shí)企業(yè)智能化加速,形成“千企千面”的智能運(yùn)營新格局。
全球AI創(chuàng)新的新一輪浪潮,正在以一種更開放、更協(xié)同的方式展開。
(封面圖和文中圖片來自通義千問)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.