網易首頁 > 網易號 > 正文申請入駐

搶先DeepSeek R2，阿里通義正式發布國內首個通用推理模型 | 電廠

2025-04-29 22:37:41　來源: 電廠

上海舉報

分享至

記者董溫淑

編輯高宇雷

Qwen 3模型即將發布的消息，已經流傳了一個月的時間；特別是最近一周內，坊間對Qwen 3的猜測不斷在“憋個大的”與“最終難產”之間反復橫跳。

直到4月29日凌晨，這款備受關注的模型終于亮相，號稱全面超越DeepSeek R1。

杭州一家中廠的算法從業者告訴「電廠」：“近幾個月網上不少DeepSeek R2的泄露信息，有人說R2要在5月份發。Qwen 3（這個時間發布）肯定是想搶個先機。”

在一家國產大模型開放平臺工作的劉露則透露，其所在的團隊提前不到12小時獲知Qwen3的發布消息，團隊成員連夜完成了Qwen 3系列模型在該平臺的部署上線。

無論如何，Qwen 3的亮相都意味著開源AI大模型的技術能力再次被刷新；與之相繼的，將是產業鏈下游應用者迎來一次新的生態選擇。

「電廠」注意到，Qwen 3發布僅10小時，已經有開發者發布了套殼Qwen 3系列模型的ChatBot類產品。

基于Qwen 3的第三方ChatBot類產品，圖源/網絡 ?

國內首個混合推理模型，成本/性能超越DeepSeek R1

根據阿里云通義千問團隊官宣，Qwen3系列開源了8個模型，其中包含2個MoE（混合專家）大模型和6個Dense（稠密）大模型。

本次Qwen3系列模型尤為值得關注的創新是該模型支持思考模式、非思考模式兩種運行方式。

在思考模式下，模型會逐步推理，經過深思熟慮后給出最終答案。這種方法適合需要深入思考的復雜問題；在非思考模式中，模型會提供快速、近乎即時的響應，適用于對速度要求高于深度的簡單問題。

換句話說，Qwen3打破了DeepSeek R1等思維鏈模型慢思考的單一模式，而是為用戶賦予靈活選擇的權利。這也是如今全球大模型市場發展的重要方向之一。

不同Benchmark下Qwen3兩種思考模式對比，圖源/阿里云通義 ?

今年2月份，由部分OpenAI前員工創辦的Anthropic在全球范圍內率先發布了名為Claude 3.7 Sonnet的混合推理模型，被視為融合了DeepSeek V3（適于通用任務）與R1（適于推理任務）模型的各自優勢。

這種混合模式引起了業界的廣泛關注。OpenAI創始人Sam Altman就曾表示，OpenAI接下來將研發“它能夠知道什么時候應該長時間思考，并且通常適用于廣泛任務”的模型。而Qwen3是國內首個混合推理模型。

性能及成本優化方面，Qwen3系列也表現驚人。

比如本次開源的兩個MoE模型，權重分別為Qwen3-235B-A22B，是一個擁有 2350 多億總參數和220多億激活參數的大模型；另一個為Qwen3-30B-A3B，一個擁有約300億總參數和30億激活參數的小型MoE模型。

MoE（混合專家模型）混合包含多個專家網絡，每個專家通常是一個子模型、也可以是神經網絡的一個子模塊，擁有不同的能力或專長，能夠處理不同類型的輸入數據。在運行時，不同任務會被進行分類、輸送到相應的“專家”處進行解決。

DeepSeek V3與R1都屬于MoE模型。這種架構的優勢是其能夠，并且在解決任務時僅調動與之相應的模塊、節省計算成本。這也是“AI界拼多多”DeepSeek提升性價比的殺手锏之一。作為與Qwen3的對比，DeepSeek V3與R1總參數規模為6710億參數，激活參數為370億。

性能方面，官方信息顯示，Qwen旗艦模型 Qwen3-235B-A22B 在代碼、數學、通用能力等基準測試中，與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂級模型相比，均展現出優勢。

小型MoE模型Qwen3-30B-A3B ，相比DeepSeek V3、GPT 4o、谷歌Gemma3-27B-1T等模型同樣表現優異。

六個開源的Dense模型均適用于通用任務解決，包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

值得一提的是參數量極低的Qwen3-4B模型，也在不少任務中展現出來相比GPT 4o更為優異的成績。

上述模型均在 Apache 2.0 許可下開源。這是一種較為寬松的許可證，允許代碼修改和再發布（作為開源或商業軟件）。

Qwen3模型還支持 119 種語言和方言，并優化了Agent和代碼能力、加強了對MCP的支持。

開源大模型“城頭變換大王旗”

Qwen3的發布，距離DeepSeek R1的亮相已過去了3個多月。

1月20日，憑借比肩OpenAI o1的性能、低廉的成本，以及對大模型研發范式的改變，R1一經發布就榮膺開源大模型世界的“無冕之王”至今。

在此期間，包含科大訊飛（星火X1）、百度（文心X1）、OpenAI（o3 mini）、阿里（Qwen-QwQ-32B）、字節（豆包1.5深度思考）在內的玩家紛紛下場推理模型，但至多是接近R1性能或實現部分超越，未能真正挑動后者的位置。

在大模型的世界里，數月的時間已足夠一代新王換舊王。正是這樣的背景下，關注的目光落到了Qwen3身上。

與許多國內玩家不同的是，早在2024年8月，阿里就公開站到了開源自研模型的大廠陣營之中。在這條最終被DeepSeek驗證可行的市場之路上，Qwen可以說已經提前拿到了不少牌。

至今Qwen系列產品已在不少開源榜單中排名靠前。如據全球最大AI開源社區Huggingface 4月29日顯示，在audio-text-to-text任務類目下，Qwen的兩款模型熱度居前。

Huggingface 于2月10日發布的開源大模型榜單“Open LLM Leaderboard”也顯示，排名前十的開源大模型全部是基于Qwen開源模型二次訓練的衍生模型。

圖源/Huggingface ?

在生態活躍度方面，Qwen也處于全球前列。據官方數據顯示，從2024年下半年開始至2025年1月底，基于Qwen系列的衍生模型數量超過了美國Llama系列，超過9萬個，已是全球最大的AI模型家族，超過了Meta 旗下的Llama家族。

不過對比Llama系列，Qwen系列開源模型在下載量方面與前者仍有差距。據Meta首席執行官Zuck Burg在今年3月份宣布，Llama的下載量已達到10億次；而Qwen系列的下載量還在千萬級別。

在Qwen3發布這一天，周靖人接受了“晚點”的采訪，他講道，判斷“開源生態跑出來了”的指標主要有兩點“一是看開發者的選擇，二是看性能指標”。

本次隨著Qwen3的發布，這款新模型通過在性能指標和成本方面超越DeepSeek R1，以及創新的混合推理模式，登頂為全球最強大的開源大模型，又為Qwen增添了一張好牌。

但在這之后，還有更多的挑戰等待著它。接下來DeepSeek R2的亮相，也將為整個市場增添新的變數。

在貫徹“第一通吃（winner-takes-all）”定律的開源市場，競爭遠未到達終局、誰能成為最終的“winner”還充滿未知，無論是DeepSeek，還是Qwen和Llama，都仍需要為不下牌桌而持續努力。

不過值得欣慰的是，雖然戰程未半，至少當下的開源大模型“桂冠”仍歸屬于國產玩家。

（注：文中劉露為化名）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Muon作者僅用一篇博客，就被OpenAI看中了

機器之心Pro 2025-06-16 14:27:12
0 跟貼 0
從刮胡子機器人到雙臂神技！這家具身獨角獸引爆億級美元融資熱潮

新智元 2025-06-23 13:16:27
0 跟貼 0

中科院&字節Seed BridgeVLA，斬獲CVPR 2025 workshop冠軍！

機器之心Pro 2025-06-24 10:46:46
0 跟貼 0

推理正確率下降65.5%！斯坦福、MIT等用「不等式」拷問AI邏輯極限

新智元 2025-06-23 13:17:43
3 跟貼 3
AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0

誰是開源界的杠把子？

虎嗅APP 2025-04-11 23:29:08
0 跟貼 0

垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
物流業deepseek時刻，中國無人車火爆全球

華商韜略 2025-06-17 10:58:23
0 跟貼 0

宇樹科技G1機器人展示武打動作：算法升級任意動作任意學

財聯社 2025-02-25 23:59:43
0 跟貼 0
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
報名開啟！別再一個人刷論文了，來ACL 2025分享會一起面對面交流

機器之心Pro 2025-06-24 10:22:00
0 跟貼 0
人人都能做開發者！連小學生都能輕松上手的0代碼開發平臺來了

量子位 2025-04-15 11:59:12
0 跟貼 0
佛山也要AI：從“制造之都”邁向“AI 新‘質’造之都”

量子位 2025-06-24 11:22:36
0 跟貼 0
超算互聯網上線開源AI社區！模型+數據+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
統一框架下的具身多模態推理

機器之心Pro 2025-06-18 14:49:46
0 跟貼 0
螞蟻開源輕量級推理模型Ring-lite，多項Benchmark達到SOTA

量子位 2025-06-23 21:18:50
2 跟貼 2
監控拍下的驚險一幕，女子家煤氣罐泄露，隨后發生的事令人后怕！

禾陌紀實 2025-06-23 14:54:42
673 跟貼 673
馬斯克的“大女兒”，這根兒斷得真徹底

感恩每日相伴 2025-06-20 03:54:48
0 跟貼 0
對話開源中國馬越：DeepSeek不是國運級的創新，年輕人才是

36氪 2025-03-13 18:14:13
20 跟貼 20
螞蟻聯手阿里，能幫普通人理財的AI來了

每日經濟新聞 2025-06-23 13:19:09
5 跟貼 5
無損減少80%激活值內存，提升5倍訓練序列長度，僅需兩行代碼

機器之心Pro 2025-06-23 15:55:45
0 跟貼 0
阿里深夜開源Qwen2.5-Omni，7B參數完看、聽、說、寫

機器之心Pro 2025-03-27 10:36:47
0 跟貼 0
揭秘詐騙電話，大家定要仔細辨別，謹防上當

驢驢老baby 2025-06-24 07:14:33
0 跟貼 0
道具模型太貴怎么辦，導演直接整上真家伙

影帝俠 2025-06-21 13:03:31
257 跟貼 257
AI理解語言的終極密碼，千問3向量模型開源，性能超谷歌OpenAI

機器之心Pro 2025-06-11 19:17:56
0 跟貼 0
寶馬與阿里巴巴達成AI領域戰略合作

每日經濟新聞 2025-03-26 11:59:03
1 跟貼 1
中國電商App霸榜前三，阿里國際站席卷海外百國榜單

每日經濟新聞 2025-04-20 22:08:02
0 跟貼 0
我用DeepSeek自定義函數，同事人都看傻了！

秋葉excel 2025-06-23 11:34:11
0 跟貼 0
繼推出高考大模型后，夸克又把專家送到村口

DoNews 2025-06-23 17:57:32
0 跟貼 0
字節跳動通報：豆包大模型團隊前員工嚴重違反制度，已辭退并全額扣發年終獎

澎湃新聞 2025-06-24 07:18:27
0 跟貼 0
卡塔爾宣布暫停境內所有空中交通

界面新聞 2025-06-23 23:58:17
2316 跟貼 2316
阿姨因燒飯把騙子晾一邊保住166萬元，詐騙與反詐的較量

藝飛說 2025-06-23 21:15:21
0 跟貼 0
不閱讀的人，他的三觀是由親朋好友加算法決定的

財經網科技 2025-06-22 16:31:25
0 跟貼 0
街頭騙局揭秘：為什么你猜不對瓜子數量？原來這么簡單

魔術師曉東 2025-06-19 19:55:34
3 跟貼 3
“殺豬盤”詐騙 “警”急來止付

河南都市頻道 2025-06-22 15:32:06
0 跟貼 0
女子操作不當致煤氣泄露卻沒有第一時間關閉閥門下一秒危險瞬間襲來

德陽看點 2025-06-23 18:25:46
0 跟貼 0
寶馬新世代iX3即將發布！全新內外飾設計，上車鴻蒙系統+Deepseek

車東西 2025-06-23 21:57:54
8 跟貼 8
需要注意還有哪些事沒交代清楚，比如銀行密碼，家產分配遺囑啥的

歡樂聚集部 2025-06-23 11:02:12
1 跟貼 1
構筑網絡空間精神高地

延安發布 2025-06-24 09:12:24
0 跟貼 0
算法時代我們都在被「傻子共振」套路？

小趙隨便聊 2025-06-23 19:30:39
0 跟貼 0

電廠

探索科技公司的未知，為你充電

1656文章數 1042關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

親子

本地

公開課

軍事航空

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
指紋識別有可能認錯人嗎？
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

搶先DeepSeek R2，阿里通義正式發布國內首個通用推理模型 | 電廠

特斯拉股價飆漲8%，但Robotaxi小違章不斷

以伊停火最新進展：伊朗已認可方案 以色列先同意停火

以伊停火最新進展：伊朗已認可方案 以色列先同意停火

如果你喜歡籃球，你沒理由不喜歡步行者

名校不是護身符，李雪琴更多黑料被扒

以色列和伊朗同意全面停火！

漢DM-i同款外觀，新款比亞迪e9申報圖曝光

態度原創

呼吸科專家破解呼吸道九大謠言！

孩子：無恥 你征信沒問題嗎？

被貴妃帶火的“唐代頂流”，如今怎么不火了

特朗普：以伊完全同意全面停火

以伊停火最新進展：伊朗已認可方案以色列先同意停火

以伊停火最新進展：伊朗已認可方案以色列先同意停火

孩子：無恥你征信沒問題嗎？