網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Qwen3深夜正式開源，小尺寸也能大力出奇跡。

2025-04-29 08:11:26　來源: 數(shù)字生命卡茲克

天津舉報(bào)

分享至

小道消息一直在說，昨天深夜或者今天凌晨，阿里會(huì)發(fā)Qwen3。

然后我特意早早的睡了一兩小時(shí)，凌晨1點(diǎn)起床，就為了等Qwen3發(fā)。

結(jié)果這一等，就是好幾個(gè)小時(shí)。。。

不過，功夫不負(fù)有心人。

凌晨5點(diǎn)，我眼睛都睜不開的時(shí)候，終于等到了。

Qwen你賠我睡眠。。。

把報(bào)告看完，我總結(jié)一下，覺得最大的亮點(diǎn)有6個(gè)：

1. 模型能力登頂全球，這個(gè)沒啥可說的，就是No.1。

2. 第一個(gè)開源的混合推理模型。

3. 8個(gè)不同尺寸的模型，幾乎覆蓋了所有場(chǎng)景。

4. 成本很低， 旗艦?zāi)Ｐ?35B參數(shù)部署成本只要DeepSeek R1的三分之一。

5. 支持MCP協(xié)議。

6. 居然還支持了119種語言。

一起說吧。

這次發(fā)了8個(gè)模型，Qwen3-0.6B、1.7B、4B、8B、14B、32B，這6個(gè)都是Dense稠密模型。

還有兩個(gè)重量級(jí)MoE模型，Qwen3-30B-A3B，和旗艦版的Qwen3-235B-A22B。

這次Qwen采用了新的命名方式，Qwen3-0.6B、1.7B、32B這種沒啥可說的，大家都理解。

兩個(gè)MoE模型，把激活的參數(shù)寫在后面， Qwen3-235B-A22B的意思就是235B的參數(shù)，但是在推理時(shí)只激活22B。

Qwen3-30B-A3B就是總參數(shù)量為30B，激活參數(shù)3B，這個(gè)還蠻有意思的。

而且，所有的模型，都是混合推理模型。

大概的意思就是，你既可以把它當(dāng)不會(huì)長思考沒有思維鏈的普通模型用，也可以直接開啟推理模式，變成一個(gè)推理模型。

可以簡單的理解為，把DeepSeek V3和R1直接揉在了一起。

就像我們其實(shí)都知道，DeepSeek這個(gè)深度思考，你打開的時(shí)候，是R1模型，但是你關(guān)掉，其實(shí)用的是v3來給你回答。

但是Qwen3，是一體的。

是一個(gè)模型，只不過支持了兩種模式，這個(gè)不管對(duì)于開發(fā)者還是使用者，都方便很多。

整體上，8個(gè)模型，誠意足到爆炸，小到0.6B，大到235B，能打手機(jī)端側(cè)，也能打旗艦體驗(yàn)，全部一次性開源了，而且都是Apache 2.0協(xié)議，想怎么用就怎么用，想商用就商用，沒啥顧慮。

Qwen3-0.6B~4B的最大Token都是32K，其他的都是128K。

性能上，稍微有點(diǎn)離譜。

Qwen3-4B的小模型，就已經(jīng)能和上一代QwQ-32B這玩意打得有來有回。而Qwen3-30B-A3B，更是幾乎就比QwQ-32B全方位的強(qiáng)。

至于最牛逼的那個(gè) Qwen3-235B-A22B，他們甚至沒只跟開源模型比，比的全都是最頂級(jí)的閉源模型。

最主要的是，這玩意部署成本，大概只有DeepSeek R1的三分之一啊。。。

什么叫便宜大碗，這就是。

但是這么一對(duì)比，忽然發(fā)現(xiàn)，Gemini2.5-Pro，好像有點(diǎn)猛。。。

同時(shí)，在性能水桶式提升的背景下，也有了更強(qiáng)的Agent能力，也支持MCP了。

他們官方自己放了一段視頻。

我也隨手把即夢(mèng)接了進(jìn)去，可以直接用Qwen3來調(diào)用即夢(mèng)畫圖了。。。

就還真的，挺好玩，你的下一個(gè)即夢(mèng)，又何必是即夢(mèng)呢（狗頭。

除了這些模型的能力，Qwen3這次還有一個(gè)很有趣的東西。

就是語言。

上一代的Qwen2.5，只支持包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等 29 種語言。

而這一次，支持119種語言了。

不是，到底誰才是真正的OpenAI啊。

這妥妥是為世界人民謀福利好吧。。。

項(xiàng)目地址都在這了。

Blog: https://qwenlm.github.io/blog/qwen3/

GitHub: https://github.com/QwenLM/Qwen3

你牛逼的話可以自己部署，我5080勉強(qiáng)跑個(gè)Qwen3-8B，實(shí)在跑不起。

想體驗(yàn)的話，可以直接去通義和Qwen Chat，都可以。

通義： https://www.tongyi.com/qianwen/

Qwen Chat： https://chat.qwen.ai/

我自己直接在Qwen Chat上面實(shí)測(cè)了一波，一進(jìn)來左上角就默認(rèn)是旗艦版Qwen3。

嗯，就是比較抽象的是，提示語都居然都變成早上好，卡茲克了。。。

你可以在左上角，切換3個(gè)這次Qwen3比較有代表的模型來進(jìn)行對(duì)比。

左下角的深度思考，就能是否開啟推理的開關(guān)。

而且這個(gè)開關(guān)還能拖動(dòng)滑塊，決定它的最大思考長度，雖然這個(gè)功能很極客，但是還有意思。

我自己的實(shí)測(cè)結(jié)論就是：水桶級(jí)別，中等偏上。

比如讓它給我生成一個(gè)登錄頁。

效果很不錯(cuò)，能直接干出一個(gè)很酷的界面。

https://us4mpg09fz.app.yourware.so/

或者做藏師傅搞得可交互的網(wǎng)頁，把吃瓜PDF變成在線時(shí)間線。

這時(shí)候你就會(huì)發(fā)現(xiàn)，審美會(huì)差一點(diǎn)，豐富度也會(huì)不是特別狗，稍微有一點(diǎn)點(diǎn)勉強(qiáng)了。

而如果再讓它寫一個(gè)之前我在文章里放的洛小山的彈球游戲的Prompt：

我會(huì)給你一個(gè)文件，分析內(nèi)容，并將其轉(zhuǎn)化為美觀漂亮的中文可視化網(wǎng)頁作品集：
## 內(nèi)容要求
- 保持原文件的核心信息，但以更易讀、可視化的方式呈現(xiàn)
- 在頁面底部添加作者信息區(qū)域，包含：    
 * 作者姓名: [作者姓名]
 * 社交媒體鏈接: 至少包含Twitter/X：  
- 版權(quán)信息和年份
## 設(shè)計(jì)風(fēng)格
- 整體風(fēng)格參考Linear App的簡約現(xiàn)代設(shè)計(jì)
- 使用清晰的視覺層次結(jié)構(gòu)，突出重要內(nèi)容
- 配色方案應(yīng)專業(yè)、和諧，適合長時(shí)間閱讀
## 技術(shù)規(guī)范
- 使用HTML5、TailwindCSS 3.0+（通過CDN引入）和必要的JavaScript
- 實(shí)現(xiàn)完整的深色/淺色模式切換功能，默認(rèn)跟隨系統(tǒng)設(shè)置
- 代碼結(jié)構(gòu)清晰，包含適當(dāng)注釋，便于理解和維護(hù)
## 響應(yīng)式設(shè)計(jì)
- 頁面必須在所有設(shè)備上（手機(jī)、平板、桌面）完美展示
- 針對(duì)不同屏幕尺寸優(yōu)化布局和字體大小
- 確保移動(dòng)端有良好的觸控體驗(yàn)
## 媒體資源
- 使用文檔中的Markdown圖片鏈接（如果有的話）
- 使用文檔中的視頻嵌入代碼（如果有的話）
## 圖標(biāo)與視覺元素
- 使用專業(yè)圖標(biāo)庫如Font Awesome或Material Icons（通過CDN引入）
- 根據(jù)內(nèi)容主題選擇合適的插圖或圖表展示數(shù)據(jù)
- 避免使用emoji作為主要圖標(biāo)
## 交互體驗(yàn)
- 添加適當(dāng)?shù)奈⒔换バЧ嵘脩趔w驗(yàn)：    
 * 按鈕懸停時(shí)有輕微放大和顏色變化    
 * 卡片元素懸停時(shí)有精致的陰影和邊框效果    
 * 頁面滾動(dòng)時(shí)有平滑過渡效果    
 * 內(nèi)容區(qū)塊加載時(shí)有優(yōu)雅的淡入動(dòng)畫
## 性能優(yōu)化
- 確保頁面加載速度快，避免不必要的大型資源
- 實(shí)現(xiàn)懶加載技術(shù)用于長頁面內(nèi)容
## 輸出要求
- 提供完整可運(yùn)行的單一HTML文件，包含所有必要的CSS和JavaScript
- 確保代碼符合W3C標(biāo)準(zhǔn)，無錯(cuò)誤警告
- 頁面在不同瀏覽器中保持一致的外觀和功能
請(qǐng)根據(jù)上傳文件的內(nèi)容類型（文檔、數(shù)據(jù)、圖片等），創(chuàng)建最適合展示該內(nèi)容的可視化網(wǎng)頁。

確實(shí)沒有那么亮眼，在游玩的時(shí)候還有一些些BUG。

但是畢竟這個(gè)游戲還是太復(fù)雜了，人模型的尺寸也沒那么大，也沒法既要又要。

如果是做稍微簡單一點(diǎn)的連連看游戲，就還是比較簡單了。

             
    div>，所有的游戲文字都是英文

除了代碼，邏輯問題，現(xiàn)在基本也不太能難道現(xiàn)在的推理大模型了。

不過在遇到一些非常離奇非正常的測(cè)試prompt時(shí)，還是會(huì)有一點(diǎn)點(diǎn)掉智。

文筆的話，親測(cè)會(huì)比DeepSeek好一些。

但是略遜于GPT-4o。

如果你還想玩一點(diǎn)花活，還能跟即夢(mèng)打通做結(jié)合。

就能實(shí)現(xiàn)類似于那種原生多模態(tài)模型，圖文混排的效果。

還是超級(jí)有意思的。

總之，這次Qwen3的發(fā)布，真的有點(diǎn)像是深夜街頭，突然亮起的那盞霓虹燈。

不僅亮，還便宜。

不僅便宜，還能庫庫的切換顏色。

這一波下來，阿里確實(shí)是拿出了一種很阿里的態(tài)度。

8點(diǎn)了，天也亮了。

該去睡覺了。

最后。

Qwen3，歡迎來到這個(gè)荒誕又燦爛的時(shí)代。

咱們，下個(gè)奇點(diǎn)見。

以上，既然看到這里了，如果覺得不錯(cuò)，隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧，如果想第一時(shí)間收到推送，也可以給我個(gè)星標(biāo)?～謝謝你看我的文章，我們，下次再見。

>/ 作者：卡茲克、dongyi

>/ 投稿或爆料，請(qǐng)聯(lián)系郵箱：wzglyay@virxact.com

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.