小道消息一直在說,昨天深夜或者今天凌晨,阿里會(huì)發(fā)Qwen3。
然后我特意早早的睡了一兩小時(shí),凌晨1點(diǎn)起床,就為了等Qwen3發(fā)。
結(jié)果這一等,就是好幾個(gè)小時(shí)。。。
不過,功夫不負(fù)有心人。
凌晨5點(diǎn),我眼睛都睜不開的時(shí)候,終于等到了。
Qwen你賠我睡眠。。。
把報(bào)告看完,我總結(jié)一下,覺得最大的亮點(diǎn)有6個(gè):
1. 模型能力登頂全球,這個(gè)沒啥可說的,就是No.1。
2. 第一個(gè)開源的混合推理模型。
3. 8個(gè)不同尺寸的模型,幾乎覆蓋了所有場(chǎng)景。
4. 成本很低, 旗艦?zāi)P?35B參數(shù)部署成本只要DeepSeek R1的三分之一。
5. 支持MCP協(xié)議。
6. 居然還支持了119種語言。
一起說吧。
這次發(fā)了8個(gè)模型,Qwen3-0.6B、1.7B、4B、8B、14B、32B,這6個(gè)都是Dense稠密模型。
還有兩個(gè)重量級(jí)MoE模型,Qwen3-30B-A3B,和旗艦版的Qwen3-235B-A22B。
這次Qwen采用了新的命名方式,Qwen3-0.6B、1.7B、32B這種沒啥可說的,大家都理解。
兩個(gè)MoE模型,把激活的參數(shù)寫在后面, Qwen3-235B-A22B的意思就是235B的參數(shù),但是在推理時(shí)只激活22B。
Qwen3-30B-A3B就是總參數(shù)量為30B,激活參數(shù)3B,這個(gè)還蠻有意思的。
而且,所有的模型,都是混合推理模型。
大概的意思就是,你既可以把它當(dāng)不會(huì)長思考沒有思維鏈的普通模型用,也可以直接開啟推理模式,變成一個(gè)推理模型。
可以簡單的理解為,把DeepSeek V3和R1直接揉在了一起。
就像我們其實(shí)都知道,DeepSeek這個(gè)深度思考,你打開的時(shí)候,是R1模型,但是你關(guān)掉,其實(shí)用的是v3來給你回答。
但是Qwen3,是一體的。
是一個(gè)模型,只不過支持了兩種模式,這個(gè)不管對(duì)于開發(fā)者還是使用者,都方便很多。
整體上,8個(gè)模型,誠意足到爆炸,小到0.6B,大到235B,能打手機(jī)端側(cè),也能打旗艦體驗(yàn),全部一次性開源了,而且都是Apache 2.0協(xié)議,想怎么用就怎么用,想商用就商用,沒啥顧慮。
Qwen3-0.6B~4B的最大Token都是32K,其他的都是128K。
性能上,稍微有點(diǎn)離譜。
Qwen3-4B的小模型,就已經(jīng)能和上一代QwQ-32B這玩意打得有來有回。而Qwen3-30B-A3B,更是幾乎就比QwQ-32B全方位的強(qiáng)。
至于最牛逼的那個(gè) Qwen3-235B-A22B,他們甚至沒只跟開源模型比,比的全都是最頂級(jí)的閉源模型。
最主要的是,這玩意部署成本,大概只有DeepSeek R1的三分之一啊。。。
什么叫便宜大碗,這就是。
但是這么一對(duì)比,忽然發(fā)現(xiàn),Gemini2.5-Pro,好像有點(diǎn)猛。。。
同時(shí),在性能水桶式提升的背景下,也有了更強(qiáng)的Agent能力,也支持MCP了。
他們官方自己放了一段視頻。
我也隨手把即夢(mèng)接了進(jìn)去,可以直接用Qwen3來調(diào)用即夢(mèng)畫圖了。。。
就還真的,挺好玩,你的下一個(gè)即夢(mèng),又何必是即夢(mèng)呢(狗頭。
除了這些模型的能力,Qwen3這次還有一個(gè)很有趣的東西。
就是語言。
上一代的Qwen2.5,只支持包括 中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等 29 種語言。
而這一次,支持119種語言了。
不是,到底誰才是真正的OpenAI啊。
這妥妥是為世界人民謀福利好吧。。。
項(xiàng)目地址都在這了。
Blog: https://qwenlm.github.io/blog/qwen3/
GitHub: https://github.com/QwenLM/Qwen3
你牛逼的話可以自己部署,我5080勉強(qiáng)跑個(gè)Qwen3-8B,實(shí)在跑不起。
想體驗(yàn)的話,可以直接去通義和Qwen Chat,都可以。
通義: https://www.tongyi.com/qianwen/
Qwen Chat: https://chat.qwen.ai/
我自己直接在Qwen Chat上面實(shí)測(cè)了一波,一進(jìn)來左上角就默認(rèn)是旗艦版Qwen3。
嗯,就是比較抽象的是,提示語都居然都變成早上好,卡茲克了。。。
你可以在左上角,切換3個(gè)這次Qwen3比較有代表的模型來進(jìn)行對(duì)比。
左下角的深度思考,就能是否開啟推理的開關(guān)。
而且這個(gè)開關(guān)還能拖動(dòng)滑塊,決定它的最大思考長度,雖然這個(gè)功能很極客,但是還有意思。
我自己的實(shí)測(cè)結(jié)論就是:水桶級(jí)別,中等偏上。
比如讓它給我生成一個(gè)登錄頁。
效果很不錯(cuò),能直接干出一個(gè)很酷的界面。
https://us4mpg09fz.app.yourware.so/
或者做藏師傅搞得可交互的網(wǎng)頁,把吃瓜PDF變成在線時(shí)間線。
這時(shí)候你就會(huì)發(fā)現(xiàn),審美會(huì)差一點(diǎn),豐富度也會(huì)不是特別狗,稍微有一點(diǎn)點(diǎn)勉強(qiáng)了。
而如果再讓它寫一個(gè)之前我在文章里放的洛小山的彈球游戲的Prompt:
我會(huì)給你一個(gè)文件,分析內(nèi)容,并將其轉(zhuǎn)化為美觀漂亮的中文可視化網(wǎng)頁作品集:
## 內(nèi)容要求
- 保持原文件的核心信息,但以更易讀、可視化的方式呈現(xiàn)
- 在頁面底部添加作者信息區(qū)域,包含:
* 作者姓名: [作者姓名]
* 社交媒體鏈接: 至少包含Twitter/X:
- 版權(quán)信息和年份
## 設(shè)計(jì)風(fēng)格
- 整體風(fēng)格參考Linear App的簡約現(xiàn)代設(shè)計(jì)
- 使用清晰的視覺層次結(jié)構(gòu),突出重要內(nèi)容
- 配色方案應(yīng)專業(yè)、和諧,適合長時(shí)間閱讀
## 技術(shù)規(guī)范
- 使用HTML5、TailwindCSS 3.0+(通過CDN引入)和必要的JavaScript
- 實(shí)現(xiàn)完整的深色/淺色模式切換功能,默認(rèn)跟隨系統(tǒng)設(shè)置
- 代碼結(jié)構(gòu)清晰,包含適當(dāng)注釋,便于理解和維護(hù)
## 響應(yīng)式設(shè)計(jì)
- 頁面必須在所有設(shè)備上(手機(jī)、平板、桌面)完美展示
- 針對(duì)不同屏幕尺寸優(yōu)化布局和字體大小
- 確保移動(dòng)端有良好的觸控體驗(yàn)
## 媒體資源
- 使用文檔中的Markdown圖片鏈接(如果有的話)
- 使用文檔中的視頻嵌入代碼(如果有的話)
## 圖標(biāo)與視覺元素
- 使用專業(yè)圖標(biāo)庫如Font Awesome或Material Icons(通過CDN引入)
- 根據(jù)內(nèi)容主題選擇合適的插圖或圖表展示數(shù)據(jù)
- 避免使用emoji作為主要圖標(biāo)
## 交互體驗(yàn)
- 添加適當(dāng)?shù)奈⒔换バЧ嵘脩趔w驗(yàn):
* 按鈕懸停時(shí)有輕微放大和顏色變化
* 卡片元素懸停時(shí)有精致的陰影和邊框效果
* 頁面滾動(dòng)時(shí)有平滑過渡效果
* 內(nèi)容區(qū)塊加載時(shí)有優(yōu)雅的淡入動(dòng)畫
## 性能優(yōu)化
- 確保頁面加載速度快,避免不必要的大型資源
- 實(shí)現(xiàn)懶加載技術(shù)用于長頁面內(nèi)容
## 輸出要求
- 提供完整可運(yùn)行的單一HTML文件,包含所有必要的CSS和JavaScript
- 確保代碼符合W3C標(biāo)準(zhǔn),無錯(cuò)誤警告
- 頁面在不同瀏覽器中保持一致的外觀和功能
請(qǐng)根據(jù)上傳文件的內(nèi)容類型(文檔、數(shù)據(jù)、圖片等),創(chuàng)建最適合展示該內(nèi)容的可視化網(wǎng)頁。
確實(shí)沒有那么亮眼,在游玩的時(shí)候還有一些些BUG。
但是畢竟這個(gè)游戲還是太復(fù)雜了,人模型的尺寸也沒那么大,也沒法既要又要。
如果是做稍微簡單一點(diǎn)的連連看游戲,就還是比較簡單了。
div>,所有的游戲文字都是英文
除了代碼,邏輯問題,現(xiàn)在基本也不太能難道現(xiàn)在的推理大模型了。
不過在遇到一些非常離奇非正常的測(cè)試prompt時(shí),還是會(huì)有一點(diǎn)點(diǎn)掉智。
文筆的話,親測(cè)會(huì)比DeepSeek好一些。
但是略遜于GPT-4o。
如果你還想玩一點(diǎn)花活,還能跟即夢(mèng)打通做結(jié)合。
就能實(shí)現(xiàn)類似于那種原生多模態(tài)模型,圖文混排的效果。
還是超級(jí)有意思的。
總之,這次Qwen3的發(fā)布,真的有點(diǎn)像是深夜街頭,突然亮起的那盞霓虹燈。
不僅亮,還便宜。
不僅便宜,還能庫庫的切換顏色。
這一波下來,阿里確實(shí)是拿出了一種很阿里的態(tài)度。
8點(diǎn)了,天也亮了。
該去睡覺了。
最后。
Qwen3,歡迎來到這個(gè)荒誕又燦爛的時(shí)代。
咱們,下個(gè)奇點(diǎn)見。
以上,既然看到這里了,如果覺得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克、dongyi
>/ 投稿或爆料,請(qǐng)聯(lián)系郵箱:wzglyay@virxact.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.