99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<blockquote id="bkk8g"><i id="bkk8g"><video id="bkk8g"></video></i></blockquote>

<nobr id="bkk8g"><code id="bkk8g"><nav id="bkk8g"></nav></code></nobr>

<meter id="bkk8g"><span id="bkk8g"></span></meter>

<kbd id="bkk8g"><option id="bkk8g"></option></kbd>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

阿里Qwen3問鼎開源王座！8款模型全面開放，最大杯全方位超越R1

2025-04-29 16:15:50　來源: 量子位

北京舉報

0

分享至

明敏發自凹非寺
量子位 | 公眾號 QbitAI

千呼萬喚，Qwen3終于來了！

一口氣上新8大模型，通通開源。

旗艦模型Qwen3-235B-A22B全方位超越R1、o1、o3-mini，最大杯稠密模型也以32B參數量達到了可觀水平。

小尺寸模型的表現也同樣亮眼，Qwen3-4B在數學、代碼能力上“以小博大”，和比自身大10倍模型水平相當。

本系列一共包括2個MoE模型和6個稠密模型。

小MoE模型Qwen3-30B-A3B
MoE模型Qwen3-235B-A22B

Qwen3-32B
Qwen3-14B
Qwen3-8B
Qwen3-4B
Qwen3-1.7B
Qwen3-0.6B

它們均在Apache 2.0許可下開源。

經過后訓練的模型，例如Qwen3-30B-A3B，以及它們的預訓練基座模型（如 Qwen3-30B-A3B-Base），現已在 Hugging Face、ModelScope和Kaggle等平臺上開放使用。

對于部署，Qwen團隊推薦使用SGLang和vLLM等框架；而對于本地使用，則推薦Ollama、LMStudio、MLX、llama.cpp和KTransformers等。

網友：讓開源再次偉大！

現在，在Qwen Chat（網頁版）和通義APP中均能試用Qwen3。

值得一提的是，Qwen3還增強了對MCP的支持，具備更強的與環境交互的能力。

輕松破解7米甘蔗過2米門

Qwen3系列的亮點包括代碼、數學能力，并提出了思考/非思考模式切換，提供更具性價比的模型體驗。

思考模式下，模型會逐步推理；非思考模式提供更快速、近乎即時的響應。

比如“7米長的甘蔗如何通過2米高1米寬的門？” 的問題，Qwen3-235B-A22B知道可以通過傾斜一定角度讓甘蔗過門。

非思考模式等待了2秒左右即開始作答，思考模式則消耗了38912個token進行逐步推理。

36萬億token預訓練

所以Qwen3如何而來？

首先在數據上，Qwen3預訓練使用的數據約是Qwen2.5的2倍，達到36萬億token，涵蓋119種語言和方言。

并使用Qwen2.5處理數據。用Qwen2.5-VL提取PDF中的文本，在用Qwen2.5改進質量。數學和代碼方面，則利用Qwen2.5-Math和Qwen2.5-Coder來合成包括教科書、問答對以及代碼片段等多種形式的數據。

其次在預訓練方面，共分為3個階段。

在第一階段（S1），模型在超過30萬億個 token 上進行了預訓練，上下文長度為4Ktoken。這一階段為模型提供了基本的語言技能和通用知識。

在第二階段（S2），通過增加知識密集型數據（如 STEM、編程和推理任務）的比例來改進數據集，隨后模型又在額外的5萬億個 token 上進行了預訓練。

在最后階段，使用高質量的長上下文數據將上下文長度擴展到 32K token，確保模型能夠有效地處理更長的輸入。

由于模型架構的改進、訓練數據的增加以及更有效的訓練方法，Qwen3 Dense基礎模型的整體性能與參數更多的Qwen2.5基礎模型相當。

例如，Qwen3-1.7B/4B/8B/14B/32B-Base分別與 Qwen2.5-3B/7B/14B/32B/72B-Base表現相當。特別是在 STEM、編碼和推理等領域，Qwen3 Dense基礎模型的表現甚至超過了更大規模的Qwen2.5模型。

對于Qwen3 MoE基礎模型，它們在僅使用10%激活參數的情況下達到了與 Qwen2.5 Dense 基礎模型相似的性能。這帶來了訓練和推理成本的顯著節省。

最后在后訓練方面。共分為4個階段：

（1）長思維鏈冷啟動
（2）長思維鏈強化學習
（3）思維模式融合
（4）通用強化學習

第一階段使用長思維鏈數據對模型進行微調，涵蓋了數學、代碼、邏輯推理和 STEM 問題等多種任務和領域，增強模型基本推理能力。

第二階段進行大規模強化學習，利用基于規則的獎勵來增強模型的探索和鉆研能力。

第三階段在一份包括長思維鏈數據和常用的指令微調數據的組合數據上對模型進行微調，將非思考模式整合到思考模型中。

第四階段則在包括指令遵循、格式遵循和 Agent 能力等在內的 20 多個通用領域的任務上應用了強化學習，以進一步增強模型的通用能力并糾正不良行為。

在博客中，Qwen團隊表示，Qwen3的發布和開源將極大地推動大型基礎模型的研究與開發。

我們的目標是為全球的研究人員、開發者和組織賦能，幫助他們利用這些前沿模型構建創新解決方案。

更多細節可查看：

[1]Blog: https://qwenlm.github.io/blog/qwen3/

[2]GitHub: https://github.com/QwenLM/Qwen3

[3]Hugging Face: https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f

[4]ModelScope: https://modelscope.cn/collections/Qwen3-9743180bdc6b48

體驗方式：

https://chat.qwen.ai/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

別再卷數據了，LLM也怕「過勞死」！CMU等揭秘災難性過度訓練

新智元 2025-05-03 13:06:33
10 跟貼 10
ACI.dev能一站直連600+工具，讓你的智能體秒變全能王！

機器之心Pro 2025-04-30 17:13:00
20 跟貼 20

Deadline 前還在熬夜做圖表，DeepSeek + AI 指令上線，復雜圖表即可一鍵生成

生物學霸 2025-03-30 17:36:28
0 跟貼 0

差分注意力機制引領變革，DIFF Transformer攻克長序列建模難題

機器之心Pro 2025-04-29 11:03:19
6 跟貼 6
Claude網頁版接入MCP！10款應用一鍵調用,開發者30分鐘創建新集成

量子位 2025-05-02 18:18:26
4 跟貼 4

熟能生巧提算力，一二三年級數學口算題卡開啟智慧計算之門

星云漫步 2025-05-03 19:45:34
0 跟貼 0

科學家將R1技術遷移到多模態領域，只需10條數據就能提升模型性能

DeepTech深科技 2025-03-05 18:08:03
6 跟貼 6
只要9美元！LoRA+強化學習，DeepSeek 1.5B推理性能暴漲20%

新智元 2025-05-02 12:59:06
12 跟貼 12

老師提問數學題，學生一秒答出，關鍵是還正確！

瘋女愛搞笑 2025-05-02 15:06:04
2 跟貼 2
拿著數學課本學英語，這頓打是少不了了

花田追劇 2025-05-04 03:37:00
0 跟貼 0
MIT開發新方法，無需從頭訓練機器人即可執行復雜任務

DeepTech深科技 2024-11-05 18:05:35
0 跟貼 0
奧數思維破常規，舉一反三通萬象，五年級數學步步登高

星云漫步 2025-05-03 10:52:24
0 跟貼 0
世界模型在機器人任務規劃中的全新范式：通用機器人規劃模型FLIP

機器之心Pro 2025-03-19 14:50:58
0 跟貼 0
1000多個智能體組成，AI社會模擬器MATRIX-Gen助力大模型自我進化

機器之心Pro 2024-11-14 17:08:05
0 跟貼 0
又一開源AI神器！將機器學習論文自動轉為可運行代碼庫

量子位 2025-05-01 11:42:03
14 跟貼 14
小學數學課外拓展-5年級-第35講一半模型（1）

維七的教育分享圈 2025-05-03 19:43:53
4 跟貼 4
數學易錯題，結果等于0，可以么？

三樂大掌柜 2025-04-30 14:18:44
1 跟貼 1
多做數學題目，就會很快樂嗎？

公考客棧店小二 2025-05-02 23:44:43
0 跟貼 0
男生數學差兩分就滿分了，在課間偷偷抹淚沒有一個同學安慰他

重慶焦點 2025-05-01 13:39:13
10 跟貼 10
壓根就不想做題目呀！看到數學頭就大了，怎么辦

公考客棧店小二 2025-05-02 23:39:58
1 跟貼 1
今天咱們來聊聊，孩子必須要上高中嗎？

玉辭心 2025-05-04 09:07:57
0 跟貼 0
一套神奇的思維書，讓娃玩到停不下來，沒想到學習能這么簡單

丁香媽媽 2025-04-29 21:39:29
0 跟貼 0
丘成桐：父親的哲學課——從古文到數學

尚曦讀史 2025-05-04 08:18:32
9 跟貼 9
數學強化訓練，有點難度，你能使用什么方法？

三樂大掌柜 2025-05-01 21:33:59
1 跟貼 1
兩個信封，一個選擇，看穿它的人不超過1%

質子教授 2025-05-02 21:15:50
11 跟貼 11
寶媽分享小寶剛學完數學的狀態，“你的學習生涯才剛開始”，網友：無論什么年齡段學數學都一樣

重慶熱點 2025-04-29 19:35:00
0 跟貼 0
媽媽不信兒子數學16分“沒救”，親自上陣輔導，10分鐘后徹底破防！

青島文藝廣播 2025-05-01 22:15:36
0 跟貼 0
高中三年整理出來的數學學習方法

一頭被數學拱了的豬 2025-05-03 21:54:55
0 跟貼 0
任勇：努力用“數學磚瓦”筑起思維“游樂場”

中國教育新聞網 2025-04-30 19:41:12
0 跟貼 0
三思后行勤思辨，數學思維啟智泉

星云漫步 2025-05-03 05:43:20
0 跟貼 0
考研數學難不難

星云漫步 2025-05-02 22:17:19
0 跟貼 0
#阿Sa數學是我的天敵##奔跑吧# 碰上數學

浙江衛視 2025-05-02 19:26:30
0 跟貼 0
媽媽教兒子數學，結果萬萬沒想到，論寓教于樂的重要性！

爆笑汪汪隊 2025-05-03 14:19:53
1 跟貼 1
巧思妙想 “題”升思維

陜西素質教育月刊 2025-05-04 09:57:36
0 跟貼 0
數學書里學英語真有你的

番茄追劇君 2025-05-02 19:00:00
1 跟貼 1
男人帶著一個布加迪汽車模型，來到當鋪就要賣500萬美刀，紀錄片

新鮮尋寶 2025-05-02 20:02:53
39 跟貼 39
豆瓣9.5黑暗童話巔峰作！推理迷苦等6年!

賣書狂魔熊貓君 2025-05-02 18:35:15
6 跟貼 6
題海無涯巧作舟，斗半匠易錯應用題助力數學思維步步高

星云漫步 2025-05-03 20:37:27
0 跟貼 0
“不跪”背后的數學博弈！強者邏輯，弱者困境

本末倒置也 2025-05-03 19:58:25
0 跟貼 0
數學建模是干什么的

星云漫步 2025-05-02 22:59:29
0 跟貼 0

9個月之后，陳雨菲決賽再戰安洗瑩，沒法打了

9個月之后，陳雨菲決賽再戰安洗瑩，沒法打了

真理是我親戚

2025-03-09 21:25:10

衣服脫下來只能扔沙發？看了鄰居家的做法后，真被狠狠上了一課

衣服脫下來只能扔沙發？看了鄰居家的做法后，真被狠狠上了一課

裝小宅

2025-05-02 10:29:40

終破魔咒，約基奇生涯首次淘汰常規賽50+勝場球隊，此前5戰0勝

終破魔咒，約基奇生涯首次淘汰常規賽50+勝場球隊，此前5戰0勝

懂球帝

2025-05-04 10:26:38

現在國內外貿行業達成了一個三不做的共識

現在國內外貿行業達成了一個三不做的共識

清暉有墨

2025-05-02 18:56:44

中國正式向美國開炮：新冠是美國制造傳播，必須給全世界一個交代

中國正式向美國開炮：新冠是美國制造傳播，必須給全世界一個交代

近史談

2025-05-03 18:27:31

“燒屏機”在閑魚泛濫成災，價格賊便宜，到底能不能買？

“燒屏機”在閑魚泛濫成災，價格賊便宜，到底能不能買？

金科技觀察家

2025-05-03 17:10:08

烏軍無人艇首次擊落俄軍蘇30戰機！新羅西斯克進入緊急狀態

烏軍無人艇首次擊落俄軍蘇30戰機！新羅西斯克進入緊急狀態

項鵬飛

2025-05-03 19:46:21

我國性教育為啥無法普及？網友：我表弟九歲就有欲望了，親身經歷

我國性教育為啥無法普及？網友：我表弟九歲就有欲望了，親身經歷

娛樂圈人物大賞

2025-05-04 01:07:43

中國“最干凈”的6個城市，一塵不染，太羨慕住在這里的人了

中國“最干凈”的6個城市，一塵不染，太羨慕住在這里的人了

戶外釣魚哥阿勇

2025-05-03 05:40:54

女航天員王浩澤上天以后，臉型發生了變化，你知道是什么原因嗎

女航天員王浩澤上天以后，臉型發生了變化，你知道是什么原因嗎

林子說事

2025-05-04 06:29:21

以色列山火背后的國際孤立鏡像：“失道者寡助”照進現實

以色列山火背后的國際孤立鏡像：“失道者寡助”照進現實

文學故事家

2025-05-03 21:54:49

是你嗎？巴菲特認為中產階級最不應買的五樣東西

是你嗎？巴菲特認為中產階級最不應買的五樣東西

華人生活網

2025-04-19 04:25:00

你對爸媽虛報價格最多的一次是多少？網友：160萬的馬我說幾千塊

你對爸媽虛報價格最多的一次是多少？網友：160萬的馬我說幾千塊

娛樂圈人物大賞

2025-05-02 00:10:10

山東大學生泰山陪爬月入5位數！五一咨詢量是平時兩倍：已成立工作室，畢業后專職陪爬

山東大學生泰山陪爬月入5位數！五一咨詢量是平時兩倍：已成立工作室，畢業后專職陪爬

瀟湘晨報

2025-05-03 16:56:08

瓦倫西亞3-2，連續9輪西甲不敗，25歲皇馬舊將無敵雙響炮

瓦倫西亞3-2，連續9輪西甲不敗，25歲皇馬舊將無敵雙響炮

側身凌空斬

2025-05-04 02:40:24

報效祖國建功西部丨從“象牙白塔”到“西部熱土”——西部計劃志愿者畫像

報效祖國建功西部丨從“象牙白塔”到“西部熱土”——西部計劃志愿者畫像

北青網-北京青年報

2025-05-03 17:07:02

浙大副校長：貪污1.3億、入獄3年，為何出獄后獲得國家支持2758萬

浙大副校長：貪污1.3億、入獄3年，為何出獄后獲得國家支持2758萬

北緯的咖啡豆

2025-05-03 08:00:13

澤連斯基：自上個月與特朗普在梵蒂岡會晤，特朗普的觀點已開始轉變

澤連斯基：自上個月與特朗普在梵蒂岡會晤，特朗普的觀點已開始轉變

環球網資訊

2025-05-03 23:28:36

英超最新積分戰報：阿森納爆冷，爭五格局白熱化，3隊同積60分

英超最新積分戰報：阿森納爆冷，爭五格局白熱化，3隊同積60分

足球狗說

2025-05-04 06:03:41

軍訓前我爸千叮萬囑別透露身份,當我被同學針對時,他帶警衛連出現

軍訓前我爸千叮萬囑別透露身份,當我被同學針對時,他帶警衛連出現

紅豆講堂

2025-05-03 08:30:09

追蹤人工智能動態

10422文章數 176129關注度

往期回顧全部

科技要聞

新勢力車企，誰領先？誰危險?

頭條要聞

牛彈琴：武契奇被公開警告后突然發病或不參加俄閱兵

頭條要聞

牛彈琴：武契奇被公開警告后突然發病或不參加俄閱兵

體育要聞

北京請神馬布里？許利民真有“玄學”！

娛樂要聞

55歲王菲跟“李亞鵬時期”完全不同！

財經要聞

一個時代的結束！巴菲特年底將卸任

汽車要聞

小米SU7大優惠！5月限時購車權益送輔助駕駛

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

親子

數碼

公開課

軍事航空

家居要聞

意式輕奢低飽和質感美學

輕奢婚房自由隨性生活
雅奢氛圍營造品質生活
慢度設計溫暖與沉靜的體驗

親子要聞

一個透氣能水洗、高度可調的「神奇枕頭」，很多人沒給娃用過

數碼要聞

你可以相信Intel獨立顯卡！第三代Xe3已進入預驗證

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
全球十大恐怖禁區有哪些？
李彥宏：百度離破產30天

軍事要聞

媒體：美俄兩場閱兵都有新看頭

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：英吉沙县| 织金县| 长兴县| 九龙坡区| 玉龙| 大埔区| 图片| 屏南县| 汶上县| 宜章县| 汕尾市| 桐梓县| 延安市| 永川市| 沈丘县| 芜湖县| 柳林县| 马公市| 宝鸡市| 自贡市| 子洲县| 柞水县| 永康市| 亚东县| 衡东县| 金华市| 凤冈县| 佳木斯市| 宁河县| 清镇市| 武穴市| 开鲁县| 甘洛县| 宝应县| 留坝县| 东乌珠穆沁旗| 襄城县| 津南区| 宜兴市| 广河县| 崇阳县|

<cite id="k2xj8"></cite>

<sub id="k2xj8"></sub>