99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Qwen3發布!超DeepSeek R1登頂開源榜,還帶來了跟R1不同配方

0
分享至

  

   作者 | summer
郵箱 | huangxiaoyi@pingwest.com

  在所有人都在猜測DeepSeek V4或者R2和Qwen3誰先到來時,Qwen3發布了。

  4月29日凌晨,阿里巴巴開源了新一代通義千問Qwen3系列模型,涵蓋8款不同尺寸。其中,旗艦模型Qwen3 235B采用混合專家(MoE)架構,總參數量235B(僅為DeepSeek-R1的1/3),激活參數僅需22B,預訓練數據量達36萬億Tokens。

  

  性能上,據官方介紹,Qwen3在多項測評中表現優異,超越DeepSeek-R1、OpenAI-o1等主流模型,成為當前性能領先的開源大語言模型。

  

  具體來看,Qwen3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強:在奧數水平的AIME25測評中,Qwen3斬獲81.5分,刷新開源紀錄;在考察代碼能力的LiveCodeBench評測中,Qwen3突破70分大關,表現甚至超過Grok3;在評估模型人類偏好對齊的ArenaHard測評中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。

  看慣了模型榜單表現上的反復超越,但這次的Qwen3還有些不同,比起單純的模型邊界突破,Qwen3更想突出的是以小博大的能力。而且它在和DeepSeek輪流推動開源模型進步的過程中,再次給開源社區提供了與R1不同的配方。

  1

  沒完全用R1的方法,但完成了對R1的超越

  和R1類似的是,Qwen3也走的是“用模型訓模型”的思路。

  在預訓練階段,Qwen3的性能優化很重要的一個來源是大量高質的合成數據。

  數量上看,Qwen3的數據集相比Qwen2.5有了顯著擴展。Qwen2.5是在 18 萬億個 token 上進行預訓練的,而 Qwen3 使用的數據量幾乎是其兩倍,達到了約 36 萬億個 token,涵蓋了 119 種語言和方言。其中一部分來自于PDF文檔提取信息,另一部分就是Qwen2.5系列模型合成的數據。

  技術報告中明確提到,“我們使用 Qwen2.5-VL 從這些文檔中提取文本,并用 Qwen2.5 改進提取內容的質量。為了增加數學和代碼數據的數量,我們利用 Qwen2.5-Math 和 Qwen2.5-Coder 這兩個數學和代碼領域的專家模型合成數據,合成了包括教科書、問答對以及代碼片段等多種形式的數據。”

  這也意味著,在預訓練的過程中,Qwen3借助自身的生態優勢,又構建了一個自我迭代提升的數據系統。

  預訓練奠定了Qwen3的基礎能力,而在此基礎上的后訓練階段則是Qwen3最為關鍵的技術創新,它通過多階段訓練方法實現了推理能力與直接回答能力的融合。

  

  以上圖為例,同一模型內實現了思考和非思考模式。在官方的應用界面來看,選擇哪種模式的方法看起來還是讓用戶自己選擇,不過在選擇了深度思考模式后,用戶多了一個設置思考預算的功能,讓模型根據問題難度動態分配。

  在后訓練上,Qwen3用了和R1整體pipeline類似的的“回鍋肉”式迭代:微調、RL、再微調,然后再更具體的RL。

  

  它和DeepSeek一樣用大模型蒸餾小模型,不過Qwen徹底是自己蒸餾自己了。

  另一個特別值得注意的是,第二階段RL,Qwen團隊采用的是基于規則的獎勵來增強模型的探索和鉆研能力。

  “第二階段的重點是大規模強化學習,利用基于規則的獎勵來增強模型的探索和鉆研能力。”官方博客寫到。這與當前被認為是DeepSeek R1等模型成功關鍵的GRPO(基于結果獎勵的優化)形成鮮明對比。Qwen3沒有完全依賴GRPO這樣基于結果的獎勵機制。

  緊接著,在第三階段的微調中,Qwen3采用了一份長思維鏈數據和常用的指令微調數據的組合數據上對模型進行微調,實現了將非思考模式整合到思考模型中,確保了推理和快速響應能力的無縫結合。

  最后,在第四階段,Qwen3在包括指令遵循、格式遵循和 Agent 能力等在內的 20 多個通用領域的任務上應用了強化學習。

  Qwen3沒有完全用R1的方法,但完成了對R1的超越。

  1

  模型全尺寸,但參數正在“變小”

  和Qwen此前的生態路線一樣,Qwen3一口氣發布了8款不同的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斬獲同尺寸開源模型SOTA(最佳性能)。

  這次的全尺寸,果然沒有讓期待已久的社區失望,歡呼聲一片。

  MLX 是專為 Apple Silicon設計的高效機器學習框架。在模型發布前,MLX的團隊就完成了對Qwen 3的支持工作。其中0.6B和4B可以應用于手機,8B、30B、30B MOE可用于電腦......

  

  尺寸全是一方面。更重要的是Qwen在不斷以更多、更小的尺寸,達到過去更大尺寸同樣的性能效果。在很多場景下,模型都具備了在端側運行的能力和水平。

  據官方博客顯示,Qwen3的30B參數MoE模型實現了10倍以上的模型性能杠桿提升,僅激活3B就能媲美上代Qwen2.5-32B模型性能;Qwen3的稠密模型性能繼續突破,一半的參數量可實現同樣的高性能,如32B版本的Qwen3模型可跨級超越Qwen2.5-72B性能。

  

  Qwen3顯然是個能讓開源界好好把玩和拆解一段時間的最熱門模型,接下來它更全面的技術報告發布后,估計會揭秘更多“獨家配方”,繼續推動開源模型的進步和創新。

  

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
克里米亞遭受最大規模攻擊!俄四大空軍基地遇襲

克里米亞遭受最大規模攻擊!俄四大空軍基地遇襲

項鵬飛
2025-05-02 20:51:34
新情況出現了,黃金和石油價格大跌,這預示著什么呢?

新情況出現了,黃金和石油價格大跌,這預示著什么呢?

流蘇晚晴
2025-05-02 20:13:53
提醒!高中沒入團,不能報這6所大學!

提醒!高中沒入團,不能報這6所大學!

京城教育圈
2025-05-02 21:37:11
悲催!封丘醫療系統清退501人,網傳一護士將評優證書丟進垃圾桶

悲催!封丘醫療系統清退501人,網傳一護士將評優證書丟進垃圾桶

火山詩話
2025-05-03 08:47:05
廣西放大招了!全國首創周末高速免費,玩兩天就回,省好幾百路費

廣西放大招了!全國首創周末高速免費,玩兩天就回,省好幾百路費

火山詩話
2025-05-03 12:52:01
中國正式發布白皮書:美國才是新冠罪魁禍首,必須給全球還個公道

中國正式發布白皮書:美國才是新冠罪魁禍首,必須給全球還個公道

麓谷隱士
2025-05-03 07:03:54
潑天流量!榮昌五一首日游客破35萬,酒店爆滿,比重慶主城還貴…

潑天流量!榮昌五一首日游客破35萬,酒店爆滿,比重慶主城還貴…

火山詩話
2025-05-03 06:32:36
尷尬,陳雨菲蘇杯2-1山口茜戰術安排失誤,靠的自我覺醒

尷尬,陳雨菲蘇杯2-1山口茜戰術安排失誤,靠的自我覺醒

真理是我親戚
2025-05-03 12:58:35
浙江“胖都來”商場開業,胖東來回應:已向對方郵寄律師函!律師:涉嫌構成商標侵權及不正當競爭

浙江“胖都來”商場開業,胖東來回應:已向對方郵寄律師函!律師:涉嫌構成商標侵權及不正當競爭

每日經濟新聞
2025-05-03 00:06:06
就在今天?31歲凱恩已進超400球 多次獲金靴但無冠 今晚圓夢在即

就在今天?31歲凱恩已進超400球 多次獲金靴但無冠 今晚圓夢在即

直播吧
2025-05-03 17:28:06
廣東黃騰峽漂流現場游客哄搶漂流船,景區:已實施限流并正常開放

廣東黃騰峽漂流現場游客哄搶漂流船,景區:已實施限流并正常開放

上游新聞
2025-05-03 16:01:18
澤連斯基發出威脅,暗示要襲擊俄閱兵式?不到24小時,俄撂下重話

澤連斯基發出威脅,暗示要襲擊俄閱兵式?不到24小時,俄撂下重話

荷蘭豆愛健康
2025-05-03 13:21:48
它是肝臟的“最愛”,睡眠不好的人要多吃,氣色好,更顯年輕!

它是肝臟的“最愛”,睡眠不好的人要多吃,氣色好,更顯年輕!

江江食研社
2025-05-02 16:30:11
五一最堵10大景點出爐!網友:第1名堵到懷疑人生,第5名直接勸退

五一最堵10大景點出爐!網友:第1名堵到懷疑人生,第5名直接勸退

一個小孩
2025-05-03 01:59:43
深度:普通民眾既看不到大事的真相,也不能影響上層的決策

深度:普通民眾既看不到大事的真相,也不能影響上層的決策

子墨君
2025-05-02 23:08:06
擁有核武器的9個國家中,最窮的巴基斯坦, 是如何獲得核武器的?

擁有核武器的9個國家中,最窮的巴基斯坦, 是如何獲得核武器的?

文史達觀
2025-05-03 06:45:05
震撼!史無前例:俄羅斯蘇30飛機被烏克蘭無人艦艇擊落!

震撼!史無前例:俄羅斯蘇30飛機被烏克蘭無人艦艇擊落!

國際情爆猿
2025-05-03 16:49:21
現在國內外貿行業達成了一個三不做的共識

現在國內外貿行業達成了一個三不做的共識

清暉有墨
2025-05-02 18:56:44
美烏礦產協議終簽署,還有一個資源大國也想仿效

美烏礦產協議終簽署,還有一個資源大國也想仿效

第一財經資訊
2025-05-03 16:00:13
擠爆了!各地景區開啟人海模式,網友喊話某地文旅局:只想掙錢!你們睡得著嗎

擠爆了!各地景區開啟人海模式,網友喊話某地文旅局:只想掙錢!你們睡得著嗎

可達鴨面面觀
2025-05-03 14:40:37
2025-05-03 19:11:00
硅星人 incentive-icons
硅星人
硅(Si)是創造未來的基礎,歡迎來到這個星球。
2156文章數 10335關注度
往期回顧 全部

科技要聞

特朗普下手,英偉達對華“特供版”要改

頭條要聞

外媒拍下華爾茲手機聊天界面:用"山寨"軟件與多人通信

頭條要聞

外媒拍下華爾茲手機聊天界面:用"山寨"軟件與多人通信

體育要聞

北京請神馬布里?許利民真有“玄學”!

娛樂要聞

趙又廷節目中高調撒糖 大贊高圓圓超好

財經要聞

巴菲特年度盛會,六大看點前曕!

汽車要聞

易三方科技體驗日·北京站上演硬核駕控

態度原創

藝術
家居
時尚
手機
本地

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

家居要聞

意式輕奢 低飽和質感美學

解鎖夏季“白開水穿搭”新玩法,時尚達人都在藏的秘訣

手機要聞

高通驍龍8s Gen4勁敵!聯發科天璣9400e來了:一加全球首發

本地新聞

春色滿城關不住 | 花漾千陽!塬上秘境藏幾重詩意?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 茂名市| 齐齐哈尔市| 漳州市| 西畴县| 天峻县| 普格县| 仙居县| 南康市| 南澳县| 武鸣县| 海口市| 庆云县| 罗平县| 宜宾市| 碌曲县| 赤峰市| 驻马店市| 娄底市| 沙洋县| 永新县| 普陀区| 尼玛县| 老河口市| 荥阳市| 邹城市| 石城县| 平塘县| 松滋市| 古浪县| 兴业县| 舟山市| 张家川| 广南县| 遵化市| 从江县| 靖西县| 台南市| 宜昌市| 富顺县| 天台县| 洞口县|