99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Qwen3小升級即SOTA,開源大模型王座快變中國內部賽了

0
分享至

聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI

開源大模型正在進入中國時間。

Kimi K2風頭正盛,然而不到一周,Qwen3就迎來最新升級,235B總參數量僅占Kimi K2 1T規模的四分之一。

基準測試性能上卻超越了Kimi K2。



Qwen官方還宣布不再使用混合思維模式,而是分別訓練Instruct和Thinking模型。

所以,此次發布的新模型僅支持非思考模式,現在網頁版已經可以上線使用了,但通義APP還未見更新。



Qwen官方還透露:這次只是一個小更新!大招很快就來了!



但總歸就是,再見Qwen3-235B-A22B,你好Qwen3-235B-A22B-2507了。

By the way,這個名字怎么取得越來越復雜了。

先來看看這次的“小更新”都有哪些~

增強了對256K長上下文的理解能力

新模型是一款因果語言模型,采用MoE架構,總參數量達235B,其中非嵌入參數為234B,推理時激活參數為22B

在官方介紹中顯示,模型共包含94層,采用分組查詢注意力(GQA)機制,配備64個查詢頭和4個鍵值頭,并設置128個專家,每次推理時激活8個專家。

該模型原生支持262144的上下文長度。

這次改進主要有以下幾個方面

  • 顯著提升了通用能力,包括指令遵循、邏輯推理、文本理解、數學、科學、編碼和工具使用。
  • 大幅增加了多語言長尾知識的覆蓋范圍。
  • 更好地符合用戶在主觀和開放式任務中的偏好,能夠提供更有幫助的響應和更高質量的文本生成。
  • 增強了對256K長上下文的理解能力。



在官方發布的基準測試中可以看到,相較于上一版本,新模型在AIME25上準確率從24.7%上升到70.3%,表現出良好的數學推理能力。

而且對比Kimi K2、DeepSeek-V3,Qwen3新模型的能力也都略勝一籌。



為了提高使用體驗,官方還推薦了最佳設置:



Qwen3新版本深夜發布就立刻收獲了一眾好評:Qwen在中等規模的語言模型中已經領先。



也有網友感慨Qwen在開啟新的架構范式:



One More Thing

有趣的是,就在Qwen3新模型發布的前兩天,NVIDIA也宣稱發布了新的SOTA開源模型OpenReasoning-Nemotron

該模型提供四個規模:1.5B、7B、14B和32B,并且可以實現100%本地運行。



但實際上,這只是基于Qwen-2.5在Deepseek R1數據上微調的模型。



而現在Qwen3已經更新,大招已經被預告。

隨著Llama轉向閉源的消息傳出,OpenAI遲遲不見Open,開源基礎大模型的競爭,現在正在進入中國時間。

DeepSeek丟了王座,Kimi K2補上,Kimi K2坐穩沒幾天,Qwen的挑戰就來了。

體驗鏈接:https://chat.qwen.ai/


[1]https://x.com/Alibaba_Qwen/status/1947344511988076547
[2]https://x.com/giffmana/status/1947362393983529005

— 完 —

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
44天,500億違約成本:馬斯克把政府“拿捏”到什么程度?

44天,500億違約成本:馬斯克把政府“拿捏”到什么程度?

流年拾光
2025-07-23 12:27:16
熱搜上令人窒息的“母女吃牛肉面”一幕,讓網友直呼精神窮人可怕

熱搜上令人窒息的“母女吃牛肉面”一幕,讓網友直呼精神窮人可怕

美美談情感
2025-07-25 00:24:40
157cm人體火藥桶!鋼鐵玫瑰AJ Applegate:從NBA啦啦隊到業界奧斯卡的暴裂舞步

157cm人體火藥桶!鋼鐵玫瑰AJ Applegate:從NBA啦啦隊到業界奧斯卡的暴裂舞步

非專業電影fans
2025-07-24 07:54:11
東南亞瀕臨失控,越南軍隊大批趕往中國,中國周邊亂不得

東南亞瀕臨失控,越南軍隊大批趕往中國,中國周邊亂不得

阿校談史
2025-07-25 12:03:31
如傳聞屬實,華為轉向的“代價”誰來背?

如傳聞屬實,華為轉向的“代價”誰來背?

關爾東
2025-07-24 17:12:40
中方:已向以色列提出嚴正交涉!

中方:已向以色列提出嚴正交涉!

環球時報新聞
2025-07-25 12:01:51
索爾斯克亞:礦工實力強勁而我們防守不夠理想,有些球員歸隊太晚

索爾斯克亞:礦工實力強勁而我們防守不夠理想,有些球員歸隊太晚

雷速體育
2025-07-25 10:41:16
特朗普還未登機訪華,五角大樓突然下達禁令,不許任用中國工程師

特朗普還未登機訪華,五角大樓突然下達禁令,不許任用中國工程師

歷史求知所
2025-07-24 13:55:03
馬卡:西班牙兩位公主將出席女足歐洲杯決賽

馬卡:西班牙兩位公主將出席女足歐洲杯決賽

懂球帝
2025-07-25 09:08:17
午評:大盤調整到3588,跡象明顯了,不用猜了,下午很可能這樣走

午評:大盤調整到3588,跡象明顯了,不用猜了,下午很可能這樣走

阿傖說事
2025-07-25 11:57:51
市場監管總局:已暫停充電寶及電芯企業CCC證書8756張

市場監管總局:已暫停充電寶及電芯企業CCC證書8756張

澎湃新聞
2025-07-25 08:44:03
梅西專屬鏡頭回歸!曾被C羅的比賽直播模仿過!

梅西專屬鏡頭回歸!曾被C羅的比賽直播模仿過!

氧氣是個地鐵
2025-07-25 11:43:24
油價大降0.84元/升,2025年第15次油價調整,7月29日或再下跌

油價大降0.84元/升,2025年第15次油價調整,7月29日或再下跌

油價早知道
2025-07-23 09:22:43
去了日本才發現:遍地“長裙子+平底鞋”,卻精致不壓身高,洋氣

去了日本才發現:遍地“長裙子+平底鞋”,卻精致不壓身高,洋氣

小陳聊搭配
2025-07-24 20:14:11
上海樂高樂園最大優點是“沒人”?

上海樂高樂園最大優點是“沒人”?

旅界Pro
2025-07-24 07:52:15
電影《731》,一個30秒預告片就遭到百萬人抵制,他們在害怕什么

電影《731》,一個30秒預告片就遭到百萬人抵制,他們在害怕什么

文史達觀
2025-07-19 13:08:22
吃飯魚刺卡喉?耳鼻喉醫生教你一瓶水在家自救!網友:太有效了

吃飯魚刺卡喉?耳鼻喉醫生教你一瓶水在家自救!網友:太有效了

菁媽育兒
2025-07-20 12:58:06
昔日忠犬露獠牙,普京面對卡德羅夫步步緊逼,為何只能妥協退讓?

昔日忠犬露獠牙,普京面對卡德羅夫步步緊逼,為何只能妥協退讓?

愛史紀
2025-07-18 11:50:11
內馬爾回應與球迷沖突:他們有權噓我,但不能侮辱我是雇傭兵

內馬爾回應與球迷沖突:他們有權噓我,但不能侮辱我是雇傭兵

雷速體育
2025-07-25 07:00:06
意媒:國米考慮以3000萬-3500萬出售帕瓦爾,球員只愿去頂級強隊

意媒:國米考慮以3000萬-3500萬出售帕瓦爾,球員只愿去頂級強隊

直播吧
2025-07-25 07:33:06
2025-07-25 14:15:00
量子位 incentive-icons
量子位
追蹤人工智能動態
10922文章數 176194關注度
往期回顧 全部

科技要聞

特斯拉周四股價大跌8%,馬斯克罕見示弱

頭條要聞

普京透露核潛艇建造計劃:擬再補充4艘"北風之神-A"級

頭條要聞

普京透露核潛艇建造計劃:擬再補充4艘"北風之神-A"級

體育要聞

誰敢相信她45歲了?大女主從不受限

娛樂要聞

董璇婚后為女兒與丈夫張維伊分居?

財經要聞

特斯拉,下神壇

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態度原創

健康
教育
手機
游戲
藝術

呼吸科專家破解呼吸道九大謠言!

教育要聞

南陽一中附中學區劃分,也是十九中的大利好

手機要聞

千元標桿!REDMI Note 15 Pro系列入網

《無主之地4》進廠壓盤!9月12日如期發售!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 涿鹿县| 石景山区| 信阳市| 双辽市| 铜山县| 秀山| 渭南市| 阿坝县| 纳雍县| 保德县| 武川县| 正阳县| 内江市| 南华县| 龙口市| 新河县| 阳高县| 荥经县| 乐安县| 广州市| 汉源县| 永福县| 保亭| 新宁县| 福鼎市| 辽宁省| 涞源县| 色达县| 普兰店市| 武隆县| 安岳县| 临江市| 运城市| 江孜县| 淮阳县| 镇赉县| 吉木乃县| 英山县| 关岭| 漳州市| 南投县|