99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

開源Qwen一周連刷三冠,暴擊閉源模型!基礎模型推理編程均SOTA

0
分享至

魚羊 發自 凹非寺
量子位 | 公眾號 QbitAI

卷瘋了,通義千問真的卷瘋了。

Qwen3-Coder剛炸完場,就隔了一天,馬上全新開源Qwen3系列最強推理模型——Qwen3-235B-A22B-Thinking-2507。



怎么個最強法?一登場,再次刷新SOTA,在各項測評中一舉拿下「全球最強開源模型」寶座,比肩頂級閉源模型Gemini-2.5 Pro、o4-mini。

國外網友都饞哭了:



關鍵是,就在這短短一周里,算上前兩天開源的新基礎模型Qwen3-235B-A22B-Instruct-2507(非思考版),和Qwen3-Coder,通義千問是完成了一波開源三連。

開源還不算,各個出手即SOTA:接連斬獲基礎模型、編程模型、推理模型三項全球開源最強

這個模型更新強度和效能提升,妥妥地引領全球了。

就問小扎慌不慌(doge)。

新版Qwen3推理模型,登頂全球開源最強

正如DeepSeek R1是在V3基礎上打造的推理模型,Qwen3全新推理模型,是基于Qwen3-235B-A22B打造——就是235B參數那版MoE,激活參數22B。

官方表示,新推理模型主要提升了3方面的核心能力:

  • 邏輯推理、數學、科學和編碼等任務上性能顯著提升;
  • 能更好地遵循指令、使用工具、生成文本;
  • 支持256K原生上下文,適用于高度復雜的推理任務。

而此番刷新SOTA,登頂開源最強,確實不是那種一丟丟提升,仔細看測評分數,那是「真有點東西」。



先來看推理方面。

在超高難度測試「人類最后的考試」中,最新的2507版推理模型,相較4月底初發布的Qwen3推理模型,分數從11.8分提升到了18.2分。

超過了DeepSeek-R1-0528的17.7分,和OpenAI o4-mini在高性能推理模式下拿到的18.1分。



編程方面,在LiveCodeBench v6和CFEval中,Qwen3新推理模型甚至超越了Gemini-2.5 Pro等閉源業界標桿,刷新SOTA。

除此之外,在知識、對齊、智能體、多語言等基準評測中,Qwen3新推理模型都有比肩閉源模型的表現,達到開源SOTA。



紙面上的成績屬實是相當優秀,那么具體使用起來,這個新推理模型表現又會如何?

我們也簡單測試了一下。

還是那道經典題:7米長的甘蔗如何通過2米高1米寬的門?

Qwen3-235B-A22B-Thinking-2507思考了43秒,最后給出的答案是:



思考過程如下:



相較之下,o4-mini的答案就簡單粗暴了些。



模型三連開源,摘下三項SOTA

前面也說到,全新推理模型,其實是本周阿里開源第三彈。

總結起來畫風其實是醬嬸的:

前兩彈震得大家伙腦袋嗡嗡的,各種實測部署正上頭呢,通義實驗室的卷王們啪地又甩出了一對王炸。



就說Qwen3-Coder,開源即刷新AI編程SOTA——不僅在開源界超過DeepSeek V3和Kimi K2,連業界標桿、閉源的Claude Sonnet 4都比下去了。



網友們實測起來,小球彈跳效果是這樣的:



HuggingFace首席執行官Clement Delangue、Perplexity首席執行官Aravind Srinivas等大佬都第一時間加入了討論、點贊:

  • 這是開源的勝利。



Qwen3-Coder火爆,帶動阿里千問API調用量暴漲。

海外知名模型API聚合平臺OpenRouter數據顯示,阿里千問API調用量過去幾天已突破1000億Tokens,在OpenRouter趨勢榜上包攬全球前三,是當下最熱門的模型。

基礎模型領域,Qwen3最新版本——Qwen3-235B-A22B-Instruct-2507(非思考版)也登頂全球開源第一,在GPQA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等眾多測評中表現出色,超越Claude4(Non-thinking)等領先閉源模型。



中國開源,卷到了世界最前沿

三連開源,連摘三冠,對于中國開源力量而言,或許還只是一個開端。

有一說一,打從DeepSeek爆火、Llama 4翻車,要說開源領域哪股勢力最為活躍,成為新的風潮引領者,還得看神秘的東方力量。

每有開源新王誕生,DeepSeek、Qwen、Kimi……看來看去,還是made in China。

「中國確實將開源提升到了一個新高度」,越來越多地被討論、被贊同。



關鍵是,正如黃仁勛最新一次在北京所說,開源模型方面,「中國發展速度極快」。

以Qwen為例,目前,阿里已開源300余款通義大模型,通義千問衍生模型突破14萬個,已經真真正正超越此前的全球開源老大Llama系列,成為全球第一開源模型家族。

阿里方面透露,未來三年,阿里巴巴還將投入超過3800億元用于建設云和AI硬件基礎設施,持續升級全棧AI能力。

更重要的是,開源和閉源的差距也正在這種中國速度中被壓縮。

增長曲線的交叉點何時出現?尚未可知,但國產模型的身位已經實實在在排在了全球最前沿。

— 完 —

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
聽起來難以置信,但卻真實發生過的15個歷史事件!

聽起來難以置信,但卻真實發生過的15個歷史事件!

墨羽怪談
2025-07-06 10:05:14
年薪4億!美國芯片女王蘇姿豐,頂風幫中國打破制裁,研發中國芯

年薪4億!美國芯片女王蘇姿豐,頂風幫中國打破制裁,研發中國芯

壹知眠羊
2025-07-26 19:20:43
我主刀30年被降級,領導點名要我手術,我說:我辭職了,院長懵了

我主刀30年被降級,領導點名要我手術,我說:我辭職了,院長懵了

紅豆講堂
2025-06-30 17:20:10
解放軍當時為何不把佩洛西專機干掉?答案其實非常清楚

解放軍當時為何不把佩洛西專機干掉?答案其實非常清楚

伴史緣
2025-07-25 16:21:23
陳佩斯《戲臺》首日票房僅2051萬,劉昊然《南京照相館》強勢奪冠

陳佩斯《戲臺》首日票房僅2051萬,劉昊然《南京照相館》強勢奪冠

千信齊飛
2025-07-26 01:15:51
《戲臺》:國產喜劇,進化到這個地步了?

《戲臺》:國產喜劇,進化到這個地步了?

舒心醬
2025-07-25 00:33:32
49國大佬將聚北京,93大閱兵名單藏著你所不知的門道

49國大佬將聚北京,93大閱兵名單藏著你所不知的門道

大道微言
2025-07-23 16:25:48
大鵬被網紅姜濤討要結婚份子錢,之前合作過網劇,但已10年沒聯系

大鵬被網紅姜濤討要結婚份子錢,之前合作過網劇,但已10年沒聯系

歸史
2025-07-15 11:54:07
聯合國想買被拒,比利時斡旋無果!特朗普政府為何燒掉價值近千萬美元避孕物資?

聯合國想買被拒,比利時斡旋無果!特朗普政府為何燒掉價值近千萬美元避孕物資?

紅星新聞
2025-07-26 17:08:15
下半年想買新款MPV?建議認準這5款

下半年想買新款MPV?建議認準這5款

優視汽車
2025-07-26 17:44:53
河南男子被哈工大錄取,讀了4年后懵了,學校:從未有過你的入學記錄

河南男子被哈工大錄取,讀了4年后懵了,學校:從未有過你的入學記錄

睡前講故事
2025-07-21 10:55:20
央視澄清多個謠言!老師死里逃生原因曝光,救援40分鐘才抵達!

央視澄清多個謠言!老師死里逃生原因曝光,救援40分鐘才抵達!

古希臘掌管松餅的神
2025-07-25 13:04:53
施幼珍:不哭不鬧不上吊,拿捏死宗慶后僅用一招,她才是真正王者

施幼珍:不哭不鬧不上吊,拿捏死宗慶后僅用一招,她才是真正王者

普覽
2025-07-17 19:04:48
網約車司機一句話讓長沙文旅三年白干,旅行不該被這樣“潑冷水”

網約車司機一句話讓長沙文旅三年白干,旅行不該被這樣“潑冷水”

凡知
2025-07-25 16:33:54
害死6名大學生的公司安全問題很大!連新華社現場采訪視頻里都全是安全問題!

害死6名大學生的公司安全問題很大!連新華社現場采訪視頻里都全是安全問題!

小星球探索
2025-07-25 11:38:09
49年,偉人得知載濤靠擺攤營生后,當即表示:小攤就不要接著擺了

49年,偉人得知載濤靠擺攤營生后,當即表示:小攤就不要接著擺了

杰絲聊古今
2025-05-22 18:29:26
《掃毒風暴》唯一輸家:段奕宏跌下神壇,演技尷尬,全程被吊打

《掃毒風暴》唯一輸家:段奕宏跌下神壇,演技尷尬,全程被吊打

喵喵娛樂團
2025-07-24 18:20:53
宗慶后遺產風波再升級:信托是謠傳,遺囑是真,捧骨灰的另有其人

宗慶后遺產風波再升級:信托是謠傳,遺囑是真,捧骨灰的另有其人

比利
2025-07-21 16:35:21
盧秀燕與黃國昌合體反罷,民進黨見縫插針挑撥離間!

盧秀燕與黃國昌合體反罷,民進黨見縫插針挑撥離間!

梁察天下
2025-07-26 22:50:03
退伍女兵三甲醫院兩次被使用禁忌藥物致一級傷殘

退伍女兵三甲醫院兩次被使用禁忌藥物致一級傷殘

易聞觀察
2025-07-26 14:06:08
2025-07-26 23:40:49
量子位 incentive-icons
量子位
追蹤人工智能動態
10932文章數 176198關注度
往期回顧 全部

科技要聞

AI教父辛頓現身上海:人類如何不被AI殺掉

頭條要聞

佩通坦再發聲:雖無法履行總理職責 但一直在聽取匯報

頭條要聞

佩通坦再發聲:雖無法履行總理職責 但一直在聽取匯報

體育要聞

楊瀚森效力NBA期間 青島男籃將暫存球隊15號球衣

娛樂要聞

董璇首談保釋前夫細節!高云翔突然不回消息

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

"得房率"超90% 全新嵐圖知音空間信息曝光

態度原創

房產
家居
藝術
本地
軍事航空

房產要聞

分數線集體飆漲!海中867分!2025海南中招格局大變!

家居要聞

環繞設計 空間動線合理

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

換個城市過夏天|風拂鹽湖,躲進格爾木的盛夏清涼

軍事要聞

泰軍方向26國發函:柬埔寨率先開火

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 连山| 兴安盟| 吉林市| 乃东县| 阜新| 淳化县| 马边| 象州县| 临清市| 封开县| 连云港市| 南雄市| 昆山市| 临海市| 巴里| 钦州市| 巴林右旗| 潜江市| 根河市| 绵竹市| 甘南县| 江川县| 芮城县| 桂阳县| 丽江市| 扎赉特旗| 靖西县| 武山县| 安龙县| 克东县| 马龙县| 青田县| 金乡县| 峨山| 仪征市| 德庆县| 合江县| 汝阳县| 浪卡子县| 南昌市| 湄潭县|