99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

殺瘋了!阿里開源最強(qiáng)推理模型,一周三模型干翻全球開閉源天花板

0
分享至


智東西
作者 李水青
編輯 漠影

智東西7月25日?qǐng)?bào)道,昨日晚間,阿里又又又開源了!

阿里通義千問團(tuán)隊(duì)正式推出Qwen3-235B-A22B推理模型的升級(jí)版本:Qwen3-235B-A22B-Thinking-2507


▲Qwen3-235B-A22B-Thinking-2507開源頁面截圖

該模型擁有235B參數(shù),激活參數(shù)為22B,支持256K上下文,在編程、數(shù)學(xué)、知識(shí)、推理、人類偏好對(duì)齊等多項(xiàng)能力測(cè)評(píng)中得分比肩Gemini-2.5 pro、o4-mini等頂尖閉源模型,大幅超越DeepSeek-R1等開源模型,創(chuàng)下全球開源模型SOTA(最佳性能表現(xiàn))。


▲Qwen3-235B-A22B-Thinking-2507的部分測(cè)評(píng)表現(xiàn)

一周之內(nèi),阿里已用三款最新模型橫掃全球權(quán)威測(cè)評(píng),分別斬獲基礎(chǔ)模型、編程模型、推理模型等主流領(lǐng)域的三項(xiàng)全球開源冠軍。其中,7月23日開源的最強(qiáng)編程模型Qwen3-Coder-480B-A35B-Instruct在全球開發(fā)圈引起了一陣熱潮,連推特、Hugging Face的創(chuàng)始人及CEO都發(fā)文推薦。


▲推特創(chuàng)始人杰克·多爾西點(diǎn)贊Qwen3-Code

接連開源動(dòng)作背后,阿里通義千問已成“最聽勸”團(tuán)隊(duì)。Qwen非思考模型的推出就是接受了開發(fā)者的建議。“經(jīng)過與社區(qū)溝通和深思熟慮,我們決定停止使用混合思考模式。相反,我們將分別訓(xùn)練Instruct和Thinking模型,以獲得最佳質(zhì)量。”Qwen團(tuán)隊(duì)在X平臺(tái)上寫道。


▲Qwen非思考模型的推出就是接受了開發(fā)者的建議

“開發(fā)者需要什么,千問就開源什么”,面對(duì)如此聽勸的通義千問團(tuán)隊(duì),催更成為開發(fā)者的常態(tài)。昨日Qwen3-235B-A22B-Thinking-2507剛剛發(fā)布,就有開發(fā)者在千問相關(guān)負(fù)責(zé)人Junyang Lin的X平臺(tái)下催更這一模型的更小尺寸版本,對(duì)此Junyang Lin也下場(chǎng)回復(fù):“下周是 ‘flash’周 。”



▲千問相關(guān)負(fù)責(zé)人回應(yīng)開發(fā)者催更

目前,Qwen3-235B-A22B-Thinking-2507已在魔搭社區(qū)、Hugging Face開源,采用極寬松的Apache2.0開源協(xié)議,人人均可免費(fèi)下載商用。用戶也可以通過QwenChat體驗(yàn)該模型。


▲用戶可在QwenChat選擇使用該模型

QwenChat體驗(yàn)地址:
chat.qwen.ai
魔搭社區(qū)地址:
https://www.modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507
Hugging Face地址:
https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507

一、全面趕超DeepSeek,比肩OpenAI o3

昨夜,Qwen3-235B-A22B-Thinking-2507模型一經(jīng)發(fā)布,立馬在全球范圍內(nèi)收獲了極高熱度。社交平臺(tái)X上不少網(wǎng)友點(diǎn)贊分享,有網(wǎng)友稱:“這還是我第一次看到名副其實(shí)的‘思考模式’!”有人贊嘆:“基準(zhǔn)測(cè)試成績(jī)令人印象深刻!”


▲X網(wǎng)友評(píng)價(jià)Qwen3-235B-A22B-Thinking-2507

來看看測(cè)試情況。如下圖所示,最亮眼的應(yīng)該是編程能力的LiveCodBenchV6的成績(jī),從5月發(fā)布的Qwen3的55.7分提升到了現(xiàn)在74.1分。另外知識(shí)能力測(cè)試SuperGPQA和推理能力測(cè)試HMMT25也都是目前的最高分。


▲Qwen3-235B-A22B-Thinking-2507測(cè)評(píng)情況(圖源:Hcores LLM Arena)

具體來看,在知識(shí)方面,Qwen3-235B-A22B-Thinking-2507在MMLU-Redux、GPQA、SuperGPQA的測(cè)試中均超越了DeepSeek-R1-0528,并且得分逼近OpenAI o3、Gemini-2.5 Pro等頂尖閉源模型。

在推理方面,Qwen3-235B-A22B-Thinking-2507在AIME25、HMMT25、LiveBenc、HLE幾項(xiàng)測(cè)試中得分都碾壓Deepseek-R1-0528、OpenAI o3、Claude4 Opus Thinking

在編碼方面,Qwen3-235B-A22B-Thinking-2507在LiveCodeBench v6、CFEval、OJBench等測(cè)試中全面超越Deepseek-R1-0528、OpenAI o4-mini、OpenAI o3

在一致性方面,Qwen3-235B-A22B-Thinking-2507在WritingBench測(cè)試中趕超了開源模型Deepseek-R1-0528以及OpenAI o3、Gemini-2.5 Pro等閉源模型,在IFEval、Creative Writing v3等測(cè)試方面也接近OpenAI o3、Gemini-2.5 Pro的水平。

在Agent方面,Qwen3-235B-A22B-Thinking-2507在BFCL-v3、TAU2-Retail等測(cè)試中得分接近OpenAI o3,趕超了Deepseek-R1-0528、OpenAI o4 mini、Gemini-2.5 Pro

在多語言能力方面,Qwen3-235B-A22B-Thinking-2507在MultiIF、PolyMATH測(cè)試中也取得了最好成績(jī),超越Deepseek-R1-0528、OpenAI o4-mini、OpenAI o3、Gemini-2.5 Pro、Claude4 Opus Thinking等模型



▲Qwen3-235B-A22B-Thinking-2507的測(cè)評(píng)成績(jī)(對(duì)于OpenAI o4-mini和o3,測(cè)試使用中等推理,但標(biāo)有*的分?jǐn)?shù)除外,這些分?jǐn)?shù)是使用高推理生成的。)

“Qwen勢(shì)頭強(qiáng)勁,正在征服所有人!”一位開發(fā)者在社交平臺(tái)X上稱,“Qwen3 235B的搜索能力極致思考模式可不是鬧著玩的。它解決了ChatGPT o3-pro上個(gè)月破解的難題。”


▲X網(wǎng)友評(píng)價(jià)Qwen3-235B-A22B-Thinking-2507體驗(yàn)

這個(gè)難題描述了一個(gè)文字游戲:“Sabrina Carpenter 的那首歌的歌名是什么?當(dāng)你讀出你對(duì)這個(gè)問題的正確單句回答中每個(gè)單詞的最后一個(gè)字母時(shí),這首歌的歌名也會(huì)出現(xiàn)。”如下圖所示,Qwen3-235B-A22B-Thinking-2507準(zhǔn)確猜出了答案。


▲X網(wǎng)友的試用案例截圖

值得一提的是,本次阿里還推出了為三款最新Qwen3模型大規(guī)模RL(強(qiáng)化學(xué)習(xí))訓(xùn)練提供支持的算法——組序列策略優(yōu)化 (GSPO)。

通義千問團(tuán)隊(duì)相關(guān)負(fù)責(zé)人稱:“相較于GRPO,GSPO在穩(wěn)定性、效率、性能和底層友好度方面均具有顯著優(yōu)勢(shì),并且從根本上自然地解決了強(qiáng)化學(xué)習(xí)中大型MoE模型訓(xùn)練的穩(wěn)定性問題。”


▲組序列策略優(yōu)化 (GSPO)技術(shù)報(bào)告截圖

論文地址:

https://huggingface.co/papers/2507.18071

二、一周開源三連冠,劍指閉源巔峰

短短一周時(shí)間里,阿里通義千問團(tuán)隊(duì)已連續(xù)開源了三款模型,橫掃全球開源模型權(quán)威測(cè)評(píng),成績(jī)直追頂級(jí)閉源模型。

先是7月22日,阿里更新旗艦版Qwen3模型,推出Qwen3-235B-A22B非思考模式(Non-thinking)的更新版本,命名為Qwen3-235B-A22B-Instruct-2507

新的Qwen3模型通用能力顯著提升,在指令遵循、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編程及工具使用等方面眾多測(cè)評(píng)中,超過Kimi-K2、DeepSeek-V3等頂級(jí)開源模型以及Claude-Opus4-Non-thinking等領(lǐng)先閉源模型。


▲Qwen3-235B-A22B-Instruct-2507測(cè)評(píng)成績(jī)

而后在7月23日,阿里開源了其最新一代旗艦編程模型Qwen3-Coder-480B-A35B-Instruct。這是該團(tuán)隊(duì)迄今為止最強(qiáng)大的開源智能體編程模型,擁有480B參數(shù),激活參數(shù)為35B,原生支持256K上下文。借助Qwen3-Coder,剛?cè)胄械某绦騿T一天就能完成資深程序員一周的工作,生成一個(gè)品牌官網(wǎng)最快只需5分鐘。

在基準(zhǔn)測(cè)試中,Qwen3-Coder在編程和智能體任務(wù)上擁有不錯(cuò)的性能,于Agentic Coding(智能體編程)、Agentic Browser-Use(智能體瀏覽器使用)和Agentic Tool-Use(智能體工具調(diào)用)三類任務(wù)中獲得了開源SOTA,超過Kimi K2、DeepSeek V3等開源模型和GPT-4.1等閉源模型,并可與Claude Sonnet 4這一以編程能力著稱的模型相媲美。

除了模型之外,Qwen還開源了一個(gè)由Gemini Code分叉而來的智能體編程命令行工具——Qwen Code,這一工具進(jìn)行了定制提示和函數(shù)調(diào)用協(xié)議的適配,能更充分的釋放Qwen3-Coder在智能體編程任務(wù)上的能力。

7月23日當(dāng)日,阿里云還宣布Qwen3-Coder未來一個(gè)月5-7折優(yōu)惠,256K-1M上下文長(zhǎng)度,輸入價(jià)格10元/百萬tokens,輸出價(jià)格100元/百萬tokens;緊接著今日,阿里云宣布通義靈碼上線Qwen3-Coder,免費(fèi)使用不限量。


Qwen3-Coder的開源引發(fā)硅谷和全球AI圈熱議,獲得推特創(chuàng)始人杰克·多爾西、Perplexity CEO阿拉溫德·斯里尼瓦斯、a16z合伙人馬克·馬斯克羅等科技領(lǐng)袖盛贊。HuggingFace CEO克萊門特·德朗格更是多次力薦。

同時(shí),阿里千問API在海外知名模型API聚合平臺(tái)OpenRouter的調(diào)用量暴漲,突破千億級(jí)tokens,在OpenRouter趨勢(shì)榜上包攬全球前三,成為當(dāng)下最熱門模型。

結(jié)語:中國(guó)開源力量,改寫格局

開源浪潮正重塑大模型競(jìng)爭(zhēng)規(guī)則。阿里通義千問以“三日三冠”的強(qiáng)勢(shì)表現(xiàn),不僅橫掃開源戰(zhàn)場(chǎng),更在多領(lǐng)域直逼閉源天花板。

此次連續(xù)開源頂尖模型,為開發(fā)者提供了對(duì)標(biāo)閉源巨頭的“開源平權(quán)”利器。從硅谷開發(fā)者的狂熱調(diào)用,到全球社區(qū)登頂?shù)挠埠藨?zhàn)績(jī),阿里正以開源為支點(diǎn),撬動(dòng)大模型競(jìng)爭(zhēng)新范式。中國(guó)力量,正在改寫全球大模型產(chǎn)業(yè)格局。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
切馬告別皇馬:結(jié)束這段旅程并不容易,我會(huì)將皇馬放在心里

切馬告別皇馬:結(jié)束這段旅程并不容易,我會(huì)將皇馬放在心里

懂球帝
2025-07-27 05:24:09
窮困的柬埔寨,正在買單

窮困的柬埔寨,正在買單

虛聲
2025-07-25 20:17:34
大S倫敦紀(jì)念長(zhǎng)椅宣布落成不到24小時(shí),惡心人的一幕就出現(xiàn)了

大S倫敦紀(jì)念長(zhǎng)椅宣布落成不到24小時(shí),惡心人的一幕就出現(xiàn)了

夢(mèng)史
2025-07-26 20:48:46
前NBA球員阿里扎宣布破產(chǎn),生涯總薪資1.16億美元

前NBA球員阿里扎宣布破產(chǎn),生涯總薪資1.16億美元

懂球帝
2025-07-26 15:56:14
確認(rèn)了:武漢近期多發(fā)!馬上更猛

確認(rèn)了:武漢近期多發(fā)!馬上更猛

極目新聞
2025-07-26 13:52:37
娃哈哈家族大戰(zhàn)終于真相大白了!原來從頭到尾都是場(chǎng)鬧劇

娃哈哈家族大戰(zhàn)終于真相大白了!原來從頭到尾都是場(chǎng)鬧劇

史書無明
2025-07-26 08:01:47
令人震驚:越南超過8萬個(gè)商家退出電商平臺(tái)

令人震驚:越南超過8萬個(gè)商家退出電商平臺(tái)

緬甸中文網(wǎng)
2025-07-25 14:02:10
足協(xié)急跳腳了,范志毅拒接鄭智的爛攤子,國(guó)足中方教練淪為背鍋俠

足協(xié)急跳腳了,范志毅拒接鄭智的爛攤子,國(guó)足中方教練淪為背鍋俠

云隱南山
2025-07-26 12:44:45
楊瀚森效力NBA期間,青島男籃將暫存球隊(duì)15號(hào)球衣

楊瀚森效力NBA期間,青島男籃將暫存球隊(duì)15號(hào)球衣

懂球帝
2025-07-26 12:45:06
徐正源與成都蓉城內(nèi)訌的關(guān)鍵球員居然是韋世豪,與崔康熙很相似

徐正源與成都蓉城內(nèi)訌的關(guān)鍵球員居然是韋世豪,與崔康熙很相似

姜大叔侃球
2025-07-26 10:08:34
剛剛!宗馥莉首次“回應(yīng)”風(fēng)波,太妙了!娃哈哈奪產(chǎn)案大反轉(zhuǎn),叔叔稱她“六親不認(rèn)”...

剛剛!宗馥莉首次“回應(yīng)”風(fēng)波,太妙了!娃哈哈奪產(chǎn)案大反轉(zhuǎn),叔叔稱她“六親不認(rèn)”...

澳洲紅領(lǐng)巾
2025-07-26 12:21:24
宗慶后的警覺,狐貍分餅,梅艷芳信托化為了烏有

宗慶后的警覺,狐貍分餅,梅艷芳信托化為了烏有

月滿大江流
2025-07-24 17:44:11
全部飛機(jī)停航!中國(guó)重拳出擊!日本提要求被拒絕“完全無法接受”

全部飛機(jī)停航!中國(guó)重拳出擊!日本提要求被拒絕“完全無法接受”

健身狂人
2025-07-22 10:56:19
“沒忍住、射里面”報(bào)警,尷尬了誰?

“沒忍住、射里面”報(bào)警,尷尬了誰?

深度報(bào)
2025-07-24 10:49:25
WTA500華盛頓站:張帥/湯森德2-0橫掃肯寧組合,成功捧杯

WTA500華盛頓站:張帥/湯森德2-0橫掃肯寧組合,成功捧杯

懂球帝
2025-07-27 05:24:09
中超裁判業(yè)余一幕:無視明顯犯規(guī),刻意拖延時(shí)間,這水平真不行

中超裁判業(yè)余一幕:無視明顯犯規(guī),刻意拖延時(shí)間,這水平真不行

國(guó)足風(fēng)云
2025-07-26 21:54:17
泰柬爆發(fā)新沖突!泰國(guó)出動(dòng)4架戰(zhàn)機(jī)空襲柬埔寨,還在柬沿海部署8艘軍艦!安理會(huì)緊急開會(huì),柬駁斥“先入侵泰”指控

泰柬爆發(fā)新沖突!泰國(guó)出動(dòng)4架戰(zhàn)機(jī)空襲柬埔寨,還在柬沿海部署8艘軍艦!安理會(huì)緊急開會(huì),柬駁斥“先入侵泰”指控

每日經(jīng)濟(jì)新聞
2025-07-26 17:53:04
杭州留學(xué)生被限制自由3個(gè)月,卸載所有社交軟件,百萬學(xué)費(fèi)飛了

杭州留學(xué)生被限制自由3個(gè)月,卸載所有社交軟件,百萬學(xué)費(fèi)飛了

都市快報(bào)橙柿互動(dòng)
2025-07-26 20:22:43
申花13號(hào)最厲地方 踢到17輪不僅全勤 還沒紅黃牌 要知道他是后衛(wèi)

申花13號(hào)最厲地方 踢到17輪不僅全勤 還沒紅黃牌 要知道他是后衛(wèi)

80后體育大蜀黍
2025-07-26 23:19:10
懂車帝確實(shí)懂車,但是不懂規(guī)矩

懂車帝確實(shí)懂車,但是不懂規(guī)矩

美芳
2025-07-25 22:18:55
2025-07-27 06:00:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
10205文章數(shù) 116807關(guān)注度
往期回顧 全部

科技要聞

AI教父辛頓現(xiàn)身上海:人類如何不被AI殺掉

頭條要聞

佩通坦再發(fā)聲:雖無法履行總理職責(zé) 但一直在聽取匯報(bào)

頭條要聞

佩通坦再發(fā)聲:雖無法履行總理職責(zé) 但一直在聽取匯報(bào)

體育要聞

楊瀚森效力NBA期間 青島男籃將暫存球隊(duì)15號(hào)球衣

娛樂要聞

董璇首談保釋前夫細(xì)節(jié)!高云翔突然不回消息

財(cái)經(jīng)要聞

劉煜輝:當(dāng)下重要不是找確定性而是轉(zhuǎn)折點(diǎn)

汽車要聞

"得房率"超90% 全新嵐圖知音空間信息曝光

態(tài)度原創(chuàng)

健康
教育
家居
時(shí)尚
軍事航空

呼吸科專家破解呼吸道九大謠言!

教育要聞

專家說教育不要內(nèi)卷,那我們的孩子到底應(yīng)該走什么路?

家居要聞

環(huán)繞設(shè)計(jì) 空間動(dòng)線合理

金童玉女離婚20年,怎么不算圓滿大結(jié)局呢?

軍事要聞

泰軍方向26國(guó)發(fā)函:柬埔寨率先開火

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 含山县| 安吉县| 皮山县| 天长市| 维西| 淮阳县| 绥滨县| 济宁市| 阳新县| 明溪县| 青神县| 聂荣县| 宝鸡市| 旬阳县| 班玛县| 拉孜县| 杂多县| 汕头市| 南宁市| 车险| 汶上县| 平顺县| 通州区| 新宾| 湾仔区| 横山县| 英德市| 齐河县| 双城市| 宽城| 峨眉山市| 铜鼓县| 从化市| 图片| 平塘县| 开封县| 博湖县| 岑溪市| 都安| 梁平县| 丹阳市|