99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

阿里AI四連發,橫掃全球開源榜單第一名

0
分享至

阿里巴巴通義團隊用四連發的重磅出擊,橫掃Github開源榜單。

本周從7月22日到25日,阿里接連推出Qwen3-235B非思考版本、Qwen3-Coder編程模型、Qwen3-235B-A22B-Thinking-2507推理模型,以及WebSailor AI Agent框架,四款產品橫掃基礎模型、編程模型、推理模型和智能體領域的開源榜單。

權威機構Artificial Analysis更是直接評價:

通義千問3是全球最智能的非思考基礎模型。
非思考模型也能性能“爆表”

據硬AI,周二凌晨阿里巴巴通義千問團隊推出非思考模式(Non-thinking)最新模型,命名為Qwen3-235B-A22B-Instruct-2507-FP8。

這款非思考模型在多項關鍵基準測試中表現出色。不僅全面超越了Kimi-K2等頂級開源模型,甚至領先Claude-Opus4-Non-thinking等頂級閉源模型。


值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)測評中表現卓越。這意味著模型在理解復雜指令、自主規劃、調用工具以完成任務的能力上,達到了一個新的高度。“主打Agent”,將是未來AI應用的核心競爭力。



編程模型引發社區沸騰

7月23日發布的Qwen3-Coder更是在全球開發者社區引發轟動。


華爾街見聞此前提及,這款基于MoE架構的編程模型擁有480B總參數,35B激活參數,原生支持256K上下文,可擴展至1M。

在開發者最關注的SWE-bench Verified基準測試中,Qwen3-Coder取得了開源模型最佳表現。


模型在7.5萬億token規模上訓練,其中包含70%代碼數據,并通過長時程強化學習和2萬個虛擬環境的大規模實戰訓練,在真實世界的多輪交互任務中展現出色能力。

阿里還推出了配套的命令行工具Qwen Code,為開發者提供了完整的編程解決方案。

科技界領袖紛紛為Qwen3-Coder點贊,例如Perplexity CEO Aravind Srinivas盛贊Qwen3-coder的實力:

成果令人驚嘆,開源正在獲勝。

推特創始人Jack Dorsey更是強調Qwen3和Goose——其Block公司開發的AI Agent框架,搭配使用的話非常棒:

goose配合Qwen3-Coder等于哇哦

AI Agent框架挑戰閉源壟斷

阿里通義實驗室同期開源的WebSailor AI Agent框架,直接對標OpenAI的Deep Research產品。

這款框架在BrowseComp-en/zh測試中性能顯著優于所有開源智能體,可媲美專屬閉源模型。


WebSailor采用復雜任務生成和強化學習模塊的雙重技術架構。通過構建復雜知識圖譜和動態采樣策略,系統能夠在海量信息中進行高效檢索和推理。

除了在復雜任務上的卓越表現,WebSailor在簡單任務上也表現出色。例如,在SimpleQA基準測試中,WebSailor的性能超過了所有其他模型產品。

該項目在GitHub已獲得超過5000顆星,并曾拿下每日增長趨勢第一名。


WebSailor的核心技術主要圍繞復雜任務生成和強化學習模塊展開,這兩個模塊相互配合,共同推動了開源智能體在復雜信息檢索任務中的性能提升。

該框架的開源意義重大,打破了閉源系統在信息檢索領域的壟斷地位,為全球開發者提供了媲美Deep Research的開源解決方案。

推理模型登頂全球開源冠軍

7月25日發布的Qwen3-235B-A22B-Thinking-2507成為本周最重磅的產品。

  • AIME25(數學)達到92.3分。
  • LiveCodeBench v6(編程)獲得74.1分。
  • WritingBench(寫作)達到88.3分。
  • PolyMATH(多語言數學)獲得60.1分。

更詳細的榜單表現來看,Qwen3推理模型相較于其他模型來看也毫不遜色(除了 R1,其他都是頂尖閉源模型)。


該模型采用MoE架構,總參數235B,激活參數22B,擁有94層結構和128個專家系統,原生支持262,144 tokens上下文長度。模型專為思考模式構建,默認聊天模板自動包含思考標簽,為深度推理提供了強大支撐。

OpenRouter數據顯示,阿里千問的API調用量在過去幾天暴漲,已超過1000億tokens,包攬最熱門調用模型前三名。這一數據直接反映了市場對阿里開源模型的認可度。


全球網友也是被通義的最強推理模型給驚呆了。有網友直接表示:

中國的開源o4-mini。

AI Thinkers更是評論道:

中國剛剛發布了一款怪物級的AI模型。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
企退養老金4380元,補發到賬共694.89,每月上漲近百元落袋為安

企退養老金4380元,補發到賬共694.89,每月上漲近百元落袋為安

社保精算師
2025-07-26 12:01:04
河南商水回應“下鄉幫扶人員賒欠3萬餐費”:已結清

河南商水回應“下鄉幫扶人員賒欠3萬餐費”:已結清

新京報
2025-07-25 16:07:18
工齡超30年的退休人員,2025年再迎利好,3大福利或可享,有你嗎

工齡超30年的退休人員,2025年再迎利好,3大福利或可享,有你嗎

貓叔東山再起
2025-07-25 10:20:02
29萬人逃離湖南,22萬人離開吉林!人口大遷徙中,誰是最后贏家?

29萬人逃離湖南,22萬人離開吉林!人口大遷徙中,誰是最后贏家?

青眼財經
2025-07-15 15:56:07
大罷免投票,蕭旭岑預測結局,兩岸局勢或失控,賴清德將無人制衡

大罷免投票,蕭旭岑預測結局,兩岸局勢或失控,賴清德將無人制衡

愛下廚的阿釃
2025-07-26 15:26:09
斷糧第 7 天!菲律賓仁愛礁坐灘軍艦告急,馬科斯向美求救碰壁

斷糧第 7 天!菲律賓仁愛礁坐灘軍艦告急,馬科斯向美求救碰壁

起喜電影
2025-07-26 12:56:58
你見過又窮又浪費的家庭嗎?網友:我老公賺多少花光多少!

你見過又窮又浪費的家庭嗎?網友:我老公賺多少花光多少!

特約前排觀眾
2025-07-23 00:10:03
瑜伽褲女神,好身材超絕,美得太上頭!

瑜伽褲女神,好身材超絕,美得太上頭!

一抹暖陽
2025-07-19 15:47:52
全部飛機停航!中國重拳出擊!日本提要求被拒絕“完全無法接受”

全部飛機停航!中國重拳出擊!日本提要求被拒絕“完全無法接受”

健身狂人
2025-07-22 10:56:19
糖尿病最怕的早餐!醫生反復提醒:寧可不吃,也別碰這幾種早餐

糖尿病最怕的早餐!醫生反復提醒:寧可不吃,也別碰這幾種早餐

明月聊史
2025-07-26 14:38:30
特朗普小馬科斯會晤:我們跟中國關系特別好。菲律賓迷茫了

特朗普小馬科斯會晤:我們跟中國關系特別好。菲律賓迷茫了

杜文龍
2025-07-26 23:00:02
“黃毛男孩”曬北大通知書,結果專業被群嘲:畢業了也是送外賣

“黃毛男孩”曬北大通知書,結果專業被群嘲:畢業了也是送外賣

戶外小阿隋
2025-07-24 00:41:48
小侄子7歲時走丟,10年后我去巴厘島旅游,突然一個少年叫住我

小侄子7歲時走丟,10年后我去巴厘島旅游,突然一個少年叫住我

球場的看客
2025-07-23 20:22:07
大罷免最新進展:24名藍委均不同意票更多,傅崐萁、徐巧芯都安全

大罷免最新進展:24名藍委均不同意票更多,傅崐萁、徐巧芯都安全

特特農村生活
2025-07-26 17:54:19
看到姜文和大鵬的電影后,才知道,陳佩斯的《戲臺》為何被排擠?

看到姜文和大鵬的電影后,才知道,陳佩斯的《戲臺》為何被排擠?

草莓解說體育
2025-07-25 07:47:37
好多錢!哈珀簽合同時被自己的薪資震驚,爆發出“我去”的驚叫聲

好多錢!哈珀簽合同時被自己的薪資震驚,爆發出“我去”的驚叫聲

雷速體育
2025-07-26 10:48:27
華為Mate X7突然炸場,Mate X6用戶徹底破防了

華為Mate X7突然炸場,Mate X6用戶徹底破防了

搞機小帝
2025-07-25 12:43:19
俄烏這么一打,中國常規軍力的實力再也藏不住了

俄烏這么一打,中國常規軍力的實力再也藏不住了

影史侃談
2025-07-06 08:31:35
三方交易變五方,郭艾倫重返遼籃,王嵐嵚焦伯喬陳國豪下家明確

三方交易變五方,郭艾倫重返遼籃,王嵐嵚焦伯喬陳國豪下家明確

去山野間追風
2025-07-26 10:03:00
兩老人占商場母嬰室2小時,反復敲門不開,管理員開鎖入門后愣住

兩老人占商場母嬰室2小時,反復敲門不開,管理員開鎖入門后愣住

懸案解密檔案
2025-07-24 09:52:17
2025-07-26 23:55:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領先的金融商業信息提供商
132706文章數 2650205關注度
往期回顧 全部

科技要聞

AI教父辛頓現身上海:人類如何不被AI殺掉

頭條要聞

佩通坦再發聲:雖無法履行總理職責 但一直在聽取匯報

頭條要聞

佩通坦再發聲:雖無法履行總理職責 但一直在聽取匯報

體育要聞

楊瀚森效力NBA期間 青島男籃將暫存球隊15號球衣

娛樂要聞

董璇首談保釋前夫細節!高云翔突然不回消息

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

"得房率"超90% 全新嵐圖知音空間信息曝光

態度原創

健康
藝術
數碼
游戲
軍事航空

呼吸科專家破解呼吸道九大謠言!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

數碼要聞

三星 Exynos 2600跑分曝光,S26搭載?

《GTA6》的最強賣點?重游次世代“罪惡都市”

軍事要聞

泰軍方向26國發函:柬埔寨率先開火

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 额济纳旗| 昭通市| 闽侯县| 阆中市| 资阳市| 汤原县| 乐业县| 额敏县| 都安| 呼和浩特市| 隆回县| 繁昌县| 郸城县| 枞阳县| 静安区| 霸州市| 时尚| 江川县| 遵义县| 昌邑市| 乌拉特后旗| 娱乐| 柞水县| 广元市| 砀山县| 安图县| 渝北区| 元氏县| 都江堰市| 广丰县| 临夏县| 永平县| 潍坊市| 林芝县| 长葛市| 平山县| 绵竹市| 广宗县| 衡山县| 克拉玛依市| 徐闻县|