7月22日凌晨,阿里巴巴旗下大模型千問(Qwen)在 Hugging Face 上發布 Qwen3-235B-A22B-Instruct-2507-FP8。這一更新版本被視為 Qwen3-235B-A22B-FP8的“非思考模式”升級版。
根據官方介紹,新版本模型在指令遵循、邏輯推理、文本理解、數學、科學、編程與工具使用等通用能力上均實現大幅提升。
在多個公開基準測評中,Qwen3-235B-A22B-Instruct-2507-FP8超越了包括 Kimi-K2、DeepSeek-V3在內的頂級開源模型,并在部分任務上超過了 Claude-Opus4-Non-thinking 等閉源強模型。測評項目涵蓋知識(GQPA)、數學(AIME25)、編程(LiveCodeBench)、偏好對齊(Arena-Hard)及 Agent 能力(BFCL)等。
此外,據介紹,該模型還在以下幾個方面取得突破:一是對多語言長尾知識的覆蓋能力顯著增強;二是在主觀與開放性任務中,生成內容更符合用戶偏好;三是上下文長度支持擴展至256K,進一步提升了長文本處理能力。(袁寧)
本文來自網易科技報道,更多資訊和深度內容,關注我們。