阿里巴巴Qwen最新版本在全球AI排名中擊敗同行DeepSeek
阿里巴巴云開發(fā)的AI大型語言模型家族Qwen,正在日本擴大其影響力。
Abeja是日本一家開發(fā)分析物理空間系統(tǒng)的公司,于4月17日宣布了其新的QwQ-32B推理AI模型,該模型展示了將決策聯(lián)系在一起并輸出復雜答案的高度能力。該模型的開發(fā)基礎是阿里巴巴的Qwen模型。
阿里巴巴1月份發(fā)布的Qwen封閉模型Qwen2.5-Max,在全球AI模型性能的排名中,位列113個模型中的第六位。
Qwen2.5-Max擊敗了像DeepSeek這樣的著名競爭對手,不僅在語法等基本語言技能方面表現(xiàn)出色,而且在邏輯推理和數(shù)學方面也表現(xiàn)出色。
Qwen的開源模型也展示了高性能。Qwen2.5-32B在全球AI排名中位列第26位,超過了谷歌的Gemma-3-27B開源AI模型(第32位)和Meta的Llama 3 70B Instruct(第57位)。
開源AI模型可以由外部公司訓練以開發(fā)自己的AI。Abeja-Qwen2.5-32B——排名最高的日本模型,位列第21位——也是使用Qwen開發(fā)的。
其他日本初創(chuàng)公司也已發(fā)布或正在開發(fā)基于Qwen的模型,包括Elyza和Lightblue以及Axcxept。
野村綜合研究所的李表示,因為Qwen可以用小數(shù)據(jù)集產(chǎn)生高準確性,它在多個基準測試中因其高水平的日語語言能力而受到贊譽。
Qwen在海外也引起了廣泛關(guān)注。阿里巴巴云表示,在網(wǎng)上已經(jīng)開發(fā)了超過10萬個Qwen衍生模型。李說,與其他開源模型相比,Qwen能力在全球范圍內(nèi)受到高度評價。
阿里巴巴云計劃為日本公司調(diào)整和定制其模型。考慮到關(guān)鍵信息泄露到海外的風險,它將在日本的服務器上部署某些模型,告訴公司Qwen可以在不將數(shù)據(jù)傳輸?shù)胶M獾那闆r下使用。
阿里巴巴云已經(jīng)在與多家日本公司進行談判。日本部門負責人正弘表示,希望在三年內(nèi)將使用Qwen的公司數(shù)量增加到“1000家以上”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.