2025年1月29日凌晨,阿里云通義千問旗艦版模型Qwen2.5-Max正式發布。新模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源MoE模型以及最大的開源稠密模型。與此同時,阿里巴巴美股股價在當天收盤前半小時出現顯著上漲,漲幅1%快速拉升至6.7%。
// 阿里云除夕夜拋出重磅新模型//
1月29日凌晨,阿里云通義千問旗艦版模型Qwen2.5-Max正式發布。據微信公眾號“阿里云”消息,Qwen2.5-Max模型是阿里云通義團隊對MoE模型的最新成果,預訓練數據超過20萬億tokens。新模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源MoE模型以及最大的開源稠密模型。
在測試大學水平知識的MMLU-Pro、評估編程能力的LiveCodeBench、綜合能力評估的LiveBench,以及近似人類偏好的Arena-Hard等多個權威評測中,該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領先的性能。
(圖片來自:阿里云微信公眾號)
由于無法訪問GPT-4o和Claude-3.5-Sonnet等閉源模型的基座模型,通義團隊將Qwen2.5-Max與目前領先的開源MoE模型 DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中,Qwen2.5-Max全部超越了對比模型。
(圖片來自:阿里云微信公眾號)
// 或引發中國AI資產新一輪重估//
當天,阿里巴巴美股股價在收盤前半小時出現顯著上漲,漲幅由1%快速拉升至6.7%。按市值計算,阿里巴巴市值單日市值增長143.62億美元。
而行情異動背后,是否意味著中國AI資產的重估時機已至?
日前,中國人工智能企業深度求索(DeepSeek)發布其最新開源模型DeepSeek-R1,用較低的成本達到了接近于美國開放人工智能研究中心(OpenAI)開發的GPT-o1的性能。這一進展破解了全球人工智能產業長期以來“堆算力”的路徑依賴,其影響波及了資本市場。就中國A股市場來看,1月27日,WindDeepSeek合作商指數大漲了10.96%,多只成分個股漲幅超過10%。
當下,國內外廠商在開閉源路線上各有側重。比如OpenAI的GPT-4模型采用閉源模式,而Meta選擇完全開源。而DeepSeek和阿里云通義團隊都是開源路線的堅持者。
DeepSeek的成功也被認為是開源模型的勝利。圖靈獎得主、Meta 首席人工智能科學家 Yann LeCun此前表示,對于DeepSeek的成功,其正確的理解應該是:開源模型正在超越專有模型。
LeCun 表示,DeepSeek 之所以這次一鳴驚人,是因為他們從開放研究和開源(如 Meta 的 PyTorch 和 Llama)中獲益。DeepSeek 提出了新想法,并在他人工作的基礎上構建。因為他們的工作是公開發布和開源的,每個人都可以從中受益,這就是開放研究和開源的力量。
阿里集團CEO吳泳銘也曾表示,“通義的開源模型在中文世界的開發者使用廣泛,當開發者使用阿里云的開源模型,需要把應用部署到線上的時候,就會自然而然地選用阿里云的服務?!?/p>
而繼DeepSeek之后,Qwen2.5-Max的發布無疑是中國AI陣營在高性能、低成本技術路線上的又一重要突破。有市場人士分析稱,此前過度聚焦DeepSeek,卻忽視了包括阿里通義在內的中國AI整體性追趕。
值得一提的是,就阿里云而言,其還有"強大模型+充足算力+完整云平臺"的組合優勢,或有望引發DeepSeek之后的中國AI資產新一輪重估。
(Wind綜合財聯社、證券時報、華爾街見聞)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.