網易首頁 > 網易號 > 正文申請入駐

DeepSeek后，阿里又出重磅

2025-01-29 17:05:44　來源: Wind萬得

江蘇舉報

分享至

2025年1月29日凌晨，阿里云通義千問旗艦版模型Qwen2.5-Max正式發布。新模型展現出極強勁的綜合性能，在多項公開主流模型評測基準上錄得高分，全面超越了目前全球領先的開源MoE模型以及最大的開源稠密模型。與此同時，阿里巴巴美股股價在當天收盤前半小時出現顯著上漲，漲幅1%快速拉升至6.7%。

// 阿里云除夕夜拋出重磅新模型//

1月29日凌晨，阿里云通義千問旗艦版模型Qwen2.5-Max正式發布。據微信公眾號“阿里云”消息，Qwen2.5-Max模型是阿里云通義團隊對MoE模型的最新成果，預訓練數據超過20萬億tokens。新模型展現出極強勁的綜合性能，在多項公開主流模型評測基準上錄得高分，全面超越了目前全球領先的開源MoE模型以及最大的開源稠密模型。

在測試大學水平知識的MMLU-Pro、評估編程能力的LiveCodeBench、綜合能力評估的LiveBench，以及近似人類偏好的Arena-Hard等多個權威評測中，該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩，甚至領先的性能。

（圖片來自：阿里云微信公眾號）

由于無法訪問GPT-4o和Claude-3.5-Sonnet等閉源模型的基座模型，通義團隊將Qwen2.5-Max與目前領先的開源MoE模型 DeepSeek V3、最大的開源稠密模型Llama-3.1-405B，以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中，Qwen2.5-Max全部超越了對比模型。

（圖片來自：阿里云微信公眾號）

// 或引發中國AI資產新一輪重估//

當天，阿里巴巴美股股價在收盤前半小時出現顯著上漲，漲幅由1%快速拉升至6.7%。按市值計算，阿里巴巴市值單日市值增長143.62億美元。

而行情異動背后，是否意味著中國AI資產的重估時機已至？

日前，中國人工智能企業深度求索(DeepSeek)發布其最新開源模型DeepSeek-R1，用較低的成本達到了接近于美國開放人工智能研究中心(OpenAI)開發的GPT-o1的性能。這一進展破解了全球人工智能產業長期以來“堆算力”的路徑依賴，其影響波及了資本市場。就中國A股市場來看，1月27日，WindDeepSeek合作商指數大漲了10.96%，多只成分個股漲幅超過10%。

當下，國內外廠商在開閉源路線上各有側重。比如OpenAI的GPT-4模型采用閉源模式，而Meta選擇完全開源。而DeepSeek和阿里云通義團隊都是開源路線的堅持者。

DeepSeek的成功也被認為是開源模型的勝利。圖靈獎得主、Meta 首席人工智能科學家 Yann LeCun此前表示，對于DeepSeek的成功，其正確的理解應該是：開源模型正在超越專有模型。

LeCun 表示，DeepSeek 之所以這次一鳴驚人，是因為他們從開放研究和開源（如 Meta 的 PyTorch 和 Llama）中獲益。DeepSeek 提出了新想法，并在他人工作的基礎上構建。因為他們的工作是公開發布和開源的，每個人都可以從中受益，這就是開放研究和開源的力量。

阿里集團CEO吳泳銘也曾表示，“通義的開源模型在中文世界的開發者使用廣泛，當開發者使用阿里云的開源模型，需要把應用部署到線上的時候，就會自然而然地選用阿里云的服務?！?/p>

而繼DeepSeek之后，Qwen2.5-Max的發布無疑是中國AI陣營在高性能、低成本技術路線上的又一重要突破。有市場人士分析稱，此前過度聚焦DeepSeek，卻忽視了包括阿里通義在內的中國AI整體性追趕。

值得一提的是，就阿里云而言，其還有"強大模型+充足算力+完整云平臺"的組合優勢，或有望引發DeepSeek之后的中國AI資產新一輪重估。

（Wind綜合財聯社、證券時報、華爾街見聞）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.