勇礪商業評論 曾憲勇
5月28日,權威大模型測評機構SuperCLUE《中文大模型基準測評2025年5月報告》全新出爐。商湯「日日新 V6」(SenseNova-V6 Reasoner)憑借出色的綜合能力表現,以62.96分的優異成績,與Doubao-1.5-thinking-pro并列國內第一,摘得金牌,并在智能體Agent測試任務中獲得國內最高分。
憑借多模態長思維鏈訓練、全局記憶、強化學習等技術創新,商湯「日日新 V6」以單一模型即可完成文本、多模態等多種任務,在推理、數理、代碼等方面擁有顯著優勢,能夠深度理解人類意圖,處理各類復雜信息和復雜問題,為真實的業務應用提供強大助力。同時,商湯「日日新 V6」的多模態訓練整體效率對齊語言訓練,實現業內最優水平,推理成本亦實現業界最低。
同時,根據Hugging Face——全球最大的AI開源社區上的數據,在Open Compass本月的多模態大模型評測榜單中,商湯「日日新 V6」(SenseNova-V6 Pro)曾以80.4的總分,超越Gemini 2.5 Pro,位居第一,成為全球最強多模態大模型。
這是商湯日日新大模型半年內第二次斬獲“雙冠”。
今年年初,商湯日日新就用同一個模型,在SuperCLUE《中文大模型基準測評2024年度報告》評測和OpenCompass多模態多模態評測中,獲得雙第一,不但引發強烈關注,還引領了業界大語言模型和多模態大模型的一統化大潮。
此次成功衛冕“雙冠”——同時在通用語言和多模態兩大權威榜單中奪冠,意味著商湯「日日新 V6」已成為全球最領先的大模型之一,持續引領多模態大模型突破AI能力邊界。
得益于高效能與低成本的完美結合,商湯「日日新 V6」自今年4月發布以來,獲得了行業各界的廣泛支持,已在具身智能、智慧教育、智慧文旅等領域攜手多家合作伙伴,將共同推動多行業、多場景落地。
秉承“大裝置-大模型-應用”三位一體的發展戰略,商湯科技通過AI基礎設施系統與模型算法的聯合優化,使模型的多模態和深度思考能力不斷提升,訓練與推理成本持續降低,推動生成式AI飛速發展,快速融入“百姓之日用”。(曾憲勇)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.