勇礪商業(yè)評(píng)論 曾憲勇
5月28日,權(quán)威大模型測(cè)評(píng)機(jī)構(gòu)SuperCLUE《中文大模型基準(zhǔn)測(cè)評(píng)2025年5月報(bào)告》全新出爐。商湯「日日新 V6」(SenseNova-V6 Reasoner)憑借出色的綜合能力表現(xiàn),以62.96分的優(yōu)異成績(jī),與Doubao-1.5-thinking-pro并列國(guó)內(nèi)第一,摘得金牌,并在智能體Agent測(cè)試任務(wù)中獲得國(guó)內(nèi)最高分。
憑借多模態(tài)長(zhǎng)思維鏈訓(xùn)練、全局記憶、強(qiáng)化學(xué)習(xí)等技術(shù)創(chuàng)新,商湯「日日新 V6」以單一模型即可完成文本、多模態(tài)等多種任務(wù),在推理、數(shù)理、代碼等方面擁有顯著優(yōu)勢(shì),能夠深度理解人類(lèi)意圖,處理各類(lèi)復(fù)雜信息和復(fù)雜問(wèn)題,為真實(shí)的業(yè)務(wù)應(yīng)用提供強(qiáng)大助力。同時(shí),商湯「日日新 V6」的多模態(tài)訓(xùn)練整體效率對(duì)齊語(yǔ)言訓(xùn)練,實(shí)現(xiàn)業(yè)內(nèi)最優(yōu)水平,推理成本亦實(shí)現(xiàn)業(yè)界最低。
同時(shí),根據(jù)Hugging Face——全球最大的AI開(kāi)源社區(qū)上的數(shù)據(jù),在Open Compass本月的多模態(tài)大模型評(píng)測(cè)榜單中,商湯「日日新 V6」(SenseNova-V6 Pro)曾以80.4的總分,超越Gemini 2.5 Pro,位居第一,成為全球最強(qiáng)多模態(tài)大模型。
這是商湯日日新大模型半年內(nèi)第二次斬獲“雙冠”。
今年年初,商湯日日新就用同一個(gè)模型,在SuperCLUE《中文大模型基準(zhǔn)測(cè)評(píng)2024年度報(bào)告》評(píng)測(cè)和OpenCompass多模態(tài)多模態(tài)評(píng)測(cè)中,獲得雙第一,不但引發(fā)強(qiáng)烈關(guān)注,還引領(lǐng)了業(yè)界大語(yǔ)言模型和多模態(tài)大模型的一統(tǒng)化大潮。
此次成功衛(wèi)冕“雙冠”——同時(shí)在通用語(yǔ)言和多模態(tài)兩大權(quán)威榜單中奪冠,意味著商湯「日日新 V6」已成為全球最領(lǐng)先的大模型之一,持續(xù)引領(lǐng)多模態(tài)大模型突破AI能力邊界。
得益于高效能與低成本的完美結(jié)合,商湯「日日新 V6」自今年4月發(fā)布以來(lái),獲得了行業(yè)各界的廣泛支持,已在具身智能、智慧教育、智慧文旅等領(lǐng)域攜手多家合作伙伴,將共同推動(dòng)多行業(yè)、多場(chǎng)景落地。
秉承“大裝置-大模型-應(yīng)用”三位一體的發(fā)展戰(zhàn)略,商湯科技通過(guò)AI基礎(chǔ)設(shè)施系統(tǒng)與模型算法的聯(lián)合優(yōu)化,使模型的多模態(tài)和深度思考能力不斷提升,訓(xùn)練與推理成本持續(xù)降低,推動(dòng)生成式AI飛速發(fā)展,快速融入“百姓之日用”。(曾憲勇)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.