4月10日,商湯科技舉辦2025技術(shù)交流日活動,重磅推出全新升級的“日日新SenseNova V6”(以下簡稱:日日新 V6)大模型體系,通過多模態(tài)長思維鏈訓(xùn)練、全局記憶、強化學(xué)習(xí)的技術(shù)突破,形成領(lǐng)先的多模態(tài)推理能力,并突破成本邊界。
商湯科技董事長兼首席執(zhí)行官徐立表示:“AI之道,在于百姓之日用。商湯日日新 V6將跨越多模態(tài)邊界,釋放推理與智能的無限可能。”
據(jù)介紹,通過構(gòu)造多模態(tài)的強思維鏈數(shù)據(jù)和搭建多模態(tài)強化學(xué)習(xí)的語境,和去年發(fā)布的日日新大模型5.0及5.5相比,日日新 V6在多模態(tài)方面表現(xiàn)更加出眾,并針對推理能力進行了強化。
為滿足不同場景的需要,日日新 V6包含若干版本。其中SenseNova V6 Pro為原生多模態(tài)通用大模型,采用了6200億參數(shù)的混合專家架構(gòu),實現(xiàn)文本、圖像和視頻的原生融合;SenseNova V6 Reasoner Pro在SenseNova V6 Pro基礎(chǔ)上,通過多模態(tài)長思維鏈訓(xùn)練和多模態(tài)增強學(xué)習(xí),形成突出的多模態(tài)推理能力;SenseNova V6 Video是視頻理解模型,可以理解總結(jié)視頻內(nèi)容,并在此基礎(chǔ)上進行深入分析和推理;SenseNova V6 Omni是輕量級的全模態(tài)交互模型,深度融合語言、語音和視頻,提供實時交互體驗。
作為擁有超6000億參數(shù)的MoE原生多模態(tài)通用大模型,日日新 V6實現(xiàn)了多項技術(shù)突破,憑借單一模型就可以完成文本、多模態(tài)等各類任務(wù):擁有超過200B高質(zhì)量多模態(tài)長思維鏈數(shù)據(jù),最長64K思維鏈;數(shù)據(jù)分析能力大幅領(lǐng)先GPT-4o;多模態(tài)深度推理能力對標(biāo)OpenAI o1;憑借其全局記憶能力,日日新 V6突破長視頻理解,支持10分鐘的視頻理解及深度推理。
在現(xiàn)場,徐立展示了日日新 V6的多模態(tài)能力。例如,用戶可以將自己的數(shù)學(xué)題手寫答案拍照上傳,通過V6 Reasoner Pro的多步驟推理思考,模型先進行解題,并對用戶的答案進行分析,然后通過V6 Omni的音視頻溝通能力,模型以引導(dǎo)提問的方式為用戶逐步剖析解題思路,還支持語音實時答疑,隨時解答用戶在解題過程中遇到的問題。
比起市面上的其他拍照搜題應(yīng)用,日日新 V6更像是一個“一對一私教”。V6還可以實現(xiàn)通過攝像頭實時解讀繪本,根據(jù)畫面和用戶的語音要求講故事,在交流中,V6可針對不同的對話內(nèi)容和場景需求,即時切換語氣、情感與音調(diào)。
目前,基于多模態(tài)大模型,商湯開發(fā)了多種新場景應(yīng)用。例如在長視頻上,商湯上線了視頻理解功能,提供對教學(xué)視頻、旅游視頻、生活視頻的解析、總結(jié)、對話,以及對情景之外的情節(jié)和邏輯的補全。面向日常應(yīng)用的需求,SenseNova V6 Omni具備數(shù)學(xué)解題、點讀翻譯、文旅講解、繪本講解四大功能。在財務(wù)審核、購物比價、商鋪運營等場景中,也可以利用V6來解決用戶需求。
徐立表示,商湯發(fā)展AI的目標(biāo)便是“在真實的環(huán)境中解決那些日常煩瑣、但是重要的行業(yè)需求”,“當(dāng)AI聚集了人類現(xiàn)有的大量平均水平的知識之后,它就能夠運用觸類旁通的能力,為開放問題形成一種真正意義上的確定性,完成從模型到客戶使用的‘最后一公里’。”
在技術(shù)交流日上,商湯宣布了與多家軟硬件企業(yè)的戰(zhàn)略簽約,其中包括具身智能企業(yè)傅利葉。基于SenseNova V6 Omni,傅利葉的機器人可以通過融合圖像、視頻、語音和文本信息理解環(huán)境,進行思考與表達,洞察用戶的需求與情緒,與人類進行交互。機器人在輸出語音的同時,還能同步生成與語義相匹配的動作,實現(xiàn)語言與行為的統(tǒng)一。
整合日日新 V6全部能力,商湯商量也迎來全面升級,并推出全新商量App。用戶通過一個入口,即可體驗文字、圖像、視頻等多種模態(tài)流式交互體驗,目前已開放內(nèi)測。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.