近日,云從科技自主研發的從容大模型在國際權威評測平臺OpenCompass最新全球多模態榜單中,以80.7分的綜合成績登頂榜首。
這一成績不僅刷新了國內AI模型在國際多模態測評中的最高得分紀錄,更超越谷歌、OpenAI等全球頂尖團隊,與商湯科技SenseNova(80.4分)、上海AI LAB InternVL(79.1分)占據前10名的半壁江山,展現了中國在通用人工智能領域的突破性進展。
此次評測中,從容大模型展現了全方位技術優勢。面對涵蓋視覺感知、認知理解與跨領域應用的8大核心數據集,該模型在醫學健康、數理邏輯、藝術設計等十余個專業領域表現突出。
尤其在MMBench中文測試、高難度學科綜合評測(MMMU)及高階推理榜單(MMStar)中均拔得頭籌,并在復雜場景文本識別(ocrbench)、開放域問答(MMVet)等關鍵場景中穩居全球前列,其綜合能力較國際頭部模型GPT-4.1領先近5分。
技術突破源于云從科技在多模態核心領域的持續深耕。從容大模型聚焦通用視覺語言理解與推理任務,通過三大核心領域(多模態對齊、高階推理、長上下文建模)的突破性優化,構建起全球領先的技術壁壘:
1.多模態對齊:
自建面向強化指令對齊的高質量基準數據集,覆蓋了圖文問答、多模態理解、多輪交互等任務場景,提升多模態理解與任務指令遵循的推理表現。
2.決策類人化:
首創融合DPO(直接偏好優化)與GRPO(生成式獎勵優化)的雙重對齊技術,無需依賴獎勵模型即可實現類人化推理決策,通過優化模型學習機制,從容大模型實現了更貼近人類思維的決策方式,在復雜問答與多輪交互中展現出更強的智能行為選擇能力;
3.高效工程優化:
重點攻克了4K高分辨率圖像問答場景,面向多模態文檔理解(OCR)對模型的圖像編碼器進行了結構優化,可處理高分辨率圖像與文檔(如合同、發票表格等),支持多模態文檔的智能審查、智能解析、智能問答等任務。
面對跨頁文檔分析、多輪對話等長文本場景,可精準追蹤超過3萬字的上下文邏輯;
4.原生多模態推理
模型全面升級,面向多圖、跨圖場景的圖文交錯模式和原生視頻模式,提供原生的多模態文檔理解和多模態視頻理解,可以實現跨圖比較、圖文組合推理、多圖問答等復雜多模態任務,進而提升大模型大模型的模型理解深度與廣度。
據「TMT星球」了解,目前該模型已在金融、制造、政務等多個領域通過AI智能體實現規模化落地。
某銀行基于該模型與云從合作打造風控合規案防智能平臺,構建風控AI智能體,實現風險識別自動化和問責標準化,投訴數量壓降50%以上;
在電商領域,云從科技為正浩創新部署的智能客服平臺,通過多模態對齊與知識庫精準匹配,將問答準確率提升至95%,客服月均效率提高24%。
“技術創新最終要服務于社會價值。”云從科技聯合創始人姚志強表示,團隊將持續探索多模態技術的安全落地模式,以自主創新的AI基礎設施,為全球智能化轉型提供更高效、更包容的技術支撐。
隨著從容大模型的持續進化,中國人工智能正以扎實的技術根基,開啟賦能實體經濟的新篇章。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.