99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

具身智能大腦+首個SaaS開源框架,智源研究院刷新10項測評基準

0
分享至

允中 發自 凹非寺
量子位 | 公眾號 QbitAI

具身智能大腦+全球首個具身智能SaaS開源框架,智源研究院在具身智能領域發力了——

“通用具身大腦”RoboBrain 2.0,面向真實物理環境,集感知、推理與規劃于一體。

全新32B版本憑借時空認知能力的突破,在多項權威具身智能基準上全面刷新紀錄。



RoboOS 2.0,作為全球首個具身智能SaaS開源框架,創新性集成MCP協議與無服務器架構,實現輕量化部署,打通智能大腦與異構本體協同通路。

兩招齊出,并且全部開源,發布便在全球社交媒體和技術社區引發廣泛熱議。



不少具身智能專業人士就指出,具身大腦+跨本體大小腦協同框架,是推動機器人從“單機智能”邁向“群體智能”的有效路徑,能加速具身智能技術從實驗室走向真實場景。



一起來看具體技術細節。

RoboBrain 2.0:突破三大核心瓶頸

當前主流AI模型在應對真實物理環境時,普遍存在三大核心瓶頸:空間理解精度不足時間依賴建模薄弱長鏈推理能力欠缺

RoboBrain 2.0正是針對于此,在三大關鍵能力上實現了全面突破,顯著提升了對復雜具身任務的理解與執行能力。

  • 空間理解
  • 精確點定位和邊界框預測:能夠根據復雜指令在圖像中定位物體或區域。
  • 空間關系理解:理解物體之間的相對位置和方向。
  • 空間推理:支持基于場景圖的實時構建和更新,進行復雜的三維空間推理。
  • 時間建模
  • 長期規劃:能夠進行多步任務規劃,支持長期目標的實現。
  • 閉環交互:支持基于反饋的動態調整,適應動態環境。
  • 多智能體協作:能夠協調多個智能體的行為,完成復雜任務。
  • 長鏈推理
  • 鏈式推理:能夠進行多步推理,支持復雜任務的逐步解決。
  • 因果邏輯:能夠從復雜指令中提取因果邏輯,并與環境狀態對齊。
  • 決策透明性:能夠生成推理過程的詳細解釋,支持決策的透明性和可解釋性。



△RoboBrain能力概覽圖

模塊化編碼器-解碼架構

具體來說,RoboBrain 2.0采用模塊化的編碼器 - 解碼器架構,為復雜的具身任務實現了感知、推理和規劃的統一

與專注于通用靜態視覺問答(VQA)的傳統視覺 - 語言模型(VLMs)不同,RoboBrain 2.0在保持強大通用VQA能力的同時,專門針對具身推理任務,如空間感知、時間建模和長鏈因果推理。該架構將高分辨率圖像、多視圖輸入、視頻幀、語言指令和場景圖編碼為統一的多模態標記序列,以進行全面處理。



△RoboBrain2.0模型架構圖

多模態數據集和分階段訓練策略

訓練方面,RoboBrain 2.0采用的是多模態數據集和分階段訓練策略。

RoboBrain 2.0基于全面且多樣化的多模態數據集,融合高分辨率圖像、多視角視頻序列、場景圖、3D場景數據及復雜自然語言指令,能全面賦能機器人在具身環境中的感知、推理與行動能力。



△RoboBrain 2.0訓練數據集

該多模態數據集聚焦三大核心領域,為復雜物理場景提供有力支持:

  • 通用多模態理解:整合標準視覺問答、區域級查詢、OCR視覺問答及多輪視覺對話,優化語言表達的多樣性與語義一致性,通過豐富的視覺-語言交互數據,提升模型對復雜任務的理解與響應能力,適應從簡單問答到多輪對話的多樣場景。
  • 空間感知:支持高精度物體定位、邊界框預測及對象功能性識別,覆蓋室內外復雜視覺場景與3D空間推理,助力機器人精準解析物體關系、空間屬性及場景上下文,應對遮擋、多視角變化等挑戰,滿足高精度定位與交互需求。
  • 時間建模:通過多模態數據支持長程任務規劃、閉環反饋機制及多智能體協作,強化模型在動態環境中的任務分解、動作序列預測及實時交互能力,確保在復雜物理場景中實現連續決策、靈活協作與高效任務執行。RoboBrain 2.0以卓越的多模態感知、精細的空間推理及強大的長時規劃能力,賦能機器人在具身環境中進行交互推理、多智能體協作及高效任務規劃,助力復雜物理場景的智能感知與決策。

RoboBrain 2.0采用三階段遞進式訓練流程

  • 第一階段:基礎時空學習(Foundational Spatiotemporal Learning)

在第一階段,RoboBrain 2.0專注于構建其在空間感知和時間理解方面的基礎能力。模型通過大規模多模態數據集進行訓練,這些數據集涵蓋了密集標注的圖文數據、視頻問答以及指代表達理解任務。

通過這一階段的訓練,模型能夠處理靜態圖像和視頻流,掌握物體的基本空間關系和運動事件,為后續更復雜的任務奠定了堅實的基礎。

  • 第二階段:具身時空增強(Embodied Spatiotemporal Enhancement)

在第二階段,RoboBrain 2.0通過引入高分辨率多視圖圖像、第一人稱視頻數據以及導航和交互任務,進一步增強其在具身任務中的時空建模能力。模型學習處理長序列的時空信息,支持多智能體協調、長期規劃和動態環境中的適應性決策。

這一階段的訓練使模型能夠更好地將歷史視覺信息與當前指令相結合,從而在動態交互環境中實現更連貫的長期規劃和穩健的場景理解。

  • 第三階段:具身情境中的推理鏈訓練(Chain-of-Thought Reasoning in Embodied Contexts)

在第三階段,RoboBrain 2.0通過監督微調和強化微調,進一步提升其在復雜具身任務中的推理能力。模型使用多輪推理示例進行訓練,這些示例涵蓋了長期任務規劃、操作預測、閉環交互、時空理解以及多機器人協作等任務。

通過這一階段的訓練,模型能夠生成推理鏈,支持復雜任務的逐步推理和決策,從而在具身情境中實現更高效、更準確的推理和規劃能力。



研究人員采用FlagEvalMM框架,全面驗證了RoboBrain 2.0的空間與時間推理能力。

  • 空間推理:在BLINK(83.95)、CV-Bench(85.75)、Where2Place(73.59)等9項基準測試中,RoboBrain-32B/7B-2.0屢獲SOTA,精準實現物體定位、邊界框預測及空間參照,超越Gemini、GPT-4o等基線。



  • 時間推理:在多機器人規劃(80.33)、Ego-Plan2(57.23)、RoboBench(72.16)中,展現卓越長程規劃、閉環反饋及多智能體協作能力,領跑Qwen2.5-VL、Claude等模型。



值得一提的是,除了32B版本,此前智源研究院還推出了RoboBrain 2.07B版本,具備緊湊高效的模型結構,其輕量化設計適配邊緣設備部署需求,能在低資源環境下穩定運行,同時相比主流的開閉源模型性能依舊強勁。

從單機智能邁向群體智能

依托跨本體大小腦協作框架RoboOS 2.0的多本體規劃能力,RoboBrain 2.0已實現多智能體間協作執行任務,支持商超廚房居家等多場景部署。



跨本體具身大小腦協作框架RoboOS 2.0是全球首個基于具身智能SaaS平臺、支持無服務器一站式輕量化機器人本體部署的開源框架

同時,RoboOS 2.0也是全球首個支持MCP的跨本體具身大小腦協作框架,旨在構建具身智能領域的“應用商店”生態。

RoboOS 2.0實現了大腦云端優化推理部署與小腦技能的免適配注冊機制,顯著降低開發門檻,典型場景下,相關代碼量僅為傳統手動注冊方式的1/10

具體來說,RoboOS是面向多機器人協作的“大腦-小腦”分層系統,包含三大核心組件:(a) 基于云計算的具身大腦模型,負責高級認知與多智能體協同;(b) 分布式小腦模塊群,專司機器人專項技能執行;(c) 實時共享內存機制,強化環境態勢感知能力。



△RoboOS 2.0框架(SaaS + MCP模式)

相較于1.0,RoboOS 2.0對端到端推理鏈路進行了系統級優化,整體性能提升達30%,全鏈路平均響應時延低至3ms以下,端云通信效率提升27倍

在功能層面,新增了多本體時空記憶場景圖(Scene Graph)共享機制,支持動態環境下的實時感知與建模;同時引入多粒度任務監控模塊,實現任務閉環反饋,有效提升機器人任務執行的穩定性與成功率。

RoboOS多機協作實現流程包含四個關鍵階段:首先通過分層任務分解將復雜任務逐級拆解,隨后基于網絡拓撲結構進行子任務動態分配,再由分布式智能體集群并行執行各子任務,最后通過實時共享內存機制動態更新環境狀態與任務進度。



基于RoboOS 2.0協作框架,可充分發揮RoboBrain 2.0強大的空間理解、時序規劃與閉環推理能力的同時,一鍵下載并部署來自全球開發者創建的相同型號機器人本體的小腦技能,完成大小腦的全鏈路無縫整合。

RoboBrain 2.0可通過像素級空間理解,支持下游小腦模型高精度抓取、搬運、放置等操作,同時,根據實時感知任務執行狀態調整執行計劃,適應動態環境變化,實現閉環反饋機制。

目前,RoboBrain 2.0及RoboOS 2.0已全面開源,模型權重、訓練代碼與評測基準全部可用。

智源研究院還同步推出單機版產品線及RoboSkill技能商店,通過深度集成實現機器人技能模塊智能匹配與一鍵適配功能,標準化接口有效消除廠商與硬件適配流程差異。還有開箱即用鏡像,支持“三行指令”極速部署,全面賦能開發者高效構建智能機器人系統。

傳送門

RoboBrain 2.0

Page:https://superrobobrain.github.io
GitHub:https://github.com/FlagOpen/RoboBrain2.0
ArXiv:https://arxiv.org/abs/2507.02029
Checkpoint-7B:https://huggingface.co/BAAI/RoboBrain2.0-7B
Checkpoint-32B:https://huggingface.co/BAAI/RoboBrain2.0-32B
RoboBrain2.0的FlagRelease多芯片鏡像:
https://huggingface.co/FlagRelease/RoboBrain2.0-7B-FlagOS
https://huggingface.co/FlagRelease/RoboBrain2.0-32B-FlagOS
https://huggingface.co/FlagRelease/RoboBrain2.0-7B-FlagOS-Ascend

RoboOS 2.0

Page:https://flagopen.github.io/RoboOS
GitHub:https://github.com/FlagOpen/RoboOS
GitHub單機輕量版:https://github.com/FlagOpen/RoboOS/tree/stand-alone
GitHub技能商店:https://github.com/FlagOpen/RoboSkill
ArXiv:https://arxiv.org/abs/2505.03673

— 完 —

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
北京國有資本運營管理有限公司黨委書記、董事長吳禮順履新北京市國資委黨委書記、主任

北京國有資本運營管理有限公司黨委書記、董事長吳禮順履新北京市國資委黨委書記、主任

澎湃新聞
2025-07-20 15:08:28
五常聯合起來的能量到底有多大?史詩級副本《觸犯天條》了解下!

五常聯合起來的能量到底有多大?史詩級副本《觸犯天條》了解下!

大又元
2025-07-18 17:39:29
全網群嘲的“老母親給兒子32萬買車”事件, 他貪婪的模樣真丑啊

全網群嘲的“老母親給兒子32萬買車”事件, 他貪婪的模樣真丑啊

悠閑歷史
2025-07-06 09:41:03
兒媳年薪80萬,婆婆逼她給小姑子50萬,不然就離婚,兒子笑了:那就離

兒媳年薪80萬,婆婆逼她給小姑子50萬,不然就離婚,兒子笑了:那就離

澤澤先生
2025-07-12 07:00:07
援藏干部董旭斌已任浙江省林業局黨組書記、局長(正廳長級)

援藏干部董旭斌已任浙江省林業局黨組書記、局長(正廳長級)

澎湃新聞
2025-07-20 16:14:27
東北人的“始祖鳥崇拜”,體制內男人最好的醫美

東北人的“始祖鳥崇拜”,體制內男人最好的醫美

鈦媒體APP
2025-05-16 11:29:30
那不勒斯球衣標識出現拼寫錯誤,市場經理:不改了,錯誤難免

那不勒斯球衣標識出現拼寫錯誤,市場經理:不改了,錯誤難免

懂球帝
2025-07-20 10:24:09
江西省人大常委會副主任王少玄,當選新職

江西省人大常委會副主任王少玄,當選新職

政知新媒體
2025-07-20 14:30:40
同樣是“長公主”,43歲宗馥莉對比53歲孟晚舟,面相、衣品大不同

同樣是“長公主”,43歲宗馥莉對比53歲孟晚舟,面相、衣品大不同

鋭娛之樂
2025-07-19 22:50:06
十五位女明星的腳,你最喜歡誰的

十五位女明星的腳,你最喜歡誰的

手工制作阿殲
2025-07-20 11:25:44
哈蘭德和女友近照,傷愈復出,2億英鎊身價世界第一,女友絕美

哈蘭德和女友近照,傷愈復出,2億英鎊身價世界第一,女友絕美

大西體育
2025-07-20 15:33:14
三峽大壩“賬本”曝光:運行了20余年,2500億投入如今回本了嗎?

三峽大壩“賬本”曝光:運行了20余年,2500億投入如今回本了嗎?

霽寒飄雪
2025-07-20 09:18:01
打臉不:歐盟爆出中國車真實銷量

打臉不:歐盟爆出中國車真實銷量

艾米手工作品
2025-07-20 11:33:54
成都一女子,因“生菜吃成法杖”火了,網友:羊毛不帶這么薅的

成都一女子,因“生菜吃成法杖”火了,網友:羊毛不帶這么薅的

觀察鑒娛
2025-07-20 12:08:40
梁朝偉摟劉嘉玲拍合照,兩人素顏晨跑,結婚17年依舊甜蜜

梁朝偉摟劉嘉玲拍合照,兩人素顏晨跑,結婚17年依舊甜蜜

魯中晨報
2025-07-19 13:00:10
50歲男人染指69名女性,從20歲到63歲不等,只因他太了解女性需求

50歲男人染指69名女性,從20歲到63歲不等,只因他太了解女性需求

易玄
2025-07-12 03:29:57
緬甸園區老板送回高考生,“你前途光明,不該留在這里”

緬甸園區老板送回高考生,“你前途光明,不該留在這里”

觀察者網
2025-07-19 16:48:37
全紅嬋訓練視頻曝光!又胖了,剛動兩下就體力不支,累得喘粗氣

全紅嬋訓練視頻曝光!又胖了,剛動兩下就體力不支,累得喘粗氣

心靜物娛
2025-07-20 13:30:51
35張不可思議的照片,誰看誰震驚!

35張不可思議的照片,誰看誰震驚!

中國藝術家
2025-05-22 05:25:05
1945年女“臥底”被執行槍決,處刑前遞出黃紙,法官看完:快住手!

1945年女“臥底”被執行槍決,處刑前遞出黃紙,法官看完:快住手!

紀實文錄
2025-07-16 11:37:54
2025-07-20 17:59:00
量子位 incentive-icons
量子位
追蹤人工智能動態
10893文章數 176192關注度
往期回顧 全部

科技要聞

Manus"跑路新加坡"后,創始人首次復盤

頭條要聞

極氪被指賣"0公里二手車"虛增銷量 官方:正常商業行為

頭條要聞

極氪被指賣"0公里二手車"虛增銷量 官方:正常商業行為

體育要聞

零成本搞定艾頓斯馬特 湖人還有大動作?

娛樂要聞

肖戰改名官宣!徹底不裝了,要自由

財經要聞

夾縫中的芯片之王:黃仁勛能守住4萬億嗎?

汽車要聞

輔助駕駛五維測評 蔚來世界模型:大智小糙

態度原創

游戲
旅游
親子
教育
軍事航空

《馬里奧賽車:世界》制作人員名單暗示DLC可能性

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

親子要聞

盧靖姍挺七月孕肚健身,肚子大四肢纖細,透露還有3個月寶寶出生

教育要聞

浦口、江寧、六合、高淳…發布2025中招第二批次投檔線!

軍事要聞

美記者:若特朗普決定 澤連斯基或被流放

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 含山县| 丰都县| 西吉县| 宜阳县| 安新县| 西吉县| 西乌| 凌云县| 莱芜市| 延安市| 赤水市| 子长县| 阳朔县| 钟山县| 桦南县| 东明县| 黎城县| 华容县| 木里| 娱乐| 保山市| 肃宁县| 额敏县| 九寨沟县| 武宣县| 四会市| 雷州市| 青岛市| 墨玉县| 蕉岭县| 静宁县| 白银市| 江陵县| 苍溪县| 宜良县| 二连浩特市| 新巴尔虎右旗| 长宁区| 浦东新区| 桃江县| 江山市|