99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

具身智能實力派!十年多模態打底,世界模型開路,商湯悟能來了

0
分享至

克雷西 發自 凹非寺
量子位 | 公眾號 QbitAI

WAIC 2025大模型論壇上,商湯科技正式發布了「悟能」具身智能平臺,官宣入局具身智能。

以此為出發點,商湯科技在具身智能領域的布局也開始浮出水面。



站在這個具身智能的風口之上,商湯選擇此時入局,體現了怎樣的思考,其背后又有著怎樣的積淀?

吸引AI頭部企業、初創公司和投資者們紛紛踏足,具身智能又究竟發展到了哪一步?

在這場論壇上,這些問題的答案被一一揭開。

新型多模態模型亮相WAIC

先來看商湯發布的日日新V6.5多模態推理大模型

日日新6.5獨創了圖文交錯思維鏈,跨模態推理精度顯著提升。

傳統的多模態推理模型,在推理之前會將圖像轉變成文本解讀,后續的推理過程就變成了純文本。

而在圖文交錯思維鏈當中,圖像會以本體的形式參與到整個推理過程。



在這種圖文混合的思考模式下,日日新6.5的多媒體推理能力在多個數據集上都超越了Gemini 2.5 Pro。



同時依托輕量Vision?Encoder?+和縱深LLM架構,日日新6.5相比6.0表現提升了6.99%,但推理成本只有日日新6.0的30%,綜合算下來性價比提升了5倍。



隨著模型能力提升,商湯在大模型落地上,就不止做“賣軟件”的生意,還做“賣大腦”的生意。

從多模態模型到具身智能大腦

其實,商湯能夠高調切入具身智能,是其從感知視覺、多模態,走向物理世界交互的必然結果。

商湯科技聯合創始人、執行董事、首席科學家林達華認為,多模態是邁向AGI的必經之路。因此,只有能夠同時“讀文本、看世界、動手腳”,AI才可能真正理解并改造物理環境。

而且超過十年的行業落地經驗,包括在自動駕駛領域的成功實踐,也讓商湯在感知、定位、軌跡規劃和安全冗余等方面累積了大量真實數據與世界模型經驗。

這些能力遷移到機器人等具身形態——相當于先在“會開車的大機器人”身上練兵,再擴展到泛化的移動與操作場景。

因此,商湯繼「開悟」世界模型之后,發布全新「悟能」具身智能平臺。一端承接日日新多模態大模型的通用能力,一端擁有打造和使用世界模型進行訓練的經驗,進而打造生態體系。



「開悟」世界模型背后包括商湯積累的10萬3D資產,支持多視角視頻生成,最多可以同時生成11個攝像頭角度視頻,并在長達150s的時間保持時空一致。

空間上,它可以理解遮擋、前后層級,讓同一物體在不同視角下呈現一致外觀。

時間上,它能夠理解時序和運動規律,讓物體在時間推移中保持自然連貫的變化。



并且支持參數化編輯,天氣、光照、道路,以及路上的車輛,都支持一鍵變換。



在具身智能場景中,還可以同時處理人、物、場,構建4D的真實世界。



并且這種世界同時包含了第一和第三視角。



這樣做的目的,是同時滿足“機器人自己看到什么”與“人類示范動作長什么樣”這兩類信息的互補需求。

第一視角是機器人在真實運行時唯一能獲取的感知流,它決定了模型推理時的輸入分布;第三視角則能完整捕捉人類或機器人全身的姿態骨骼和環境關系,為動作意圖、路徑規劃提供清晰標簽。

將兩種視角對齊訓練,可以讓模型學會把外部示范映射成自身可用的感覺?動作對,一方面顯著減少昂貴的遙操作數據量,另一方面提高跨機器人、跨場景的泛化能力,使同一個“大腦”既能看懂人類演示,也能在自己的相機視角下執行,從而加速具身智能落地。

基于「開悟」世界模型,商湯科技推出了「悟能」具身智能平臺架構,包含感知、決策與行動等多個層次:

  • 感知層:視覺/語音/觸覺多傳感輸入;
  • 決策層:LLM+世界模型協同規劃;
  • 行動層:VLA端到端控制機械臂、移動底盤。

這一大腦,能夠支持自動駕駛、機器人、機器狗等具身場景中的感知、導航、交互等功能。





在具身智能落地上,商湯選擇“軟硬協同”路線。目前已與眾多人形機器人、物流搬運底盤廠商、家用陪伴平臺等伙伴達成合作,將T模型預裝進不同形態的機器人,讓硬件天然具備多模態感知和推理能力。

未來,隨著硬件越賣越多,回流的視覺、語音和操作數據也越豐富,進一步反哺模型迭代,形成正向的數據飛輪。

破解具身智能行業難題

除了發布新產品,商湯還在這次論壇上組織具身智能行業從業者以及學術界人士,一起探討了具身世界模型發展的關鍵問題。



圓桌討論首先聚焦的問題,依然是數據稀缺——一個具身智能從業者面臨的共同痛點。

北京大學助理教授、智源學者、銀河通用創始人兼CTO王鶴介紹了他的解決方案——先在虛擬環境把pick?and?place做到幾乎與現實一致,再用少量真機樣本校正長尾場景

而商湯“開悟”世界模型恰好承接了“99%”的合成任務,能夠批量生成長時多攝像一致的視頻。

商湯與傅利葉等伙伴合作推出的超千萬數量級的機器人,則源源不斷回流那關鍵“1%”的真實視覺、語音和操作日志,二者形成互補閉環,解決了數據從量到質的難題。

當然,數據只有“量”還遠遠不夠,商湯聯合創始人、執行董事、CTO王曉剛認為,僅有機器人本身攝像頭的第一視角并不夠,上帝俯瞰的第三視角能補全肢體骨骼與全局語義;只有把兩種視角對齊,端到端訓練才能兼顧感知與動作。

澳大利亞科學院院士、南洋理工大學教授陶大程進一步指出,第一視角不僅要看圖像,還要疊加深度、慣性、力覺等多傳感器流,才能完整地捕捉“感知—意圖—行動”閉環

為此,商湯在世界模型中同步生成并標定第一和第三視角數據,確保時空一致,再映射回端側傳感器,讓機器人既“看自己”也“學別人”,從而縮短仿真與現實之間的落差。

這一做法也契合圓桌嘉賓關于“視角一致性決定遷移效果”形成的共識。

關于模型路線的取舍,同樣引發了熱議。

上海交通大學人工智能學院副院長、上海穹徹智能科技創始人盧策吾認為,必須兼顧通用與場景閉環

上海市信息投資股份有限公司副總裁、庫帕斯科技董事長山棟明則從投資與供應鏈角度呼應這一觀點。他認為當下只要能把設備鋪出去,真實數據自然會涌回

商湯正在驗證這條“雙輪”路徑——多模態大模型日日新V6.5提供跨領域能力,垂直應用不斷把真實反饋注入基座,驅動模型滾動升級。

綜合來看,商湯通過世界模型的大規模仿真、合作硬件的真實數據回流、第一與第三視角的融合標注,以及“通用大腦 + 場景閉環”的協同演進,把數據、算法與硬件生態織成了一條自循環鏈。

商湯的數據飛輪已起步,正全速領跑未來賽道,將通過多模態與硬件協同,共筑具身智能護城河。

從工業到家庭,千萬數量級機器人將承載這顆具身大腦。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
宗慶后再被曝猛料,魔爪伸向多名女員工,還有浙大高材生為他生子

宗慶后再被曝猛料,魔爪伸向多名女員工,還有浙大高材生為他生子

八斗小先生
2025-07-17 15:12:37
懂車帝把36輛車逼上“絕命高速”后車企集體破防:到底在怕什么?

懂車帝把36輛車逼上“絕命高速”后車企集體破防:到底在怕什么?

艾米手工作品
2025-07-26 09:43:35
搞勞民傷財的“形象工程”!山西一縣委原書記被雙開,任內違規使用資金建仿真椰子樹

搞勞民傷財的“形象工程”!山西一縣委原書記被雙開,任內違規使用資金建仿真椰子樹

瀟湘晨報
2025-07-27 09:47:06
他去世后,被做成游戲NPC與母親“重逢”,令全網淚奔

他去世后,被做成游戲NPC與母親“重逢”,令全網淚奔

世界音樂公號
2025-07-20 23:29:19
中國網球大捷!2-0奪冠,張帥勇奪女雙冠軍,王欣瑜豪奪3連勝

中國網球大捷!2-0奪冠,張帥勇奪女雙冠軍,王欣瑜豪奪3連勝

全能體育柳號
2025-07-27 09:14:31
同樣14億人口,為什么中國滿世界買糧食,印度卻能大量出口?

同樣14億人口,為什么中國滿世界買糧食,印度卻能大量出口?

壹知眠羊
2025-07-23 07:57:43
今年是中國文壇羞恥年

今年是中國文壇羞恥年

不正確
2025-07-26 21:40:36
娃哈哈家族大戰終于真相大白了!原來從頭到尾都是場鬧劇

娃哈哈家族大戰終于真相大白了!原來從頭到尾都是場鬧劇

史書無明
2025-07-26 08:01:47
鄭智或下課,國足中方教練或敲定,50歲,年薪200萬,或9月上任

鄭智或下課,國足中方教練或敲定,50歲,年薪200萬,或9月上任

東球弟
2025-07-27 11:22:23
全市預警升級!大到暴雨+雷暴大風+37℃今明殺到天津!一區啟動暴雨Ⅲ級應急響應!

全市預警升級!大到暴雨+雷暴大風+37℃今明殺到天津!一區啟動暴雨Ⅲ級應急響應!

天津人
2025-07-27 17:41:42
9000萬歐元先生遭巴黎棄用,即將離隊

9000萬歐元先生遭巴黎棄用,即將離隊

星耀國際足壇
2025-07-27 12:59:25
佛山5200只“滅蚊魚”上崗,應對基孔肯雅熱:不挑食、一天滅蚊438只

佛山5200只“滅蚊魚”上崗,應對基孔肯雅熱:不挑食、一天滅蚊438只

魯中晨報
2025-07-27 07:50:02
青樓出身,無法生育被休,改嫁上將連生11子,人人敬重的廣東之母

青樓出身,無法生育被休,改嫁上將連生11子,人人敬重的廣東之母

柳絮憶史
2025-07-21 11:30:50
美國猶太人資本巨頭貝萊德,已經全面滲透中國市場!

美國猶太人資本巨頭貝萊德,已經全面滲透中國市場!

華人星光
2025-07-20 14:19:00
韓紅說得真沒錯!這一次,誰也救不了“偷雞不成蝕把米”的張碧晨

韓紅說得真沒錯!這一次,誰也救不了“偷雞不成蝕把米”的張碧晨

南南說娛
2025-07-26 09:29:57
世錦賽游泳第1日綜述:李冰潔破亞洲紀錄,覃海洋、張雨霏晉級

世錦賽游泳第1日綜述:李冰潔破亞洲紀錄,覃海洋、張雨霏晉級

燒體壇
2025-07-27 21:34:07
俄媒:一旦開戰,中方只靠解放軍難以取勝,必須調動另一股力量!

俄媒:一旦開戰,中方只靠解放軍難以取勝,必須調動另一股力量!

健身狂人
2025-07-05 13:40:32
金正男妻兒下落曝光:經臺灣逃亡至荷蘭,后卻被美國中情局帶走

金正男妻兒下落曝光:經臺灣逃亡至荷蘭,后卻被美國中情局帶走

混沌錄
2025-07-26 21:40:05
深圳中考分析:整體穩定,六大重構,走讀實惠!

深圳中考分析:整體穩定,六大重構,走讀實惠!

師說君
2025-07-27 16:08:36
李霄鵬:所有隊員都付出了百分之二百的努力,這讓我比較感動

李霄鵬:所有隊員都付出了百分之二百的努力,這讓我比較感動

懂球帝
2025-07-27 22:45:09
2025-07-27 23:28:49
量子位 incentive-icons
量子位
追蹤人工智能動態
10945文章數 176197關注度
往期回顧 全部

科技要聞

77歲諾獎得主,用15條句話把AI圈鎮住了!

頭條要聞

14歲輟學女生簽MCN 因"無法忍受"強行解約被起訴索賠

頭條要聞

14歲輟學女生簽MCN 因"無法忍受"強行解約被起訴索賠

體育要聞

約克雷斯身邊的男人,才是阿森納的最佳引援

娛樂要聞

X玖少年團9成員現狀揭秘:2人成頂流

財經要聞

陳文輝:為什么耐心資本這么重要?

汽車要聞

搭載華為乾崑智駕 一汽奧迪Q6L e-tron預售35.3萬起

態度原創

藝術
本地
游戲
家居
健康

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

換個城市過夏天|風拂鹽湖,躲進格爾木的盛夏清涼

LPL第三階段:還能不能好了?WBG讓一追二,戰勝AL

家居要聞

環繞設計 空間動線合理

呼吸科專家破解呼吸道九大謠言!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 司法| 兰州市| 新乡县| 南丹县| 彭州市| 四子王旗| 开化县| 古交市| 葵青区| 胶州市| 江陵县| 商河县| 甘南县| 文登市| 大田县| 隆昌县| 衡阳市| 淅川县| 松溪县| 江阴市| 盘山县| 连山| 文昌市| 井冈山市| 汤阴县| 建平县| 板桥市| 奉节县| 吉安市| 五寨县| 香格里拉县| 东辽县| 靖州| 临朐县| 会宁县| 金阳县| 舞阳县| 湘西| 建宁县| 赤水市| 武安市|