【TechWeb】6月20日,在華為開(kāi)發(fā)者大會(huì)2025(HDC 2025)上,全新發(fā)布基于盤(pán)古多模態(tài)大模型的世界模型,可以為智能駕駛、具身智能機(jī)器人的訓(xùn)練,構(gòu)建所需要的數(shù)字物理空間,實(shí)現(xiàn)持續(xù)優(yōu)化迭代。
在火星探測(cè)領(lǐng)域,盤(pán)古世界模型能夠基于單張火星地表圖片,生成高精度的數(shù)字物理空間。借助這一技術(shù),火星車(chē)可以模擬真實(shí)任務(wù)場(chǎng)景,通過(guò)分析環(huán)境中的距離和角度信息,預(yù)判可能的物理碰撞并訓(xùn)練避障能力;同時(shí),通過(guò)對(duì)數(shù)字空間中巖石的抓取模擬,還能提升機(jī)械臂的操作能力。
在智能駕駛領(lǐng)域,輸入首幀的行車(chē)場(chǎng)景、行車(chē)控制信息和路網(wǎng)數(shù)據(jù),盤(pán)古世界模型就可以生成每路攝像頭的行車(chē)視頻和激光雷達(dá)的點(diǎn)云,能夠?yàn)橹悄荞{駛生成大量的訓(xùn)練數(shù)據(jù),而無(wú)需依賴高成本的路采。廣汽集團(tuán)與華為云深度合作,依托盤(pán)古多模態(tài)大模型,實(shí)現(xiàn)了2D視頻模態(tài)與3D點(diǎn)云模態(tài)的像素級(jí)對(duì)應(yīng),在數(shù)分鐘內(nèi)即可完成復(fù)雜場(chǎng)景Corner case的復(fù)原,為端到端模型“兩天一個(gè)版本”的高效迭代提供了強(qiáng)力支撐。
盤(pán)古世界模型的發(fā)布,有助于進(jìn)一步推動(dòng)數(shù)字世界與物理世界深度融合,加速人工智能技術(shù)在更多復(fù)雜場(chǎng)景中落地應(yīng)用,為人們探索未知領(lǐng)域和構(gòu)建智能社會(huì)創(chuàng)造更多可能。(御風(fēng))
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.