99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

極佳科技毛繼明詳解:世界模型究竟是什么?有啥用?怎么用?

0
分享至

毛繼明簡介 :極佳科技合伙人&副總裁,擁有超過16年的工程研發(fā)與架構(gòu)經(jīng)驗,專注于大規(guī)模分布式系統(tǒng)和自動駕駛仿真技術(shù)。曾任百度Apollo仿真和工程負責人,以及百度、贏徹T10級別架構(gòu)師。

毛繼明在極佳科技推動了DriveDreamer系列等世界模型相關(guān)技術(shù)的研發(fā)與商業(yè)化落地,服務了數(shù)十家自動駕駛及機器人客戶。



如今,世界模型已經(jīng)成為具身智能實現(xiàn)突破的關(guān)鍵所在,但業(yè)界對于世界模型仍未形成統(tǒng)一的標準,也存在不同的觀點。

去年,極佳科技提出了一種名為DriveDreamer4D的框架,旨在利用世界模型的先驗知識來提升4D駕駛場景的重建效果。日前,極佳科技合伙人&副總裁——毛繼明,在由智猩猩、車東西主辦的「第四屆自動駕駛峰會」上,詳細介紹了世界模型的特點、作用及發(fā)展趨勢。

世界模型的發(fā)展背景

“每一代的智駕算法,對于數(shù)據(jù)數(shù)量及質(zhì)量的需求,都是在瘋狂提升的,這導致行業(yè)也在面臨數(shù)據(jù)缺口的困境。”

他指出,從2023年下半年開始,大家開始嘗試通過生成數(shù)據(jù)來去輔助算法性能的提升,但當時還對此存在疑慮。可從2024年下半年開始,世界模型開始收獲更多的信任。

未來,智能駕駛的用戶對于算法的需求會更高,甚至需要其超越人類。毛繼明指出,去年年底,小馬智行CTO樓天城曾在采訪中提出一個觀點:人天然是「雙標」的——由于對機器缺乏信任,所以機器必須要比人表現(xiàn)得更好才能獲得人類的信任。所以樓天成提出了一種非常形象的解決思路——Learn by practice。



“這里所說的Practice,必須在可交互的環(huán)境中進行,這樣才能確保安全和高效。那么要生成這樣的環(huán)境,仍然需要依賴世界模型。”

不管是生成可供訓練的數(shù)據(jù),還是生成可交互場景,世界模型都扮演著非常重要的角色。可以說,世界模型是智駕算法進入新一代的鑰匙。

毛繼明介紹稱,去年,世界模型的概念被提起的頻率非常高,包括李飛飛的world labs,Google的DeepMind,還有1x和Covariant這兩家具身智能公司,他們機器人的Foundation model也是用的世界模型的技術(shù)。更別提Tesla和Wayve,他們的智駕方案從2023年就開始應用世界模型。



再看國內(nèi),三大造車新勢力,蔚小理從去年下半年開始,也都紛紛提出要基于世界模型去構(gòu)建算法研發(fā)體系。此時,世界模型已經(jīng)不再是一個只存在于實驗室的預研課題,而是成為了產(chǎn)業(yè)界的共識,已經(jīng)到了應用的爆發(fā)期。

2023年9月,極佳科技首次將世界模型與智駕進行了結(jié)合,然后發(fā)表了一系列的論文——也就是DriveDreamer系列。

世界模型的三大功能

「世界模型究竟是什么?」這是許多人都會問到的問題,但其實,世界模型至今還沒有一個業(yè)界公認的標準化定義。而毛繼明通過對很多不同的世界模型的認知,對其中一些內(nèi)核功能進行了匯總:?

首先,從宏觀上來看,世界模型可被認為是真實世界的投影,至少是一個局部的投影。所以要想建設一個世界模型,第一步就是要對真實世界建模。所以,建模和關(guān)系抽象,是世界模型的第一個核心功能。



另外,若想讓世界模型發(fā)揮真正的價值,就需要與智能體去進行交互,因為前者需要為智能體去提供想象的能力。在這一過程中,智能體會給世界模型提供一個有缺失的觀測,而世界模型會補齊缺失的部分,返回給智能體一個完整的想象。

同時,世界模型也會為智能體提供“What-if”能力,也就是推理和預測能力。之后,世界模型還會返回一個對結(jié)果的好壞判定。

總結(jié)來看,世界模型一共有三大功能:建模、想象,預測。這就是傳統(tǒng)的世界模型應該具有的能力。

如何搭建世界模型?

極佳提出了一種基于分層的搭建方式,將視頻生成、空間幾何生成和物理引擎:

最底層:視頻生成

2024年上半年之前,幾乎所有的世界模型都是基于視頻生成來構(gòu)建的,其中最經(jīng)典的例子就是Sora。根據(jù)OpenAI發(fā)布的論文,他們認為Sora就是一個World Simulator。

毛繼明認為,視頻生成有兩個好處:

1、視覺是人們觀測世界最重要的Signal。

2、視頻生成的機制,天然就具有想象力和推測力。它能夠基于一張圖片去想象出其中的信息,同時又可以將圖片作為起始幀,去推理后邊會發(fā)生什么。也就是說,基于視頻生成模型,可以同時實現(xiàn)實際建模場景的想象和預測。

第二層:空間幾何生成

在去年下半年,新的觀點產(chǎn)生了——由于世界是具備物理空間的,而視頻生成的基本結(jié)構(gòu)都是基于像素的,所以業(yè)界發(fā)現(xiàn)后者對世界的建模是有缺失的。因此,大家開始集中式地引入了「空間幾何生成」的新維度。

毛繼明表示,在引入空間幾何后,再配合原有的視頻生成,可以說基本能解決世界appearance層面的問題,但其實這仍然不夠。“因為這個世界,最終還是由一些物理規(guī)律所驅(qū)動的。而以當下的技術(shù),很難單純地從Observation中學到物理規(guī)律。

第三層:物理引擎層

所以極佳通過引入新的一層——「物理引擎層」,來驅(qū)動模型在時間緯度上進行一些合理的變換。我們稱之為「世界模型中的基礎模型層」,它代表了世界中物質(zhì)的確定性部分。”

例如,黃仁勛在演示Cosmos時,經(jīng)常和Omniverse放在一起去講,后者正是物理引擎與空間幾何這兩層的內(nèi)容。

更進一步,毛繼明指出:“除了物質(zhì)的確定性部分,世界模型還應該包含不確定性的部分,也就是有人參與的部分。”,這部分可以被稱之為「世界知識層」。



他介紹稱,「世界知識層」的構(gòu)成首先是一些領(lǐng)域約束,例如交規(guī)——大家開車遵守交規(guī),但也有可能不遵守交規(guī)。所以領(lǐng)域約束其實是一種「弱約束」,它并不像物理規(guī)律。其次,是Reward function,世界模型想要呈現(xiàn)它的判定能力的話,就必須由reward function去進行評分。第三就是Distributions,它代表人類宏觀傾向性的數(shù)學化的表達。

另外,很多世界模型也引入了大語言模型,這是因為模型很難通過Observation完全地重建出來,很多時候還需要輔以大語言模型中的知識。如此,有了Distribution、Reward function和領(lǐng)域約束,世界模型中的世界知識,最終應該固化在Long-term memory中,在世界模型架構(gòu)中產(chǎn)生作用。

如何真正落地?

毛繼明稱,要想將世界模型真正落地在具體場景中,還需要一系列對外的組件:包括知識更新的接口、Condition的Adapter,以及Internal的Agents。

他介紹稱,在實際場景中落地時,世界模型最經(jīng)典的一個用法就是「數(shù)據(jù)泛化應用」了,也就是通過世界模型的想象能力,在給定一些簡單條件的前提下,就可以還原出世界應有的樣子。

“數(shù)據(jù)泛化,激活的是condition和視覺生成這兩層。這也是極佳科技一開始切入到世界模型賽道時,所做的起始工作。包括DriveDreamer和DriveDreamer-2。”

毛繼明表示,在傳統(tǒng)的視頻生成模型基礎上,極佳著重優(yōu)化了「多視角一致」的能力,這也是智駕領(lǐng)域必要的一個Feature。

同時,為了滿足不同客戶的個性化需求,極佳也優(yōu)化了Condition Adapter,這有助于生成可泛化的多樣性數(shù)據(jù),去進一步優(yōu)化感知算法的魯棒性。

毛繼明展示了一個案例:給世界模型的一個Condition,即僅僅告訴世界模型車道在哪里,車在哪里,世界模型即可發(fā)揮出想象力,想象出來一個完整的世界。更進一步,如果需要更充分的想象力,可以使用文字作為輸入,然后利用它的想象力去生成一個復雜場景,這就是在DriveDreamer-2中實現(xiàn)的功能。



另外一個業(yè)務場景,是4D場景重建。這會新增兩個功能區(qū):1、是幾何生成,2、Internal agents。極佳有兩篇論文與之對應——Drive Dreamer 4D和Reckon Dreamer,這也是極佳和理想汽車的合作項目。

“它的應用場景更適用于數(shù)字孿生,也就是說可以對Identical case進行重建,并且在重建的三維世界中完成可交互的反饋式事件。”

根據(jù)極佳重建場景的具體實踐來看,如果接入了自動駕駛算法和控制器,可以實現(xiàn)在這個世界里自由移動,滿足閉環(huán)仿真的需求,實現(xiàn)Learn by practice。

世界模型將會如何發(fā)展?

“我們希望未來的Agent能夠像人一樣思考,所以它應該擁有人類大腦中的各種組件,其中最核心的組件就是世界模型。它最終會部署到車端或者是機器人端,被點亮所有功能。”

毛繼明認為,世界模型是現(xiàn)實世界的投影,但是現(xiàn)實世界是非常復雜的。它被多維度、多類型的規(guī)律共同驅(qū)動、共同影響。

例如:視頻生成,代表的是平面像素級別的變化,它是由真實世界中廣泛存在的在物體上的光的漫反射、鏡面反射等等光學規(guī)律所驅(qū)動的;

空間幾何,表達了真實世界中具體存在的宏觀物體,應該具有明確的體積屬性、位置屬性;

物理引擎指的是說物體應該具有材質(zhì)屬性,以及物體之間相互運動的動力學表達。這三種表達都是在不同的層級上,必須用不同的規(guī)律去驅(qū)動。

“我們?nèi)绻ソㄔO一個完備的、至少局部完備的世界模型,需要對多種領(lǐng)域有深刻的認知,我們需要找到一種辦法,把不同領(lǐng)域的不同規(guī)律融合到一起,這是非常大的挑戰(zhàn)。

接下來他指出,之所以要為世界模型分層,其中一個原因,是能夠注入先驗知識,這樣可以不使用那么多數(shù)據(jù)就可以完成世界模型的建設。

毛繼明還認為,世界模型的這種構(gòu)建邏輯和自動駕駛的發(fā)展類似——伴隨著真實數(shù)據(jù)的積累,以及生成數(shù)據(jù)的反哺,一定會發(fā)生跨層級融合。

就像自動駕駛多模塊架構(gòu)終究會演進到單模型端到端架構(gòu)一樣。“我們堅信世界模型會變成一個end toend one model,也就是說世界模型最終會把多層次變成更少的層次,最后融合成為一個統(tǒng)一大模型。”

進一步,他表示,在商業(yè)化實踐中,客戶通常要求是,在當前的已有客戶數(shù)據(jù)質(zhì)量基礎上,以最低的計算成本、時間成本、GPU資源成本以及存儲成本,達到世界模型的精度要求。

這需要在:數(shù)據(jù)質(zhì)量、模型精度、成本接受度這三方面,針對每個客戶,滿足他們不同的三維度平衡需求。所以他認為,幾乎不太可能有「一種模型包打天下」的情況,而是要構(gòu)建世界模型的分層框架。

“在多個商業(yè)項目落地過程中,一定會沉淀下來很多不同的做法和不同的組件。當不同場景的研發(fā)成果沉淀為可部署的組件后,就可以面對多樣化的客戶需求靈活地組織,以最快的方式來達到要求。”



不過毛繼明也直言,目前,世界模型的性能提升,是個「老大難問題」。如果類比人類大腦的直覺感知來看,現(xiàn)在世界模型的運行方式需要通過非常復雜的推理機制,能耗非常高,速度也很慢。

“如果以現(xiàn)在這樣的效率,那世界模型是不可能實現(xiàn)高效部署的。所以我覺得「端側(cè)的世界模型」就是終局,我們終究要探索一些新的世界模型算法范式,這是全行業(yè)共同去探討的一個話題。”

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
人民幣突然暴漲,全球等待中國節(jié)后開局!

人民幣突然暴漲,全球等待中國節(jié)后開局!

小波股事歷程
2025-05-04 19:58:08
一場1-2,讓歐冠4強首支出局隊浮現(xiàn):全主力被雙殺,晉級決賽難了

一場1-2,讓歐冠4強首支出局隊浮現(xiàn):全主力被雙殺,晉級決賽難了

小火箭愛體育
2025-05-04 07:11:28
斯諾克最新戰(zhàn)報!趙心童3連鞭到手,單局4分險勝,世界冠軍告急!

斯諾克最新戰(zhàn)報!趙心童3連鞭到手,單局4分險勝,世界冠軍告急!

劉姚堯的文字城堡
2025-05-04 21:28:53
賈玲終于露面了,她沒有復胖越來越有女人味了,氣質(zhì)優(yōu)雅很美

賈玲終于露面了,她沒有復胖越來越有女人味了,氣質(zhì)優(yōu)雅很美

鄉(xiāng)野小珥
2025-05-05 00:20:28
白宮急了!如果沒汽車關(guān)稅,美國汽車業(yè)將涼涼

白宮急了!如果沒汽車關(guān)稅,美國汽車業(yè)將涼涼

咻潘說車
2025-05-04 16:33:25
不是迷信!明日立夏,3事別犯了忌諱:1不早、2不曬、3不補

不是迷信!明日立夏,3事別犯了忌諱:1不早、2不曬、3不補

匹夫來搞笑
2025-05-04 16:00:38
汪小菲妻子海量不雅照曝光,穿著大膽疑整容,父母真實職業(yè)曝光

汪小菲妻子海量不雅照曝光,穿著大膽疑整容,父母真實職業(yè)曝光

古希臘掌管月桂的神
2025-05-04 10:02:38
四川男子與女友吵架,為泄憤從16樓扔下電競椅!警方:刑拘

四川男子與女友吵架,為泄憤從16樓扔下電競椅!警方:刑拘

南方都市報
2025-05-04 16:29:48
沒想到!五一最熱城市排名揭曉,原以為長沙很靠前,結(jié)果很意外!

沒想到!五一最熱城市排名揭曉,原以為長沙很靠前,結(jié)果很意外!

青青子衿
2025-05-03 08:41:57
上海宣布:開通3條應急線路!高速堵成停車場?有腦溢血患者緊急求助,救援啟動→

上海宣布:開通3條應急線路!高速堵成停車場?有腦溢血患者緊急求助,救援啟動→

上觀新聞
2025-05-04 19:30:34
0-2安洗瑩,王祉怡賽后發(fā)言有點可怕,頭腦清晰,還有自己打算

0-2安洗瑩,王祉怡賽后發(fā)言有點可怕,頭腦清晰,還有自己打算

郝小小看體育
2025-05-04 18:45:29
美媒曬鮑爾默包機:這趟回LA的航班將成為史上最安靜的航程

美媒曬鮑爾默包機:這趟回LA的航班將成為史上最安靜的航程

直播吧
2025-05-04 11:00:12
美國關(guān)稅,突發(fā)!

美國關(guān)稅,突發(fā)!

證券時報
2025-05-04 17:34:05
中國大量暴富的人正在返貧,好戲才剛開始!

中國大量暴富的人正在返貧,好戲才剛開始!

互聯(lián)網(wǎng)思維
2025-04-27 23:34:33
別拿生命去發(fā)生性關(guān)系

別拿生命去發(fā)生性關(guān)系

深度報
2025-05-04 23:29:42
為什么一再強調(diào)要敬畏自然?網(wǎng)友分享后背發(fā)涼,原來萬物皆有靈性

為什么一再強調(diào)要敬畏自然?網(wǎng)友分享后背發(fā)涼,原來萬物皆有靈性

史詩長歌
2024-11-07 07:45:02
血液科醫(yī)生:6種食物是甲醛大戶,常吃會讓白血病找上門

血液科醫(yī)生:6種食物是甲醛大戶,常吃會讓白血病找上門

菁媽育兒
2025-04-27 13:26:36
北京警方抓獲3人:炒股群里總共有30人,其中29個是托

北京警方抓獲3人:炒股群里總共有30人,其中29個是托

環(huán)球網(wǎng)資訊
2025-05-04 21:07:02
70歲以后,高級的活法:3不沾,3不省

70歲以后,高級的活法:3不沾,3不省

三人行旅行記
2025-05-04 15:34:56
“繼承權(quán)”不用爭了!2025年新規(guī)下:父母的房子全部將這樣處理

“繼承權(quán)”不用爭了!2025年新規(guī)下:父母的房子全部將這樣處理

白馬驚天劍
2025-05-01 13:55:12
2025-05-05 07:04:49
RoboX
RoboX
關(guān)注智能汽車、機器人在內(nèi)的具身智能前沿科技
132文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

巴菲特:理性看待AI炒作 耐心是關(guān)鍵

頭條要聞

貴州游船側(cè)翻游客:看見船翻了 當時就哭了

頭條要聞

貴州游船側(cè)翻游客:看見船翻了 當時就哭了

體育要聞

聯(lián)盟30隊首發(fā)得分后衛(wèi),他只能排第29位?

娛樂要聞

55歲王菲跟“李亞鵬時期”完全不同!

財經(jīng)要聞

一個時代的結(jié)束!巴菲特年底將卸任

汽車要聞

小米SU7大優(yōu)惠!5月限時購車權(quán)益送輔助駕駛

態(tài)度原創(chuàng)

手機
教育
房產(chǎn)
親子
公開課

手機要聞

曝蘋果正在開發(fā)20周年紀念版iPhone

教育要聞

你以為高二很輕松?成績告訴你,錯了!

房產(chǎn)要聞

最強書包官宣落位!海口這個片區(qū),將徹底引爆!

親子要聞

假期作業(yè)不能停! 楊雪呀

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 旬阳县| 屯门区| 海晏县| 旬邑县| 三河市| 买车| 多伦县| 肥城市| 固阳县| 宣恩县| 遵化市| 固始县| 丽水市| 华容县| 新闻| 固始县| 新兴县| 吉林市| 乡城县| 肇源县| 邹城市| 梨树县| 叙永县| 大关县| 新干县| 资阳市| 阳信县| 牟定县| 突泉县| 板桥市| 马山县| 休宁县| 垫江县| 扬中市| 梨树县| 绥中县| 南开区| 大关县| 凤阳县| 遵义市| 土默特右旗|