99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

全棧自研,理想發(fā)布下一代自動(dòng)駕駛架構(gòu) MindVLA

0
分享至


【編者按】理想汽車發(fā)布下一代自動(dòng)駕駛架構(gòu)MindVLA,這是一個(gè)融合視覺、語(yǔ)言和行為智能的機(jī)器人大模型新范式。MindVLA賦予車輛強(qiáng)大的3D空間理解、邏輯推理和行為生成能力,使其能夠感知、思考并適應(yīng)環(huán)境。該架構(gòu)通過3D高斯表示、MoE混合專家架構(gòu)的LLM基座模型、Diffusion軌跡優(yōu)化等關(guān)鍵技術(shù),實(shí)現(xiàn)了模型參數(shù)規(guī)模與實(shí)時(shí)推理性能的平衡。

2025年3月18日,理想汽車自動(dòng)駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬在NVIDIA GTC 2025發(fā)表主題演講《VLA:邁向自動(dòng)駕駛物理智能體的關(guān)鍵一步》,分享了理想汽車對(duì)于下一代自動(dòng)駕駛技術(shù)MindVLA的最新思考和進(jìn)展。

賈鵬表示:“MindVLA是機(jī)器人大模型,它成功整合了空間智能、語(yǔ)言智能和行為智能,一旦跑通物理世界和數(shù)字世界結(jié)合的范式后,將有望賦能更多行業(yè)。MindVLA將把汽車從單純的運(yùn)輸工具轉(zhuǎn)變?yōu)橘N心的專職司機(jī),它能聽得懂、看得見、找得到。我們希望MindVLA能為汽車賦予類似人類的認(rèn)知和適應(yīng)能力,將其轉(zhuǎn)變?yōu)槟軌蛩伎嫉闹悄荏w。”


理想全棧自研MindVLA 深度融合空間、語(yǔ)言及行為智能

基于端到端+VLM雙系統(tǒng)架構(gòu)的最佳實(shí)踐,及對(duì)前沿技術(shù)的敏銳洞察,理想自研VLA模型——MindVLA。VLA是機(jī)器人大模型的新范式,其將賦予自動(dòng)駕駛強(qiáng)大的3D空間理解能力、邏輯推理能力和行為生成能力,讓自動(dòng)駕駛能夠感知、思考和適應(yīng)環(huán)境。


MindVLA不是簡(jiǎn)單地將端到端模型和VLM模型結(jié)合在一起,所有模塊都是全新設(shè)計(jì)。3D空間編碼器通過語(yǔ)言模型,和邏輯推理結(jié)合在一起后,給出合理的駕駛決策,并輸出一組Action Token(動(dòng)作詞元),Action Token指的是對(duì)周圍環(huán)境和自車駕駛行為的編碼,并通過Diffusion(擴(kuò)散模型)進(jìn)一步優(yōu)化出最佳的駕駛軌跡,整個(gè)推理過程都要發(fā)生在車端,并且要做到實(shí)時(shí)運(yùn)行。


MindVLA六大關(guān)鍵技術(shù) 樹立全新技術(shù)范式

MindVLA打破自動(dòng)駕駛技術(shù)框架設(shè)計(jì)的傳統(tǒng)模式,使用能夠承載豐富語(yǔ)義,且具備出色多粒度、多尺度3D幾何表達(dá)能力的3D高斯(3D Gaussian)這一優(yōu)良的中間表征,充分利用海量數(shù)據(jù)進(jìn)行自監(jiān)督訓(xùn)練,極大提升了下游任務(wù)性能。


理想從0開始設(shè)計(jì)和訓(xùn)練了適合MindVLA的LLM基座模型,采用MoE混合專家架構(gòu),引入Sparse Attention(稀疏注意力),實(shí)現(xiàn)模型稀疏化,保證模型規(guī)模增長(zhǎng)的同時(shí),不降低端側(cè)的推理效率。基座模型訓(xùn)練過程中,理想加入大量3D數(shù)據(jù),使模型具備3D空間理解和推理能力。為了進(jìn)一步激發(fā)模型的空間智能,理想加入了未來幀的預(yù)測(cè)生成和稠密深度的預(yù)測(cè)等訓(xùn)練任務(wù)。

LLM基座模型獲得3D空間智能的同時(shí),還需要進(jìn)一步提升邏輯推理能力。理想訓(xùn)練LLM基座模型學(xué)習(xí)人類的思考過程,讓快慢思考有機(jī)結(jié)合到同一模型中,并可以實(shí)現(xiàn)自主切換快思考和慢思考。為了把NVIDIA Drive AGX的性能發(fā)揮到極致,MindVLA采取小詞表結(jié)合投機(jī)推理,以及創(chuàng)新性地應(yīng)用并行解碼技術(shù),進(jìn)一步提升了實(shí)時(shí)推理的速度。至此,MindVLA實(shí)現(xiàn)了模型參數(shù)規(guī)模與實(shí)時(shí)推理性能之間的平衡。

MindVLA利用Diffusion將Action Token解碼成優(yōu)化的軌跡,并通過自車行為生成和他車軌跡預(yù)測(cè)的聯(lián)合建模,提升在復(fù)雜交通環(huán)境中的博弈能力。同時(shí)Diffusion可以根據(jù)外部條件,例如風(fēng)格指令,動(dòng)態(tài)調(diào)整生成結(jié)果。為了解決Diffusion模型效率低的問題,MindVLA采用Ordinary Differential Equation(常微分方程)采樣器,實(shí)現(xiàn)了2-3步就能完成高質(zhì)量軌跡的生成。面對(duì)部分長(zhǎng)尾場(chǎng)景,理想建立起人類偏好數(shù)據(jù)集,并且創(chuàng)新性地應(yīng)用RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))微調(diào)模型的采樣過程,最終使MindVLA能夠?qū)W習(xí)和對(duì)齊人類駕駛行為,顯著提升安全下限。


MindVLA基于自研的重建+生成云端統(tǒng)一世界模型,深度融合重建模型的三維場(chǎng)景還原能力與生成模型的新視角補(bǔ)全,以及未見視角預(yù)測(cè)能力,構(gòu)建接近真實(shí)世界的仿真環(huán)境。源于世界模型的技術(shù)積累與充足計(jì)算資源的支撐,MindVLA實(shí)現(xiàn)了基于仿真環(huán)境的大規(guī)模閉環(huán)強(qiáng)化學(xué)習(xí),即真正意義上的從“錯(cuò)誤中學(xué)習(xí)”。過去一年,理想自動(dòng)駕駛團(tuán)隊(duì)完成了世界模型大量的工程優(yōu)化,顯著提升了場(chǎng)景重建與生成的質(zhì)量和效率,其中一項(xiàng)工作是將3D GS的訓(xùn)練速度提升至7倍以上。


理想通過創(chuàng)新性的預(yù)訓(xùn)練和后訓(xùn)練方法,讓MindVLA實(shí)現(xiàn)了卓越的泛化能力和涌現(xiàn)特性,其不僅在駕駛場(chǎng)景下表現(xiàn)優(yōu)異,在室內(nèi)環(huán)境也展示出了一定的適應(yīng)性和延展性。


MindVLA賦能汽車變?yōu)閷B毸緳C(jī) 重塑用戶體驗(yàn)

MindVLA將為用戶帶來全新的產(chǎn)品形態(tài)和產(chǎn)品體驗(yàn),有MindVLA賦能的汽車是聽得懂、看得見、找得到的專職司機(jī)。“聽得懂”是用戶可以通過語(yǔ)音指令改變車輛的路線和行為,例如用戶在陌生園區(qū)尋找超市,只需要通過理想同學(xué)對(duì)車輛說:“帶我去找超市”,車輛將在沒有導(dǎo)航信息的情況下,自主漫游找到目的地;車輛行駛過程中,用戶還可以跟理想同學(xué)說:“開太快了”“應(yīng)該走左邊這條路”等,MindVLA能夠理解并執(zhí)行這些指令。


“看得見”是指MindVLA具備強(qiáng)大的通識(shí)能力,不僅能夠認(rèn)識(shí)星巴克、肯德基等不同的商店招牌,當(dāng)用戶在陌生地點(diǎn)找不到車輛時(shí),可以拍一張附近環(huán)境的照片發(fā)送給車輛,擁有MindVLA賦能的車輛能夠搜尋照片中的位置,并自動(dòng)找到用戶。

“找得到”意味著車輛可以自主地在地庫(kù)、園區(qū)和公共道路上漫游,其中典型應(yīng)用場(chǎng)景是用戶在商場(chǎng)地庫(kù)找不到車位時(shí),可以跟車輛說:“去找個(gè)車位停好”,車輛就會(huì)利用強(qiáng)大的空間推理能力自主尋找車位,即便遇到死胡同,車輛也會(huì)自如地倒車,重新尋找合適的車位停下,整個(gè)過程不依賴地圖或?qū)Ш叫畔ⅲ耆蕾嘙indVLA的空間理解和邏輯推理能力。

總結(jié)來說,對(duì)于用戶而言,有MindVLA賦能的車不再只是一個(gè)駕駛工具,而是一個(gè)能與用戶溝通、理解用戶意圖的智能體;對(duì)于汽車行業(yè)而言,像iPhone 4重新定義了手機(jī),MindVLA也將重新定義自動(dòng)駕駛;對(duì)于人工智能領(lǐng)域而言,汽車作為物理人工智能的最佳載體,未來探索出物理世界和數(shù)字世界結(jié)合的范式,將有望賦能多個(gè)行業(yè)協(xié)同發(fā)展。

由 CSDN&Boolan 聯(lián)合舉辦的「2025 全球機(jī)器學(xué)習(xí)技術(shù)大會(huì)」將于 4 月 18-19 日在上海隆重舉行。大會(huì)云集院士、10 所高校科研工作者、近 30 家一線科技企業(yè)技術(shù)實(shí)戰(zhàn)專家組成的超 50 位重磅嘉賓。他們將以獨(dú)特的視角,解讀智能體、聯(lián)邦學(xué)習(xí)、多模態(tài)大模型、強(qiáng)化學(xué)習(xí)等前沿議題。無論你是科研學(xué)者、技術(shù)專家,還是行業(yè)從業(yè)者,都將在這里收獲前沿洞見和實(shí)踐經(jīng)驗(yàn),共同推動(dòng) AI 時(shí)代的技術(shù)變革與應(yīng)用落地。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
揚(yáng)眉吐氣!中國(guó)男籃大勝美國(guó)隊(duì),廣東隊(duì)立大功,歸化球員太給力

揚(yáng)眉吐氣!中國(guó)男籃大勝美國(guó)隊(duì),廣東隊(duì)立大功,歸化球員太給力

宗介說體育
2025-06-13 14:11:06
特朗普承認(rèn)對(duì)以色列打擊伊朗知情

特朗普承認(rèn)對(duì)以色列打擊伊朗知情

界面新聞
2025-06-14 09:30:55
尼日爾斷電求援,趕走中國(guó)技術(shù)遭反制,北京開出新條件

尼日爾斷電求援,趕走中國(guó)技術(shù)遭反制,北京開出新條件

野山歷史
2025-06-14 09:35:36
同樣是總統(tǒng),為什么金正恩只給李在明面子?中國(guó)早有預(yù)判

同樣是總統(tǒng),為什么金正恩只給李在明面子?中國(guó)早有預(yù)判

任紀(jì)煙
2025-06-13 18:13:20
航班飛行中一乘客充電寶突然冒煙,上海航空回應(yīng)!旅客:機(jī)艙內(nèi)煙霧彌漫,大家用礦泉水接力協(xié)助撲救

航班飛行中一乘客充電寶突然冒煙,上海航空回應(yīng)!旅客:機(jī)艙內(nèi)煙霧彌漫,大家用礦泉水接力協(xié)助撲救

每日經(jīng)濟(jì)新聞
2025-06-14 12:10:14
陳麗華立遺囑:兒女每人100億,余下幾百億都?xì)w“唐僧”老公

陳麗華立遺囑:兒女每人100億,余下幾百億都?xì)w“唐僧”老公

深析古今
2025-06-13 22:38:06
印度想與我國(guó)互免簽證,此訴求為何未被采納?

印度想與我國(guó)互免簽證,此訴求為何未被采納?

華山穹劍
2025-06-13 20:29:36
臺(tái)風(fēng)“蝴蝶”中午或二次登陸,深圳今年最強(qiáng)、最長(zhǎng)降雨要來了!

臺(tái)風(fēng)“蝴蝶”中午或二次登陸,深圳今年最強(qiáng)、最長(zhǎng)降雨要來了!

小虎新車推薦員
2025-06-14 10:23:30
里夫斯訓(xùn)練營(yíng):我說過一百萬遍 不可能兩天之內(nèi)把小孩變成詹姆斯

里夫斯訓(xùn)練營(yíng):我說過一百萬遍 不可能兩天之內(nèi)把小孩變成詹姆斯

直播吧
2025-06-14 10:46:47
中年男人“快樂藥”滯銷了,調(diào)查顯示“95后”僅50%每周有性生活

中年男人“快樂藥”滯銷了,調(diào)查顯示“95后”僅50%每周有性生活

風(fēng)向觀察
2025-06-12 20:06:51
決賽對(duì)陣出爐!國(guó)乒選手3:2爆冷淘汰世界亞軍,與瑞典爭(zhēng)奪冠軍

決賽對(duì)陣出爐!國(guó)乒選手3:2爆冷淘汰世界亞軍,與瑞典爭(zhēng)奪冠軍

國(guó)乒二三事
2025-06-14 05:49:32
中國(guó)足協(xié)按合同約定單方終止與伊萬合作 東亞杯由新帥帶隊(duì)

中國(guó)足協(xié)按合同約定單方終止與伊萬合作 東亞杯由新帥帶隊(duì)

財(cái)聯(lián)社
2025-06-13 19:41:22
江蘇一男子吃酒席得了1包好煙,他拿到小賣部想給老婆換點(diǎn)吃的,誰(shuí)料,老板娘得知原因后不禁淚目

江蘇一男子吃酒席得了1包好煙,他拿到小賣部想給老婆換點(diǎn)吃的,誰(shuí)料,老板娘得知原因后不禁淚目

不二大叔
2025-06-10 21:46:43
央視曝驚天騙局!成本1元賣800,無數(shù)女孩受害,下場(chǎng)凄慘仍有人吃

央視曝驚天騙局!成本1元賣800,無數(shù)女孩受害,下場(chǎng)凄慘仍有人吃

阿纂看事
2025-06-13 16:44:28
半天離職!上海一芯片團(tuán)隊(duì)幾乎全裁!賠償N+3!

半天離職!上海一芯片團(tuán)隊(duì)幾乎全裁!賠償N+3!

半導(dǎo)體圈
2025-06-14 11:04:11
軍校招生有新變化!4所軍校不再直接招生

軍校招生有新變化!4所軍校不再直接招生

大象新聞
2025-06-14 06:54:07
中央批準(zhǔn),馬森述履新廣東

中央批準(zhǔn),馬森述履新廣東

魯中晨報(bào)
2025-06-13 16:54:20
印度空難1人奇跡幸存,專家:可能是解體時(shí)被拋了出去,與位置無關(guān)!一家五口赴倫敦開啟新生活,拍下最后一張全家福!波音最新聲明

印度空難1人奇跡幸存,專家:可能是解體時(shí)被拋了出去,與位置無關(guān)!一家五口赴倫敦開啟新生活,拍下最后一張全家福!波音最新聲明

每日經(jīng)濟(jì)新聞
2025-06-13 14:33:15
國(guó)防部:要求日方停止危險(xiǎn)挑釁行徑

國(guó)防部:要求日方停止危險(xiǎn)挑釁行徑

看看新聞Knews
2025-06-13 23:13:46
衛(wèi)健部門回應(yīng)湖南湘雅二院墜亡實(shí)習(xí)醫(yī)生所涉舉報(bào)材料:聯(lián)合調(diào)查組調(diào)查中

衛(wèi)健部門回應(yīng)湖南湘雅二院墜亡實(shí)習(xí)醫(yī)生所涉舉報(bào)材料:聯(lián)合調(diào)查組調(diào)查中

FM93浙江交通之聲
2025-06-12 23:10:54
2025-06-14 12:59:00
AI科技大本營(yíng) incentive-icons
AI科技大本營(yíng)
連接AI技術(shù)的創(chuàng)造者和使用者
2526文章數(shù) 7599關(guān)注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業(yè)陪葬?

頭條要聞

牛彈琴:中東大戰(zhàn)開啟 以色列遭受幾十年來最猛烈攻擊

頭條要聞

牛彈琴:中東大戰(zhàn)開啟 以色列遭受幾十年來最猛烈攻擊

體育要聞

32隊(duì)爭(zhēng)10億獎(jiǎng)金,全新世俱杯來了!

娛樂要聞

鳳凰傳奇曾毅手表引爭(zhēng)議 含性暗示元素

財(cái)經(jīng)要聞

樓市權(quán)威發(fā)聲

汽車要聞

長(zhǎng)城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

健康
藝術(shù)
旅游
游戲
教育

呼吸科專家破解呼吸道九大謠言!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

SIE總裁稱PS+訂閱價(jià)格還會(huì)上漲 玩家更喜歡高級(jí)檔會(huì)員

教育要聞

老師表面喜歡,實(shí)則“內(nèi)心反感”的4種學(xué)生,地位還不如倒數(shù)差生

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 博野县| 盐城市| 德保县| 五常市| 江城| 南平市| 兖州市| 刚察县| 和平区| 军事| 大同县| 娄烦县| 专栏| 扎赉特旗| 黑山县| 出国| 遂川县| 南靖县| 长岛县| 麟游县| 福鼎市| 巴彦县| 公主岭市| 县级市| 长沙市| 麟游县| 北碚区| 林芝县| 东宁县| 龙山县| 福建省| 尼勒克县| 大竹县| 吉安县| 玉屏| 佛冈县| 乌兰察布市| 金川县| 宜阳县| 建水县| 邓州市|