網易首頁 > 網易號 > 正文申請入駐

元戎啟行周光：VLA模型將于2025年第三季度量產

2025-06-11 19:27:49　來源: 智見Time

上海舉報

分享至

2025年6月11日，元戎啟行CEO周光受邀出席2025年火山引擎Force原動力大會，宣布元戎啟行將攜手火山引擎，基于豆包大模型，共同研發VLA等前瞻技術，打造物理世界的Agent。同時，周光宣布元戎啟行的VLA模型將于2025年第三季度推向消費者市場，并展示了VLA模型的四大功能——空間語義理解、異形障礙物識別、文字類引導牌理解、語音控車，功能將隨量產逐步釋放。

元戎啟行CEO周光

周光:“VLA的四大核心功能，相當于為AI汽車增加‘透視眼’‘百事通’‘翻譯官’‘應答靈’等屬性，讓AI汽車更全面地了解駕駛環境，準確預測潛在駕駛危險因素，顯著提升輔助駕駛的安全性。”

空間語義理解：駕駛“透視眼”

VLA模型能夠全維度解構駕駛環境，精準破解橋洞通行、公交車遮擋視野等動靜態駕駛盲區場景駕駛風險。

例如，在通過無紅綠燈的路口時，VLA模型能提前識別到“注意橫穿，減速慢行”的指示牌，即使公交車通行造成動態盲區，VLA也會結合公交車的動作去做出準確的決策。當公交車進行減速時，它會通過推理前方可能有行人穿行，并做出“立即減速、注意風險、謹慎通行”的決策。

公交車動態盲區遮擋

異形障礙物識別：駕駛“百事通”

vla模型是一個超級學霸，它通過互聯網迅速獲取知識并轉換成自己的經驗，有自己的駕駛“知識庫”，對駕駛過程中出現的各類障礙物了如指掌，準確判斷潛在危險因素，行駛更安全。例如，VLA模型能夠識別“變形”的超載小貨車，結合實際路況，執行減速繞行或靠邊駕駛。

異形障礙物識別

文字引導牌理解：駕駛“翻譯官”

搭載VLA模型的AI 汽車不僅能 “看見” 道路標識，更能 “讀懂” 文字背后的通行規則，解析復雜路況里蘊含的路況信息，讓復雜路況決策如 “開卷考試” 般從容。面對左轉待行區、可變車道、潮汐車道等 “動態規則路段”，VLA模型能夠讀懂字符與圖標的含義，高效匹配實時路況。在多車道復雜路口選道直行的場景中，能夠準確識別車輛前方的文字及圖案標識牌，從左轉右轉混雜的路口準確找到左轉車道，并執行操作。

特殊路標識別

語音交互控車：駕駛“應答靈”

通過VLA模型，AI汽車可以與用戶高效交流，根據語音指令做出對應的駕駛決策，隨叫隨應，交互更擬人，體驗更舒適。并且當用戶意愿與導航信息相沖突時，VLA模型會優先采納用戶意愿。

語音控車指令

目前，元戎啟行已完成VLA模型的真實道路測試，預計今年將有超5款搭載元戎啟行VLA模型的AI汽車陸續推入市場。其中，VLA模型支持激光雷達方案與純視覺方案，將率先搭載在NVIDIA Drive Thor芯片上，后續元戎啟行還將通過技術優化，讓VLA模型可以適配更多芯片平臺。

火山引擎汽車總經理、智慧出行和具身研究院院長楊立偉表示：“元戎啟行作為業內率先推出VLA模型的企業之一，對人工智能的理解極為深刻。火山引擎作為行業領先的云服務提供商，在云計算領域擁有深厚的技術實力和豐富的經驗。我們非常期待與元戎啟行攜手合作，共同推動基于豆包大模型的物理世界Agent的落地應用，助力智慧出行領域的創新發展。”

周光強調：“VLA模型作為當下最先進的AI技術，可以連接視覺、語言、動作等多種模態，打通物理世界與數字世界的壁壘，具有完善的任務規劃和執行能力，是實現物理世界 agent 的關鍵技術。元戎啟行很高興能夠與火山引擎達成合作，基于VLA模型共同打造物理世界的Agent，讓雙方的先進技術在物理世界的各個領域落地，推動生產力進階。”

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.