作為一名圍棋愛好者,樓天城至今還經常喜歡看棋。
在觀看Master(AlphaGo的升級形態)下棋時,如果出現了不理解的招數,他會下意識覺得是因為「身為人類的自己太蠢了」。
在他看來,現階段的L4自動駕駛也步入了這一階段——Robotaxi的決策和軌跡開始變得不易被人理解。
相比較下,L2則會永遠停留在理解范圍之內,因為后者只是模仿人類,而前者必須超越人類。
在4月23日的上海車展上,小馬智行發布了搭載第七代自動駕駛系統方案。搭載該方案的Robotaxi擁有100%車規級零部件(覆蓋從線束、連接器到固態激光雷達、英偉達Orin-X芯片等零部件),自動駕駛套件總成本較前代下降70%,還可支持平臺化適配設計。
同時,基于小馬智行PonyWorld 世界模型技術基座,Robotaxi安全性比人類駕駛高出10倍。
在發布會后,RoboX與小馬智行聯合創始人、CTO——樓天城進行了對話,談到了「從L2到L4」、機器人,以及海外發展等話題。
VLA只會「短跑」,而非「長跑」
盡管小馬智行直到現在才發布Ponyworld世界模型,但其實他們已經使用了多年此類技術:“世界模型在機器學習領域已經有30年歷史了,我們使用世界模型已接近6年,L4都普遍在用…我一直以為這是業界共識,并未意識到大家不知道這一信息,所以從未強調過。”樓天城說道。
世界模型帶來的主要是學習方式的改變——人類有兩種學習模式:一種是模仿學習,方便快捷,也沒有不確定因素,但學生很難超過老師;另一種是強化學習:由老師創造試驗環境,自己去摸索。
樓天城指出,所有L4公司都是在強化學習模式中演進。直到端到端、世界模型等術語成為L2輔助駕駛最火的概念,他才將早已在用的技術對外擺在了臺面上。
“小馬智行的技術路線經歷了多次變革,其中也包括端到端——自Transformer出現開始,小馬智行就開始整合從感知到執行的模塊,使得訓練難度、表達能力都逐步提升。彼時,Waymo、百度也都已經開始用上了這一思路。”
2023年8月,小馬智行就已將感知、預測、規控三大傳統模塊打通,統一成端到端自動駕駛模型,搭載到L4級自動駕駛出租車和L2級輔助駕駛乘用車上。該模型在L4級車輛扮演冗余系統的角色,同時也可作為L2級車輛的解決方案。
到了現在,端到端成為了L2的必選項,但對L4公司來說,卻早已是標配了。
至于VLA(視覺語言模型,Vision-Language Model),樓天城的態度則更加明確:“VLA在L4上基本幫不上忙。”
VLA模型擅長整合視覺和語言信息,處理跨模態任務(如圖像描述、視覺問答),其核心優勢在于跨領域通用性。但它通常不針對特定領域進行深度優化,其知識通過大規模預訓練獲得,缺乏對自動駕駛中極端場景的建模能力。(編者注)
他指出,從VLA模型的屬性來看,它相當于一個「全科大夫」,可追求極端安全的L4需要的是「專科大夫」。
“它就像一個更優秀的短跑運動員,但腿部肌肉并不適合長跑。哪怕它經過不斷鍛煉成為了博爾特,也不代表他能長跑。”
個人用戶何時能用上L4?
從產品形式來說,即便是「車位到車位」,也終究人需要人類介入,這樣的產品屬性永遠沒法跨越。
“換句話說,如果安全有一條及格線,L4的安全及格線基本就是滿分線,L4真正的挑戰就在這里。在此標準上,L2差得非常遠……它其實根本過不了L4的及格線,而且會越差越遠。”
樓天城認為,目前在L2已經逐漸「平權」的情況下,行業尋求向L3進階是情理之中的事。然而L3的很多做法,還只是延續了L2的影子,并非實現質變,也不會漸進到L4。
那么,L4的技術,何時能降維到面向個人的量產車上呢?這或許會比預想的要久。
“至少不會是二零二幾年。因為目前的Robotaxi還需要專門的區域控制、運營、看護、遠程客服等多維度的工作。直到今天,L4也只做了幾個城市,賣給個人的難度更是不可同日而語。”
具身智能也將經歷「真空期」
盡管自動駕駛和機器人有共通之處,甚至前者也是具身智能的一部分。但小馬智行仍然沒有做機器人的計劃。
“不是因為技術不通用,而是因為我覺得自動駕駛是機器人領域最容易落地的東西。如果連這點都做不到,其他也無從談起。”
樓天城認為,具身智能和需要蜇伏更長的時間,和AGI一樣,都會經歷和自動駕駛一樣的真空期。
在他看來,具身智能今天的狀態和自動駕駛2018年的狀態非常像:“我非常懷念那個時候,那時只要做做Demo就行了。”
在次年,疫情來襲,他認為這反而為自動駕駛提供了一個潛心研究的「蟄伏期」:“那段時間,大家的心態平比較淡一些,這幫助團隊撐過了那段真空期。”
他坦言,如今具身智能做的很多展示都很炫酷,但真正的商業化需要考慮很多長尾問題。只有撐過這段沒有任何進展的真空期,才能繼而衡量其商業和應用價值。
這些挑戰都是自動駕駛曾經遭遇過的,因為他經歷過,才知道有多困難。
“自動駕駛恐怕是Agent領域中最pioneer的應用了,沒有比Robotaxi更好落地應用的。如果連這一方面都做不到的話,一定上不了牌桌。”
第七代系統的使命
如今,小馬智行的Robotaxi車隊已至少已經跑了50萬個小時,已經擴展至市中心、高快速路。
所以到了現在,樓天城認為,是時候講成本和量產了。
現在小馬智行的Robotaxi已實現零部件100%都是車規的,這也是降本的關鍵所在。“在這一點上,其他家都還沒做到,尤其Waymo是做得最差的。”
樓天城指出,降本的過程有兩個大的里程碑:1、去掉人,2、車規化量產的這種硬件。這一代系統就是為了達到這個目的。
另外,至今還總有人認為Robotaxi需要付出大量「云代駕」的成本,樓天城也對此進行了澄清。
“我從不會以任何方式嘗試云代駕的邏輯。一般人可能不清楚云代駕的網費高昂到什么地步,而且它對網絡的要求非常高,可能配有云代駕的一輛車,相當于購買并折舊十輛普通車輛的成本總和。而且,由于沒有身臨其境的感覺,云代駕做的判斷也是有誤差的。”
樓天城表示,小馬智行從第一天就沒有嘗試過任何代駕的概念,只是有遠程客服,Waymo也從未做過云代駕。
盡管在降本上,小馬智行已做到了極致,可樓天城還是直言,第七代小馬智行Robotaxi的價格,會在合理范圍內定得相對較高。“因為AI的本意,是提供好的產品和高質量的服務,而不是把價格卷得更低。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.