馬斯克門徒歸國創業,首次亮相上海車展。
Nullmax,創始人為特斯拉Autopilot團隊早期成員,首次亮相上海車展,接受對外采訪,從“油電同智”的10萬元方案談到2027年L3高速NOA落地。
馬斯克的中國門徒,仍是純視覺的擁躉,嘗試用“漸進式路線+數據閉環”推動智能輔助駕駛走向全民化。
以下為采訪對話實錄,經編輯
Q:Nullmax首次亮相上海車展,希望向行業傳遞哪些核心信息?
徐雷:我們確實是第一次參加上海車展,我們其實參加的展覽也比較多,包括去年的CES,包括明年的CES也都會參展,上海車展確實是國內參加的第一次比較重要的展會,我們是一家以AI驅動的科技公司,通過軟件平臺化的方式打造針對不同市場、不同需求的方案。大家也可以看到我們的方案覆蓋了不同算力的芯片,不同類型和數量的傳感器,包括從一體機的市場,到行泊一體域控方案,到艙駕一體域控方案,還有端到端大模型純視覺、真無圖方案,我們這些方案可以覆蓋從幾萬塊錢到幾十萬塊錢的不同價位車型,可以符合國內、國外不同的法律法規需求,包括國外更多是法律法規驅動的市場,我們有一些基于海外芯片打造的方案。在國內更多的是基于體驗及性價比的方案,包括應用端到端大模型更加擬人化的城市NOA的方案。我們主要還是基于比較獨特的視覺感知技術和數據驅動的閉環系統,打造了針對不同細分市場有競爭力的方案,這是我們想通過這次車展傳遞給合作伙伴和客戶的信息。
Q:漸進式自動駕駛發展的內涵是什么?
徐雷:基于SAE的分級,從L0到L5級,L5級就是人可以開車的地方,車就可以自動開。我們選擇的是漸進式的方向,漸進式主要是從兩個維度解釋:
第一個維度就是剛才咱們說的SAE的分級,從L2往L3、L4方向走,這是第一。L2級別,從技術積累包括產品落地,我們覺得車安全是非常重要的一點,我們需要有足夠多實車的積累和數據的驗證,才能保證我們能夠從L2往L3,甚至往L4方向發展,這個路線的發展相對來說就是跨越式的路線,比如說Waymo、Cruise這種,使用了重激光、重地圖的單車智能方案,希望一步到位可以把司機拿掉。
第二個就是ODD可運行設計范圍和OEDR,就是對各種物體和事件的反應,以前是做高速、高架城區快速路的功能,現在拓展到城市的場景,這是我們從可運行設計范圍和對各種事件、物體的反應。
我們覺得從解決問題的漸進性上面,從商業化的“沿途下蛋”的方向來講,我們還是選擇漸進式的路線。
Q:我們在展臺宣傳中看到Nullmax致力于為產業鏈提供“普適價值”,您如何看待這句話?這一理念如何通過MaxDrive解決方案和新一代端到端的NI技術來實現?和其他競爭對手相比,輔助駕駛方案的產品競爭力是什么?
Nullmax 創始人、CEO、CTO徐雷:普適價值從兩個維度來講,我們的產品并不直接面對終端消費者,我們帶來的價值一方面是為了OEM,Tier1,另一方面是終端用戶。從第一個維度來講,我們希望我們的方案,組合輔助駕駛功能給客戶帶來的意義,一個是安全性的提升,減少事故的發生,還有就是整個效率的提升,同時也建立在大家用得起,買得起的基礎之上,有更多的人群使用。基于這點考慮,我們的方案需要能夠快速、高效、成本非常低的,從一個車型移植到另外一個車型,每一個車型就像手機一樣,有一些低端手機,也有一些旗艦手機,我們能夠更快速地把方案移植到不同的平臺上,基于每一個細分市場打造最有競爭力的方案。
回答你第二個問題,我們的方案相較于市面上一些同質化的方案來說,我們不是僅基于某一款芯片打造的功能,我們是針對國內國外不同細分市場,每一個Segment,去打造不同的產品方案,從一體機的國產方案和海外方案,到行泊一體域控及艙駕一體域控方案,還是有非常多的差異化優勢。有的是最具性價比,有的是滿足法律法規,有的是端到端體驗更出色,可能價格貴一些。我們針對每一個市場的特點都會有相應滿足市場需求的方案,并且建立Nullmax全棧自研的基礎上,包括從感知,特別是視覺感知。視覺感知的實時性非常強,我們做到了接近30frame/幀,比激光的10 frame/幀要高很多。所以我們整個對環境感知能力非常強。
另外一點,我們打造了整套的數據閉環系統,包括從數據的采集、標注、訓練到部署、驗證到量產的打磨,基礎設施的能力也是非常強的,至少我看了很多同類的公司還是有一些不一樣的地方。
另外一點,我想表達的一點我們是AI驅動的公司,并不是傳統意義汽車產業鏈的Tier1,我們不做硬件的生產設計和制造。
Q:認為什么樣的數據才是高質量的數據,怎么樣拿到數據才更合理?
Nullmax首席科學家 成二康:我來說一下我們目前做的概況,因為我們也做了很長時間,我們覺得除了數據之外,架構設計也很重要,這個架構設計也和數據強相關。我們現在做的數據主要有兩種,一種是真實的實測數據,二是虛擬的數據,我給一個軌跡,可以把交通場景重建出來。有的宣傳說不同的數據或者人類駕駛數據是沒用的,我覺得這些數據可以倒推到端到端的設計中。我們這次車展在26日有一個技術分享,講關于端到端的技術設計,其中就包括不同駕駛人類的習慣或者風格怎么被端到端設計處理。
大家現在目前所做的端到端的設計基本上都是基于Decoder技術架構的設計,除了Decoder本身設計之外,還有Query,Planning Query的設計,我們現在在做的Planning Query設計可以兼容不同駕駛的風格,這樣就可以更好地把不同人駕駛習慣的風格設計上去,我們也在驗證過程中發現更好的Planning Query的設計,尤其是能夠把不同駕駛風格的Query融合在設計里面,這樣就可以處理不同人類,不同駕駛習慣的數據,發揮得更好,這是我們目前做出來的如何兼容不同人類駕駛習慣數據上面的使用方法,細節我們會在26日下午做分享。
Q:我再問一個和端到端相關的話題,春節的時候,大家都被同一件事情震驚,DeepSeek的意外火爆,用一種全新的方式實現了類似于OpenAI相同的性能,當時有一種論調是在大語言模型領域,算力的需求沒有像之前大家預估的那么高,如果我們做一種線性外推的話,是不是在自動駕駛領域,端到端的自動駕駛領域,對于云端和車端的算力需求也不是那么高?在您看來有沒有什么趨勢?
成二康:我可以介紹一下我們端到端設計的思路,剛好和你的問題很相關。
現在大家在推的包括VLM+端到端,或者現在大家用的最火爆的VLA。不管是VLM還是VLA本質上都是借用了目前語言的架構設計,從語言來說,語言從ChatGPT火起來之后,已經過渡到以Decoder-only為主的技術架構設計。我們覺得既然語言在做Decoder技術架構設計在自動駕駛領域是否能夠存在自己的Decoder-only的技術架構設計,這個也是我們目前端到端設計的重點。
這里面有一個核驗證的結論是在自動駕駛里面,如果能夠很好的設計Decoder-only的技術架構,比如說現在設計的大概是9000萬,或者下到3000萬的參數量,可以同樣等價于1B、7B VLM或者是VLA同樣的效果。我們總結下,在自動駕駛里面,當然可以借鑒VLA或者大模型VLM的已有的技術架構和參數,可以在更高的算力上面,比如說超過500T或者1000T算力上面使用。如果在中高階算力,比如說100T(稠密算力)左右的上面,更好的設計這個Decoder,它可以實現和類似大語言結構一樣的效果,Decoder-only的技術架構在純自動駕駛形態里面是可以被設計出來的。
Q:3000萬參數量可以等價差不多7B?
成二康:我們驗證可以等于7B或者是1B,使用公開的VLM或者VLA的參數。
Q:開春之后,比亞迪先是開了發布會,說“全民智駕,智駕平權”,后面長安、吉利、奇瑞陸續開了發布會,大家認為2025年是組合輔助駕駛全面開花的一年,但是接下來有一個問題就是供應鏈能不能跟得上?之前業內傳出說800萬攝像頭里面CS的芯片有可能出現缺貨,在您看來有沒有這種可能性?或者除了攝像頭的芯片,其他的零部件有沒有可能出現缺貨?
量產工程部高級總監 張帆:是有可能的,您剛才說的情況,是不可避免的。另外就是8Max攝像頭是未來城市場景使用必須的配置,周視和后視可以用2Max或者3Max的,8Max前視是必須的,不管是30度還是120度的,它可以幫助我看得更遠、更寬。2Max和3Max也會有這種趨勢。
徐雷:這有可能是階段性的挑戰,以中國的供應鏈和生產制造能力,這個不是不可逾越的挑戰,我相信整個供應鏈跟進的速度會更快。
張帆:每次往上躍級,中國智駕從供應鏈到下游的算法,到芯片供應商,到算法供應商,到Tier1整體邁上一個臺階,這是一個必然的趨勢。
Q:大家好,我準備了三個問題,我看我們的合作伙伴上面有愛芯元智這家公司,他們剛宣布了出海戰略,想問一下對于當前的自動駕駛而言,還是L2的配置率相對來說比較高,我剛剛了解到咱們是漸進式的發展路線,這個對于海外市場是不是更加契合?我們海外市場的規劃怎么樣的?現在海外市場對自動駕駛的標準要求比較嚴,我們如何做一個匹配?
徐雷:我們基于愛芯元智有一些合作,在國內國外都有量產的項目即將落地,此外與包括瑞薩、高通、TI等不同芯片公司合作,針對全球不同市場打造多款方案。
剛剛您提到的海外更多的是法律法規驅動的市場,特別是對前向視覺感知的能力要求比較高,我們的方案性能表現都很出色,因此與海外的Tier1共同推進項目合作落地。
另外一點,除了一體機市場法律法規驅動以外,高速NOA今年在歐洲那邊也會有法律法規出來,我們基于不同芯片打造的方案也可以落地海外市場。
Q:第二個問題是工信部對于智駕做了規范,芯片廠商表示說對下游的廠商和主機廠宣傳口徑做出一個管理,我不知道咱們這邊怎么看這個問題,是不是也會有同樣類似的行為?
徐雷:首先第一點我們還是非常支持工信部的規定的,第二,其實在沒有工信部規定出來之前我們所有的宣傳還是以客觀事實為基礎的,并沒有出現“全國都能開、有馬路都能開”,這句話對等下來就是對應的SAE第五級,人開的地方車就能開。我們現在的組合輔助駕駛技術沒有達到這個程度。在沒有工信部規定的時候,我們一直與合作伙伴和用戶討論的都是系統邊界的問題,所以我們覺得整個組合輔助駕駛還是以安全為第一位的。提高效率是在安全的基礎之上希望實現的功能,所以我們所有的方案,包括從最低階到高階的方案,在安全的基礎上擴大它的可使用范圍,讓用戶知道這個系統的邊界在什么地方,充分發揮系統的作用,但是所有的前提還是建立在安全的基礎之上。
Q:第三個小問題是華為今天提出了“油電同智”,其實很多芯片廠商也有這樣的理念,就是“油電同智”,我想問一下對于油車和電車而言,對于自動駕駛這些解決方案和技術實現的路徑有沒有什么不一樣的區別?
徐雷:我們有量產過油車的組合輔助駕駛方案,也量產過電車的組合輔助駕駛方案,油車和電車有一些區別吧。比如油車的控制,包括延時肯定比電車慢一些,電的話,踩一下馬上會有反應。這也是我們為什么要打造不同類型的方案去適合不同的車。在我們看來,不管中國還是全世界范圍,油車有一定的比例,而且會存在很長時間,這也是為什么我們有一些更加低功耗的方案,對油車也很友好。
Q:我們從去年開始看到了很多新的名詞的涌現,從技術驅動到數據驅動,從VLM到VLA,這種技術方案或者技術路線在快速迭代和不停演化過程當中,咱們怎么去做技術路線的預研和判斷,以保證我們在技術到來的時候有足夠多的準備。
徐雷: 從研發的角度來講,其實大家也知道在很多年前,不管是Microsoft都會有單獨的研究院,后來這種模式慢慢會有一些變化,特別是在AI發展過程當中,更多的不是說選擇技術路線,而是說我們在做的過程當中面臨新的挑戰和認識,比如說從高速、高架的NOA做到城市,從APA做到記憶泊車,做到代客泊車,在做的過程中同時加深我們對這些問題的理解,真正的挑戰在什么地方,基于這些我們提出相應的解決方案,這驅動我們不斷地往前發展。這個就好比最早2012年、2013年出來的CNN,到最近的Transformer,到大模型,AI還是不斷地往前發展,本質上還是因為我們對AI的使用更加深入,我們希望通過AI解決更多的問題,同時也對邊界或者說這個問題的性質挑戰有更深入的理解,所以有新的技術的出現。所以我覺得要跟上,還是要保證在大規模量產的同時平衡好對AI研發投入的關系,這是我的理解。
成二康:我稍微補充一下,我們Nullmax還是堅持自動駕駛自主研發的技術,因為計算機視覺進展很快,感知進展很快,從2021年開始,我們每年都有原創的論文在發表,現在我們也擁抱開源社會,從2024年起,所有公開發表的paper都會開源,以這種姿態迎接更快技術的迭代,這是一點。
第二,技術發展非常快,有研究者就提出說“新的AI發展這么快,很多創新是來自于企業的”,我們作為輔助駕駛AI企業,也希望從量產當中發現更多真實的問題,很多復雜的場景,我們希望以場景來做AI,來解決自動駕駛里面的難點問題,提前識別問題,提前做預研,在量產過程中做實踐,做技術不斷地迭代。
徐雷:我們成立以后還是堅定地在AI方向做投入,做難而正確的事情。做自動駕駛最難的還是從最上游的感知,特別是視覺感知,到底用哪些數據訓練,整個算力的投入還是非常大的,我們還是堅持不懈地在這個方向投入,包括整套打造的視覺為主的方案,前向360度的感知,在行車、泊車上面都有量產落地。
Q:我想問一下現在的AI技術主要強調無圖、多模態端到端的口號,現在業內喊出這些口號的企業也很多,我想請各位領導給我們總結一下Nullmax的競爭優勢。
成二康:因為這次的車展我們展示了不同的芯片算力的域控,不同的行車和泊車的場景,我們技術方案的優勢就是有一套平臺化的軟件技術架構,這個技術架構包括兩方面。第一方面是有平臺化的感知方案,它可以覆蓋動態場景識別、靜態場景識別,也包含時序場景識別,也包含更復雜的拓撲識別,我們有一套平臺化的軟件架構,這個里面的感知可以適配到不同的算力,比如說一套平臺化架構可以下探到2T算力,向上升級到32T、100T、200T,包括我們和黑芝麻智能合作的可以升級到更高算力,一套軟件架構可以適配不同的芯片。除此之外,平臺化的集成方案 MaxOS,它可以使平臺化軟件的stack可以快速移植到不同的芯片上面去,我們能夠快速地為不同的客戶,或者是不同的車廠服務,客戶會選擇不同的算力,也會選擇的芯片平臺,有了這個平臺化的解決方案之后就可以更好的為客戶服務。
Q:我想請教各位老師綜合考慮政策因素和行業成熟度等等各種因素,L3在我國大概真正的落地是什么節點?這個時間節點上我們Nullmax大概在什么位置?主要競品是誰,主要客戶有哪些?
徐雷:從L3來講,L3高速NOA比L3城市早一些,L3在海外已經有一些量產落地,只是ODD的限制相對多一些,對速度和環境有各種限制。你講的是大規模的落地,其實這個問題我們的理解是這樣的,剛才我提到有兩個維度在提升,一個維度是ODD,一個維度級別,現在我們做的很多事情是把ODD從高速往城市擴,但是本質上還是L3以下的智能駕駛。我們做的事情是在漸進式路線里通過量產里程的積累,比如說這是ODD,這是級別L2、L3,ODD從高速往城市擴,因為我有很多里程的積累,會把ODD往回收,但是我的級別會往上漲,這個就是L3高速NOA到來的時候,這個時間點大概是2027年左右吧。就是現在L2的級別把ODD變大,經過數據的積累,我們會把ODD變小,回到高速,但是級別會往上走。從這兒開始再往L3大的ODD,包含城市的范圍走。
Q:您剛剛介紹到說會繼續做投入,做難而正確的事,我想問一下待披露的投融資計劃有嗎?
Nullmax COO沈隆:基于我們未來的發展需要,我們仍然是在準備融資方面的工作,現在有些產業合作伙伴,包括產業合作者都有在接觸,包括未來還有更高的資本市場的規模,我們正在推進中。
Q:我想問一下去年提到的類腦有沒有經過規模化的驗證,量產怎么樣?
成二康:我們現在應用的基于巖山科技開發的類腦,現在有大規模數據在做驗證,有一些成果在實車上面做部署。
徐雷:其實從去年開始整個大模型非常火,包括你提到的DeepSeek,各種我們都看過,大模型或者是端到端的這種方式,其實也有一些問題,現在的大模型在網上不斷地學習一些問題,當你問他一些問題,它也是從網上看的虛假信息給你回答。回到車或者回到大模型上面,我們整個世界是有一些基礎的運行規則,包括物理規則,包括法律法規,包括政策法規,所以我們信號大模型是會讓我們變得更強,同時有一些弊端,我們希望通過其他的技術和方法,包括仲裁的方式,其他的方式規避到AI方向,在提升上限的同時,保證我們做大模型的時候不要有幻覺,不要有完全不合乎常識的回答。
Q:咱們出海方面,現在貿易環境有很多不確定性,這個會不會影響我們出海或者是通過影響到主機廠,間接地對我們產生影響,如果有的話,我們可以有哪些措施應對?
徐雷:出海的法規也分情況,比如說歐洲就是法律法規要求比較高的地方,還有地緣政治的因素,所以我們要打造不同的方案,包括我們在海外也有研發中心,在當地就可以做開發和支持,所以這個也是我們希望把整個這套技術,不僅僅是在中國落地,包括海外,包括高法規國家、低法規國家,希望都能落地我們的方案。
Q:之前百人會論壇上出現了很多車企不要自研的聲音,我們怎樣看待自研和依賴第三方供應商的?
徐雷:這個問題從我們成立這家公司開始,大家就一直在討論這個問題,就是車企要不要自研,本質上還是取決于不同類型的車企到底要不要自研,到底要自研到什么程度,要不要自研芯片,以及要不要自研自動駕駛的技術。至少在我們看來,不同的車企有不同的選擇吧,從實際結果來看,現在好像選擇第三方方案的車企越來越多。
Q:您認為未來智駕方案有可能成為一個標準化的方案?因為標準化的方案更加考驗的是制造能力,智駕方案未來有可能有這樣的趨勢嗎?
徐雷:至少在我們現在看到的趨勢是智駕其實是AI在具身智能方面的重要應用場景,畢竟還是以AI的技術為基礎打造的一套應用。我們覺得不管是智駕或者是大模型,遠遠還沒有達到殊途同歸的方式,即使是實現同樣的功能,每家選擇用什么樣的數據,怎么訓練,架構什么樣的,如何驗證,每家還是非常的不一樣,在AI快速迭代的發展過程當中,而且技術不斷地更新,而且這個問題本身也是非常有挑戰的問題,我們最終還是希望車可以有一個虛擬駕駛員可以開,我覺得在可預見的短期不太可能變成以制造為見長。
Q:今年價格戰還在持續,主機廠給供應商的成本壓力也是越來越大,Nullmax一直強調的是通過成本可控的技術推動輔助駕駛在更多的車企上普及,越來越大的成本壓力之下,咱們怎么平衡性能和安全,會不會存在過度追求性價比導致功能閹割的情況。
徐雷:我覺得討論性價比還是要建立在安全的基礎之上。成本包括很多方面,整個系統的成本、研發這套系統的投入成本,以及這套系統能夠以多大規模的平臺化,分攤到不同的層面上。傳統的車是機械制造的產物,現在整個智能駕駛或者輔助駕駛是希望通過軟件平臺化的方式,把我們開發的成果,能夠復用到不同的解決方案上。通俗的說我就種一棵樹,針對不同的需求,在這棵樹上面可以打造不同的方案,而不是種很多棵樹。你剛才提到的非常對,成本很關鍵,這里的成本也包括研發投入,一旦方向選擇錯誤,你所有的投入基本會打水漂,所以這里面更考驗一個企業在做產品的時候,組織架構的技術判斷和執行能力,但是這個并不影響我們這套產品一定要建立在安全的基礎上,因為這是我們可持續發展的基礎。
Q:第二個問題是今年同樣年初的時候,特斯拉FSD入華炒得很火,無論是從您的職業經驗還是Nullmax自己的技術路線來看,特斯拉純視覺路線和咱們的技術有同源性的,咱們的本土化經驗和特斯拉FSD相比,是否有差異化的優勢?未來會不會尋求一些合作?
徐雷:我們確實不了解特斯拉的技術細節,但是從公開的技術評測可以看到,當然特斯拉來中國之后,對中國的法律法規,也缺少實際道路數據的訓練,有一些壓單黃線、壓單實線,這個在海外是可以的,但是在中國法規是不可以的。但是他的一些基礎能力,比如說跟其他車的交互博弈的能力,我們看到還是非常強的,這也是為什么我們比較堅定地走以視覺為主的路線,當然這件事情肯定要比激光難很多,但是最終實現天花板的高度會高。
Q:剛才您提到了車企是否應該自研的問題,作為智駕的方案商,我們有沒有自研芯片的問題?這兩三年我們看到作為輔助駕駛里面軟硬結合的趨勢,比如說英偉達、地平線都在做自己的軟件方案,比如說Momenta在往上游做自己的芯片,其實蔚小理新勢力車企自研芯片也是類似的,所以有些人認為智駕技術發展特別快,我做軟硬之間的結合可能更有利于我更快地推出更先進的方案,但是長遠來看,可能軟硬之間的解耦才是趨勢,所以想請教一下您對這個問題是什么看法?
徐雷:從商業和技術上兩點來回答這個問題,以前高通做芯片,舉個很簡單的例子,做人臉識別,以前也沒有單獨的人臉識別的芯片,以前用DSP或者其他的方案去做,當這個方案人臉識別成熟度足夠之后做成一個芯片,成本更低,做一個ASIC芯片。現在從商業上來講,芯片本質上是一個相對比較傳統的business,芯片是需要有足夠的量支撐,才能形成商業的閉環,不斷地迭代新的芯片。
從組合輔助駕駛或者AI的角度來講,我們覺得這個方案還是不斷地進化過程當中,我們認為遠遠沒有達到殊途同歸的方式。其實做芯片本質上還是希望降低成本,但是目前我們還沒有看到這個芯片對整個方案,可能對成本上面有幫助,所以這種方案沒有收斂之前,至少從我們企業來講,我們還是做好我們該做的事情,非常專注的把AI的技術不斷地往前推進,當然我們也有一些非常好的合作伙伴,包括國外的合作伙伴和國內的合作伙伴非常專注的把芯片做好,我們還是各自做好各自領域最專業的事情。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.