采訪 | 周長賢 張祥威 撰文 | 張祥威 編輯|馬青竹
王曉剛與沈邵劼、周光等偶爆“金句”的友商技術(shù)高管不同,這位商湯絕影一號位,言辭樸實。做過香港中文大學(xué)電子工程系教授的他,被人稱作王老師。
2017年,在智能駕駛還比較蠻荒的時代,王老師曾帶隊拿下本田長達5年的智駕合作。僅依賴攝像頭,且未搭載激光雷達和高精地圖。
之后幾年,自動駕駛領(lǐng)域大事不斷,但智駕公司的商業(yè)化戰(zhàn)績并不突出。商湯絕影也埋頭前行,與母公司商湯科技業(yè)務(wù)上協(xié)同推進。
現(xiàn)在,商湯科技在上海臨港建立的AI智算中心,云端算力已從700P增至25000P,商湯絕影則基于豐沛的算力,2022年底,推出感知決策一體化的自動駕駛端到端通用模型UniAD。
OpenAI帶火ChatGPT后,商湯科技推出流式多模態(tài)“日日新5o”,商湯絕影基于此推出一系列智能座艙人交互方案。
近兩年,商湯絕影才進入量產(chǎn)期,與超30家國內(nèi)外車企達成合作,覆蓋100余款車型。
其中,智駕方案分別在廣汽、合眾、一汽等共6款車型量產(chǎn)上車。
智能座艙大模型產(chǎn)品,主要在小米SU7(參數(shù)丨圖片)、吉利翼真L380、蔚來樂道L60上搭載,累計交付40多款車型,量產(chǎn)規(guī)模約120萬輛。
王曉剛預(yù)計,今年底量產(chǎn)交付將突破350萬輛。商湯絕影團隊約1000人規(guī)模,智駕是重心。
但在高階智駕一戰(zhàn)中,時下熱門的端到端賦能方案,商湯絕影量產(chǎn)略慢。規(guī)劃中,基于端到端的智駕方案,明年四季度量產(chǎn)。這比華為等頭部大概晚一年。
于是就在11月27日,商湯絕影帶來全新一代產(chǎn)品。“2024絕影實力AI DAY”上,王曉剛一口氣發(fā)布三款產(chǎn)品:
一段式端到端智駕UniAD量產(chǎn)解決方案、“開悟”世界模型、以及面向車端的情感AI引擎——"A New Member For U",中文名為“你的家庭成員”。
在華為、Momenta等各路合圍下,商湯絕影能順利殺出嗎?聽?wèi)T了端到端,商湯絕影會有什么不同?世界模型能否為下階段的自動駕駛帶來新氣象?
近日,《出行百人會/AutocarMax》專訪商湯絕影王曉剛,談及對技術(shù)、量產(chǎn)、合作模式的見解。
智駕敢開白盒
提及量產(chǎn),表達一直內(nèi)斂的王曉剛,用了“戰(zhàn)斗”一詞。
“中低階,我們要快速結(jié)束戰(zhàn)斗。現(xiàn)在,中低階智駕方案的市場在迅速增長,我們要能夠抓住時間窗口,有較好的市場份額。”
王曉剛說,之后商湯絕影會將重心放在端到端量產(chǎn)。
“過去兩年,絕影經(jīng)歷了一個痛苦的過程,因為第一批量產(chǎn)項目交付過程中,工程化能力是不足的,缺少量產(chǎn)意識、交付意識。”王曉剛不避諱問題,直言基于地平線J5芯片的方案最終未能量產(chǎn)。
他解釋,這和主機廠規(guī)劃有關(guān),基于地平線J5研發(fā)時,可以先熟悉計算平臺、工具鏈,某種意義上是為J6做準(zhǔn)備。
這一過程,讓商湯絕影推動了組織架構(gòu)的調(diào)整,接下來將面向量產(chǎn)交付,更加聚焦。與此同時,還積累了車企的信任,不止有上面提到的廣汽、合眾、一汽三家,還有后面的大客戶——奇瑞大卓、東風(fēng)。
今年10月,奇瑞尹同躍喊出“智能化不客氣了”,同日,奇瑞旗下大卓智能與商湯絕影達成戰(zhàn)略合作。
商湯絕影與大卓的合作,正是緣起地平線的新一代芯片平臺J6。彼時,基于J6,大卓的感知團隊與商湯絕影均在進行研發(fā),雙方接觸后,看到各自資源和能力上的短板,決定合作。
來自技術(shù)、體系、文化等維度的挑戰(zhàn),是大多AI公司要面臨的挑戰(zhàn)。曾有智駕高管直言,跟著項目駐場開發(fā)時,由于工程化問題,挨罵是常態(tài)。
與大卓合作,王曉剛基本上每周會去一趟蕪湖,到了先試車,再和客戶開會。
王曉剛說,“自動駕駛對質(zhì)量的要求非常高,量產(chǎn)交付后,車企會做壓力測試,偶爾出現(xiàn)一個BUG,我們就要全力找原因,反復(fù)做各種測試,沒日沒夜。”
與主機廠合作,中后期重點在于體驗。商湯絕影建立了體驗群,各條線研發(fā)負責(zé)人都會親身上車體驗,看實車表現(xiàn)究竟如何,而不單是解決數(shù)據(jù)集的問題,或看看性能曲線。
王曉剛準(zhǔn)備迅速結(jié)束中低階的戰(zhàn)斗,他認為,“中低階方案,接下來半年左右是關(guān)鍵窗口期。”由于中低階方案對體驗的要求已經(jīng)明確,商湯絕影將基于地平線J6平臺,降低成本,形成快速復(fù)制的能力。
雙方的合作模式也頗為大膽,許多智駕公司將算法視為至寶,商湯絕影卻敢于白盒交付。
“大卓類似廣汽研究院的角色。我們幫奇瑞建立自有的智駕能力,會交付白盒方案。”一位商湯絕影人士向《出行百人會/AutocarMax》透露。
白盒交付,相當(dāng)于算法團隊直接供車企調(diào)用。智駕公司通常擔(dān)心團隊被挖,核心算法被車企學(xué)去。據(jù)了解,一些如卓馭級別的頭部智駕供應(yīng)商,甚至因拒絕車企的白盒交付需求,錯失大客戶定點。
但上述商湯絕影人士認為,“開白盒,可以讓車企感到供應(yīng)鏈可控,不擔(dān)心被卡脖子。相當(dāng)于教給了車企方法,車企掌握后,可以基于方案開發(fā)一些定制化的功能。”
商湯絕影不擔(dān)心白盒交付的風(fēng)險。
“敢于交付白盒的核心原因是,雙方合作基于算力。我們可以向車企提供全棧算法,最終目的是建立數(shù)據(jù)閉環(huán)體系,把云端算力用起來,模型的能力就會越來越強。”上述商湯絕影人士稱。
與擅長算法的自動駕駛公司相比,商湯絕影長于算力,母公司商湯擁有20000P算力,也就是20E FLOPS。雖然商湯的算力并非專為汽車而設(shè),但資源充足。
王曉剛說,“將來AI公司跟主機廠合作,是一個趨勢,不再是標(biāo)準(zhǔn)化黑盒的交付,更多的是研發(fā)體系對齊、共創(chuàng)共建的過程。”
如今,商湯絕影和大卓的合作也跳出具體項目,擴展至中低階、高階、端到端方案等多維度。
絕影實力AI Day上,王曉剛公布高階智駕量產(chǎn)節(jié)點,全場景高階智駕方案將在2025年Q2量產(chǎn);基于UniAD的端到端方案于2025年Q4量產(chǎn)。
全場景高階智駕,包含兩種方案:
AD Pro,基于地平線J6 E(80 TOPS),搭載7VnR,最高可實現(xiàn)城市記憶行車;
以及AD Max,基于地平線J6 M(128 TOPS),搭載11VnR,最高實現(xiàn)城區(qū)領(lǐng)航。
此外,基于UniAD的端到端方案,又被稱為AD Ultra,將基于NVIDIA Orin/Thor(200+TOPS),搭載11VnR,最高實現(xiàn)端到端城區(qū)領(lǐng)航。
上述產(chǎn)品和節(jié)點,基本上可以理解為給大卓的量產(chǎn)定制方案,以及量產(chǎn)承諾。
若能按時推進,奇瑞百萬級新車的大門將為其打開。更重要的是,商湯的云端基礎(chǔ)設(shè)施,將有用武之地,趕赴端到端、大模型的下一站。
量產(chǎn)端到端,商湯絕影的硬仗
拋開蔚小理等全棧自研派,自動駕駛生態(tài)圈如今呈現(xiàn)一種格局:車企掌握數(shù)據(jù),智駕供應(yīng)商掌握算法、算力。
這就意味著,算法能力,車企難以短時間具備。算力,由于投入巨大,車企也會謹(jǐn)慎投入。
所以,雙方彼此需要合作。
如前文所說,商湯絕影愿意白盒交付。更深遠的意義,是為與車企建立背靠背信任關(guān)系,獲取數(shù)據(jù),從而基于自身算力等基礎(chǔ)設(shè)施,完善自動駕駛大模型,比如絕影實力AI Day上發(fā)布的「開悟」世界模型。
世界模型,圖靈獎得主楊立昆是最早提出這一概念的專家之一,后被特斯拉、毫末智行、蔚小理、華為等引用。
當(dāng)下,車企、自動駕駛公司推出的端到端,遠非終點,業(yè)內(nèi)研發(fā)人士習(xí)慣稱其為端到端1.0時代。下一代演進方向,指向更好地理解物理世界。
商湯絕影的“開悟”世界模型,文藝點的說法是,在云端為端到端智駕再造時空,給機器呈現(xiàn)一個“賽博世界”。可以用于端到端模型的訓(xùn)練,也可以滿足仿真需求。
王曉剛解釋,“端到端類似人的小腦,接到信號以后,自然反射做出駕駛行為。多模態(tài)大模型類似人的大腦,能夠做出分析。今天的量產(chǎn)數(shù)據(jù)是不夠的,可以依靠世界模型去生成各種視頻,比如特定的Corner Case,做好模擬數(shù)據(jù)的仿真。”
據(jù)悉,“開悟”世界模型,可生成150秒時長的Clips級數(shù)據(jù),以及1024類場景。這將用于仿真、泛化,對理解真實世界,以及理解車輛運動規(guī)律和交通規(guī)則發(fā)揮重要作用。
對于主流的11V方案,“開悟”世界模型則做到了視角時空對齊,以及克服魚眼視角畸變、可靈活滿足行泊場景需求。
于世界模型,各家用法類似,就看能否順利落地,以及愿意買單。
“隨著高階自動駕駛和無人駕駛的到來,智能輔助駕駛技術(shù)不可能以單一軟件功能的方式售賣,智駕會帶來高昂的數(shù)據(jù)費用,在大模型領(lǐng)域里面甚至很難有Tier 1。”何小鵬認為。
他提到,“原來的?動駕駛,可以?Tier1和整??合作的方式進?PK。但是,在從?腦到?腦到整?,全部軀體都可以?AI驅(qū)動的情況下,Tier1不可能全域AI都做。所以,Tier1在未來的3-4年會迅速有變化。”
王曉剛承認,一體化趨勢對Tier1和主機廠原有的合作模式提出挑戰(zhàn)。
“嚴(yán)格來說,商湯并不是傳統(tǒng)意義上的Tier1。系統(tǒng)分成各個模塊,不同供應(yīng)商完成其中一塊,Tier1負責(zé)最終的系統(tǒng)集成和兜底。AI大模型出現(xiàn)后,各模塊之間的邊界逐漸模糊,甚至消失。自動駕駛大模型,需要將各個模塊都串起來,需要Tier1有更強的AI能力。”
同時,他也提出反問,主機廠是否要把所有的事兒都做了?
“既然所有的東西都是在一起的,是不是主機廠要做所有的事情?從算法、軟件一直到芯片,什么都自己做完。我覺得也不是。這樣的話,主機廠負擔(dān)就會變得非常的重,因為投入還是非常大的。”
不是所有車企都有全棧自研的決心和能力,但也有車企已經(jīng)開啟自研之路。在正確答案塵埃落定前,商湯絕影等智駕供應(yīng)商們要盡快完成自證。
結(jié)語
最近,王曉剛被問到平時有什么愛好,他直言,“愛好比較少了。這幾年在業(yè)務(wù)上投入的精力非常多,跟以前當(dāng)老師時就非常不一樣。”
量產(chǎn)關(guān)鍵期,帶隊打仗壓縮了個人生活空間,應(yīng)該是常態(tài)。
本田、一汽等項目之后,奇瑞的大卓等將是商湯絕影的新試卷,成了就是樣板,能帶來更多客戶,留在牌桌。王曉剛也知道,越往后競爭會更激烈,時間稀缺。
—THE END—
出行百人會 | AutocarMax
追蹤汽?出行產(chǎn)業(yè)鏈進化,關(guān)注新產(chǎn)品、新科技、商業(yè)邏輯與商業(yè)人物,影響圈層中有影響力的人。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.