隨著3A游戲大作開始“上車”,寶馬等一眾外資品牌在2025上海車展憑借“巨幕影院”和3D投影技術(shù)重新定義座艙體驗(yàn),智能汽車競(jìng)爭(zhēng)的焦點(diǎn)已從硬件參數(shù)轉(zhuǎn)向認(rèn)知能力,行業(yè)正處于“軟件定義汽車”向“認(rèn)知重塑出行”躍遷的臨界點(diǎn)。
“未來的智能座艙不是冰冷的機(jī)器,而是能‘察言觀色’的家庭成員?!鄙虦^影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛在接受《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱NBD)獨(dú)家采訪時(shí),借此形容當(dāng)前智能座艙的發(fā)展方向。在他看來,智能座艙的進(jìn)化分為三個(gè)階段:早期的“問答工具”、大模型賦能的“全能助手”,以及具備記憶與共情能力的“家庭成員”。
工信部數(shù)據(jù)顯示,2025年第一季度中國(guó)L2級(jí)輔助駕駛新車滲透率已達(dá)65%,但智能駕駛供應(yīng)商正面臨嚴(yán)峻挑戰(zhàn):價(jià)格戰(zhàn)愈演愈烈,車企自研趨勢(shì)日益明顯,同時(shí)智能駕駛事故頻發(fā)引發(fā)公眾對(duì)激光雷達(dá)等傳感器的廣泛討論。在這一背景下,商湯絕影如何在沒有激光雷達(dá)的情況下保障安全性?規(guī)?;宪嚾绾螌?shí)現(xiàn)盈利?
對(duì)此,王曉剛認(rèn)為,車輛搭載激光雷達(dá)只是階段性的技術(shù)選擇,隨著模型算法的演進(jìn)、數(shù)據(jù)迭代和整體安全性的提高,激光雷達(dá)是可以被替代的。商湯絕影選擇通過“世界模型+強(qiáng)化學(xué)習(xí)”的技術(shù)組合,突破現(xiàn)實(shí)數(shù)據(jù)不足的瓶頸,在降低硬件依賴的同時(shí)確保系統(tǒng)安全。
商湯絕影CEO王曉剛 圖片來源:企業(yè)供圖
談及與主機(jī)廠的關(guān)系時(shí),王曉剛用“太極”比喻新時(shí)代的合作模式。在車企紛紛加強(qiáng)自研的背景下,商湯絕影定位為AI(人工智能)基礎(chǔ)設(shè)施與云端服務(wù)提供商,與車企在數(shù)據(jù)和研發(fā)體系上深度耦合。王曉剛認(rèn)為,這種模式既保留車企的核心自研能力,也能發(fā)揮科技公司的技術(shù)優(yōu)勢(shì)。
現(xiàn)階段汽車是人工智能最好的載體
NBD:商湯絕影現(xiàn)在打出口號(hào)叫“專注于汽車行業(yè)的AI公司”。為什么這么說?目前在做的主要重點(diǎn)是什么?
王曉剛:商湯是1+X的戰(zhàn)略,1就是大模型,X就是各個(gè)行業(yè)的板塊,絕影是其中的X之一,聚焦汽車行業(yè)。今天我們說商湯絕影是“最專注在汽車行業(yè)的AI公司”,其實(shí)離不開商湯這個(gè)平臺(tái)型的公司。它在不同的階段其實(shí)是有不同的行業(yè)作為驅(qū)動(dòng)力,今天這個(gè)時(shí)間點(diǎn)的話,智能汽車是人工智能發(fā)展最強(qiáng)勁的驅(qū)動(dòng)力。
輔助駕駛從過去十幾年發(fā)展到今天,已經(jīng)到了大規(guī)模進(jìn)行落地推廣的階段。另外,尤其是多模態(tài)大模型和世界模型,在汽車領(lǐng)域的作用和能力實(shí)際上是體現(xiàn)得最充分的。因?yàn)樵谄囘@個(gè)空間,有聲音、有圖像,還有激光雷達(dá)、車機(jī)的各種信號(hào),各種傳感器是非常豐富的。相比其他行業(yè),比如手機(jī)、互聯(lián)網(wǎng)輸入比較單一,而汽車是一個(gè)非常好的應(yīng)用場(chǎng)景,去體現(xiàn)多模態(tài)大模型人機(jī)交互的能力。
而且,今天很多智能汽車?yán)锩嬗玫降倪@些技術(shù)和未來智能機(jī)器人,也是大家一致看好的方向。這些技術(shù)是高度重合的,但是你看機(jī)器人數(shù)量(目前)是非常少的,(而)汽車進(jìn)行大規(guī)模量產(chǎn),(有)大量的數(shù)據(jù)回流。所以,我們今天聚焦智能汽車,實(shí)際上能夠產(chǎn)生巨大的用戶價(jià)值。另外,這些技術(shù)也是為將來人工智能向通用人工智能演進(jìn)打下了非常好的基礎(chǔ)。
NBD:之前理想汽車CEO李想說過一句話,他認(rèn)為汽車是人工智能最好的載體。
王曉剛:對(duì),至少是目前這個(gè)階段。時(shí)代還在發(fā)展,當(dāng)今這個(gè)階段它就是一個(gè)最好的載體。
NBD:商湯絕影提出智能座艙需要“叛逆”進(jìn)化,這是否意味著它必須具備更強(qiáng)的主動(dòng)交互能力?
王曉剛:我們其實(shí)對(duì)智能座艙有一個(gè)思考,它的發(fā)展有幾個(gè)階段:第一個(gè)階段是工具,就是早期你提問題它回答,完成一個(gè)特定的任務(wù)。進(jìn)入大模型的第二階段后,智能座艙躍升至“助手階段”,不僅能理解復(fù)雜指令,還能跨場(chǎng)景協(xié)同完成任務(wù)。第三個(gè)階段就是家庭成員,它不僅能幫你做事,還有情感上的連接,就像家里的寵物。假如有一天寵物離開了,情感上大家是非常難以割舍的。
過去幾個(gè)月,我們的智能座艙開發(fā)了一系列新功能。我們的產(chǎn)品經(jīng)理經(jīng)常與它互動(dòng),慢慢就產(chǎn)生共情。這一階段的智能座艙,不僅加強(qiáng)了人跟車之間的粘性和依賴,實(shí)際上也是對(duì)于人機(jī)交互的一個(gè)革命性改變。
NBD:感覺這是一個(gè)大概念,可以擴(kuò)展到不只是汽車,甚至汽車以外都是可以的。
王曉剛:確實(shí),情感化交互的邏輯具備普適性,但不同載體的實(shí)現(xiàn)條件差異顯著。以手機(jī)為例,它本質(zhì)上是被動(dòng)響應(yīng)的設(shè)備,用戶需要主動(dòng)喚醒、輸入指令后設(shè)備才會(huì)提供服務(wù),既無(wú)法持續(xù)感知用戶狀態(tài),也難以建立深度陪伴感。相比之下,汽車是更理想的情感載體。
當(dāng)用戶進(jìn)入車內(nèi),座艙系統(tǒng)天然處于全時(shí)待命狀態(tài),攝像頭、麥克風(fēng)、座椅傳感器等設(shè)備持續(xù)運(yùn)行,能夠?qū)崟r(shí)捕捉乘客的表情、動(dòng)作、聲音甚至生理信號(hào)(如疲勞度),從而構(gòu)建動(dòng)態(tài)的情感反饋循環(huán)。這種“無(wú)感卻無(wú)處不在”的交互模式是手機(jī)等難以實(shí)現(xiàn)的。
端到端是“必贏之戰(zhàn)”,激光雷達(dá)屬于階段性需求
NBD:您曾提到“端到端是必贏之戰(zhàn),沒有B計(jì)劃”。與華為、特斯拉等的端到端方案相比,商湯絕影在模型或訓(xùn)練方式上有哪些獨(dú)特壁壘?
王曉剛:端到端的技術(shù)路徑差異取決于數(shù)據(jù)規(guī)模與實(shí)現(xiàn)方式,一種是兩段式端到端,就是把感知與規(guī)控拆分為兩個(gè)獨(dú)立模塊,規(guī)控部分采用小模型替代傳統(tǒng)規(guī)則。這種模式適用于數(shù)據(jù)量有限的場(chǎng)景,但能力上限受數(shù)據(jù)規(guī)模制約。另一種就是以特斯拉為代表的一段式端到端,全系統(tǒng)整合為單一模型,依賴超大規(guī)模真實(shí)數(shù)據(jù)訓(xùn)練。特斯拉憑借700萬(wàn)輛車的海量數(shù)據(jù)回流,目前是唯一能規(guī)?;瘧?yīng)用此模式的企業(yè)。國(guó)內(nèi)其他車廠都干不了,我們也干不了。
在這種情況下,商湯絕影的選擇是“世界模型+仿真強(qiáng)化學(xué)習(xí)”。我們通過構(gòu)建高精度虛擬環(huán)境,在仿真中生成海量駕駛場(chǎng)景(如極端路況、復(fù)雜交互),使自動(dòng)駕駛系統(tǒng)在模擬世界中反復(fù)試錯(cuò)、自我進(jìn)化。這與AlphaGo(一款圍棋人工智能程序)的演進(jìn)邏輯相似,早期AlphaGo依賴人類棋譜訓(xùn)練,而AlphaZero(一種通用強(qiáng)化學(xué)習(xí)算法)通過自我博弈生成新策略,最終超越人類水平。
不過,圍棋的棋盤規(guī)則固定,狀態(tài)變化可精準(zhǔn)預(yù)測(cè);現(xiàn)實(shí)駕駛中,車輛下一時(shí)刻的狀態(tài)受無(wú)數(shù)變量影響,自動(dòng)駕駛的難點(diǎn)在于物理世界狀態(tài)演進(jìn)的復(fù)雜性。
NBD:依靠地圖不行嗎?地圖方案在未來是否仍然可行,還是已經(jīng)逐漸失去作用?
王曉剛:以往,業(yè)界普遍采用高精度地圖,后來逐漸向輕量化地圖轉(zhuǎn)變,如今正逐步降低對(duì)地圖的依賴性?;氐街邱{層面,地圖方案存在局限性,因?yàn)橹悄茏摳兄h(huán)境主要依賴攝像頭。我們擁有11個(gè)攝像頭,能夠?qū)崟r(shí)捕捉車輛周圍的視頻信息。但真正的挑戰(zhàn)在于預(yù)測(cè),基于當(dāng)前攝像頭捕獲的畫面狀態(tài),如何準(zhǔn)確預(yù)測(cè)下一時(shí)刻攝像頭中出現(xiàn)的場(chǎng)景?這就需要世界模型的能力。
目前,我們的世界模型可以模擬未來的場(chǎng)景變化。例如,當(dāng)車輛行駛至施工路段需要避讓時(shí),世界模型能夠模擬避讓過程中的各種可能性,包括模擬碰撞后的情形。
NBD:我們看到商湯絕影有方案是沒有激光雷達(dá)的,現(xiàn)在大家都在說安全冗余,會(huì)不會(huì)擔(dān)心(沒有激光雷達(dá))這個(gè)事兒?模型如何在保證安全的前提下實(shí)現(xiàn)好用?
王曉剛:我覺得不加激光雷達(dá)屬于一個(gè)階段性的問題,可能現(xiàn)階段大家對(duì)(智駕)安全有顧慮,所以搭載激光雷達(dá)?,F(xiàn)在,在高速路段場(chǎng)景下,即使不搭載激光雷達(dá)車輛也能夠正常行駛;但在城區(qū)復(fù)雜場(chǎng)景中,行駛難度會(huì)有所增加。不過,加激光雷達(dá)也不能解決所有問題,因?yàn)樗旧硪矔?huì)受各種條件和天氣干擾,激光雷達(dá)也會(huì)老化,信號(hào)也會(huì)出現(xiàn)各種各樣的問題。
從我們的角度來看,將來隨著模型算法的演進(jìn)、數(shù)據(jù)迭代,整體安全性的提高,這個(gè)(激光雷達(dá))是可以被替代掉的。提高智駕安全性其實(shí)有很多方式,模擬仿真就是一種。
圖片來源:企業(yè)供圖
過去,在復(fù)雜場(chǎng)景下,若自動(dòng)駕駛出現(xiàn)失敗,由于場(chǎng)景不可重復(fù),只能采集類似場(chǎng)景進(jìn)行訓(xùn)練,但這種方法不能保證解決問題。而模擬仿真技術(shù)的出現(xiàn),使得記錄失敗場(chǎng)景并對(duì)其進(jìn)行重構(gòu)成為可能。在仿真環(huán)境中,(我們)可以反復(fù)測(cè)試直至成功,并生成類似場(chǎng)景以確保模型的泛化性。這使得自動(dòng)駕駛的技術(shù)邊界更加明確,能夠清晰地知曉在何種場(chǎng)景下系統(tǒng)有效、何種場(chǎng)景下可能失效,從而提高安全性。
NBD:現(xiàn)在有的車企會(huì)配置兩套系統(tǒng),一套搭載激光雷達(dá),另一套采用端到端系統(tǒng),兩套系統(tǒng)互相兜底。您覺得這是一個(gè)好的方式嗎?或者說這是一個(gè)過渡階段的解決方案嗎?
王曉剛:目前來說,這是一個(gè)合理的方式。主要是端到端系統(tǒng)存在不確定性,而規(guī)則具有確定性,當(dāng)遇到無(wú)法處理的情況時(shí),系統(tǒng)會(huì)讓車輛停下來。端到端系統(tǒng)基于類人學(xué)習(xí),其應(yīng)對(duì)未見過場(chǎng)景的能力有限,因此需要其他方式兜底。不過,隨著未來世界模型的出現(xiàn)和仿真技術(shù)的發(fā)展,當(dāng)能夠仿真出各種場(chǎng)景并明確技術(shù)邊界時(shí),行業(yè)將更具確定性。知道系統(tǒng)在何種場(chǎng)景下有效或失效,大家有確定性就知道邊界在哪兒,可能就會(huì)減少對(duì)這種雙系統(tǒng)配置的依賴。
與車企合作模式:“太極式共生”
NBD:產(chǎn)品現(xiàn)在的上車情況是怎樣的?大概有多少個(gè)品牌在用?
王曉剛:目前,我們的產(chǎn)品已經(jīng)上車7款車型。在智能駕駛方面,今年3月份剛剛實(shí)現(xiàn)了首批地平線J6M方案的量產(chǎn)。接下來,今年我們還將推出價(jià)格更為親民的地平線J6E方案,并將在奇瑞品牌實(shí)現(xiàn)量產(chǎn)。此外,基于英偉達(dá)Thor平臺(tái)開發(fā)的系統(tǒng),以及包括世界模型和強(qiáng)化學(xué)習(xí)等端到端技術(shù),會(huì)應(yīng)用到東風(fēng)的量產(chǎn)車型中。
NBD:如今主機(jī)廠和供應(yīng)商的關(guān)系似乎與過去有所不同,尤其是許多科技公司也成為了主機(jī)廠的供應(yīng)商。如何看待新時(shí)代下我們與汽車主機(jī)廠的合作模式?商湯絕影是供應(yīng)商還是與主機(jī)廠的合作關(guān)系已經(jīng)發(fā)生了變化?
王曉剛:這里可以用“鴛鴦鍋”和“太極”來形象地描述兩種不同的合作模式?!傍x鴦鍋”中紅湯和白湯的界限非常清晰,合作的焦點(diǎn)往往集中在邊界上。在這種模式下,主機(jī)廠如果發(fā)展自研能力,目的可能是為了替代供應(yīng)商。而“太極”則體現(xiàn)了中國(guó)人獨(dú)特的智慧,雙方相互呼應(yīng)、相互依存。
在人工智能領(lǐng)域,主機(jī)廠需要具備一定的自研能力,以便更好地理解和把握技術(shù),這不僅涉及自動(dòng)駕駛,還包括智能座艙以及利用人工智能改造生產(chǎn)線和供應(yīng)鏈等眾多方面。然而,人工智能技術(shù)發(fā)展迅速且投入巨大,如果主機(jī)廠在這一領(lǐng)域獨(dú)自投入巨資建設(shè)超算中心等基礎(chǔ)設(shè)施,不僅成本高昂,而且在汽車價(jià)格不斷下降的市場(chǎng)環(huán)境下很難實(shí)現(xiàn)高性價(jià)比。
我們與主機(jī)廠的合作是一種內(nèi)外結(jié)合、緊密共生的關(guān)系。主機(jī)廠的自研團(tuán)隊(duì)與我們的AI技術(shù)相互補(bǔ)充,缺一不可。主機(jī)廠需要保留一定的自研能力,而我們的AI技術(shù)則為其提供支持。沒有主機(jī)廠的數(shù)據(jù)支持,我們的AI技術(shù)難以發(fā)揮作用;而沒有我們的AI技術(shù),主機(jī)廠也難以在這一領(lǐng)域?qū)崿F(xiàn)高效發(fā)展。簡(jiǎn)單說,雙方就是一個(gè)非常緊密的共生關(guān)系。
NBD:過去主機(jī)廠多強(qiáng)調(diào)全棧自研,如今則更傾向于全棧可控,且這種可控存在多種模式,比如通過股權(quán)合作將供應(yīng)商與自身綁定。商湯絕影是否會(huì)與主機(jī)廠開展此類股權(quán)合作呢?
王曉剛:股權(quán)合作只是其中一種形式,雖然能在特定時(shí)間節(jié)點(diǎn)保障資源投入,但主機(jī)廠當(dāng)下亟待解決的核心問題并非資源,而是雙方研發(fā)體系的對(duì)齊。這包括工具鏈、數(shù)據(jù)格式以及各種管線等方面的適配。若主機(jī)廠與供應(yīng)商的兩套體系無(wú)法對(duì)接,雙方的基礎(chǔ)設(shè)施與能力便難以實(shí)現(xiàn)協(xié)同。
在現(xiàn)實(shí)情況下,主機(jī)廠也不可能構(gòu)建多套研發(fā)體系,通常只會(huì)采用一套。因此,關(guān)鍵在于推動(dòng)研發(fā)體系與基礎(chǔ)設(shè)施的企業(yè)應(yīng)用,這并非單純的股權(quán)投入所能解決。即便主機(jī)廠對(duì)多家車企進(jìn)行投資,也不可能為其分別建立獨(dú)立的研發(fā)體系。
圖片來源:企業(yè)供圖
NBD:與車企合作肯定會(huì)涉及數(shù)據(jù),您以前也強(qiáng)調(diào)過誰(shuí)更接近數(shù)據(jù),誰(shuí)就占據(jù)主動(dòng)權(quán)。那么,如何平衡數(shù)據(jù)隱私和訓(xùn)練的效率?
王曉剛:我們今天跟車企合作,車廠依然是數(shù)據(jù)的擁有者。關(guān)于隱私保護(hù),所有車輛采集的數(shù)據(jù)都需要進(jìn)行脫敏處理,例如去除人臉和車牌信息。此外,國(guó)家對(duì)此也有明確的規(guī)范和要求,商湯絕影自身也具備數(shù)據(jù)脫敏技術(shù),能夠?yàn)檐嚻筇峁?shù)據(jù)脫敏服務(wù)。
自動(dòng)駕駛研發(fā)重心轉(zhuǎn)向:從車載到云端
NBD:您之前提到智能駕駛距離盈利還有三年左右,隨著未來智能駕駛的大規(guī)模產(chǎn)業(yè)化,如何通過上車來降低成本并增強(qiáng)盈利能力呢?
王曉剛:首先它的量得起來,目前市場(chǎng)上的量產(chǎn)爆發(fā)是一個(gè)積極的趨勢(shì)。另外,為了推動(dòng)行業(yè)發(fā)展,標(biāo)準(zhǔn)化和平臺(tái)化至關(guān)重要。我們今天看到這樣一個(gè)趨勢(shì),當(dāng)前攝像頭配置逐漸趨于一致,車企在采集攝像頭數(shù)據(jù)時(shí)也盡量采用相同類型的攝像頭,并且盡可能復(fù)用調(diào)試工作,這樣可以避免額外的數(shù)據(jù)采集,提高效率實(shí)現(xiàn)平臺(tái)化。
NBD:如果在汽車行業(yè),您覺得商湯絕影以后會(huì)成為自動(dòng)駕駛的安卓還是蘋果的iOS?
王曉剛:首先我們要擁有自動(dòng)駕駛的這些全量方案,可能后面會(huì)更多地提供云服務(wù)、大模型和基礎(chǔ)設(shè)施。自動(dòng)駕駛未來的研發(fā),在車端的研發(fā)會(huì)變得越來越輕,而在云端的基礎(chǔ)設(shè)施投入會(huì)越來越重,因?yàn)槎急荒P吞娲恕?qiáng)化學(xué)習(xí)、世界模型都是在訓(xùn)練階段、在云端發(fā)生的,最后出來的端側(cè)的東西相對(duì)來說比較簡(jiǎn)單。所以我們自己要提供云服務(wù),給客戶這些基礎(chǔ)設(shè)施的支撐。
NBD:展望未來3年到5年,商湯絕影有什么規(guī)劃?您希望達(dá)到什么樣的目標(biāo)?
王曉剛:我覺得從三個(gè)層面來看,在通用人工智能高速發(fā)展的浪潮里,希望絕影始終能夠站在前列,給消費(fèi)終端客戶帶來優(yōu)秀且新的體驗(yàn)。從公司自身來說,未來3年到5年,(希望)能夠有更好地發(fā)展,進(jìn)入下一個(gè)階段。商湯絕影希望通過3年至5年在汽車行業(yè)深耕,能夠極大地去推動(dòng)商湯AI平臺(tái)化的發(fā)展。畢竟,商湯再先進(jìn)的技術(shù)也需要找到合適的應(yīng)用和落地場(chǎng)景,以便獲取反饋,形成正向循環(huán)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.