隨著輔助駕駛普及的不斷深入,公眾越來(lái)越關(guān)注駕駛系統(tǒng)的安全性,期待輔助駕駛帶來(lái)更安全也更流暢的智慧出行體驗(yàn)。只是許多輔助駕駛方案在遇到新場(chǎng)景時(shí)難以妥善處理,事故時(shí)有發(fā)生,暴露出當(dāng)前技術(shù)方案的諸多瓶頸。然而,人工智能技術(shù)的發(fā)展和進(jìn)步推動(dòng)著智能駕駛的演進(jìn)。例如,商湯絕影2022年發(fā)布了行業(yè)首個(gè)感知決策一體化的智駕通用模型UniAD,并榮獲CVPR 2023最佳論文,引領(lǐng)了智能駕駛行業(yè)的創(chuàng)新潮流,智駕進(jìn)入到端到端時(shí)代,模型學(xué)會(huì)類人交互,性能表現(xiàn)大幅提升。那么人工智能技術(shù)是否未來(lái)還會(huì)對(duì)智駕的進(jìn)步起到什么決定性作用,我們對(duì)商湯絕影創(chuàng)始人王曉剛先生進(jìn)行了專訪。
智駕革命:從模仿人類到超越人類的世界模型
在智能駕駛的深水區(qū)競(jìng)賽中,行業(yè)正面臨根本性范式轉(zhuǎn)移。商湯科技聯(lián)合創(chuàng)始人、絕影智能汽車(chē)事業(yè)群總裁王曉剛在接受專訪時(shí)指出:自動(dòng)駕駛正從端到端的'模仿學(xué)習(xí)'邁入'生成式智能駕駛'時(shí)代,其顛覆性不亞于GPT對(duì)自然語(yǔ)言處理的革新。
這一判斷直擊行業(yè)兩大核心痛點(diǎn):數(shù)據(jù)質(zhì)量瓶頸與安全確定性難題。當(dāng)前主流的端到端模型,本質(zhì)上是通過(guò)海量人類駕駛數(shù)據(jù)模仿駕駛員行為,但王曉剛揭示了致命缺陷:我們收集的90%數(shù)據(jù),恰恰是普通司機(jī)在復(fù)雜場(chǎng)景中的猶豫或錯(cuò)誤決策。當(dāng)系統(tǒng)學(xué)習(xí)的是人類的'平均分',就無(wú)法突破安全上限。
這種困境在極端場(chǎng)景尤為突出。以無(wú)保護(hù)左轉(zhuǎn)為例,傳統(tǒng)模型需要收集數(shù)萬(wàn)個(gè)相似案例,但現(xiàn)實(shí)中危險(xiǎn)場(chǎng)景不可復(fù)現(xiàn),且人類處置方式參差不齊。商湯的破局之道來(lái)自其雙料冠軍技術(shù)——連續(xù)兩年斬獲Waymo挑戰(zhàn)賽冠軍的開(kāi)悟世界模型。該技術(shù)通過(guò)物理引擎構(gòu)建3D交通環(huán)境數(shù)字孿生,結(jié)合強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)百萬(wàn)次虛擬試錯(cuò)。就像AlphaZero自創(chuàng)圍棋定式,我們的系統(tǒng)能在虛擬世界中探索出人類從未設(shè)想過(guò)的安全策略。王曉剛以某量產(chǎn)項(xiàng)目為例:在夜間暴雨場(chǎng)景中,世界模型生成的1.2萬(wàn)種變道策略,使得自動(dòng)緊急避讓成功率提升47%,決策延遲降低至83毫秒。
對(duì)于小鵬汽車(chē)提出的云端大模型+車(chē)端蒸餾方案,王曉剛認(rèn)為這印證了行業(yè)共識(shí):未來(lái)智能駕駛研發(fā)將呈現(xiàn)'云端重投入、車(chē)端輕量化'趨勢(shì)。但真正的技術(shù)制高點(diǎn)在于世界模型的精確度——它必須像物理定律般嚴(yán)謹(jǐn),又能像生物進(jìn)化般自適應(yīng)。商湯的解決方案中,每1個(gè)真實(shí)場(chǎng)景可生成8000個(gè)衍生場(chǎng)景,模型迭代效率提升400倍,云端訓(xùn)練成本降低60%。
智艙進(jìn)化:從工具到家庭成員的靈魂革命
當(dāng)行業(yè)熱議大模型上車(chē)時(shí),王曉剛犀利指出癥結(jié)所在:簡(jiǎn)單移植云端大模型,只會(huì)讓車(chē)機(jī)變成話癆。真正的突破在于重構(gòu)多模態(tài)交互邏輯,實(shí)現(xiàn)'一句頂萬(wàn)句'的情感穿透力。
在商湯新一代SenseAuto-Chat系統(tǒng)中,三個(gè)技術(shù)支點(diǎn)正在重塑體驗(yàn)范式:
無(wú)痕身份認(rèn)知系統(tǒng):通過(guò)動(dòng)態(tài)人臉識(shí)別與聲紋融合,無(wú)需用戶注冊(cè)即可構(gòu)建數(shù)字身份畫(huà)像。當(dāng)某車(chē)企高管首次進(jìn)入測(cè)試車(chē)時(shí),系統(tǒng)自動(dòng)關(guān)聯(lián)其公開(kāi)演講內(nèi)容,主動(dòng)探討艙駕融合的技術(shù)邊界,展現(xiàn)出堪比私人助理的認(rèn)知深度。
群體智慧交互引擎:支持8人實(shí)時(shí)自然對(duì)話,能理解座艙內(nèi)碎片化討論并智能介入。在家庭出行場(chǎng)景中,系統(tǒng)可捕捉兒童想看熊貓的隨意對(duì)話,自動(dòng)規(guī)劃成都大熊貓基地路線,同步推送科普視頻到后排屏幕。
3D視線元宇宙:通過(guò)亞毫米級(jí)眼球追蹤與場(chǎng)景語(yǔ)義理解,駕駛員注視充電樁2秒即可觸發(fā)自動(dòng)泊入,凝視廣告牌3秒自動(dòng)推送品牌信息。更革命性的是,該技術(shù)與智駕系統(tǒng)深度耦合——當(dāng)系統(tǒng)檢測(cè)到駕駛員持續(xù)關(guān)注右側(cè)來(lái)車(chē)時(shí),會(huì)主動(dòng)增強(qiáng)該方向傳感器權(quán)重,實(shí)現(xiàn)人機(jī)協(xié)同決策。
真正的智能座艙要像家人一樣'懂得'與'記得'。王曉剛演示了記憶系統(tǒng)的進(jìn)化:系統(tǒng)將日常對(duì)話轉(zhuǎn)化為2048維記憶向量,當(dāng)用戶某次抱怨加班頭痛后,再次夜間行車(chē)時(shí)會(huì)主動(dòng)調(diào)暗燈光、播放白噪音,并在地圖標(biāo)注途經(jīng)三甲醫(yī)院。這種潤(rùn)物細(xì)無(wú)聲的共情能力,正在重構(gòu)人車(chē)關(guān)系。某新勢(shì)力品牌的用戶調(diào)研顯示,搭載該系統(tǒng)的車(chē)主平均每日主動(dòng)喚醒車(chē)機(jī)23次,較傳統(tǒng)系統(tǒng)提升5倍,情感依賴度評(píng)分達(dá)8.7分(滿分10)。
數(shù)據(jù)博弈:99%人類數(shù)據(jù)該被拋棄嗎?
針對(duì)地平線余凱人類駕駛數(shù)據(jù)價(jià)值有限的觀點(diǎn),王曉剛給出了辯證解讀:在L2向L3躍遷階段,高風(fēng)險(xiǎn)場(chǎng)景的優(yōu)質(zhì)數(shù)據(jù)依然珍貴。但世界模型的價(jià)值在于,它能像駕校教練般無(wú)限復(fù)現(xiàn)危險(xiǎn)場(chǎng)景,通過(guò)強(qiáng)化學(xué)習(xí)探索比人類更優(yōu)的通過(guò)策略。
商湯構(gòu)建了獨(dú)特的數(shù)據(jù)飛輪:量產(chǎn)車(chē)收集的真實(shí)問(wèn)題場(chǎng)景,經(jīng)過(guò)世界模型生成百萬(wàn)級(jí)衍生場(chǎng)景,再通過(guò)云端訓(xùn)練反哺車(chē)端模型。在與某車(chē)企合作的自動(dòng)泊車(chē)項(xiàng)目中,該系統(tǒng)將狹窄車(chē)位泊入場(chǎng)景擴(kuò)展出12萬(wàn)種變體(包括購(gòu)物車(chē)碰撞、兒童突然出現(xiàn)等),使得泊車(chē)成功率從87%提升至99.3%,回退率下降90%。
更具戰(zhàn)略意義的是數(shù)據(jù)安全機(jī)制的突破。通過(guò)聯(lián)邦學(xué)習(xí)框架,商湯實(shí)現(xiàn)了數(shù)據(jù)可用不可見(jiàn):車(chē)企數(shù)據(jù)不出本地,通過(guò)加密通道提取特征值參與模型訓(xùn)練。這種模式已吸引3家跨國(guó)車(chē)企加入生態(tài),其中某歐洲品牌借此快速適配中國(guó)復(fù)雜路況,研發(fā)周期縮短11個(gè)月。
生態(tài)布局:AI OS重構(gòu)汽車(chē)產(chǎn)業(yè)價(jià)值鏈
面對(duì)軟件不賺錢(qián)的行業(yè)魔咒,商湯亮出了駕艙云三位一體的破局之策。最新發(fā)布的行業(yè)首個(gè)車(chē)載AI OS(千機(jī)系統(tǒng)),將大模型能力下沉至車(chē)機(jī)內(nèi)核:
MOE架構(gòu)革命:在10TOPS算力芯片上流暢運(yùn)行70億參數(shù)模型,通過(guò)專家網(wǎng)絡(luò)動(dòng)態(tài)分配,語(yǔ)音交互能耗降低67%;
智能體商店:開(kāi)放300個(gè)API接口,第三方開(kāi)發(fā)者可開(kāi)發(fā)旅游達(dá)人健康管家等場(chǎng)景化智能體,某母嬰品牌借此推出兒童情緒安撫應(yīng)用,上車(chē)首周使用率達(dá)38%;
混合現(xiàn)實(shí)引擎:結(jié)合AR-HUD與SLAM定位,在擋風(fēng)玻璃投射虛擬導(dǎo)游形象,某文旅集團(tuán)測(cè)試顯示,游客停留時(shí)間延長(zhǎng)22分鐘,二次消費(fèi)提升130%。
在出海戰(zhàn)略中,商湯的技術(shù)正成為破局關(guān)鍵。針對(duì)2026版ENCAP新規(guī),其3D視線追蹤方案幫助某國(guó)產(chǎn)車(chē)型在Euro NCAP測(cè)評(píng)中斬獲歷史最高分。更巧妙的是文化適配能力:在中東市場(chǎng),系統(tǒng)會(huì)自動(dòng)規(guī)避女性語(yǔ)音指令;在東南亞則強(qiáng)化雨季路況預(yù)警。某自主品牌借助該體系,在泰國(guó)市場(chǎng)首月訂單突破5000輛,溢價(jià)能力比競(jìng)品高8%。
未來(lái)之戰(zhàn):L3落地與責(zé)任重構(gòu)
當(dāng)被問(wèn)及L3落地前景時(shí),王曉剛展現(xiàn)了技術(shù)樂(lè)觀主義:世界模型解決的不僅是技術(shù)問(wèn)題,更是責(zé)任劃分難題。當(dāng)系統(tǒng)能明確告知'我能處理哪些場(chǎng)景,何時(shí)需要接管',法律與商業(yè)的齒輪才能真正咬合。
商湯的解決方案中引入數(shù)字黑匣子概念:系統(tǒng)實(shí)時(shí)記錄駕駛決策鏈,包括世界模型生成的128種備選方案及其概率分布。在某個(gè)高速公路案例中,這套機(jī)制成功證明系統(tǒng)提前發(fā)出接管請(qǐng)求,幫助車(chē)企規(guī)避了巨額賠償風(fēng)險(xiǎn)。
更深遠(yuǎn)的影響在于產(chǎn)業(yè)價(jià)值重構(gòu)。某分析師測(cè)算,商湯的技術(shù)體系可使車(chē)企軟件毛利率提升至68%,是硬件業(yè)務(wù)的2.3倍。這種改變正引發(fā)鏈?zhǔn)椒磻?yīng):某傳統(tǒng)車(chē)企將電子電氣架構(gòu)研發(fā)團(tuán)隊(duì)削減60%,轉(zhuǎn)而投向AI模型訓(xùn)練;某電池巨頭則跨界投資虛擬場(chǎng)景生成工具,尋求供應(yīng)鏈協(xié)同創(chuàng)新。
汽車(chē)產(chǎn)業(yè)的寒武紀(jì)大爆發(fā)
在這場(chǎng)生成式AI引發(fā)的智駕革命中,王曉剛勾勒出清晰的演進(jìn)路徑:2024年是世界模型驗(yàn)證年,2025年進(jìn)入場(chǎng)景生成工業(yè)化階段,2026年或?qū)⒂瓉?lái)L3級(jí)商業(yè)落地潮。但比技術(shù)突破更深刻的,是對(duì)汽車(chē)本質(zhì)的重新定義——從載具進(jìn)化為有記憶、會(huì)思考的移動(dòng)生命體。
當(dāng)被問(wèn)及終極愿景時(shí),王曉剛給出詩(shī)意回答:未來(lái)的汽車(chē)會(huì)像老友般理解你的沉默,像導(dǎo)師般彌補(bǔ)你的疏忽,像家人般守護(hù)你的脆弱。這不是科幻,而是正在發(fā)生的現(xiàn)實(shí)。 在這場(chǎng)重構(gòu)人車(chē)關(guān)系的史詩(shī)級(jí)變革中,中國(guó)科技公司正站在浪潮之巔。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.