自GPT問世以來,勤奮的本土車企就一直在探索如何將大模型這個(gè)新質(zhì)生產(chǎn)力應(yīng)用在企業(yè)運(yùn)營(yíng)和產(chǎn)品領(lǐng)域。
關(guān)于大模型重塑智能座艙的用戶體驗(yàn)和改造自動(dòng)駕駛產(chǎn)品,已經(jīng)有了鋪天蓋地的宣傳,至于大模型如何幫助提升車企本身的生產(chǎn)力,卻很少有人提及,其實(shí),這也是非常值得關(guān)注的領(lǐng)域。
最危險(xiǎn)的地方最安全,最能花錢的地方才能最省錢。
在汽車行業(yè)的業(yè)務(wù)流里, 最能體現(xiàn)降本增效的地方是人才密集型、資金密集型的軟件開發(fā)領(lǐng)域。
根據(jù)華為專家在2024汽車人工智能大會(huì)上的系統(tǒng)性總結(jié),大模型可以在產(chǎn)品研發(fā)的過程中用于代碼輔助。
展開來看,大模型能夠以多輪對(duì)話、邏輯推理、長(zhǎng)文本理解、內(nèi)容創(chuàng)作、擴(kuò)寫與優(yōu)化、情感分析能力輔助需求分析;
以文生圖、多輪對(duì)話、邏輯推理能力輔助軟件開發(fā)架構(gòu)設(shè)計(jì);
以注釋生成代碼、代碼補(bǔ)全、代碼重構(gòu)、代碼翻譯、代碼生成注釋、生成測(cè)試用例、多輪對(duì)話能力輔助代碼開發(fā);
以注釋生成代碼、代碼補(bǔ)全、生成測(cè)試用例、多輪對(duì)話能力輔助軟件測(cè)試。
其代碼輔助能力覆蓋從需求分析、架構(gòu)設(shè)計(jì)、代碼編寫、軟件測(cè)試到部署上線、系統(tǒng)維護(hù)的整個(gè)生命周期。
在無法應(yīng)用AI神經(jīng)網(wǎng)絡(luò),需要通過寫代碼實(shí)現(xiàn)功能的系統(tǒng)里,碼農(nóng)們對(duì)AI大模型提高代碼開發(fā)效率樂觀其成,但在AI模型可以取代代碼,直接消滅編寫代碼需求的領(lǐng)域,碼農(nóng)們感到了前所未有的壓力。
自動(dòng)駕駛算法范式經(jīng)歷了編寫規(guī)則代碼到全面采用AI神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)變,在規(guī)則時(shí)代里,隨著駕駛場(chǎng)景復(fù)雜度的提升,頭發(fā)掉了一地的程序員越來越感到無能為力,但不管怎樣,飯碗還是能保住的。
24年開始風(fēng)靡本土車圈的端到端范式的進(jìn)步將規(guī)則驅(qū)動(dòng)轉(zhuǎn)向了數(shù)據(jù)驅(qū)動(dòng),從駕駛數(shù)據(jù)中模仿學(xué)習(xí)老司機(jī)的決策神經(jīng)網(wǎng)絡(luò)提升了應(yīng)對(duì)各種復(fù)雜場(chǎng)景的泛化能力,也把很多從事決策模塊開發(fā)的碼農(nóng)們的飯碗砸碎了一地。
開發(fā)出大模型的工種是碼農(nóng),最能感受大模型能力的工種是碼農(nóng),最先被大模型替代的工種還是碼農(nóng),想想真是又魔幻又讓人心酸!
是人都有弱點(diǎn),越是大佬越是容易被騙。
沒有人比他更懂關(guān)稅的川普悍然發(fā)動(dòng)關(guān)稅大戰(zhàn),或許是受到了馬斯克的蒙騙。
在自動(dòng)駕駛、人形機(jī)器人、AI大模型領(lǐng)域一向無比激進(jìn)的馬斯克或許曾經(jīng)對(duì)川普進(jìn)言,雖然大漂亮沒有那么多懂工藝、懂制造、自律、勤奮的技術(shù)工人,但也不是不可能在本土建設(shè)起完善的制造業(yè)產(chǎn)業(yè)鏈。
再過一段時(shí)間,完全可以依靠人形或具身機(jī)器人擰螺絲、焊電路板、搞質(zhì)檢,不用那么多領(lǐng)漢堡和可樂的老爺們上生產(chǎn)線,也能玩得轉(zhuǎn)。
應(yīng)該說,作為美利堅(jiān)科技圈造神運(yùn)動(dòng)中的天降猛男,馬斯克當(dāng)然不會(huì)把制造業(yè)看得那么簡(jiǎn)單,只是他的想法過于樂觀了。
不過,多模態(tài)視覺語(yǔ)言模型的確可以在生產(chǎn)線上找到用武之地。
比如,理想汽車早在24年7月份就將DeepSeek VL視覺語(yǔ)言模型用在了生產(chǎn)線的質(zhì)檢中。
這類通過視覺-語(yǔ)言聯(lián)合表征框架實(shí)現(xiàn)多模態(tài)特征融合的視覺語(yǔ)言模型,能夠?qū)z像頭捕捉到的圖像與質(zhì)檢知識(shí)庫(kù)進(jìn)行語(yǔ)義對(duì)齊,通過圖像識(shí)別和文本規(guī)則,針對(duì)產(chǎn)品缺陷實(shí)現(xiàn)基于視覺觀察和語(yǔ)義理解的綜合判斷。
視覺語(yǔ)言模型中的視覺V部分負(fù)責(zé)提取圖像特征,語(yǔ)言L部分負(fù)責(zé)通過可持續(xù)更新的質(zhì)檢知識(shí)庫(kù)進(jìn)行規(guī)則匹配,并行處理圖像特征提取和規(guī)則匹配。
同時(shí)解析圖像特征與工藝文檔,以視覺-語(yǔ)言的聯(lián)合實(shí)現(xiàn)跨模態(tài)的語(yǔ)義理解,突破傳統(tǒng)視覺檢測(cè)的局限,顯著降低誤檢率,提升檢測(cè)效率。
也就是說,DeepSeek可不只是在理想VLA大模型上幫助節(jié)省了9個(gè)月的時(shí)間,節(jié)省了好多錢,在生產(chǎn)線質(zhì)檢上,DeepSeek的視覺語(yǔ)言模型早就用愛發(fā)電,免費(fèi)上班了。
伴隨著軟件定義汽車向AI定義汽車的轉(zhuǎn)變,智能電動(dòng)汽車軟件開發(fā)工作由編寫代碼向AI模型開發(fā)演變。在軟件定義汽車這個(gè)層面,大模型可以助力代碼的開發(fā),在AI定義汽車這個(gè)層面,大模型同樣也可以助力AI模型的開發(fā)。
自端到端范式出現(xiàn)之后,自動(dòng)駕駛算法的形式就由軟件代碼和AI模型的混合體變成了以AI神經(jīng)網(wǎng)絡(luò)為絕對(duì)主體,接下來就以自動(dòng)駕駛算法開發(fā)為例,介紹一下大模型如何助力自動(dòng)駕駛數(shù)據(jù)閉環(huán)。
可以認(rèn)為自動(dòng)駕駛數(shù)據(jù)閉環(huán)指的是自動(dòng)駕駛開發(fā)工具鏈,涵蓋車輛采集數(shù)據(jù)、脫敏數(shù)據(jù)上云、數(shù)據(jù)清洗、場(chǎng)景挖掘、數(shù)據(jù)標(biāo)注、形成場(chǎng)景庫(kù)、模型訓(xùn)練、仿真模擬、評(píng)價(jià)體系、車端OTA這些階段。
借助于生成式AI大模型的超強(qiáng)理解能力,大模型可以用于場(chǎng)景挖掘和數(shù)據(jù)標(biāo)注,大幅提高標(biāo)注速度和準(zhǔn)確性,降低人力成本。
從道路元素、車輛、行人、交通標(biāo)志,到離散要素、幾何、屬性、連接關(guān)系,大模型將在圖像自動(dòng)識(shí)別和精確標(biāo)注中發(fā)揮越來越重要的作用。
借助于生成式AI大模型的超強(qiáng)生成能力,大模型可以用于場(chǎng)景重建和生成,大幅度降低Corner Case的收集成本,并提高模型訓(xùn)練和評(píng)估的效率。
隨著自動(dòng)駕駛系統(tǒng)能力的進(jìn)步,邊緣場(chǎng)景收集的難度和模型能力驗(yàn)證的難度越來越高,通過AI大模型重建和生成駕駛場(chǎng)景,用于自動(dòng)駕駛模型的高效訓(xùn)練和仿真,正在成為頭部智駕企業(yè)的主流選擇。
AI大模型生成用于模型訓(xùn)練和仿真的駕駛場(chǎng)景的突出優(yōu)勢(shì)還在于成本低且靈活可配置。
通過不同的提示詞,可以生成不同天氣、光照、車道下的視頻,可以生成多種車型、相機(jī)個(gè)數(shù)的多視角行車視頻,也可以創(chuàng)建復(fù)雜立交場(chǎng)景、人車混雜的路口場(chǎng)景,以提高自動(dòng)駕駛系統(tǒng)的泛化能力。
大模型正在重構(gòu)汽車研、產(chǎn)、供、銷、服的方方面面,也必將在未來兩三年內(nèi)對(duì)車企固有的人才體系帶來巨大的沖擊,對(duì)很多從業(yè)者而言,這是一個(gè)喜憂參半的消息!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.