自GPT問世以來,勤奮的本土車企就一直在探索如何將大模型這個新質(zhì)生產(chǎn)力應用在企業(yè)運營和產(chǎn)品領域。
關于大模型重塑智能座艙的用戶體驗和改造自動駕駛產(chǎn)品,已經(jīng)有了鋪天蓋地的宣傳,至于大模型如何幫助提升車企本身的生產(chǎn)力,卻很少有人提及,其實,這也是非常值得關注的領域。
最危險的地方最安全,最能花錢的地方才能最省錢。
在汽車行業(yè)的業(yè)務流里, 最能體現(xiàn)降本增效的地方是人才密集型、資金密集型的軟件開發(fā)領域。
根據(jù)華為專家在2024汽車人工智能大會上的系統(tǒng)性總結,大模型可以在產(chǎn)品研發(fā)的過程中用于代碼輔助。
展開來看,大模型能夠以多輪對話、邏輯推理、長文本理解、內(nèi)容創(chuàng)作、擴寫與優(yōu)化、情感分析能力輔助需求分析;
以文生圖、多輪對話、邏輯推理能力輔助軟件開發(fā)架構設計;
以注釋生成代碼、代碼補全、代碼重構、代碼翻譯、代碼生成注釋、生成測試用例、多輪對話能力輔助代碼開發(fā);
以注釋生成代碼、代碼補全、生成測試用例、多輪對話能力輔助軟件測試。
其代碼輔助能力覆蓋從需求分析、架構設計、代碼編寫、軟件測試到部署上線、系統(tǒng)維護的整個生命周期。
在無法應用AI神經(jīng)網(wǎng)絡,需要通過寫代碼實現(xiàn)功能的系統(tǒng)里,碼農(nóng)們對AI大模型提高代碼開發(fā)效率樂觀其成,但在AI模型可以取代代碼,直接消滅編寫代碼需求的領域,碼農(nóng)們感到了前所未有的壓力。
自動駕駛算法范式經(jīng)歷了編寫規(guī)則代碼到全面采用AI神經(jīng)網(wǎng)絡的轉變,在規(guī)則時代里,隨著駕駛場景復雜度的提升,頭發(fā)掉了一地的程序員越來越感到無能為力,但不管怎樣,飯碗還是能保住的。
24年開始風靡本土車圈的端到端范式的進步將規(guī)則驅動轉向了數(shù)據(jù)驅動,從駕駛數(shù)據(jù)中模仿學習老司機的決策神經(jīng)網(wǎng)絡提升了應對各種復雜場景的泛化能力,也把很多從事決策模塊開發(fā)的碼農(nóng)們的飯碗砸碎了一地。
開發(fā)出大模型的工種是碼農(nóng),最能感受大模型能力的工種是碼農(nóng),最先被大模型替代的工種還是碼農(nóng),想想真是又魔幻又讓人心酸!
是人都有弱點,越是大佬越是容易被騙。
沒有人比他更懂關稅的川普悍然發(fā)動關稅大戰(zhàn),或許是受到了馬斯克的蒙騙。
在自動駕駛、人形機器人、AI大模型領域一向無比激進的馬斯克或許曾經(jīng)對川普進言,雖然大漂亮沒有那么多懂工藝、懂制造、自律、勤奮的技術工人,但也不是不可能在本土建設起完善的制造業(yè)產(chǎn)業(yè)鏈。
再過一段時間,完全可以依靠人形或具身機器人擰螺絲、焊電路板、搞質(zhì)檢,不用那么多領漢堡和可樂的老爺們上生產(chǎn)線,也能玩得轉。
應該說,作為美利堅科技圈造神運動中的天降猛男,馬斯克當然不會把制造業(yè)看得那么簡單,只是他的想法過于樂觀了。
不過,多模態(tài)視覺語言模型的確可以在生產(chǎn)線上找到用武之地。
比如,理想汽車早在24年7月份就將DeepSeek VL視覺語言模型用在了生產(chǎn)線的質(zhì)檢中。
這類通過視覺-語言聯(lián)合表征框架實現(xiàn)多模態(tài)特征融合的視覺語言模型,能夠將攝像頭捕捉到的圖像與質(zhì)檢知識庫進行語義對齊,通過圖像識別和文本規(guī)則,針對產(chǎn)品缺陷實現(xiàn)基于視覺觀察和語義理解的綜合判斷。
視覺語言模型中的視覺V部分負責提取圖像特征,語言L部分負責通過可持續(xù)更新的質(zhì)檢知識庫進行規(guī)則匹配,并行處理圖像特征提取和規(guī)則匹配。
同時解析圖像特征與工藝文檔,以視覺-語言的聯(lián)合實現(xiàn)跨模態(tài)的語義理解,突破傳統(tǒng)視覺檢測的局限,顯著降低誤檢率,提升檢測效率。
也就是說,DeepSeek可不只是在理想VLA大模型上幫助節(jié)省了9個月的時間,節(jié)省了好多錢,在生產(chǎn)線質(zhì)檢上,DeepSeek的視覺語言模型早就用愛發(fā)電,免費上班了。
伴隨著軟件定義汽車向AI定義汽車的轉變,智能電動汽車軟件開發(fā)工作由編寫代碼向AI模型開發(fā)演變。在軟件定義汽車這個層面,大模型可以助力代碼的開發(fā),在AI定義汽車這個層面,大模型同樣也可以助力AI模型的開發(fā)。
自端到端范式出現(xiàn)之后,自動駕駛算法的形式就由軟件代碼和AI模型的混合體變成了以AI神經(jīng)網(wǎng)絡為絕對主體,接下來就以自動駕駛算法開發(fā)為例,介紹一下大模型如何助力自動駕駛數(shù)據(jù)閉環(huán)。
可以認為自動駕駛數(shù)據(jù)閉環(huán)指的是自動駕駛開發(fā)工具鏈,涵蓋車輛采集數(shù)據(jù)、脫敏數(shù)據(jù)上云、數(shù)據(jù)清洗、場景挖掘、數(shù)據(jù)標注、形成場景庫、模型訓練、仿真模擬、評價體系、車端OTA這些階段。
借助于生成式AI大模型的超強理解能力,大模型可以用于場景挖掘和數(shù)據(jù)標注,大幅提高標注速度和準確性,降低人力成本。
從道路元素、車輛、行人、交通標志,到離散要素、幾何、屬性、連接關系,大模型將在圖像自動識別和精確標注中發(fā)揮越來越重要的作用。
借助于生成式AI大模型的超強生成能力,大模型可以用于場景重建和生成,大幅度降低Corner Case的收集成本,并提高模型訓練和評估的效率。
隨著自動駕駛系統(tǒng)能力的進步,邊緣場景收集的難度和模型能力驗證的難度越來越高,通過AI大模型重建和生成駕駛場景,用于自動駕駛模型的高效訓練和仿真,正在成為頭部智駕企業(yè)的主流選擇。
AI大模型生成用于模型訓練和仿真的駕駛場景的突出優(yōu)勢還在于成本低且靈活可配置。
通過不同的提示詞,可以生成不同天氣、光照、車道下的視頻,可以生成多種車型、相機個數(shù)的多視角行車視頻,也可以創(chuàng)建復雜立交場景、人車混雜的路口場景,以提高自動駕駛系統(tǒng)的泛化能力。
大模型正在重構汽車研、產(chǎn)、供、銷、服的方方面面,也必將在未來兩三年內(nèi)對車企固有的人才體系帶來巨大的沖擊,對很多從業(yè)者而言,這是一個喜憂參半的消息!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.