前不久,小米SU7(參數丨圖片)澎湃OS推送了最新的OTA,小米智能駕駛正式接入了VLM;廣州車展上,極氪發布浩瀚智駕2.0也使用了WLM;理想汽車更是早就應用了端到端+VLM雙架構。這VLM到底是什么技術?會是新的智駕浪潮嗎?
VLM,全稱是Vision Language Model。就是可以識別圖像或者文本中的內容,并且生成信息指令的AI模型。
大家肯定聽說過ChatGPT,就是你通過文字來問它問題,它能自動生成答案給你,這其實就是一種語言模型,而如果輸入的不是文字,而是圖像或者視頻,這就是VLM視覺語言模型了。形象點解釋,它就像我們小學考試中的“看圖說話”一樣。
那讓車輛去“看圖說話”,能有什么作用呢?
大家想想,在開啟領航輔助時,你的車輛能識別潮汐車道嗎?能識別收費站ETC通道嗎?能理解交警的手勢嗎?如果不能,VLM現階段最大的用處,就是彌補端到端智駕方案暫時未訓練過、而無法理解的上述場景。
在如今已經深度應用VLM的理想汽車上,VLM帶來哪些實際體驗提升?小米SU7的VLM目前有哪些應用?VLM會在未來成為必然的趨勢嗎?更多詳細技術介紹,一起來看本期視頻!
如果你也和我們一樣,對汽車行業的變革式發展滿懷憧憬,歡迎大家到B站關注《童濟仁汽車情報所》,我們會在每周五與探討一個你可能感興趣的新話題。大家有任何意見與建議,也歡迎留言與我們交流。
入駐媒體平臺
商務聯系人:Maggie
Tel:135-6413-6455
E-Mail:maggie@neuesmedia.com
版權聲明: 本文為《童濟仁汽車評論》獨家稿件 。 歡迎任何形式的轉載,但須注明出處為《童濟仁汽車評論》和撰寫作者。 如有任何侵權行為,侵權者將承擔相應法律責任。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.