越是信息爆炸的時代,人們越是容易少見多怪。
這幾年,我們見識過各種各樣驚悚的標題,聽了太多“逆天炸裂”、“碳基終結者”、“ChatGPT時刻”、“iPhone時刻”這樣的暴論,但最終只有極少數產品能做到真正的金身不破,DeepSeek就是其中的一個。
問題來了,這個AI大模型能給致力于打造AI汽車的本土車企帶來哪些好處呢?
ChatGPT已經問世將近兩年半,各行各業的從業者們都已經走過了質疑AI、理解大模型、擁抱AI大模型的三個階段。
到了DeepSeek爆火時,汽車業這種與AI強相關的行業在擁抱DeepSeek上沒有展現出一絲一毫的猶豫。
畢竟,大模型一手To B,可以幫助車企提升生產力,一手To C,可以提升智能電動汽車的產品力。
根據字節跳動旗下火山引擎的總結,大模型可以改善車企的業務運營,在營銷、研發、制造、物流、質量、運營各個環節降低運營成本,提升運營效率。
營銷方面自不用提,大家已經見識了DeepSeek寫小作文的能力,天花亂墜,舌燦蓮花,有時我也被它震撼地五體投地。
研發層面,最能體現DeepSeek實力的是它的編碼能力。
和之前的預訓練大模型相比,GPT o1/o3和DeepSeek R1這種推理模型在代碼編寫能力上有了長足的進步。
必然能在去年30%自動編碼、70%人工編碼的基礎上,進一步提升自動編碼的占比。
制造方面,理想汽車25年3月份通過官方媒體表示,24年6月份經過多番評測對比后,引入當時尚未廣泛流行的DeepSeek-VL 7B視覺大模型打造了行業首個 “硅基質檢員”,實現了效率躍升、精度提升、柔性匹配三大突破。
至于網絡上盛傳的比亞迪在電池生產線上部署了基于DeepSeek的工業視覺質檢方案,因為沒有官媒的確認,大概率是哪個小編讓DeepSeek生成的假消息。
在物流、質量、運營方面的應用案例在此就不再一一列舉了。
根據DeepSeek的官方表態,它們重點發力三個方向:數學和代碼、多模態、自然語言。
寫小作文對應的是自然語言本身的能力,助力軟件開發體現的是其代碼能力,在生產線上做質檢體現的是它的多模態能力。
DeepSeek押注的這三個方向和智能電動車企的需求契合度非常高,所以可以預計,車企使用DeepSeek的行為是長期可持續,絕非為了蹭一蹭熱點而已。
萬物皆可AI。近一兩年來,AI PC、AI手機、AI汽車的新概念層出不窮。
有一說一,和其它很多其實并不具備強AI屬性的產品相比,這三類產品的概念還是比較契合現實、中規中矩的。
目前,軟件定義汽車方興未艾,AI定義汽車山雨欲來,隨著智能電動汽車AI屬性的逐漸增強,AI大模型領域的翹楚DeepSeek必然將在AI汽車中找到用武之地。
第一個應用領域顯然是智能座艙。
據悉,目前除了蔚來和小鵬沒有通過官方消息確認在座艙系統里引入DeepSeek,其它新勢力車企、傳統車企、合資車企都相繼官宣了DeepSeek上車的好消息。
需要指出的是,DeepSeek并非車企部署在座艙系統里的唯一大模型,而是與另外一個可以快速響應用戶簡單問題的預訓練大模型一起雙模部署。
比如零跑汽車的座艙系統同時部署了阿里巴巴的通義千問大模型和DeepSeek大模型,通義千問負責快速響應,DeepSeek負責深度思考,然后精準回答用戶的復雜問題。
這種搭配的理論根源來自快慢系統。
通義千問作為系統1,依賴直覺與本能進行快速判斷和高效響應,DeepSeek R1作為系統2,依賴有意識的分析思考進行復雜推理和基于規則的演繹。
可以拿理想汽車智能駕駛解決方案里的快慢雙系統,和座艙系統里的雙模型做類比。
鑒于R1目前的多模態能力并不是太強,對數字座艙來說,它帶來的助益主要體現在語言識別后的模糊意圖理解能力和文本內容生成能力上。
模糊意圖理解能力上,它支持上下文關聯的多輪對話,可以根據情感基調、人物關系、當下情景理解用戶的模糊指令,帶來了自然語言交互的跨越式升級。
文本內容生成能力上,據悉,DeepSeek在訓練語料上大量使用北大中文系學子做數據標注。
其結果就是,它的文字特別優美,而且具有極強的情感穿透力。
想必很多人都曾在它的小作文面前痛哭流涕,反復念叨著知音難覓,知音難覓!
無利不起早,各個車企之所以迫不及待地將DeepSeek搬到座艙里,是因為它可以快速大幅度提升智能座艙系統理解用戶指令并提供高質量回答的能力。
但在智駕系統上,DeepSeek還沒有找到直接的用武之地。
一來,深度思考模式的DeepSeek R1先推理再回答,無法滿足智能駕駛系統對實時性的要求。
二來,它的幻覺極其嚴重,經常理直氣壯地編造數據,信誓旦旦地胡說八道,無法滿足智能駕駛系統對準確性的要求。
不過,DeepSeek倒是可以在啟發智駕模型訓練新范式獻上一臂之力。
DeepSeek的蒸餾技術路徑表明,使用GPT o1等先進模型生成的高質量數據做訓練,可以大幅度壓縮訓練階段的算力需求。
DeepSeek可以通過強化學習生成高質量的智駕場景數據,減少對龐大車隊和人工的依賴,解決數據驅動的端到端模型訓練中的高質量數據缺失問題。
在提升訓練效率上,DeepSeek通過DualPile雙向管道并行算法和EPLB專家并行負載均衡器,實現了數據通信和計算的重疊,提高了計算資源利用率,加快了模型訓練速度,并大大方方地進行了開源。
在前段時間的AI技術分享交流日上,小鵬智駕負責人李力耘展示了小鵬在提高智駕模型訓練速度上的一些有益探索。
其核心攻堅點也放在了提升數據訪問效率上,想必也在一定程度上借助了DeepSeek的開源成果。
除了在生產力這端提供基于強化學習的訓練范式、提升數據訪問效率的解決方案,在產品力這端,DeepSeek R1開源的一些技術成果也能用于提升模型的運算速度。
在三月初那次開源周活動里,DeepSeek開源了DeepGEMM矩陣乘法加速庫,支持FP8精度,提升了大規模矩陣運算的效率。
其開源的3FS并行文件系統實現了高速數據存取,可同時用于AI模型的訓練和推理,也能幫助提升車端模型的推理能力。
五月將至,DeepSeek R2就要問世了,想必很多車企正在翹首以盼,包括那兩家至今尚未官宣支持DeepSeek的車企,別再端著了!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.