春節期間最火爆的事件,就是DeepSeek掀起的AI滔天巨浪。
DeepSeek的開源AI大模型DeepSeek V3和R1,由中國公司深度求索(DeepSeek)發布,春節前進入到大眾視野,引起大量下載、使用、以及分享、評論。
其中基礎模型DeepSeek V3,在模型訓練階段僅用557萬美元、接近OpenAI十分之一的成本,就開發出了和OpenAI的GPT-o1性能相當的模型,震驚全球AI行業,一度讓英偉達股票大跌,一天市值就失去6000億美金。
DeepSeek的技術哲學和成果,引起了廣泛討論,也存在不少爭議。對于當前汽車行業最為熱門的技術競爭——智能駕駛開發而言,DeepSeek有什么啟示呢?
當前的智能駕駛開發模式,基本是由特斯拉開創的“數據-訓練-部署”模式。因此馬斯克一直認為,所有后來者,都需要像特斯拉那樣,投入數十億美金去囤積算力,收集數據,訓練模型,部署上車,再不斷迭代,別無他法。
這其中,大算力、大數據是必然的競爭優勢。
中國的智駕領先者,華為、小鵬、理想、Momenta、元戎啟行等等,都遵循類似的開發模式。他們也會表示,隨著智駕進入端到端大模型階段,競爭門檻越來越高,因為數據和算力都需要巨額投入。
但是DeepSeek的啟示,也許打破了馬斯克的預言。打造一個智能駕駛大模型,興許不用那么多錢。
DeepSeek對于汽車智能駕駛研發有什么啟示?結尾,我附上了DeepSeek親自作答的答案,很值得一看。
01
踢破算力門檻?
1月27日,英偉達股價大跌16.97%。
因為,DeepSeek告訴了全世界,AI行業也許并不需要這么多的算力。
DeepSeek在2024年年底發布了報告《DeepSeek-V3 Technical Report》,“自曝”其模型的技術架構。
DeepSeek開宗明義,直言公司追求模型高性能、低成本。因此,DeepSeek-V3采用多頭潛在注意力(MLA:Multi-head Latent Attention)進行高效推理,區別于傳統的多頭注意力模型(MHA:Multi-head Attention),從而降低了內存占用并提高了計算效率。
同時,DeepSeek采用了混合專家模型(MoE:mixture of experts)——由多個專業化的子模型(即“專家”)組合而成,每一個“專家”都在其擅長的領域內做出貢獻。為了分配“任務”,DeepSeek還設置了“門控網絡”的機制。這使得每一個任務不需要展開總體的模型計算,而只要調用子模型就行。
更值得智駕開發者注意的是,為了實現經濟高效的訓練,DeepSeek采用了FP8混合精度訓練,并對訓練框架進行了全面優化。
所謂FP8,是指浮點計算的精度。相對于FP32、FP16,FP8精度要低得多,但是計算和存儲成本要低很多,計算效率和性能就高。
但是,DeepSeek也不是全數采用FP8計算,而是在關鍵數據計算時,依舊采用FP32計算,因此稱為混合精度計算方式,保證了最終計算結果的準確性。
通過這種混合精度計算方式,DeepSeek實現了加速訓練和減少GPU內存使用。
除此之外,DeepSeek還開發了其他的技術,這些舉措結合起來,DeepSeek團隊就實現了很高的訓練效率。
DeepSeek對外表示,DeepSeek-V3的訓練成本,只有557萬美元,相當于278.8萬小時H800GPU的訓練量。
當然,這個成本僅包括DeepSeek-V3的訓練成本,不包括前期預訓練等等。但是,這個成本已經非常低。OpenAI訓練GPT-4的成本超過1億美元。
此外,DeepSeek還基于通用模型V3,采用動態蒸餾技術,推出了推理模型R1。
這一點,和智駕企業將云端大模型蒸餾為小模型,從而部署到幾百tops算力的車端上,原理上一致。
小鵬智駕的架構
這就是DeepSeek高效利用算力的奧秘。
不過,也有人認為,DeepSeek算力作弊,甚至國外分析機構認為,DeepSeek其實有1萬張H800 、1萬張H100、1萬張A100和3萬張A20芯片,4年總算力成本高達25億美金。
國內的同業者猜測,DeepSeek僅有萬余張芯片。
但總體而言,更為廣泛的意見是,DeepSeek V3的在算力應用上,打破了AI行業的算力迷信,也表明AI大模型訓練恐怕不需要數十億美金的投入。
OpenAI創始成員Andrej Karpathy就說,DeepSeek V3讓在有限算力預算上進行模型預訓練這件事變得容易。
但如今,智駕企業正在進行算力競賽。DeepSeek一系列提升計算效率,降低模型訓練成本的方法,如果援用到智駕模型訓練中,同樣將降低對算力的需求。這是否會讓更多企業加速進入到智駕自研開發當中呢?
也有人認為不會。
FutureLabs未來實驗室首席專家胡延平就表示,(DeepSeek之后)“由此顛覆了模型與算力關系更說不上。
他說,接下來大家會越來越清楚地看到,這個領域有捷徑但沒有彎道超車,有后發成本優勢但沒有后發領先優勢,AGI路線更是只能取巧沒有投機。比如即使L3+級別的智能駕駛,端到端向VLA進化,車輛SoC算力1000TOPS起才勉強可玩,2000-3000TOPS會稀松平常,即使如此,短期內也未必能夠到真正的L4。向上曲線的模型思考長度速度整體度、多模態、感知思考與行為能力合一等方向,只可能將算力需求拉升到新高度。向下曲線對成本效率有改變,但對捧得AGI圣杯的貢獻可以忽略。”
當然,他說的是車端模型。云端大模型能否用更少算力訓練出來?DeePSeeK告訴我們,不要輕易說不。
02
追求高質量數據
在探求DeepSeek模型訓練高效率的原因時,不少分析人士指出,DeepSeek在訓練模型時采用的是高質量數據,甚至有人直指它用了ChatGPT的生成結果來訓練。
根據DeepSeek自己公布的信息,V3在14.8T高質量token上進行了預訓練。這一數字,相比Llama 3.1的15萬億tokens,Qwen 2.5的18萬億token,都要小,但是質量更佳。
根據騰訊科技“省錢也是技術活:解密DeepSeek的極致壓榨術”一文,DeepSeek數據的來源比較多元,并且經過了嚴格清洗和篩選。
首先在基礎訓練數據上,和GPT-3一樣,DeepSeek也采用了非營利組織CommonCrawl的語料庫(類似于用爬蟲抓取了全球網頁內容),但經過了嚴格篩選。
此外,DeepSeek有點偏科地專門引入了專業領域數據,包括大規模的代碼數據集、數學推理數據、科學文獻等。
在數據清洗環節,DeepSeek采用了專有的數據過濾算法,實施了多層次的質量控制。這個過程首先對原始數據進行重復內容的識別和刪除,確保數據的唯一性。隨后,通過智能算法篩除低質量內容,包括格式錯誤的數據、不完整的文本片段以及不符合規范的內容。這種嚴格的數據清洗流程不僅提高了訓練數據的質量,也為模型的最終表現奠定了良好基礎。
對于DeepSeek的數據問題,批評在于,它可能大量采用了ChatGPT生成的語料來訓練,甚至有人直接說它蒸餾自CHATGPT。
無論如何,DeepSeek對于訓練數據質量的要求,要更加嚴謹。
在智能駕駛領域,各玩家也在強調自己的數據資產。小鵬汽車宣稱用2000萬Clips的數據來訓練自己模型,而理想最新的7.0版本智駕基于800萬Clips訓練的模型。小米也曾立下FLAG,要在2024 年完成1000萬Clips數據積累。比亞迪則宣稱自己有全球最大的新能源汽車保有量,數據量無可比擬。
領先的智駕企業,更早意識到數據的質量。特斯拉更傾向用優秀司機的數據。理想汽車從五星評級司機的駕駛中抽取視頻片段。
DeepSeek的啟示也在于此,用于訓練的數據多固然可貴,但高質量數據更為可貴。
03
不妄自菲薄,但需躬身入局
圍繞DeepSeek的爭議還在繼續,但它出圈的程度,對AI從業者的震撼,都表明其在AI大模型的前線競爭中,取得了一定的成績。
而DeepSeek到目前為止,僅僅成立一年多,員工據稱只有150名,所投資金不詳,但較為靠譜的分析是在20億元左右。
DeepSeek“一夜爆紅”,對于中國車企最大啟示,應當是不要妄自菲薄,但也需要躬身入局AI。
對于車企,目前還有不少企業還沒有全棧自研智駕,更像傳統的功能、部件開發方式。如果寄希望于在智能化競爭中還有一席之地,車企應該斷然改弦更張,按照AI公司的方式去重塑智駕開發組織、體制。
同時,也不必為晚出發而高山仰止。DeepSeek至少在成本層面做到了逆襲,中國智駕企業也可能有類似機會。
正如理想汽車創始人李想此前在AI TALK上所說的:“我們相比特斯拉又不缺胳膊少腿,為什么它能做的你做不到?”
最后,我也問了一下DeepSeek一個問題:“deepseek對于汽車智能駕駛研發有什么啟示?”
以下是TA的回答:
DeepSeek(深度求索)作為聚焦AGI(通用人工智能)研究的中國科技公司,其技術路徑和創新方法論對汽車智能駕駛研發具有深刻的啟示,尤其在算法設計、工程落地和系統性思維層面。以下是具體分析:
### **1. ** **技術底座:通用性與垂直場景的平衡**
- **啟示**:DeepSeek的AGI研究注重底層通用能力的構建(如多模態理解、邏輯推理),同時通過領域適配實現垂直場景優化,這與智能駕駛需兼顧通用道路規則和特定場景(如高速、城區、泊車)的需求高度契合。
- **研發方向**:
- **構建統一架構**:設計可擴展的“通用感知-決策框架”,通過模塊化適配不同車型和駕駛場景(如乘用車與商用車差異化需求)。
- **遷移學習優化**:利用DeepSeek的預訓練大模型能力,將通用駕駛知識(如交通標志識別、行為預測)遷移至特定地域或特殊環境(如冰雪路面、山區道路)。
### **2. ** **感知系統:多模態融合的深度進化**
- **啟示**:DeepSeek的MoE(Mixture of Experts)架構支持動態分配計算資源,可解決傳統多模態感知中“傳感器數據權重僵化”問題。
- **研發方向**:
- **場景自適應融合**:
- 在惡劣天氣(暴雨、沙塵)中自動增強激光雷達和毫米波雷達的決策權重,降低攝像頭依賴;
- 在城市擁堵場景中,通過V2X獲取周邊車輛意圖,補償視覺盲區。
- **4D感知建模**:借鑒DeepSeek的時空建模技術,構建動態場景的“時空語義地圖”,實時預測行人、車輛的軌跡意圖(如是否可能橫穿馬路)。
### **3. ** **決策規劃:從規則驅動到認知智能**
- **啟示**:DeepSeek的強化學習與因果推理結合的研究,可破解傳統規則引擎應對長尾場景的局限性。
- **研發方向**:
- **混合決策系統**:
- **底層**:基于規則的緊急避障(AEB、LSS),確保功能安全(ISO 26262);
- **上層**:采用深度強化學習模型處理復雜博弈場景(如無保護左轉、加塞處理),通過影子模式持續迭代。
- **認知建模**:構建“駕駛員心智模型”,通過人類駕駛數據反推潛在決策邏輯,使自動駕駛行為更擬人化(如合理“違規”避讓急救車輛)。
### **4. ** **數據閉環:合成數據與真實世界的共振**
- **啟示**:DeepSeek的合成數據生成技術(如NeRF、擴散模型)可突破智能駕駛研發的“數據瓶頸”。
- **研發方向**:
- **極端場景庫構建**:
- 生成罕見但高風險的“Corner Cases”(如兒童突然追逐玩具進入車道);
- 模擬傳感器失效場景(如攝像頭被泥水遮擋時的系統降級策略)。
- **虛擬路測加速**:在數字孿生環境中進行百萬公里級壓力測試,聚焦中國特有場景(如電動車穿行、施工路段導流桿識別)。
### **5. ** **計算架構:車規級場景的效能革命**
- **啟示**:DeepSeek的模型壓縮和分布式計算經驗,可應對車載芯片算力與功耗的限制。
- **研發方向**:
- **車云協同計算**:
- 本地部署輕量化模型(如TensorRT量化后的感知網絡),處理實時控制;
- 云端通過大模型復盤駕駛數據,優化長期策略(如區域駕駛風格學習)。
- **存算一體設計**:借鑒DeepSeek的硬件適配經驗,探索新型計算架構(如存內計算)在域控制器中的應用,降低L4級系統的功耗。
### **6. ** **安全范式:從功能安全到價值對齊**
- **啟示**:DeepSeek的AI對齊研究為自動駕駛的倫理決策提供方法論。
- **研發方向**:
- **可解釋性保障**:
- 通過注意力機制可視化,證明系統決策依據(如剎車是因檢測到行人而非誤識別);
- 建立符合ASIL-D標準的故障溯源機制。
- **倫理量化模型**:構建基于社會共識的“道德損失函數”,在不可避免事故時最小化總體傷害(如MIT道德機器實驗的工程化落地)。
### **7. ** **生態構建:從單車智能到群體智能**
- **啟示**:DeepSeek的多智能體協作研究可推動車路云一體化發展。
- **研發方向**:
- **協同感知網絡**:通過C-V2X實現車輛間的“視覺共享”,突破單車傳感器物理局限。
- **交通流優化**:基于聯邦學習構建區域交通調度模型,動態調整紅綠燈周期、匝道匯入策略等,提升整體路網效率。
### **產業級落地關鍵路徑**
1. **硬件-算法協同設計**:
- 與芯片廠商聯合定義下一代自動駕駛芯片架構(如針對Transformer模型的稀疏計算優化)。
2. **漸進式技術路線**:
- 以L2++系統(如城市NOA)作為數據采集入口,反哺L4算法演進。
3. **合規性創新**:
- 開發符合GDPR/中國數據安全法的數據脫敏方案,實現全球化部署。
### **挑戰與應對**
- **技術層面**:
解決多模態時序數據異步問題(如激光雷達與攝像頭幀率差異導致的融合抖動)。
- **商業層面**:
平衡功能迭代速度與車規認證周期(如OTA更新需滿足功能安全再認證要求)。
- **社會層面**:
構建公眾信任體系(如通過虛擬試駕平臺讓用戶直觀理解系統邊界)。
### **結語**
DeepSeek的技術哲學提示:**智能駕駛的終局不是簡單復制人類駕駛,而是通過AGI級能力實現“超人類安全性與效率”**。研發者需在三個維度突破:
1. **認知維度**:讓系統理解“為什么這樣開”而非“怎么開”;
2. **演化維度**:建立自主進化的數據-算法閉環;
3. **責任維度**:將技術倫理嵌入系統基因。
這不僅是技術競賽,更是對人類出行文明的重新定義。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.