99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek風暴卷起,“特斯拉們”會被顛覆嗎?

0
分享至



春節期間最火爆的事件,就是DeepSeek掀起的AI滔天巨浪。

DeepSeek的開源AI大模型DeepSeek V3和R1,由中國公司深度求索(DeepSeek)發布,春節前進入到大眾視野,引起大量下載、使用、以及分享、評論。

其中基礎模型DeepSeek V3,在模型訓練階段僅用557萬美元、接近OpenAI十分之一的成本,就開發出了和OpenAI的GPT-o1性能相當的模型,震驚全球AI行業,一度讓英偉達股票大跌,一天市值就失去6000億美金。

DeepSeek的技術哲學和成果,引起了廣泛討論,也存在不少爭議。對于當前汽車行業最為熱門的技術競爭——智能駕駛開發而言,DeepSeek有什么啟示呢?

當前的智能駕駛開發模式,基本是由特斯拉開創的“數據-訓練-部署”模式。因此馬斯克一直認為,所有后來者,都需要像特斯拉那樣,投入數十億美金去囤積算力,收集數據,訓練模型,部署上車,再不斷迭代,別無他法。

這其中,大算力、大數據是必然的競爭優勢。

中國的智駕領先者,華為、小鵬、理想、Momenta、元戎啟行等等,都遵循類似的開發模式。他們也會表示,隨著智駕進入端到端大模型階段,競爭門檻越來越高,因為數據和算力都需要巨額投入。

但是DeepSeek的啟示,也許打破了馬斯克的預言。打造一個智能駕駛大模型,興許不用那么多錢。

DeepSeek對于汽車智能駕駛研發有什么啟示?結尾,我附上了DeepSeek親自作答的答案,很值得一看。

01

踢破算力門檻?

1月27日,英偉達股價大跌16.97%。

因為,DeepSeek告訴了全世界,AI行業也許并不需要這么多的算力。

DeepSeek在2024年年底發布了報告《DeepSeek-V3 Technical Report》,“自曝”其模型的技術架構。

DeepSeek開宗明義,直言公司追求模型高性能、低成本。因此,DeepSeek-V3采用多頭潛在注意力(MLA:Multi-head Latent Attention)進行高效推理,區別于傳統的多頭注意力模型(MHA:Multi-head Attention),從而降低了內存占用并提高了計算效率。

同時,DeepSeek采用了混合專家模型(MoE:mixture of experts)——由多個專業化的子模型(即“專家”)組合而成,每一個“專家”都在其擅長的領域內做出貢獻。為了分配“任務”,DeepSeek還設置了“門控網絡”的機制。這使得每一個任務不需要展開總體的模型計算,而只要調用子模型就行。

更值得智駕開發者注意的是,為了實現經濟高效的訓練,DeepSeek采用了FP8混合精度訓練,并對訓練框架進行了全面優化。

所謂FP8,是指浮點計算的精度。相對于FP32、FP16,FP8精度要低得多,但是計算和存儲成本要低很多,計算效率和性能就高。

但是,DeepSeek也不是全數采用FP8計算,而是在關鍵數據計算時,依舊采用FP32計算,因此稱為混合精度計算方式,保證了最終計算結果的準確性。

通過這種混合精度計算方式,DeepSeek實現了加速訓練和減少GPU內存使用。

除此之外,DeepSeek還開發了其他的技術,這些舉措結合起來,DeepSeek團隊就實現了很高的訓練效率。



DeepSeek對外表示,DeepSeek-V3的訓練成本,只有557萬美元,相當于278.8萬小時H800GPU的訓練量。

當然,這個成本僅包括DeepSeek-V3的訓練成本,不包括前期預訓練等等。但是,這個成本已經非常低。OpenAI訓練GPT-4的成本超過1億美元。

此外,DeepSeek還基于通用模型V3,采用動態蒸餾技術,推出了推理模型R1。

這一點,和智駕企業將云端大模型蒸餾為小模型,從而部署到幾百tops算力的車端上,原理上一致。


小鵬智駕的架構

這就是DeepSeek高效利用算力的奧秘。

不過,也有人認為,DeepSeek算力作弊,甚至國外分析機構認為,DeepSeek其實有1萬張H800 、1萬張H100、1萬張A100和3萬張A20芯片,4年總算力成本高達25億美金。

國內的同業者猜測,DeepSeek僅有萬余張芯片。

但總體而言,更為廣泛的意見是,DeepSeek V3的在算力應用上,打破了AI行業的算力迷信,也表明AI大模型訓練恐怕不需要數十億美金的投入。

OpenAI創始成員Andrej Karpathy就說,DeepSeek V3讓在有限算力預算上進行模型預訓練這件事變得容易。



但如今,智駕企業正在進行算力競賽。DeepSeek一系列提升計算效率,降低模型訓練成本的方法,如果援用到智駕模型訓練中,同樣將降低對算力的需求。這是否會讓更多企業加速進入到智駕自研開發當中呢?

也有人認為不會。

FutureLabs未來實驗室首席專家胡延平就表示,(DeepSeek之后)“由此顛覆了模型與算力關系更說不上。

他說,接下來大家會越來越清楚地看到,這個領域有捷徑但沒有彎道超車,有后發成本優勢但沒有后發領先優勢,AGI路線更是只能取巧沒有投機。比如即使L3+級別的智能駕駛,端到端向VLA進化,車輛SoC算力1000TOPS起才勉強可玩,2000-3000TOPS會稀松平常,即使如此,短期內也未必能夠到真正的L4。向上曲線的模型思考長度速度整體度、多模態、感知思考與行為能力合一等方向,只可能將算力需求拉升到新高度。向下曲線對成本效率有改變,但對捧得AGI圣杯的貢獻可以忽略。”

當然,他說的是車端模型。云端大模型能否用更少算力訓練出來?DeePSeeK告訴我們,不要輕易說不。

02

追求高質量數據

在探求DeepSeek模型訓練高效率的原因時,不少分析人士指出,DeepSeek在訓練模型時采用的是高質量數據,甚至有人直指它用了ChatGPT的生成結果來訓練。

根據DeepSeek自己公布的信息,V3在14.8T高質量token上進行了預訓練。這一數字,相比Llama 3.1的15萬億tokens,Qwen 2.5的18萬億token,都要小,但是質量更佳。

根據騰訊科技“省錢也是技術活:解密DeepSeek的極致壓榨術”一文,DeepSeek數據的來源比較多元,并且經過了嚴格清洗和篩選。

首先在基礎訓練數據上,和GPT-3一樣,DeepSeek也采用了非營利組織CommonCrawl的語料庫(類似于用爬蟲抓取了全球網頁內容),但經過了嚴格篩選。

此外,DeepSeek有點偏科地專門引入了專業領域數據,包括大規模的代碼數據集、數學推理數據、科學文獻等。

在數據清洗環節,DeepSeek采用了專有的數據過濾算法,實施了多層次的質量控制。這個過程首先對原始數據進行重復內容的識別和刪除,確保數據的唯一性。隨后,通過智能算法篩除低質量內容,包括格式錯誤的數據、不完整的文本片段以及不符合規范的內容。這種嚴格的數據清洗流程不僅提高了訓練數據的質量,也為模型的最終表現奠定了良好基礎。

對于DeepSeek的數據問題,批評在于,它可能大量采用了ChatGPT生成的語料來訓練,甚至有人直接說它蒸餾自CHATGPT。

無論如何,DeepSeek對于訓練數據質量的要求,要更加嚴謹。

在智能駕駛領域,各玩家也在強調自己的數據資產。小鵬汽車宣稱用2000萬Clips的數據來訓練自己模型,而理想最新的7.0版本智駕基于800萬Clips訓練的模型。小米也曾立下FLAG,要在2024 年完成1000萬Clips數據積累。比亞迪則宣稱自己有全球最大的新能源汽車保有量,數據量無可比擬。

領先的智駕企業,更早意識到數據的質量。特斯拉更傾向用優秀司機的數據。理想汽車從五星評級司機的駕駛中抽取視頻片段。

DeepSeek的啟示也在于此,用于訓練的數據多固然可貴,但高質量數據更為可貴。

03

不妄自菲薄,但需躬身入局

圍繞DeepSeek的爭議還在繼續,但它出圈的程度,對AI從業者的震撼,都表明其在AI大模型的前線競爭中,取得了一定的成績。

而DeepSeek到目前為止,僅僅成立一年多,員工據稱只有150名,所投資金不詳,但較為靠譜的分析是在20億元左右。

DeepSeek“一夜爆紅”,對于中國車企最大啟示,應當是不要妄自菲薄,但也需要躬身入局AI。

對于車企,目前還有不少企業還沒有全棧自研智駕,更像傳統的功能、部件開發方式。如果寄希望于在智能化競爭中還有一席之地,車企應該斷然改弦更張,按照AI公司的方式去重塑智駕開發組織、體制。

同時,也不必為晚出發而高山仰止。DeepSeek至少在成本層面做到了逆襲,中國智駕企業也可能有類似機會。

正如理想汽車創始人李想此前在AI TALK上所說的:“我們相比特斯拉又不缺胳膊少腿,為什么它能做的你做不到?”

最后,我也問了一下DeepSeek一個問題:“deepseek對于汽車智能駕駛研發有什么啟示?”



以下是TA的回答:

DeepSeek(深度求索)作為聚焦AGI(通用人工智能)研究的中國科技公司,其技術路徑和創新方法論對汽車智能駕駛研發具有深刻的啟示,尤其在算法設計、工程落地和系統性思維層面。以下是具體分析:

### **1. ** **技術底座:通用性與垂直場景的平衡**

- **啟示**:DeepSeek的AGI研究注重底層通用能力的構建(如多模態理解、邏輯推理),同時通過領域適配實現垂直場景優化,這與智能駕駛需兼顧通用道路規則和特定場景(如高速、城區、泊車)的需求高度契合。

- **研發方向**:

- **構建統一架構**:設計可擴展的“通用感知-決策框架”,通過模塊化適配不同車型和駕駛場景(如乘用車與商用車差異化需求)。

- **遷移學習優化**:利用DeepSeek的預訓練大模型能力,將通用駕駛知識(如交通標志識別、行為預測)遷移至特定地域或特殊環境(如冰雪路面、山區道路)。

### **2. ** **感知系統:多模態融合的深度進化**

- **啟示**:DeepSeek的MoE(Mixture of Experts)架構支持動態分配計算資源,可解決傳統多模態感知中“傳感器數據權重僵化”問題。

- **研發方向**:

- **場景自適應融合**:

- 在惡劣天氣(暴雨、沙塵)中自動增強激光雷達和毫米波雷達的決策權重,降低攝像頭依賴;

- 在城市擁堵場景中,通過V2X獲取周邊車輛意圖,補償視覺盲區。

- **4D感知建模**:借鑒DeepSeek的時空建模技術,構建動態場景的“時空語義地圖”,實時預測行人、車輛的軌跡意圖(如是否可能橫穿馬路)。

### **3. ** **決策規劃:從規則驅動到認知智能**

- **啟示**:DeepSeek的強化學習與因果推理結合的研究,可破解傳統規則引擎應對長尾場景的局限性。

- **研發方向**:

- **混合決策系統**:

- **底層**:基于規則的緊急避障(AEB、LSS),確保功能安全(ISO 26262);

- **上層**:采用深度強化學習模型處理復雜博弈場景(如無保護左轉、加塞處理),通過影子模式持續迭代。

- **認知建模**:構建“駕駛員心智模型”,通過人類駕駛數據反推潛在決策邏輯,使自動駕駛行為更擬人化(如合理“違規”避讓急救車輛)。

### **4. ** **數據閉環:合成數據與真實世界的共振**

- **啟示**:DeepSeek的合成數據生成技術(如NeRF、擴散模型)可突破智能駕駛研發的“數據瓶頸”。

- **研發方向**:

- **極端場景庫構建**:

- 生成罕見但高風險的“Corner Cases”(如兒童突然追逐玩具進入車道);

- 模擬傳感器失效場景(如攝像頭被泥水遮擋時的系統降級策略)。

- **虛擬路測加速**:在數字孿生環境中進行百萬公里級壓力測試,聚焦中國特有場景(如電動車穿行、施工路段導流桿識別)。

### **5. ** **計算架構:車規級場景的效能革命**

- **啟示**:DeepSeek的模型壓縮和分布式計算經驗,可應對車載芯片算力與功耗的限制。

- **研發方向**:

- **車云協同計算**:

- 本地部署輕量化模型(如TensorRT量化后的感知網絡),處理實時控制;

- 云端通過大模型復盤駕駛數據,優化長期策略(如區域駕駛風格學習)。

- **存算一體設計**:借鑒DeepSeek的硬件適配經驗,探索新型計算架構(如存內計算)在域控制器中的應用,降低L4級系統的功耗。

### **6. ** **安全范式:從功能安全到價值對齊**

- **啟示**:DeepSeek的AI對齊研究為自動駕駛的倫理決策提供方法論。

- **研發方向**:

- **可解釋性保障**:

- 通過注意力機制可視化,證明系統決策依據(如剎車是因檢測到行人而非誤識別);

- 建立符合ASIL-D標準的故障溯源機制。

- **倫理量化模型**:構建基于社會共識的“道德損失函數”,在不可避免事故時最小化總體傷害(如MIT道德機器實驗的工程化落地)。

### **7. ** **生態構建:從單車智能到群體智能**

- **啟示**:DeepSeek的多智能體協作研究可推動車路云一體化發展。

- **研發方向**:

- **協同感知網絡**:通過C-V2X實現車輛間的“視覺共享”,突破單車傳感器物理局限。

- **交通流優化**:基于聯邦學習構建區域交通調度模型,動態調整紅綠燈周期、匝道匯入策略等,提升整體路網效率。

### **產業級落地關鍵路徑**

1. **硬件-算法協同設計**:

- 與芯片廠商聯合定義下一代自動駕駛芯片架構(如針對Transformer模型的稀疏計算優化)。

2. **漸進式技術路線**:

- 以L2++系統(如城市NOA)作為數據采集入口,反哺L4算法演進。

3. **合規性創新**:

- 開發符合GDPR/中國數據安全法的數據脫敏方案,實現全球化部署。

### **挑戰與應對**

- **技術層面**:

解決多模態時序數據異步問題(如激光雷達與攝像頭幀率差異導致的融合抖動)。

- **商業層面**:

平衡功能迭代速度與車規認證周期(如OTA更新需滿足功能安全再認證要求)。

- **社會層面**:

構建公眾信任體系(如通過虛擬試駕平臺讓用戶直觀理解系統邊界)。

### **結語**

DeepSeek的技術哲學提示:**智能駕駛的終局不是簡單復制人類駕駛,而是通過AGI級能力實現“超人類安全性與效率”**。研發者需在三個維度突破:

1. **認知維度**:讓系統理解“為什么這樣開”而非“怎么開”;

2. **演化維度**:建立自主進化的數據-算法閉環;

3. **責任維度**:將技術倫理嵌入系統基因。

這不僅是技術競賽,更是對人類出行文明的重新定義。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
6-1大勝!王欣瑜殺進4強,保存體能PK頭號種子,劍指決賽

6-1大勝!王欣瑜殺進4強,保存體能PK頭號種子,劍指決賽

大秦壁虎白話體育
2025-07-25 17:46:00
壞消息一個接一個,李嘉誠已經沒有回頭路,李氏家族暴虧781億!

壞消息一個接一個,李嘉誠已經沒有回頭路,李氏家族暴虧781億!

做一個合格的吃瓜群眾
2025-07-25 16:38:29
突發!東沙群島上空發生激烈對峙!臺軍機遭信號干擾,翼龍10出動

突發!東沙群島上空發生激烈對峙!臺軍機遭信號干擾,翼龍10出動

掌青說歷史
2025-07-25 21:24:40
300年來首次!2004年遼寧出現一只咬傷村民,一個腳印長30厘米

300年來首次!2004年遼寧出現一只咬傷村民,一個腳印長30厘米

萬象硬核本尊
2025-07-25 19:25:29
美網紅:楊瀚森不會英語就不配來這撈金 尊重都是相互的

美網紅:楊瀚森不會英語就不配來這撈金 尊重都是相互的

直播吧
2025-07-25 09:50:08
亂收費害了整個行業?全國電視機開機率只有30%,用戶:活該如此

亂收費害了整個行業?全國電視機開機率只有30%,用戶:活該如此

時尚的弄潮
2025-07-24 05:47:06
快船球迷必須接受的殘酷現實:這套新陣容,缺陷比想象中更致命

快船球迷必須接受的殘酷現實:這套新陣容,缺陷比想象中更致命

夜白侃球
2025-07-24 22:01:19
2萬億!武漢穩了!

2萬億!武漢穩了!

越喬
2025-07-25 16:26:21
三天攻下柬埔寨,泰國外長赴美求助,47國收到通知,中方斬釘截鐵

三天攻下柬埔寨,泰國外長赴美求助,47國收到通知,中方斬釘截鐵

Ck的蜜糖
2025-07-25 07:59:49
夏天最該吃的不是冬瓜,而是它,每周吃兩次,渾身有勁,舒服入伏

夏天最該吃的不是冬瓜,而是它,每周吃兩次,渾身有勁,舒服入伏

江江食研社
2025-07-25 12:30:08
王毅會見東盟秘書長高金洪

王毅會見東盟秘書長高金洪

界面新聞
2025-07-25 16:39:06
總理去世,毛遠新問:誰當總理合適?毛主席說:還是他比較好一些

總理去世,毛遠新問:誰當總理合適?毛主席說:還是他比較好一些

冰雅憶史
2025-07-19 10:38:01
05年,清華教授13歲女兒在公交車上被掐死,生前哀求:再也不敢了

05年,清華教授13歲女兒在公交車上被掐死,生前哀求:再也不敢了

柳絮憶史
2025-07-08 14:11:59
三個姑姑分掉女孩父親遺產后續:二姑身份被扒,瓜分百萬遭起訴

三個姑姑分掉女孩父親遺產后續:二姑身份被扒,瓜分百萬遭起訴

阿纂看事
2025-07-25 17:28:52
許家印曝出大瓜,還有兩孩子!

許家印曝出大瓜,還有兩孩子!

梳子姐
2025-03-20 11:31:08
直到宗慶后人設崩塌,才懂賭王臨終前,把私生子交給何超瓊含金量

直到宗慶后人設崩塌,才懂賭王臨終前,把私生子交給何超瓊含金量

攬星河的筆記
2025-07-18 22:29:50
珠寶晚宴,周也面相變了,哈尼好美,任嘉倫臉凹,張柏芝黑袍搶鏡

珠寶晚宴,周也面相變了,哈尼好美,任嘉倫臉凹,張柏芝黑袍搶鏡

胡一舸北游
2025-07-25 19:11:17
沒想到狂飆2年后,38歲的高葉,再次讓恩人孫紅雷和世界刮目相看

沒想到狂飆2年后,38歲的高葉,再次讓恩人孫紅雷和世界刮目相看

小丸子的娛樂圈
2025-07-23 21:38:18
沖突完全由洪森引起,沒想到泰國真開戰,父子倆把柬埔寨帶入絕境

沖突完全由洪森引起,沒想到泰國真開戰,父子倆把柬埔寨帶入絕境

現代小青青慕慕
2025-07-25 09:09:11
“霉霉”來了!

“霉霉”來了!

上海黃浦
2025-07-25 07:36:22
2025-07-25 22:12:49
電動汽車觀察家
電動汽車觀察家
提供電動汽車權威資訊和意見
2968文章數 3463關注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

18歲男子多付車費索要無果自殺 司機已從租車公司退車

頭條要聞

18歲男子多付車費索要無果自殺 司機已從租車公司退車

體育要聞

3年過去了,她還是歐洲杯上最酷的姐

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態度原創

游戲
家居
房產
藝術
旅游

《嘟嘟臉惡作劇》研發代表專訪:為游戲抵押房產,把捏臉做到極致

家居要聞

環繞設計 空間動線合理

房產要聞

分數線集體飆漲!海中867分!2025海南中招格局大變!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 周宁县| 宽甸| 荆州市| 海安县| 瑞安市| 合川市| 黑水县| 锦屏县| 余姚市| 五台县| 秦安县| 广灵县| 宁夏| 辉南县| 永嘉县| 朔州市| 抚松县| 宜川县| 阳东县| 江门市| 铅山县| 海盐县| 阳原县| 墨玉县| 广南县| 武陟县| 金华市| 万山特区| 佛冈县| 淮阳县| 黑河市| 保定市| 墨脱县| 石狮市| 大同县| 黄龙县| 松原市| 延津县| 徐水县| 剑阁县| 乌拉特前旗|