從DeepSeek V3開源趨勢重新審視2025年大模型落地的最佳AI infra土壤

2025-03-10 10:07:24　來源: 人工智能研究

貴州舉報

分享至

很多時候工程架構(gòu)解決的是復(fù)雜性問題，對于 LLM 來說，模型結(jié)構(gòu)相對固定，結(jié)構(gòu)核心部分已經(jīng)變成全手寫以達(dá)成最佳性能，好像所有的 LLM 模型幾乎可以使用同一套 API。

AI推理需求即將爆發(fā)，甚至也可以說已經(jīng)爆發(fā)的2025年，真正適配AI大模型大規(guī)模落地的底層AI infra應(yīng)該是什么樣的？

DeepSeek V3 作為目前公開資料可以看到的最復(fù)雜、最精巧的大模型 infra 設(shè)計，緊密結(jié)合算法和Infra，可以說在模型的部署上是最高端的一波了，真正發(fā)揮出了模型的極致性能。DeepSeek 把路走通以后，也許未來很多大模型框架，都會往沿著這個方向繼續(xù)演進(jìn)。

我整理了DeepSeek的資源大全，涉及到DeepSeek 的官方鏈接、開源項目、專業(yè)的技術(shù)分析文章，以及不斷更新的行業(yè)資訊，你想知道的關(guān)于 DeepSeek 的一切，都可以在這里找到。掃碼免費領(lǐng)取??（下滑還有更多福利）

研夢非凡3月11日晚（周二）邀請了手握10余篇頂會的楊導(dǎo)師給大家從DeepSeek-V3 的技術(shù)報告入手，深入探討 AI Infrastructure 的關(guān)鍵技術(shù)與創(chuàng)新實踐，展示如何通過高效的計算集群、訓(xùn)練框架、低精度訓(xùn)練以及推理部署優(yōu)化，推動大規(guī)模語言模型的性能與效率提升。

掃碼預(yù)約直播課領(lǐng)資料+福利

課程內(nèi)容

1. 計算集群（Compute Clusters）

如何構(gòu)建高效、可擴(kuò)展的計算集群，以支持 DeepSeek-V3 這種擁有 6710 億參數(shù) 的大規(guī)模混合專家模型（MoE）的訓(xùn)練與推理。

2. 訓(xùn)練框架優(yōu)化（Training Framework）

DualPipe 與計算-通信重疊：通過 DualPipe 技術(shù)實現(xiàn)計算與通信的高效重疊，最大化硬件利用率。
跨節(jié)點全對全通信的高效實現(xiàn)：優(yōu)化多節(jié)點間的通信效率，減少訓(xùn)練中的瓶頸。
極致內(nèi)存節(jié)省與最小開銷：在保證性能的同時，顯著降低內(nèi)存占用，提升訓(xùn)練穩(wěn)定性。

3. FP8 低精度訓(xùn)練（FP8 Training）

混合精度框架：通過混合精度訓(xùn)練加速模型收斂，同時保持高精度模型的性能。
量化與乘法精度提升：在低精度訓(xùn)練中通過量化與乘法優(yōu)化，進(jìn)一步提升模型精度。
低精度存儲與通信：減少存儲與通信開銷，顯著降低訓(xùn)練成本。

4. 推理與部署（Inference and Deployment）

Prefilling 與 Decoding 優(yōu)化：通過預(yù)填充和解碼階段的優(yōu)化，提升推理效率，降低延遲。
硬件設(shè)計建議：針對通信與計算硬件的優(yōu)化建議，為未來 AI 基礎(chǔ)設(shè)施的設(shè)計提供參考。

導(dǎo)師介紹

楊導(dǎo)師

【簡介】畢業(yè)于知名計算機(jī)名校。博士期間研究方向聚焦為計算機(jī)視覺，自然語言處理，高效的深度學(xué)習(xí)訓(xùn)練和推理方法，大語言模型輕量化與高效微調(diào)技術(shù)。

曾在多家公司擔(dān)任算法研究員，并進(jìn)行計算機(jī)視覺，高效模型壓縮算法，多模態(tài)大語言模型的研究，包括模型量化，剪枝，蒸餾，編譯以及高效稀疏化訓(xùn)練與推理。

【科研成果】在國際頂級會議CVPR,ICCV, EMNLP等發(fā)表13篇論文，并擔(dān)任CVPR,ICCV,ECCV,ICML,ICLR, NeurIPS等重要會議和期刊的審稿人。

多項發(fā)明專利，指導(dǎo)學(xué)生有耐心，教學(xué)嚴(yán)謹(jǐn)，思維邏輯縝密，已經(jīng)指導(dǎo)數(shù)十篇論文。對于成果好的學(xué)生，幫助學(xué)生寫推薦信和指導(dǎo)申請碩/博申請。

研夢非凡可指導(dǎo)的研究方向

主流方向科研論文常用方法

掃碼預(yù)約直播課領(lǐng)資料+福利

夢非凡科研論文指導(dǎo)方案

idea并不是直接拍腦門拍出來的，是一遍一遍實驗、跑代碼、改模型、思路修正的過程中產(chǎn)生的。研夢非凡1V1定制化論文指導(dǎo)，和研夢導(dǎo)師一起找idea，研夢導(dǎo)師指導(dǎo)實驗，共同解決數(shù)據(jù)問題。授之以漁——搭建論文寫作框架，增刪改查，針對性實驗指導(dǎo)！哪里薄弱補(bǔ)哪里！

全程1v1論文輔導(dǎo)掃碼咨詢助教

研夢非凡導(dǎo)師團(tuán)隊

研夢非凡的導(dǎo)師來自海外QStop50、國內(nèi)華五、C9、985高校的教授/博士導(dǎo)師/博士后，世界500強(qiáng)公司算法工程師，以及國內(nèi)外知名人工智能實驗室研究員。

這是一支實力強(qiáng)大的高學(xué)歷導(dǎo)師團(tuán)隊，在計算機(jī)科學(xué)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等領(lǐng)域，積累了豐富的科研經(jīng)歷，研究成果也發(fā)表在國際各大頂級會議和期刊上，在指導(dǎo)學(xué)員的過程中，全程秉持初心，堅持手把手個性化帶教。包括但不限于以下導(dǎo)師～～

<<< 左右滑動見更多 >>>

掃碼預(yù)約研夢非凡1v1導(dǎo)師meeting

研夢非凡隸屬于蘇州研途教育，深耕考研輔導(dǎo)行業(yè)13年，累計服務(wù)1w+付費學(xué)員（60%高校學(xué)生/教師，40%職場精英）；科研為本，質(zhì)量為先！我們有：500+ 國內(nèi)外頂尖高校博士/教授，互聯(lián)網(wǎng)大廠/獨角獸公司的高級算法科學(xué)家組成的教師團(tuán)隊;深度定制的科研服務(wù)，根據(jù)每位學(xué)員的實際情況，提供個性化的科研輔導(dǎo)方案，確保交付結(jié)果;一站式、全方位科研支持，從選題到方案設(shè)計，從實驗實施到論文撰寫、成果發(fā)表，4V1全流程保姆式服務(wù)！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.