今天在各個(gè)群里看到了:
「DeepSeek工程師在GitHub上高亮了來自騰訊的代碼貢獻(xiàn),并用“huge speedup”介紹了這次性能提升」
追到了對(duì)應(yīng)的 PR(提交代碼),在這(兩周前):
https://github.com/deepseek-ai/DeepEP/pull/130
找到了新聞源頭(今天):
DeepSeek致謝騰訊大模型網(wǎng)絡(luò)提速技術(shù)方案貢獻(xiàn)
中譯中:
前段時(shí)間,開源了通信框架 DeepEP
一文詳解:DeepSeek 第二天開源的 DeepEP
框架很棒,尤其是在高端網(wǎng)絡(luò)下。
但很多數(shù)據(jù)中心,網(wǎng)不好,表現(xiàn)差。
騰訊
- 優(yōu)化網(wǎng)絡(luò)資源使用
- 降低通信控制成本
- 保證數(shù)據(jù)處理順序
結(jié)果
- DeepEP在RoCE網(wǎng)絡(luò)上的通信性能提升約2倍
- 在高端InfiniBand網(wǎng)絡(luò)上,已有性能基礎(chǔ)上再提升約30%
- 技術(shù)成果已應(yīng)用于騰訊內(nèi)部大模型訓(xùn)練
開源
- 優(yōu)化已開源,并入了 DeepEP 項(xiàng)目
- DeepSeek 團(tuán)隊(duì)表示感謝
One Morething
開源不是智商稅
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.