今天在各個群里看到了:
「DeepSeek工程師在GitHub上高亮了來自騰訊的代碼貢獻,并用“huge speedup”介紹了這次性能提升」
追到了對應的 PR(提交代碼),在這(兩周前):
https://github.com/deepseek-ai/DeepEP/pull/130
找到了新聞源頭(今天):
DeepSeek致謝騰訊大模型網絡提速技術方案貢獻
中譯中:
前段時間,開源了通信框架 DeepEP
一文詳解:DeepSeek 第二天開源的 DeepEP
框架很棒,尤其是在高端網絡下。
但很多數(shù)據(jù)中心,網不好,表現(xiàn)差。
騰訊
- 優(yōu)化網絡資源使用
- 降低通信控制成本
- 保證數(shù)據(jù)處理順序
結果
- DeepEP在RoCE網絡上的通信性能提升約2倍
- 在高端InfiniBand網絡上,已有性能基礎上再提升約30%
- 技術成果已應用于騰訊內部大模型訓練
開源
- 優(yōu)化已開源,并入了 DeepEP 項目
- DeepSeek 團隊表示感謝
One Morething
開源不是智商稅
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.