馬斯克表示,特斯拉Dojo AI 訓練計算機正在取得進展。我們將于今年晚些時候上線下一代AI芯片Dojo 2。一項新技術要經過三次重大迭代才能成為偉大的技術。Dojo 2已經很好了,但Dojo 3一定會更棒。
特斯拉AI官方發文的內容是其最新的Dojo技術報告。特斯拉AI表示Dojo超級計算機正面臨制造缺陷和老化導致的靜默數據損壞(SDC)問題。與傳統的系統崩潰不同,這些缺陷不會立即暴露,而是在訓練過程中悄無聲息地破壞數據完整性。
一個有缺陷的節點可能導致耗時數周的AI模型訓練產生錯誤結果,或使收斂速度顯著放緩。更致命的是,這些問題在模型訓練完成后幾乎無法檢測——企業可能在不知情的情況下部署了基于損壞數據訓練的AI系統。
Dojo是特斯拉設計的超級計算機系統,用作人工智能,特別是FSD的訓練場。這個名字是對武術練習道場的致敬。
超級計算機由數千臺稱為節點的小型計算機組成。這些節點各自擁有自己的CPU(中央處理單元)和GPU(圖形處理單元)。前者負責節點的總體管理,后者則處理復雜的事情,比如將任務分割成多個部分并同時進行處理。
來源:新浪網
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.