本文由半導體產業縱橫(ID:ICVIEWS)編譯自eetimes
RISC-V正在發揮更大的價值。
Tenstorrent 已開始發售其用于 AI 工作負載的 Blackhole 處理器。首席執行官 Jim Keller 表示,這是四年來最好的一天。
在Keller位于加州圣克拉拉的辦公室門外,有一塊白板,上面用粗體字寫著“我們一定會贏!”。旁邊列出了一些在黑洞一代硬件上達到“實用”性能和可靠性水平的模型,其中包括目前公司TT-NN編譯器堆棧中列出的五個模型。“我們還有15個模型正在開發中,”他說。
負責構建基于 Tenstorrent MLIR(多級中間表示)編譯器的團隊 TT-Forge 稍微落后了一點,但 Keller 表示“目前有數百名工程師正在致力于此”。
“MLIR 真的是一個重大勝利,”Keller說。“這是一個不錯的選擇,真的很棒。”
Keller 對為開源項目 MLIR 做出貢獻感到特別興奮。Tenstorrent 的整個軟件棧都是開源的。“這個決定在公司內部和外部都得到了好評,而且它幫助我們招募人才,因為開源精神對工程師很有吸引力,”他說。
“我們在很多方面都獲得了關注,因為人們能夠基于我們的技術構建軟件,而且他們為我們歡呼,因為它有效,而且我們可以對其進行調整。他們對真正的開源軟件棧的存在感到興奮,”Keller 說。
RISC-V投資
Tenstorrent 的芯片和 IP 也基于開源指令集 RISC-V 構建。Keller 表示:“RISC-V 行業的決策速度曾讓我們感到畏懼,但現在我們在某些領域已經處于領先地位。”
“我們正在投資 RISC-V 編譯器技術。我們已經將 LLVM 的性能提高了 10%,并且為開源做出了貢獻。操作系統、驅動程序、工具鏈,一切都在改進。RISC-V 真的很棒,我很高興我們做出了正確的決策,并且能夠從中受益,”Keller 說道。
“AI 代碼生成將會改變代碼。它將更加傾向于并行化,CPU 架構也在發生變化。其他 ISA 無法控制這一點,但 RISC-V 可以,所以我們正在積極地致力于此,”Keller 說。
NVIDIA 近期宣布,將把其用于 GPU 之間通信的互連技術“NVIDIA NVLink”的 IP 授權給部分定制 CPU 和加速器制造商。該公司以自主研發而聞名,但一些人認為此舉旨在圍繞部分 NVIDIA 技術構建多供應商生態系統。當被問及是否對更開放的 NVLink 版本有任何擔憂時,Keller 回答說:“我一點也不擔心。”
Keller說:“Tenstorrent 芯片通過經過驗證的開放標準以太網連接,這已經足夠了。”
他開玩笑說:“我們把NVIDIA做的事情列個清單,然后反其道而行之。以太網真的很棒。小型低成本芯片是個好主意。更簡單的服務器很棒,開源軟件也很棒。”
他還強調了 Tenstorrent 對更便宜的芯片封裝的關注,放棄高帶寬內存 (HBM) 而選擇 GDDR6。
Keller說:“如果你完全照搬領先者的做法,你將獲得 20% 的市場份額,但你會降低價格,而且你不會創造出新的市場。”
“至少有一家公司正在自己的AI硬件中使用Tenstorrent的開源堆棧。這家中國公司提交了一份錯誤報告,Tenstorrent團隊順利修復了該錯誤。這就是開源軟件的本質,即使它可能幫助了中國的競爭對手制造商,”他說。
勝利是靠創新贏得的
“Tenstorrent 將繼續服務中國市場。根據目前的美國出口限制,我們上一代硬件 Wormhole 可以運往中國,但 Blackhole 必須進行精簡,我們正在將這種精簡融入到每一塊硅片中。Ascalon CPU IP 也必須針對中國客戶進行精簡,”Keller 說道。
“限制人工智能技術的出口對美國沒有好處,”Keller說。“限制半導體設備的出口意味著中國將加大國內人工智能技術的研發力度。”
“據我所知,過去五年中國對半導體設備的限制,反而加速了中國的發展速度大約五年,”Keller說道。“勝利是靠創新贏得的,而不是靠限制。這一點早已顯而易見。”
Tenstorrent 目前在塞爾維亞、德國和波蘭設有歐洲辦事處,并應塞浦路斯政府的邀請在塞浦路斯開設辦事處,將使用 Tenstorrent 計算機與塞浦路斯大學開展合作項目。
“各國都希望掌控自己的人工智能技術,而不是依賴美國的超級巨頭,”Keller說,“他們喜歡我們的開源軟件,這樣他們就可以自己做事。”
Keller表示:“我們未來可能設立辦事處的國家之一是西班牙,因為那里有大量與 RISC-V 相關的人才和政府支持。”
在日本,Tenstorrent 也正在與 Rapidus 合作,后者的 2nm 中試線正在啟動中,并且剛剛提前發布了 PDK(工藝設計套件)。
“我們一直在對一些 CPU 進行綜合測試,并向它們發送反饋,”Keller 說,“測試結果基本符合我們的預期。”
構建更大的訓練集群
隨著 Blackhole 芯片的推出,Tenstorrent 正在繼續構建更大規模的訓練集群。目前,他們已經構建了一個由 6 個“Backhole Galaxies ”(192 個芯片)組成的訓練集群,并計劃在未來六個月內實現更大的集群。他們的最終目標是打造一個包含 16 臺 Galaxy 服務器的數據平面引擎。其中 16 臺 Galaxy 服務器用于交換(Tenstorrent 使用自有芯片作為交換機),另外 16 臺 Galaxy 服務器用作優化器,并保留一定的冗余度。
“在演示中,我們將運行一個集群,并展示即使拔掉任何線纜,它也不會停止運行,”Keller說。“原則上,你可以關閉任何服務器的電源,它都會繼續運行。”
他進一步指出,“四臺 Galaxies(128 塊芯片)即可實現快速推理。推理所需的令牌數量將是現有大規模語言 (LLM) 工作負載的百萬倍以上(推理計算量的實際上限取決于人類能夠提出的獨特問題的數量)。”
“我的使命是大幅降低訓練成本,”Keller強調。“我們如何提供合適的平臺來做新的事情?這是一個巨大的挑戰,因為如果你不能訓練,你就無法做新的事情。”
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯系后臺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.