本文由半導體產業縱橫(ID:ICVIEWS)編譯自techxplore
晶圓級處理器可以提供更強大的計算能力和更高的能源效率。
加州大學河濱分校的工程師在《設備》雜志上發表的一篇技術評論論文探討了一種新型計算機芯片的前景,這種芯片可以重塑人工智能的未來,并且更加環保。
Cerebras 制造的這些巨型芯片被稱為晶圓級加速器,建立在餐盤大小的硅晶圓上,與傳統的圖形處理單元(GPU)形成鮮明對比,后者的大小不比郵票大。
加州大學河濱分校跨學科團隊的論文得出結論:晶圓級處理器可以提供更強大的計算能力和更高的能源效率——隨著人工智能模型變得越來越大、要求越來越高,這些特性正是所需要的。
“晶圓級技術代表著一次重大飛躍,”加州大學河濱分校伯恩斯工程學院電氣與計算機工程教授、該論文的主要作者米赫里·奧茲坎 (Mihri Ozkan) 表示。“它使擁有數萬億個參數的人工智能模型能夠比傳統系統運行得更快、更高效。”
除了 Ozkan 之外,合著者還包括 UCR 研究生 Lily Pompa、Md Shaihan Bin Iqbal、Yiu Chan、Daniel Morales、Zixun Chen、Handing Wang、Lusha Gao 和 Sandra Hernandez Gonzalez。
Ozkan 表示:“通過將所有東西都放在一個晶圓上,就可以避免芯片間通信造成的延遲和功率損失。”
該論文還重點介紹了晶圓上芯片封裝等技術,這些技術可以使晶圓級設計更加緊湊、更易于擴展,計算密度可能提高 40 倍。
當前AI訓練硬件呈現多元化發展態勢,主要分為兩大陣營:采用晶圓級集成技術的專用加速器(如Cerebras WSE-3和Tesla Dojo)和基于傳統架構的GPU集群(如NVIDIA H100)。
Cerebras WSE-3采用臺積電(TSMC)5nm工藝,在46,225mm2的晶圓上集成4萬億個晶體管和90萬個AI優化核心,其44GB片上SRAM可實現21PB/s的內存帶寬。相比之下,Tesla Dojo采用模塊化設計,每個訓練瓦片包含1.25萬億晶體管和8,850個核心,通過特斯拉傳輸協議(TTPoE)實現低延遲通信。
在計算吞吐量方面,WSE-3在FP16精度下達到125PFLOPS的峰值性能,而NVIDIA H100在FP8精度下為1.97PFLOPS(啟用稀疏計算時)。特別值得注意的是,在碳捕獲模擬中,WSE-3展現出比H100快210倍的性能。延遲表現上,晶圓級架構優勢更為明顯:WSE-3的片上延遲達到亞納秒級,而H100的NVLink 4.0雖提供900GB/s帶寬,但多GPU通信延遲仍較高。
能效成為評估AI硬件的關鍵指標。WSE-3通過消除芯片間數據傳輸,實現每瓦2倍于前代的性能提升。其創新的"引擎塊"設計整合了水-丙二醇冷卻回路,可處理23kW的熱設計功耗(TDP)。Tesla Dojo則采用去離子水直接冷卻技術,每個訓練瓦片功耗15kW。相比之下,H100 GPU的能效為7.9TFLOPS/W,需依賴液冷系統應對700W的功耗。
晶圓級芯片面臨的最大挑戰是制造良率。Cerebras采用SwarmX互連架構實現缺陷核心的動態繞行,宣稱達到100倍缺陷容限。Tesla Dojo則采用TSMC的集成扇出(InFO)封裝技術,將25個D1芯片集成在載具晶圓上。在工藝節點方面,WSE-3采用TSMC 5nm FinFET工藝,而Dojo使用7nm工藝,兩者都代表了半導體制造的最前沿。
“如果把 GPU 想象成繁忙的高速公路——效率很高,但交通堵塞會浪費能源,”Ozkan 說道,“晶圓級引擎更像是單軌列車:直接、高效、污染更少。”
“我們看到晶圓級系統本身正在加速可持續性研究,”Ozkan說道。“這對計算領域和地球來說都是雙贏。”
一個系統高達86%的總碳足跡可能來自制造和供應鏈,而不僅僅是能源使用。他們提倡使用可回收材料和低排放合金,以及全生命周期設計實踐。
“效率始于工廠,”Ozkan 說道。“為了真正降低計算的影響,我們需要重新思考整個流程——從晶圓到廢料。這項審查是深度跨學科合作的成果。我們希望它能成為研究人員、工程師和政策制定者探索人工智能硬件未來的路線圖。”
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯系后臺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.