公眾號記得加星標??,第一時間看推送不會錯過。
來源:內容來自wccftech。
AMD 對未來消費級 GPU 領域有著宏大的計劃,而且并非普通方案。根據傳聞和最新的專利,公司預計很快將采用多芯粒 GPU。
多芯粒模塊(MCM)的概念對于圖形處理領域來說并不完全陌生,但由于單芯片設計的局限性,整個行業正在逐步傾向于 MCM 架構。AMD 看起來是這一領域經驗豐富的公司之一,因為其 Instinct MI200 AI 加速器系列是首個采用 MCM 設計的產品,在一個封裝內集成了多個芯粒,例如圖形處理核心(GPCs)、HBM 堆疊內存和 I/O 芯片。根據 coreteks 的說法,在 Instinct MI350 系列中,AMD 采取了一種全新的方式,這可能成為基于芯粒的消費級 GPU 的基礎。
然而,在游戲 GPU 中采用芯粒設計所面臨的最大限制是更高的延遲,因為幀渲染無法容忍遠距離的數據跳躍。為了解決這個問題,AMD 必須提出一種盡可能縮短數據與計算之間距離的解決方案。根據視頻中披露的一項新專利顯示,AMD 可能已經破解了“多芯粒”游戲 GPU 的設計之道。有趣的是,這項專利披露的細節是關于 CPU 的,而非 GPU,但文本和機制都表明,它面向的是圖形處理的使用場景。
那么,AMD 究竟將如何在 GPU 中使用多芯粒設計呢?根據專利的說法,其關鍵技術是一種“帶有智能交換器的數據結構電路”,用于連接計算芯粒與內存控制器之間的通信。這基本上就是 AMD 的 Infinity Fabric,但縮小并針對消費級 GPU 進行了優化,因為 AMD 無法使用 HBM 內存芯片。該交換器旨在優化內存訪問,首先會比較圖形任務的請求是否需要任務遷移或數據復制,其決策延遲在納秒級別。
現在數據訪問問題解決后,該專利提出每個 GCD(圖形計算單元)將配備 L1 和 L2 緩存,類似于 AI 加速器的結構。此外,還可以通過交換器訪問額外的共享 L3 緩存(或堆疊式 SRAM),該交換器將連接所有的 GCD。這將減少對全局內存的訪問,更重要的是,作為芯粒之間的共享暫存區,類似于 AMD 在處理器中使用的 3D V-Cache。專利中還提到堆疊式 DRAM,它本質上是 MCM 設計的基礎。
此次多芯粒專利的亮點在于,AMD 已經具備完整的生態系統。公司可以使用臺積電的 InFO-RDL 橋接技術,以及在芯片之間使用特定版本的 Infinity Fabric 進行封裝。而這種實現之所以更加吸引人,是因為它是 AI 加速器的縮小版。如果你還記得,AMD 計劃將其游戲和 AI 架構合并為一個統一架構——UDNA 架構。AMD 還統一了軟件生態系統,這樣可以攤薄驅動程序和編譯器的開發工作。
由于單芯片設計的限制,行業亟需變革,AMD 或許擁有領先競爭對手的最佳機會之一。然而,芯粒設計也存在復雜性,AMD 在 RDNA 3 中就曾經歷過因芯粒互連帶來的延遲問題。不過,憑借創新的交換器方案,加上額外的共享 L3,AMD 希望能解決延遲問題;但這依然是一次巨大的架構飛躍。作為一名愛好者,我非常期待這項創新能夠進入市場,但我們或許需要等到 UDNA 5 才能見分曉。
https://wccftech.com/amd-chiplet-based-gaming-gpus-are-much-closer-than-you-think/
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4092期內容,歡迎關注。
加星標??第一時間看推送,小號防走丟
求推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.