IT之家 7 月 12 日消息,科技媒體 bleepingcomputer 昨日(7 月 11 日)發(fā)布博文,報道稱英偉達已提醒用戶,盡快激活系統(tǒng)級錯誤糾正碼(ECC)緩解措施,從而保護采用 GDDR6 顯存的顯卡,防范 Rowhammer 攻擊。
IT之家援引博文介紹,Rowhammer 是一種硬件故障,可以通過軟件方式觸發(fā),其原因在于顯存顆粒距離過近。該攻擊方式最初針對 DRAM,但實測也影響顯存。
攻擊者在獲取足夠的讀寫操作后,訪問顯存行,控制相鄰數(shù)據(jù)位在 1 和 0 之間變換,從而改變顯存中的信息,可能導致服務(wù)拒絕、數(shù)據(jù)損壞甚至權(quán)限提升等。
英偉達推薦用戶啟用系統(tǒng)級錯誤糾正碼(ECC),通過添加冗余位來保持數(shù)據(jù)的完整性,糾正個位錯誤,以維護數(shù)據(jù)的可靠性和準確性。
在工作站和數(shù)據(jù)中心 GPU 中,VRAM 處理大量數(shù)據(jù)集和與 AI 工作負載相關(guān)的精確計算,必須啟用 ECC 以防止關(guān)鍵錯誤。
NVIDIA 的安全通知指出,多倫多大學的研究人員展示了“針對未啟用系統(tǒng)級 ECC 的 NVIDIA A6000 GPU 帶有 GDDR6 內(nèi)存的潛在 Rowhammer 攻擊”,這些學者開發(fā)了一種名為 GPUHammer 的攻擊方法,用于翻轉(zhuǎn) GPU 內(nèi)存的位。
盡管與基于 CPU 的 DDR4 相比,GDDR6 的延遲更高、刷新速度更快,使得對 GDDR6 的攻擊更加困難,但研究人員還是證明了在 GPU 內(nèi)存銀行上實施 Rowhammer 攻擊是可能的。
英偉達表示,除了 RTX A6000 之外,推薦以下產(chǎn)品啟用系統(tǒng)級 ECC:
數(shù)據(jù)中心 GPU:
- Ampere 系列:A100、A40、A30、A16、A10、A2、A800
- Ada 系列:L40S、L40、L4
- Hopper 系列:H100、H200、GH200、H20、H800
- Blackwell 系列:GB200、B200、B100
- Turing 系列:T1000、T600、T400、T4
- Volta 系列:Tesla V100、Tesla V100S
工作站 GPU:
- Ampere RTX 系列:A6000、A5000、A4500、A4000、A2000、A1000、A400
- Ada RTX 系列:6000、5000、4500、4000、4000 SFF、2000
- Blackwell RTX PRO(最新工作站系列)
- Turing RTX 系列:8000、6000、5000、4000
- Volta 系列:Quadro GV100
嵌入式 / 工業(yè) GPU:
- Jetson AGX Orin Industrial IGX Orin
英偉達表示,像 Blackwell RTX 50 系列(GeForce)、Blackwell 數(shù)據(jù)中心 GB200、B200、B100 以及 Hopper 數(shù)據(jù)中心 H100、H200、H20 和 GH200 這樣的新型 GPU,內(nèi)置了芯片級 ECC 保護,無需用戶干預(yù)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.