某高校HPC選型立項會現場
幾位大甲方正在激烈討論…
這位副院長所說的分享,其實是
上周某「科研算力基礎設施」閉門會
會上,一位大型科研機構的研究員
講出了自己單位的HPC選型心得
他的開場白,有這么一段
「我不是反對GPU,但我們所里大部分HPC集群,還都是用CPU來搭建的」
為啥選CPU呢?這位專家繼續解釋
在我們科研單位,一個HPC集群
通常要承載不同科研任務
這些任務,來自不同科研團隊
對算力的需求,也是千差萬別
有的吃緩存、有的吃IO、有的吃主頻
CPU可以更靈活應對這些負載,效率奇高
還有,我們跑的軟件
都是科研軟件,一般人都沒聽過
大量科研軟件,都優先支持CPU
這些軟件的廠家,更愿意在CPU上做優化
總之,科研任務「雜而重」
CPU是全能型選手(性能、靈活性、兼容性)
扛活兒能力更強
基本邏輯搞明白,接下來問題是
市面上CPU,選哪款比較好?
當然是
第五代AMD EPYC 處理器
Turin系列中的【AMD EPYC 9755】
這也是AMD最新一代CPU
話說,這款“9755”一問世
就被很多科研大佬瘋狂點贊
他們也有過買不到合適算力卡的苦惱
結果“9755”把這些高端大活兒都包辦了
這顆“懂科研的CPU”
一口氣解決困擾科研人員的六大難題
HPC機房是科研院所的香餑餑
每個課題組都在搶資源
之前大家都是輪流排隊共用
動不動就是幾十個仿真任務同時跑
而且個個大活兒,負載重、周期長
采用AMD EPYC 9755
可以有效緩解HPC機房的排隊狀況
因為這家伙的性能確實強悍
采用先進的4nm制程
單顆CPU,高達128核,256 個線程
更有同門師兄“9965”甚至能提供192核
以一臺雙路HPC節點為例
搭載2顆 AMD EPYC 9755
單節點算力,就能飆到22.12TFlops
干起活來嗖嗖快
而且,“9755”采用了全新Zen 5架構
具備了更高IPC(每時鐘指令數)
IPC越高,CPU單位時間內處理任務越多
相比上一代Zen 4架構
通用任務快17%,AI和科研任務快37%
一個典型科研計算任務
比如迭代計算、量子化學模擬
需要【高強度+大規模+長時間】穩定計算
極大挑戰CPU的“抗壓能力”
這期間要:不降頻,不掉速,全程拉滿
而“9755”專干這種大場面
高頻穩定輸出,一口氣干到底
它基礎頻率 2.7GHz,最高可達4.1GHz
還有能飆到5GHz的同門兄弟
好比一場科研馬拉松長跑
起跑快、途中快、沖刺快,全程不降速
有些科研任務
可能包含大規模矩陣乘、浮點運算等
比如結構力學、流體力學、電磁場仿真等
要是CPU不給力,漫長等待如煉獄
莫慌,“9755”支持AVX-512指令集
具有完整的512b數據路徑
這可是應對矩陣計算的秘笈
讓它可以全程保持較高的全核頻率
算得又快又穩,告別漫長等待
大型計算任務,往往伴隨海量數據
不是算不動,而是數據“堵在半路了”
內存帶寬跟不上,IO通道也擁堵
數據加載慢一步,CPU就只能躺平
AMD EPYC 9755早就修好數據高速路
首先,大緩存拉滿
配備高達512MB的L3緩存
熱數據直接放在自己“被窩”里
先來一波“近場訪問”,絕對不卡殼
第二,內存通道拉滿
每顆CPU支持12通道DDR5內存
內存容量最高可擴展到 6TB
第三,內存速率拉滿
最高支持6400MT/s
數據加載又快又穩
最后,高速IO拉滿
支持PCIe 5.0 + CXL 2.0
高速設備隨心擴展,數據流轉暢通無阻
科研軟件是“有脾氣”的
有的對緩存特別敏感
就要大緩存、高內存帶寬
有的盯著頻率,主頻越高越歡
有的看核數,偏愛高核心數
AMD EPYC 9755好比超級大廚
能夠滿足各種軟件的不同胃口
高核心數、高頻率、大L3緩存、高IPC、
12通道 DDR5 6400、AVX-512...
還有一點,它是X86架構
生態兼容性好,適配度和優化完善
HPC集群一上量
采購成本、運營成本,都是大開支
電老虎一發威,每年動輒百萬級電費
AMD EPYC 9755堪稱性價比王者
前期采購看→相同預算,算力更高
同樣規模下,搭載“9755”的集群
擁有更多核數、更高主頻、更強算力
算效比更高
后期上線看→相同電費,效率更高
“9755”能效比高,功耗更低
跑同樣多任務,電費省下一大筆
長遠運營看→便于內部統一統籌
搭載“9755”的集群支持高效虛擬化調度
單位可以將HPC集群統一建設和管理
避免院系、科室自建,造成浪費
既能提供超大規模算力
又能按需靈活分配資源
怎么樣,科研場景六大難點
AMD EPYC 9755全部攻克
讓每個科學計算項目,都絲滑無比
讓科研經費的每分錢,都花在刀刃上
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.