我們正在進入AI(人工智能)時代,以大語言模型為代表的AI技術的加速普及,使得訓練和推理的算力需求大增。
國內市場,智算中心的建設如火如荼。知名研究機構IDC預測,到2027年,中國生成式AI的投資規模將超過130億美元,五年復合增長率高達86.2%。
不過,就在智算中心迅猛發展的同時,一些突出的矛盾也正在凸顯出來。根據老冀的觀察,主要有以下兩大矛盾:
1.算力需求高速增長與投資硬約束的矛盾。如今,AIGC(生成式人工智能)仍在大發展,對于AI算力的需求還在高速增長,這就使得智算中心的算力規模要比傳統數據中心至少高出一個數量級,這也意味著芯片、服務器以及各種配套成本都會顯著上升。另一方面,客戶用于建設智算中心的資金、場地、人工往往都存在預算硬約束。如何在滿足現實預算硬約束的條件下,建設面向未來的智算中心,這是一個“既要又要”的大難題。
2.高能耗與綠色低碳之間的矛盾。智算中心算力規模的急劇膨脹,使得其對電力、水等諸多資源的消耗也出現了高速增長;而資源的消耗,也會增加碳排放。 隨著“雙碳”可持續發展目標的提出,客戶在建設智算中心的同時,還要遵循綠色低碳的諸多要求。如何平衡巨量能源消耗與綠色發展的矛盾,同樣也是一大難題。
如何才能破解這兩大矛盾?作為算力基礎設施供應商的浪潮信息,適時推出了42kW智算風冷算力倉解決方案,并成功在西南某智算中心投入運營,從而提供了解決兩大矛盾的鑰匙。下面,老冀就給大家具體分析一下浪潮信息的這套解決方案。
省錢省地背后的秘密
如何解決算力需求高速增長與投資硬約束的矛盾?42kW智算風冷算力倉給出的答案,就是“高密度部署”。
在很多人的印象中,風冷數據中心的單機柜功率只有3~7kW,不可能滿足客戶對超大規模算力的需求。難不成,漫山遍野全都建成智算中心?
實際上,業界已經在嘗試高密度部署的風冷智算中心,一般能做到單機柜功率20kW左右。而如今,浪潮信息創新發布的42kW智算風冷算力倉,功率密度在現有高密方案的基礎上直接翻倍,單機柜可部署AI服務器的數量是傳統風冷機柜的8-10倍以上,這也意味著同樣的占地面積,可以部署的算力規模是原來的8-10倍以上。
由此,42kW智算風冷算力倉在輸出超高密度算力、挑戰風冷極限的同時,相比傳統數據中心,大幅減少了機柜數量和空調數量,減少了40%的模塊部署量和60%的建設用地,從而大大節約了智算中心的建設成本。
下面,咱們具體可以通過計算實例,把采用42kW智算風冷算力倉的智算中心,與現階段高密度風冷數據中心的投資成本做個對比:
以某小型智算中心為例。為了滿足AI算力的需求,需要部署32臺AI服務器,目前單臺AI風冷服務器的功耗約為10.5kW。如果采用與現階段高密度風冷數據中心一致的規格進行部署,單機柜一般能支持20kW左右,這樣就需要16臺機柜、4臺配電柜、8臺空調。而采用42kW智算風冷算力倉呢?僅需部署8臺機柜、8臺空調,節省了50%的柜位。
與此同時,機柜的減少,也減少了IB線纜之間的互聯距離,預計能夠節約50% IB線纜成本。
綜合算下來,如果采用42kW智算風冷算力倉建設智算中心,基礎設施初期投資可節省將近100萬元;智算中心投入運營之后,每年還能夠節約超過120萬元的電費,大幅降低了智算中心的總體投資成本。
此外,節約下來的還有時間成本。由于42kW智算風冷算力倉采用了模塊化設計與預制化安裝,例如出廠集成冷熱通道門,無需施工搭建傳統風冷通道件等,從而將智算中心的建設工期從14天縮減至5天,同時還采用了AIStation管理軟件節省調試時間,做到上電即上線,使智算中心盡快具備業務使用要求,實現快速部署上線。
當客戶對高密部署和快速投運有廣泛需求,而又受到場地、設備、成本等限制,并不具備液冷的部署條件時,42kW智算風冷算力倉就是最佳的、且經過大規模實踐驗證的高密風冷智算中心解決方案。
創新技術打造綠色低碳
緊接著,智算中心的高能耗與綠色低碳之間的矛盾,又如何解決?浪潮信息的42kW智算風冷算力倉同樣拿出了一整套創新的解決方案:
一、創新散熱及供電設計
為解決高密部署帶來的散熱難題,同時降低能耗,浪潮信息對智算中心散熱及供電進行創新設計。一方面,采用封閉冷熱通道,從而縮短了送風距離,避免傳統大空間彌漫式送風導致的風量處理不集中及冷量散失問題,實現冷量100%利用。與此同時,還采用了機柜內外縫隙全密封式設計,可避免冷、熱氣流短路及熱風倒灌問題,實現算力倉外“0”噪音。
另一方面,由于高密機柜與列間空調采用配比接近1:1的間隔布局,假如端部空調故障會導致風量分配不均,超高功率密度部署風冷散熱不均衡,極易出現局部熱點。為解決相關問題,算力倉專門針對空調的布局做了全新的設計和優化,以使氣流組織達到最佳狀態。在這里,浪潮信息設計了一套獨創的空調雙群控策略,它能夠根據冷熱通道布局的溫濕度傳感器數據變化,嵌套兩組輪巡調控算法,實時調節空調送風模式,可完全避免因單臺空調設備故障或輪巡休眠出現的局部熱點問題,在提升系統的可靠性的同時提升能效水平。
此外,42kW智算風冷算力倉的列間空調還采用了高溫進水模式,與冷熱通道全密封結合起來,相比傳統風冷數據中心,制冷系統能效比有效提升10%以上。
同時,為實現高效供電,浪潮信息還對智算中心的供配電系統進行了創新設計,采用了中壓配電+變壓器+濾波補償+高效UPS+末端智能母線的全供電鏈路一體設計,實現兆瓦級一體解決方案,供電效率大幅提升,降低電能損耗30%以上。
由于采用了這一系列的創新設計,42kW智算風冷算力倉可將智算中心風冷散熱的PUE降到1.25以下,遠低于傳統風冷數據中心。
而這正契合了當前綠色低碳的要求。2024年7月,國家發改委等四部委印發了《數據中心綠色低碳發展專項行動計劃》,對數據中心PUE進行了嚴格限制要求:2025年底,新建/改擴建大型及超大型數據中心PUE不超過1.25,國家樞紐節點PUE不超過1.2。
二、智能運營
對于智算中心來說,綠色低碳必然會體現在其生命周期的全過程,這也意味著除了項目的建設階段之外,建成之后的運營同樣也很重要。如果能夠實現更加智能的管理和運維,勢必將大大減少智算中心的人員和資源配置,同樣也是為綠色低碳做了貢獻。
對此,浪潮信息InManage管理平臺下足了功夫,它首先解決了傳統數據中心IT和動力環境割裂的問題,實現了一套系統同時采集智算中心的IT基礎設施和動力環境兩種數據,解決數據不互通問題,并對數據進行了5大功能創新,包括高密單排微模塊2D/3D可視化、供配電系統鏈路展示、數據中心實時圖像監控及視頻回放、數據中心門禁安全管理、核心制冷部件遠程調控。
舉個例子。過去,為了保證核心制冷部件的安全可靠,運維人員只能進入機房,對其進行現場操作。如今有了核心制冷部件遠程調控這個創新的功能,運維人員只需要坐在控制室內,就能夠完成全套調整動作。
有了如此智能的管理平臺作為基礎,老冀有理由相信,未來客戶還能夠開發出更多實用、好用的運維功能和服務,并提供更加靈活的AI服務,例如在資源上納管裸金屬和容器、以卡時的形式出售GPU和算力資源、通過拖拽方式即可直接租用成熟大模型框架和應用等等。
因此,對于客戶來說,采用42kW智算風冷算力倉只是個開始,后續還有很多文章可以做。
正當其時
從以上分析大家應該不難看出,對于當前渴望擁有智算中心的大多數主流客戶來說,42kW智算風冷算力倉是一套“剛剛好”的解決方案,它能夠有效解決算力需求高速增長與投資硬約束、高能耗與綠色低碳這兩大矛盾,滿足這些客戶的現實需求。相對液冷,它的建設周期更快,能夠在傳統機房做高密化快速部署;相對傳統風冷,則有更高的部署密度和接近于液冷的 PUE,實現更好的節能降耗。
不過,客戶往往也有個不小的顧慮:隨著AI服務器功耗及單機柜功率密度持續攀升,未來高密風冷智算中心是否還能繼續滿足算力需求?老冀認為大可不必擔心,原因有兩點:
第一點,據老冀了解,浪潮信息還會對智算風冷算力倉技術進行持續升級,未來我們還會看到更高單機柜功率密度的智算風冷解決方案,足以滿足目前主流客戶對智算中心擴容和進一步拓展算力的需求。
同時,浪潮信息也在持續推動液冷技術創新與應用,未來還會推出單機柜功率超過100kW的液冷算力倉產品,以滿足客戶更高密度、更高能效、更低PUE的需求。
第二點,新技術的發展和普及,需要遵循行業基本規律,老冀舉個汽車行業的例子。
大家都知道,咱們國家新能源汽車發展很快,目前的滲透率已經超過了50%。但是,新能源汽車大發展,并不意味著汽車市場馬上就進入純電時代。相反,由于很多消費者都存在續航焦慮和對于補能便利性的擔心,在當前這個階段,他們往往會選擇購買兼容燃油的混合動力汽車。
中國汽車工業協會的數據顯示,今年前5個月,混合動力汽車的銷量仍然占到了中國新能源汽車銷量的38%,而且銷量占比還有進一步提升的趨勢,這也倒逼中國幾乎所有的汽車廠商,無論是老牌燃油車廠還是造車新勢力,都在加緊推出更多的混合動力新車。
回到算力市場。超大規模、超強算力、超低能耗是下一代智算中心的演進方向,智算中心由風冷走向液冷是大勢所趨,同時也有一個逐步發展的過程。而從以上兩點可以看出,正在加緊規劃建設智算中心的客戶,會根據自身的需求場景和成本約束,理性地做出選擇。在未來很長的時間里,風冷和液冷都會繼續發展,滿足客戶的多樣化需求,并帶給客戶更多的價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.