引言人工智能工作負載需要基礎設施來應對動態、不可預測的需求
人工智能 (AI) 正以驚人的速度在各行各業落地。從金融到醫療保健,AI 正在驅動新服務并開啟新的商業模式,從根本上改變我們所有人的生活、學習和工作方式。然而,發展與挑戰并存,就 AI 而言,快速普及意味著支撐 AI 的基礎設施正面臨越來越大的壓力。
數據中心曾經針對傳統企業工作負載進行優化,如今正被迫適應全新的運營模式。高性能計算的興起意味著更高的功耗、更高的發熱量和更大的波動性。現有的系統難以跟上這種變化。
AI 工作負載不僅僅需要規模,還需要能夠應對動態且不可預測的需求的IT 基礎設施。隨著企業擴大 AI 的應用,支持環境也必須不斷發展。
01
機架密度正在快速攀升
數據中心運營商正在經歷的最明顯的變化之一是機架密度的提升。標準部署通常每機架功耗約為 10 千瓦至 15 千瓦。但 AI 硬件——尤其是圖形處理單元 (GPU)集群——功耗更高,產生的熱量也更多。
在許多人工智能部署中,機架功耗如今高達 40 千瓦甚至更高。一些實驗訓練環境的功耗甚至超過 100 千瓦。這不僅僅是能源消耗的問題。這對電力鏈的每個環節都構成了挑戰,從不間斷電源 (UPS) 系統到配電單元 (PDU),再到設施自身的開關設備。
較舊的數據中心如果不進行重大升級,可能無法支持這些負載。對于那些向人工智能領域擴張的企業來說,機架空間的布局、冗余和分區需要仔細規劃,以避免造成熱或電氣瓶頸。
02
冷卻已達到極限
傳統的空氣冷卻系統并非專為當今的熱負荷而設計。即使配備了熱通道封閉系統并優化了氣流,設施仍然難以在高密度區域快速散熱。
這就是液體冷卻日益普及的原因。直接芯片冷卻系統在高性能云計算環境中已經很常見,現在正被應用于支持人工智能且密度超過 50kW/機架的數據中心。在空間緊張或以能效為優先考慮、密度超過 150kW/機架的場合,浸入式冷卻也正在被探索。
安裝液體冷卻系統涉及重大變更——從管道和泵送系統到維護規程和泄漏預防。這是一個重大轉變,但隨著傳統冷卻方法逐漸失去發展空間,這一轉變正變得勢在必行。
03
負載波動迫使人們重新思考
AI 工作負載的行為方式與傳統計算不同。訓練周期可以在幾秒鐘內從空閑狀態切換到峰值狀態,然后再切換回來。推理作業通常持續運行,給電氣和冷卻基礎設施帶來持續的壓力。
這種變化給系統帶來壓力;電力系統需要快速響應,冷卻系統必須避免超調或滯后,傳感器和控制需要實時響應,而不是基于平均負載假設。
這正在推動對更智能基礎設施的投資。基于軟件的電源管理、預測分析和環境遙測不再是附加功能,它們正成為實現彈性和效率的關鍵。
04
調試變得更加復雜
為人工智能設計基礎設施是一回事,證明其在壓力下有效又是另一回事。
調試團隊必須模擬幾年前還不存在的情況,包括計算負載的突然飆升、高熱壓下的故障場景,以及空氣和液體冷卻并存的混合環境。
這意味著仿真工具在設計過程的早期階段就能得到應用,數字孿生技術有助于在設備安裝前測試氣流和熱模型。現場調試現在包含更多功能測試,以及電氣、機械和IT團隊之間更多的協作。
05
電力限制正在減緩進展
在英國和歐洲的部分地區,接入電網已成為一項重大障礙。較長的連接時間和有限的容量正在拖延新建和擴建項目的進度。
這一現實且日益嚴峻的挑戰正促使一些運營商轉向現場發電、儲能系統以及可分階段擴建的模塊化設施。其他運營商則優先考慮電力供應更便利的地區——即使這些地區并非最初的目標地點。
冷卻策略也會受到直接影響。液體冷卻系統需要持續的能源供應才能維持穩定運行。任何電源中斷都可能迅速引發冷卻問題,尤其是在工作負載無法暫停的情況下。此外,在高密度環境中,即使是短暫的電源中斷也可能在幾秒鐘內造成熱影響,使基礎設施沒有時間進行后續處理。
06
熱能再利用正在受到重視
人工智能工作負載會產生大量熱量,運營商正在探索有效利用廢熱的方法。
過去,熱回收通常被認為過于復雜或不具成本效益。但隨著液冷系統溫度更高、熱輸出更集中,情況正在發生變化。
一些新設施正在設計具備熱能輸出功能。其他一些設施正在考慮接入當地區域供熱系統。在規劃部門的參與下,人們對環境績效的期望正在不斷提高,而熱能再利用可以成為項目的一個優勢。
07
基礎設施正在變得更加適應
人工智能正在為數據中心基礎設施帶來新的期望。它需要快速、可擴展且適應性強。標準化固然重要,但靈活性也變得越來越重要——尤其是在人工智能工作負載不斷發展并從中心樞紐擴展到邊緣的情況下。
下一代數據中心需要以最少的浪費來管理高負載。它們需要盡可能地回收能源,在壓力下保持高效,并實時響應不斷變化的需求。
這不僅僅關乎容量,還關乎設計靈活的系統,使其能夠隨著條件的變化而保持高效。
免責聲明:
本文所發布的內容和圖片旨在傳播行業信息,版權歸原作者所有,非商業用途。如有侵權,請與我們聯系刪除。所有信息不構成任何投資建議,加密市場具有高度風險,投資者應基于自身判斷和謹慎評估做出決策。投資有風險,入市需謹慎。
設為星標 避免錯過
虛擬世界沒有旁觀者,每個點贊都是創造歷史的像素
關注我,一起探索AWM?
2025-07-04
2025-07-03
2025-07-02
商業贊助
點擊下方 “目錄” 閱讀更多
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.