10月30日,中國大唐集團數據中心(烏蘭察布)項目開工,是全國首個100%采用綠電交易的能源央企數據中心;
10月24日,騰訊韶關湞江算力中心項目啟動變電站及電力外線工程監理供應商招募業務需求和規劃總負荷大約247.67MW,園區配套新建220kV/110kV變電站一座及電力外線;
10月18日,博浩海門算力中心項目簽約,將成為長三角最大的100%全綠電算力中心;
10月18日,九川科技靈武智慧算力科創谷項目開工建設,項目主要采用液冷、零碳操作系統等技術打造3000P算力綠色低碳數據中心;
10月17日,第十師北屯市500P智算中心項目簽約,該項目選址地風光電資源豐富,符合建設智算項目選址的各項條件;
10月17日,中國移動長三角(蕪湖)數據中心項目開工,是中國移動采用彈性功率設計理念、數字化交付、液冷等先進建造技術打造的中國第六代新型綠色算力中心;
趨勢與問題
據IDC圈不完全統計,截止2024年10月31日,我國智算中心項目已超過577個,且規劃投資額、規劃算力規模不斷增大。以10月下旬集中發布的動態來看,大多項目普遍將綠色低碳作為核心設計理念,其中:大唐和博浩等項目率先實現100%綠電使用,九川科技項目則采用零碳操作系統,中國移動推進新一代綠色算力中心建設,同時北屯市的項目選址也考慮了風光等可再生能源的就近接入。
這一趨勢其實是智算中心建設的必然選擇。從更長期視角來看,算力本質上是能源在數字空間的價值重構,而科技發展的核心趨勢就是不斷優化能源利用效率,在信息處理領域實現以更低能耗獲取更強大的數據傳輸、處理和存儲能力。這種效率提升既是技術進步的重要指標,也是實現數字經濟可持續發展的關鍵。
當我們從智算中心建設和運營視角延伸來看電力能源問題時,至少包括三方面問題:
第一、全國智算中心工作負載;第二、新能源在智算中心中的應用;第三、智算中心GPU芯片的能耗功率。
1全國智算中心工作負載
全國智算中心工作負載情況將在很大程度上影響數據中心用電的市場格局,一方面是全國智算中心工作負載是否達到了飽和,另一方面是全國電網系統穩定可控。
全國智算中心工作負載是否達到了飽和方面,中國目前還沒有遇到這個問題,但美國已經趨于飽和。美國數據中心2015年到2019年間數據中心工作負載持續增長了近2倍,但其電力需求卻基本沒有出現大的變化,但近幾年在AI驅動下電力需求爆發,導致電力供應突然嚴重不足,其背后的根本原因其實并非AI耗電直接導致了數據中心用電瓶頸,而是數據中心工作負載已經在過去幾年基本在云數據中心和超大規模數據中心中完成遷移,且能效提升也達到了瓶頸。換句話說,在當前的美國電網框架下,已經沒有更多的云數據中心和超大規模數據中心能夠承擔新的AI工作負載需求了。也因此,當地很多數據中心開始選擇自建電站甚至使用核電站來供應一個獨立的數據中心運營,比如AWS 甚至以6.5億美元的價格購買了一個1000MW的核電數據中心園區。
從電網穩定可控方面來看,國內當前大批智算中心仍處于加速建設階段,提前布局電力系統建設仍存在很大的余地。對于一個電力系統來說,穩定性非常重要的點,就是它的"裕度"(margin)必須大于1.1倍。"裕度"一旦小于1.1倍,就會出現一些系統性缺電的風險。當前我國在解釋"裕度"這個概念時,是可控裝機處以最高負荷的概念。我國的電力系統由于過去主要以化石能源為主,屬于可控能源,但是隨著整個電力系統的新能源比例不斷擴大,波動性和間歇不可控性比例正在不斷增加。
也因此,隨著我國電網新能源比例的不斷增大,新能源設備的電力輸出能力成了電力系統中一個非常重要的考量緯度。在國際上,這個系數被稱為“退額系數”(Derating Factor),而在我國新型電力系統建設中,則使用“置信出力”(反映了發電設備在特定時段內可以保證的最低出力水平)這一概念,特別是在最新的新型電力系統建設行動方案中被重點提及。
當前,我國新能源的發電量大約是傳統能源三分之一的水平。但從目前海外的招標數據看,大多數新能源電力設施在實際運行條件下可靠的輸出水平并不高,這是當前智算中心用電面臨的重要挑戰。這也是為什么在最近的"加快建設新型電力系統"的政策文件里,要求未來達到10%以上的“置信出力”。
2新能源在智算中心中的應用
關于新能源在智算中心中的應用,有一個非常重要的事實:智算中心通常24小時不間斷用電;數據中心可再生電力的主要來源于太陽能,無法持續24 小時;由于空間限制和開發規劃,可再生能源電廠幾乎很少可以直接為數據中心供電。風能和水電是常見的替代方案,但風能也不能持續24小時發電,雖然水電可以持續運行,但很難快速增加容量,甚至無法增加。
但當前隨著AI爆發,新能源在數據中心中使用已經是大勢所趨。以美國為例,據專業機構預測,到2026年,美國所有數據中心每年將產生1.55億噸二氧化碳排放,相當于370萬輛乘用車的年排放量。這對電力基礎設施和碳排放的影響已經非常巨大,使得所有超大規模企業都會主要關注的一個領域,它們幾乎無一例外地以實現凈零排放為目標,致力于讓數據中心使用100% 可再生能源供電。也正因為此,履行可持續發展承諾將是決定AI數據中心容量在何時何地以何種方式部署的關鍵因素。
在新能源發電傳輸中,會遇到一個比較嚴重的電能損失問題,據專業機構測算:每1000公里會損失3%,每3000公里會損失10%。3000公里以上損失暫時沒有可靠的實際測算數據。也正因為此,在現有技術條件下,新能源發電更多需要近場使用,哪怕擴地區使用都需要承擔非常高的成本,跨國成本更高,比如中國到德國,如果按地形鋪設特高壓,可能需要9000公里,電能損失超過50%,電價成本高過當地發電成本幾十倍。
不止如此,新能源應用到智算中心,未來可能面臨的另外一個問題就是電量供應問題,有業內專家舉過一個例子:如果用當前主流規格的太陽能板,在新疆或西北戈壁那種陽光充足的地區,再考慮到黑夜、陰天、故障維修等因素,每平米太陽能板全年大約可以發電240度。要滿足20年后的用電需求,總共需要大約2380億平方米的太陽能板;真正施工時還有變電設施、儲能電池,還要在太陽能板間留出足夠的間距來維修保養,所以再把這個面積乘以3,估算出來總共需要約7140億平方米的面積,相當于一個邊長840公里的正方形區域!
3智算中心GPU芯片的能耗功率
當前,以英偉達為代表的芯片廠商在芯片功率方面進行著持續的技術突破。最新的DGX B200更是實現了很大的飛躍。功耗達到14.3kW,比A100增加了約2.2倍,但計算性能卻提升到了驚人的72 petaFLOPS,是A100的14.4倍。能效比進一步優化到0.20 kW/pFLOPS,這一數字顯示NVIDIA在芯片架構和系統設計上的深度創新。
顯然,這種發展趨勢對AI產業有著深遠影響。首先,它表明在AI芯片領域,摩爾定律不僅在延續,而且呈現出更快的發展速度。其次,能效比的持續改善直接影響到數據中心的運營成本和環境影響。當我們討論大模型訓練時,更高的算力密度意味著可以用更少的服務器完成相同的訓練任務,這不僅降低了部署的復雜度,也減少了整體能源消耗。這從產業經濟的角度來看,也帶來了顯著的成本效益。
盡管如此,從當前AI對智算中心芯片能耗的需求來看,和以往互聯網階段有很大不同,因為AI中存在Scale Law(規模定律)和多模態這些和以往不同的特殊情況,也就是說每Scale Law一次或者每增加一個模態,對于Token以及參數來說,都是一個量級的增加。但芯片的能耗功率下降,還只是一個倍率的下降。兩者相結合之后,整體還是呈現一個加速上升的過程。
以英偉達(NVIDIA)的H100為例,單個芯片H100的能耗要比H100的能耗更高,雖然它的算力單位能耗是下降的。因此只要英偉達的出貨量在持續上升,就可以判斷整個電力總需求就會呈現一個上升趨勢。
總之,當前智算中心用電方面面臨著多方挑戰,據海外專業半導體機構 simianalysis 最新報告分析,智算中心行業需要以下條件:
1. 鑒于持續消耗的巨大電力,電力成本要低廉,特別是隨著時間推移,推理 (Inference) 需求只會不斷增加。
2. 能源供應鏈在地緣政治和天氣干擾下要有穩定性和穩健性,以降低能源價格波動的可能性,以及能夠快速提高燃料生產,從而迅速規劃大規模發電的能力。
3. 總體上要有碳強度低的電力結構,適合建立大量可以在合理經濟條件下生產的可再生能源。
此外,該報告還指出:中國是新建發電設施的佼佼者,如果條件允許,他們可能會在建設千兆瓦級數據中心方面處于領先地位。
即將于2024年12月19日到20日在北京·首鋼園(四高爐)舉辦的第十九屆中國IDC產業年度大典,將全面探討智算中心建設與能源應用問題,掃描下方二維碼報名參會:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.