毫無疑問,2023年是AI大模型的創新元年,以生成式AI為代表的技術發展引領新一輪科技爆發,將深刻影響全球經濟社會發展變革。不難預計,2024年越來越多的人工智能應用也將快速走進我們的工作和生活。
各行各業、不同場景的AI應用、大模型訓練等新需求、新業務的產生,推動智能算力需求的指數級增長,同時帶動整體算力規模保持快速增長。根據中國信息通信研究院測算,2022年全球計算設備算力總規模達到906 EFlops,增速達到47%,預計未來五年全球算力規模將以超過50%的速度增長,到2025年全球計算設備算力總規模將超過3 ZFlops,至2030年將超過20 ZFlops。
數據中心逐步從云數據中心向云+智算中心演進,算力助推全球數字經濟發展的生產力作用更加凸顯。數據中心作為核心基礎設施,迎來巨大發展機遇的同時,也面臨著能耗高、建設周期長、運維難、安全性等挑戰。如何洞察數據中心的演進方向,供配電系統作為數據中心的供能心臟,如何保障讓數字世界堅定運行,尤為關鍵和重要。
2024年1月15日,華為舉辦2024數據中心能源十大趨勢發布會并發布《白皮書》,華為數據中心能源領域總裁堯權分享了華為對未來數據中心的洞見和思考,其中蘊含未來數據中心的三大特征:安全可靠、融合極簡、低碳綠色。
安全可靠是數據中心的最核心需求
過去一年,我們看到了多個國內外數據中心宕機引發的服務中斷事件,這帶來的后果影響和經濟損失是巨大的。根據全球數據中心標準組織Uptime的數據顯示,從2019年到2022年,數據中心業務中斷損失超過10萬美元的比例,已經從39%上升至71%,且會隨著算力需求翻番成倍增長。
所以,作為數字經濟的核心底座,安全可靠是數據中心的最核心需求,是保障業務連續性的命脈,應始終作為最高優先級關注。
彌補數據中心在安全性、可靠性上的薄弱環節,《2024數據中心能源十大趨勢白皮書》指出,高可靠產品+專業化服務是保障數據中心安全可靠運行的關鍵,分布式制冷架構將成為溫控安全的更優選擇,預測性維護將成為數據中心基礎設施的標配,全生命周期的網絡安全防護體系將成為數據中心基礎設施的保護盾。
首先,要保障產品自身的高可靠,華為認為,在產品設計、生產環節就要貫穿“全鏈安全”的理念,全生命周期筑牢產品設備高可靠性。同時,通過提供專業化部署和運維服務,完善端到端的保障機制,降低安全風險。
其次,在架構安全方面,隨著大型數據中心的單體規模越來越大,對制冷系統的可靠性需求越來越高,當前大型數據中心多采用集中式制冷架構的方案,如傳統冷凍水系統,系統包含冷水機組、冷卻塔、蓄冷罐等多個子系統,設備多,結構復雜,且各個設備關聯性強,故障易擴散,影響面廣。白皮書指出,相較于集中式制冷架構,分布式制冷架構靈活,各個子系統完全獨立,單臺設備故障不會影響其他設備運行,故障域更小,可靠性更高,將成為溫控安全的更優選擇。
再者,從整個IT數字化的演進方向來看,運維化被動為主動,從“救火”到“防火”的轉變至關重要,數據中心能源亦是如此,預測性維護將成為標配。華為認為,得益于AI技術的快速發展,預測性維護的范圍將持續擴大,從電容、風扇等易損件的壽命預測、設備的熱失控預警到制冷系統的漏液預警,提前主動預測,提前處理避免事故的發生,改變事后“救火”的手忙腳亂。
第四,網絡安全始終是伴隨數字化發展的巨大風險,對于數據中心能源設備來說,亦要強化硬件安全加軟件安全的全方位安全防御。軟件安全要從供應安全、縱深防御和運維/運營安全三個維度,構筑全生命周期網絡安全防護體系。
融合極簡釋放數字化效益最大化潛能
從數據中心的建設到運維,建設周期長、運維運營難是影響IT投資回報的重要挑戰。以傳統的數據中心建設模式舉例來說,建設速度慢,工程復雜是普遍現狀,市場競爭形勢瞬息萬變,這對于企業的運行效率產生重要影響,融合極簡是未來數據中心的另一重要特征和關鍵詞。
如何打造融合極簡的數據中心?《2024數據中心能源十大趨勢白皮書》指出,預制化、模塊化將成為高質量快速交付的最佳選擇,專業化管理平臺讓數據中心運維更安全、更高效,風液融合將成為業務需求不確定場景下的優選架構。
在數據中心的建設上,通過“工程產品化”和“產品模塊化”,在工廠一體化集成,完成預制和預調試,保證現場交付的是高質量產品,能夠有效縮短交付周期,同時滿足客戶業務快速上線需求,所以建設周期更短、質量更高的預制化、模塊化方案成為首選。以華為的智能微模塊方案舉例,通過將溫控、機柜、通道、布線、監控等系統集成在一個模塊內,全模塊化架構實現極簡安裝、大幅縮短建設周期、降低運營成本。在墨西哥,費利佩·安赫萊斯國際機場(AIFA機場)采用華為智能微模塊FusionModule2000,3個月便完成項目交付,交付時間縮短30%,OPEX降低30%,PUE 降低25%,電池系統節省占地60%。
在數據中心的運維上,隨著數據中心呈現規模化、集約化發展趨勢,相應的整體運維復雜度也大幅提升,特別是多“啞”設備的存在,導致人工巡檢難度大。這時,構建專業化的管理平臺可以顯著提升數據中心運維效率和準確性,通過原廠的專業化管理平臺, 構建設備深度管理能力,實現運維極簡化,做到快速判斷問題,及時排除故障,讓數據中心運維更安全、更高效。
在制冷設備的架構上,面臨當下通用算力和智能算力的過渡期,華為認為,風液融合將成為業務需求不確定場景下的優選架構,通過風冷+液冷的組合和比例可調,靈活適配未來的業務演進,保護用戶投資。
低碳綠色是數據中心發展的底色
面向未來,綠色和低碳是人類社會發展的底色。數據顯示,數據中心總耗電量在ICT行業占比超80%,所以,主要國際組織與經濟體均發布相關政策,推動數據中心行業綠色可持續發展,數據中心加速向低碳綠色方向轉變是必然趨勢。
面對低碳綠色的發展要求,《數據中心能源十大趨勢白皮書》指出,間接蒸發冷卻技術依然是現在和未來最優的制冷方案,數據中心能效PUE挖潛要從關注部件高效調整為系統工程最優解,AI調優將成為存量DC能效智能優化的最佳選擇。
為什么間接蒸發冷卻技術被視為制冷方案最優選?關鍵原因在于其能夠最大化利用自然冷源,從而達到節約能耗的目的。在冷源側,間接蒸發冷卻方案相較冷凍水系統,在架構、效率和運維方面存在明顯優勢,它也是分布式制冷架構的典型方案。以中國移動呼和浩特數據中心舉例,通過采用華為EHU間接蒸發冷卻等技術方案,實現制冷能耗降低10%,節省配電面積40%,PUE低至1.15。華為認為,針對智能算力需求,間接蒸發冷卻支持未來演進的架構,將進一步適配液冷的計算場景。
PUE是降低數據中心能耗的關鍵指標,如何找到未來降低極致PUE的方向?在華為看來,傳統數據中心關注提升UPS、空調等部件效率,但受限于元器件物理限制,部件的效率提升已接近瓶頸。轉換思路,從關注部件效率轉為系統工程優化是重要的趨勢方向,白皮書舉例指出了UPS雙變換模式轉向S-ECO、數據中心PUE轉向PFPUE(算力PUE)等方案思路,例如S-ECO支持全模式0ms切換和全負載范圍高效,解決諧波大、輸入浪涌電壓干擾的問題,為能效優化提供創新方案。
此外,大量存量數據中心在低碳降耗的要求下又該如何進行節能改造?傳統的節能改造需要停線停業務,存在業務中斷的風險,而采用人工調整優化的方式,難度大,效果差,頻率低。白皮書指出,AI能效調優解決方案通過預置AI算法和大數據模型,是存量DC能效智能優化的最佳選擇。舉例來說,華為廊坊云數據中心采用iCooling能效優化技術,尋找出制約PUE的關鍵因素,推理出最佳參數組合并應用,達到數據中心能效最優,年均PUE由1.42降低至1.26,且在持續智能優化,實現從制冷到“智冷”的轉變。
整體看來,無論是安全可靠、融合極簡,還是低碳綠色,十大趨勢體現了華為對未來數據中心發展的洞察和思考,它們為企業帶來的是經濟效益和社會效益的雙贏。
算力是數字經濟時代新的生產力,發布會上,堯權正式提出了華為數據中心能源的全新slogan“讓數字世界堅定運行”,以安全可靠、融合極簡、低碳綠色的數據中心能源解決方案,構筑智算時代新基石,讓每一瓦特承載更多算力,華為數據中心能源融合數字技術和電力電子技術,正努力構建讓數字世界堅定運行的基座。很明顯,數智化的未來離不開這一關鍵基座。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.