元腦InManage智能管理系統(tǒng)近期實(shí)現(xiàn)系統(tǒng)性突破,通過深度融合IT設(shè)備管理與動(dòng)力環(huán)境監(jiān)控兩大體系,構(gòu)建覆蓋數(shù)據(jù)中心環(huán)境參數(shù)與服務(wù)器核心運(yùn)行指標(biāo)的全域數(shù)據(jù)整合網(wǎng)絡(luò)。該系統(tǒng)可基于服務(wù)器芯片級(jí)溫度感知數(shù)據(jù),實(shí)現(xiàn)從部件散熱、整機(jī)負(fù)載到制冷系統(tǒng)流量分配的動(dòng)態(tài)閉環(huán)控制,確保服務(wù)器在25-30℃黃金溫度區(qū)間穩(wěn)定運(yùn)行,成功實(shí)現(xiàn)風(fēng)冷系統(tǒng)能耗降低15-20%,液冷系統(tǒng)二次節(jié)能10%,全面推動(dòng)數(shù)據(jù)中心綠色轉(zhuǎn)型。
數(shù)據(jù)中心運(yùn)維管理核心難題 兩套系統(tǒng)不互通,運(yùn)維粗放能耗高
據(jù)國際能源署(IEA)報(bào)告數(shù)據(jù)顯示,2024年,數(shù)據(jù)中心約占全球電力需求的1.5%,即415太瓦時(shí);到2030年,數(shù)據(jù)中心的用電量將增長一倍以上,達(dá)到約945太瓦時(shí)。作為能耗大戶,數(shù)據(jù)中心的能耗主要來源于IT設(shè)備和制冷系統(tǒng)。其中,IT設(shè)備作為數(shù)據(jù)中心的核心,能耗占比最高達(dá)40%-50%;其次是制冷系統(tǒng),能耗占比約30%-40%。
在傳統(tǒng)運(yùn)維管理模式下,數(shù)據(jù)中心節(jié)能降耗主要依賴于兩套管理系統(tǒng):
■ 一是IT 基礎(chǔ)設(shè)施管理系統(tǒng),主要負(fù)責(zé)服務(wù)器等IT設(shè)備的節(jié)能。該系統(tǒng)依托帶外管理技術(shù),通過BMC實(shí)時(shí)采集服務(wù)器功耗、出/入風(fēng)口溫度、氣流等能耗信息,分析服務(wù)器運(yùn)行狀態(tài)與能源使用情況,對(duì)風(fēng)扇轉(zhuǎn)速、CPU 頻率等進(jìn)行調(diào)控,實(shí)現(xiàn)服務(wù)器能耗最優(yōu);
■ 二是動(dòng)力環(huán)境監(jiān)控系統(tǒng),主要負(fù)責(zé)制冷系統(tǒng)、供配電系統(tǒng)的能耗優(yōu)化。動(dòng)環(huán)監(jiān)控系統(tǒng)利用遍布數(shù)據(jù)中心的溫濕度傳感器、電流電壓傳感器等監(jiān)測(cè)設(shè)備,實(shí)時(shí)采集環(huán)境、動(dòng)力設(shè)備、制冷設(shè)備等運(yùn)行數(shù)據(jù),基于數(shù)據(jù)分析結(jié)果預(yù)測(cè)設(shè)備故障和環(huán)境變化趨勢(shì),聯(lián)動(dòng)調(diào)控空調(diào)、電源、冷卻塔等非IT設(shè)備,提高其能源使用效率。
但由于IT和動(dòng)環(huán)兩套系統(tǒng)獨(dú)立運(yùn)行,數(shù)據(jù)不互通,動(dòng)環(huán)系統(tǒng)只能收集到機(jī)柜級(jí)的數(shù)據(jù),而無法獲取更精細(xì)的服務(wù)器節(jié)點(diǎn)級(jí)、芯片級(jí)數(shù)據(jù),導(dǎo)致冷量和服務(wù)器功耗的貼合度低,對(duì)制冷系統(tǒng)和供電系統(tǒng)的運(yùn)維管理粗放,無法依據(jù)服務(wù)器功耗進(jìn)行精準(zhǔn)調(diào)控,從而影響數(shù)據(jù)中心整體的能耗優(yōu)化。
更重要的是,傳統(tǒng)粗放式運(yùn)維調(diào)控手段難以實(shí)現(xiàn)溫度的精準(zhǔn)把控,不穩(wěn)定的服務(wù)器溫度將顯著影響設(shè)備性能與壽命。據(jù)了解,一般服務(wù)器機(jī)箱內(nèi)部溫度維持在 25-30℃區(qū)間是最適宜的狀態(tài)。當(dāng)服務(wù)器長期處于過熱狀態(tài),將會(huì)加速電路老化、芯片和風(fēng)扇損壞,提升硬件故障率,最終大幅縮減服務(wù)器整體使用壽命,且會(huì)導(dǎo)致內(nèi)存與存儲(chǔ)設(shè)備性能下降,數(shù)據(jù)讀寫錯(cuò)誤率上升,影響系統(tǒng)的高效穩(wěn)定運(yùn)行。
元腦InManage全新升級(jí) 雙平臺(tái)統(tǒng)一納管,能效與穩(wěn)定性雙提升
針對(duì)數(shù)據(jù)中心整體節(jié)能降耗和系統(tǒng)高效穩(wěn)定運(yùn)行的挑戰(zhàn),元腦InManage數(shù)據(jù)中心智能管理平臺(tái)進(jìn)行了全新升級(jí),以“AI+一體化”為核心理念,深度融合IT基礎(chǔ)設(shè)施管理平臺(tái)與動(dòng)力環(huán)境監(jiān)控平臺(tái),通過全域統(tǒng)一納管、AI精準(zhǔn)調(diào)控兩大創(chuàng)新突破,保障數(shù)據(jù)中心綠色節(jié)能、高效穩(wěn)定運(yùn)行,讓服務(wù)器始終穩(wěn)定運(yùn)行在最適宜的溫度下。
// 全域統(tǒng)一納管,讓服務(wù)器始終穩(wěn)定運(yùn)行在最適宜的溫度下
全新升級(jí)的元腦InManage數(shù)據(jù)中心智能管理平臺(tái)實(shí)現(xiàn)跨系統(tǒng)深度集成,融合IT基礎(chǔ)設(shè)施管理與動(dòng)力環(huán)境監(jiān)控兩套系統(tǒng),構(gòu)建涵蓋溫度、濕度、風(fēng)速、流速等環(huán)境參數(shù),以及服務(wù)器功耗、運(yùn)行狀態(tài)等關(guān)鍵數(shù)據(jù)的全域數(shù)據(jù)池;并通過多維度數(shù)據(jù)采集模塊實(shí)時(shí)收集、清洗和融合,確保了數(shù)據(jù)的準(zhǔn)確性和及時(shí)性,實(shí)現(xiàn)核心參數(shù)的毫秒級(jí)采集與關(guān)聯(lián)分析,助力實(shí)現(xiàn)從服務(wù)器風(fēng)扇、整機(jī)功耗調(diào)優(yōu),到數(shù)據(jù)中心空調(diào)、冷量、流量等的全方位精準(zhǔn)調(diào)控,避免了傳統(tǒng)運(yùn)維管理模式中由于數(shù)據(jù)單一和滯后導(dǎo)致的控制誤差和延遲,大幅提升系統(tǒng)穩(wěn)定性,運(yùn)維效率翻倍。
在IT和動(dòng)環(huán)系統(tǒng)打通后,通過跨系統(tǒng)智能聯(lián)動(dòng),可直接監(jiān)測(cè)服務(wù)器 BMC數(shù)據(jù),整合部件級(jí)數(shù)據(jù)和環(huán)境信息,形成“部件溫度-整機(jī)負(fù)載-綜合環(huán)測(cè)-自動(dòng)指令-冷量供給”的閉環(huán)控制鏈路,一旦捕捉到溫度異常,立即結(jié)合服務(wù)器負(fù)載狀態(tài)及環(huán)境溫度,調(diào)節(jié)風(fēng)量和冷卻液流量,實(shí)現(xiàn)毫秒級(jí)響應(yīng),提升控制精度和實(shí)時(shí)性,讓服務(wù)器始終穩(wěn)定運(yùn)行在最適宜的溫度下。
// AI精準(zhǔn)調(diào)控,數(shù)據(jù)中心更節(jié)能
在實(shí)現(xiàn)IT和動(dòng)環(huán)雙平臺(tái)統(tǒng)一納管的基礎(chǔ)上,升級(jí)后的元腦InManage數(shù)據(jù)中心智能管理平臺(tái)可通過對(duì)制冷系統(tǒng)、供電系統(tǒng)等同步進(jìn)行AI精準(zhǔn)調(diào)控,實(shí)現(xiàn)非IT設(shè)備的能耗優(yōu)化,從而推動(dòng)數(shù)據(jù)中心整體節(jié)能降耗。例如,在風(fēng)冷數(shù)據(jù)中心里,該平臺(tái)作為智能中樞,實(shí)時(shí)匯聚服務(wù)器、空調(diào)、配電柜等設(shè)備的運(yùn)行數(shù)據(jù),以及溫濕度、氣流壓力等環(huán)境參數(shù),借助AI算法對(duì)海量數(shù)據(jù)深度分析,精準(zhǔn)預(yù)測(cè)設(shè)備負(fù)載變化與溫度趨勢(shì),一旦發(fā)現(xiàn)潛在熱點(diǎn)風(fēng)險(xiǎn),平臺(tái)立即聯(lián)動(dòng)調(diào)節(jié)空調(diào)風(fēng)速、風(fēng)向與制冷量,實(shí)現(xiàn)“以需供冷”的動(dòng)態(tài)平衡,保障系統(tǒng)穩(wěn)定運(yùn)行的同時(shí),可降低能耗15-20%以上。
針對(duì)液冷數(shù)據(jù)中心,該平臺(tái)實(shí)現(xiàn)了動(dòng)態(tài)流量優(yōu)化,相比于傳統(tǒng)運(yùn)維的分散式數(shù)據(jù)分析模式,該平臺(tái)可基于服務(wù)器芯片功耗與液冷回路壓力數(shù)據(jù),通過采用多目標(biāo)優(yōu)化算法,精確控制系統(tǒng)冷卻液流量,計(jì)算出系統(tǒng)在不同運(yùn)行環(huán)境下的最優(yōu)流量分配方案,通過AI精準(zhǔn)調(diào)控,流量利用率提升50%,液冷系統(tǒng)再節(jié)能10%。
流量動(dòng)態(tài)調(diào)控界面
在智能化運(yùn)維新趨勢(shì)下,元腦服務(wù)器管理平臺(tái)通過構(gòu)建全鏈路閉環(huán)控制體系,成功實(shí)現(xiàn)從芯片級(jí)散熱到機(jī)房級(jí)環(huán)控的精準(zhǔn)調(diào)節(jié)。該方案突破傳統(tǒng)運(yùn)維數(shù)據(jù)孤島,通過AI驅(qū)動(dòng)的動(dòng)態(tài)流量分配算法,使液冷系統(tǒng)流量利用率提升50%。隨著AIOps能力的持續(xù)演進(jìn),該平臺(tái)將持續(xù)賦能數(shù)據(jù)中心智能化改造,為算力基礎(chǔ)設(shè)施的可持續(xù)發(fā)展注入新動(dòng)能。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.