(本文編譯自electronicdesign)
數(shù)據(jù)中心,尤其是那些驅(qū)動(dòng)最新AI創(chuàng)新的設(shè)施,正在消耗越來(lái)越多的電力。據(jù)高盛最新研究顯示,當(dāng)前數(shù)據(jù)中心耗電量占全球總用電量的2%,而這一數(shù)字預(yù)計(jì)到2030年將攀升至10%。
這暴露出了傳統(tǒng)數(shù)據(jù)中心電力電子系統(tǒng)的短板,從向服務(wù)器集群供應(yīng)交流電的配電系統(tǒng),到提供直流電的穩(wěn)壓器,再到核心的高性能AI芯片,整個(gè)供電鏈條都面臨挑戰(zhàn)。數(shù)據(jù)中心的電力架構(gòu)必須進(jìn)行重大變革以應(yīng)對(duì)AI不斷增長(zhǎng)的功率需求,而電子設(shè)計(jì)師們也將不得不解決一系列挑戰(zhàn)。
代際差異:數(shù)據(jù)中心供電系統(tǒng)的演變
要了解數(shù)據(jù)中心電力供應(yīng)的發(fā)展方向,了解當(dāng)前電力架構(gòu)的構(gòu)成至關(guān)重要。圖1展示了“第一代”電力架構(gòu)的主要組成部分。在這種架構(gòu)下,三相交流電(通常線電壓為480伏)進(jìn)入數(shù)據(jù)中心,并為不間斷電源(UPS)供電。不間斷電源為備用電池供電,并為服務(wù)器機(jī)架提供穩(wěn)定的交流電壓。在服務(wù)器機(jī)架內(nèi)部,通過每個(gè)刀片服務(wù)器中的通用冗余電源將交流電壓整流并降壓至12伏。
幾十年來(lái),這種架構(gòu)一直是數(shù)據(jù)中心供電的行業(yè)標(biāo)準(zhǔn),如今很大一部分系統(tǒng)仍采用這種配置。在這種架構(gòu)中,一個(gè)典型的服務(wù)器機(jī)架支持的功率范圍為10千瓦至15千瓦。
大約十年前,整個(gè)科技行業(yè)開始推動(dòng)提高數(shù)據(jù)中心效率。巨型云數(shù)據(jù)中心的興起促使功率水平不斷提高,從而催生了“第二代”架構(gòu)(如圖2所示)。
這個(gè)新系統(tǒng)與第一代有幾個(gè)不同之處。首先,服務(wù)器電源的輸出電壓提高到了48伏,同時(shí)將電源整合到電源架中,這種電源架也被稱為“開放式機(jī)架”電源。機(jī)架中還集成了本地備用電池單元。
所有這些改進(jìn)使功率轉(zhuǎn)換階段的效率提高了5%,同時(shí)增加了可輸送的功率量。在云計(jì)算數(shù)據(jù)中心,一個(gè)典型的機(jī)架功率為40千瓦至100多千瓦。
但是,隨著耗電量巨大的人工智能芯片開始主導(dǎo)數(shù)據(jù)中心,第二代架構(gòu)正達(dá)到其物理極限。人工智能數(shù)據(jù)中心的功率需求攀升至單個(gè)機(jī)架600千瓦至1兆瓦。如今,人工智能工作負(fù)載需要大量的計(jì)算,這就需要縮短圖GPU、CPU和網(wǎng)絡(luò)交換機(jī)之間的物理連接距離。這種配置意味著需要從信息技術(shù)機(jī)架中移出又大又笨重的電源。
這就是為什么第三代架構(gòu)引入了“副機(jī)架”的概念,它基本上是一個(gè)獨(dú)立的機(jī)架,通過母線連接到服務(wù)器機(jī)架(如圖3所示)。
數(shù)據(jù)中心高壓直流電源設(shè)計(jì)面臨的挑戰(zhàn)
既然未來(lái)數(shù)據(jù)中心的發(fā)展方向已明確,現(xiàn)在就可以探討高壓直流配電所面臨的挑戰(zhàn)以及一些潛在的解決方案。電源設(shè)計(jì)師和系統(tǒng)工程師有一長(zhǎng)串需要自問的問題,其中有些問題業(yè)界甚至可能還未考慮到。但以下是一些需要重點(diǎn)關(guān)注的問題:
最佳輸出電壓水平是多少?+400伏、+800伏,還是±400伏?
隔離在系統(tǒng)中扮演什么角色?在高壓輸出端,隔離是絕對(duì)必要的嗎?
對(duì)于副機(jī)架而言,合適的功率轉(zhuǎn)換拓?fù)浣Y(jié)構(gòu)是什么?服務(wù)器機(jī)架的合適功率轉(zhuǎn)換拓?fù)浣Y(jié)構(gòu)又是什么?
如果將電源從信息技術(shù)機(jī)架中移出的主要目的是提高計(jì)算密度,那為什么還必須改變電源的輸出電壓呢?簡(jiǎn)單來(lái)說(shuō),這與將電力從副機(jī)架傳輸?shù)叫畔⒓夹g(shù)機(jī)架的母線有關(guān)。如果服務(wù)器機(jī)架運(yùn)行人工智能訓(xùn)練和推理等計(jì)算量巨大的工作負(fù)載需要600千瓦的功率,在48伏的電壓下傳輸這些功率將需要12500安的電流(未考慮任何傳輸損耗)。
由于所需的電流密度,母線的實(shí)際尺寸會(huì)非常大,重量接近200磅。這些母線還需要采用液冷技術(shù),從而增加了成本和復(fù)雜性。相反,如果將配電電壓提高到800伏直流電,對(duì)于一個(gè)功率為600千瓦的機(jī)架,僅需750安的電流。這樣的電流水平可以采用風(fēng)冷方式,并且每條母線的重量可減輕85%。
配電電壓必須提高。但合適的電壓水平是多少呢?+400伏、+800伏或±400伏的電壓已經(jīng)應(yīng)用于當(dāng)今的電動(dòng)汽車(EV)及其相關(guān)充電基礎(chǔ)設(shè)施中。
+400伏的電壓最具意義,因?yàn)樗呀?jīng)廣泛應(yīng)用于目前的數(shù)據(jù)中心中:大多數(shù)單相交流-直流電源中的功率因數(shù)校正(PFC)在通過LLC階段將電壓降至48伏或12伏之前,輸出電壓為+400伏,并且電氣元件也易于獲取和使用。從安全角度來(lái)看,工程師對(duì)400伏電壓也有深入的了解,包括設(shè)計(jì)中的爬電距離和電氣間隙。但是,如果功率水平進(jìn)一步提高,母線可能會(huì)成為一個(gè)問題。
+800伏的電壓是母線電壓的另一個(gè)可行選擇,因?yàn)樗梢允鼓妇€尺寸更小,配電效率更高。不過,對(duì)于相關(guān)元件來(lái)說(shuō),這是一個(gè)相對(duì)較新的生態(tài)系統(tǒng)。工程師將不得不解決一系列關(guān)于安全性和間距的技術(shù)問題。第三個(gè)選擇是結(jié)合前兩個(gè)選項(xiàng),選擇±400伏。其主要缺點(diǎn)是這種電壓需要復(fù)雜的控制來(lái)確保負(fù)載平衡。
如何在高壓直流電源系統(tǒng)中處理隔離問題
權(quán)衡考慮這三種電壓選擇非常重要,但有一個(gè)問題也會(huì)影響最終選擇,即隔離。
隔離和絕緣可實(shí)現(xiàn)兩個(gè)目的:一是最終用戶的安全;二是使接地環(huán)路相互分離。這兩點(diǎn)對(duì)于數(shù)據(jù)中心架構(gòu)來(lái)說(shuō)都極為重要。鑒于所需的功率水平,將多個(gè)較小的電源并聯(lián)起來(lái)是合理的,并且要確保這些電源能夠?qū)崿F(xiàn)均流。
圖4展示了幾種輸出電壓和隔離方案的選擇。第一種方案是最為直接的,它將功率因數(shù)校正(PFC)變?yōu)橐粋€(gè)獨(dú)立的電源單元(PSU)。盡管它有自身的優(yōu)勢(shì),但企業(yè)是否會(huì)接受這種方案還存在不確定性。在將多個(gè)非隔離的交流-直流電源并聯(lián)時(shí),還存在均流和平衡方面的問題。與其他帶有額外隔離階段的方案相比,第一種方案具有最高的效率和最低的成本。
第二種、第三種和第四種方案在交流-直流階段之后引入了隔離措施,以解決電流平衡問題。第三種和第四種方案使用了分裂母線來(lái)產(chǎn)生±400伏電壓,它們的主要區(qū)別在于所需母線的數(shù)量(三條母線與兩條母線的區(qū)別)。第四種方案需要一些額外的控制措施來(lái)確保±400伏電壓下的負(fù)載平衡。
電源拓?fù)浣Y(jié)構(gòu):平衡成本、速度、效率與隔離
另一個(gè)需要做出的決策是交流-直流整流器應(yīng)采用何種拓?fù)浣Y(jié)構(gòu)。有許多因素會(huì)影響拓?fù)浣Y(jié)構(gòu)的選擇,包括成本、效率、負(fù)載上的瞬態(tài)情況以及隔離等。
一種兩級(jí)式的方法是設(shè)計(jì)電源系統(tǒng)最傳統(tǒng)且最常用的方式,其中一級(jí)負(fù)責(zé)整流,另一級(jí)獨(dú)立處理隔離問題。對(duì)于整流器而言,有許多知名的拓?fù)浣Y(jié)構(gòu),例如維也納整流器、T型逆變器或有源中性點(diǎn)箝位電路。
同樣,隔離式直流-直流轉(zhuǎn)換級(jí),如三相LLC(諧振電感電容)電路或全橋LLC電路,可用于實(shí)現(xiàn)電壓調(diào)節(jié)和隔離。這種方法的一大優(yōu)勢(shì)在于,通過在整流器和隔離式直流-直流轉(zhuǎn)換級(jí)之間增加額外的電容,能夠輕松應(yīng)對(duì)瞬態(tài)和線路掉電事件中的能量存儲(chǔ)問題。
另一種潛在的方法是使用單級(jí)來(lái)同時(shí)處理交流-直流整流和隔離,這也被稱為矩陣變換器。圖5展示了單級(jí)矩陣變換器的簡(jiǎn)化原理圖。
這種類型的變換器能夠通過減少傳導(dǎo)路徑中的開關(guān)數(shù)量,以及縮減開關(guān)和磁性元件的總數(shù)來(lái)提高效率,從而降低成本。不過,除了需要擔(dān)憂浪涌電壓外,能量存儲(chǔ)方面也存在一些潛在的缺點(diǎn)。
矩陣變換器也是雙向開關(guān)的完美應(yīng)用,有助于進(jìn)一步降低成本并提高效率。然而,要實(shí)現(xiàn)這種類型的設(shè)計(jì),仍有許多問題和技術(shù)細(xì)節(jié)有待解決。
向高壓直流配電的轉(zhuǎn)變必然會(huì)給數(shù)據(jù)中心的電源帶來(lái)許多變化。解決復(fù)雜問題并改進(jìn)電源設(shè)計(jì)的機(jī)遇就在眼前。為了滿足新型處理器的功率需求,未來(lái)的數(shù)據(jù)中心將依賴于當(dāng)下所做出的決策。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.