1.21
知識分子
The Intellectual
導(dǎo) 讀
《科學(xué)四十人》系列座談(左起,楊富強、李勇、陳云霽、丁肇豪、張永平)
無論是否支持人工智能(AI)的發(fā)展,我們都難以忽視一個重要的問題,那就是AI的能耗。
關(guān)于AI的能耗,一篇廣為流傳的報道稱,ChatGPT 每日耗電量或超 50 萬千瓦時,相當于1.7萬個美國家庭的能耗。還有研究估算,在最糟糕的場景下,未來谷歌AI的能耗將與像愛爾蘭這樣的國家相當。然而另一方面,也有觀點認為媒體和大眾選擇性關(guān)注估算結(jié)論較為夸張的研究,并將對AI能耗的擔(dān)憂視為社會對新技術(shù)慣有的反應(yīng)。
人工智能日新月異、能源領(lǐng)域錯綜復(fù)雜,二者關(guān)系的都是人類未來。大模型的高速發(fā)展對電力系統(tǒng)的沖擊究竟有多大?大模型時代,如何提升AI系統(tǒng)的能效?AI基礎(chǔ)設(shè)施和電力基礎(chǔ)設(shè)施有哪些需要協(xié)調(diào)的地方?具體面臨哪些挑戰(zhàn)?
圍繞這些問題,《知識分子·科學(xué)四十人》系列座談邀請到清華大學(xué)電子工程系教授、城市科學(xué)與計算研究中心負責(zé)人李勇,中國科學(xué)院計算技術(shù)研究所副所長、處理器芯片全國重點實驗室主任陳云霽,華北電力大學(xué)電氣與電子工程學(xué)院教授丁肇豪,能源基金會清潔電力項目主任張永平參與討論,主持人為北京大學(xué)氣候變化與能源轉(zhuǎn)型項目高級顧問楊富強。威廉與佛洛拉·休利特基金會Edit Ruano致辭。
以下為論壇實錄。
楊富強:今天我們探討人工智能(AI)與能源之間的關(guān)系。AI這個概念對大家來說已經(jīng)耳熟能詳,我們幾乎每天都在討論。然而,要深入全面理解AI,可能許多人還難以做到。我們有幸邀請到了四位專家,他們將為我們闡釋AI與能源之間的聯(lián)系。我們相信,AI不僅會推動工業(yè)革命,還會對能源革命、經(jīng)濟發(fā)展、政治和文化等多個領(lǐng)域產(chǎn)生深遠的影響。這既是一個巨大的挑戰(zhàn),也是一個巨大的機遇。
今天我們將討論的焦點放在能源與AI的結(jié)合上,探討AI能為能源行業(yè)帶來什么,以及能源如何反過來促進AI的發(fā)展。先請各位嘉賓介紹一下各自研究應(yīng)用。
北京大學(xué)氣候變化與能源轉(zhuǎn)型項目高級顧問楊富強
李勇:我來自清華大學(xué)電子工程系,我們系在電子芯片算力等領(lǐng)域有著深厚的基礎(chǔ),研究工作涵蓋了從芯片架構(gòu)設(shè)計到電子光子基本原理,再到工藝流程等多個層面。在人工智能迅速發(fā)展的今天,這些研究方向顯得尤為重要。
雖然我在電子工程系工作,但我的研究并不涉及芯片硬件,而是聚焦于如何有效利用芯片算力。過去十多年的研究,我逐漸將研究重點放在了城市領(lǐng)域,因為城市是一個數(shù)據(jù)的寶庫,擁有大量的視頻和其他模態(tài)數(shù)據(jù)。王堅院士曾提出,城市可能是世界上最“吃”算力的地方。因此,我選擇城市科學(xué)與計算作為我的研究方向。為此,我們系成立了城市科學(xué)計算研究中心,專注于處理和分析城市數(shù)據(jù),以期實現(xiàn)城市智能化。
目前,城市發(fā)展正面臨兩個重要機遇:智能化和能源轉(zhuǎn)型。智能化是我所在的研究所的主要研究領(lǐng)域,而能源領(lǐng)域則對城市變革產(chǎn)生深遠影響。隨著清潔能源在能源結(jié)構(gòu)中所占比例的增加,它已成為全球?qū)崿F(xiàn)碳中和目標的關(guān)鍵路徑。
從信息的角度來看,物理世界的構(gòu)成包括時間、空間、物質(zhì)、能量和信息。能量與信息之間的轉(zhuǎn)換關(guān)系與我們今天討論的能源和智能緊密相關(guān)。因此,在進行產(chǎn)業(yè)轉(zhuǎn)換時,我們考慮的是如何利用智能技術(shù)幫助能源行業(yè)更有效地利用能源?;谶@一理念,我們也孵化了一家名為清鵬智能的產(chǎn)業(yè)公司,主要關(guān)注如何運用人工智能技術(shù),將清潔能源與現(xiàn)有的電能、水能等主流能源形式整合,形成一個統(tǒng)一的能源系統(tǒng)。
清華大學(xué)電子工程系教授、城市科學(xué)與計算研究中心負責(zé)人李勇
陳云霽:今天討論的兩個主題——電力能源和電子層面的芯片——實際上和我的前半生、后半生似乎有著緊密的聯(lián)系。我的父親曾在江西省電力局下屬的事業(yè)單位江西電力試驗研究所工作,現(xiàn)在這個單位叫江西省電科院。我從出生直到上大學(xué)之前,都生活在江西省電力局的院子里。
小時候,我爸常帶我去電廠,有時我們會在那里住上兩周。我一直認為電廠是人類歷史上最偉大的創(chuàng)造之一。作為能源的中心,電廠也可以被看成是世界的中心。就像心臟通過血管將能量送往人的全身,電廠通過鐵塔將能源輸送到世界各地四面八方。
雖然沒有機會從事電力行業(yè),但我從2002年開始涉足了一個與電力有一點點關(guān)聯(lián)的研究領(lǐng)域:如何減少芯片耗電量。包括后來我們開發(fā)了國際上首個專門用于深度學(xué)習(xí)的處理器芯片,初衷就是尋找更節(jié)能的方式來執(zhí)行深度學(xué)習(xí)任務(wù)。從那時起過去了二十多年,包括芯片設(shè)計、計算機科學(xué)、電子工程和算法研究等多個領(lǐng)域的專家共同努力,今天的芯片在處理神經(jīng)網(wǎng)絡(luò)操作時所需的能耗已經(jīng)降低了100倍甚至更多。然而,隨著大型模型的出現(xiàn),對算力的需求增長速度遠遠超過了我們降低能耗的速度。
中國科學(xué)院計算技術(shù)研究所副所長、處理器芯片全國重點實驗室主任陳云霽
丁肇豪:我所在的單位是華北電力大學(xué)新能源電力系統(tǒng)全國重點實驗室,主要研究的是新能源為主體的新型電力系統(tǒng)。我的工作主要是從電力系統(tǒng)的角度出發(fā),探討算力基礎(chǔ)設(shè)施與電力系統(tǒng)之間的關(guān)系,我們將其總結(jié)為“算電協(xié)同”。2017年我們就開始討論這個概念,那么具體是如何協(xié)同的呢?
我的工作分為兩個方面。從算力角度來看,我們研究如何讓算力基礎(chǔ)設(shè)施,也就是AI的基礎(chǔ),更多地利用新能源,尤其是那些波動性的可再生能源。簡單來說,我們探討的是如何讓一些可以中斷或者可以改變地理位置的算力任務(wù),根據(jù)新能源的時間和空間分布調(diào)整,從而更多地使用新能源。這相當于重新塑造算力負載的時空布局,使其能夠更好地利用新能源。
從電力系統(tǒng)的角度來看,隨著AI技術(shù)的發(fā)展,其電力負荷可能會占據(jù)全社會負荷中的很大比例。那么,電力系統(tǒng)需要靈活性和調(diào)節(jié)能力,讓這些AI基礎(chǔ)設(shè)施的電力負荷跟隨電力系統(tǒng)的需要而調(diào)整。比如一天之中,電力系統(tǒng)需要調(diào)峰、調(diào)頻。我們的工作是讓算力基礎(chǔ)設(shè)施通過調(diào)整計算任務(wù)來改變它們的電力負荷特性,將這些原本可能給電力系統(tǒng)平衡帶來挑戰(zhàn)的AI負荷,轉(zhuǎn)變?yōu)閷﹄娏ο到y(tǒng)平衡產(chǎn)生積極支撐作用的靈活負荷。
華北電力大學(xué)電氣與電子工程學(xué)院教授丁肇豪
張永平:我的專業(yè)背景是電力系統(tǒng),讀書時在電機系學(xué)習(xí)。與電子系、計算機系和自動化系這些所謂的弱電專業(yè)有所不同,我們專注于強電領(lǐng)域。當時計算機、電子這些專業(yè)是熱門專業(yè),我們常開玩笑說,你們再怎么發(fā)展,只要我們把電斷了,你們啥也干不了。畢業(yè)后,我一直在電力系統(tǒng)和電力市場領(lǐng)域工作。
我在能源基金會工作負責(zé)清潔電力項目。我們的使命是推動可再生能源的發(fā)展,以取代化石能源,以應(yīng)對氣候危機。這是一個復(fù)雜的挑戰(zhàn),不僅僅是建造風(fēng)電場和光伏電站,然后關(guān)閉煤電廠那么簡單。首先,我們需要關(guān)注中國電力系統(tǒng)需求的變化,尤其是電力負荷的增長,每年以5-10%的速度快速增長。數(shù)據(jù)中心目前已經(jīng)占到2-3%的用電量,而AI智算中心用電增長可能更快。
這不僅是用電量的問題,更重要的是用電的負荷特性。數(shù)據(jù)中心的用電曲線相對平穩(wěn),這對電力系統(tǒng)來說是理想的,而且傳統(tǒng)的火電等電源相對容易調(diào)節(jié),去滿足數(shù)據(jù)中心的用電需求。但我們希望使用波動性的可再生能源,如風(fēng)能和太陽能,來滿足未來數(shù)據(jù)中心的能源需求,這就帶來了挑戰(zhàn):如果用電需求不能調(diào)節(jié),而供給又是波動的,我們該怎么辦?我們正在研究如何利用波動性的可再生能源滿足不同類型的用電需求,特別是數(shù)據(jù)中心的需求;探討是否能夠讓數(shù)據(jù)中心的用電也變得可調(diào),這是個有趣的話題。
能源基金會清潔電力項目主任張永平
AI能耗是一種真實的“威脅”嗎?
楊富強:國際能源署(IEA)最近發(fā)布了2024版的全球電力報告,發(fā)現(xiàn)2022年的全球數(shù)據(jù)中心和人工智能大約消耗了全球總用電量的1.6%,而且增長迅速。各位老師怎么看,將來會如何?
陳云霽:我先分享一個的觀點,這個觀點是從科學(xué)院的于海斌院士那里聽來的。他提出了一個關(guān)于當前人工智能領(lǐng)域的不等式,就是從重要性來說,AI殺手級應(yīng)用大于大模型,大模型大于算力,算力又大于電力。這個不等式反映了人工智能的現(xiàn)狀。
盡管AI很熱,已經(jīng)能幫我們改個稿子,但在實體空間中,尤其是在工業(yè)、生產(chǎn)和生活服務(wù)等領(lǐng)域,我們對于真正殺手級的應(yīng)用還是非常非常迫切需要的。所以應(yīng)用的重要性最高,同時也是最缺乏的。接下來是大模型。然后是芯片。最后是電力。今天我們還沒有聽說過有哪個很好的大模型應(yīng)用因為電力不足而關(guān)門不干的。
再過十年,這種重要性可能會發(fā)生逆轉(zhuǎn)。我們可以預(yù)見,十年后,人工智能深入到實體經(jīng)濟和我們生活的各個角落,殺手級應(yīng)用非常普遍。隨著應(yīng)用數(shù)量的增長,對電力的需求將遠遠超過現(xiàn)在。人工智能應(yīng)用目前主要局限于數(shù)字空間,但如果它們進一步滲透到工廠、家庭、醫(yī)療和農(nóng)業(yè)等社會各個方面,電力消耗的占比可能不再是1.6%,而是16%甚至更多。到那時,重要性的順序可能會顛倒過來:電力將成為最關(guān)鍵的因素,其次是算力,然后是模型,最后才是應(yīng)用本身。
楊富強:我們經(jīng)常講說,AI的盡頭是能源。
陳云霽:當然今天AI最重要的還是做出殺手級的應(yīng)用,但在未來十年或二十年后,AI的盡頭一定是能源。到那個時候,我們可能需要一些調(diào)整,以數(shù)據(jù)中心為例,根據(jù)新能源供應(yīng)來調(diào)整我們的操作頻率。比如,我們現(xiàn)在使用大模型,提出一個問題,它咔咔咔給我們回一堆。那么,在新能源供應(yīng)充足時,我們可以讓它更快地響應(yīng);而在新能源供應(yīng)不足時,我們可以讓它稍微慢一些。
此外,大模型的使用實際上分為兩個階段:訓(xùn)練和推理。訓(xùn)練是將大量數(shù)據(jù)輸入模型,使其變得更加聰明;推理則是我們真正向大模型提問,得到答案。
楊富強:現(xiàn)在哪一個階段更耗電?
陳云霽:訓(xùn)練現(xiàn)在花的電很多,但是以后推理會更多。推理對響應(yīng)時間的要求是實時性的,我們向AI提一個問題,希望它能立即給出答案。相比之下,訓(xùn)練雖然同樣重要,但并不需要馬上完成。OpenAI訓(xùn)練一個模型可能要花好幾個月,我們可以在新能源供應(yīng)充足時多跑一跑。
楊富強:AI的能耗可以隨著可再生能源的供應(yīng)變化而調(diào)整,或者根據(jù)能源供應(yīng)情況來安排算法的運行順序,比如決定何時進行訓(xùn)練。
李勇:目前人工智能技術(shù)的能耗在整個社會能源消耗中占比并不大,數(shù)據(jù)中心只占全社會能源消耗的1-2%。人工智能替我們?nèi)祟惷刻熳龅氖?,也還不到1%。但隨著技術(shù)的進步,我們預(yù)計在未來十到二十年,這個比例可能會提高到40-50%。相應(yīng)地,能源消耗的比重也可能增加到社會總能源消耗的20-30%。隨著時間的推移,這個比例可能會繼續(xù)增長。因此,雖然能源問題目前尚未成為危機,但未來肯定會成為一個重大問題。我想補充一些證據(jù)來說明我們這個討論的重要性。
我們剛才提到了一個關(guān)鍵問題,即人工智能中的“能”與能源中的“能”之間的關(guān)系。這種關(guān)系涉及到我們?nèi)绾卧谛酒湍茉唇嵌葘崿F(xiàn)節(jié)能。能源角度的“能”是指能量,而人工智能的“智能”實際上是關(guān)于能力。這對應(yīng)于物質(zhì)世界構(gòu)成中的兩個重要概念:能量和信息。人工智能的能力本質(zhì)上是提供信息。為了更好地節(jié)能,我們需要將能量更好地服務(wù)于能力的產(chǎn)生,這就需要打通能量和信息之間的聯(lián)系。
從物理學(xué)的角度來看,物質(zhì)可以轉(zhuǎn)化為能量,再轉(zhuǎn)化為信息。我們已經(jīng)有一個完整的體系來描述時空、物質(zhì)和能量,但與信息,即與我們今天討論的人工智能能力之間,還存在很大的差距。我們今天討論的話題就是探索信息和能量之間是否可能產(chǎn)生更大的聯(lián)系,形成一個整體。從物理學(xué)的基本概念來看,能耗問題涉及的是瓦特(功率單位),而人工智能的涉及的是比特(信息單位)。為了實現(xiàn)節(jié)能,我們需要在這兩個方向上努力。
“追漲殺跌”?
在電網(wǎng)最脆弱的時候,萬卡集群不僅救不了它,
反而雪上加霜
丁肇豪:從電力行業(yè)的角度來看,人工智能和數(shù)據(jù)中心的能耗其實經(jīng)歷了許多變化。在2022年底ChatGPT出現(xiàn)之前,盡管數(shù)字經(jīng)濟和人工智能發(fā)展迅速,但在心底里,電力行業(yè)對數(shù)據(jù)中心帶來的電力負荷增長還是持有相對平穩(wěn)的觀點。突然,ChatGPT的出現(xiàn)讓人們意識到這可能是一次改變?nèi)祟惿鐣墓I(yè)革命。從我們電力人來看,未來可能會出現(xiàn)許多殺手級應(yīng)用,即使是尚未出現(xiàn),許多企業(yè)也已經(jīng)開始跑馬圈地,為這些潛在的應(yīng)用準備數(shù)據(jù)中心。
大量的數(shù)據(jù)中心,或者說智算中心,開始涌現(xiàn)。這對電力行業(yè)帶來了顯著的變化。從電力供應(yīng)總量的角度來看,電力行業(yè)需要調(diào)整電力電量平衡模型。今年夏天,在IEEE電力與能源協(xié)會年會(PES GM:IEEE Power & Energy Society General Meeting)上,PJM電力規(guī)劃負責(zé)人分享了他們的經(jīng)歷。由于PJM涵蓋了美國主要數(shù)據(jù)中心的富集區(qū),他們突然發(fā)現(xiàn)需要對電力規(guī)劃做出重大調(diào)整,因為許多新的數(shù)據(jù)中心需要接入電網(wǎng),而現(xiàn)有的輸電能力和電能供應(yīng)能力無法滿足這些新的需求。同樣的問題也出現(xiàn)在美國德州,許多大型數(shù)據(jù)中心希望接入電網(wǎng),卻發(fā)現(xiàn)電網(wǎng)沒有預(yù)留足夠的輸電通道能力,也沒有足夠或穩(wěn)定的電源供應(yīng)。
然而,我想進一步討論的是,人工智能的發(fā)展對電力系統(tǒng)的影響遠不止于此。在實時電力平衡方面,數(shù)據(jù)中心的發(fā)展也產(chǎn)生了重大影響。我舉一個例子,許多新的數(shù)據(jù)中心規(guī)劃已經(jīng)達到單個數(shù)據(jù)中心百兆瓦,甚至超過百兆瓦的規(guī)模。這些萬卡、十萬卡集群預(yù)訓(xùn)練時的功耗非常大。
楊富強:相當于一個中小城市了。
丁肇豪:相當于一個小城市級別。與其他類型的負荷相比,數(shù)據(jù)中心的能耗還有一個顯著特點:比如Meta在訓(xùn)練自己的模型時可能會因為各種原因暫停多次,每次暫停都可能導(dǎo)致瞬間百兆瓦級別的電力負荷波動。在配電網(wǎng)層面上,這種波動是前所未有的,以前電網(wǎng)并沒有足夠的能力來應(yīng)對這種問題,這是一個全新的挑戰(zhàn)。這種波動不僅關(guān)系到電力供應(yīng)是否充足,還可能對電網(wǎng)安全造成沖擊。再比如,GPU集群有可能不具備電壓/頻率穿越能力,在電網(wǎng)出故障的時候不僅不能支撐電網(wǎng),反而可能給電網(wǎng)造成更大的問題。
陳云霽:股市里面叫“追漲殺跌”,對吧?
丁肇豪:確實是。這些因素疊加起來對我們電力系統(tǒng)的瞬時平衡產(chǎn)生了重大影響。數(shù)據(jù)中心在增長,我們電力和能源行業(yè)需要進行中長期的預(yù)測和規(guī)劃。這涉及到:首先,從總量上評估,包括電源的供應(yīng)和輸電通道的建設(shè)是否能夠滿足需求;其次,考慮數(shù)據(jù)中心在電力系統(tǒng)中占比增大后對系統(tǒng)的影響,以及是否擁有足夠多的手段來平衡。
陳云霽:既然數(shù)據(jù)中心的能耗如此之大,未來數(shù)據(jù)中心的運營者是否可以自己建立電站或者發(fā)電機組?就像我小時候,我爸經(jīng)常參與建設(shè)30萬千瓦的發(fā)電機組。那以后,每個AI數(shù)據(jù)中心是否都可以自己建立一個電廠?
丁肇豪:自從當年比特幣挖礦流行以來,就有人提出了類似想法,比如自己搞個小水電站,降低挖礦成本。但數(shù)據(jù)中心的情況有所不同,因為需要穩(wěn)定可靠的電力供應(yīng)。即便數(shù)據(jù)中心自己建立了發(fā)電廠,最終還是需要至少一條線路或兩個回路接入大電網(wǎng)。自建的風(fēng)光發(fā)電廠不是非常穩(wěn)定,其產(chǎn)生的電力波動最終還是會映射回大電網(wǎng)。無論自己建還是別人建,只要存在波動性,大電網(wǎng)就必須做出反應(yīng)。
吃兩三碗飯的人腦
和“吃”很多很多電的AI
楊富強:在數(shù)據(jù)中心的整個能源消耗過程中,哪個環(huán)節(jié)的電力消耗最多?又有哪些環(huán)節(jié)是比較容易實現(xiàn)節(jié)電的?
陳云霽:從信息處理的角度,我們可以將能源消耗分為兩大類:信息傳輸和信息計算與處理。目前,大模型的信息處理能耗相對較高,遠超信息傳輸?shù)哪芎?。但是,未來隨著計算芯片性能和功耗比的提升,這種狀況是可能發(fā)生變化的,信息傳輸成為核心問題。目前,計算能耗占據(jù)了主導(dǎo)地位,這引發(fā)了一個疑問:為什么計算機的能耗總是遠高于人腦?人腦僅消耗約20瓦的功率,每天吃兩三碗飯就能干很多事情,而計算機則需要更多。
我想引用杰弗里·辛頓(Geoffrey Hinton)的觀點,他是一位獲得過圖靈獎的科學(xué)家,最近也拿到諾貝爾獎。辛頓提出了一個有趣的觀點,即“凡人計算”(mortal computation),涉及到物質(zhì)與信息之間的關(guān)系。人腦中的物質(zhì)與信息是強耦合的,軟件和硬件是綁定在一起的。人腦中的思想和信息都附著在物質(zhì)上,如果一個人去世,這些信息就會隨之消散。而計算機則不同,軟件和硬件是分離的,信息可以從一個硬件拷貝到另一個硬件,但我們不能把一個人大腦里的東西拷貝到另一個人的大腦里。
辛頓認為,軟硬件的分離是導(dǎo)致計算機在處理神經(jīng)網(wǎng)絡(luò)時能耗特別高的一個重要原因。順著他的思路我再往下想,如果未來我們能夠開發(fā)出一種計算機,其軟件和硬件完全一體化,可能只能處理特定的模型,不具備通用性,類似于人腦中物質(zhì)與信息的緊密結(jié)合,那么能耗可能會大幅降低。總之,我想從人腦中汲取靈感,可能會幫助我們進一步提高計算效率。
李勇:從產(chǎn)業(yè)生態(tài)的角度來看,當前以大模型為代表的人工智能技術(shù)的整體能耗主要涉及兩個階段:訓(xùn)練和推理。目前,主要的能耗集中在訓(xùn)練階段,而推理階段的能耗預(yù)計將在未來有顯著增長。從芯片使用的角度來看,無論是訓(xùn)練還是推理,都需要大量的算力,也就是GPU/DPU卡。
兩者之間有一個重要區(qū)別:訓(xùn)練的時效性是可控制的,可以今天進行,也可以推遲到明天,甚至一個月后完成,時間上的靈活性較大。相比之下,推理階段與業(yè)務(wù)實時綁定,對響應(yīng)時間有嚴格要求。因此,推理對底層硬件的要求更高。這也意味著在訓(xùn)練階段,算力和能耗的協(xié)同優(yōu)化有更大的空間,東數(shù)西算的策略在這里可以發(fā)揮作用。例如,在西北地區(qū)有豐富的風(fēng)能和太陽能,可以在能源充足時計算,能源不足時則減少計算。
對于訓(xùn)練階段,根據(jù)能源供應(yīng)情況調(diào)整計算量的做法是可行的。但對于推理階段,這種場景可能并不適用,實現(xiàn)算電協(xié)同的挑戰(zhàn)更大。我的初步想法是,風(fēng)、太有不確定性,是否可以利用核能來彌補,長遠解決這個問題。
陳云霽:此外,我們的計算可以變得更專用化。過去十年來,芯片設(shè)計領(lǐng)域有一個明顯的趨勢,就是專用體系結(jié)構(gòu)變得越來越重要?;叵攵昵?,我們幾乎所有的計算任務(wù)都是通過通用CPU來完成的,就像瑞士軍刀,什么都能干,但每一樣都不是最好的。到了人工智能時代,專門為人工智能設(shè)計的芯片,如GPU、NPU等,已經(jīng)成為處理AI任務(wù)的主流選擇。
未來,我們可能會進一步專用化。為大模型設(shè)計專門的芯片,甚至為某個特定大模型定制芯片,如果能夠?qū)崿F(xiàn),越是專用芯片,能效一定越高。舉一個極端的例子,假設(shè)我們未來訓(xùn)練出了一個非常好的大模型,這個模型本身就具有足夠的通用性,能夠處理各種任務(wù)。那么,我們是否可以為這個特定的大模型定制一個芯片,讓它只能跑這一個大模型。如果是這樣,它的能效可能比現(xiàn)在的GPU還要高出100倍甚至1000倍,從而可能解決我們未來長遠的問題。
但是現(xiàn)在我們還不能這么干,因為大模型的演進速度太快了。今天是GPT-4,明天是GPT-4o,后天是Sora……大模型的發(fā)展仍然處于一個快速變化的階段。如果未來大模型的發(fā)展逐漸穩(wěn)定,出現(xiàn)了一個主導(dǎo)性的、基本收斂的大模型,那么我們芯片設(shè)計者就可以為它專門定制芯片了。
從源隨荷動到源荷互動
張永平:我們支持了一些數(shù)據(jù)中心相關(guān)的項目,出發(fā)點是將數(shù)據(jù)中心視為一個重要的電力負荷,并關(guān)注如何用綠色、清潔的可再生能源來滿足這些負荷需求。
首先,從需求層面來看,數(shù)據(jù)中心,尤其是提供AI算力的智算中心,已經(jīng)成為了高耗能產(chǎn)業(yè),其能耗問題也備受關(guān)注。數(shù)據(jù)中心的能耗涵蓋了芯片、IT設(shè)備、空調(diào)制冷、備用柴油發(fā)電機、不間斷電源等多個方面。目前,數(shù)據(jù)中心的能效已經(jīng)相對較高,領(lǐng)先的數(shù)據(jù)中心的PUE指標已經(jīng)接近1.1,這意味著進一步提高能效的難度很大。但我們不能因為高耗能就抑制數(shù)據(jù)中心的發(fā)展,就像不能因為電動汽車充電多就不讓它充電,不是這個邏輯。
其次,從供給層面來看,我們?nèi)绾螐哪茉矗貏e是電力的角度來滿足數(shù)據(jù)中心的用電需求,特別是綠色需求。數(shù)據(jù)中心的用電需求量大,且在某些時段用電量非常高,這與核電,尤其是中小型、模塊化核電的供電特性非常匹配。在美國,OpenAI、Google、Meta等公司已經(jīng)在投資核電,以滿足未來的AI數(shù)據(jù)中心的用電需求。在中國,我們也在探索如何利用可再生能源來滿足數(shù)據(jù)中心的綠色用電需求。例如,許多數(shù)據(jù)中心的屋頂上都裝有光伏板,但這只能滿足一小部分電力需求,杯水車薪。為了使用更多的綠色能源,可以考慮建立大型園區(qū),或者利用附近的風(fēng)電和太陽能,這就需要配置儲能系統(tǒng)來平衡可再生能源的波動性。同時大電網(wǎng)的兜底保障也還是必需的。
此外,如果數(shù)據(jù)中心附近沒有可再生能源,可以通過購買綠色電力憑證或者通過金融手段來滿足需求。還有一個趨勢是,國家鼓勵將數(shù)據(jù)中心遷移到可再生能源豐富的地區(qū),如西北地區(qū),這樣可以減少電網(wǎng)傳輸?shù)男枨?,使得用電需求與清潔電力供給更加接近,用電成本更低,也助力可再生能源就地利用。
第三,數(shù)據(jù)中心與電網(wǎng)之間的互動。AI大模型的訓(xùn)練階段和推理階段,用電特性是不同的。包括數(shù)據(jù)處理方面,冷數(shù)據(jù)和熱數(shù)據(jù)的處理需求也有所區(qū)別。通過智能調(diào)度算力,我們可以決定何時進行計算,這樣就能在一定程度上減輕電網(wǎng)的負擔(dān),甚至在某些時候還能幫上電網(wǎng)的忙,產(chǎn)生互動效應(yīng)。這種互動不僅能提高電網(wǎng)的安全性,而且可能更加經(jīng)濟。
數(shù)據(jù)中心的電價屬于工商業(yè)電價。目前,工商業(yè)電價的激勵機制還不夠完善,但未來可能會有更多的電價激勵措施。通過與電網(wǎng)的互動,數(shù)據(jù)中心不僅能出售余熱,還可能通過響應(yīng)電網(wǎng)需求再賺點錢,對運營效率提升也有好處。
丁肇豪:電力行業(yè)看待數(shù)據(jù)中心的方式很樸素,就是一個負荷。電力系統(tǒng),特別是新型電力系統(tǒng),隨著可再生能源比例的增加,電源側(cè)的波動性和不確定性也在增加。過去,我們依賴火力發(fā)電,美國則是天然氣電廠,來平衡這種波動。但在碳排放目標的約束下,調(diào)節(jié)性電源,特別是火力發(fā)電,正在減少,這意味著舊的解決方案行不通了。
新的解決方案是實現(xiàn)源荷互動,即不再是單向的源隨荷動,而是負荷也能根據(jù)電源變化而變化。數(shù)據(jù)中心作為未來電力負荷的主要部分,我們希望它能跟隨可再生能源的變化而動。怎么做?
對于大模型訓(xùn)練這樣的離線負載,就像我們給學(xué)生布置任務(wù),要求他們在第二天早晨9點前提交,具體是在凌晨2點還是6點完成計算,并不重要。這些計算任務(wù)可以由阿里云等云服務(wù)提供商來處理,根據(jù)風(fēng)力發(fā)電的時段以及碳排放強度來靈活調(diào)整和調(diào)度算力資源。這類任務(wù)通常規(guī)模較大,對截止時間不敏感。但許多任務(wù)需要大量數(shù)據(jù),通常在特定數(shù)據(jù)中心完成。我們希望將這些任務(wù)放在新能源基地附近的數(shù)據(jù)中心來算,比如沙戈荒基地。
對于在線輕量級任務(wù),如大模型推理,只要滿足時延要求,我們可以在空間上調(diào)度這些任務(wù)。我們與阿里巴巴以及國家電網(wǎng)華北分部合作過一個算力-電力協(xié)同調(diào)度實驗。當電網(wǎng)出現(xiàn)新能源消納困難,棄風(fēng)棄光現(xiàn)象時,我們能否將其他地區(qū)的負載調(diào)度過去?實驗中,我們將阿里南通數(shù)據(jù)中心的一些計算任務(wù)轉(zhuǎn)移到張北數(shù)據(jù)中心,通過算力任務(wù)的轉(zhuǎn)移,南通的負荷降低,而張北的負荷增加,正好消納了當?shù)氐男履茉础?/p>
我們希望這種做法能成為常態(tài),電網(wǎng)能夠向云服務(wù)和數(shù)據(jù)中心企業(yè)提供信號,數(shù)據(jù)中心企業(yè)在算力調(diào)度時能及時響應(yīng),將能源和碳排放作為調(diào)度系統(tǒng)的一部分。
楊富強:將碳排放納入考量,使用煤電會產(chǎn)生相應(yīng)的碳排放,而使用可再生能源則沒有。此外,還可以通過排隊機制來調(diào)整電價。例如,在太陽能最佳的中午時分,如果數(shù)據(jù)中心能夠利用這些“垃圾電”(即過剩的可再生能源),電價可能只有1分錢。而在電力需求高峰時期,電價可能會高達1毛錢。未來可以通過價格機制、市場手段、行政措施以及調(diào)度手段來優(yōu)化能源使用。
工藝節(jié)點短期無法突破
楊富強:我們在不斷追求更先進的芯片技術(shù),7納米、5納米、3納米、1納米……那么,能源消耗是否會成為一個考量因素或者關(guān)鍵的設(shè)計指標?
陳云霽:對于我們芯片人來說,有兩個最核心的指標:速度和能效。速度大家都知道,都希望芯片跑得快。而能效,盡管在上個世紀沒有得到太多關(guān)注,但從2000年以后,它已經(jīng)成為了一個焦點。我們特別關(guān)注每次計算所消耗的能量,比特運算與瓦特之間的關(guān)系是我們非常重視的。
之所以大家追求更先進的工藝,7納米不夠,還要3納米、1納米的,一方面是因為這樣可以在芯片上集成更多的晶體管,從而提高速度。但更重要的是,使用更先進的工藝可以顯著降低每次計算的能量消耗。例如,5納米工藝相比于7納米工藝,每次計算消耗的能量可以減少幾十個百分點。這也正是為什么半導(dǎo)體技術(shù)不斷向更小的納米尺度發(fā)展的原因。
李勇:未來,芯片的能耗肯定將變得越來越重要。這與我們今天討論的整體趨勢是一致的。人工智能在社會中所占的工作量比例越來越大,能耗也隨之增長。而能耗的增加,本質(zhì)上主要是由于計算需求的增長,計算的核心依賴于芯片來處理比特、信息和數(shù)據(jù)。最終,這個賬要算到芯片上。因此,從能耗角度評估芯片的計算效率,會越來越受大家重視。
楊富強:那我們跟國外相比,處在什么水平?
陳云霽:這個問題大家都非常關(guān)注。半導(dǎo)體工藝中的一個重要參數(shù)是工藝節(jié)點,也就是我們熟知的12納米、7納米、3納米等。目前,國際上如臺積電已經(jīng)開始量產(chǎn)3納米工藝,并走向1.8納米,甚至1納米的技術(shù)路徑也是通的。而國內(nèi)由于國際形勢的影響,短期內(nèi)可能還需停留在7納米工藝節(jié)點上。但這并不意味著我們就在這里“躺平”了。
中國科學(xué)家和美國科學(xué)家面臨的挑戰(zhàn)本質(zhì)上是相似的。我們可能在7納米暫時停一段時間,而美國可能在1.8納米或1納米節(jié)點上停留。因此,全球的芯片設(shè)計者都在探索同一個問題:在工藝節(jié)點無法進一步縮小的情況下,如何通過體系結(jié)構(gòu)的創(chuàng)新來提升性能,尤其是降低能耗。
在這種情況下,一個有前景的技術(shù)趨勢是為特定任務(wù)定制專用芯片,即走向?qū)S没R揽客ㄓ肅PU,這種像瑞士軍刀一樣的多功能但非最優(yōu)設(shè)計,已經(jīng)越來越難以滿足需求。相反,為特定的大模型、手機或AR/VR設(shè)備等定制專用芯片,可能成為在工藝節(jié)點不變的情況下降低能耗的重要手段。
楊富強:對于成熟的芯片技術(shù),我們與國際先進水平相比處在什么位置?
陳云霽:在成熟的工藝節(jié)點上,中國的芯片設(shè)計水平在國際上已經(jīng)達到了非常先進的水平。雖然不便斷言是排名第一或第二,但絕對位于第一梯隊之中。我舉一個數(shù)字,以集成電路領(lǐng)域的重要國際會議國際固態(tài)電路會議(ISSCC)為例,這個會議是衡量芯片設(shè)計領(lǐng)域研究成果的重要平臺。據(jù)我所知,清華大學(xué)在該會議上發(fā)表的論文數(shù)量已經(jīng)位居世界前列。
這個數(shù)字其實變化非常大,十多年前,我們大陸每年在ISSCC上只能發(fā)表一篇文章,我記得十多年前我發(fā)表了兩篇,在國內(nèi)已經(jīng)算是最多的之一了。現(xiàn)在,僅僅是清華大學(xué)的一個課題組,一年就能在ISSCC上發(fā)表三到五篇論文。從設(shè)計角度來看,中國無疑已經(jīng)進入了國際第一方陣。在成熟工藝節(jié)點上,中國的芯片設(shè)計工作非常不錯,也有大量出口。
楊富強:中國在很多領(lǐng)域?qū)崿F(xiàn)了從依賴進口到自給自足的轉(zhuǎn)變。以空調(diào)行業(yè)為例,二三十年前,市場上主要是日本、美國的空調(diào)品牌,以節(jié)能技術(shù)領(lǐng)先,但現(xiàn)在,中國的品牌已經(jīng)超越。我們同樣期待在芯片領(lǐng)域中國也能扮演越來越重要的角色。
更快還是更?。糠羌夹g(shù)層面的矛盾
楊富強:現(xiàn)在,我們換個角度來討論芯片。雖然芯片常常被貼上高耗能的標簽,但我們也要看到芯片技術(shù)的進步對整個電力系統(tǒng),尤其是在節(jié)能和可再生能源消納方面產(chǎn)生了巨大的正面沖擊。
張永平:首先,關(guān)于用電量,我們討論了數(shù)據(jù)中心的能耗占比,不論1%還是2%,即使達到10%,只要都是清潔能源,也是可以接受的。因此,核心問題在于如何滿足數(shù)據(jù)中心的高能耗需求,同時確保這些能源是清潔的。
其次,能源的使用特性也非常重要。傳統(tǒng)上,我們喜歡穩(wěn)定的能源供應(yīng),但隨著風(fēng)能和太陽能的波動性,這種偏好受到了挑戰(zhàn)。我們希望數(shù)據(jù)中心和其他能源負荷能夠與可再生能源的波動相協(xié)同,這樣就能最大限度地利用可再生能源。目前,許多工作都在朝著這個方向努力。
核心問題在于需要有一個激勵機制來鼓勵。例如,對于數(shù)據(jù)中心,目前它們可能不考慮響應(yīng)電網(wǎng)的需求,但如果我們能提供足夠的經(jīng)濟激勵,讓它們通過調(diào)整算力調(diào)度來節(jié)省成本或賺取利潤,那么它們可能會更愿意采取行動。
陳云霽:比如,中午開機計算,不要錢。
張永平:對的。許多人可能不太了解電力現(xiàn)貨市場。在電力現(xiàn)貨市場中,電力價格主要影響工商業(yè)用戶比較多,普通家庭用戶感受不到,但工商業(yè)是敏感的。在一些地區(qū),在可再生能源發(fā)電量過剩的時段,比如中午時分,甚至?xí)霈F(xiàn)負電價。如果你在這些時段購買電力,理論上不僅不需要花錢,還能賺錢。
如果有設(shè)計良好的市場機制和足夠的激勵,就能引導(dǎo)數(shù)據(jù)中心調(diào)整其用電行為。當然,這種激勵需要足夠大,就像電動汽車的V2G(Vehicle to Grid),電動汽車可以充電,還能將電能反饋給電網(wǎng)賺錢。但如果放電一次只能賺8塊、10塊,又給自己帶來很大不便,人們可能就不會去做。我相信,未來如果數(shù)據(jù)中心的用電量巨大,且其用電特性對電網(wǎng)產(chǎn)生顯著影響,這種矛盾可能會倒逼市場改革,給出更多激勵信號。
丁肇豪:這個問題我們其實深有體會。雖然今天我們討論的數(shù)據(jù)中心與電網(wǎng)互動、算力調(diào)度以及與新能源平衡的概念聽起來都很好,但實際操作中,從最早2004年就有人提出這些概念。然而,即使過去了二十年,實際落地的項目在全球范圍內(nèi)仍然寥寥無幾,沒有太多可持續(xù)應(yīng)用的案例。
這其中一個很大的問題,是需要電力現(xiàn)貨市場的價格信號來激勵數(shù)據(jù)中心調(diào)整用電行為。但我認為這只是一個方面,因為在算力領(lǐng)域,相關(guān)團隊可能更關(guān)心產(chǎn)品的交付和服務(wù)的可靠性,而不是帶來電費和排放的降低。
陳云霽:我認為目前的情況可能是時機未到。雖然現(xiàn)在人工智能算力只占全球電力消耗的1.6%,但如果有一天這一比例達到20-30%,即便是資金雄厚的互聯(lián)網(wǎng)公司可能也付不起如此巨額的電費。以O(shè)penAI為例,盡管其技術(shù)領(lǐng)先,但實際上一直在虧損。因為目前OpenAI通過大模型掙到的錢無法補貼其電力成本,因此它一直在虧損。不過,我相信它總有一天要掙錢。
目前,無論是互聯(lián)網(wǎng)公司還是大模型創(chuàng)業(yè)公司,還沒有真正考慮如何盈利。他們現(xiàn)在的重點不在于考慮成本問題,包括電力成本。但當他們開始真正思考如何掙錢,AI的算力消耗和電力成本就是他們必須面對和解決的問題。
李勇:不是不報,時間未到。在互聯(lián)網(wǎng)行業(yè),投資現(xiàn)在主要集中在算力,而電力成本尚未顯著上升。算力基礎(chǔ)設(shè)施一旦建成,就會持續(xù)運行,其成本實際上是一個相對平穩(wěn)或逐漸下降的趨勢。相比之下,電力成本卻有可能持續(xù)上升。因此,當電力成本變得足夠高,以至于在經(jīng)濟上成為一個不可忽視的因素時,企業(yè)將會發(fā)現(xiàn)降低電力消耗是劃算的。
張永平:時間點是一個很有趣的話題。據(jù)我了解,至少在美國,像OpenAI這樣的公司,未來的商業(yè)模式如果能夠成功并實現(xiàn)盈利,無非兩個:一是AI應(yīng)用的驅(qū)動,特別是使用量和調(diào)用量的增加,這是收入的來源;二是降低成本。一方面,他們會切入芯片生產(chǎn)上游的晶圓;另一方面,他們正在投資電力領(lǐng)域,包括核電和其他直接電力供應(yīng)方式,以省去中間環(huán)節(jié),直接獲取電力供應(yīng),能節(jié)省超過40%的能源成本。他們正在投資未來。
楊富強:我們剛才討論了AI的能源消耗,同時我們也應(yīng)該看到AI在提高能源效率和減少碳排放方面的潛力。以智能電網(wǎng)為例,我們擔(dān)心可再生能源的不穩(wěn)定性可能導(dǎo)致電網(wǎng)事故。這類事故很少見,可能一年只有一兩次,或者幾年才發(fā)生一次,但一旦發(fā)生,后果嚴重。有了AI之后,我們可以通過模擬和計算幫助我們預(yù)防和解決電網(wǎng)事故?,F(xiàn)在,當我們談到AI時,經(jīng)常提到“AI向善”。人們對AI既感到驚喜,又有些害怕。我們對AI的擔(dān)憂是什么,怎樣去克服?
李勇:我們經(jīng)常討論AI帶來的威脅,比如最初的數(shù)據(jù)威脅,指的是大語言模型消耗了人類產(chǎn)生的所有文本語料,讓我們面臨數(shù)據(jù)枯竭的問題。然而,AI雖然消耗了大量數(shù)據(jù),但它也能產(chǎn)生更多的數(shù)據(jù),比如在視頻創(chuàng)作等領(lǐng)域創(chuàng)造新的內(nèi)容。今天,我們討論的是AI快速發(fā)展可能帶來的能源危機,但討論后我們發(fā)現(xiàn),AI雖然增加了能源消耗,但它也能幫助我們更有效地利用新能源,比如風(fēng)能和太陽能。這實際上是為我們打開了另一扇窗。
楊富強:傳統(tǒng)上,電網(wǎng)調(diào)度需要幾十名工作人員來管理。如果我們引入AI技術(shù),有人提出可以設(shè)計一個軟件,讓AI來接管電網(wǎng)調(diào)度工作,這樣效率會更高,可能只需要一兩個人來監(jiān)督。然而,這也帶來了風(fēng)險。如果AI軟件遭到入侵或者出現(xiàn)故障,可能會導(dǎo)致整個國家電網(wǎng)系統(tǒng)的崩潰。我們應(yīng)該怎么做?
丁肇豪:在電力系統(tǒng)中,我們經(jīng)常需要進行方式計算,這是一種考慮各種可能性以確保電力系統(tǒng)安全的方法。過去,國家調(diào)度中心進行方式計算需要從各省抽調(diào)大量人員,花費數(shù)月時間。但隨著電力系統(tǒng)越來越復(fù)雜,尤其是風(fēng)能和太陽能的增加,這種方式計算變得更加困難。這時,人工智能可能提供了一個解決方案。
然而,使用人工智能也帶來了不可靠性和安全隱患。例如,數(shù)據(jù)投毒、代碼后門等攻擊手段,或者即使沒有惡意攻擊,AI計算出的結(jié)果也可能出錯,因為大型模型本質(zhì)上是概率模型。如果出現(xiàn)問題,誰來負責(zé)?在電力調(diào)度中的決策都是有人負責(zé)。但如果決策是由AI做出的,責(zé)任歸屬就變得模糊。這是在使用AI時,尤其是電力行業(yè)這樣相對保守的領(lǐng)域,需要特別考慮的問題。我們希望在AI的可解釋性、安全性和效率提升之間找到平衡點。
張永平:之前在電力領(lǐng)域,尤其是在電力調(diào)度這個技術(shù)含量最高的領(lǐng)域,人工智能更多還是輔助決策的作用,比如更精準地預(yù)測電力負荷,比如應(yīng)用語音、視覺、自然語言處理等技術(shù),幫助調(diào)度員做交互,降本增效,這些場景已經(jīng)變得很常見。
現(xiàn)在,人工智能的應(yīng)用正越來越多地探索電力系統(tǒng)最核心的領(lǐng)域。例如,因為電網(wǎng)變得越來越復(fù)雜,支持電網(wǎng)運行方式的制定;還有實時監(jiān)控電網(wǎng)運行情況,調(diào)度員需要關(guān)注大屏幕上的電網(wǎng)狀態(tài),并在出現(xiàn)問題時迅速采取應(yīng)對措施,以往這些工作依賴于計算機輔助和人的經(jīng)驗,而人工智能的輔助可以使決策更加精準。
但核心問題在于,人工智能存在不可解釋性。雖然智能涌現(xiàn)帶來了一些好處,但在傳統(tǒng)領(lǐng)域,不可解釋性可能導(dǎo)致安全責(zé)任難以界定。以往人做決策時責(zé)任明確,而AI做決策時責(zé)任歸屬變得模糊。這類似于自動駕駛面臨的社會倫理問題,不僅僅是技術(shù)問題,而是涉及到如何在不同情況下做出倫理判斷。隨著技術(shù)的進步,我們不僅需要改變技術(shù)層面的東西,還需要改變安全文化、社會責(zé)任、倫理和法律法規(guī)等方面。這些問題可能需要長期解決。
觀眾提問
觀眾1:陳云霽老師提到一個觀點,未來AI的大模型可能會收斂到一個相對特定的大模型,我們將為其提供專用的硬件支持。我自己的研究也與大模型相關(guān),想請教李勇老師,您對AI,包括大模型未來的展望是怎樣的?它應(yīng)該具備哪些能力?如何融入人類社會?
李勇:大模型發(fā)展到今天,已經(jīng)展示出了許多可能性,特別是在虛擬世界中解決問題的能力,超出了我們的預(yù)期。目前,許多研究工作正在進一步探索如何讓大模型在現(xiàn)實世界中發(fā)揮作用,比如通過具身智能等研究,讓大模型的能力在現(xiàn)實世界中得到應(yīng)用,幫助我們解決實際問題。
總體來看,大模型是目前人類探索通用智能的一個可能方向,盡管它可能不是唯一的方向。對于未來,我認為一方面,既然我們已經(jīng)看到了大模型的潛力,就應(yīng)該繼續(xù)努力探索。但從國內(nèi)外的發(fā)展形勢來看,美國在這一領(lǐng)域的引領(lǐng)作用仍然很明顯,我們還需要認識到跟隨的現(xiàn)狀。另一方面,隨著智能水平的進一步提升,我們也需要探索一些目前尚未被充分開發(fā)的、有潛力的新路徑。這樣,我們就能為未來人工智能的安全性和可持續(xù)性做出貢獻。
觀眾2:我想問李老師,芯片和大模型的能耗中,有多少是理論上必要的,又有多少是可以通過優(yōu)化減少的?丁老師,于數(shù)據(jù)中心來說,電力波動的承受范圍有多大,是否存在一個理論上限?如果數(shù)據(jù)需要根據(jù)新能源的出力不斷調(diào)整,客戶可能會擔(dān)心多次傳輸帶來的風(fēng)險,這種風(fēng)險如何評估和控制?張老師,高可再生能源占比的算力中心是如何實現(xiàn)的?如果我們想建立一個以可再生能源為主的微電網(wǎng),技術(shù)上的突破點和背后的成本可能是什么?
張永平:我們觀察到數(shù)據(jù)中心目前有兩個發(fā)展趨勢:一方面是大型集中式數(shù)據(jù)中心,另一方面是分布式小型算力中心。這些小型算力中心通常建在需要智能算力的地方,以滿足當?shù)氐男枨蟆?/p>
目前,完全依賴綠色能源的集中式數(shù)據(jù)中心相對較少,因為這類數(shù)據(jù)中心對可靠性的要求非常高。可再生能源,尤其是風(fēng)能和太陽能,具有較大的波動性。要保證大規(guī)模能源供應(yīng)的穩(wěn)定性,就需要有調(diào)節(jié)手段,比如水電(如果有的話),因為它是綠色的。或者配備儲能設(shè)施,但從能量密度和成本角度來看,儲能設(shè)施可能并不是一個技術(shù)、成本效益上劃算的解決方案。因此,大多數(shù)大型數(shù)據(jù)中心至少需要有大電網(wǎng)作為備用,完全離網(wǎng)運行可能比較困難。
對于小型數(shù)據(jù)中心,靠近智算需求的地方,實現(xiàn)綠色電力供應(yīng)是可能的。它們可以利用綠色電力加上一些儲能設(shè)施,在某些時段滿足供應(yīng)需求。雖然可能無法保證一天24小時或一周七天都能百分之百使用綠電,但在某些時段是可以實現(xiàn)的。
從企業(yè)運營的角度來看,為了滿足綠色能源的需求,如果沒有物理資源,它們可以通過購買綠色電力憑證等方式來實現(xiàn)。雖然這會帶來一些綠色電力的溢價,但這種方式可以被視為消耗綠電的一種方法。這些是目前我們觀察到的一些趨勢。
丁肇豪:關(guān)于獨立運行的綠色微電網(wǎng),這個話題在電力領(lǐng)域已經(jīng)討論很久了。但如果要將高可靠性結(jié)合進來,難度就增加了許多。尤其是對于大型數(shù)據(jù)中心,比如擁有萬卡或十萬卡集群的數(shù)據(jù)中心,要實現(xiàn)獨立運行并且保證可靠性,難度就更大了。這種難度既包括技術(shù)上的挑戰(zhàn),也包括經(jīng)濟實現(xiàn)上的挑戰(zhàn),比如投入儲能、氫能等的成本和安全問題。雖然技術(shù)上不惜代價可能是可行的,但一旦考慮到經(jīng)濟成本,可能就變得不可行了。
關(guān)于數(shù)據(jù)中心響應(yīng)速度的問題。我們做過一些模擬實驗,發(fā)現(xiàn)數(shù)據(jù)中心實際上可以提供2秒或4秒的電力系統(tǒng)調(diào)頻服務(wù)。數(shù)據(jù)中心的計算速度或控制速度遠高于電網(wǎng)的頻率,因此有很大的操作空間。
關(guān)于數(shù)據(jù)中心負荷與電力消耗是否線性相關(guān)。我只能說它們是正相關(guān)的,但并非線性關(guān)系。在實際測試中,我們明顯看到算力調(diào)度的時候,最終展現(xiàn)出的電力負荷波動是一種非線性映射關(guān)系。這其中有很多原因,包括任務(wù)執(zhí)行與能耗在服務(wù)器層面、機房層面或整個機群層面的非線性映射,以及制冷等的時間常數(shù)差異。這些因素共同作用,導(dǎo)致最終的非線性關(guān)系。這也是AI可以解決的問題之一,只要我們有足夠的數(shù)據(jù),就可以進行優(yōu)化。
關(guān)于數(shù)據(jù)中心的控制范圍,即上限和下限問題,這并沒有一個統(tǒng)一的答案。它取決于數(shù)據(jù)中心運行的計算任務(wù)類型。如果是大模型的預(yù)訓(xùn)練,那么如果完全停止,變化范圍可能非常大。但如果是一般性的算力中心,運行的是均衡后的負載業(yè)務(wù),那么變化范圍會小一些,具體取決于運行的業(yè)務(wù)類型。因此,這個問題的答案主要取決于我們關(guān)注的是什么樣的數(shù)據(jù)中心以及它運行的業(yè)務(wù)類型。
李勇:關(guān)于芯片能耗的問題,從目前的情況來看,芯片在運行時產(chǎn)生的能耗在一定程度上都是合理的,但確實存在一些可以優(yōu)化的空間。硬件的能耗主要由幾個部分組成:電源模塊、模數(shù)轉(zhuǎn)換模塊以及核心的數(shù)字電路處理模塊。在不同的芯片中,這些模塊的功耗比重各不相同,因此在芯片設(shè)計中,優(yōu)化這些模塊的能耗是一個核心問題。
除了優(yōu)化現(xiàn)有設(shè)計,另一個層面的考慮是芯片架構(gòu)的創(chuàng)新。我們是否可以從現(xiàn)有的軟硬件分離模式轉(zhuǎn)變?yōu)槟7氯四X的工作機制,設(shè)計出一種新型的芯片架構(gòu)。此外,工藝技術(shù)的進步也是提升芯片能效的一個重要方向。
觀眾3:丁老師,您剛才提到算力中心的靈活調(diào)節(jié)需求與其處理的具體任務(wù)相關(guān)。那么,對于未來的不同應(yīng)用場景,我們是否能夠做出估計,并據(jù)此反推出未來增長曲線的可能形狀?例如,未來的任務(wù)將如何增長,其中有多少是可調(diào)節(jié)的?考慮到未來高比例的可再生能源系統(tǒng)和算力中心所占的比重,它的調(diào)節(jié)能力將決定我們需要配置多少靈活能源,如儲能等。同時,我也注意到騰訊等公司通過輔助服務(wù)市場的價格來指導(dǎo)其算力中心的調(diào)節(jié)。這種市場機制在未來是否仍然適用?或者當AI消耗了高比例的能源后,輔助服務(wù)的價格信號是否不足以進行調(diào)節(jié),我們是否需要新的市場或市場機制來應(yīng)對這種情況。
張老師,我的問題是關(guān)于碳中和路徑和能源轉(zhuǎn)型的。雖然我們已經(jīng)有了這些路徑,但在設(shè)計時并未考慮到新型技術(shù),尤其是像AI算力中心這樣的高耗能技術(shù)?,F(xiàn)在我們意識到,未來這些技術(shù)可能占用20%到30%甚至更高的能源比例,是否有項目在研究這種新技術(shù)對未來碳中和路徑的影響?影響范圍會有多大?還是說目前大家仍然認為能源前端的問題,如可再生能源的替代,更為關(guān)鍵,而耗能問題相對來說不是主要因素?
丁肇豪:我先來談?wù)勊懔χ行恼{(diào)節(jié)能力的問題。這個調(diào)節(jié)能力實際上取決于我們對業(yè)務(wù)時延的敏感性和對服務(wù)質(zhì)量的認知。換句話說,這取決于我們對算力需求的緊迫性。例如,如果您使用ChatGPT,并且您是一個非常注重環(huán)保的人,您是否愿意讓ChatGPT在回答問題時比別人多花50%的時間?如果您愿意,那么推理任務(wù)的靈活性就會增加。如果您更愿意等待,比如增加到100%的時間,那么靈活性就更大,因為它可以在能源供應(yīng)更充足的地方進行計算。
至于輔助服務(wù)機制的問題,中國的電力市場仍在發(fā)展變化中。從新一輪電力體制改革開始,現(xiàn)貨電力市場建設(shè)正在全面鋪開。目前,數(shù)據(jù)中心真正參與電力現(xiàn)貨市場的情況還比較少,所以瓶頸并不在于機制層面。如果將來理想情況下,數(shù)據(jù)中心占電力負荷的30%到40%,并且我們需要它們進行調(diào)節(jié),那么我們需要給它們足夠的價格信號。我認為,沿著目前市場機制的設(shè)計思路,從輔助服務(wù)的角度來看,問題不大。可能更多的是需要在容量機制、現(xiàn)貨能量市場和輔助服務(wù)市場之間的匹配關(guān)系上做一些調(diào)整。這可能是一個更長遠的問題,是未來我們需要面對的。
張永平:關(guān)于碳中和的路徑,電力部門脫碳無疑是最核心的部分。不僅電力部門自身需要實現(xiàn)碳中和,其他許多部門也在快速電氣化,這一過程中如果使用的電力都是清潔和綠色的,也能助力其他行業(yè)的減排。在進行這類路徑研究時,尤其是從電力角度出發(fā),我們首先關(guān)注的是對未來電力需求的預(yù)測。未來的需求預(yù)測總是充滿挑戰(zhàn),因為太難預(yù)測,所以很多方法都采用了高中低不同情景的分析。在最低和最高的情景中,會進一步細分各個用電部門的需求。
我相信,按照目前數(shù)據(jù)中心和AI智算的發(fā)展,至少在高用電情景中,已經(jīng)充分考慮了AI對未來電力需求的影響。在這樣的高情景設(shè)定下,如何滿足這些需求,尤其是使用綠色清潔的可再生能源,是有相應(yīng)方案的。我們對這些方案進行了一些分析和測算,發(fā)現(xiàn)是有可能實現(xiàn)的,但對電力系統(tǒng)轉(zhuǎn)型的挑戰(zhàn)巨大。
在可預(yù)見的未來,面對AI帶來的電力需求的增長,通過技術(shù)、政策和市場的協(xié)同努力,盡可能多的用可再生能源去滿足這一需求,還是充滿信心的。
注:科學(xué)四十人是一個科學(xué)交流公益項目,由北京市海淀區(qū)智識前沿科技促進中心(簡稱“智識學(xué)研社”,《知識分子》《賽先生》出品方)和浙江省科匯致遠公益基金會共同發(fā)起。科學(xué)四十人委員會目前包括來自不同學(xué)科領(lǐng)域的34位一流學(xué)者。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.