整理 | 鄭麗媛
出品 | CSDN(ID:CSDNnews)
在這個什么都講“提效節能”的年代, 如果告訴你, 僅靠修改 Linux 內核中 30 行左右的代碼, 就能讓數據中心能耗降低 30%,你敢信嗎?
聽起來有些夸張?但這確實是來自加拿大滑鐵盧大學的一項真實研究成果,而且已經被并入 Linux Kernel 6.13!
數據中心的“腦力勞動”出了問題?
我們都知道,現代數據中心是 AI 時代的“算力發動機”。不管是你讓 ChatGPT 寫的段子,還是正在加載的一張美圖,它們背后都離不開數據中心日以繼夜地運轉著數十萬甚至上百萬個服務器節點。
然而,正因為運轉得太“勤快”,數據中心已經成了用電大戶。根據國際能源署(IEA)的預測,到 2030 年,數據中心的電力需求可能占到全球總用電量的 4%。在 AI 大模型加速落地的今天,這個數字只會更快逼近。
以 OpenAI 的 GPT-4 為例,它的訓練過程據估算消耗了相當于 5000 個美國家庭一整年用電的電能——這還不包括推理階段的耗電。可以說,AI 的算力焦慮正實實在在地轉化為電力焦慮。
那么問題來了:這些電到底花在哪兒了?
加拿大滑鐵盧大學的研究者發現,僅僅是在網絡處理這個“看起來不起眼”的環節,就存在巨大的優化空間。
“主動輪詢”+“智能切換”,巧妙應對流量波動
要理解這項優化,我們得先了解一點網絡棧的“潛規則”。當服務器收到一個新的網絡數據包時,Linux 內核的做法是:立刻發起一個中斷請求(IRQ),強行打斷 CPU 當前正在執行的任務,轉去處理這個包。
乍一看沒問題,響應快嘛。但問題在于,這種頻繁的“打斷—處理—返回”的過程,會導致 CPU 緩存失效,執行效率變低,而且非常耗電。用滑鐵盧大學 Cheriton 計算機學院教授 Martin Karsten 的比喻來說:這就像在一個流水線上,一旦有新任務就有人大聲喊停,所有人都得停下手中的事趕去處理,反復打斷反而影響整體效率。
那有沒有可能不被動等待中斷,而是“我閑下來自己去看看有沒有任務”?而這,正是 Martin Karsten 帶領的研究團隊想出的解決方案。他們與內容分發網絡公司 Fastly 的首席工程師 Joe Damato 合作,開發出了一段約 30 行的代碼,用于改進 Linux 網絡流量的處理機制,其核心思想是:
高流量時段,關閉頻繁的中斷請求,改為采用主動輪詢:CPU 每隔一小段時間主動去網絡檢查是否有新包;
低流量時段,重新啟用傳統中斷模式,減少不必要的資源消耗。
簡單來說,就是“忙的時候我自己去看,閑的時候你叫我一聲”。這種動態切換機制充分結合了兩種模式的優點,在節能的同時還能提升吞吐量、降低延遲。
更妙的是,整個改動只需要在 Linux 網絡棧中修改約 30 行代碼——沒有引入任何新硬件、沒有額外成本,僅僅改了幾行老代碼,就能讓龐大的數據中心更省電、更高效。
“我們沒有增加任何新功能,只是重新安排了執行順序,”Martin Karsten 解釋道,“就像在工廠流水線上稍微重新調整步驟,避免工人東奔西跑那樣,讓 CPU 緩存的利用更加高效。”
實測結果:性能提升 45%,能耗降低 30%
根據該研究團隊給出的實測結果,這項優化不僅能降低能耗最多達 30%,還將數據處理吞吐量提升高達 45%,同時保持較低的尾延遲(tail latency),即系統在高負載下仍能快速響應關鍵請求。
值得一提的是,這項優化也已正式并入 Linux Kernel 6.13,正式成為 Linux 系統的一部分,意味著只要操作系統內核版本跟得上,所有基于 Linux 的服務系統都能無縫受益。
Martin Karsten 教授表示:“像 Amazon、Google、Meta 這樣的科技巨頭或多或少都會使用 Linux,但它們對啟用什么特性非常謹慎。如果這些公司愿意在數據中心中開啟這一優化方案,那么全球范圍內每年可以節省數十億度電。每一次互聯網上的服務請求,也幾乎都能從中受益。”
如他所說,在這個“誰的 AI 跑得快、誰的訓練成本更低”的時代背景下,這項優化堪稱開源社區給數據中心運營者的“節能大禮包”。
不過,盡管節能技術不斷進步,但根據 Uptime Institute 的報告,全球仍有超過一半的數據中心并未追蹤包括碳排放、可再生能源使用率等在內的關鍵可持續指標。更糟糕的是,還有不少企業甚至放松了原有的環保目標,以便給 AI 項目讓路。
例如 Google 最近披露,其碳排放在 4 年內激增了 48%,主要原因就是為了支撐 AI 布局而大規模擴建數據中心——這也引發了外界對“AI 是否真的可持續”的廣泛質疑。
面對這個問題,IEEE 高級成員、貝爾法斯特女王大學工程學院教授 Aoife Foley 呼吁道,所以數據中心想要實現可持續發展,不僅要在代碼優化上下功夫,還得從設計、建設階段就考慮環境因素,篩選暗數據、減少不必要存儲、使用綠色能源。
https://www.techrepublic.com/article/data-centres-energy-reduction-code/
https://www.datacenterdynamics.com/en/news/changing-linux-code-could-cut-data-center-energy-use-by-30-researchers-claim/
如果您曾將 PayPal 集成到您的應用或項目中,并為此查閱過 PayPal 的集成文檔,我們誠摯邀請您參與一項重要的問卷調研。
只需要 30 秒即可搞定問卷上的 6 個小問題(全部都是選擇題)!為感謝您的寶貴時間,前 200 名完成問卷的開發者將獲得一份精美禮品(快充頭/保溫杯/6合1充電器三選一)作為答謝。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.