2011年,由Facebook聯合Intel、Rackspace、高盛和Arista Networks發起的開源硬件組織——OCP開放計算項目(Open Compute Project)正式成立,其使命是通過開放開源硬件技術,實現可擴展的計算,提供高效的服務器、存儲和數據中心硬件設計,以減少數據中心的環境影響,致力于圍繞網絡、服務器、存儲和Open Rack的開源貢獻進行創新。之后,與之相關的ODCC和Open19相繼成立,共同構成了今天的所謂開放計算。
而今年恰逢開放計算10周年,這使得以“開放計算再十年:降碳?增效?踐行”為主題的OCP China Day 2021頗為業內關注。
過往的10年,開放計算表現如何?更重要的是,再過10年,開放計算又將怎樣?
10年碩果累累,開放計算彰顯強大產業生命力
提及開放計算10年來的表現,據全球科技研究機構Omdia聯合浪潮共同發布的《全球開放計算發展報告》(以下簡稱《報告》顯示,10年以來,開放計算從整機柜項目開始,已延伸到數據中心的方方面面,包括服務器、存儲、網絡、供電、散熱、基礎設施管理等,并涵蓋了全球領先的芯片、部件、整機、數據中心整體解決方案提供商以及互聯網廠商。可以說,如今的開放計算已經建立了面向數據中心基礎設施的完整生態,影響力與日俱增。
以OCP為例,作為全球開放計算的起源地,其吸引著全球頂尖的公司加入并持續發展壯大,獲得了Facebook、微軟、谷歌、阿里巴巴、百度、騰訊、英特爾、英偉達、ARM、HPE、浪潮、廣達等會員的支持和貢獻。目前OCP社區擁有250+成員企業,5000多名工程師和16000多名參與者,設立了數據中心基礎設施、服務器、存儲、網絡、硬件管理、機架&電源等9大類23個項目組,已經發展為一個支持數據中心標準化的產業生態。
而從市場表現看,基于開放計算標準的服務器年市場規模已經達到了140億美元,每年基于開放計算標準的服務器部署數量為470萬臺,而按照數據中心的算力計算,基于開放計算標準的服務器為全球數據中心提供的算力占比達到了34.8%。相比之下,2016年全球服務器中只有7%是基于開放計算標準的。
10年間,可以說開放計算彰顯出了強大的產業生命力,那么接下來的再10年又當如何?能否保持和延續產業生命力?也許這才是業內最為關心的問題。
與時俱進迎挑戰,開放計算促技術創新落地
在我們看來,相關產業的標準也好,模式也罷,要想在未來的發展中保持生命力,考量的是其隨著產業的發展變化,與時俱進,不斷迎接新的挑戰的能力。具體到開放計算也不例外。
據全球科技研究機構Omdia聯合浪潮共同發布的《全球開放計算發展報告》指出,降低資本和運營支出是采用開放計算設備的主要原因。同時他們表示看到了開放設計所提供的創新的價值,以及部署開放計算設備將帶來與競爭對手差異化的優勢。
那么接下來的是,開放計算能否面對產業因不斷發展而出現新的挑戰或者需求,而通過自身的創新來保持這些優勢?
以代表當下和未來的AI計算產業為例,眾所周知,隨著人工智能計算的指數級增長,目前全球已有上百家公司投入新型AI芯片的研發與設計,AI計算芯片多元化趨勢愈發明顯。
具體表現在ASIC、GPU等AI芯片越來越多,技術更新也越來越快,導致AI硬件系統的技術挑戰和設計復雜性也越來越大,將AI芯片集成到系統中通常需要大約6-12個月。這種延遲阻礙了新的競爭性AI芯片的快速采用。
此外,因為各廠商在AI芯片開發中采用了不同的技術路線,導致芯片的接口、互聯、協議上互不兼容,使得數據中心用戶在AI計算基礎設施建設中不得不面臨硬件分裂化和生態割裂化的重大挑戰。
對此,作為OCP鉑金會員的浪潮信息副總裁、浪潮信息AI&HPC產品線總經理劉軍坦言,眾多的AI計算芯片層出不窮,讓我們擁有了一個面向不同計算負載的多元算力的同時,也帶來了多元芯片適配的挑戰。
針對于此,OCP推出了OAI開放技術規范,涉及OAI、OAM、UBB、HIB等9大領域,涵蓋結構設計、溫度、管理、供電、硬件安全性、可用性等諸多方面,旨在建立一整套可兼容各類AI加速器(包括AI芯片)的技術標準,以刺激AI計算基礎設施的融合創新,基于此,該規范出臺立即得到了業內的響應。
以OCP的鉑金會員浪潮為例,其自OAI中的OAM規范推出后僅耗時3個月,就設計并發布了全球首款OAM通用基板及基于該基板、可兼容各類符合OAM規范的AI芯片的AI開放加速系統MX1。
需要說明的是,MX1是全球首個支持多家不同型號AI芯片的開放加速系統,不僅能夠支持國際廠商的計算芯片,比如英特爾的芯片、Habana的芯片,同時支持來自中國本土創新研發的AI芯片,像知名的寒武紀、燧原、天數等。
此外,基于OAM標準,浪潮還制定了UBBSPEC的設計規范,大幅提升各類符合OAM規范的AI加速芯片的兼容性。目前,百度的X-MAN4.0、浪潮的MX-1、水原科技的T11等一系列產品已支持OAM標準。
除上述外,隨著、AI的發展,在催生了數據中心規模化發展的同時,更激活邊緣計算應用場景的多元化需求。
在此趨勢下,越來越多的企業和行業應用場景需要實現邊緣計算的跨硬件架構開發、部署與運行,以實現更高的敏捷性與靈活性。同時,邊緣計算負載的復雜化也意味著,邊緣計算中心將需要管理越來越多不同品牌型號、性能標準、部署模式的設備,這就需要制定統一的基準規范,降低部署與運維的門檻。
因此,推動邊緣計算開放標準的制定至關重要。只有統一的標準才能為邊緣計算系統的搭建與運行設定一致性規范,實現邊緣計算硬件與應用的解耦合,讓邊緣計算應用能夠獨立于邊緣硬件環境。同時,開放的邊緣計算意味著系統的兼容性、靈活性與擴展性得到顯著提升,以及賦予用戶根據實際負載需求,靈活搭建邊緣計算方案的自由。
基于此,OCP和ODCC不約而同地在邊緣計算積極推動,分別設立了OpenEdge和OTII項目組。其中,OpenEdge作為OCP社區的重要項目組,制定了全球第一款通用的邊緣服務器標準,解決了邊緣服務器規范與電信規范融合的基礎問題。
而在ODCC社區中,2017年底成立了OTII項目組,目標是形成面向和邊緣計算場景的深度定制、開放標準和統一規范的服務器技術方案。基于OTII的邊緣服務器采用寬度和2U高度;深度只有傳統服務器深度的一半。這樣讓服務器不僅能夠直接在傳統機架上部署,也能夠掛在墻壁上,從而簡化邊緣部署。
據Omdia調查報告稱,國內電信運營商采用基于OTII的 邊緣服務器,運營支出減少 53%,資本支出減少 30%,同時節省功耗、場地租賃費用和現場管理費用。
不知業內從上述看到了什么?我們看到的是開放計算通過創新與時俱進,保持差異化競爭優勢的能力。例如上述的開放計算通過社區的共同努力,以開放標準促進多元計算融合,為人工智能創新賦予了更多可能,以及在邊緣計算的創新幫助客戶降低資本和運營支出就是明顯的例證。
降碳增效大勢所趨,開放計算有備而來
細心的業內會發現,此次備受關注的OCP China Day 2021中,降碳、增效成為主題詞。那么問題來了,降碳、增效對于開放計算的未來意味著什么?
據相關數據顯示,2020年我國數字經濟規模達到39.2萬億元,同比增長9.7%,占GDP的比重已經達到38.6%。數據中心作為數字經濟的核心基礎設施,其年用電量已占全社會用電的2%左右,數據中心已成為一大碳排放源,同時由于數字基礎設施碳排放的“鎖定效應”,因而成為下一個減排的重點領域。
針對于此,工信部印發了《新型數據中心發展三年行動計劃(2021-2023年)》(以下簡稱《行動計劃》),明確用3年時間,基本形成布局合理、技術先進、綠色低碳、算力規模與數字經濟增長相適應的新型數據中心發展格局。而近期發布的《全國一體化大數據中心協同創新體系算力樞紐實施方案》(簡稱《實施方案》)中,也明確指出要推動數據中心綠色可持續發展,加快節能低碳技術的研發應用,提升能源利用效率,降低數據中心能耗。
需要說明的是,《行動計劃》主要目標中,對降低數據中心電能利用效率(PUE)做了明確規定,即到2021年底,新建大型及以上數據中心PUE降低到1.35以下。到2023年底,新建大型及以上數據中心PUE降低到1.3以下,嚴寒和寒冷地區力爭降低到1.25以下。
由此看,1.3基本成為各地新建數據中心的PUE紅線,但實際的情況是,截至2019年年底,全國超大型數據中心平均PUE為1.46大型數據中心平均PUE為1.55;規劃在建數據中心平均設計PUE 為 1.41 左右,超大型、大型數據中心平均設計PUE分別為1.36和1.39,與《行動計劃》目標尚存一定差距,如何在規定期限內進一步降低PUE,實現綠色低碳發展,成為數據中心產業面臨的緊迫挑戰。
對此,劉軍認為,開放計算的社區目標與未來中國針對數據中心的發展目標不謀而合。目前,中國要求新建大型數據中心的PUE值小于1.3,對綠色節能提出了更高的技術需求,比如專門提到需要高密度集成的高效IT設備、支持液冷的高效制冷系統、支持高壓直流的高效供電系統等。這些與社區在創新項目上的布局高度一致,為開放計算下一個十年提供了清晰的發展之路。
實際情況是,與傳統設計相比,開放計算在降低能耗、減少運營支出方面已經彰顯出明顯的優勢。
比如Facebook在OCP開放的整機柜設計方案,可節省45%的資本支出,提升38%的能源效率,并降低24%的運營支出。
更讓業內吃驚的是,Facebook2019 年可持續年度報告顯示,在2015 年—2019年,相對于行業平均PUE1.5,Facebook 數據中心相當高效,最近五年其PUE始終維持在1.1上下。
對此,浪潮服務器產品線副總經理陳彥靈認為,利用整機柜及液冷等方式,通過集中供電、集中散熱、集中管理,可提升部署密度,降低功耗及TCO。同時,針對AI計算、冷數據存儲與大數據等不同應用類型,可將數據中心劃分不同的功率密度區域,優化提升空間供電利用率。此外,還可以對數據中心的功耗、負載分配及設備使用率分析,總結設備日使用率分布情況,進而促進數據中心級能耗優化。
基于此,我們看到,除了Facebook,國內百度采用天蝎整機柜可將TCO降低 10%,且百度所有建設投產的數據中心PUE 均低于1.3,最新建成的數據中心年均PUE 約1.2 左右,大幅提升了能源效率。
當然,除了基于整機柜方式外,還有液冷的創新助力PUE的降低。例如阿里通過數據中心IT設備冷卻一體化設計,將服務器浸泡在特殊的絕緣冷卻液中,散熱全程無需風扇、空調等制冷設備,大大降低了數據中心的能耗,整體節能超70%,大幅提高了數據中心能源使用效率。
至于通過對數據中心的功耗、負載分配及設備使用率分析,總結設備日使用率分布情況,促進數據中心級能耗優化方面,由浪潮牽頭的開放計算項目OpenRMC已經有了最新進展,OCP社區今年公布了OpenRMCDesign Specification v1.0,該設計規范解決了不同整機柜之間的統一管理問題,滿足了中小規模數據中心提升自動化運維能力、提高系統可用性、降低數據中心能耗水平等一系列需求。
種種事實證明,要實現《行動計劃》的目標,開放計算模式理應是產業最佳的選擇。
寫在最后:過去十年,開放計算成了數據中心創新的主力;未來十年,需要繼續創新來應對數據中心降碳、適配和多元化的挑戰,共建標準,共建生態,攜手推動開放計算產業的協同創新。
令我們看好的是,開放計算一直在行動。
例如在技術領域上,OCP的創新已開始延伸到數據中心的方方面面,持續推動綠色高效數據中心的建設。即將推出的Open Rack 3.0在空間、承重、供電、液冷支持等方面做出更多改進,讓數據中心能夠更大規模的運行各類AI工作負載;在高速網絡通信領域,OCP Mezz (NIC)規范已經成為業界IO選項的標準,最新的NIC3.0技術規范增加了熱插拔設計,信號速率最高可支持PCIe Gen5,滿足各行業高密度計算對高密度部署的空間要求。同時,OCP正在打破數據中心基礎設施領域的界限,向異構計算、邊緣計算等前瞻技術延伸。
應用方面,開放計算起源于超大規模數據中心,正向中小型數據中心和非互聯網行業滲透。電信、金融、游戲、電商、醫療、汽車制造等行業已經或正在嘗試部署符合開放計算標準的IT基礎設施。
正是由于開放計算的一直在行動,其市場前景也普遍被業內看好。
據Omdia預測,2025年全球40%的服務器將基于開放標準;非互聯網行業在開放計算的市場占比將從2020年的10.5%增加至2025年的21.9%。
另據IDC預測,2020—2024年間全球開放計算項目(Open Compute Project,OCP)基礎設施市場的年復合增長率達到16.6%,預測期末市場規模達到338億美元。
綜上,我們不難看到,開放計算依然是未來IT基礎架構創新發展的核心驅動力之一,更重要的是,其與產業未來發展的大勢及目標高度吻合。所以,再過10年,開放計算,與時俱進,大勢所趨,大有可為。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.