《“十四五”數字經濟發展規劃》提出以數字技術與實體經濟深度融合為主線,加強數字基礎設施建設,完善數字經濟治理體系,協同推進數字產業化和產業數字化,賦能傳統產業轉型升級,培育新產業新業態新模式,不斷做強、做優、做大我國數字經濟,為構建數字中國提供有力支撐。
為此,從2020年至今,發改委、工信部等先后發布多個文件,包括《關于加快構建全國一體化大數據中心協同創新體系的指導意見》、《全國一體化大數據中心協同創新體系算力樞紐實施方案》、《新型數據中心發展三年行動計劃(2021-2023年)》,全國統一的數據中心基礎設施建設已經全面鋪開。
正是在這樣的大背景下,以“智算創見,數實相融”為主題的浪潮信息生態伙伴IPF2022召開。那么通過此次大會,我們能夠管窺到中國數字經濟發展中,作為基礎設施底座的算力怎樣的發展趨勢?對于國家大力推動的數實融合會有何影響?相關企業對此有何新的產業洞見和舉措?
數實融合深化升級,算力從通用到智算大勢所趨
提及數實融合,從理論上看,就是數字世界同物理世界的融合,現實世界的需求推動數字世界的發展,數字世界的發展來引導現實世界的運行。而眾所周知的事實是,數字世界是“算”出來的世界,是運行在服務器、終端等計算平臺上的世界,“數字世界一切皆計算”。
而上述理論落實到當下全球及我國大力實踐的數字經濟中,數實融合體現的則是以算力為基礎,將所謂物理世界中抽象的技術(例如目前炙手可熱的、物聯網、大數據、人工智能等)應用到百行千業(現實世界)中,轉換成實在的生產力,實現數字經濟的量化(例如促進GDP的增長),提升國家的競爭力。
基于此,從國家戰略層面看,當下,中國經濟已經進入高質量發展階段,即對推進數實融合的需求不僅迫切,而且呈現出高質量的特征,而高質量發展的基本特征就是以創新驅動增長,推動經濟發展向結構更合理、附加值更高的階段演化,同時,數字經濟的根本屬性也是科技創新。所以未來中國經濟的數實融合,不論是從規模還是深度廣度上,都在向更高層次推進,而伴隨著數實融合的不斷深入,數字經濟不應只帶來產業升級,更應助力產業和社會價值的持續創新。
從產業和技術層面看,數實相融是一個逐級演進的過程,可以分為自動化、信息化、數字化、智慧化,并通過起始、初級、中級、高級階段予以呈現,而從技術的角度,自動化、信息化、數字化是以傳統計算為基礎、以算數、完成完全可控的既定處理的計算技術,而智算就是以獲得知識、智慧為目的的計算技術,智慧化是信息化、數字化最終的目標,也是發展的必然趨勢。
由此我們不難發現,無論是從國家數字經濟發展的戰略層面,還是產業和技術的客觀發展規律,數實融合從促進產業升級向加速產業創新的更高層次發展是大勢所趨。那么隨之而來的則是前述以生產力為主要屬性的傳統算力,向以創新力為主要特征的智算的演進。
究其原因,智算可以從數據中發現創新點,有效縮短人類發現的時間、人力和成本消耗,從而讓企業、政府、科研機構找到新方法、新路徑,實現轉型升級和創新。
這里我們以智算在人類生命健康的蛋白質結構解析為例來說明為何智算就是創新力。
傳統蛋白質結構的解析一般依賴冷凍電鏡、核磁共振、X射線衍射三種方式,確定一個蛋白質結構需要幾個月甚至是幾年。過去半個多世紀,人類一共解析了五萬多個人源蛋白質的結構,僅是人類蛋白質組里大約 17% 的氨基酸結構信息。而基于深層神經網絡的AlphaFold實現了原子精度的蛋白質結構預測計算方法,在一年的時間內,它將預測的結構信息比例從17% 大幅提高到 58%,是一個典型的量變引起的質變。可以說,AI在破解生命的蛋白密碼方面,已經具備了相當的創見能力。
又如在考古學的古DNA分析領域,由于年代久遠,DNA序列片段破損嚴重,相對于現代DNA,古DNA測序及分析更復雜,在傳統的計算方式下,一般完成一次古人類的全基因組樣本分析需要耗時至少兩周。浪潮信息聯合吉林大學,將AI加速技術運用到古DNA基因測序中,打造了我國DNA考古領域的首個FPGA基因測序加速應用方案,可在9.64小時內完成全基因組分析,48分鐘完成全外顯子組分析,相比傳統計算方案,基因數據處理速度提升39倍,為重現新疆古人類文明做出了巨大貢獻。
生產力到創新力,算力演化帶來新挑戰
如前述,無論是從國家數字經濟發展的戰略層面,還是產業和技術的客觀發展規律,數實融合從促進產業升級,向加速產業創新的更高層次發展是大勢所趨,與此同時,由此引發的由生產力屬性為主的通用計算向創新力屬性為主的智慧計算演變的過程中,又出現了新的挑戰。
例如算力方面,供給與需求矛盾更加突出。目前,AI算力需求平均3.4個月就會翻一番,相比之下,通用芯片的性能年均僅提升3%,AI算力更多由GPU/TPU/FPGA/ASIC等提供,而目前的計算體系結構并不適于多元算力的互聯融合及AI算力效率的發揮。
又如算法方面,多樣性、專業性、巨量化的挑戰日益明顯,主要體現在,深度學習發展至今,已產生了40多種基礎結構,如注意力結構、卷積結構等,以及500多種不同的基礎算子,而這些基礎結構及算子依據不同的建模方法構成了近10萬種不同的模型;算法通用性、精度要求模型規模越來越大,萬億參數大模型近在咫尺,但高昂的成本和技術復雜度讓多數企業望而卻步;AI新算法、新理論層出不窮,使得智算人才培養難度和成本居高不下,傳統企業在短期內很難獲得所需的人才。
這里我們以具體的金融業為例,由于金融業務的復雜性,金融AI算法開發的門檻較高,存在開發鏈條長、開發周期長、人力成本高等問題。此外,當下人工智能開發中計算資源分散、訓練數據的孤島現象以及開發環境和流程中的管理問題,也致使AI算法開發效率低下,進而阻礙了金融業的顛覆式創新。
需要說明的是,由于算力和算法新挑戰的出現及彼此間的相互作用和影響(例如大模型需要更多算力),又出現了以此為基礎設施的數據中心面臨更加嚴峻的能耗和低碳的新挑戰。
據統計,數據中心的用電量從2012年的645億度提升到了2020年的2045億度,占到了全社會總用電量的2.7%。另據綠色和平和工業和信息化部電子第五研究所計量檢測中心聯合發布的《中國數字基建的脫碳之路:數據中心與5G減碳潛力與挑戰(2020-2035)》報告預測,2035年,中國數據中心和的碳排放總量將達2.3億—3.1億噸,約占中國碳排放量的2%—4%。其中,數據中心的碳排放將比2020年最高增長103%。即便是在中國2030年全面實現碳達峰之后,數據中心的碳排放仍將持續增長。
最后,在從計算向智算演化的過程中,由于多芯片(例如GPU、TPU、FPGA、ASIC等)的采用,不同的芯片往往都有單獨的指令集、開發運行環境和操作規則,彼此之間互不融合,造成在此基礎之上發展起來的云、大數據、AI技術不同流派互不兼容;AI技術同云、大數據以及傳統應用之間也互不兼容,生態割裂的新挑戰凸顯,并導致當前AI創新減緩。
智算中心持續進化,化挑戰加速數實融合創新
鑒于上述挑戰,在從傳統通用算力向智算的演化中,實現數實相融從促進產業升級向推動產業創新的更高層次發展,需要的是算力、算法、生態層面的融合創新,并通過集這些融合創新于一身的智算中心的煥新方能實現。
這里我們以浪潮信息聯合燧原科技打造的“錢塘江”智算中心解決方案為例來予以說明。
在應對算力挑戰方面,其采用多次獲得全球AI基準測試冠軍的浪潮AI服務器系統架構,搭載燧原科技高能效AI算力芯片“邃思,單集群可提供高達200P峰值AI算力(TF32),支持按需橫向擴容。“錢塘江”智算中心方案支持超強擴展能力,采用高帶寬、全互聯拓撲構架,跨節點互聯帶寬高達448GB/s ,結合GCU-LARE 2.0多芯互聯技術,可實現千芯級大規模集群高速互聯,具備優異的線性加速比,可支撐千億參數巨量模型高效并行訓練。
而為了化解能耗和低碳的挑戰,其創新研發全球首臺開放加速模組液冷計算平臺,率先實現單節點8顆400W高性能AI芯片液冷散熱,支持中高溫水運行,采用先進變頻流量系統,大幅提高流量變化范圍、降低能耗, 智算中心整體PUE低于1.1。
提到液冷技術,我們想補充說明的是,最新發布的《2021-2022全球計算力指數評估報告》認為,隨著數據中心系統對綠色節能的要求不斷提高,液體冷卻解決方案將在數據中心市場得到更廣泛的采用,到2023年數據中心中至少有約40%將配備液冷技術解決方案。而隨著智算中心布局和建設的不斷深入,液體冷卻解決方案將在數據中心市場得到更廣泛的應用。
針對生態割裂的挑戰,其提供了普惠生態支持,支持業界主流深度學習框架,聯合元腦生態伙伴提供普適普惠的數據、算力、算法服務;方案搭載浪潮AIStation智能業務創新生產平臺、“源”巨量模型算法能力,構成領先的算力算法一體化智算中心解決方案。
值得一提的是,隨著新挑戰的出現,智算中心也需與時俱進,不斷進化。
以已經投入運營的南京智能計算中心為例,針對算法的新挑戰,其最新引入了“源”大模型,解決了模型與算力層的適配難點,通過對編譯器和推理架構的針對性創新和優化,將模型的推理性能提高了數十倍。此外,“源”落地南京智能計算中心之后,提供多種API接口,可供開發者直接調用;提供會話式AI SDK開放框架,開放YTK工具包,支持大模型+微調的AI開發新范式,行業用戶可以更快、更簡便的方法進行會話式AI模型定制開發。
總結:眾所周知,智算中心因具備開放標準,集約高效、普適普惠三個特征成為當下中國數字經濟的底座已經成為業內的共識。而隨著智算就是創新力時代的到來及出現的新的挑戰,本就是智算中心建設核心內容的算力和算法的基建化就顯得尤為重要。
為此,浪潮信息在此前算力基建化的基礎上,提出了算法基建化,即通過在智算中心部署大模型所需要的訓練、推理和數據處理系統,構建出自然語言處理大模型、視覺大模型和多模態大模型,同時,以模型API服務、領域模型、開發者社區的形式對外提供算法基礎服務,緩解我們前述企業面對大模型訓練成本高、技術門檻高的新挑戰,真正讓算法也能普惠大眾,助力行業智慧應用高效開發,滿足數實融合向更高層次發展的需求。
“軟硬兼施”。算法基礎設施與算力基礎設施的強強聯合是否會成為未來智算中心的標配,借此匯聚“大算力+大算法”更好地賦能千行百業,助力產業AI化進程?一切均有待考量,但作為加速數實融合創新,促進數字經濟發展過程中新基建的智算中心,持續演化和與時俱進肯定是大勢所趨。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.