從蒸汽機到電力革命,從互聯網到移動互聯網,每一次產業變革都遵循“技術觸發到場景適配,再到行業繁榮”的鐵律,唯有AI時代是跳躍式的發展。
凱文·凱利早就在《必然》中預言未來三十年,人類社會將經歷比工業革命更劇烈的技術躍遷,但連這位預言家本人,都未曾料到大模型會讓AI時代的進化速度如此迅猛。
年初DeepSeek橫空出世,以開源的形態迅速席卷全球,并形成了一種事實性的標準。大量企業為其趨之若鶩,幾個月的時間里,數不勝數的AI應用快速的部署和落地,因此也產生了許多“斷層”,特別是那一道巨大的算力“鴻溝”。
我們知道,傳統算力每18-20個月翻一倍,在深度學習的時候,每6個月翻一倍,而到了大模型時代算力幾乎是每年幾十倍的增長。IDC的數據也顯示:全球算力需求將以每年50%的速度增長,而AI應用驅動算力需求增長速度更快,預計到2030年,智能算力需求將比當前呈現上百倍的增長。
當算力的鴻溝正在被越拉越大,擺在我們眼前的其實有兩條路線:要么強化計算單機設備性能,突破現有的算力“極限”;要么通過異構智算技術,讓存量算力的效率達到“極致”。
那么,在“極限”和“極致”這兩條路上,誰又能代表中國的算力創新?
01
算力鴻溝的破局之道
極限與極致的雙向突圍
不可否認,DeepSeek橫空出世,為智算領域帶來了全新的質變。
按照“杰文斯悖論”:技術進步本應降低資源消耗,卻因效率提升催生了更強烈的需求。以DeepSeek為例,其模型訓練成本較三年前下降85%,算力需求彈性擴大6倍。算力成本結構的劇變,使得AI技術逐步轉變為所有企業均可負擔的基礎設施。
如聯想集團副總裁、中國基礎設施業務群總經理陳振寬所說,“過去,AI算力的使用者主要集中在以基礎大模型開發為核心的少數用戶;而今年,以DeepSeek、千問等為代表的大模型,以更強大的性能和更優化的成本,驅動更廣泛的用戶加入到AI應用落地的隊伍之中。”
當AI技術加快向百行百業滲透,必定會刺激智算需求呈現幾何級數的增長。供需力量共同推動了算力需求規模的持續增長,根據IDC預測,2025年中國X86服務器市場仍將保持12%的穩健增長,而AI服務器的增速則將保持在30%以上。
當然,智算的需求發展,并非盡在數量級上,而是有了很多新的要求和“內容”。
以DeepSeek為例,千億級參數規模的訓練需要萬卡級GPU集群連續運轉數周,而推理階段同樣需要高性能計算資源來保證低延遲響應。同時,AI應用場景變得更加多元化,從智能客服、醫療診斷到自動駕駛、工業質檢,這使得算力需求不再局限于云端超算中心,而是向邊緣計算、企業本地化部署快速延伸。
這些變化催生了兩個趨勢:一是超大規模算力集群需要更高的“算-存-網”協同效率,二是輕量化推理設備必須提供更強的單機性能。
這也與陳振寬的判斷不謀而合,“作為AI時代的能力底座,算力技術也在不斷升級。萬卡、十萬卡級算力集群的出現,要求在超大規模算力集群里,實現‘算存網’能力的高效協同;而模型本地部署的應用潮流,又帶來對大模型一體機單機性能的極致要求;與此同時,液冷技術、異構計算等技術創新也在快速滲透;算力對AI時代發展的重要意義,正在持續增強。”陳振寬說。
因此,在突破性能“極限”方面,聯想深度構建以計算力、存儲力、運載力為核心的AI基礎設施,打造覆蓋AI全場景、性能領先的AI算力產品組合。
而在追求算力效率“極致”方面,聯想將萬全異構智算平臺升級到3.0版本,以及AI推理加速算法集、AI編譯優化器、AI訓推慢節點故障預測與自愈系統、專家并行通信算法四大技術創新,為高效算力提供強大支撐。
這兩條路徑,到底要怎么走?
02
“萬全”之策
從平臺到場景的技術閉環
以DeepSeek為代表的開源大模型迅速崛起,形成的AI普惠化趨勢,本質上是帶來了算力需求的結構性變化:從過去集中在預訓練階段的算力需求,正快速向推理和后訓練環節延伸。
按照聯想中國基礎設施業務群戰略管理部總監黃山的觀察,“截至去年,AI算法的需求主要來源于基礎大模型開發用戶,他們的訴求主要是算力利用率的提升,而今年以DeepSeek為代表的開源大模型讓數以萬計的用戶加入到了AI應用開序列,產生了大量對AI推理和后訓練算力的強烈需求。”
這種需求的躍遷直接催生了更復雜、更多元的算力需求:既要支持千卡級集群的高效訓練,又要滿足企業本地化部署的極致推理性能,還要確保分布式計算的高可用性。這其實是聯想升級萬全異構智算平臺3.0的主要動因。
而更深層次的原因,則源自當前大模型落地面臨三個核心矛盾:
首先是算力效率瓶頸,傳統AI集群的模型浮點利用率(MFU)普遍低于40%,意味著超過一半的算力資源被閑置或浪費;其次是推理性能天花板,單臺服務器承載的并發請求量難以突破千級門檻;最棘手的是分布式系統的穩定性問題,在千卡級訓練中,任何一個GPU的輕微故障都可能導致整個集群效率腰斬。
而萬全異構智算平臺3.0的技術創新直擊這些痛點:
AI推理加速算法集,通過對MMA等新型方法工程實踐并結合自身混合精度量化等方法二次優化,滿足用戶對推理更高吞吐量、更低延時訴求,可將DeepSeek等大模型推理性能提升5-10倍。
AI編譯優化器,采用臨近算子融合等方式簡化計算過程,結合與GPU戰略伙伴成果優化算子,使AI訓練和推理計算開銷降低至少15%。
AI訓推慢節點故障預測與自愈系統,基于三年以上實踐積累的故障特征庫和訓練的故障預測模型,實現百卡秒級、千卡分鐘級、萬卡十分鐘級故障自愈。
專家并行通信算法,針對MoE架構大模型訓推通信問題,在底層核函數層面實現計算與通信高度并行,將推理延遲降低3倍以上,網絡帶寬利用率從50%提升到90%。
事實上,萬全平臺的升級是瞄準了客戶場景的真實需求,所以在行業實踐方面也是成果顯著,比如在東數西算第一大智算樞紐的千卡訓練場景中,將MFU從30%提升至60%;在北京大學的生命科學AI計算大裝置中,提升了異構GPU、NPU的計算效率;在吉利汽車超智融合計算集群中,納管數萬核算力并支持15類以上仿真預測應用;針對模型本地部署的企業AI基礎設施場景,全速運轉滿血版DeepSeek R1 模型極限吞吐量超12,000Tokens/s,不斷刷新性能的“極致”。
這樣的“萬全”才是行業發展的風向標,才是AI普惠化時代最稀缺的基礎設施特質。
03
面向全面AI新場景
“一橫五縱”重構智算體系
IDC最新預測顯示,到2029年中國加速計算市場規模將突破千億美元,其中70%的服務器需求將來自AI負載,這種結構性轉變正重塑整個服務器產業的演進方向。
大模型訓練從集中式走向分布式,推理場景從云端下沉到邊緣,能耗問題從次要考量變為關鍵瓶頸……這一系列的變化,讓企業從追求單純的算力規模,向追求高效、穩定、綠色算力系統轉變。
面對AI浪潮下帶來的全新算力發展趨勢下,聯想堅持“一橫五縱”的部署,在全新推出了聯想萬全異構智算平臺3.0之后,在自身算力全產品線上也開啟了“滿天星”模式的全面升級。從而在AI新場景下不斷涌現的形勢下,重構全新智算體系,并持續引領著行業發展。
恰如聯想中國基礎設施業務群服務器產品部總經理周韜所言,“客戶整個轉化鏈條對算力的需求已超越單一硬件維度,而是涵蓋數據處理、AI訓練、推理應用的全棧算力解決方案。”
聯想敏銳洞察到這些趨勢與需求,針對數據處理場景,聯想新一代數據處理服務器在單一機柜中可實現多達48個計算節點,配置12288個英特爾?志強?6性能核心,并搭配8800MHz MRDIMM內存,大幅提升生成式人工智能性能。配合專利無滴漏不銹鋼盲插系統與航空級防松連接裝置,構建出全液冷高密度計算平臺。
在模型訓練和優化場景,聯想推出一系列AI訓練算力服務器。配置兩顆英特爾?志強?處理器與8塊GPU卡,通過OAM互聯輸出強大算力。面對GPU和CPU功耗不斷提升的問題,聯想采用冷板式CPU/GPU液冷方案,為600瓦以上處理器提供浸沒式液冷技術,助力AI訓練服務器家族實現綠色節能。
在推理應用場景,聯想最新的推理應用算力服務器支持英特爾?至強?6處理器和主流 PCIE GPU處理器,每個CPU核集成英特爾AMX BF16和IP16加速器,與GPU配合默契,甚至可直接調用CPU算力完成小規模推理業務。同時提供 CPU、GPU、內存VR全液冷方案,結合處理器的能效比,可以為客戶帶來2倍性能與4倍性能功耗比。
實際上,這些技術升級,都是基于聯想AI導向的基礎設施“一橫五縱”的布局戰略。“一橫”的不斷提升,也同步伴隨著“五縱”全線產品組合的能力升級。
在計算力層面,針對AI訓練場景,推出聯想問天 WA7880a家族等算力利器;數據處理環節,聯想ThinkSystem SC750 V4服務器高效支撐;推理應用領域,聯想問天WA5480 G5、聯想問天WR5220 G5,以及聯想ThinkSystem SR650 V4、SR650a V4、SR630 V4等服務器,共同構建了強大的算力組合。
在存儲力層面,從聯想問天DXN AI 存儲解決方案、DXN2000系列、DXN 全閃系列,到Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列,再到AIPod DeepSeek一體機,面向全場景支持產品能夠快速落地、滿足本地各行業實際需求。
在運載力層面,聯想憑借RoCE/IB多架構融合及低延遲優化技術,構建起適配不同規模AI算力集群的智能網絡體系。最新發布的高密度400G交換機聯想問天NE8770-64QC,專為AI場景深度定制。同期亮相的多業務核心交換機聯想問天NE7550G-8C與新一代高性能核心交換機聯想問天NE9770G-4C,也為數據網絡性能提升注入強勁動力。
在軟件及超融合領域,聯想重磅升級AIO V6系列產品和聯想問天WX系列虛擬化超融合8.0.2版本,進一步彰顯了聯想超融合產品的卓越實力。
在算力服務方面聯想首次發布算力服務“成本-效能”雙優運營系統,持續助力客戶優化運營效能與成本。其中智能調度引擎與FinOps引擎,可提升集群資源利用率13%,并精準識別58%無效實例,最大化用戶效益。
特別要指出,在綠色算力方面,聯想以液冷技術為核心實現能效躍升:單相浸沒“飛魚”仿生散熱技術,模擬魚類游動姿態優化流體設計,支持下一代600W芯片散熱,最大功耗提升20%;雙循環相變浸沒系統,散熱能力較傳統方案翻倍,系統PUE低至1.035,全球領先。
事實上,從聯想萬全異構智算平臺3.0的升級和聯想“五縱”產品在不同場景下的技術演進,我們更應該關注其背后所折射出來的發展趨勢:
第一,算力供給從粗放走向精準,不再單純追求峰值算力,而是強調每瓦特的實效輸出;第二,技術棧從分離走向融合,需要同時優化計算、存儲、網絡的全棧效能;第三,應用場景從集中式走向分布式,既要支持東數西算級別的超算中心,也要賦能企業本地的輕量化部署。
我們認為,真正的算力革命并不完全取決于芯片,而在于讓每一焦耳能量、每一毫米空間、每一秒時間都發揮極致價值,讓每一分算力都能突破效率的“極限”。而這才是聯想想要定義的智算時代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.