“大模型已經進入下半場。”在前不久的聯想創新科技大會(Lenovo Tech World 2025)上,中國信通院云計算與大數據研究所所長何寶宏做出了如此論斷。
中國信通院云計算與大數據研究所所長何寶宏
轉場的關鍵時間點是2024年12月。從那以后,深度求索(DeepSeek)接連發布了DeepSeek-V3基座大模型、DeepSeek-R1推理模型、Janus-Pro多模態大模型,達到了OpenAI同類型模型的同等水平,訓練成本卻只有5%,運行成本更是只有3%。
如果說大模型的上半場是卷算力的狂飆突進的話,下半場則轉入了效率為先的精耕細作。由于外部環境的變化,這種風格的切換,在中國市場尤甚。而這,當然也給中國的AI基礎設施供應商帶來了全新的挑戰。
新的賽場、新的規則、新的范式,誰能抓住新的機會?
最好的時代
正如何寶宏所言,大模型的下半場,最大的變化就是在上半場已經發揚光大的、追求“高性能”的高端賽道之外,又出現了一條追求“高性價比”的普惠賽道。
由于普惠賽道的出現,使得AI基礎設施市場出現了“杰文斯悖論”:當技術進步提升資源利用效率后,資源消耗量非但未減少,反而進一步增長。
這是最好的時代。IDC數據顯示,2024年全球人工智能服務器市場規模預計為1251億美元,2025年將增至1587億美元,2028年有望達到2227億美元,其中生成式人工智能服務器占比將從2025年的29.6%提升至2028年的37.7%。
中國市場的情況還要更為樂觀。同樣是根據IDC的預測,2023-2028年期間,中國智能算力規模的五年年復合增長率預計達到46.2%,通用算力規模預計達到18.8%。較上一版本的預期值33.9%和16.6%,均有顯著提升。
最壞的時代
這也是最壞的時代。如今,由于大模型應用客戶需求的巨大變化,也給所有的中國AI基礎設施供應商提出了新的要求,他們必須盡快適應巨變并做到“四化”:
1.多元化:由于人工智能在國內的應用場景較為復雜,同時受到地緣、供應鏈等因素影響,人工智能芯片類型與廠商呈現出多元化的趨勢,GPU、CPU、DSA、ASIC等多種芯片被廣泛應用在人工智能的訓練與推理中,不少場景實現了多類型芯片的混合使用。在芯片廠商方面,諸多國內廠商開始嶄露頭角,提供了大規模的算力集群方案。
2.服務化:為滿足不同的算力需求,人工智能算力服務不斷革新。生成式人工智能IaaS服務可為企業按需提供容量,支持靈活的模型訓練和內容生成;算力租賃使用戶按需租賃計算資源,降低成本并提高靈活性;算力共享通過資源池化和動態調度,實現資源共享和成本分攤;智算中心集成高性能的計算、存儲和網絡資源,提供高可用的一站式服務,支持大規模人工智能應用。
3.場景化:人工智能算力基礎設施的多樣化,旨在應對不同行業和應用場景的多樣化需求。例如,金融行業需要高安全性和低延遲的計算環境,醫療行業需要處理大量醫學影像數據,制造業需要實現實時生產優化,互聯網行業需要處理大規模用戶數據和內容推薦。這些需求對底層架構提出了高性能、低延遲、高安全性、可擴展性和成本效益等新要求。
4.綠色化:在雙碳目標的指引下,全國范圍內對綠色發展的重視程度和投資力度不斷加大。政策上來說,一方面國家對于數據中心的新建審批及能耗要求上持續趨嚴;另一方面也會通過諸如電費分段計價等引導數據中心綠色化發展。
這樣的新時代,中國的AI基礎設施供應商該如何應對?
“四策”對“四化”
針對AI基礎設施的“四化”,中國的AI基礎設施供應商們同樣也在行動起來,以“四策”來應對。
1.支持異構計算。如今在全球,異構計算大行其道;在中國市場,這個趨勢則更加明顯。IDC預測,到2029年中國加速服務器市場規模將超過千億美元,其中非GPU服務器市場規模將接近50%。即使是在超過市場規模一半的GPU服務器市場,由于中國特有的環境,NVIDIA不再一枝獨秀,而是出現了天數智芯、沐曦、摩爾線程、華為、燧原科技、壁仞科技、海光信息、寒武紀等諸多國產芯片廠商。對于中國AI基礎設施供應商來說,關鍵就是要做好這些芯片廠商的適配。
2.算存網齊頭并進。對于如今的AI基礎設施提供商來說,計算、存儲、網絡能力必須同時提升。他們必須采用先進的計算架構,提升單計算節點性能,提高計算效率;還需要優化內存層次結構,減少數據傳輸延遲,增強數據處理速度;還得利用智能調度算法合理分配計算任務,優化集群管理方面,確保資源高效利用。面對智算客戶的時候,他們還需要交付算存網一站式解決方案。
3.打造場景化產品。當然,AI基礎設施提供商更需要針對大模型的各種應用場景,打造針對性的產品。例如,針對目前高速增長的推理場景,推出更適合推理的AI服務器;針對國內客戶希望盡快用上滿血版DeepSeek大模型并進行本地化部署的場景,發布DeepSeek一體機產品。
4.普及綠色技術。為了盡快實現雙碳目標,業界積極探索破局之道。其中,液冷技術作為關鍵突破,可以顯著提升計算密度,降低數據中心的總能耗。通過全棧液冷方案,將推動算力設施在計算節點層面、機柜層面以及數據中心層面的綠色化和低碳化轉型。
六大創新技術
從聯想創新科技大會上,我們已經看到,聯想已經為下半場做好了充足的準備。
面對AI技術的持續創新和用戶需求的快速變化,聯想從算力性能與效能、核心算法、算力服務等多個維度再次發布六大創新技術:
1.AI推理加速算法集。針對大模型引發的推理需求爆發,AI推理加速算法集結合了MLA-多頭潛在注意力機制、投機推理等業界新興方法,以及聯想長期優化的混合精度量化、分布式并行等算法,為推理加速打造強大的工具箱,助力用戶突破推理性能極限,實現AI推理性能提升5-10倍。同時,相對于業界最優的社區方案,聯想的AI推理性能保持20%以上的優勢。
2.AI編譯優化器。針對各個行業對大模型后訓練與推理結合的前沿需求,AI編譯優化器在訓練或推理過程中能夠自動化替換高效算子、優化計算路徑,并進行自動重編譯,大幅簡化復雜的AI計算過程,在提升AI訓推效率的同時,還實現了降低訓練和推理計算開銷各15%以上。
3.AI訓推慢節點故障預測與自愈系統。面對大規模AI計算集群的運維需求,該系統通過對集群異步實時狀態監測與全面故障分析,以AI預測AI故障,在節點性能下降前發現問題,并自動化解決故障,實現故障自愈時間控制在百卡秒級、千卡分鐘級、萬卡十分鐘級。
4.專家并行通信算法。面向AI計算集群不斷提升的網絡能力需求,該算法通過對通信計算原語、訪存方式和網絡路由算法的協同優化,實現了推理延時降低3倍以上,網絡帶寬利用率從50%提升至90%。
5.“飛魚”仿生散熱設計與浸沒式制冷系統。在液冷領域,該系統成功突破了散熱器性能瓶頸,最大支持功耗提升20%;同時,聯想還發布了“雙循環”相變浸沒制冷系統,通過創新的外接單相換熱器設計,實現散熱能力較傳統方案翻倍提升,系統PUE低至1.035。
6.算力服務“成本-效能”雙優運營系統。該系統從服務服務方面幫助提升用戶運營效能,優化運營成本。
在支持異構計算方面,聯想也做得足夠深入。“DeepSeek大模型也好,通義千問3也好,它們的滿血版在一些國產GPU上都已經跑通了,不僅僅是跑通,還做了調優。”聯想中國基礎設施業務部戰略管理部總監黃山透露,聯想與8大國產GPU廠商開展了廣泛的合作,甚至深入到了算子級別。
聯想中國基礎設施業務部戰略管理部總監黃山
兩大重磅升級
除了發布六大創新技術之外,聯想還宣布了兩大重磅升級:
第一大重磅升級是發布了聯想萬全異構智算平臺3.0版本,新增了AI推理加速算法集、AI編譯優化器、AI訓推慢節點故障與自愈系統、專家并行通信算法等四大突破性創新技術,直擊大模型應用落地的關鍵痛點,從而為DeepSeek R1/V3等千億級大模型提供更高效的運行環境,并不斷突破算力效率極限。
在該平臺的加持下,實測單機部署DeepSeek 671B模型吞吐突破12000 tokens/s,在極限場景下更是創下37000+ tokens/s的行業新紀錄,充分展示了聯想萬全異構智算平臺的技術領先性。
第二大重磅升級,是聯想AI基礎設施從計算力、存儲力到運載力的全線升級:
1.計算力。如今,隨著AI應用進入百花齊放的后訓練時代,聯想提出打造“更強大、更穩定、更高效、更綠色”的算力基礎設施,并針對業務數據到智能業務全過程的三個關鍵應用場景——數據處理、模型訓練和推理應用分別進行優化,形成數據處理算力服務器、AI訓練算力服務器、推理應用算力服務器三大家族。
在這次聯想創新科技大會上,聯想重磅推出基于英特爾?至強?6處理器的全新算力服務器家族,包括聯想問天 WA7880a家族在內的AI訓練算力服務器家族、聯想ThinkSystem SC750 V4在內的數據處理算力服務器家族;聯想問天 WA5480 G5、WR5220 G5、聯想ThinkSystem SR650 V4、SR650a V4、SR630 V4在內的推理應用算力服務器家族。面向不同的AI應用場景,全新算力服務器家族進行了針對性優化,充分釋放AI服務器的算力潛能。
2.存儲力。聯想最新發布了凌拓全新存儲產品家族,以及具備本地自研、自有知識產權、自主可控三大特征的聯想存儲新品牌聯想問天。聯想凌拓從數據管理到存儲架構均進行了全方位升級,包括聯想問天DXN AI 存儲解決方案、DXN2000系列、DXN 全閃系列,Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列、AIPod DeepSeek一體機在內的聯想凌拓全新存儲產品家族,滿足AI存儲時代各個行業的需求。
3.運載力。聯想通過RoCE/IB多架構融合及低延遲優化技術,構建了覆蓋多種規模AI算力集群的智能網絡體系。其數據網絡產品兼容多種主流AI網絡架構。最新發布的高密度400G交換機聯想問天NE8770-64QC專為AI場景深度優化。同步亮相的還包括兩款戰略級新品——面向下一代融合網絡的多業務核心交換機聯想問天NE7550G-8C,以及支持超大規模組網的新一代高性能核心交換機聯想問天NE9770G-4C。
此外,在軟件及超融合領域,聯想還升級了AIO V6系列產品和聯想問天WX系列虛擬化超融合8.0.2版本。聯想AIO超融合解決方案已實現2000+企業級客戶部署,累計支撐超20000個核心業務系統平穩運行。
從以上六大創新技術和兩大重磅升級可以看出,在應對大模型下半場的“四策”(支持異構計算、算存網齊頭并進、打造場景化產品、普及綠色技術)上,聯想已經走在了行業的最前列。
成為領軍者
新的時代,也意味著新的機會。聯想集團副總裁、中國基礎設施業務群總經理陳振寬表示:“在各種創新疊加下,算力已不再僅僅是AI落地的底座,相反,正作為新興的技術引擎推動中國AI新時代的落地。”
聯想集團副總裁、中國基礎設施業務群總經理陳振寬
如今的聯想,已經開始收獲果實。眾所周知,在AI基礎設施當中,最主力的產品就是AI服務器。聯想中國基礎設施業務群服務器產品部總經理周韜透露,去年聯想服務器在中國市場創造了180%的驚人增速。究其原因,就是在AI服務器市場獲得了大豐收。“去年得益于AI的大發展,我們在互聯網、電信運營商、制造業、智算中心等領域都有比較大的突破。”
聯想中國基礎設施業務群服務器產品部總經理周韜
就在前不久,聯想發布了2024/2025財年年報。其中,基礎設施方案業務集團(ISG)表現優異,營收同比暴漲了63%,并在下半財年成功扭虧為盈。
如今,六大創新技術、兩大重磅升級的發布,將進一步夯實聯想在AI基礎設施領域的基礎,并向著廣為廣闊的市場進發。周韜表示,在互聯網這個最重要的細分市場,聯想除了繼續擴大在Tier1的市場份額之外,還要進軍Tier2。
面向AI的新十年,聯想已經開啟創業5.0時代。聯想集團董事長兼CEO楊元慶表示,超級智能體時代,聯想將致力于助力合作伙伴率先擁抱AI,攜手把握這波機遇,深挖并服務好客戶的人工智能新需求,成為行業的領軍者。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.