網易首頁 > 網易號 > 正文申請入駐

大模型下半場的比拼，為什么勝出的是聯想？

2025-05-28 18:36:09　來源: 老冀談科技

北京舉報

分享至

“大模型已經進入下半場。”在前不久的聯想創新科技大會（Lenovo Tech World 2025）上，中國信通院云計算與大數據研究所所長何寶宏做出了如此論斷。

中國信通院云計算與大數據研究所所長何寶宏

轉場的關鍵時間點是2024年12月。從那以后，深度求索（DeepSeek）接連發布了DeepSeek-V3基座大模型、DeepSeek-R1推理模型、Janus-Pro多模態大模型，達到了OpenAI同類型模型的同等水平，訓練成本卻只有5%，運行成本更是只有3%。

如果說大模型的上半場是卷算力的狂飆突進的話，下半場則轉入了效率為先的精耕細作。由于外部環境的變化，這種風格的切換，在中國市場尤甚。而這，當然也給中國的AI基礎設施供應商帶來了全新的挑戰。

新的賽場、新的規則、新的范式，誰能抓住新的機會？

最好的時代

正如何寶宏所言，大模型的下半場，最大的變化就是在上半場已經發揚光大的、追求“高性能”的高端賽道之外，又出現了一條追求“高性價比”的普惠賽道。

由于普惠賽道的出現，使得AI基礎設施市場出現了“杰文斯悖論”：當技術進步提升資源利用效率后，資源消耗量非但未減少，反而進一步增長。

這是最好的時代。IDC數據顯示，2024年全球人工智能服務器市場規模預計為1251億美元，2025年將增至1587億美元，2028年有望達到2227億美元，其中生成式人工智能服務器占比將從2025年的29.6%提升至2028年的37.7%。

中國市場的情況還要更為樂觀。同樣是根據IDC的預測，2023-2028年期間，中國智能算力規模的五年年復合增長率預計達到46.2%，通用算力規模預計達到18.8%。較上一版本的預期值33.9%和16.6%，均有顯著提升。

最壞的時代

這也是最壞的時代。如今，由于大模型應用客戶需求的巨大變化，也給所有的中國AI基礎設施供應商提出了新的要求，他們必須盡快適應巨變并做到“四化”：

1.多元化：由于人工智能在國內的應用場景較為復雜，同時受到地緣、供應鏈等因素影響，人工智能芯片類型與廠商呈現出多元化的趨勢，GPU、CPU、DSA、ASIC等多種芯片被廣泛應用在人工智能的訓練與推理中，不少場景實現了多類型芯片的混合使用。在芯片廠商方面，諸多國內廠商開始嶄露頭角，提供了大規模的算力集群方案。

2.服務化：為滿足不同的算力需求，人工智能算力服務不斷革新。生成式人工智能IaaS服務可為企業按需提供容量，支持靈活的模型訓練和內容生成；算力租賃使用戶按需租賃計算資源，降低成本并提高靈活性；算力共享通過資源池化和動態調度，實現資源共享和成本分攤；智算中心集成高性能的計算、存儲和網絡資源，提供高可用的一站式服務，支持大規模人工智能應用。

3.場景化：人工智能算力基礎設施的多樣化，旨在應對不同行業和應用場景的多樣化需求。例如，金融行業需要高安全性和低延遲的計算環境，醫療行業需要處理大量醫學影像數據，制造業需要實現實時生產優化，互聯網行業需要處理大規模用戶數據和內容推薦。這些需求對底層架構提出了高性能、低延遲、高安全性、可擴展性和成本效益等新要求。

4.綠色化：在雙碳目標的指引下，全國范圍內對綠色發展的重視程度和投資力度不斷加大。政策上來說，一方面國家對于數據中心的新建審批及能耗要求上持續趨嚴；另一方面也會通過諸如電費分段計價等引導數據中心綠色化發展。

這樣的新時代，中國的AI基礎設施供應商該如何應對？

“四策”對“四化”

針對AI基礎設施的“四化”，中國的AI基礎設施供應商們同樣也在行動起來，以“四策”來應對。

1.支持異構計算。如今在全球，異構計算大行其道；在中國市場，這個趨勢則更加明顯。IDC預測，到2029年中國加速服務器市場規模將超過千億美元，其中非GPU服務器市場規模將接近50%。即使是在超過市場規模一半的GPU服務器市場，由于中國特有的環境，NVIDIA不再一枝獨秀，而是出現了天數智芯、沐曦、摩爾線程、華為、燧原科技、壁仞科技、海光信息、寒武紀等諸多國產芯片廠商。對于中國AI基礎設施供應商來說，關鍵就是要做好這些芯片廠商的適配。

2.算存網齊頭并進。對于如今的AI基礎設施提供商來說，計算、存儲、網絡能力必須同時提升。他們必須采用先進的計算架構，提升單計算節點性能，提高計算效率；還需要優化內存層次結構，減少數據傳輸延遲，增強數據處理速度；還得利用智能調度算法合理分配計算任務，優化集群管理方面，確保資源高效利用。面對智算客戶的時候，他們還需要交付算存網一站式解決方案。

3.打造場景化產品。當然，AI基礎設施提供商更需要針對大模型的各種應用場景，打造針對性的產品。例如，針對目前高速增長的推理場景，推出更適合推理的AI服務器；針對國內客戶希望盡快用上滿血版DeepSeek大模型并進行本地化部署的場景，發布DeepSeek一體機產品。

4.普及綠色技術。為了盡快實現雙碳目標，業界積極探索破局之道。其中，液冷技術作為關鍵突破，可以顯著提升計算密度，降低數據中心的總能耗。通過全棧液冷方案，將推動算力設施在計算節點層面、機柜層面以及數據中心層面的綠色化和低碳化轉型。

六大創新技術

從聯想創新科技大會上，我們已經看到，聯想已經為下半場做好了充足的準備。

面對AI技術的持續創新和用戶需求的快速變化，聯想從算力性能與效能、核心算法、算力服務等多個維度再次發布六大創新技術：

1.AI推理加速算法集。針對大模型引發的推理需求爆發，AI推理加速算法集結合了MLA-多頭潛在注意力機制、投機推理等業界新興方法，以及聯想長期優化的混合精度量化、分布式并行等算法，為推理加速打造強大的工具箱，助力用戶突破推理性能極限，實現AI推理性能提升5-10倍。同時，相對于業界最優的社區方案，聯想的AI推理性能保持20%以上的優勢。

2.AI編譯優化器。針對各個行業對大模型后訓練與推理結合的前沿需求，AI編譯優化器在訓練或推理過程中能夠自動化替換高效算子、優化計算路徑，并進行自動重編譯，大幅簡化復雜的AI計算過程，在提升AI訓推效率的同時，還實現了降低訓練和推理計算開銷各15%以上。

3.AI訓推慢節點故障預測與自愈系統。面對大規模AI計算集群的運維需求，該系統通過對集群異步實時狀態監測與全面故障分析，以AI預測AI故障，在節點性能下降前發現問題，并自動化解決故障，實現故障自愈時間控制在百卡秒級、千卡分鐘級、萬卡十分鐘級。

4.專家并行通信算法。面向AI計算集群不斷提升的網絡能力需求，該算法通過對通信計算原語、訪存方式和網絡路由算法的協同優化，實現了推理延時降低3倍以上，網絡帶寬利用率從50%提升至90%。

5.“飛魚”仿生散熱設計與浸沒式制冷系統。在液冷領域，該系統成功突破了散熱器性能瓶頸，最大支持功耗提升20%；同時，聯想還發布了“雙循環”相變浸沒制冷系統，通過創新的外接單相換熱器設計，實現散熱能力較傳統方案翻倍提升，系統PUE低至1.035。

6.算力服務“成本-效能”雙優運營系統。該系統從服務服務方面幫助提升用戶運營效能，優化運營成本。

在支持異構計算方面，聯想也做得足夠深入。“DeepSeek大模型也好，通義千問3也好，它們的滿血版在一些國產GPU上都已經跑通了，不僅僅是跑通，還做了調優。”聯想中國基礎設施業務部戰略管理部總監黃山透露，聯想與8大國產GPU廠商開展了廣泛的合作，甚至深入到了算子級別。

聯想中國基礎設施業務部戰略管理部總監黃山

兩大重磅升級

除了發布六大創新技術之外，聯想還宣布了兩大重磅升級：

第一大重磅升級是發布了聯想萬全異構智算平臺3.0版本，新增了AI推理加速算法集、AI編譯優化器、AI訓推慢節點故障與自愈系統、專家并行通信算法等四大突破性創新技術，直擊大模型應用落地的關鍵痛點，從而為DeepSeek R1/V3等千億級大模型提供更高效的運行環境，并不斷突破算力效率極限。

在該平臺的加持下，實測單機部署DeepSeek 671B模型吞吐突破12000 tokens/s，在極限場景下更是創下37000+ tokens/s的行業新紀錄，充分展示了聯想萬全異構智算平臺的技術領先性。

第二大重磅升級，是聯想AI基礎設施從計算力、存儲力到運載力的全線升級：

1.計算力。如今，隨著AI應用進入百花齊放的后訓練時代，聯想提出打造“更強大、更穩定、更高效、更綠色”的算力基礎設施，并針對業務數據到智能業務全過程的三個關鍵應用場景——數據處理、模型訓練和推理應用分別進行優化，形成數據處理算力服務器、AI訓練算力服務器、推理應用算力服務器三大家族。

在這次聯想創新科技大會上，聯想重磅推出基于英特爾?至強?6處理器的全新算力服務器家族，包括聯想問天 WA7880a家族在內的AI訓練算力服務器家族、聯想ThinkSystem SC750 V4在內的數據處理算力服務器家族；聯想問天 WA5480 G5、WR5220 G5、聯想ThinkSystem SR650 V4、SR650a V4、SR630 V4在內的推理應用算力服務器家族。面向不同的AI應用場景，全新算力服務器家族進行了針對性優化，充分釋放AI服務器的算力潛能。

2.存儲力。聯想最新發布了凌拓全新存儲產品家族，以及具備本地自研、自有知識產權、自主可控三大特征的聯想存儲新品牌聯想問天。聯想凌拓從數據管理到存儲架構均進行了全方位升級，包括聯想問天DXN AI 存儲解決方案、DXN2000系列、DXN 全閃系列，Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列、AIPod DeepSeek一體機在內的聯想凌拓全新存儲產品家族，滿足AI存儲時代各個行業的需求。

3.運載力。聯想通過RoCE/IB多架構融合及低延遲優化技術，構建了覆蓋多種規模AI算力集群的智能網絡體系。其數據網絡產品兼容多種主流AI網絡架構。最新發布的高密度400G交換機聯想問天NE8770-64QC專為AI場景深度優化。同步亮相的還包括兩款戰略級新品——面向下一代融合網絡的多業務核心交換機聯想問天NE7550G-8C，以及支持超大規模組網的新一代高性能核心交換機聯想問天NE9770G-4C。

此外，在軟件及超融合領域，聯想還升級了AIO V6系列產品和聯想問天WX系列虛擬化超融合8.0.2版本。聯想AIO超融合解決方案已實現2000+企業級客戶部署，累計支撐超20000個核心業務系統平穩運行。

從以上六大創新技術和兩大重磅升級可以看出，在應對大模型下半場的“四策”（支持異構計算、算存網齊頭并進、打造場景化產品、普及綠色技術）上，聯想已經走在了行業的最前列。

成為領軍者

新的時代，也意味著新的機會。聯想集團副總裁、中國基礎設施業務群總經理陳振寬表示：“在各種創新疊加下，算力已不再僅僅是AI落地的底座，相反，正作為新興的技術引擎推動中國AI新時代的落地。”

聯想集團副總裁、中國基礎設施業務群總經理陳振寬

如今的聯想，已經開始收獲果實。眾所周知，在AI基礎設施當中，最主力的產品就是AI服務器。聯想中國基礎設施業務群服務器產品部總經理周韜透露，去年聯想服務器在中國市場創造了180%的驚人增速。究其原因，就是在AI服務器市場獲得了大豐收。“去年得益于AI的大發展，我們在互聯網、電信運營商、制造業、智算中心等領域都有比較大的突破。”

聯想中國基礎設施業務群服務器產品部總經理周韜

就在前不久，聯想發布了2024/2025財年年報。其中，基礎設施方案業務集團（ISG）表現優異，營收同比暴漲了63%，并在下半財年成功扭虧為盈。

如今，六大創新技術、兩大重磅升級的發布，將進一步夯實聯想在AI基礎設施領域的基礎，并向著廣為廣闊的市場進發。周韜表示，在互聯網這個最重要的細分市場，聯想除了繼續擴大在Tier1的市場份額之外，還要進軍Tier2。

面向AI的新十年，聯想已經開啟創業5.0時代。聯想集團董事長兼CEO楊元慶表示，超級智能體時代，聯想將致力于助力合作伙伴率先擁抱AI，攜手把握這波機遇，深挖并服務好客戶的人工智能新需求，成為行業的領軍者。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.