過去幾天,中美經貿關系發生著極速變化。而變化的主基調是,美國希望從貿易戰的短期沖撞,重新回到長期進行,同時也更加殘酷的科技絞殺上。
5月12日中美雙方發布聯合聲明,決定大幅下降關稅。緊隨其后的5月14日,美國政府亮出了瞄準中國AI的“獠牙”,美國商務部工業與安全局(BIS)突然宣布,即日起在全球范圍內禁用中國先進集成電路。
美國出招絕非無的放矢,就在一個月前,華為發布了CloudMatrix384 超節點,該技術通過384張卡構建超節點集群,超級云服務器,最高提供300Pflops的算力規模。這意味著,美國通過N卡禁售來限制中國AI算力發展的技術圍堵,或將被徹底打破。
從DeepSeek的算法層突破,到CloudMatrix384的算力層突圍,中國AI正以系統性創新,彌補單芯片制程差距,美國發現其“卡脖子”邏輯正在失效。
接下來,美國必然會進一步打壓中國AI的任何生存空間,更證明了模型自主與算力自強的重要性。昇騰云算力就是出路,就是防線。
5月16日,華為云AI峰會中,華為云副總裁黃瑾又進一步披露了更多CloudMatrix 384 超節點的創新技術細節。CloudMatrix 384 超節點持續壯大,把“殺不死你的必會讓你更強大”寫進現實。
過去的8年里,單卡硬件的算力增長了40倍,但是節點內的總線帶寬只增長了9倍,跨節點的網絡帶寬只增長了4倍。集群網絡通信成為當前大模型訓練和推理的最大挑戰,也是科技競逐的焦點之一。
514美國禁令的恐懼根源,或許就在于昇騰的架構創新,破解了網絡帶寬拓展比單卡算力增長更滯后的技術難題,使CloudMatrix384 實現了集群穩定性,中國AI的算力長城,正在CloudMatrix384的基石上崛起。
具體來說,CloudMatrix 384 超節點實現了MatrixLink超節點網絡服務。這項技術能夠通過擴展訓練集群實現大模型的訓推性能提升20%,從而在網絡側滿足最為苛刻的模型推訓需求。
突破了內外部通信瓶頸的CloudMatrix 384,實現了AI算力資源的集約式高效利用,以及超大規模AI訓練集群可云上獲取,支撐昇騰AI云服務以更高的算力利用率、更高的算力可用度、更高的吞吐率以及更低的成本,為千行百業智能化提供充沛且普惠的云上AI算力服務,從而為中國AI算力爭取到了長足的領先空間與發展窗口。
更值得一提的是,當產業從萬卡向十萬卡集群演進,超節點修筑AI算力長城的腳步也并未停下。華為云AI峰會上,華為云公布了CloudMatrix 384 超節點的創新技術優勢。
昇騰云和CloudMatrix 384 超節點,實現了MoE親和、以網強算、以存強算、長穩可靠、朝推夜訓、即開即用六大科技創新,這些創新如同“技術磚石”,穩固支撐AI 產業發展更進一步,成為AI時代理想的基礎設施。
為什么這么說?這就要提到各行各業的AI訓推需求,要求云上算力,豎起三道重要的防線:
一是算力充沛的性能防線。
正如杰文斯悖論所說的,Deepseek雖然降低了單個模型對算力的需求,但隨著應用AI的用戶越來越多,算力資源的總需求量非但沒有減少,反而進一步增加了。這一背景下,國產AI算力面臨雙重困境,一是單卡性能落后英偉達最新產品,二是多卡集群會“打群架”,堆卡但不增效。而提升算力集群的資源利用率,需要存儲(存力)、網絡(運力)的共同做功,來適配最新的計算架構。
簡單來說,在DeepSeek的推動下,MoE已經成為主流大模型共同追求的實踐路徑,所謂MoE架構,就是從GPT4這樣的少量大專家的超大規模參數模型,變成了大量小專家的模式,在每張卡上都部署多個小專家。但傳統架構下,MoE模型容易因為專家負載不均、AllToAll通信延遲等,導致算力浪費,降低資源利用率。
CloudMatrix 384 超節點的分布式推理平臺可以說是專為MoE大模型而生,具有MoE親和的技術特性。對比一卡多專家的“小作坊模式”,超節點通過高速互聯總線,降低跨機通信損耗,從而實現一卡一專家高效分布式推理,單卡的MoE計算和通信效率都大幅提升。通過聯接力打破單點算力的性能制約,最大限度地釋放算力共振的能力,也體現了超節點以網強算的技術優勢。
除了網絡通訊,顯存容量不高也會制約MoE模型的開發。大模型推理的不同階段,對計算/訪存的資源需求其實并不一致,比如prefill階段需要高算力,而decode階段需要高防存,但傳統“存算綁定”的模式不夠靈活,就限制了資源利用和性能吞吐。
解決MoE模型的“存力”難題,華為云首創了EMS彈性內存存儲,通過內存池化技術,實現顯存和算力解綁。一方面,用EMS替代NPU中的顯存,可使得首Token時延降低,最高降幅可達80%;另一方面,當NPU的顯存不足時,EMS獨立擴容,不必再通過堆NPU以獲得更多內存。同時,EMS還支持算力卸載,這也使得系統吞吐量提升100%。
提高運力以網強算、提高存力以存強算,合力提高綜合計算性能,從而為各行各業應用Deepseek等MoE模型,提供澎湃算力,正是CloudMatrix 384 所筑起的性能防線。
二是算力可靠的穩定防線。
解決了性能問題,接下來還解決多卡集群“打群架”的可靠性問題。千卡乃至萬卡級算力集群的運維挑戰,已經成為算力的關鍵瓶頸。集群規模增大,故障頻發,導致訓練中斷,模型開發團隊不得不頻繁執行檢查點checkpoint保存操作,這不僅延長了大模型訓練周期,還會導致計算資源浪費,開發成本增高。
構建高可靠性的智能運維體系,已成為云上算力長城的必要職責。對此,華為開發了昇騰云腦運維“1-3-10”標準,即1分鐘感知、3分鐘定界、10分鐘內恢復,從而具備了保障長穩大模型訓練的能力。
也意味著,中國AI有了更具韌性的算力基礎設施。
三是算力普惠的成本防線。
DeepSeek到來之后,AI推理側的任務激增,而訓練側的算力需求則在下降。對于云服務商來說,針對用戶訪問的潮汐特征(日間推理峰值遠遠大于夜間),做好算力資源的動態平衡,可以進一步優化資源利用效率,避免算力閑置,這樣能夠實現綜合成本最優,最終讓成本優勢變成價格優勢、普惠能力,為行業和用戶提供像“水電”一樣實時、普惠、靈活的算力。
目前,華為云已經在全國三大樞紐數據中心——烏蘭察布、貴安和蕪湖完成了超節點規模布局,支持百TB級的帶寬互聯,10毫秒時延圈覆蓋全國19個城市群,讓行業用戶不需要自建數據中心,可以像水電氣一樣,第一時間享受到即開即用的AI算力資源。
同時,華為云通過“訓推共池”“靈活調度”兩大技術,實現朝推夜訓,白天進行模型推理,晚上閑時進行模型訓練,實現了全國超節點算力資源的“錯峰用電”,算力資源利用率可提升30%以上。
通過性能、穩定、普惠的三道防線,華為云CloudMatrix 384 超節點可以更好地守護各行各業的智能化需求,成為中國AI巍然挺立的堅實基礎設施。
正如長城的出現,守護了古代中國的國土安全。超節點通過多項技術特征的加持,讓以卡為單位的分散式AI算力,走向了集中式AI計算底座,成為真正意義上的下一代AI基礎設施,一座堅固的云上算力長城。
更宏觀的角度來看,超節點技術不僅僅是一項工程性創新,它還徹底改變了芯片制造領域的技術對壘格局。
英偉達最新推出了基于第五代NVLink技術的NVL72,并且將其局限在自身生態當中,客觀上構成了對中國AI算力的發展制約。但實際上,我們真正需要的不是芯片本身,而是算力。通過重新定義AI基礎設施,超節點技術為AI算力的供給提供了前所未有的澎湃動力,進而突破了被芯片制程鎖死的AI進程。
在當前國際博弈的大背景下,超節點的出現,正是中國應對挑戰、把握AI機遇的有力證明。
除了超節點之外,華為云還在大模型、AI生態等領域進行了持續升級,持續迭代的盤古大模型,已經在30多個行業、400多個場景中應用,在制造、金融、政務、醫療、制藥、汽車、氣象等七個行業保持市場規模領先。
在算力底座、資源調度、推理服務及集群可靠四個方面,華為云全面升級昇騰AI云服務,協助客戶進行模型的開發、訓練、托管和應用。目前,昇騰AI云服務已適配包含DeepSeek在內的160多個第三方大模型,并面向政府、金融、互聯網、零售等行業服務600多家創新先鋒企業。
就像美國的貿易沖擊,掀不翻中國經濟的汪洋大海,美國的一紙禁令,也禁不了昇騰這座云上AI算力長城。
當山姆·奧特曼在國會參議院建議要加大AI基礎設施投入的時候,昇騰AI云服務已經通過超節點的建設,以及更多技術、產品、資源的匯集,為接下來的中國AI應用大爆發做好了準備——下一代AI基礎設施,就是中國AI走向強大的內因。
2025年5月16日,被制裁整整六年的華為依舊在茁壯生長,并且在這些年里拿出了MetaERP、數據庫、軟硬件工具鏈等等核心技術突破。如今超節點的加入,讓這六年中所有的故事都更加熠熠生輝。
華為的故事在反復提醒著一件事:我們除了強大,無路可走。
曾幾何時,先進AI算力必然來自西方,被認為是一個“鐵律”。但CloudMatrix 384 超節點的突破,不僅證明了中國可以有自主化的可靠AI算力基礎設施,更證明了中國AI算力可以實現系統性領先,甚至可以改變企業用戶的AI算力獲取方式,給全球AI一個更好的算力選擇。
近幾個月,所有國際新聞都在提醒我們,只有當自身足夠強大,能夠給自己和他人提供選擇,我們才有話語權,才有交流和談判的空間,才能為多元、開放與平等添加一份保障。
從這個意義來說,CloudMatrix 384 超節點就如同AI世界中的長城。它佇立在那里,確保了全球AI的自由勃發與平等成長。
巍巍昆侖,翼翼長城。一些源于中國文化的智慧,一些來自中國科技的態度,此刻正無言流淌在奔騰的AI算力中,相信它們很快會被世界讀懂。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.