99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

華為的一場信心之戰

0
分享至


圖片系AI生成

“信心,比黃金和貨幣更重要。”

2008年經濟危機之時,金融風暴席卷全球,來勢很猛、速度很快,使西方各大國無不疲于奔命,雖然采取了多種措施救市,提振本國經濟,無奈效果不佳。

“在經濟困難面前,信心比黃金和貨幣更重要。”中國發聲并挺身而出,站在了應對金融危機的最前沿。

此時此刻,恰如彼時彼刻。無論是宏觀經濟環境的封鎖,還是世界產業鏈的逆全球化,企業像是時代海洋里的一葉扁舟,努力地找尋方向,努力地讓自己不至于頃刻翻覆。

華為可能是最有感觸的一家,一方面,本次華為被置于戰場前線,受到了最為猛烈的炮火轟擊;另一方面,華為上一次嚴重危機,正是2008年經濟危機所造就。

經歷過危機的老華為人有些熟悉,同樣是在公司保持連年增長的勢頭上,然后突然發生黑天鵝事件,華為的應對也有一些相似,大致的三部曲可以理解為,先聚焦主業,強調利潤和現金流;再激活組織活力,讓能打糧食的人到一線;最后也是最關鍵的一步,創新致勝,確保自己的創新跟上時代。

2022年,華為創始人任正非在內部講話中提到,如果按計劃在2025年我們會有一點點希望,那么我們要先想辦法度過這三年艱難時期,生存基點要調整到以現金流和真實利潤為中心,不能再僅以銷售收入為目標。

到了2024年,華為實現全球銷售收入8621億元,同比增長22.4%,創下2021年之后的新高,凈利潤626億元,經營收入開始恢復。

至此為止,華為還不能說完成度過危機的三部曲。任正非曾提到,“中國99%的公司可以與美國合作,他們沒有受到制裁,他們的芯片算力比我們的高,他們能買到的東西比我們好。在這樣的條件下,未來幾年我們能不能為生存活下去?我們還在掙扎中,內部還在講怎么克服很多困難。”

自2019年5月16日開始,華為連續幾年遭遇制裁,烈度不斷升級,耗費了大量的人力、物力、財力恢復業務連續性,不止是為了確保基本的經營,更是要在美國封禁最嚴苛的領域蹚出一條路。

華為依舊處于危機之中,如果不能在AI算力領域成為世界第二極,那么華為逃不過這場慢性衰落,可能在國內有足夠的生存空間,但在國際市場失去競爭力,對于中國AI產業來說,大概也是如此。


華為公司常務董事、華為云計算CEO 張平安

華為以及中國AI算力產業都需要信心,遠比當下的現金流和利潤還重要得多,這也是為何當華為云計算CEO張平安拿出了AI基礎設施架構突破性進展——CloudMatrix 384超節點之后,迅速吸引了中國AI產業的集中關注。

歷史上多數企業由危轉機的拐點,往往都是用顛覆性創新開啟新一輪增長周期。

天下苦英偉達久矣

英偉達攫取了大模型行業發展至今的絕大部分利潤,幾乎壟斷了AI算力,全世界不少聰明的頭腦都在思考同一個問題,如何突破英偉達的“封鎖”,不僅僅是國內AI產業,國外的訴求同樣迫切。

如果用一個關鍵詞來形容AI算力產業,“冰山之下”大概最為合適。微軟、谷歌、亞馬遜等云計算巨頭加速自研AI芯片,削弱對英偉達的依賴,國內廠商受限于宏觀環境,更難獲得最新的AI算力產品,不得不在產業鏈缺失的條件下自研。

所有人都能看到水面之上的英偉達,“擠牙膏式”更新迭代著自己的產品,更大的算力、帶寬,更強的生態綁定,榨干AI產業的每一分資本支出,但是國內和國外廠商的諸多AI算力研究還潛藏在水面之下,等待合適的時機。

一個時代有一個時代的計算架構,英偉達取代英特爾如此,其他廠商要對標甚至取代英偉達,也需要以年為周期的持久投入,以及一點幸運,畢竟誰能想到做游戲顯卡,能成AI算力巨擘。

沒有一家廠商,比華為更想在水面之上自由呼吸,海外巨頭在自研和采購英偉達之間尚有妥協空間,華為以及對AI算力有需求的所有中國企業別無他法。

在介紹CloudMatrix 384超節點之前,有必要引入英偉達的NVL72,2024年英偉達GTC大會上,最大的亮點不是Grace Blackwell架構,不是NVLink domain,不是精度軟件優化液冷等等,這些單點技術突破都足夠優異且常規。

但是NVL72這個極致壓縮又極致耦合的架構,為萬億級大模型訓練和推理層面提供了前所未有的性能。

在訓練方面,與上一代產品相比,通過32k GB200 NVL72 訓練1.8萬億參數的GPT-MoE 模型性能可提升4倍。推理方面,GB200 NVL72加上FP4 精度和第五代 NVLink 等諸多技術,與上一代產品相比整體效率提升了30倍。

簡單理解,大模型的Scaling Law意味著算力越大,模型越智能,而隨著模型規模的增大,每增加相同數量的參數或計算資源,獲得的性能提升逐漸減少,但是NVL72這種架構提供了更強的算力,且實現了平均token成本更低的Scale-up。

中國AI算力產業在單點層面還追不上英偉達產品,專為萬億大模型優化的AI算力集群,似乎又把戰局拉得越來越遠,此時,CloudMatrix 384超節點出現了。

DeepSeek送上風口

面向AI時代的海量算力需求,華為云基于“一切可池化、一切皆對等、一切可組合”的新型高速互聯總線架構推出CloudMatrix 384超節點,實現從服務器級到矩陣級的資源供給模式轉變。


CloudMatrix 384超節點

CloudMatrix 384具備“高密”“高速”“高效”的特點,通過全面的架構創新,在算力、互聯帶寬、內存帶寬等方面實現全面領先。

寥寥數語不足以顯示CloudMatrix 384超節點的價值,先上結論,CloudMatrix 384超節點是在芯片制程、模型精度、HBM帶寬等基礎條件均受限的情況下,在實際業務場景中擊敗了英偉達同等對標產品的創新,走出國內突破AI算力封鎖的跨越性一步。

譬如其中的高速互聯總線,能夠將GPU、CPU等各種不同的計算設備,都可以實現直接互聯,不需要經過CPU中轉通信,這是大參數模型仍然能取得高性能的前提。

少有人知道,CloudMatrix 384超節點的誕生,背負著怎樣的壓力。在基礎算力不如英偉達的情況下,內部也有不少人持懷疑態度,技術是理性的,但創新需要一些感性思維。

昇騰和英偉達先天存在差異,英偉達的路線不能照搬,這是一條必須自己蹚出來的路。有NVL72在先,國內AI算力廠商自然會嘗試同等規模的算力集群,但是要不要做到384節點這么大,這意味著更大的不確定性。

成本直線上升不說,而且結果預期并不明確,不是堆節點就能堆出來大算力集群,國內其他廠商如果處理不好網絡等一系列相關問題,更多的節點只會意味著更多的浪費,產品也沒有競爭力。

彼時大模型的發展脈絡還不清晰,384節點的大膽預研可能會造成浪費,錯失一些關鍵機會,華為云承受著巨大的壓力,創新的同義詞就是風險,但是如果不做,跟在英偉達后面永遠不可能超過英偉達。

新技術的發展,總是有一些不約而同的“巧合”,當DeepSeek的出現改變了大模型行業的走向,華為云驚喜地發現,此前有些模糊的預判得到了證實,上層大模型驅動底層AI基礎設施朝著超節點的方向演進。

DeepSeek的模型訓練采用MoE架構,MoE模型通過門控網絡動態選擇激活的專家,如DeepSeek-V3每層包含257個專家,每次僅激活8個專家,這導致不同GPU節點間需要頻繁交換數據,在訓練過程中會因All-to-All通信導致GPU閑置等問題。

此外,MoE模型里專家可能“冷熱不均”,有的專家被頻繁調用,有的閑置,同時傳統單機8卡架構無法滿足MoE模型對專家數量的擴展需求。

DeepSeek開源大模型不僅是算法的勝利,其突出價值表現在從底層優化AI模型的可能性,起初DeepSeek在英偉達H100的基礎上做訓練,但是外部團隊很難復現DeepSeek模型的效果的效率,即便用同樣的H100也不行。

隨后DeepSeek公布了一系列軟件倉庫,相當于把自己的調優過程做成了教程,但是行業發現,若采用單機部署方案,最終的性能遠不如 DeepSeek 官方公布的部署方案,且至少有數倍成本差距。更具挑戰的是,雖然 DeepSeek 公開了大 EP 并行方案,但技術難度較大,業內還沒有其他團隊快速復現這一部署方法。

回過頭看,DeepSeek在AI基礎設施層面做大量的工程創新是無奈之舉,英偉達巴不得大模型訓練用更多的卡,DeepSeek用更少的卡實現了更優的計算效果,一定程度上影響了英偉達GPU的銷量。

在DeepSeek之后,英偉達才優化了自己的GPU,使其適合MoE架構的訓練,這更像是一種被動式的響應客戶需求。但是華為云CloudMatrix 384超節點不同,在DeepSeek之前,華為云其實并不完全確定CloudMatrix 384超節點是否能讓客戶愿意買單。

市場會獎勵押中未來的創新者,華為云目前是業界唯一采用對等架構超節點技術提供算力服務的云廠商,數據顯示:CloudMatrix 384超節點的算力提升幅度高達50倍,達300Pflops,相比NVL72提升67%;網絡帶寬提升了1倍;超節點的內存(HBM)帶寬則提升了1.13倍。

這不是PPT數據,而是實際業務場景中的效果。硅基流動聯合華為云基于CloudMatrix 384 超節點昇騰云服務和高性能推理框架SiliconLLM,用大規模專家并行最佳實踐正式上線DeepSeek-R1。

該服務在保證單用戶 20TPS 水平前提下,單卡Decode吞吐突破1920Tokens/s,可比肩H100部署性能。同時,經過主流測試集驗證及大規模線上盲測,在昇騰算力部署DeepSeek-R1的模型精度與DeepSeek官方保持一致。

以往對標英偉達同等產品的國內算力卡,在實際業務場景可能要打個五折,甚至低至兩折,基于華為對標H100的算力卡,華為云實現了在單芯片性能略遜的情況下,通過一系列優化措施超過H100的業務效果。

華為云是如何做到的?

坦誠而言,在AI算力層面,包括華為在內的國內算力,距離英偉達還有不小的差距,但是華為云另辟蹊徑,在前方沒有路標的情況下,找到了一條突破英偉達封鎖的路線。

華為的解決方案是“用非摩爾定律的方法解決摩爾定律的問題”,單個芯片算力不足,就用Chiplet來封裝,同樣的芯片數量依然不足達到NVL72的水平,那就上升一層做系統級創新,結合華為在聯接領域的老本行,以及其他系統級優化能力,實現了比NVL72更高的集群算力利用率。

華為公司副總裁張修征也指出:“應以空間換算力、帶寬換算力、能源換算力,應把算力、存力、運力、電力作為一個復合要素考慮,這一系統性思維在剛剛發布的CloudMatrix 384超節點上體現得尤為明顯。”

不同于業界此前的方案,CloudMatrix 384超節點技術跳出單點技術限制走向系統性、工程性的創新,從“堆芯片”走向“拼架構”,走出突破AI算力封鎖的跨越性一步,讓許多AI應用落地難題有了迎刃而解的契機。

張修征強調:“伴隨架構創新的突破,昇騰 AI 云服務在推理效率、模型精度上已經持平于業界領先水平,在某些領域如智駕等已經領先于業界,這或將徹底終結大家的算力焦慮。”

48臺384卡的緊耦合互聯,打造成一個超級云服務器,實現算力規模50倍提升,值得一提的是,英偉達用了72個GPU,華為云用了384個NPU,在性能實現趕超的情況下,功耗只是小幅提升,而不是等比例提升。

但這也不得不帶來另一個煩惱,當大模型算力集群變得愈發復雜,數千根光纖的物理交互、高密的算力和網絡設備,液冷支撐體系等,一般企業難以維護CloudMatrix 384 超節點這樣的基礎設施,華為云也提前考慮到了難題,給出了解決方案。

傳統云服務以單臺服務器為交付單元,超節點通過“云的方式”來提供服務,對用戶來說性價比是遠遠大于自建數據中心。

一是超節點建設成本高,自建費時費力,芯片更新換代快,采用自建IDC方式,將會大大增加客戶的建設成本。

二是超節點運維難度高,因其架構復雜,涉及到的運維工具更多。支持大模型的智算中心故障率要遠高于普通數據中心,華為云獨有的系統能力,可以幫助超節點長穩智能地運維,能更好地幫助客戶解決問題。

張平安表示,面向智能世界,華為云致力于做好行業數字化的“云底座”和“使能器”,加速千行萬業智能化。依托AI全棧能力,華為云將堅定打造“自主創新、安全可信”的AI算力底座,依托昇騰AI云服務推動各行各業AI快速開發落地。

《孫子兵法·謀攻篇》寫道:故上兵伐謀,其次伐交,其次伐兵,其下攻城。攻城之法,為不得已。英偉達的存在讓很多人感到無力,懷疑中國算力產業能不能、需要多久才實現算力第二極的目標。

某種意義上AI產業之爭就是信心之爭,中國算力產業需要更多諸如CloudMatrix 384超節點之類的創新,烏云依舊在,也可能長時間籠罩在頭頂,但至少我們看到了一道裂縫,信心比什么都重要,這才是華為云之于中國AI產業更重要的意義。(本文首發于鈦媒體APP)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
臺灣極品教師,又是家庭主婦,36E上圍,太有韻味了吧

臺灣極品教師,又是家庭主婦,36E上圍,太有韻味了吧

云端小院
2025-05-02 05:55:43
沒孩子,沒遺產,無性婚姻20年,翁帆的野心終于暴露了!

沒孩子,沒遺產,無性婚姻20年,翁帆的野心終于暴露了!

chen7
2025-04-21 19:32:12
請叫他索圣!索帥創貝西克塔斯隊史,首戰土超三巨頭全勝成首人

請叫他索圣!索帥創貝西克塔斯隊史,首戰土超三巨頭全勝成首人

直播吧
2025-05-05 02:33:59
孫悟空被壓山下500年,唯一給他喂桃的牧童是誰?翻爛原著才知道

孫悟空被壓山下500年,唯一給他喂桃的牧童是誰?翻爛原著才知道

大千世界觀
2025-05-05 21:50:03
明天上班!好消息:再上19天班又放假了!不調休!

明天上班!好消息:再上19天班又放假了!不調休!

北京海淀
2025-05-05 16:46:20
曹云金帶前妻女兒現身游樂場,胖了20斤臉很圓,5歲女兒特別好看

曹云金帶前妻女兒現身游樂場,胖了20斤臉很圓,5歲女兒特別好看

泠泠說史
2025-05-04 17:51:11
沖上熱搜!演員趙麗穎罕見粉色短發造型曝光,發文迎立夏

沖上熱搜!演員趙麗穎罕見粉色短發造型曝光,發文迎立夏

魯中晨報
2025-05-05 16:40:06
歐豪何冰《刑警的日子》首播差評一片!案情毫無懸疑,主角嘴太貧

歐豪何冰《刑警的日子》首播差評一片!案情毫無懸疑,主角嘴太貧

露珠聊影視
2025-05-06 00:53:10
送杜蘭特去當龍王?美媒提議太陽學習馬刺,球星鬧事就送出美國

送杜蘭特去當龍王?美媒提議太陽學習馬刺,球星鬧事就送出美國

阿雄侃籃球
2025-05-05 23:34:06
馮唐:一輩子做兩件事就可以致富,發現什么是有效的,重復它...

馮唐:一輩子做兩件事就可以致富,發現什么是有效的,重復它...

清風拂心
2025-04-27 20:20:03
最佳陣容一陣有4個名額已定,那么最后一個名額會是誰?

最佳陣容一陣有4個名額已定,那么最后一個名額會是誰?

田先生籃球
2025-04-13 23:20:50
大哥說啥都對!希爾德調侃巴特勒:告訴人們你不再是羅賓了

大哥說啥都對!希爾德調侃巴特勒:告訴人們你不再是羅賓了

直播吧
2025-05-05 12:30:27
網傳這個女孩在餐廳里用雙語要求黑人回她的老家!

網傳這個女孩在餐廳里用雙語要求黑人回她的老家!

去非
2025-05-04 09:18:21
太寒心:朱婷歐冠表現太出彩但仍被歧視!奪冠海報唯獨漏了她

太寒心:朱婷歐冠表現太出彩但仍被歧視!奪冠海報唯獨漏了她

金毛愛女排
2025-05-05 07:04:14
過去100年,我國曾有10次國運,只要走錯了一次,就有可能被滅國

過去100年,我國曾有10次國運,只要走錯了一次,就有可能被滅國

睡前講故事
2025-03-27 10:42:26
中國等13國重申維持多邊貿易體系

中國等13國重申維持多邊貿易體系

北京商報
2025-05-06 00:42:02
立夏節氣下大雪?山西蘆芽山關閉所有景點

立夏節氣下大雪?山西蘆芽山關閉所有景點

瀟湘晨報
2025-05-05 21:28:05
劉海燕、周拉才讓,職務對調

劉海燕、周拉才讓,職務對調

新京報政事兒
2025-05-05 22:23:42
“香港之子”跌落神壇,晚節不保,完美人設竟然都是偽裝

“香港之子”跌落神壇,晚節不保,完美人設竟然都是偽裝

小彭談歷史
2025-02-17 00:40:33
美國983萬平方公里領土,政府擁有28%,私人占有60%

美國983萬平方公里領土,政府擁有28%,私人占有60%

高博新視野
2025-05-05 06:01:17
2025-05-06 02:36:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
117673文章數 860373關注度
往期回顧 全部

科技要聞

這3款新 iPhone,可能會改變蘋果的未來

頭條要聞

匈牙利外長"提醒"澤連斯基:注意說話方式

頭條要聞

匈牙利外長"提醒"澤連斯基:注意說話方式

體育要聞

當年的阿森納小球童,要踢歐冠決賽了

娛樂要聞

馬麗崩潰哭訴上熱搜,評論區罵聲一片

財經要聞

人民幣暴漲近900點!發生了什么?

汽車要聞

小米SU7的真實續航到底有多少?

態度原創

藝術
本地
時尚
公開課
軍事航空

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

春色滿城關不住 | 花漾千陽!塬上秘境藏幾重詩意?

“襯衫+短褲”今年最火穿搭,這樣穿太高級了!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

解放軍儀仗隊紅場高唱抗日歌曲

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 耿马| 隆尧县| 阳东县| 建始县| 娄底市| 军事| 安龙县| 华容县| 固始县| 鄂温| 遂平县| 岳阳县| 武鸣县| 潼关县| 白银市| 治多县| 行唐县| 铁力市| 天镇县| 乌拉特前旗| 靖边县| 宁强县| 昭通市| 太保市| 温泉县| 马山县| 清丰县| 扎鲁特旗| 北辰区| 博野县| 林芝县| 珠海市| 太康县| 乌海市| 贵阳市| 通江县| 烟台市| 攀枝花市| 界首市| 美姑县| 尤溪县|