99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

昇騰云CloudMatrix 384超節(jié)點(diǎn)六大科技創(chuàng)新,定義下一代AI基礎(chǔ)設(shè)施

0
分享至

5月16日,華為云AI峰會在北京召開,華為云副總裁黃瑾發(fā)表主題演講,介紹了更多CloudMatrix 384 超節(jié)點(diǎn)技術(shù)優(yōu)勢與細(xì)節(jié)。他指出,隨著大模型訓(xùn)練和推理對算力需求的爆炸式增長,傳統(tǒng)計(jì)算架構(gòu)已難以支撐AI技術(shù)的代際躍遷,超節(jié)點(diǎn)架構(gòu)的誕生不僅是技術(shù)的突破,更是以工程化創(chuàng)新開辟AI產(chǎn)業(yè)的新路徑。華為云CloudMatrix 384超節(jié)點(diǎn)具備MoE親和、以網(wǎng)強(qiáng)算、以存強(qiáng)算、長穩(wěn)可靠、朝推夜訓(xùn)、即開即用六大領(lǐng)先技術(shù)優(yōu)勢,以系統(tǒng)架構(gòu)創(chuàng)新重新定義新一代AI基礎(chǔ)設(shè)施。



華為云副總裁黃瑾

重新定義AI基礎(chǔ)設(shè)施架構(gòu),開辟算力新紀(jì)元

當(dāng)前,大模型訓(xùn)練經(jīng)歷了從早期小模型在單卡訓(xùn)練、小參數(shù)大模型在單機(jī)訓(xùn)練,到現(xiàn)在MoE、長序列、多模態(tài)大模型都在AI集群上訓(xùn)練的演進(jìn)過程。AI算力的瓶頸,從單卡算力的瓶頸到單機(jī)內(nèi)總線帶寬的瓶頸,再到現(xiàn)在集群間通信帶寬的瓶頸,需求增長了1萬倍。

然而過去的8年里,單卡硬件的算力增長了40倍,但是節(jié)點(diǎn)內(nèi)的總線帶寬只增長了9倍,跨節(jié)點(diǎn)的網(wǎng)絡(luò)帶寬只增長了4倍,這使得集群網(wǎng)絡(luò)通信成為當(dāng)前大模型訓(xùn)練和推理的最大挑戰(zhàn)。

黃瑾表示,面對這些挑戰(zhàn),華為云創(chuàng)新性的推出了采用全對等互聯(lián)架構(gòu)的CloudMatrix 384超節(jié)點(diǎn)。這項(xiàng)技術(shù)創(chuàng)新跳出單點(diǎn)技術(shù)限制走向系統(tǒng)性、工程性的創(chuàng)新算力架構(gòu),直面通信效率瓶頸、內(nèi)存墻制約、可靠性短板三大技術(shù)挑戰(zhàn)。通過新型高速互聯(lián)總線實(shí)現(xiàn)384 張卡互聯(lián)成為一個(gè)超級云服務(wù)器,最高提供300Pflops的算力規(guī)模,比業(yè)界同類產(chǎn)品領(lǐng)先67%。

解碼六大優(yōu)勢,CloudMatrix 384超節(jié)點(diǎn)重構(gòu)AI算力架構(gòu)

目前,基于CloudMatrix的超節(jié)點(diǎn)集群已經(jīng)在蕪湖、貴安、內(nèi)蒙規(guī)模上線,黃瑾進(jìn)一步深入解讀了六大技術(shù)創(chuàng)新點(diǎn):



MoE親和架構(gòu),從“小作坊”到“超級工廠”。在傳統(tǒng)架構(gòu)下,MoE模型訓(xùn)練容易因通信延遲導(dǎo)致算力浪費(fèi),而CloudMatrix 384超節(jié)點(diǎn)的分布式推理平臺可以說是專為MoE大模型而生。黃瑾指出,對比一卡多專家的“小作坊模式”,超節(jié)點(diǎn)更像“大工廠模式”,通過高速互聯(lián)總線,能夠?qū)崿F(xiàn)一卡一專家高效分布式推理,單卡的MoE計(jì)算和通信效率都大幅提升。這也是為什么有幾百個(gè)政務(wù)、零售、醫(yī)療、保險(xiǎn)、制造、礦山、旅游等各行各業(yè)的客戶,基于華為云昇騰AI云服務(wù)部署DeepSeek模型的創(chuàng)新應(yīng)用,例如在智能助手、智能客服、互聯(lián)網(wǎng)搜索、內(nèi)容創(chuàng)作等各種場景落地。

以網(wǎng)強(qiáng)算,雙層網(wǎng)絡(luò)破解“數(shù)據(jù)堵車”。當(dāng)AI算力走向規(guī)模化部署,單點(diǎn)的芯片性能不再是制約算力發(fā)展的唯一變量,如何由點(diǎn)及面地激活算力矩陣的共振效應(yīng),也是破解AI時(shí)代算力命題的關(guān)鍵一步。而釋放聯(lián)接力也正是超節(jié)點(diǎn)最大的創(chuàng)新突破之一,黃瑾介紹,傳統(tǒng)網(wǎng)絡(luò)像擁堵的城市道路,CloudMatrix 384則構(gòu)建了AI專屬高架橋,通過MatrixLink服務(wù)將單層網(wǎng)絡(luò)升級為兩層高速網(wǎng)絡(luò),一層是超節(jié)點(diǎn)內(nèi)部的ScaleUp總線網(wǎng)絡(luò),確保超節(jié)點(diǎn)內(nèi)384卡全對等高速無阻塞互聯(lián),卡間超大帶寬2.8T,納秒級時(shí)延;另一層是跨超節(jié)點(diǎn)間的ScaleOut網(wǎng)絡(luò),可支持微秒級時(shí)延,資源彈性擴(kuò)展;同時(shí),基于全局拓?fù)涓兄闹悄苷{(diào)度算法,保障客戶任務(wù)長穩(wěn)運(yùn)行。

以存強(qiáng)算,彈性內(nèi)存改寫“算存綁定”。 華為云首創(chuàng)了EMS彈性內(nèi)存存儲,打破傳統(tǒng)GPU算力與顯存綁定的關(guān)鍵障礙,通過內(nèi)存池化技術(shù),實(shí)現(xiàn)顯存和算力解綁。一方面,用EMS替代NPU中的顯存,可使得首Token時(shí)延降低,最高降幅可達(dá) 80%;另一方面,當(dāng)NPU的顯存不足時(shí),EMS獨(dú)立擴(kuò)容,不必再通過堆NPU以獲得更多內(nèi)存。同時(shí),EMS還支持算力卸載,這也使得系統(tǒng)吞吐量提升,有的場景達(dá)100%的提升??傊?,這一技術(shù)創(chuàng)新大幅提升了資源利用率、性能和吞吐量。

長穩(wěn)可靠,故障自愈的“AI醫(yī)生”。隨著模型訓(xùn)練需求的不斷接入,大集群的運(yùn)維難度大、復(fù)雜性高的問題日益凸顯。對此,華為云開發(fā)了昇騰云腦運(yùn)維“1-3-10”標(biāo)準(zhǔn),即 1 分鐘感知、3分鐘定界、10 分鐘內(nèi)恢復(fù)。通過5層壓測、靜默故障感知技術(shù),昇騰云腦可將硬件故障感知率從40%提升至90%。同時(shí),覆蓋計(jì)算、存儲、網(wǎng)絡(luò)、軟件四大種類故障模式庫也打通了全棧故障場景,這一全棧故障知識庫能夠覆蓋95%常見問題以實(shí)現(xiàn)故障快速定界;在恢復(fù)機(jī)制上,3層快恢技術(shù)、快速建鏈技術(shù)、圖編譯緩存等技術(shù)能夠?qū)崿F(xiàn)萬卡故障快速恢復(fù)。

朝推夜訓(xùn),力資源“錯(cuò)峰用電”。在大模型訓(xùn)練中,提升算力利用率,避免算力閑置也是企業(yè)關(guān)心的重點(diǎn)之一。CloudMatrix 384超節(jié)點(diǎn)通過“訓(xùn)推共池”“靈活調(diào)度”兩大關(guān)鍵技術(shù)實(shí)現(xiàn)朝推夜訓(xùn),白天進(jìn)行模型推理,晚上閑時(shí)進(jìn)行模型訓(xùn)練,算力資源利用率可提升30%以上。

即開即用,“算力水電”普惠模式。為助力客戶更好地專注業(yè)務(wù)模型開發(fā),華為云已經(jīng)在全國三大樞紐數(shù)據(jù)中心——烏蘭察布、貴安和蕪湖完成了超節(jié)點(diǎn)規(guī)模布局,支持百TB級的帶寬互聯(lián),10毫秒時(shí)延圈覆蓋全國19個(gè)城市群,讓客戶能夠第一時(shí)間享受到即開即用的AI算力資源。同時(shí),華為云擁有專業(yè)的超節(jié)點(diǎn)運(yùn)維團(tuán)隊(duì),在為客戶免去繁瑣的管理和維護(hù)的同時(shí),保障資源的穩(wěn)定運(yùn)行。

做好智能世界云底座和使能器,加速行業(yè)智能躍遷

如今AI已經(jīng)成為最有影響力的通用技術(shù),如何將技術(shù)價(jià)值轉(zhuǎn)化為應(yīng)用成果,成為千行百業(yè)面臨的核心課題。華為云超節(jié)點(diǎn)創(chuàng)新系統(tǒng)架構(gòu)的背后,是華為云堅(jiān)持“昇騰云服務(wù)支持百模千態(tài),盤古大模型重塑千行萬業(yè)”的戰(zhàn)略。

黃瑾強(qiáng)調(diào),一直以來華為云持續(xù)推動昇騰AI云服務(wù)全面升級,通過打磨昇騰云的訓(xùn)練、推理的性能、可靠性和性價(jià)比,為中國乃至全球客戶提供好用、易用的AI算力云服務(wù)?,F(xiàn)已全面適配了DeepSeek在內(nèi)的160多個(gè)大模型,以云服務(wù)的方式,協(xié)助客戶進(jìn)行模型的開發(fā),訓(xùn)練,托管和應(yīng)用。昇騰AI云服務(wù)上線以來,面向政府、金融、零售、互聯(lián)網(wǎng)、交通、制造等行業(yè)已經(jīng)服務(wù)六百多家創(chuàng)新先鋒企業(yè),加速行業(yè)智能化應(yīng)用的快速落地。

在充滿突破和創(chuàng)新的AI發(fā)展過程中,每一個(gè)階段都會產(chǎn)生大量的新技術(shù)、新模式,企業(yè)唯有抓住AI時(shí)代機(jī)遇,才能搶占發(fā)展先機(jī)。黃瑾表示,面向智能世界,華為云致力于做好行業(yè)數(shù)字化的“云底座”和“使能器”,堅(jiān)定打造AI算力底座,以安全、穩(wěn)定、高質(zhì)量、持續(xù)創(chuàng)新的AI云服務(wù),賦能千行萬業(yè)應(yīng)用創(chuàng)新,攜手伙伴、客戶加速行業(yè)智能躍遷。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
繼續(xù)下去,沒人關(guān)心房價(jià),因?yàn)楹芏嗳硕家獰o班可上了

繼續(xù)下去,沒人關(guān)心房價(jià),因?yàn)楹芏嗳硕家獰o班可上了

八斗小先生
2025-05-19 08:34:16
公務(wù)接待工作餐明確“不上酒”,白酒股集體下跌!

公務(wù)接待工作餐明確“不上酒”,白酒股集體下跌!

第一財(cái)經(jīng)資訊
2025-05-19 10:52:55
熱搜第一!虞書欣爺爺被扒猛料其父與爺爺所在國企往來15億引關(guān)注

熱搜第一!虞書欣爺爺被扒猛料其父與爺爺所在國企往來15億引關(guān)注

趣文說娛
2025-05-19 09:25:57
其他國家有“中吹”嗎?網(wǎng)友:出國了就知道國內(nèi)多爽了

其他國家有“中吹”嗎?網(wǎng)友:出國了就知道國內(nèi)多爽了

娛樂圈人物大賞
2025-05-19 00:20:07
雙盲實(shí)驗(yàn):讓有意無意的騙子現(xiàn)形

雙盲實(shí)驗(yàn):讓有意無意的騙子現(xiàn)形

深度報(bào)
2025-05-18 23:57:38
僅1分鐘,1人當(dāng)場死亡!“我真的很后悔!”

僅1分鐘,1人當(dāng)場死亡!“我真的很后悔!”

揚(yáng)子晚報(bào)
2025-05-19 07:19:08
32歲女子撿到蛇當(dāng)寵物養(yǎng)了7年,專家檢查后驚恐發(fā)顫“這不是蛇”

32歲女子撿到蛇當(dāng)寵物養(yǎng)了7年,專家檢查后驚恐發(fā)顫“這不是蛇”

卡西莫多的故事
2025-05-15 18:10:00
譚木匠940名員工 有341名殘疾人

譚木匠940名員工 有341名殘疾人

閃電新聞
2025-05-18 18:26:33
武漢發(fā)生故意傷害案致1人死亡,警方通報(bào)

武漢發(fā)生故意傷害案致1人死亡,警方通報(bào)

界面新聞
2025-05-19 12:41:53
現(xiàn)在知道為什么笑了吧?SGA晉級西決后社媒發(fā)布鬼魅一笑圖片

現(xiàn)在知道為什么笑了吧?SGA晉級西決后社媒發(fā)布鬼魅一笑圖片

雷速體育
2025-05-19 11:00:11
心疼大S!汪小菲馬筱梅二婚伴手禮很奢華,愛與不愛一目了然

心疼大S!汪小菲馬筱梅二婚伴手禮很奢華,愛與不愛一目了然

素素娛樂
2025-05-17 13:40:03
年僅22歲!小伙摔倒以為沒事,7天后死亡;出現(xiàn)這些癥狀千萬別忽視

年僅22歲!小伙摔倒以為沒事,7天后死亡;出現(xiàn)這些癥狀千萬別忽視

新民晚報(bào)
2025-05-19 12:30:27
我國將迎來人口死亡高峰!2024年1093萬人去世,專家揭秘三大主因

我國將迎來人口死亡高峰!2024年1093萬人去世,專家揭秘三大主因

聯(lián)友說娛
2025-05-19 09:26:46
未斷電的充電線接觸被褥 不到10分鐘家被燒了

未斷電的充電線接觸被褥 不到10分鐘家被燒了

閃電新聞
2025-05-18 18:15:18
黃子韜衛(wèi)生巾上線,半小時(shí)爆賣45萬單!徐藝洋嚴(yán)肅聲明:我本人正在用

黃子韜衛(wèi)生巾上線,半小時(shí)爆賣45萬單!徐藝洋嚴(yán)肅聲明:我本人正在用

瀟湘晨報(bào)
2025-05-18 22:03:08
NBA大洗牌?歷史首次出現(xiàn)49年來從未奪冠球隊(duì)出現(xiàn)在東西部決賽

NBA大洗牌?歷史首次出現(xiàn)49年來從未奪冠球隊(duì)出現(xiàn)在東西部決賽

Emily說個(gè)球
2025-05-19 07:05:09
確認(rèn)了!“頂流”昨晚抵達(dá)中國

確認(rèn)了!“頂流”昨晚抵達(dá)中國

FM93浙江交通之聲
2025-05-19 08:56:06
落后23分!掘記:自威少上場后比分是59-25 從那開始一切都改變了

落后23分!掘記:自威少上場后比分是59-25 從那開始一切都改變了

直播吧
2025-05-19 05:18:03
熱搜第一!陳奕迅被傳死亡消息,粉絲刷爆評論區(qū),祈求出面辟謠!

熱搜第一!陳奕迅被傳死亡消息,粉絲刷爆評論區(qū),祈求出面辟謠!

野山歷史
2025-05-19 08:27:29
5000億美元!目標(biāo)已實(shí)現(xiàn)

5000億美元!目標(biāo)已實(shí)現(xiàn)

中國新聞周刊
2025-05-18 11:33:40
2025-05-19 13:20:49
科技狂潮
科技狂潮
科技狂潮
310文章數(shù) 63466關(guān)注度
往期回顧 全部

科技要聞

3nm工藝!雷軍:小米玄戒O1投入已超135億

頭條要聞

媒體:印度遭巴軍"獵殺"損失慘重 仍不忘煮"自嗨鍋"

頭條要聞

媒體:印度遭巴軍"獵殺"損失慘重 仍不忘煮"自嗨鍋"

體育要聞

1場3次爭議判罰!梅西炮轟美職聯(lián)裁判

娛樂要聞

汪小菲婚禮一過,S媽就坐不住了

財(cái)經(jīng)要聞

特朗普威脅沃爾瑪“不許漲價(jià)”

汽車要聞

或6月上市 小米YU7更多信息將于5月下旬公布

態(tài)度原創(chuàng)

房產(chǎn)
時(shí)尚
本地
教育
公開課

房產(chǎn)要聞

真猛!三亞房價(jià)和銷量,全都漲了!

讓世界為中國文物駐足,他們都做了什么?

本地新聞

“5·19中國旅游日”2025年主會場活動啟動儀式

教育要聞

學(xué)習(xí)思維沒跟上,學(xué)得再多也白搭

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 民乐县| 仁化县| 宾川县| 杭州市| 榆社县| 翼城县| 江永县| 清水县| 阿克苏市| 德安县| 通山县| 桂阳县| 益阳市| 霸州市| 繁峙县| 巴里| 寻甸| 土默特左旗| 健康| 永宁县| 墨竹工卡县| 武安市| 库车县| 红安县| 五莲县| 铜山县| 巴林右旗| 保定市| 大渡口区| 鲁山县| 建昌县| 玛纳斯县| 青岛市| 句容市| 大城县| 四会市| 芜湖市| 乌鲁木齐县| 东源县| 靖州| 鄢陵县|