99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

芯片管制升級,國產AI還得靠國產云

0
分享至



文|白 鴿

編|王一粟

一則新聞又開炸AI圈。

最新消息顯示,美國BIS執法部門宣布加強對海外AI芯片的出口管制措施,其中有對中國國產算力芯片不利的條款。

關稅剛剛達成初步協議,轉頭就加強科技管控。根據路透社報道,美國參議員上周五提出一項新法案,要求對出口受限的人工智能芯片實施位置驗證機制,旨在阻止中國獲得先進半導體技術。

這項名為《芯片安全法案》的提案將給與美國商務部授權,要求出口受控的AI芯片及其集成產品配備位置追蹤系統,以監測這些產品是否被轉移、走私或用于未經授權的用途。

不過,后續BIS又更改了口徑,對中國AI芯片的限制又從某一款單獨的AI芯片擴大到其他所有先進計算芯片。

至此,幻想需要被徹底放棄了:在AI這個未來科技的勝負手上,將會是一場沒有終點的長跑比賽。

而想坐在談判桌上,必須擁有籌碼:自主創新的科技實力。

大模型推理,超節點需要解決“三高一低”

超節點是AI浪潮中,算力架構的一次重大創新。這個概念雖然源自英偉達,但中國廠商卻做了更多顛覆式的創新。

創新源于改變。

邁入2025年,AI大模型推理的需求更加旺盛,對算力提出了更多要求。如果僅僅是通過算力的堆疊,并不能夠滿足推理需求。

當前行業面臨著“三高一低”挑戰——即如何實現更高的算力利用率、更高的算力可用度、更高的吞吐率以及更低的處理時延。

事實上,DeepSeek低價質優的背后,就是通過使用MoE架構,保證模型容量的前提下降低計算成本。

MoE架構是一種通過動態組合多個子模型(專家)來提升模型性能的大規模機器學習框架,其核心特點是稀疏激活機制,即在用戶輸入問題時,僅激活與輸入數據最相關的專家進行思考回答,生成最終結果。

如DeepSeek-R1的參數量是671B,但因為采用稀疏架構,實際上每次只激活其中32B的參數,加上DeepSeek的思維鏈優化等技術,就可以實現近似于ChatGPT-4o和o1的推理能力。

而傳統的Dense架構則是全科天才需要處理所有問題,雖然能力強大,但是當問題變多時就會顯得效率十分低下,而且其消耗的資源也遠超“普通專家”。

但是,MoE模型通過門控網絡動態選擇激活的專家,這就導致不同GPU節點間需要頻繁交換數據(如專家參數、中間計算結果),而傳統的點對點通信模式(如單機8卡互聯)在MoE訓練中容易因通信帶寬不足或延遲過高導致GPU資源閑置。

而想要解決這一問題,超節點技術似乎成為了當前的最優解。

一般來說,構建一個超大規模的GPU集群,往往有兩種方式,一種是通過增加單節點的資源數量,向上擴展,即Scale Up,在每臺服務器中多塞幾塊GPU,一個服務器成為一個節點;另一種Scale Out是通過網絡將多臺服務器(節點)連接起來。



而當這些設備處于同一個HBD(High Bandwidth Domain,超帶寬域)的時候,英偉達對這種以超大帶寬互聯16卡以上GPU-GPU的Scale Up系統,稱為超節點。

那為什么說,超節點是解決MoE架構通信問題的最優解?

背后原因在于,超節點作為Scale Up的當前最優解,通過內部高速總線互連,能夠有效支撐并行計算任務,加速GPU之間的參數交換和數據同步,縮短大模型的訓練周期。

近期,華為云正式發布了CloudMatrix 384超節點,其在性能倍增的同時,也進行了技術創新,包括對MoE親和、以網強算、以存強算、長穩可靠、朝推夜訓、即開即用等6大方面。



其中,華為云CloudMatrix 384超節點通過超高帶寬Scale-Up網絡實現從“傳統以太網”向“共享總線網絡”演進,用對等架構替代傳統以CPU為中心的主從架構,將資源互聯帶寬提升了10倍以上,實現CPU、NPU、內存等多樣資源全對等連接。

這背后核心技術就是華為云創新的以網強算MatrixLink服務,其是將單層網絡升級為兩層高速網絡:一層是超節點內部的ScaleUp總線網絡,確保超節點內384卡全對等高速無阻塞互聯,卡間超大帶寬2.8TB,納秒級時延,另一層則是跨超節點間的ScaleOut網絡,可支持微秒級時延,資源彈性擴展,最大支持128k組網規模。

“基于全局拓撲感知的智能調度算法,對于流量沖突,可規劃最佳流量路徑,確保無阻塞交換。同時,可支持光模塊故障的快速識別、隔離與流量快速調度,保障客戶任務長穩運行。”華為云副總裁黃瑾說道。

具體來說,傳統單機最多帶8個專家,類似一個小辦公室只能坐8人,而MoE需要成百上千專家,超節點則可以把多個機柜計算卡連成“超級辦公室”,專家數量隨需求擴展,可支持千億參數大模型。

而針對MoE模型里專家可能“冷熱不均”:有的專家被頻繁調用,有的閑置情況。華為昇騰AI云服務利用超節點和動態資源分配機制相結合,使算力利用率平均提高了50%,能夠充分滿足AI業務的高并發與彈性需求特性。

事實上,除底層硬件層面網絡帶寬的創新外,華為昇騰AI云服務此次升級的分布式推理平臺,也能夠基于對MoE架構天然的親和推理能力,提高集群的吞吐性能。

經過實測,硅基流動在基于華為昇騰AI云服務打造的超節點算力服務集群上,其計算吞吐量已經超越業界最好GPU的集群吞吐性能,單卡可以達到1920Token/秒。



另外,在DeepSeek推理模型里面,由于其對專家模型的動態選擇能力,也需要進行Prefill(大模型推理的首個階段)和Decode(大模型推理輸入-輸出結果的過程)負載配比,通過動態的均衡和自動負載均衡,來實現整個系統最佳推理的吞吐。

通過超節點,華為昇騰AI云服務不僅優化了訓練與推理效率,還降低了硬件成本,也成為支撐MoE模型從實驗室走向工業落地的關鍵。

大模型落地,算力調度既要靈活、又要高效

相比于大模型預訓練的集中式調度,“大量的AI推理應用,往往是短時間、短期間的潮汐式應用。”中國電信大模型首席專家、大模型團隊負責人劉敬謙此前曾說道。

如某電商平臺在大促期間,大模型客服推理算力需求瞬時可提升500%,這就需要在分鐘級內完成跨集群資源調度。

因此,推理的算力部署要靠近用戶,保證算力延時要在5-10毫秒范圍內的同時,還要能夠支持算力資源的高效靈活調度,才能夠滿足潮汐式應用需求。

這里有兩個關鍵詞,一個是算力充足,一個是靈活高效。

要想算力充足,不光是砸錢買英偉達的卡這么簡單,就算OpenAI這樣的新貴也不能放肆揮霍。這就需要從幾個維度去想辦法:

  • 提升單體架構的算力
  • 把多元化的算力都用起來,CPU、NPU、GPU、內存一起上

超節點就完美地同時解決了這倆問題。

就像上面提到,超節點是從架構上的設計,提升了單體架構的算力。比如,華為云的CloudMatrix 384超節點基于高帶寬互聯技術,在一臺服務器中集成了384張算力卡。同時,通過分布式擎天架構實現CPU、NPU、GPU、內存等多樣資源統一抽象、池化,突破單體算力瓶頸,使算力規模提升50倍,達300PFlops。

事實上,在傳統的方案中,因為顯存和算力綁定,往往客戶為了獲取更多的內存,就必須大規模購買NPU,造成NPU算力資源的極大浪費。

基于此,華為云推出了業界首創的EMS彈性內存存儲,通過內存池化技術,一方面可以支持以存強算,即用EMS替代NPU中的顯存,緩存并復用歷史KV計算結果,可以使首Token時延降低,有場景可降低到80%。

另一方面,當NPU的顯存不足時,往往企業會通過購買更多NPU的方式進行擴容,但通過EMS的分布式內存存儲,基于將內存虛擬化的技術,就可以補充顯存空間,減少企業購買NPU的數量。

此外,“EMS還支持算力卸載,即將原來需要在NPU中進行的KV計算卸載到CPU和EMS中,從而使得系統吞吐量提升100%。”黃瑾如此說道。

當前,做超節點方案的廠商并不少,但華為云CloudMatrix 384超節點有一些自有的特點,比如在節點間重要的通信上,華為就用了光通信,而非業界主流的銅纜電互聯。

通信起家的華為,比英偉達在通信上更有話語權。它能做到更高的卡間互聯帶寬、更高的擴展性、更低的延遲和功耗,為大模型訓練、科學計算等高性能計算場景提供了強大支撐。

經實測,華為云數據顯示,基于華為云的CloudMatrix 384超節點的軟硬件協調,在一個超節點上通過高效網絡互聯技術,MFU(Model Flops Utilization,模型浮點運算利用率)可實現高達55%的利用率,同時還能夠保證超節點萬卡集群上,萬億模型訓練超40天不中斷。

底層的算力資源池已經有了,而想要高效靈活地調度這些資源池,則離不開云服務體系。

一方面,華為昇騰AI云服務通過瑤光智慧云腦,可提供NPU、GPU、CPU、內存等資源按需組合,通過匹配最優算力組合,實現百億到萬億級模型訓練所需的資源。此外,還可實現多個大模型在一個超節點資源池內調度,讓超節點整體資源利用率更高。

值得一提的是,此次昇騰AI云服務在資源調度上,還實現了容器級的Serverless技術,及卡級別的Serverless技術,能夠實現卡級別和容器級別的資源調度,使資源利用率提升50%以上。

所謂Serverless通常指無服務器架構,用戶不需要管理服務器,平臺自動處理基礎設施。而容器級的Serverless是指基于容器技術的Serverless 解決方案,如 AWS Fargate、阿里云函數計算支持容器等。

一般在大模型的部署應用中,可以將大模型封裝為容器鏡像,并通過 Serverless 容器實現彈性推理,這樣就可以在低負載時僅保留1個實例維持熱啟動,節省資源,在峰值時秒級擴容多個實例,分攤推理壓力。

如某客服大模型使用Serverless容器后,推理成本降低30%,并發處理能力提升5倍;某電商促銷活動中,容器級Serverless平臺在10秒內擴容2000個容器實例,處理峰值達10萬QPS的商品推薦請求。

在行業人士看來,容器級Serverless技術通過 “去基礎設施化” 重構了應用部署模式,讓容器技術從 “需要專業團隊運維的重資產” 變為 “即開即用的算力資源”。

同時,未來在云服務體系中,容器級Serverless也將向 “全域算力調度” 演進,實現中心云、邊緣節點、端設備的容器實例統一管理,推動 “算力即服務(CaaS)” 的終極形態,即用戶無需關心算力在哪里、如何運行,只需按需獲取容器化的計算能力。

可以看到,容器Serverless技術進一步降低了企業用算力的門檻,尤其對中小企業而言,用上大模型將更加容易。

有了充足的底層算力資源,還能夠靈活高效的進行調配,但對于很多企業來說,還是希望能夠更充分的進行算力的利用,避免算力出現閑置問題。

為了解決企業的顧慮,華為云還創新地推出了朝推夜訓模式,即通過訓推共池和靈活調度,白天進行模型推理,晚上閑時進行模型訓練,大幅提升超節點算力資源利用率。

其核心原理在于將訓練推理作業共用一個專屬資源池,支撐提前劃分訓練、推理邏輯子池,通過邏輯子池動態配合調整,實現訓推資源時分復用,節點在訓練和推理任務間切換<5分鐘。

從底層算力資源的擴張,到以云服務的形式對算力資源進行靈活調配,再到充分保證企業對算力資源的利用率,可以看到,華為云正在構建全方位體系化的AI算力供給能力。

而面向未來,除了對算力資源的調配和利用之外,如何保證算力資源更加穩定的供給,也將成為關鍵。

日新月異的大模型,更需要一朵穩定的云



“我們一年花費在云端算力上的費用,大概十幾億元。”Momenta創始人曹旭東曾透露。

智能駕駛的數據量非常龐大,且對數據的實時性要求非常高,畢竟這涉及到駕駛安全問題。而隨著端到端大模型的上車,對算力資源的需求更加龐大。

但端側的算力供給,遠遠不能夠達到智能駕駛的需求,基于云-邊-端的混合架構,則成為了智能駕駛算力應用最常見的方式。而這背后,對算力服務支持的穩定性和可靠性也就要求更加嚴格。

這就需要算力服務商,具備對大模型故障的強感知能力。

華為云最近把這種感知能力提升到了一個新標準——針對超大規模集群的故障感知提出了1-3-10標準。即不管是千卡集群,還是萬卡集群,亦或是10萬卡集群,華為昇騰AI云服務能夠實現1分鐘感知故障、3分鐘故障定界、10分鐘故障恢復。



能做到如此快速的故障恢復,源于背后昇騰云腦的最新升級,其可實現全棧故障感知、診斷與快速自動恢復。

其中,在故障感知方面,通過靜默故障感知技術和算法,主動探測硬件進行功能或性能測試,根據測試結果及時發現并隔離性能衰減的“慢節點”,基于變化趨勢,預測硬件的潛在故障風險,提前進行隔離或更換。硬件故障感知率從40%提升至90%。

同時,昇騰云腦的全棧故障知識庫已經覆蓋95%常見場景,可一鍵故障診斷準確率可達到80%,大大縮短網絡故障診斷時效。配合 “三層快恢技術” ,實現萬卡集群故障10分鐘恢復的效果。

通過昇騰云腦,華為云則能夠快速感知故障并進行修復,能夠保證大模型長期穩定地運行。

事實上,除了汽車行業外,許多其他行業的人也都能感受到:“大模型的發展太快了。”

今年春節期間,DeepSeek第一次爆火,距今過去100多天,而在此期間,各種更新迭代的大模型產品、Agent智能體產品,更是日新月異。

然而,相比于日新月異的大模型,作為底層基礎設施,數據中心交付周期卻相對比較漫長,從立項到建設完成,往往至少需要一年半載的時間,而此時大模型早已經更新迭代好幾批了,芯片也早就不是最新的。

也正因此,在中國智算中心建設周期中,有很多小型智算集群和數據中心,建完就出現閑置,原因就在于其已經不能夠滿足當下最新大模型的算力需求了。

那么,在日新月異的大模型更新迭代背景之下,國內大模型企業想要能夠使用最新的算力基礎設施,云的方式則成為了最優解,且對于行業用戶而言,用云的性價比遠遠大于自建數據中心。

一方面,數據中心建設成本高,自建費時費力,且芯片更新換代快,自建IDC將會大大增加企業的建設成本;另外,數據中心的運維難度高,整體架構更復雜,涉及到更多運維工具。

另外,更為重要的一點是,數據中心非常容易出現問題,導致各種故障,如果沒有積累深厚的系統化運維能力,很難實現數據中心的長穩智能運維。

畢竟,運維一個數據中心的時間長達10-15年,在漫長的運維過程中如何保障數據中心的可靠運行是每個基礎設施管理者首要的責任。

反觀中國的云廠商,無論在軟硬件技術上,幾乎都是全球頂流的水平了。

比如華為云,僅在中國就已經完成了全國三大云核心樞紐布局,即貴州貴安、內蒙古烏蘭察布、安徽蕪湖,具備3大樞紐DC,百TB帶寬互聯,萬公里光纖骨干網,覆蓋19大城市圈。

目前,這三大數據中心均已上線了超節點,“在全國主要的流量城市中,基本上在10毫秒內就可以訪問到這個超節點。”黃瑾說道,現在企業想要申請使用,分鐘級就可以開通。

當然,在龐大的數據中心運維中,華為云也形成了體系化的能力,幫助超節點長穩智能地運維,能更好地幫助客戶的業務穩定高效地運行。

綜合來看,中國AI產業的基礎設施已經絕對擁有了軟硬件自主創新的能力,這種內循環的能力,會讓我們變得更加強大。

無端的科技戰,并不能夠阻擋中國AI產業的崛起,反而是成為了一種催化劑,讓主動擁抱國產算力的企業和機構變得更多。

一朵更加穩定的云,才能夠為AI大模型走向落地,提供更加穩定的國產AI算力支持,幫助中國AI走得更高更遠。

未來,面向智能世界,華為云將致力于做好行業數字化的“云底座”和“使能器”,加速千行萬業智能化。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
俄羅斯軍事專家:“中國綜合國力遠超漢唐時期,美國毫無勝算”

俄羅斯軍事專家:“中國綜合國力遠超漢唐時期,美國毫無勝算”

農夫史記
2025-05-31 20:20:43
著名港星方剛去世享年78歲,一生未婚無子女,最后露面瘦骨嶙峋

著名港星方剛去世享年78歲,一生未婚無子女,最后露面瘦骨嶙峋

開開森森
2025-05-31 15:08:45
暴雨增強!上海人今天請減少出門,這些活動已取消、延期!緊急通知

暴雨增強!上海人今天請減少出門,這些活動已取消、延期!緊急通知

環球網資訊
2025-06-01 07:47:23
直擊廣東疊滘龍船賽:300元的觀賽陽臺位一位難求,千元的龍船飯預訂一空

直擊廣東疊滘龍船賽:300元的觀賽陽臺位一位難求,千元的龍船飯預訂一空

紅星新聞
2025-05-31 15:16:17
這三種老人是禍害,誰攤上誰倒霉,真的希望你家里沒有

這三種老人是禍害,誰攤上誰倒霉,真的希望你家里沒有

小鬼頭體育
2025-05-25 21:19:18
每天至少一包,寧波男子同時查出三種癌癥!最終放棄治療

每天至少一包,寧波男子同時查出三種癌癥!最終放棄治療

魯中晨報
2025-05-31 14:05:36
最后24小時,三國對華下戰書,美航母殺個回馬槍,中方劃下落彈區

最后24小時,三國對華下戰書,美航母殺個回馬槍,中方劃下落彈區

說天說地說實事
2025-05-30 12:36:48
抵制二手煙,我成了戴防毒面具上班的“怪人”

抵制二手煙,我成了戴防毒面具上班的“怪人”

新京報
2025-05-31 09:47:41
陳妍希曬母子合照慶生,大秀美背,8歲小星星長勢喜人,體態像爸

陳妍希曬母子合照慶生,大秀美背,8歲小星星長勢喜人,體態像爸

西瓜愛娛娛
2025-06-01 11:25:53
美軍發力,鐵了心阻止大陸收臺!解放軍擺好戰斗姿態,發出最強音

美軍發力,鐵了心阻止大陸收臺!解放軍擺好戰斗姿態,發出最強音

兵器雜志
2025-06-01 10:51:21
玩不起中超的江蘇足球,玩玩“蘇超”也不錯,干凈純潔有奶香味

玩不起中超的江蘇足球,玩玩“蘇超”也不錯,干凈純潔有奶香味

譚浩俊
2025-06-01 07:38:19
加沙的孩子沒有兒童節:每45分鐘有一名孩子死去

加沙的孩子沒有兒童節:每45分鐘有一名孩子死去

環球網資訊
2025-05-31 11:01:23
前腳剛去莫斯科捧場,后腳就被克宮問罪:塞爾維亞的幾十萬發炮彈

前腳剛去莫斯科捧場,后腳就被克宮問罪:塞爾維亞的幾十萬發炮彈

鷹眼Defence
2025-05-30 18:17:32
華為余承東:我先把牛吹在這里,鴻蒙智行不是第一陣營就是第一名

華為余承東:我先把牛吹在這里,鴻蒙智行不是第一陣營就是第一名

叮當當科技
2025-06-01 11:05:37
王楚欽回應緋聞:希望大家給予理解與空間。

王楚欽回應緋聞:希望大家給予理解與空間。

大嘴說臺球
2025-05-29 13:29:43
曝圖赫爾報復曼聯,建議德拉普選擇切爾西!拉爵或從大巴黎租前鋒

曝圖赫爾報復曼聯,建議德拉普選擇切爾西!拉爵或從大巴黎租前鋒

羅米的曼聯博客
2025-05-31 10:12:06
他被張衛健謝霆鋒打成重傷,發妻流產6次,如今靠鹵肉攤維持生計

他被張衛健謝霆鋒打成重傷,發妻流產6次,如今靠鹵肉攤維持生計

新語愛八卦
2025-05-22 15:03:39
阿斯:皇馬今夏簽中場只是過渡選項,終極目標是明年簽羅德里

阿斯:皇馬今夏簽中場只是過渡選項,終極目標是明年簽羅德里

懂球帝
2025-05-31 21:25:15
最新情報傳來,朝鮮利用烏克蘭戰爭,與俄羅斯做了一筆大交易

最新情報傳來,朝鮮利用烏克蘭戰爭,與俄羅斯做了一筆大交易

張牧之
2025-05-31 12:05:06
美防長:這是我們的優先戰區!中國專家:要錢?

美防長:這是我們的優先戰區!中國專家:要錢?

環球時報新聞
2025-05-31 16:25:29
2025-06-01 12:20:50
光錐智能 incentive-icons
光錐智能
來這里,看千行百業的數字化、智能化。
640文章數 137關注度
往期回顧 全部

科技要聞

特朗普突然炒掉NASA準局長,嫌他不"忠誠"?

頭條要聞

玩滑翔傘被“吸”至8000米高空 當事人親述逃生細節

頭條要聞

玩滑翔傘被“吸”至8000米高空 當事人親述逃生細節

體育要聞

亞錦賽女子200米:16歲陳妤頡22秒97奪金

娛樂要聞

張若昀夫婦國外遛娃 男方推平價兒童車

財經要聞

油價繼續下跌?歐佩克宣布將再度增產

汽車要聞

零跑汽車5月交付量達45,067臺 穩居新勢力前三

態度原創

手機
旅游
家居
房產
軍事航空

手機要聞

vivo S20、OPPO Reno13銷量大比拼,結果很意外

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

家居要聞

原木純白 邂逅自然本真

房產要聞

金地華南落子海南自貿港22萬㎡標桿項目,夯實代建行業領軍者地位

軍事要聞

美防長在香會大肆渲染中國威脅 中方回應

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 榆社县| 施秉县| 永宁县| 陵川县| 治多县| 耒阳市| 陕西省| 长丰县| 南充市| 天柱县| 扶风县| 德安县| 从江县| 措美县| 东乌珠穆沁旗| 南阳市| 广东省| 湖南省| 炉霍县| 门源| 鄂尔多斯市| 龙胜| 法库县| 徐水县| 晋宁县| 秀山| 洪泽县| 石门县| 庐江县| 赣榆县| 通州区| 潢川县| 莆田市| 古交市| 龙里县| 保康县| 江门市| 闽侯县| 西乌珠穆沁旗| 铜陵市| 松溪县|