6月30日,華為正式宣布將盤古7B(70億參數)、盤古Pro MoE 72B(720億參數混合專家模型)及昇騰推理技術開源。
從旁觀視角來看,華為此次開源絕非簡單的技術共享,而是華為昇騰生態的“戰略轉折點”,更是一次對西方AI技術霸權的正面突圍。
因為根據分析來看,盤古Pro MoE 72B 的模型權重和基礎推理代碼已經火速上線開源平臺,而盤古7B 雖說相關資源要晚些時候開放,但已然讓大家翹首以盼。
華為這波操作,直接打破了以往大模型技術 “閉門造車” 的局面,把核心技術大方地擺在臺面上,讓開發者們隨意取用、改造。
從技術實力上看,盤古大模型系列一直是華為的 “秘密武器”。就拿盤古 Pro MoE 72B 來說,它采用的分組混合專家(MoGE)架構簡直是 “黑科技”。通過分組均衡路由技術,實現專家負載動態分配,在昇騰 300I Duo 平臺上單卡推理吞吐量飆升至 321 tokens/s,比同規模模型提升 15%。
這意味著什么?以往模型在處理復雜任務時,常常會因為負載不均 “掉鏈子”,而華為這一技術,直接把這個行業痛點給 “治好了”。再加上軟硬協同優化,昇騰芯片算力利用率(MFU)提升 50% 以上,給超大規模模型工業化部署提供了全新的 “解題思路”。
所以華為這次決定開源,更是昇騰生態戰略的關鍵一步。一直以來,大模型技術研發成本高、門檻高,很多企業有心無力。華為此舉,直接把門檻給降低了。
瞧瞧廣汽集團,靠著盤古多模態大模型,復雜場景復原變得超簡單,智能駕駛模型迭代快得飛起,實現 “兩天一個版本”。
中國石油基于盤古打造昆侖大模型,在 100 多個專業領域落地應用,勘探開發等工作效率大幅提升。這就是開源的魅力,讓大模型技術不再是少數巨頭的 “專利”,能迅速滲透到千行百業。
再看華為云新一代昇騰 AI 云服務,基于 CloudMatrix 384 超節點,單卡推理吞吐量高達 2300 tokens/s,為開發者提供了強大的算力后盾,媲美國際領先水平。
因此總體上來說,華為通過開源,構建 “技術開源 - 生態共建 - 價值共享” 的閉環。往后開發者能依托華為開源平臺、昇騰硬件和 ModelArts 工具鏈,快速定制行業專屬大模型。
華為輪值董事長徐直軍曾直言:“AI產業必須避免走向算力壟斷。”此次開源正是宣言的實踐:當盤古大模型的權重、代碼、推理工具全部開放,昇騰芯片的“生態荒漠”瞬間變成“技術綠洲”。
可以預見,未來可能出現這樣的場景:一家歐洲車企用盤古MoE 72B訓練自動駕駛模型,卻選擇華為昇騰而非英偉達H100部署。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.