6月20日消息,在華為開發者大會2025(HDC 2025)上,華為常務董事、華為云計算CEO張平安宣布基于CloudMatrix 384超節點的新一代昇騰AI云服務全面上線,同時宣布盤古大模型5.5正式發布,自然語言處理(NLP)、計算機視覺(CV)、多模態、預測、科學計算五大基礎模型全面升級。
CloudMatrix 384超節點,新一代昇騰AI云服務
隨著大模型訓練和推理對算力需求的爆炸式增長,傳統計算架構已難以支撐AI技術的代際躍遷。華為云相關專家表示,傳統的分布式系統本質上是一個松耦合系統,服務器之間一般用 25Gbps或100Gbps 以太網帶寬就可以滿足絕大多數應用的需求。而 AI 時代的應用負載與傳統業務有很大不同,當前服務器集群的以太網互聯帶寬已經越來越難滿足前面提到的 AI 時代的訓練、推理等場景的需求。
云平臺必須通過新型的超高性能網絡把大量 GPU、CPU等多元算力連接在一起,并且用“對等架構”替換掉傳統的“主從架構”,讓多元算力可以直接通信,不需要通過 CPU,這樣才能滿足需求,這個能力是 AI 原生云基礎設施最重要的能力。
華為云新一代昇騰AI云服務基于CloudMatrix 384超節點,首創將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網絡MatrixLink全對等互聯,形成一臺超級“AI服務器”,單卡推理吞吐量躍升到2300 Tokens/s,與非超節點相比提升近4倍。
據悉,超節點架構能更好地支持混合多專家MoE大模型的推理,可以實現“一卡一專家”,一個超節點可以支持384個專家并行推理,極大提升效率;同時,超節點還可以支持“一卡一算子任務”,靈活分配資源,提升任務并行處理,減少等待,將算力有效使用率(MFU)提升50%以上。
對于萬億、十萬億參數的大模型訓練任務,在云數據中心,還能將432個超節點級聯成最高16萬卡的超大集群;同時,超節點還可以支持訓推算力一體部署,如“日推夜訓”,訓推算力可靈活分配,幫助客戶資源使用最優。
昇騰AI云服務已為科大訊飛、新浪、硅基流動、面壁智能、中科院、360等超過1300家客戶提供澎湃的AI算力。
基于國產算力,盤古大模型5.5全面升級
與其他大模型廠商,華為在大模型領域的戰略是聚焦行業,通用大模型也是為了更好深入行業AI,盤古大模型的使命是讓各個行業不必重復“造輪子”,不必從零打造自己的企業大模型。基于此,華為云本次發布盤古大模型5.5,五大基礎模型全面升級。
首先是盤古自然語言處理NLP大模型,全新的718B 深度思考模型是一個由256個專家組成的MoE大模型,在知識推理、工具調用、數學等領域大幅增強,處于業界第一梯隊。盤古大模型基于昇騰云的全棧軟硬件訓練,標志著基于昇騰可以打造出世界一流大模型。
同時,盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行升級,例如,盤古提出了自適應快慢思考合一的技術,通過構建難度感知的快慢思考數據和兩階段漸進訓練,實現模型根據問題難易程度自適應地切換快慢思考,簡單問題敏捷回復,復雜問題深度思考,整體模型推理效率提升8倍。
盤古深度研究DeepDiver通過長鏈難題合成、漸進式獎勵等關鍵技術,可以在網頁搜索、常識性問答等應用上獲得很高的執行效率,如可以在5分鐘內完成超過10跳的復雜問答、生成萬字以上的專業調研報告等,大幅提升工作效率。
面向行業企業客戶,華為云提供了盤古基礎及行業大模型、預訓練和后訓練語料、數據工程工具集、模型訓練工具集、行業裁判模型、行業評測平臺六大核心能力,通過華為云ModelArts完備的工具鏈和工程化的方法,將企業自己沉淀的數據資產,進行高質量的增訓、微調和強化學習,讓行業客戶能夠快速打造自己的專業大模型。
中國農業科學院在盤古大模型基礎上,增訓海量專業文獻與跨物種多組學數據,構建了面向育種領域的農業科學發現大模型,實現精準農業專業知識問答、高效基因分析和定向位點設計,縮短了早期研發周期,提升了目標性狀改良精準性。當前,農科院團隊已基于該農業科研智能系統成功地對一種水稻材料進行了株型改良,株高較常規品種降低約25%,抗倒伏能力顯著提升,同時產量不受影響。
會上,張平安還發布盤古醫學、金融、政務、工業、汽車五個具備深度思考能力的行業自然語言大模型,加速行業智能化,并將在6月底正式上線。
基于盤古多模態大模型的世界模型,可以為智能駕駛、具身智能機器人的訓練,構建所需要的數字物理空間,實現持續優化迭代;基于盤古大模型的多模態能力及思維能力,華為云正式發布CloudRobo具身智能平臺;盤古預測大模型采用業界首創的triplet transformer統一預訓練架構,極大地提升預測大模型的精度,并大幅提升跨行業、跨場景的泛化性。盤古科學計算大模型和盤古計算機視覺CV大模型也同步更新。
過去一年,盤古大模型已在30多個行業、500多個場景中落地,在政務、金融、制造、醫療、煤礦、鋼鐵、鐵路、自動駕駛、氣象等領域發揮價值。
加碼AI云,發布企業級Agent平臺
除了幫助客戶更好地擁抱AI,華為云也在不斷通過AI技術重塑云服務,打造AI Native的云。華為云CTO張宇昕發布企業Agent平臺ModelArts Versatile,內置了各類業務場景的經驗模板,支持自助式的智能體開發,Versatile還提供了智能化工具鏈,實現Agent分鐘級工作輸出,達成傳統人工天級工作成果,有效降低Agent開發的復雜度與專業性。
CodeArts Doer構建了業界最全的6大開發領域專業Agent,覆蓋項目經理、產品管理、開發、構建、測試和部署全流程,將軟件研發端到端提效40%以上;GaussDB Doer在精準查詢方面,基于盤古大模型,利用全球上萬個GaussDB運維案例的百億Tokens數據微調,構建專業運維基模型;MetaStudio通過個性化TTS語音合成,數字人的音色相似度、讀音準確率都達到業界領先。
此外,華為云提供包含語料數據安全、模型安全、推理安全、應用安全在內的端到端大模型安全方案。大模型防火墻通過提示詞攻擊防范和敏感內容實時檢測,保障大模型推理安全。一方面識別越獄、角色扮演、惡意指令等主流提示詞攻擊手段;另一方面預置了百萬級規則庫,針對提示詞攻擊的檢出率大于95%,整體能夠幫助模型綜合安全評測得分提升20%以上。
華為云是華為公司面向開發者的統一底座,目標打造昇騰、鴻蒙、鯤鵬、GaussDB、歐拉等各項根技術的生態,目前華為云開發者已超過800萬,支持鯤鵬、昇騰、鴻蒙等生態的開發者總計達到1300萬。(本文首發于鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.