99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

剛剛,華為發布!

0
分享至

數據是個寶

數據寶

投資少煩惱

中國AI產業注入強心劑。

5月30日,券商中國記者從華為獲悉,華為在MoE模型訓練領域再進一步,重磅推出參數規模高達7180億的全新模型——盤古Ultra MoE,這是一個全流程在昇騰AI計算平臺上訓練的準萬億MoE模型。同時,華為發布盤古Ultra MoE模型架構和訓練方法的技術報告,披露眾多技術細節,充分體現了昇騰在超大規模MoE訓練性能上的跨越。

業內人士分析,華為盤古Ultra MoE和盤古Pro MoE系列模型的發布,證明華為不僅完成了國產算力+國產模型的全流程自主可控的訓練實踐,同時在集群訓練系統的性能上也實現了業界領先。這意味著國產AI基礎設施的自主創新能力得到了進一步驗證,為中國人工智能產業的發展提供了一顆“定心丸”。

國產算力與國產模型重大突破

據悉,訓練超大規模和極高稀疏性的MoE模型極具挑戰,訓練過程中的穩定性往往難以保障。針對這一難題,華為盤古團隊在模型架構和訓練方法上進行了創新性設計,成功地在昇騰平臺上實現了準萬億MoE模型的全流程訓練。

在模型架構上,盤古團隊提出Depth-Scaled Sandwich-Norm(DSSN)穩定架構和TinyInit小初始化的方法,在昇騰平臺上實現了超過18TB數據的長期穩定訓練。此外,他們還提出了EP loss負載優化方法,這一設計不僅保證了各個專家之間的能保持較好的負載均衡,也提升了專家的領域特化能力。同時,盤古Ultra MoE使用了業界先進的MLA和MTP架構,在預訓練和后訓練階段都使用了Dropless訓練策略,實現了超大規模MoE架構在模型效果與效率之間的最佳平衡。

在訓練方法上,華為團隊首次披露在昇騰CloudMatrix 384超節點上,高效打通大稀疏比MoE強化學習(RL)后訓練框架的關鍵技術,使RL后訓練進入超節點集群時代。同時,在5月初發布的預訓練系統加速技術基礎上,在不到一個月的時間內,華為團隊又完成了一輪迭代升級,包括:適配昇騰硬件的自適應流水掩蓋策略,進一步優化算子執行程序,進一步降低Host-Bound以及提升EP通信的掩蓋;自適應管理內存優化策略的開發;數據重排實現DP間Attention負載均衡;以及昇騰親和的算子優化,這些技術實現萬卡集群預訓練MFU由30%大幅提升至 41%。

此外,近期發布的盤古Pro MoE大模型,在參數量僅為720億、激活160億參數量的情況下,通過動態激活專家網絡的創新設計,實現了以小打大的優異性能,甚至可以媲美千億級模型的性能表現。在業界權威大模型榜單SuperCLUE最新公布的2025年5月排行榜上,位居千億參數量以內大模型排行并列國內第一。

業內人士分析,華為此舉的核心意義在于,證明了在國產AI算力平臺(昇騰)上,能夠高效、穩定地訓練并優化達到國際頂尖水平的超大規模稀疏模型(MoE),實現了從硬件到軟件、從訓練到優化、從基礎研究到工程落地的“全棧國產化”和“全流程自主可控”的閉環,并在關鍵性能指標上達到業界領先水平。

國內大模型消息不斷

5月28日,深度求索公司傳來消息,DeepSeek-R1模型已完成小版本試升級,可前往官方網頁、APP、小程序測試(打開深度思考),API接口和使用方式保持不變。

這家總部位于杭州的初創公司今年1月發布了DeepSeek-R1人工智能模型,震驚了全球科技界。R1模型在多項標準化指標上的表現均優于西方競爭對手,而其成本據稱僅為數百萬美元。此舉引發了全球科技股的暴跌,投資者開始質疑,領先的公司是否仍需要投入巨資來構建人工智能服務。

這是自3月底以來,DeepSeek的一次最新動作。3月25日晚,DeepSeek公司在官方賬號上正式宣布V3模型完成小版本升級的消息,并介紹了新版本DeepSeek-V3-0324模型的提升細節,包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。彼時,據海外專業AI模型評測機構最新排名,新版V3模型是得分最高的非推理模型,超過xAI的Grok3和OpenAI的GPT-4.5(preview)。

5月21日,在2025騰訊云AI產業應用峰會上,騰訊大模型戰略首次全景亮相,從自研的混元大模型、到AI云基礎設施,再到智能體開發工具、知識庫以及面向場景的應用,騰訊大模型矩陣產品全面升級。騰訊正通過持續打磨技術和產品能力,為企業和用戶在大模型時代打造真正“好用的 AI”。

在瘋狂卷技術的全球大模型角逐中,騰訊混元正小步快跑、快速迭代,技術能力持續提升。

騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生在會上宣布,在全球公認的權威大語言模型評測平臺Chatbot Arena上,混元TurboS排名已攀升至全球前八,國內僅次于DeepSeek。其中,代碼、數學等理科能力,混元TurboS也進入全球前十。

5月29日,騰訊旗下騰訊元寶、ima、搜狗輸入法、QQ瀏覽器、騰訊文檔、騰訊地圖、騰訊樂享等多款AI應用宣布接入DeepSeek R1-0528,用戶在不同產品中,選擇DeepSeek模型R1深度思考,都可以體驗到DeepSeek R1-0528最新的深度思考、編程和長文本處理等能力。

來源:券商中國

聲明:數據寶所有資訊內容不構成投資建議,股市有風險,投資需謹慎。

責編:林麗峰

校對:劉榕枝

數據寶

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
把觀眾當傻子?又丑又沒演技,這一次,沒有人會為她的作品買單

把觀眾當傻子?又丑又沒演技,這一次,沒有人會為她的作品買單

近史閣
2025-04-19 17:31:13
1992年,南斯拉夫解體,最終分裂為6個國家,如今哪個混的最好?

1992年,南斯拉夫解體,最終分裂為6個國家,如今哪個混的最好?

貓眼觀史
2024-03-30 20:00:32
37℃、38℃、39℃!連續一周熱熱熱,還有強降雨!要注意→

37℃、38℃、39℃!連續一周熱熱熱,還有強降雨!要注意→

掌上金牛
2025-06-12 09:41:11
退休后才發現:大多數退休老人不去旅游,去旅游的是這幾類人

退休后才發現:大多數退休老人不去旅游,去旅游的是這幾類人

生活不過如此呀
2025-05-29 06:20:03
中國男籃再出現壞消息,日本隊宣布亞洲杯陣容,郭士強奪冠太難了

中國男籃再出現壞消息,日本隊宣布亞洲杯陣容,郭士強奪冠太難了

宗介說體育
2025-06-11 14:16:00
成本15賣1000!年銷30萬坑害全國,央視最新曝光,趕緊告訴家里人

成本15賣1000!年銷30萬坑害全國,央視最新曝光,趕緊告訴家里人

新語愛八卦
2025-06-11 17:47:34
這波居然讓張柏芝“贏麻了”,王菲直接被比下去了!

這波居然讓張柏芝“贏麻了”,王菲直接被比下去了!

小光侃娛樂
2025-05-16 22:45:03
毛主席寫信邀請蔣介石回大陸,蔣讀了半小時,以四字回應送信人

毛主席寫信邀請蔣介石回大陸,蔣讀了半小時,以四字回應送信人

紀實文錄
2025-02-28 17:24:48
許家印大消息!價值113億元“恒大系”不良債權被擺上貨架,抵押資產簡直離譜,甚至還有村里的地皮!涉北京等9城市12個項目

許家印大消息!價值113億元“恒大系”不良債權被擺上貨架,抵押資產簡直離譜,甚至還有村里的地皮!涉北京等9城市12個項目

金融界
2025-06-10 16:51:20
保時捷女銷冠真容曝光!工作6年還生了娃,同事披露她賣車多原因

保時捷女銷冠真容曝光!工作6年還生了娃,同事披露她賣車多原因

寒士之言本尊
2025-06-05 22:08:25
G3步行者116-107雷霆 球員評價:3人滿分,6人及格

G3步行者116-107雷霆 球員評價:3人滿分,6人及格

籃球資訊達人
2025-06-12 12:03:55
鄧文迪將被深圳檢察院起訴?這姐攤上啥事兒了?

鄧文迪將被深圳檢察院起訴?這姐攤上啥事兒了?

李砍柴
2025-06-11 22:29:51
井柏然曬最新素顏照片 網友:這才是真實顏值

井柏然曬最新素顏照片 網友:這才是真實顏值

草莓解說體育
2025-06-11 15:05:52
黃健翔楊晨談國足未來:國足要開始徹底更新換代,選帥要選合適的

黃健翔楊晨談國足未來:國足要開始徹底更新換代,選帥要選合適的

直播吧
2025-06-11 19:20:29
徐靜雨:戴格諾特純垃圾 臥底廢物 網友都能比他做出更好的決定

徐靜雨:戴格諾特純垃圾 臥底廢物 網友都能比他做出更好的決定

直播吧
2025-06-12 11:41:12
李在明邀請中方訪韓,并提出一個鄭重請求,中掛斷電話后只字未提

李在明邀請中方訪韓,并提出一個鄭重請求,中掛斷電話后只字未提

起喜電影
2025-06-12 00:11:48
19歲學霸因差6分滿分跳樓身亡,更多內幕曝光,一細節諷刺至極

19歲學霸因差6分滿分跳樓身亡,更多內幕曝光,一細節諷刺至極

溫柔看世界
2025-06-12 11:57:26
6.12-7.1,運勢爆棚,勢如破竹,4大生肖升官發財

6.12-7.1,運勢爆棚,勢如破竹,4大生肖升官發財

素然追光
2025-06-12 00:20:35
即將反轉!中雨、大雨、暴雨!臺風“蝴蝶”來了

即將反轉!中雨、大雨、暴雨!臺風“蝴蝶”來了

魯中晨報
2025-06-11 20:06:15
里程碑!印第安納步行者拿到總決賽隊史主場首勝

里程碑!印第安納步行者拿到總決賽隊史主場首勝

懂球帝
2025-06-12 11:52:20
2025-06-12 13:28:49
數據寶 incentive-icons
數據寶
運營主體是深圳證券時報社有限公司
16827文章數 166754關注度
往期回顧 全部

科技要聞

一鏡雙目捅破天,華為最快明年Q2超越蘋果

頭條要聞

女業主發視頻求交房被質疑"擦邊" 粉絲量已達到12.7萬

頭條要聞

女業主發視頻求交房被質疑"擦邊" 粉絲量已達到12.7萬

體育要聞

22分鐘27分被贊如科比!馬瑟林比肩妖刀

娛樂要聞

金秀賢贏了 金賽綸父母“隱藏式”失蹤

財經要聞

"特馬"互撕反轉?特朗普回應馬斯克反悔

汽車要聞

全面升級 一汽-大眾速騰L有望于三季度上市

態度原創

家居
本地
藝術
數碼
公開課

家居要聞

精致奢華 豐富的連貫空間

本地新聞

非遺里的河南 | 黃河泥變身千年墨寶,寫字都帶仙氣兒~

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

數碼要聞

Thread 1.4 助力 Apple 設備,智能家居體驗再升級

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 许昌县| 巩留县| 阿拉善盟| 米林县| 伊吾县| 平谷区| 九龙县| 昌邑市| 视频| 武城县| 水富县| 巴林左旗| 枝江市| 左贡县| 高邑县| 德安县| 巫山县| 定边县| 平凉市| 阿瓦提县| 鹤峰县| 旺苍县| 锦屏县| 思茅市| 连州市| 衡阳县| 海阳市| 高淳县| 松原市| 视频| 赤水市| 合江县| 孟州市| 张家港市| 苏州市| 文山县| 同心县| 榆社县| 曲周县| 登封市| 襄垣县|