AI風暴席卷全球的第三個年頭,開源大模型始終是行業重點攻堅目標。截止目前,GUI開源大模型已經走過概念驗證階段,逐步向場景調優、端側部署等生態維度延伸,不僅要拼參數、拼執行力,也要拼場景落地能力,各家大廠的技術競賽已然進入決勝階段。
在此階段,開源與合作是一個繞不開的焦點,7月26日在上海揭幕的世界人工智能大會(WAIC)上,這也是行業貫穿始終的核心議題。
在此次WAIC人工智能標準化國際合作論壇上,榮耀作為首批單位,攜手阿里、百度等百余家行業領軍企業共同發布《智能體協議共建共享聯合倡議》,進一步推動行業標準化發展和國際合作。同時,榮耀還帶來了全新驚喜:MagicGUI大模型正式發布并開源。
事實上,國內的大模型開源早已從星星之火演變成燎原之勢,前有DeepSeek-V3、DeepSeek-R1以千億參數構筑智能基座,后有阿里、字節、榮耀等科技巨頭紛紛加碼。對比之下,硅谷眾大廠似乎正“逆流”而行,Meta的Llama、谷歌的Gemma等雖然也開放了部分使用和修改權限,但并未公開訓練數據集、仍在限制開發選項,很難稱得上真正的開源。
大模型的競爭來到這個階段,開源的重要意義正在凸顯:不僅事關技術平權和產業創新,更是構建AI商業生態,加速技術擴散以換取長期價值的關鍵。要抹平中外發展時間差、在產業落地階段搶得先機,就要合全行業開發者之力,通過數以億計的微調催生“鏈式反應”,打破外國巨頭的“算力霸權”——開源是必然選擇。
在此背景下,榮耀MagicGUI面向全球軟硬件開發者正式開源。這不僅是榮耀的首個開源GUI大模型,也是其“阿爾法戰略”的重要里程碑:高達70億的參數規模,基于榮耀Magic V5常用場景用機操控準確率達到91.5%,較業內同類頂級開源模型高出16.4%,性能足以比肩SOTA。(SOTA是"State of the Art"的縮寫,中文可譯為“最先進的”,常用于描述某一領域當前技術或模型的最高水平。例如,在人工智能領域,SOTA模型指在特定任務中性能最優的模型,如數學證明、自然語言處理等方向。)
詳細拆解之下,MagicGUI在GUI數據采集框架、知識數據構建方法、動作空間定義等維度都有一系列開創性成果,比如構建了全新的數據采集與構建框架,優化了數據配比與篩選方案,在此基礎上構建了多樣且高質量的數據集。但其最具突破性的能力,在于對兩大訓練階段——繼續預訓練和強化微調的迭代創新。
首先,在繼續預訓練階段,MagicGUI重點改進數據處理、合成數據等環節,目的是夯實基礎能力,全方位提升大模型在推理、規劃、動作執行上的綜合表現。
比如在數據處理環節中,MagicGUI通過過濾相似、重復數據,搭配啟發式規則和開源模型評估,多重篩選、攔截掉低質數據。合成數據環節同樣以提高數據質量為目的,一邊結合UI元素類別、空間位置、形狀等維度合成更全面的UI描述數據集,一邊優化開源模型,批量合成多難度層次指令數據。
其次,強化微調訓練階段,MagicGUI采用了極具創新性的采樣策略——GRPO雙重過濾方案。
所謂雙重過濾,即靜態過濾與動態過濾的結合:一方面,通過靜態過濾剔除生成響應中始終給出完全正確/錯誤預測的樣本,專注于更有挑戰性和信息量的樣本;另一方面則借助動態過濾模式,不對全部正確/錯誤的結果進行訓練,保證強化微調效果。
技術上的突破有沒有價值,不能光靠參數說話,落地到應用側的效果也是重要檢驗標準。可喜的是,我們已經能看到榮耀MagicGUI借助關鍵能力突破,落地應用榮耀Magic V5等一系列成果,以及對用戶實際生活的幫助。
比如通過一語多平臺打車功能,用戶只需一句話就能在高德、滴滴等主流APP自動完成叫車,此外還可以輕松完成打開APP、修改地址、選擇車型等細致的指令。而在這背后,想必少不了MagicGUI單步操作等關鍵能力的進步。
不積跬步無以至千里,GUI大模型的研發與創新從來不是一蹴而就的,更像是一場比拼耐力的馬拉松。在MagicGUI的發布,承載著榮耀長期、大力度、毫不保留的資源與人才投入。
當然,展望未來,相信中國科技企業也不會停下繼續探索的步伐。目前GUI開源大模型仍有不少困擾整個行業的難題有待解決,如OOD泛化、安全與隱私保護等。
這些難題既是各大科技巨頭的挑戰,也是機會。誰能搶先一步取得下一階段的突破性進展,誰就更有機會搶到技術話語權——而到最終,技術層面上的創新還是會落地產業、應用,給開發者、用戶帶去實打實的便利與體驗優化。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.