6月30日,華為正式開源部分盤古大模型體系。此次華為開源內容呈現技術矩陣化特征,具體包括:70億參數的盤古稠密模型、720億參數的盤古ProMoE混合專家模型,以及配套的昇騰模型推理技術體系,宣稱這是構建昇騰生態的關鍵舉措。
僅隔四天,GitHub研究指出盤古ProMoE與Qwen-2.5的注意力參數分布高度相似(平均相關性0.927),代碼文件含版權聲明,引發“非獨立開發”質疑。華為回應稱,部分基礎組件代碼參考了業界開源實踐,嚴格遵循開源協議并標注版權,符合開源協作精神。
圖為華為諾亞方舟實驗室聲明截圖
7月5日,針對盤古ProMoE模型被質疑套殼阿里通義千問Qwen-2.5的爭議,華為諾亞方舟實驗室發布聲明稱,該模型是基于昇騰硬件平臺開發、訓練的基礎大模型,非基于其他廠商模型增量訓練,并強調其創新了全球首個面向昇騰硬件的分組混合專家(MoGE)架構,解決分布式訓練負載均衡難題,提升訓練效率。
開發團隊稱,盤古ProMoE開源模型部分基礎組件的代碼實現參考了業界開源實踐,涉及其他開源大模型的部分開源代碼。“我們嚴格遵循開源許可證的要求,在開源代碼文件中清晰標注開源代碼的版權聲明。這不僅是開源社區的通行做法,也符合業界倡導的開源協作精神。我們始終堅持開放創新,尊重第三方知識產權,同時提倡包容、公平、開放、團結和可持續的開源理念。”
圖為爆料文章截圖
據東南早報報道,在7月6日凌晨,一位自稱是盤古大模型團隊的員工自曝,確實存在套殼、續訓、洗水印的現象。截至目前,華為方尚未對此爆料內容發表聲明。
針對此事后續進展,本網將持續關注。
來源|中國山東網綜合大象新聞、新京報、東南早報、諾亞方舟實驗室微信公號等
編輯|陳吉康
復審|張侃
終審|王蒨
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.