近日,在著名開發者論壇github上,有技術大拿曝出猛料,他發帖稱經過與他人的合作研究,發現華為在前段時間開源的盤古Pro MoE大模型存在造假的行為,因為這個模型疑似是通過拼接訓練其他家公司的模型而得來的。
2025年6月30日,華為方面宣布對盤古Pro MoE720億參數的混合專家模型開源,并表示此舉是華為踐行昇騰生態戰略的又一關鍵舉措,推動大模型技術的研究與創新發展,加速推進人工智能在千行百業的應用與價值創造。
但在論壇中,有開發者通過模型的指紋識別出來華為的MoE大模型是由Qwen模型拼接訓練而來的。而Qwen模型,是阿里巴巴所研發的一款大模型。
該開發者發帖稱,隨著目前訓練成本飆升,以及模型復用的情況愈發普遍,所以很多大型語言模型 (LLM) 面臨著嚴重的版權和知識產權盜竊問題。傳統的水印方法很容易被他人抹去,于是有研究人員在大模型中加入了類似人類的“指紋”的標識,這一方法可以在很大程度上防范以上問題。
然而在華為最新開源的盤古Pro MoE模型,與Qwen-2.5 14B表現出極高的相關性,這說明華為的這一模型是“升級改造”,而非從零開始訓練出來的。
開發者還曬出了證據,稱QKV偏差分析顯示,盤古模型與Qwen2.5-14B在三種投影類型(Q、K、V)上均表現出驚人的相似性。兩個模型都表現出幾乎相同的模式。
不僅如此,盤古的代碼里竟然還出現Qwen 2024的license。
如果這一切證據能夠證實盤古模型就是造假的話,那也能說明大模型之間的版權問題已經十分嚴重,同時所屬公司所發布的技術報告也存在著捏造信息的行為。
目前,在github論壇上正有越來越多的開發者正在對此進行研究論證。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.