7月4日,一篇技術論文在專業論壇Github上引起熱議。文章認為,通過比較,發現盤古Pangu Pro MoE 模型與 Qwen-2.5 14B 模型在注意力參數分布上有相關性,超正常范圍。因此引發了技術界對Pangu Pro可能抄襲Qwen大模型的猜測,并引發了不同觀點群體的討論。
而據數智前線從知情人士處獲悉,華為負責盤古大模型開發的諾亞方舟負責人王云鶴在內網針對此事做了回應,核心有兩點:一是面向昇騰訓練的全新架構,意味著盤古大模型是基于昇騰芯片進行訓練的,擁有獨特的架構設計。對方的評估方法不科學;二是使用LLaMA和qwen的開源組件,遵循了開源規范,社區鼓勵,不是抄襲。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.