華為盤古大模型研發涉嫌套殼抄襲一事,還在繼續發酵。
7月7日,在github上,有人上傳了一篇新文章《討賊王云鶴檄文》,矛頭直指現任華為諾亞方舟實驗室主任王云鶴。(全文附在文末)
這篇2500多字的長文中,作者指控王云鶴在短短7年內從普通研究員升至實驗室主任,卻缺乏相應資歷,并利用職權竊取其他團隊(如唐睿明、尚利峰團隊)的技術成果,通過“套殼”外部模型(如阿里千問、DeepSeek)偽裝成自研成果,剽竊盤古團隊技術成果并大肆宣傳以邀功。
作者在文章中還爆出了大量細節:王云鶴被指急功近利,違反華為“純昇騰芯片訓練”的規定,私下使用英偉達芯片進行訓練;打壓堅持國產化研發的團隊,還公然占用同事的研究成果發布論文;又使用套殼模型進行測試。
王云鶴(公開資料圖)
因為其管理風格,導致大量核心人才流失,如訓練核心人員離開超過40人,其中天才少年若干,17, 18級干部不計其數。
最后,他批判王云鶴及其團隊剽竊套殼抄襲等行為,表示這會大大耽誤中國的AI發展進程。
對于這篇長文,以及之前的6000字長文,盤古大模型相關團隊目前均未有回應。
最后附上這篇文章的全文:
《討賊王云鶴檄文》
王云鶴,1991年生于黑龍江。2018年博士畢業進入華為,經歷不到7年時間,于2025年2月中旬,從小模型實驗室主任任上,正式頂替姚駿,被任命為諾亞方舟實驗室主任(這一位置的前任包括大家耳熟能詳的楊強、李航等,王云鶴可謂德不配位),搖身一變成為了原本對手團隊的直接領導,為其直接“搶果子”而非“賽馬”提供了直接方便。
在此之后,他可以名正言順地領導Infra團隊人力(主要來自AI系統組),并要走所有的數據、核心代碼,和本就稀少的計算資源,用來實驗他的“套殼核心技術秘密”、“水印去除技術”。
在他上來之前,大家可能都沒怎么聽說華為大模型有什么動靜吧。現在,王云鶴就是諾亞方舟實驗室的主任。這也是近期各大媒體,包括 機器之心、新智元和量子位上每天都能頭條看到華為消息的主要原因(這三大公眾號的頭條,價格不菲)。這個人的知乎、小紅書等社交媒體,都是實名,因為他是一個極其喜歡宣傳的人。
因此,很多聲音認為其所謂的“內斗”在大廠是再正常不過的一件事,這件事也不例外。我竊以為是完全不正確的。我知道很多人不齒華為國產化的路線,認為其是“行業百草枯”,但我們可以從大的角度看一下這個問題。
華為諾亞方舟實驗室下的大模型團隊,大部分是才華橫溢的香港、985和海歸博士,以及部分動手能力極強的碩士。進入大模型時代,其核心使命除了訓好各類的語言、多模態理解和生成模型之外,還肩負著硬件國產化的使命,其團隊全部的語言模型訓練,都有嚴格的“只用昇騰”的規定。這一規定,從公司的角度講,是希望純昇騰訓練模型的效果能被大眾認可。然而,王云鶴及其團隊不但技術水平低下,且極為急功近利,無視國產化使命,無組織無紀律,在項目的大部分時間公然使用英偉達的芯片訓練模型。
搞過算法,接觸過AI模型訓練的人都知道,昇騰芯片環境需要大量的配置,唐睿明、尚利峰團隊——“真正的盤古團隊”,從2023年初開始踩坑,排查并升級了mindspore, 昇騰芯片等一系列國產化軟硬件協同時的問題。他們的同學、朋友此時可能因為使用非國產化芯片而快速積累認知,快速成長,從而在人才稀缺的大模型市場有了很多更好的待遇和機會。但他們卻選擇沉下心來,陪伴昇騰、陪伴PanGu一整套小米加步槍的訓練基建,一起成長,只為了搞好自己的大模型,無論從哪一個角度講,無論,這都是對國產化,對自主可控模型訓練功不可沒的貢獻。
在其他團隊在項目開始階段頻頻踩坑時,王云鶴充耳不聞。在其他團隊有些成果的時候,王云鶴聞味而來,企圖先用“詞表巧換技”占據先機。在某天才少年向姚駿(時任諾亞方舟實驗室主任)指出王云鶴的小模型實驗室開始套殼的時候,王云鶴對他說“你不愿意在這待著你就滾”。在王云鶴徹底成為諾亞方舟實驗室主任的時候,他野心畢露,開始瘋狂宣傳其“小模型實驗室訓練出的超級大模型”,向領導邀功,向誠實的AI學術研究人員們秀其敝帚。
此外,在學術界,王云鶴抱著Dacheng Tao的大腿劣幣驅逐良幣,操縱NeurIPS論文審稿使其“水貨”文章被錄用。并主導引進了Fisher Yu這一劣跡斑斑、PUA女學生致死的所謂計算機科學家來諾亞當吉祥物。矛盾的是,卻極為喜歡用論文來“秀肌肉”,被其發論文的Pangu Ultra MoE模型,其中的核心算法技術全部來自于唐睿明、尚利峰團隊,但是測試卻使用了套殼的模型,導致指標“幾乎和DeepSeek一模一樣”,完全是“彼之金玉,裝吾之敝帚”。
王云鶴,就是諾亞方舟實驗室里的祁同偉,他因為給人家捻發票捻得好手眼通天,有恃無恐。村里的野狗,都能被他拉來當警犬。這完全是一起有組織、有預謀的竊取“真正的盤古團隊”的勝利果實行為。
王云鶴此刻在內網,仍不認罪,且拒絕正面回答一切問題,并稱其“獨特的訓練技巧”經過了領導的決策。他對上沒有擔當,同時仰仗其他團隊的成果卻毫無尊重。另外,值得注意的是,他在內網完全否認718B存在強行賽馬的事實,也不正面回應套殼,即“不存在兩個718B”。
社區要警惕王云鶴,是因為他還在壓榨原四縱的殘余力量,加班加點地訓練完一個真正的718B。雖然這一模型沒有戰勝套殼導致了唐睿明、尚利峰團隊賽馬失敗,但是王云鶴還在把他當“勝負手”,當作自己可以搖身一變重回“白蓮花”的一技“還我漂漂拳”。不排除其居心叵測,想要在未來把718B開源出來,甚至直接用HonestAGI提出的方法測試一遍相似度,堂而皇之地堵住其他人的嘴。當然,這一模型的原生表現應該較差,不會和報告中一致,王云鶴肯定會祭出祖傳的“測試集訓練術”。倘若真有那一天,希望有條件跑起來的大廠、各實驗室,可以嘗試考驗模型對測試集的熟悉程度。看看我們這位考生,是不是背熟了高考卷子,來到了學術誠信這一嚴肅無比的考場!
據不完全統計,經王云鶴此舉,受影響而離開華為的大模型預訓練、后訓練核心人員超過40人,其中天才少年若干,17, 18級干部不計其數。另外,AI圈的其他研究者們看到華為的內部亂象,是否還愿意把青春獻給中國芯片上的大模型,我要打一個問號。如今很多國企都有昇騰的訂單,如果他們的前方只剩王云鶴這樣的人替他們積累訓練經驗,中國的AI發展又會倒退多少年?
身在華為,王云鶴今天造假的是718B,明天就可能是大國重器上的通信計算設備,無人機的控制系統,作戰通信終端的核心元件。。。
因此,王云鶴及其小模型實驗室團隊,其剽竊套殼行為必須受到審判。其小模型實驗室中所有不學無術、只想摘果子的成員,勢必要被釘在中國大模型發展的恥辱柱上,遺臭萬年。
回應
- 關于135B dense模型指標的質疑(注:作者附上相關鏈接,但目前已暫時失效)
- 此報告撰寫過程中,王云鶴已然上任(理智的人可以分析arxiv報告上載時間)。與Pangu Ultra MoE完全一致,在文章攥寫過程中,可笑的是,大部分被掛名的、實際做事的被列為Contributor的研究者,在論文撰寫過程中對其存在、進度全然不知。其只挑選了唐睿明、尚利峰團隊的一小部分成員對其傾囊相授,將所有問題、技術點等凝練成文中方法及之前的部分。而對于模型的實際效果和測試集表現,小模型團隊大包大攬,唐睿明、尚利峰成員幾乎全然不知,或者是被剝奪了抗議的權利,最終導致報告中列出了假到極致的訓練測試集后的結果。
- 與尊重學術道德的DeepSeek團隊不同,理智的人可以仔細搜索作者名單每個人,這篇文章的Core Contributor幾乎全是領導,而不是實際的技術人員,文章作者共有52位,源于王云鶴和某領導沆瀣一氣,得出的**“幸運52”**這一決策,可謂恬不知恥,毫無學術道德。
- 陸續也有他人回答,此處可以參閱issue區
從匿名、AI生成等角度,無腦噴之前論文和這個倉庫的所有人。我建議你們試試,如果你家里有著家屬和孩子依靠著你從事的這份工作,你能不能和《讓子彈飛》的六子一樣,切開肚子給人看看你里面有幾碗粉?
事件回顧:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.