上一篇華為盤古大模型的內部自爆文章后,作者的安危是自己十分擔心的問題。
畢竟,有太多的前塵往事。
好在原作者最新更新了,肉身暫時安全。
各位好,
感謝大家的關心與祝福。我目前暫時安全,但公司應該在進行排查與某些名單收集,后續情況未知。
我補充一些細節,以免某些人繼續顛倒黑白。
關于135B V2,小模型實驗室在迅速地完成套殼并拿完所有套殼帶來的好處后(比如任務令表彰和及時激勵),因為不想繼續支撐下游應用和模型迭代,又把這個燙手山芋甩給了四縱。確實技高一籌,直接把四縱的兄弟們拉下水。同事提供過去一個老舊的模型,最終拿回了一個當時一個魔改的先進的千問。做大模型的人,自己做的模型就像自己孩子一樣熟悉,不要把別人都當傻子。就像自家兒子出門一趟,回來個別人家孩子。
盤古report的署名是不符合學術規范的。例如,135B V3有不少有技術貢獻的人,因為作者名額數量限制,勞動成果沒有得到應有的回報,團隊內曾經有不小的意見。這個模型當時是大家智慧和汗水的結晶,甚至是團隊當時的精神支柱,支撐著不少兄弟們繼續留在諾亞。所謂的名額限制,以及掛名了一些毫無技術貢獻的人(如一些小模型實驗室的人),讓兄弟們何其心寒。
暫時平安。另外,支持我勇于說出真相的戰友們
前兩天火車停半道,一車人悶熱難耐,最后一個男人打破了車窗。
所有人都呼吸到了新鮮空氣,但沒有多少人記得支持打破車窗的男人。
那個孤獨的男人,是個孤勇者。
b站上很多年輕人都喜歡這首歌,有很多翻唱,比原唱都出彩。
但現實生活中,孤勇者沒幾個,有也得不到眾人的明牌支持。
就如同讓子彈飛里,張麻子威逼利誘都只能贏得一群走地大鵝的支持。
另一邊,針對華為盤古團隊的領導檄文也出來了。
感覺有種星星之火可以燎原的味道,刻板印象里木訥的碼農,也學會了寫文章。
效果不會比宋江酒后吟詩差。
只是,唯一的一個缺陷,任正非還在保持沉默。
前段時間阿里怨婦萬字長文出來后,馬云還是很體面大度的回應了一句:以后歡迎回來。
馬云的弟子能落個體面,那任正非呢?
恐怕此時正在被公關摁著嘴。
以下貼出是部分討賊檄文
文章license和Qwen一樣,apache-2.0。
討賊王云鶴檄文
因此,很多聲音認為其所謂的“內斗”在大廠是再正常不過的一件事,這件事也不例外。我竊以為是完全不正確的。我知道很多人不齒華為國產化的路線,認為其是“行業百草枯”,但我們可以從大的角度看一下這個問題。
華為諾亞方舟實驗室下的大模型團隊,大部分是才華橫溢的香港、985和海歸博士,以及部分動手能力極強的碩士。進入大模型時代,其核心使命除了訓好各類的語言、多模態理解和生成模型之外,還肩負著硬件國產化的使命,其團隊全部的語言模型訓練,都有嚴格的“只用昇騰”的規定。這一規定,從公司的角度講,是希望純昇騰訓練模型的效果能被大眾認可。然而,王云鶴及其團隊不但技術水平低下,且極為急功近利,無視國產化使命,無組織無紀律,在項目的大部分時間公然使用英偉達的芯片訓練模型。
搞過算法,接觸過AI模型訓練的人都知道,昇騰芯片環境需要大量的配置,唐睿明、尚利峰團隊——“真正的盤古團隊”,從2023年初開始踩坑,排查并升級了mindspore, 昇騰芯片等一系列國產化軟硬件協同時的問題。他們的同學、朋友此時可能因為使用非國產化芯片而快速積累認知,快速成長,從而在人才稀缺的大模型市場有了很多更好的待遇和機會。
但他們卻選擇沉下心來,陪伴昇騰、陪伴PanGu一整套小米加步槍的訓練基建,一起成長,只為了搞好自己的大模型,無論從哪一個角度講,無論,這都是對國產化,對自主可控模型訓練功不可沒的貢獻。
在其他團隊在項目開始階段頻頻踩坑時,王云鶴充耳不聞。在其他團隊有些成果的時候,王云鶴聞味而來,企圖先用“詞表巧換技”占據先機。在某天才少年向姚駿(時任諾亞方舟實驗室主任)指出王云鶴的小模型實驗室開始套殼的時候,王云鶴對他說“你不愿意在這待著你就滾”。在王云鶴徹底成為諾亞方舟實驗室主任的時候,他野心畢露,開始瘋狂宣傳其“小模型實驗室訓練出的超級大模型”,向領導邀功,向誠實的AI學術研究人員們秀其敝帚。
此外,在學術界,王云鶴抱著Dacheng Tao的大腿劣幣驅逐良幣,操縱NeurIPS論文審稿使其“水貨”文章被錄用。并主導引進了Fisher Yu這一劣跡斑斑、PUA女學生致死的所謂計算機科學家來諾亞當吉祥物。矛盾的是,卻極為喜歡用論文來“秀肌肉”,被其發論文的Pangu Ultra MoE模型,其中的核心算法技術全部來自于唐睿明、尚利峰團隊,但是測試卻使用了套殼的模型,導致指標“幾乎和DeepSeek一模一樣”,完全是“彼之金玉,裝吾之敝帚”。
王云鶴,就是諾亞方舟實驗室里的祁同偉,他因為給人家捻發票捻得好手眼通天,有恃無恐。村里的野狗,都能被他拉來當警犬。這完全是一起有組織、有預謀的竊取“真正的盤古團隊”的勝利果實行為。
王云鶴此刻在內網,仍不認罪,且拒絕正面回答一切問題,并稱其“獨特的訓練技巧”經過了領導的決策。他對上沒有擔當,同時仰仗其他團隊的成果卻毫無尊重。另外,值得注意的是,他在內網完全否認718B存在強行賽馬的事實,也不正面回應套殼,即“不存在兩個718B”。
因此,王云鶴及其小模型實驗室團隊,其剽竊套殼行為必須受到審判。其小模型實驗室中所有不學無術、只想摘果子的成員,勢必要被釘在中國大模型發展的恥辱柱上,遺臭萬年。
回應
關于135B dense模型指標的質疑:https://github.com/HW-whistleblower/True-Story-of-Pangu/issues/317:
此報告撰寫過程中,王云鶴已然上任(理智的人可以分析arxiv報告上載時間)。與Pangu Ultra MoE完全一致,在文章攥寫過程中,可笑的是,大部分被掛名的、實際做事的被列為Contributor的研究者,在論文撰寫過程中對其存在、進度全然不知。其只挑選了唐睿明、尚利峰團隊的一小部分成員對其傾囊相授,將所有問題、技術點等凝練成文中方法及之前的部分。而對于模型的實際效果和測試集表現,小模型團隊大包大攬,唐睿明、尚利峰成員幾乎全然不知,或者是被剝奪了抗議的權利,最終導致報告中列出了假到極致的訓練測試集后的結果。
與尊重學術道德的DeepSeek團隊不同,理智的人可以仔細搜索作者名單每個人,這篇文章的Core Contributor幾乎全是領導,而不是實際的技術人員,文章作者共有52位,源于王云鶴和某領導沆瀣一氣,得出的**“幸運52”**這一決策,可謂恬不知恥,毫無學術道德。
陸續也有他人回答,此處可以參閱issue區
從匿名、AI生成等角度,無腦噴之前論文和這個倉庫的所有人。我建議你們試試,如果你家里有著家屬和孩子依靠著你從事的這份工作,你能不能和《讓子彈飛》的六子一樣,切開肚子給人看看你里面有幾碗粉?
——正道的光——
“如果天空是黑暗的,那就摸黑生存;如果發出聲音是危險的,那就保持沉默;如果自覺無力發光,那就蜷伏于墻角。
但不要習慣了黑暗就為黑暗辯護;不要為了自己茍且而得意;不要嘲笑那些比自己更勇敢熱情的人們。
我們可以卑微如泥土,但不可以扭曲如蛆蟲?!?/p>
輿論這個舞臺, 正義不發聲,就會被歪理邪說占領。
覺得文章還算正常的話,歡迎點贊、關注、轉發、在看,讓正常的聲音占領廣場,耳根子也能清凈會,世界也會更好一點點。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.