隨著大模型軍備競賽終極階段越來越近,某些玩家對于“彎道超車”的渴望也變得空前迫切,紛紛開始八仙過海,各顯神通。
5月底,華為發布了大模型盤古Pro MoE 72B,彼時,多家財經、科技媒體上出現了《昇騰×盤古:軟硬協同煉就MoE推理性價比之王!》、《首次打榜就登頂,華為盤古如何以小勝大?》等軟文。
這些不知出自何人之手的杰作吹噓說,與其他動輒千億以上的大模型相比,盤古Pro MoE以72B總參數量達到了59分,千億參數量以內大模型排行并列國內第一。
新近的一份調查意外地扒掉了“國內科技界一哥”的遮羞布。
7月4日,Honest AGI Community 6位成員聯名發表了一篇題為《LLM 的內在指紋:持續訓練不足以竊取模型!》(Intrinsic Fingerprint of LLMs: Continue Training is NOT All You Need to Steal A Model)的論文。
在這篇長達10頁的文章中,幾位研究人員通過比較翔實的實證比較,發現盤古Pro MoE模型與阿里Qwen-2.5 14B模型在注意力參數分布上的平均相關性存在“驚人一致”,高達0.927,遠超其他模型對比的正常范圍。
他們認定,盤古大模型并非從頭訓練,而是通過升級改造技術從Qwen-2.5 14B模型派生而來。
“這突顯了潛在的模型剽竊、版權侵權和信息造假案例。”
/嵌入層局部重置)、學術文件蓄意造假(訓練規模/架構創新聲明)等,系統性掩蓋模型來源和學術不端行為。
不僅如此,傳統模型主要依賴于在訓練或推理階段嵌入的水印技術保護知識產權,論文還說,華為的開發人員在可能意識到了自己的不當行為后,故意采取技術手段刻意偽裝(分詞器
丑聞曝光后,盤古LLM項目組組長解釋說,對方的評估方法不科學,不同層數的模型也可以得到高度相似的結果。
但HonestAGI團隊反擊說,任何分類問題都有一個閾值來識別決策邊界,本次研究疑似值為0.9,且是一個用于初步比較的工具,而盤古“不幸地”在進一步調查之前便觸發了預警。
他們還提出了一個靈魂拷問:論文中對FFN(前饋網絡)的分析以及主頁上發布的許多新結果,這些都是“巧合”嗎?開源社區正在發現分析梯度和鍵值緩存的相似性等更多“巧合”。
在說服HonestAGI團隊無果后,7月5日,盤古Pro MoE技術開發團隊換了一個策略,在華為AI官方公眾號“諾亞方舟實驗室”緊急發布了《關于盤古大模型開源代碼相關討論的聲明》,試圖以情動人。
但是,網友對此似乎并不買賬。
知乎網友“邃石1314”嘲諷說:“就看聲明,至少用了阿里的開源模型,其他的不知道。”另一位網友也補了一刀:“他們甚至不敢在聲明里提千問或者阿里的名字。”
Pro MoE的論文突然遭到404。
就在大家期待雙方進一步正面交鋒的時候,詭異的一幕出現了,質疑盤古
不過,在正義與良知的驅動下,一位深喉挺身而出。
7月6日,盤古大模型團隊研發人員、華為諾亞方舟實驗室員工在某自媒體上撰寫了《盤古之殤:HW諾亞盤古大模型研發歷程的心酸與黑暗》長文,通過自己的所見所聞與部分同事口述,詳細揭露了華為前算法應用部部長、現諾亞方舟實驗室主任、小模型實驗室主任王云鶴多次套殼Qwen 1.5 110B、Qwen 2.5 14B、Deep Seek v3的事實。
“聽同事說他們為了洗掉千問的水印采取了不少辦法,甚至包括故意訓了臟數據。”
在當事人看來,這種事已經遠遠超越了一位技術從業人員的底線,以至于盤古大模型抄襲千問事件鬧得沸沸揚揚之后,其除了有點擔憂盤古品牌又不禁感到大快人心,大家曾在無數日日夜夜,對內部某些人一次次靠著造假就能獲得無數利益的行為咬牙切齒卻無能為力,這種壓抑和羞辱消磨了他們對華為的感情,甚至懷疑自己的人生和價值。
不管這場羅生門能否引發華為高層的重視,最終如何收場,但有一點是肯定的,他們不是第一次被抓包了。
2019年春天,一位數碼博主用P30 Pro對著月亮隨手一拍,照片里連環形山都清晰可見,引發激烈爭議,#華為拍月亮是不是作弊#話題一度沖上熱搜。后來,天文愛好者用專業設備驗證并非華為技術有多出眾,而是主要通過算法優化實現。
去年,該公司在一次發布會上演示大模型生成圖片的程序又出現烏龍,按下Ctrl-C中斷后,屏幕上顯示了time.sleep(6)的代碼。專業人士認為,華為展示的是預先準備好的結果,并非現場運行。
至于他們宣稱耗時數年打造的自研鴻蒙系統則鬧出過更大的笑話,2022年,有網友爆料稱,將自己的華為手機系統默認語言從中文變成英文后,中文界面中顯示的“Harmony OS”秒變“Android System”,鴻蒙被大家紛紛嘲諷成“套殼牌安卓”。
一個擁有20多萬員工的巨無霸為何頻頻出乖現丑?這里面有著多方面的原因,沒有邊界感,無所不為顯然是最重要的因素之一。
不少創業者都對華為心存畏懼,在互聯網上,后者有著“行業百草枯”稱號,所到之處寸草不生。然而,硬幣的另一面是,全面出擊需要大量的資源,即使是年銷售收入超過8600億、居于《財富》中國科技50強冠軍也不可能無限投入,何況近年來鴻蒙系統消耗了大量人力、物力、財力,必然會影響到部分業務的支持力度,這些部門的負責人很容易選擇劍走偏鋒,傷害到整個企業的形象。
實際上,越是大公司越應該明確自己的邊界,既有助于突出自身的主營業務,也能讓別人有錢可掙,形成多贏局面,賺走最后一塊銅板是極度缺乏社會責任感的表現。
人工智能雖然被視為未來十年最重要的技術,但通用大模型窗口正在加速關閉,全球范圍內未來能留在牌桌的不超10家,局勢已經很明朗,有資格參與下一輪角逐的選手基本確定,在很難取得突破的情況下,華為應集中資源打造手頭的鴻蒙,在大模型方面,選擇與Deep Seek、阿里千問或其他開發商服務不寒磣。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.