華為最新開源的盤古(Pangu)AI大模型,正深陷一場技術(shù)與倫理的風(fēng)暴中心。一場關(guān)于其核心技術(shù)是否“套殼抄襲”阿里巴巴通義千問(Qwen)模型的指控,已迅速從開發(fā)者社區(qū)的竊竊私語演變?yōu)樾袠I(yè)矚目的公開事件。華為于2025年7月5日發(fā)布官方聲明,堅決否認(rèn)了增量訓(xùn)練或抄襲的說法,并強調(diào)其行為嚴(yán)格遵循開源許可。但這起爭議的意義已遠(yuǎn)超個案本身,它如同一面棱鏡,折射出當(dāng)前全球人工智能領(lǐng)域在“開源”旗幟下的模糊邊界、信任困境與秩序重構(gòu)的迫切需求。
一場由“指紋”引發(fā)的“血統(tǒng)”追問
爭議的導(dǎo)火索是一份于7月4日發(fā)布在代碼托管平臺GitHub上的技術(shù)分析報告。該報告的作者——一位自稱為哥斯達(dá)黎加大學(xué)的韓國學(xué)生——采用了一種名為“LLM-Fingerprint”(大語言模型指紋)的技術(shù),對華為盤古Pro MoE模型(總參數(shù)720億)與阿里巴巴通義千問Qwen-2.5 14B模型進(jìn)行了深度比對。
該技術(shù)的核心邏輯是,通過提取和分析模型中每個Transformer層的注意力參數(shù)(QKVO)的標(biāo)準(zhǔn)差,為每個模型生成一個獨特的“指紋”向量。報告指出,盤古Pro MoE模型與通義千問模型在這一“指紋”上的相似度達(dá)到了驚人的0.927(理論最大值為1.0,代表完全一致)。這一數(shù)值遠(yuǎn)超不同獨立訓(xùn)練模型間應(yīng)有的正常差異范圍,因此報告作者斷定,這強烈指向了“非獨立開發(fā)”的可能性。
為指控增添“實證”的,是研究者在盤古開源的代碼文件中,發(fā)現(xiàn)了明確指向阿里巴巴的版權(quán)聲明——“Copyright 2024 The Qwen team, Alibaba Group”。在許多開發(fā)者看來,這無異于一個“忘記擦除的腳印”,似乎坐實了盤古模型與通義千問之間存在直接的代碼繼承關(guān)系。盡管這份引發(fā)軒然大波的GitHub報告在發(fā)布后不久即被刪除,但其提出的技術(shù)疑點和代碼證據(jù)已在行業(yè)內(nèi)迅速發(fā)酵,將華為推上了輿論的風(fēng)口浪尖。
華為的辯護(hù):創(chuàng)新、參考與開源精神
面對洶涌的輿論,華為負(fù)責(zé)盤古大模型研發(fā)的核心團(tuán)隊——諾亞方舟實驗室,在事發(fā)次日(7月5日)午后迅速做出回應(yīng)。這份聲明的核心,可以概括為三點:獨立創(chuàng)新的堅定立場、對開源實踐的合規(guī)遵循,以及對社區(qū)共建的開放態(tài)度。
首先,華為方面明確切割了盤古模型與“基于其他廠商模型增量訓(xùn)練”的關(guān)聯(lián)。聲明強調(diào),盤古Pro MoE是一個“基于昇騰(Ascend)硬件平臺開發(fā)、訓(xùn)練的基礎(chǔ)大模型”。華為特別指出了其關(guān)鍵創(chuàng)新——全球首個面向昇騰硬件設(shè)計的“分組混合專家模型(MoGE)”架構(gòu)。據(jù)稱,該架構(gòu)有效解決了大規(guī)模分布式訓(xùn)練中的負(fù)載均衡難題,是其核心技術(shù)壁壘的體現(xiàn),而非對他人的簡單復(fù)刻。
其次,針對代碼中出現(xiàn)的阿里版權(quán)聲明,華為并未回避,而是將其定義為對業(yè)界開源實踐的參考與尊重。盤古團(tuán)隊承認(rèn),“部分基礎(chǔ)組件的代碼實現(xiàn)參考了業(yè)界開源實踐,涉及其他開源大模型的部分開源代碼”。他們認(rèn)為,嚴(yán)格遵循開源許可證的要求,在代碼中清晰標(biāo)注原始版權(quán)聲明,“不僅是開源社區(qū)的通行做法,也符合業(yè)界倡導(dǎo)的開源協(xié)作精神”。這番解釋試圖將一個看似“抄襲”的證據(jù),重塑為一次合規(guī)、透明的開源協(xié)作行為。
最后,華為重申了其對開放創(chuàng)新和知識產(chǎn)權(quán)的尊重,并歡迎開發(fā)者在官方社區(qū)就技術(shù)細(xì)節(jié)進(jìn)行深入、專業(yè)的交流。這份回應(yīng)措辭嚴(yán)謹(jǐn),試圖從技術(shù)原創(chuàng)性、行為合規(guī)性和開源理念三個層面,全面化解外界的質(zhì)疑。
超越個案:AI開源的“模糊地帶”與信任危機
華為盤古與阿里通義千問的這場風(fēng)波,絕非孤例。它深刻地揭示了在人工智能大模型時代,傳統(tǒng)軟件領(lǐng)域的“開源”概念正面臨前所未有的挑戰(zhàn)。近年來,從零一萬物(01.AI)的Yi系列模型被指架構(gòu)與Meta的Llama高度相似,到斯坦福大學(xué)團(tuán)隊的Llama3-V項目被證實“套殼”了中國初創(chuàng)公司面壁智能的MiniCPM模型,類似的爭議已屢見不鮮。
這些事件共同指向了一個核心問題:在AI大模型領(lǐng)域,開源的邊界究竟在哪里?
傳統(tǒng)的軟件開源,主要涉及代碼的開放。其許可證(如Apache, MIT, GPL)對代碼的復(fù)制、修改、分發(fā)和商業(yè)使用有相對明確的規(guī)定。然而,一個AI大模型的核心價值,不僅在于其實現(xiàn)代碼,更在于經(jīng)過海量數(shù)據(jù)和巨大算力“煉”出的模型權(quán)重(即參數(shù))。這些權(quán)重構(gòu)成了模型的“智能”本身。目前,行業(yè)對于模型權(quán)重的開源、借鑒乃至“化用”,缺乏統(tǒng)一、清晰的法律和道德準(zhǔn)繩。
使用一個開源模型的架構(gòu)進(jìn)行重新訓(xùn)練、參考部分實現(xiàn)代碼、還是直接使用或微調(diào)他人訓(xùn)練好的模型權(quán)重,這三者之間存在著巨大的灰色地帶。加之訓(xùn)練一個世界級大模型的成本動輒數(shù)億甚至數(shù)十億美元,這使得“站在巨人的肩膀上”成為一種普遍的技術(shù)發(fā)展路徑和商業(yè)誘惑。正如DeepSeek等優(yōu)秀開源底座模型的風(fēng)靡所顯示的,完全從零開始的自研已成為少數(shù)巨頭的特權(quán)。
此次爭議中,盡管有技術(shù)專家指出,僅憑“模型指紋”的標(biāo)準(zhǔn)差相似度來判定“抄襲”可能并不完全科學(xué),但它無疑觸動了行業(yè)最敏感的神經(jīng)——信任。在一個依賴協(xié)作與共享精神的開源社區(qū),任何關(guān)于“血統(tǒng)”純潔性的疑慮,都可能侵蝕其賴以生存的根基。
截至目前,事件的另一方,阿里巴巴通義千問團(tuán)隊尚未對此事發(fā)表公開回應(yīng)。然而,整個行業(yè)都在屏息凝視。這起事件的最終走向,無論結(jié)果如何,都將成為一個標(biāo)志性的案例。它迫使所有參與者——從科技巨頭到初創(chuàng)公司,再到每一位開發(fā)者——重新思考和定義AI時代的開源規(guī)則。如何在鼓勵創(chuàng)新、加速技術(shù)迭代的同時,有效保護(hù)知識產(chǎn)權(quán),建立一個公平、透明、可持續(xù)的開源新秩序,已成為全球人工智能行業(yè)亟待解決的重要課題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.