關(guān)注飛總聊IT,了解IT行業(yè)的方方面面。
這幾天在大模型領(lǐng)域里面最大的瓜,是華為的盤古大模型。
具體來(lái)說(shuō),就是華為的盤古大模型被質(zhì)疑套殼和抄襲了阿里的通義千問(wèn)開(kāi)源大模型。
事情最初起源于2025年7月4日。 一項(xiàng)發(fā)布于GitHub的研究指出,華為盤古Pro MoE 模型(總參數(shù)720億)采用了LLM-Fingerprint(模型指紋技術(shù)),與阿里通義千問(wèn)Qwen-2.5 14B模型的注意力參數(shù)分布存在高度相似性,平均相關(guān)性達(dá)0.927(接近完全一致的1.0),顯著超出模型間正常差異范圍,并指向“非獨(dú)立開(kāi)發(fā)”的可能性。
作者自稱是哥斯達(dá)黎加大學(xué)的韓國(guó)學(xué)生。他在文中指出,盤古開(kāi)源代碼文件中發(fā)現(xiàn)標(biāo)注“Copyright 2024 The Qwen team, Alibaba Group”,被質(zhì)疑復(fù)制阿里代碼時(shí)未刪除版權(quán)聲明。
這個(gè)哥斯達(dá)黎加大學(xué)的韓國(guó)學(xué)生的身份,發(fā)的這篇文章,確實(shí)很有意思。
然后就是,有自稱是華為盤古大模型內(nèi)部人士的人在知乎上發(fā)了一貼,網(wǎng)站在這里:
https://zhuanlan.zhihu.com/p/1925163876938391923
總結(jié)一下省流版就是真正干活的人用910訓(xùn)練很辛苦,認(rèn)認(rèn)真真做事情。但是總有一些走捷徑的人喜歡套殼,并且還忽悠住了領(lǐng)導(dǎo),讓真正做事情的人毫無(wú)前途,做無(wú)用功。
至于這個(gè)帖子里面說(shuō)的是真是假,我也不知道。
最后,華為諾亞方舟實(shí)驗(yàn)室7月5日發(fā)布了一個(gè)聲明, 全文如下:
盤古團(tuán)隊(duì)自己的模型部分基礎(chǔ)組件代碼參考了業(yè)界開(kāi)源實(shí)踐,涉及其他大模型的部分開(kāi)源代碼都遵循了開(kāi)源許可證的要求,在開(kāi)源代碼文件中清晰標(biāo)注出來(lái)了。
總而言之,就是確實(shí)有參考,而且確實(shí)也把參考了的都標(biāo)注出來(lái)了。至于參考的是不是通義千問(wèn),標(biāo)注出來(lái)的是不是通義千問(wèn)的源代碼,就沒(méi)具體說(shuō)了。
盤古大模型到底是不是套殼了通義千問(wèn)這個(gè)問(wèn)題,聲明并沒(méi)有直接給出是,或者否的回答。
因此你要問(wèn)我的話,負(fù)責(zé)一點(diǎn)回答,我也只能說(shuō),我也不知道。
要是大數(shù)據(jù),我大概率還能做個(gè)自己的判斷。到了大模型,那我真的是不懂。隔行如隔山。看不懂才是常態(tài)。
但是知乎這篇文章挺有意思的,不管說(shuō)的是真的,還是假的,其實(shí)都挺有意思的。
我說(shuō)挺有意思的,是這里面的某些關(guān)于華為的描述,包括領(lǐng)導(dǎo)的做事方式的描述,還是很有華為那股味道的。
一個(gè)從來(lái)都沒(méi)在華為干過(guò)的人,要想寫出這股味道來(lái),還是頗有難度的。一般人寫不出來(lái)。
所以,雖然我無(wú)法判斷真假,但是我想不管真的還是假的,似乎,寫這篇文章的人,都是對(duì)華為內(nèi)部很了解的人。
所以這篇文章的內(nèi)容就很有意思了。
這篇文章里面對(duì)昇騰910的描述也同樣就很有意思了。有些時(shí)候,我們還是要相信華為的硬件研發(fā)能力,910畢竟還是國(guó)產(chǎn)卡里能打的。
至于是不是套殼,有沒(méi)有抄襲,這些事情,有的時(shí)候不僅僅很難界定邊界在哪里,而且也很難界定到底做了還是沒(méi)做了。
在這個(gè)情況下,我覺(jué)得不下結(jié)論,也是一種態(tài)度。
但是,我有個(gè)問(wèn)題一直想問(wèn),為什么DeepSeek一開(kāi)源,DeepSeek團(tuán)隊(duì)的論文一公布,連Meta都要連夜組織好幾個(gè)小組研讀,破解,而盤古大模型一開(kāi)源,我好像沒(méi)看到這種動(dòng)向。
可能,這盤古大模型開(kāi)源以后,全世界的反應(yīng),本身,也就代表了一種投票吧。
推薦飛總知識(shí)星球,在私域場(chǎng)合里暢所欲言,聊聊職場(chǎng)發(fā)展的事情,和飛總提問(wèn)交流,這么低的價(jià)格不會(huì)一直保留,機(jī)會(huì)難得,一定不要錯(cuò)過(guò)這個(gè)的機(jī)會(huì)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.