這兩天的事再次證明,有些群體抹黑華為無所不用其極。拿著一個模棱兩可的東西硬生生把華為抄襲推上了熱搜。說白了,就是要用一盆臟水否定華為所有科技研發(fā)的努力,只有華為的黑料才能壓低一些企業(yè)越來越泛濫的負(fù)面輿情。
那今天我們就來聊一聊兩邊的大模型之間的事,我在之前的視頻有說過,大模型這個東西靠技術(shù)、靠數(shù)據(jù)、靠訓(xùn)練,日積月累才能做成優(yōu)秀的大模型,這種叫底座型大模型。所有一蹴而就、或者忽然橫空出世的大模型絕大多數(shù)都是所謂的蒸餾型大模型。說白了,就是把一些底座型大模型的某些能力優(yōu)化了,變成偏科學(xué)生,某個能力很強(qiáng),其他能力很弱。
從有大模型開始,我們國內(nèi)真正有做底座型大模型的都是有錢、有技術(shù),而且愿意長期投入的公司,就那么幾個,分別是百度文心大模型、阿里的通義大模型、華為的盤古大模型、騰訊的混元大模型、科大訊飛的星火大模型,還有現(xiàn)在互聯(lián)網(wǎng)行業(yè)新秀字節(jié)跳動的云雀大模型發(fā)展十分迅猛。其他的大模型,包括DeepSeek還有某個公司吹了一波牛逼以后一點(diǎn)動靜都沒有的大模型基本都是蒸餾型大模型。
今天的主角是華為的盤古大模型和阿里的通義大模型。現(xiàn)在一些帖子拿了一些云里霧里的數(shù)據(jù)就說盤古大模型抄襲。首先,盤古大模型早在2021年就推出了初代盤古大模型,但是一直都是閉源的,也就是前幾天才宣布部分開源。但是一些研究者只用了幾天就得出這樣的結(jié)論,說明研究的過程本身就是十分草率的。
另一方面,阿里也是最早進(jìn)行大模型研發(fā)的企業(yè),阿里的大模型是2023年8月才宣布開源的。大模型開源是什么意思呢?就是源代碼、參數(shù)權(quán)重、訓(xùn)練數(shù)據(jù)等核心資源完全公開,允許開發(fā)者自由使用、修改和再分發(fā)。
所以,當(dāng)一個大模型開源以后,很多沒有那么強(qiáng)的資金和技術(shù)的企業(yè)或者個人,就可以進(jìn)行借鑒、蒸餾或者本地部署。所以,在2023年8月以后,華為的盤古大模型借鑒通義大模型的一些訓(xùn)練技術(shù)或者大模型思路是完全沒問題。
至于說完全抄襲,這從本質(zhì)上就做不到。因?yàn)閮蓚€大模型的方向就不一樣,盤古大模型更多是工業(yè)大模型,它聚焦政務(wù)、金融、工業(yè)等垂直領(lǐng)域。反正在一些高精尖的工業(yè)領(lǐng)域,在軍工、在宇宙探測等方面其實(shí)都有華為盤古大模型的身影。至少在這一塊,阿里的通義大模型是不具備的,這種能力在中國,只有盤古大模型有。
因?yàn)榘⒗锏耐x大模型更注重?cái)?shù)學(xué)能力、代碼能力、語言能力和工具調(diào)動的能力。因?yàn)榘⒗锿x大模型是比較早開源的底座型大模型,所以當(dāng)前市面上絕大多數(shù)主流的大模型都可以看到通義大模型的身影,這都很正常,這就是開源大模型的意義。
開源大模型能促進(jìn)行業(yè)進(jìn)步,但是對開源公司來說,它吸引全球開發(fā)者參與改進(jìn),加速技術(shù)迭代,幫助企業(yè)實(shí)現(xiàn)技術(shù)領(lǐng)先。但是呢,像DeepSeek這些蒸餾型大模型開源,由于它很多低頻關(guān)聯(lián)的知識都被過濾了,所以知識庫比較單一,就很容易被污染而陷入思維混亂。所以,總的來說,蒸餾型大模型在未來仍然能還是很難和底座型大模型競爭的。
說了這么多,大家應(yīng)該心里有個底了。大家應(yīng)該也知道在互聯(lián)網(wǎng)上到底是誰一直在抹黑華為,因?yàn)榧夹g(shù)不行,就需要用輿論的方式來進(jìn)行企業(yè)段位的強(qiáng)行平權(quán)。怎么說呢,假大空不會因?yàn)榻o別人潑假大空的臟水而變得高大上。
充電寶事件已經(jīng)實(shí)錘了,大量的客觀數(shù)據(jù)也已經(jīng)說明了手機(jī)真實(shí)的銷量,未來或許某些保險公司的員工也會泄露一些車真正的保費(fèi)和出險率數(shù)據(jù),那時候一些車的真實(shí)銷量也會實(shí)錘。總之,互聯(lián)網(wǎng)是一灘渾水,但是未來一次又一次潮水褪去,大家就會慢慢知道,誰在裸泳。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.