大家好,我是微笑哥。
我在網(wǎng)上看到很多人說,DeepSeek 不是真開源,而僅僅只是開源了 Open Model ?
這里面確實有一些爭議,因為開源確實有很多種?
Linux、Apache、Nginx 這些我們熟悉的開源產(chǎn)品,是完完全全開源的,包括源碼什么的全部開放給大家。
DeepSeek-R1 代碼和模型權重都采用 MIT 許可證, 這意味著用戶可以自由使用、修改和分發(fā)。
但確實也沒有公開訓練數(shù)據(jù)集和訓練代碼! 我們可以把傳統(tǒng)軟件代碼開源和 AI 模型權重開源做個對比:
這在 AI 領域,“開源”的定義較傳統(tǒng)軟件復雜,而且這種開源方式是由 Meta起的頭,管開放權重叫開源!
傳統(tǒng)開源(如 Linux)要求源代碼完全公開,包括開發(fā)過程和數(shù)據(jù)。而 AI 模型的“開源”通常指模型架構、代碼和權重可用,但訓練數(shù)據(jù)和訓練代碼往往不公開。
開源倡議組織(OSI)主任 Stefano Maffulli 曾批評類似 Meta 的 Llama 模型為“偽開源”,因為僅提供權重而不公開數(shù)據(jù)。
既然 Meta 開了這個頭,后面其它的大模型也紛紛表示,這樣我也可以開源,所有 AI 大模型的開源都成這個樣子了。
比如 Llama 、 Gemma、Qwen,當然也包含了 DeepSeek。 開源社區(qū)一看這樣不行呀,得抓緊跟上時代!
于是 OSI(Open Source Initiative,開源代碼促進會)專門針對 AI 提出了三種開源概念,分別是:
開源 AI 系統(tǒng):包括訓練數(shù)據(jù)、訓練代碼和模型權重。代碼和權重需要按照開源協(xié)議提供,而訓練數(shù)據(jù)只需要公開出處(因為一些數(shù)據(jù)集確實無法公開提供)。
開源 AI 模型:只需要提供模型權重和推理代碼,并按照開源協(xié)議提供。
開源 AI 權重:只需要提供模型權重,并按照開源協(xié)議提供。
所謂推理代碼,就是讓大模型跑起來的代碼,或者說大模型的使用代碼,這也是一個相當復雜的系統(tǒng)性工程,涉及到了 GPU 調用和模型架構。
DeepSeek 只開源了權重,并沒有開源訓練代碼、數(shù)據(jù)集和推理代碼,所以屬于第三種開源形式。
所以整個 AI 領域大家都是這樣開源的,完全沒有必要專門指責 DeepSeek 一家不開源。
并且,在同樣是 AI 領域的開源,DeepSeek 的開源預算是最頂級、最徹底的那一檔存在。
到這里,這個事情基本算是解釋清楚了。
做人確實不能太實誠。
AI 領域大模型基本這樣玩了,另外 DeepSeek 沒有提供推理代碼的部分,論文也都寫了。
咱也不能苛求 DeepSeek 一家完全拔干凈呀!
最后,不知道大家有沒有感覺到。
不管其它平臺部署的是不是滿血版本,但從最終生成的效果來看,DeepSeek 官網(wǎng)生成的質量是最好的。
這個問題,我也問了一下 DeepSeek ,它是這樣回答:
DeepSeek 官網(wǎng)的生成質量優(yōu)勢源于技術、數(shù)據(jù)和生態(tài)的全方位閉環(huán)優(yōu)化,其核心在于獨占性資源整合與動態(tài)迭代能力。
對于普通用戶,若需追求極致效果,官網(wǎng)仍是首選。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發(fā)三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
PS:
我一直堅信未來 10-20 年,最大的機會屬于 AI,不管是創(chuàng)業(yè)還是工作,是否擁抱 AI 將會出現(xiàn)極大的差異!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.