中國的 OpenAI,出現(xiàn)了。
文|宛辰
編 | 靖宇
文章來源 | 極客公園(ID:geekpark)
對標(biāo) OpenAI o1 正式版的國產(chǎn)大模型來了!
1 月 20 日晚,DeepSeek(深度求索)公司發(fā)布推理模型 DeepSeek-R1 正式版,同步開源模型權(quán)重,并允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。
網(wǎng)友熱評:這,才是真正的OpenAI。能力相當(dāng)于一個月 200 美元的 ChatGPT o1 版本,卻完全免費。
不止如此,DeepSeek 一同開源的還有「技術(shù)報告」,那些訓(xùn)練 R1 時踩過的坑、做過的事通通講給你聽,只為鋪平 AGI 的路。
第一時間閱讀這份技術(shù)報告后,英偉達(dá)高級研究科學(xué)家 Jim Fan 帶來了新鮮解讀,值得我們大聲齊讀:
「我們生活在這樣一個時代:由非美國公司保持 OpenAI 最初的使命——做真正開放的前沿研究、為所有人賦能。這似乎講不通,但戲劇性的往往最有可能發(fā)生。
DeepSeek-R1 不僅開源了大量模型,還泄露了所有訓(xùn)練秘密。他們可能是第一個顯示 RL(強(qiáng)化學(xué)習(xí))飛輪發(fā)揮主要作用、持續(xù)增長的 OSS 項目。
影響可以通過『內(nèi)部實現(xiàn)了 ASI』或『草莓計劃』等神話名稱來實現(xiàn)。也可以通過簡單地轉(zhuǎn)儲原始算法和 matplotlib 學(xué)習(xí)曲線來產(chǎn)生影響。」
中國公司 DeepSeek,正在實現(xiàn)趕超 OpenAI 的使命。
DeepSeek-R1:實力派選擇「秀肌肉」
「DeepSeek-R1」的發(fā)布,擺明了是:有實力所以明晃晃地秀肌肉!
這首先體現(xiàn)在它不整期貨那一套,而是「發(fā)布即上線」,現(xiàn)在,你就可以在 DeepSeek 官網(wǎng)與 App 體驗最新的推理模型 DeepSeek-R1,隨便體驗隨便用,免費。
登錄 DeepSeek 官網(wǎng)或官方 App,打開「深度思考」模式,即可調(diào)用最新版 DeepSeek-R1 完成各類推理任務(wù)。|圖片來源:DeepSeek
DeepSeek-R1 也同步上線了 API,對用戶開放思維鏈輸出,通過設(shè)置 model='deepseek-reasoner' 即可調(diào)用。
值得注意的是 DeepSeek-R1 API 服務(wù)定價為每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16 元。看下面這這圖你會有更直接的體感,輸出 API 價格只有 OpenAI o1 的 3%。低價背后,顯然仍是秀肌肉,價格實力展現(xiàn)了技術(shù)實力——從AI Infra 層面降本的技術(shù)能力。
圖中深藍(lán)色柱子代表 DeepSeek-R1,剩下的灰色、淺藍(lán)、青淺灰分別是 OpenAI o1 不同版本的價格。|來源:DeepSeek
第三波「秀肌肉」體現(xiàn)在開源開放。DeepSeek-R1 開源模型權(quán)重幾乎是選擇了最開放的許可證和用戶協(xié)議,開源 License 統(tǒng)一使用 MIT,產(chǎn)品協(xié)議明確可「模型蒸餾」,主打一個讓大家多多來基于它做二次開發(fā)、集成。DeepSeek 甚至主動給大家示范引導(dǎo)將 R1 作為教師模型來蒸餾出一個更小但仍有實力的模型,「通過 DeepSeek-R1 的輸出,蒸餾了 6 個小模型開源給社區(qū),其中 32B 和 70B 模型在多項能力上實現(xiàn)了對標(biāo) OpenAI o1-mini 的效果」。
事實上,模型開源選擇不同的 License 背后大有學(xué)問,這直接體現(xiàn)不同模型廠商的開放程度,更體現(xiàn)開源背后的目的和策略。比如像 Llama、Qwen、GPT-2 等模型就不止開放權(quán)重,還開放了模型訓(xùn)練的源代碼,這可能是為了追求衍生模型的繁榮。而 DeepSeek-R1 選擇只開放權(quán)重,但換成了標(biāo)準(zhǔn)化、寬松的 MIT License,更多還是為了讓更多開發(fā)者能用起來,感受 DeepSeek-R1 的能力。
我們再來通過幾大主流測試基準(zhǔn)來感受一下 DeepSeek-R1 的實力。「性能對齊 OpenAI-o1 正式版 DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。」
圖片來源:DeepSeek
對于 DeepSeek-R1 帶來的直觀感受,硅基流動聯(lián)合創(chuàng)始人楊攀表示,不止模型能力和性能出色,最近兩個模型 (R1 和 V3) 在訓(xùn)練技術(shù)和模型底層架構(gòu)上都做了領(lǐng)先全球的創(chuàng)新,而且其論文開放程度也震驚了業(yè)界。
在一并公開的模型技術(shù)報告中,DeepSeek 將「DeepSeek-R1」訓(xùn)練技術(shù)全部公開,「旨在促進(jìn)技術(shù)社區(qū)的充分交流與創(chuàng)新協(xié)作」。
根據(jù)技術(shù)報告,硅基流動創(chuàng)始人&CEO 袁進(jìn)輝稱,DeepSeek-R1 是無人區(qū)的探索和發(fā)現(xiàn)。|來源:即刻
對于開源模型加技術(shù)報告,開源社聯(lián)合創(chuàng)始人林旅強(qiáng)此前向極客公園表示,開源是最好的「秀技術(shù)肌肉」的方式,同時「有的開源模型只開源、不講他是怎么做的,但是合乎大家期待的開源模型是要搭配技術(shù)報告,等于是發(fā) paper 了。開源模型不夠的,因為模型是黑盒子,技術(shù)報告會說明一些東西。DeepSeek 他們是很透明地把他的技術(shù)報告拿來公開,即使一定程度還是會捂著掖著,但是已經(jīng)是開得比較有態(tài)度。今天全球范圍的學(xué)術(shù)派還是會認(rèn)為,你把一個東西做出來再以開源的方式,是有學(xué)術(shù)追求的。」
如果 DeepSeek 的目標(biāo)是真正達(dá)到 AGI,就不斷需要把踩過的坑、做過的事情開放出來,讓大家少走一點彎路,開放才能讓整個行業(yè)更快達(dá)到 AGI,他補(bǔ)充道。
最后,我們來隨機(jī)看一些用戶實測評價(截圖來源:X.com):
Twitter 用戶盛贊 R1 的實力|圖片來源:X
DeepSeek,還有什么驚喜是我們不知道的?!
盡管昨晚 DeepSeek-R1 的發(fā)布引發(fā)了「這才是 Open AI 吧」「東方的 OpenAI」等一片稱贊。但 DeepSeek 強(qiáng)得非常扎實、全面。
去年在 2024 年 11 月 20 日發(fā)布 DeepSeek-R1-Lite 預(yù)覽版時,美國著名半導(dǎo)體與 AI 咨詢機(jī)構(gòu) Semianalysis 創(chuàng)始人 Dylan Patel 就坐不住了,第一時間下場「提醒」大家:他們有 5 萬張 H100 GPU!請不要以為他們只有 1 萬張 A100!
因為眾所周知的原因,這大概率不是事實,卻能反映 DeepSeek-R1-Lite 的強(qiáng)悍到讓行業(yè)緊張。
一個月后,DeepSeek 上線并同步開源了媲美 GPT-4o 和 Claude 3.5 Sonnet 的模型「DeepSeek-V3」,并附上了詳實的技術(shù)報告。這一次,幾乎驚動了整個硅谷AI圈。卡神(OpenAI 創(chuàng)始團(tuán)隊、前 Tesla AI 總監(jiān) Andrej Karpathy)、Alexandr Wang(Scale.ai 創(chuàng)始人)、田淵棟(Meta AI 科學(xué)家)、賈揚(yáng)清(Lepton AI 創(chuàng)始人)……人均一句「難以置信」。就連 Sam Altman 都忍不住出來酸一把「復(fù)刻已經(jīng)被驗證過奏效的東西是容易的」。
DeepSeek-V3 發(fā)布后,Sam Altman 疑似喊話 DeepSeek。|截圖來源:X.com
隨著模型性能逐漸走向全球第一梯隊,DeepSeek 也迎來了新的發(fā)展契機(jī)。
過去一年半,DeepSeek 專注于模型和研究,但從今年開始,DeepSeek 著手做應(yīng)用了。
2025 年 1 月 15 日,DeepSeek 推出移動端 AI 助手「DeepSeek」App。目前看,DeepSeek App 跟網(wǎng)頁版功能一致,主要有兩個功能:聯(lián)網(wǎng)搜索和深度思考,主打一個簡潔,聊天記錄也會同步顯示在手機(jī)端和網(wǎng)頁端,尚未針對移動端進(jìn)行特定功能的打磨,也沒有市面上 AI 助手類 App 豐富、fancy 的功能,更像是一個能讓你在手機(jī)上體驗 DeepSeek 最新模型的入口。
DeepSeek App 展示圖|來源:Apple Store
對此,一位投資人向極客公園解釋 DeepSeek 開始做應(yīng)用背后可能的戰(zhàn)略轉(zhuǎn)向:「前期 DeepSeek 靠自己的算力優(yōu)勢積累出了模型技術(shù)的領(lǐng)先度。后期要補(bǔ)數(shù)據(jù),發(fā) App 是補(bǔ)數(shù)據(jù)的手段之一。接入用戶數(shù)據(jù)和場景,可以幫助他更好地進(jìn)行模型能力的迭代和升級。」
同時,有了 DeepSeek-R1 和其他模態(tài)、類型越來越好的模型,可以期待未來 DeepSeek 在比如代碼模型/應(yīng)用里有更激進(jìn)的表現(xiàn),驚喜才剛剛開始。
媒介合作聯(lián)系微信號|ciweimeijiejun
如需和我們交流可后臺回復(fù)“進(jìn)群”加社群
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.