網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

理性看待，DeepSeek究竟處于一個什么水平？

2025-01-31 19:41:17　來源: 平凡AI

海外舉報

分享至

DeepSeek一共有三個方向的大模型：

?DeepSeek V3對標(biāo)的是GPT4o，代表的是大模型最根本的通用智能程度。

?DeepSeek R1對標(biāo)的OpenAI o1，這個是現(xiàn)在AI大模型領(lǐng)域最炙手可熱的方向，代表了最尖端的研究儲備。

?DeepSeek Janus補的是多模態(tài)能力，因為是補，就是個添頭，暫時不出彩。

DeepSeek V3

V3論文鏈接：

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdfgithub.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

榜單成績，比GPT4o大多數(shù)情況都強（前兩天Qwen2.5-Max榜單成績超過了V3）

但重點是GPT4大概率是個超大規(guī)模的模型，而DeepSeekV3的模型大小僅為671B，并且采用了MoE結(jié)構(gòu)，每次推理的激活函數(shù)只有37B。

這就意味著，V3在推理成本遠小于GPT4o的前提下，接近甚至在一些領(lǐng)域超越了GPT4o，這才是V3最大的貢獻。

DeepSeek R1

論文鏈接：

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdfgithub.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

R1是一個推理Reasoning模型，對標(biāo)的OpenAI最引以為豪的OpenAI o系列推理模型，從性能上看，R1絲毫不落于o1下風(fēng)。

不過OpenAI手里還有o3這張牌，從刷榜成績上看，R1比不過o3，但是差距有多大不好說，特別是o3的一些成績都是在閉源榜單上刷的，很難比較。

但這個性能不是重點，重點有兩個。

1 開源

R1是完全開源的，意味著只要你有足夠的設(shè)備，就可以自己部署一個，這就讓OpenAI很難堪，自己引以為豪的用來賺錢的模型，別人是開源的，甚至免費給全世界人用。

這一點兒，R1的口碑世界第一。

2 便宜

中國的AI整體受到美國的打壓，特別是訓(xùn)練用的顯卡被禁售。

DeepSeek自創(chuàng)的FP8精度訓(xùn)練，說白了就是窮鬼訓(xùn)練方法，只有在顯卡不足的時候才會考慮的方法，卡多的大廠根本不屑于考慮這種方法，算是被美國倒逼出來的創(chuàng)新。

也正在是卡不足的前提下，搞出來的創(chuàng)新自帶一種特有的平易近人特質(zhì)。

比動不動需要非常多卡的大模型的資源都需要的少。

這兩點，幾乎奠定了DeepSeek現(xiàn)在巨大的威望。

說實在的，DeepSeek的模型并不是世界頂尖，但這玩意原本的目的是就是跟陽光空氣水一樣的便宜且易獲取，OpenAI徹底閉源搞得社區(qū)烏煙瘴氣，DeepSeek就像個武功不算頂尖，但是樂于把自己不俗的死穴成才的武功心得分享出去的老哥。

致敬老哥。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

太牛了！400塊洋垃圾，也能在本地部署DeepSeek？！

雷科技 2025-02-14 11:33:42
241 跟貼 241
OpenAI底層AGI技術(shù)被曝光！前研究主管豪言：從此再無新范式

新智元 2025-06-21 17:34:26
2 跟貼 2

12名工程師，估值190億，AI黑馬的夢幻故事

智東西 2025-01-14 20:23:26
0 跟貼 0

Sam Altman提醒創(chuàng)業(yè)者：ChatGPT將來要做的，大家就繞開吧

機器之心Pro 2025-06-23 10:55:04
3 跟貼 3
OpenAI CEO深度訪談：吐槽Meta1億美金挖墻角，透露造“AI伴侶”

智東西 2025-06-22 18:45:53
15 跟貼 15

AI需要「像人類」那樣思考？AlphaOne揭示大模型的「思考之道」

機器之心Pro 2025-06-23 17:37:28
0 跟貼 0

推理正確率下降65.5%！斯坦福、MIT等用「不等式」拷問AI邏輯極限

新智元 2025-06-23 13:17:43
3 跟貼 3
具身智能創(chuàng)業(yè)來了位浙大博導(dǎo)，機器人會飛，VC搶著投

量子位 2025-06-23 20:25:19
0 跟貼 0

物流業(yè)deepseek時刻，中國無人車火爆全球

華商韜略 2025-06-17 10:58:23
0 跟貼 0
垂直小模型精準(zhǔn)補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
生成式AI的“安全溢價”與生態(tài)競爭專訪亞馬遜云科技陳曉建：我們不打極致的“價格戰(zhàn)”

每日經(jīng)濟新聞 2025-06-23 21:04:17
0 跟貼 0
MWC上海觀察 | 最新戰(zhàn)略發(fā)布！長飛如何筑牢AI時代“高速公路”

通信世界 2025-06-23 20:08:43
0 跟貼 0
超算互聯(lián)網(wǎng)上線開源AI社區(qū)！模型+數(shù)據(jù)+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
ACI.dev能一站直連600+工具，讓你的智能體秒變?nèi)芡酰?/a>

機器之心Pro 2025-04-30 17:13:00
0 跟貼 0
ROG 魔霸 9X 游戲電腦體驗，強悍的游戲性能，只為打造情緒價值機器

愛范兒 2025-04-30 20:12:30
2 跟貼 2
腳氣反復(fù)出現(xiàn)，鉆心的癢！醫(yī)生：試試夏天去沙灘踩“熱”沙子！

BRTV新聞 2025-06-22 23:47:09
717 跟貼 717
奧特曼YC硬核訪談：走ChatGPT之路必死，世界差點沒有OpenAI！

新智元 2025-06-23 14:47:51
1 跟貼 1
【產(chǎn)業(yè)互聯(lián)網(wǎng)周報】 OpenAI開始提供ChatGPT企業(yè)版折扣；國家互聯(lián)網(wǎng)信息辦公室：中國已有433款大模型完成備案；消息稱微軟計劃裁員數(shù)千人，主要集

鈦媒體APP 2025-06-23 09:59:47
0 跟貼 0
對話開源中國馬越：DeepSeek不是國運級的創(chuàng)新，年輕人才是

36氪 2025-03-13 18:14:13
0 跟貼 0
梅德韋杰夫稱有國家準(zhǔn)備直接向伊提供核彈頭萬斯回應(yīng)

環(huán)球網(wǎng)資訊 2025-06-23 11:56:50
27554 跟貼 27554
《無主之地4》配置要求秒殺60%電腦，這么多年了顯卡換沒換？

游戲智庫 2025-06-23 20:56:44
0 跟貼 0
我用DeepSeek圖片轉(zhuǎn)表格，它卻做起了數(shù)據(jù)分析

秋葉excel 2025-06-19 11:35:44
0 跟貼 0
道具模型太貴怎么辦，導(dǎo)演直接整上真家伙

影帝俠 2025-06-21 13:03:31
253 跟貼 253
我用DeepSeek自定義函數(shù)，同事人都看傻了！

秋葉excel 2025-06-23 11:34:11
0 跟貼 0
Labubu徹底拆開，各位看看這東西成本值多少

硬核拆解 2025-06-23 19:03:51
25 跟貼 25
【游戲物語】《沙丘：覺醒》：跨越沙海的獵晶傳奇與顯卡之力

PConline太平洋科技 2025-06-19 09:23:22
1 跟貼 1
DeepSeek揭示兒童最幸福10個瞬間，我頓悟如何養(yǎng)出一個高能量孩子

男孩派 2025-06-23 09:54:03
36 跟貼 36
輕松一刻：男子旅游嫌車票太貴，連偷8輛車當(dāng)座駕

輕松一刻 2025-06-23 20:51:53
2 跟貼 2
寶馬新世代iX3即將發(fā)布！全新內(nèi)外飾設(shè)計，上車鴻蒙系統(tǒng)+Deepseek

車東西 2025-06-23 21:57:54
0 跟貼 0
一番推理后竟發(fā)現(xiàn)，只有這個人是假的，這反轉(zhuǎn)夠絕了

熱血做搞笑 2025-06-23 00:00:00
0 跟貼 0
因應(yīng)“舒適推理”閱讀風(fēng)潮日本暢銷書作家乙一作品將上市

環(huán)球網(wǎng)資訊 2025-06-22 21:02:04
0 跟貼 0
重磅發(fā)布會，明天上午10時舉行！

中國網(wǎng) 2025-06-23 13:39:24
11936 跟貼 11936
高考報志愿，用好deepseek就夠了

白話頻道 2025-06-22 12:15:19
0 跟貼 0
愚昧的三大病癥

聽哲學(xué) 2025-06-22 14:44:29
10 跟貼 10
【DeepSeek談藝】王海燕筆下的花 | 解構(gòu)傳統(tǒng)，綻放當(dāng)代詩意

文化視界網(wǎng) 2025-06-23 14:57:33
0 跟貼 0
最吉利的10種夢，到底藏著啥玩意？

小于愛生活丫 2025-06-22 06:33:40
0 跟貼 0
足球TOP：24-25賽季俱樂部上座榜單，多特蒙德成為歐洲第一魔鬼主場

足球最TOP頻道 2025-06-21 19:35:35
0 跟貼 0
英偉達：從游戲初創(chuàng)公司到 AI 巨頭的進化之路

金融界 2025-06-23 07:49:20
3 跟貼 3
單集成本高達一億美金的科幻神劇能有多亮眼

風(fēng)靈剪輯 2025-06-21 05:34:00
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

理性看待，DeepSeek究竟處于一個什么水平？

售出千萬臺！他卻說"只想做下一代AI終端"

玉淵譚天：美軍轟炸伊朗的武器僅美國有 但掏空了老本

玉淵譚天：美軍轟炸伊朗的武器僅美國有 但掏空了老本

比起雷霆三少，他才是真正隊魂

魏大勛和秦嵐沒分手！

以伊沖突升級，對經(jīng)濟和股市影響有多大？

真香價格+質(zhì)保承諾 別克E5很難讓人拒絕了

態(tài)度原創(chuàng)

被貴妃帶火的“唐代頂流”，如今怎么不火了

50+姐姐的穿搭小心機：不裝嫩不扮老，這樣穿才顯貴又舒服

500元拿下240Hz產(chǎn)品？暑期裝機別錯過這些型號

3天，75億！海南賣地殺瘋了！

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

玉淵譚天：美軍轟炸伊朗的武器僅美國有但掏空了老本

玉淵譚天：美軍轟炸伊朗的武器僅美國有但掏空了老本

真香價格+質(zhì)保承諾別克E5很難讓人拒絕了