網易首頁 > 網易號 > 正文申請入駐

DeepSeek R1小步快跑，中國AI迎來高光時刻

2025-05-30 10:33:58　來源: 山自

北京舉報

分享至

一次看似不起眼的小版本更新，卻讓國產大模型在編程和設計領域逼近全球頂尖水準——小步快跑的迭代哲學正在重塑AI競爭規則。

2025年1月，DeepSeek R1的橫空出世觸發了全球AI格局的重新洗牌。這個由中國團隊開發的模型以僅600萬美元的訓練成本，實現了與OpenAI投入5億美元打造的o1模型相匹敵的性能。

更令人驚訝的是，在隨后幾個月里，DeepSeek沒有如預期般推出革命性的R2版本，而是通過一系列小版本迭代持續進化。

今年5月28日上線的R1-0528版本，再次以一次“小升級”震動技術圈。新版本在編程能力上實現突破，能一次性生成728行代碼構建出帶粒子效果的3D動畫應用，其效果已與Anthropic的Claude 4并駕齊驅。

小步迭代的得與失：優化幻覺與有限的能力拓展

在R1-0528版本中，DeepSeek團隊重點優化了模型的核心痛點——幻覺問題。通過增強自我驗證機制，模型在數學推理和事實性回答中的準確率明顯提升。

一組對比測試顯示，在Extended NYT Connections基準測試中，新版本的得分從原始R1的38.6躍升至49.8，漲幅近30%。

這種進步源于DeepSeek創新的GRPO算法（組相對策略優化）。與傳統PPO算法不同，GRPO通過組內樣本對比動態調整策略，省去了獨立價值網絡，使內存占用降低40%，訓練效率提升2.3倍。

然而細察之下，此次升級并未帶來顛覆性能力突破。模型在多語言支持、多模態理解等關鍵領域進展有限。當用戶用德語提問時，模型仍需將其翻譯成中英文處理，導致響應速度下降。

在復雜函數調用和角色扮演等場景，表現仍不及行業頂尖水平。業界期待的真正革新——如跨模態理解和復雜工具使用——仍需等待R2的到來。

思維深度：是進化還是過剩？

最顯著的變化發生在模型的思考方式上。R1-0528采用了更長的思維鏈，在解決復雜問題時展現出類似人類的逐步推理能力。

當被要求“估算π/7”時，模型耗時148秒生成包含大量中間步驟的解答。其推理過程詳細展示了對泰勒級數展開、數值逼近等方法的考量，遠超簡單問題所需。

這種深度思考模式是雙刃劍：

優勢：在編程任務中，長思維鏈使模型能自我糾錯。測試顯示，面對Zig語言開發任務時，模型能在出錯后快速調整方案。
代價：響應時間顯著延長。普通用戶面對“思考中”提示等待十余秒已成常態，在實時交互場景中體驗不佳。

技術愛好者贊賞這種透明化的推理過程，認為它增強結果的可信度。但普通用戶更關注效率——當Claude能在3秒內給出正確答案時，過長的思考鏈是否真正創造用戶價值值得商榷。

中長篇寫作：結構化的勝利

在內容創作領域，R1-0528展現出質的飛躍。與早期版本相比，其中長篇輸出實現了三重進化：

結構更嚴謹：回答采用“問題解析→分步推導→結論驗證”的標準流程，邏輯清晰度顯著提升。
信息更豐富：在歷史類問題中，模型能補充文化背景和爭議觀點，而不局限于簡單事實。
表達更規范：通過RL訓練中的格式獎勵機制，模型輸出中的中英文混雜問題基本解決。

速度之困：深度思考的代價

性能提升的最大代價是響應速度。多個實測場景暴露了這一瓶頸：

●解答高考數學壓軸題耗時83秒

●應對AIME競賽真題需213秒

●處理少樣本提示（Few-Shot Prompt）比非推理模型慢7倍

速度瓶頸部分源于工程選擇。為保持低成本優勢，DeepSeek堅持使用MoE架構（專家混合模型），每次推理僅激活370億參數（總量6710億）。

這種“省電模式”限制了并行計算效率。

在API服務場景，速度問題被性價比緩解：新版本保持輸入0.55美元/百萬token、輸出2.19美元/百萬token的定價，僅為OpenAI o1價格的3.7%。但當企業需要實時交互時，這一短板依然明顯。

小步快跑：AI產品迭代新范式

DeepSeek此次采用的策略，標志AI產品開發模式的轉變。與追求顛覆性突破的“大版本”思維不同，小步快跑模式展現出獨特優勢：

風險可控：每次迭代聚焦特定能力提升（如本次的編程與設計），避免全面重構風險。
用戶導向：快速響應社區反饋，如針對開發者需求強化three.js框架支持。
生態友好：MIT開源許可使企業可即時集成新版本，蒸餾模型讓普通顯卡也能運行70B參數模型。

這種模式有效破解“杰文斯悖論”：當技術進步降低算力成本時，反而激發更大需求。R1-0528上線后，其API調用量激增導致服務短暫中斷，正是這一現象的生動體現。

小版本迭代的累積效應不可小覷。經過數次更新，R1的編程能力已從年初的Codeforces 1890 ELO提升至2029，超越96%人類選手。

前端設計質量更達到專業設計師才能分辨差異的水準。

業界目光已投向DeepSeek R2。當小步迭代已能在編程和設計領域比肩Claude 4，真正的下一代架構革新或將重新定義國產AI的天花板。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Claude 4 核心成員：2027 年，AI 將自動化幾乎所有白領工作 | 萬字對談

愛范兒 2025-05-31 12:03:16
15 跟貼 15
o3崛起，但推理模型離「撞墻」只剩一年？

新智元 2025-05-31 12:14:36
1 跟貼 1

美團開放AI代碼工具,零代碼實現全棧能力,項目負責人揭秘架構細節

機器之心Pro 2025-05-30 14:19:26
2 跟貼 2

UC伯克利新作顛覆認知：LLM靠「自信爆表」學會推理？無需外部獎勵超進化

新智元 2025-05-31 16:07:22
1 跟貼 1
小模型媲美大模型，阿里通義開源「推理+搜索」預訓練新框架

量子位 2025-05-31 12:05:19
2 跟貼 2

Claude腦回路被開盒：AI會撒謊和暗中計劃

量子位 2025-04-04 12:20:26
0 跟貼 0

一周兩破18年數學紀錄！陶哲軒驚嘆：AlphaEvolve帶來久違「加速度」

新智元 2025-05-31 17:39:44
6 跟貼 6
AI生圖大洗牌！流匹配架構顛覆傳統，單模型同時接受文本圖像輸入

量子位 2025-05-30 17:04:43
1 跟貼 1

SSM+擴散模型，竟造出一種全新的「視頻世界模型」

機器之心Pro 2025-05-31 18:23:21
1 跟貼 1
新版DeepSeekR1實測炸裂，編碼能力直逼Claude4

量子位 2025-05-29 17:51:15
0 跟貼 0
DeepSeek開口說話了反應超神無限打斷只要兩行代碼15分鐘

量子位 2025-03-07 14:20:34
0 跟貼 0
“印度電詐”就離譜！整整八年，AI全靠人、收入全靠刷，微軟納德拉被老鄉“殺豬盤”了

華爾街見聞官方 2025-05-31 17:45:35
46 跟貼 46
飛書一個聊天框，激活了機器之心編輯部的知識資產

機器之心Pro 2025-05-21 15:39:31
0 跟貼 0
AI 時代的超級應用，是一個超級框

愛范兒 2025-03-13 11:56:19
0 跟貼 0
剛剛，“互聯網女皇”發布首份“AI趨勢報告”，長達340頁，引發業界圍觀

華爾街見聞官方 2025-05-31 19:55:36
20 跟貼 20
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
AI的盡頭是“熵”

孤獨大腦 2025-01-25 13:08:25
0 跟貼 0
DeepSeek應用如何落地？解鎖“性能x多模態xRAG”技術組合密碼！

量子位 2025-03-07 22:29:18
0 跟貼 0
DeepSeek引爆AI革命，誰能笑到最后？

量子位 2025-03-11 17:16:22
0 跟貼 0
DeepSeek開口說話了：只要15分鐘就能讓DeepSeek開口說話

量子位 2025-03-10 18:03:15
0 跟貼 0
DeepSeek應用如何落地？解鎖性能釋放x多模態融合xRAG增強

量子位 2025-03-07 22:58:40
0 跟貼 0
實測訊飛曉醫VS DeepSeek-R1，誰是更懂你的家庭健康助手？

量子位 2025-03-08 19:20:56
0 跟貼 0
站在女性角度告訴你，夫妻越過越累的底層邏輯！

周小鵬情感專家 2025-05-31 19:00:00
6 跟貼 6
獨家揭秘：河北騎行案，律師用一張腦圖拆解全案邏輯

周兆成律師 2025-05-30 19:34:06
1 跟貼 1
俄官員：若烏用上"金牛座" 俄將授權直接打擊德國領土

上游新聞 2025-05-31 07:49:55
52147 跟貼 52147
“月薪5萬被裁員”？網上突然冒出很多！這種情況記得舉報

環球網資訊 2025-05-30 08:57:45
339 跟貼 339
技術降維與戰略破局：解析胡塞武裝改寫中東戰爭規則的創新戰術

烽火三月佳人三千 2025-05-31 02:33:02
0 跟貼 0
科學家提出視頻擴散模型加速方法，在H100實現一倍以上端到端加速

DeepTech深科技 2025-05-31 22:21:30
0 跟貼 0
DeepSeek“小”更新，登開源模型王座，編碼性能暴漲直逼o3

機器之心Pro 2025-05-30 15:18:12
0 跟貼 0
票價10元的"蘇超"火了 "散裝江蘇"被稱比賽第1友誼第14

澎湃新聞 2025-05-31 07:15:42
7609 跟貼 7609
一等功臣因公犧牲年僅50歲

新京報 2025-05-31 14:38:01
15257 跟貼 15257
實測新版R1編程能力提升巨大，網站前端能力超強

量子位 2025-05-29 21:36:23
0 跟貼 0
關于雨果的發球動作是否符合規范？我們來參閱一下“國際乒聯關于發球規則”的具體內容！

最愛乒乓球 2025-06-01 00:05:05
3 跟貼 3
五年級數學，B×B-2B-B=1120，難住不學生

大力小學數學 2025-05-30 14:39:00
0 跟貼 0
杭州一“兇宅”競拍14輪后成交，單價不到8000元，相當于市場價7.5折

魯中晨報 2025-05-31 07:57:10
2846 跟貼 2846
新版R1→前端之神，編程比肩Claude和Gemini

量子位 2025-05-29 21:06:59
0 跟貼 0
繼續跟網友辯論

非典型佛教徒 2025-05-31 22:30:45
0 跟貼 0
中國玩了五千年戰略，美國沒有任何勝算

農夫史記 2025-05-31 20:42:11
1 跟貼 1
日本教授古賀茂明：美國壓制中國策略徒勞無功

漢字筆跡心理分析 2025-05-30 13:46:37
0 跟貼 0
超級開箱 | 尊界S800首發評測，華為ADS 4居然如此絲滑？

Autolab 2025-06-01 00:54:14
0 跟貼 0

手機 / 數碼

房產 / 家居

DeepSeek R1小步快跑，中國AI迎來高光時刻

1小時大定破千，余承東：尊界S800是個開端

69歲正部級高官被查 半個多月前曾赴海南考察

69歲正部級高官被查 半個多月前曾赴海南考察

亞錦賽女子200米:16歲陳妤頡22秒97奪金

張柏芝曬端午vlog！大兒子送禮物

中汽協倡議：反對“內卷式”惡性競爭

態度原創

7款復購2次以上的香香好物！誰用誰好聞！

云游中國 |來仰天湖大草原，一起策馬奔騰

孩子性子比較急，容易哭鬧怎么辦？聽聽兒科醫生的建議

金地華南落子海南自貿港22萬㎡標桿項目，夯實代建行業領軍者地位

單 SSD 容量可達 1PB，SNIA 正開發面向 2U 的 EDSFF E2 外形規格

69歲正部級高官被查半個多月前曾赴海南考察

69歲正部級高官被查半個多月前曾赴海南考察