網易首頁 > 網易號 > 正文申請入駐

DeepSeek V3“小版本更新”背后，V3和R1正在融合成一個模型

2025-03-26 10:20:52　來源: 硅星人

北京舉報

分享至

作者｜ summer
郵箱｜ huangxiaoyi@pingwest.com

在R2和V4到來之前，DeepSeek先讓我們看到了“V3 Plus”。

3月24日，DeepSeek一聲不響的在Huggingface上發布了V3的“小版本”迭代“DeepSeek-V3-0324”。開發者社區再次一片嘗鮮與夸贊。

之后3月25日晚，官方發布了該版本的官方報告。在DeepSeek的報告里，給出了四個官方亮點指引，分別是推理能力、前端開發能力、中文寫作能力、中文搜索能力的強化。

乍看起來，這些能力提升都聚焦在用戶常見任務場景之上。這也的確是一次非常注重實用性的升級，雖名為“小版本”，V3-0324卻在多個關鍵能力上實現了顯著突破，尤其是代碼生成能力的提升令人印象深刻。用戶只需關閉深度思考模式，就能體驗這一新版本，而API接口和使用方式保持不變。

而仔細觀察這幾個提升的領域，會發現一個有意思的點：DeepSeek給V3做的提升，全都落在R1的優勢能力范圍內了啊。

據報告顯示，推理能力的提升主要體現在新版 V3 模型的百科知識（MMLU-Pro, GPQA）、數學（MATH-500, AIME 2024）和代碼任務（LiveCodeBench）表現均有提高，特別是在數學、代碼類相關評測集上取得了超過 GPT-4.5、Claude-Sonnet-3.7的得分成績。

過去，在DeepSeek的兩個模型中，R1是推理模型，而V3則更適合日常對話。如今V3系列也有了推理能力的強力升級，用戶可以更好地根據任務難度選擇合適的模型：復雜問題用R1，日常對話用新版V3。這種差異化策略讓算力資源與任務需求更匹配，避免了不必要的計算浪費。

在推理能力之上，幾項任務場景中，最引人注目的是模型的代碼穩定性和準確性。繼Claude-Sonnet-3.7在前端開發能力上火爆出圈之后，大模型在這一場景的實用性被額外關注。在V3新版本技術報告出現之前，不少網友們就迫不及待地測出了V3-0324在前端開發場景下的能力飛躍。

有開發者報告生成800行代碼，字符蹦到“冒火星”，竟然無一錯誤。對開發者而言，這種體驗在遍地都是愛報錯的AI編程工具之下，顯得尤為突出。

還有用戶進一步測試表明，盡管還有差距，但DeepSeek-V3-0324在前端視覺設計上已經接近了Claude這樣的頂級模型。

用戶只需提供簡單提示，就能生成時尚的數字營銷頁面，布局合理，視覺效果精美。這種實用性的提升對網頁設計師和前端開發者尤為重要，大大縮短了從創意到實現的時間。

與社區測試相呼應，DeepSeek官方在技術報告中也展示了模型的前端代碼能力。報告中展示了一個p5.js小球物理運動程序，包含可調整的物理參數和賽博朋克風格界面，不僅功能完整，還具有高度的美觀性和交互性。

更重要的是，這個不比Claude差的新版本，可以免費使用，據網友測算，付費API的價格更是便宜了15倍。

除了代碼能力，DeepSeek R1的寫作能力也一直被津津樂道。其細膩的文風雖然有時會陷入極繁主義的浮夸，但情節連貫性和特定風格下的表達能力很強，有短劇和小說從業者都曾對硅星人提到，已經開始應用DeepSeek創作。

此次，新版本V3在中文能力也有明顯增強，特別是中長篇文本創作上質量更高，結構更完整，邏輯更嚴密，實用性也大大增強。

另外，在聯網搜索場景下，報告生成能力也有顯著提升。模型能夠從網絡信息中提取關鍵內容，生成詳實準確的報告，并以清晰美觀的排版呈現。

在開源方面，DeepSeek也繼續保持了其一貫的透明度和友好性。作為小版本更新，私有化部署只需要更新checkpoint和tokenizer_config.json等少量文件。這意味著現有用戶升級成本極低，幾乎可以無縫遷移。據報告顯示，該模型參數約660B，略低于原先V3的671B，開源版本上下文長度為128K（網頁端、App和API提供64K上下文），依然采用MIT許可證，這使得開發者可以在各種場景下自由使用。

這些能力提升其實幅度不小，但DeepSeek沒有把它稱為V3.5、V3.7，而只是將它定義為一次V3小版本更新。

在行業版本迭代泛濫、概念炒作盛行的當下，通過低調務實的姿態贏得了更多開發者社區的尊重。雖然能力有顯著提升，但由于沒有大的技術路線突破，仍將其定位為小版本迭代，那么當DeepSeek真正發布R2時，那將是一次名副其實的重大升級，而非行業常見的“通貨膨脹式”命名。

這種對技術命名的誠實態度，也是外界格外期待R2的重要理由。

而這次更新最重要的地方還在于，DeepSeek的V3和R1出現后，如Anthropic等對手在嘗試用新方法超車，核心在于把推理模型和大語言模型融合，無論是產品上通過AI的自動調配來融合到一起，還是從模型層面就“合二為一”。

現在看來，DeepSeek此次更新也很直白的展示了自己接下來的路線，也是把V系列和R系列融合成一個新模型。

官方報告中明確指出，此次更新與之前的DeepSeek-V3使用同樣的base模型，僅改進了后訓練方法，并借鑒了DeepSeek-R1模型訓練過程中的強化學習技術。

這是純RL路線的再一次的驗證和公示，在對手們繼續閉源并使用“唯一混合模型”這樣的概念來吸引人的時候，它繼續通過開源為行業提供公開的高效迭代思路。DeepSeek這開源的仗還會繼續打下去，好戲還在后面。

點個“愛心”，再走吧

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.