作者 | summer
郵箱 | huangxiaoyi@pingwest.com
在R2和V4到來之前,DeepSeek先讓我們看到了“V3 Plus”。
3月24日,DeepSeek一聲不響的在Huggingface上發布了V3的“小版本”迭代“DeepSeek-V3-0324”。開發者社區再次一片嘗鮮與夸贊。
之后3月25日晚,官方發布了該版本的官方報告。在DeepSeek的報告里,給出了四個官方亮點指引,分別是推理能力、前端開發能力、中文寫作能力、中文搜索能力的強化。
乍看起來,這些能力提升都聚焦在用戶常見任務場景之上。 這也的確是一次非常注重實用性的升級,雖名為“小版本”,V3-0324卻在多個關鍵能力上實現了顯著突破,尤其是代碼生成能力的提升令人印象深刻。用戶只需關閉深度思考模式,就能體驗這一新版本,而API接口和使用方式保持不變。
而仔細觀察這幾個提升的領域,會發現一個有意思的點:DeepSeek給V3做的提升,全都落在R1的優勢能力范圍內了啊。
據報告顯示,推理能力的提升主要體現在新版 V3 模型的百科知識(MMLU-Pro, GPQA)、數學(MATH-500, AIME 2024)和代碼任務(LiveCodeBench)表現均有提高,特別是在數學、代碼類相關評測集上取得了超過 GPT-4.5、Claude-Sonnet-3.7的得分成績。
過去,在DeepSeek的兩個模型中,R1是推理模型,而V3則更適合日常對話。如今V3系列也有了推理能力的強力升級,用戶可以更好地根據任務難度選擇合適的模型:復雜問題用R1,日常對話用新版V3。這種差異化策略讓算力資源與任務需求更匹配,避免了不必要的計算浪費。
在推理能力之上,幾項任務場景中,最引人注目的是模型的代碼穩定性和準確性。繼Claude-Sonnet-3.7在前端開發能力上火爆出圈之后,大模型在這一場景的實用性被額外關注。在V3新版本技術報告出現之前,不少網友們就迫不及待地測出了V3-0324在前端開發場景下的能力飛躍。
有開發者報告生成800行代碼,字符蹦到“冒火星”,竟然無一錯誤。對開發者而言,這種體驗在遍地都是愛報錯的AI編程工具之下,顯得尤為突出。
還有用戶進一步測試表明,盡管還有差距,但DeepSeek-V3-0324在前端視覺設計上已經接近了Claude這樣的頂級模型。
用戶只需提供簡單提示,就能生成時尚的數字營銷頁面,布局合理,視覺效果精美。這種實用性的提升對網頁設計師和前端開發者尤為重要,大大縮短了從創意到實現的時間。
與社區測試相呼應,DeepSeek官方在技術報告中也展示了模型的前端代碼能力。報告中展示了一個p5.js小球物理運動程序,包含可調整的物理參數和賽博朋克風格界面,不僅功能完整,還具有高度的美觀性和交互性。
更重要的是,這個不比Claude差的新版本,可以免費使用,據網友測算,付費API的價格更是便宜了15倍。
除了代碼能力,DeepSeek R1的寫作能力也一直被津津樂道。其細膩的文風雖然有時會陷入極繁主義的浮夸,但情節連貫性和特定風格下的表達能力很強,有短劇和小說從業者都曾對硅星人提到,已經開始應用DeepSeek創作。
此次,新版本V3在中文能力也有明顯增強,特別是中長篇文本創作上質量更高,結構更完整,邏輯更嚴密,實用性也大大增強。
另外,在聯網搜索場景下,報告生成能力也有顯著提升。模型能夠從網絡信息中提取關鍵內容,生成詳實準確的報告,并以清晰美觀的排版呈現。
在開源方面,DeepSeek也繼續保持了其一貫的透明度和友好性。作為小版本更新,私有化部署只需要更新checkpoint和tokenizer_config.json等少量文件。這意味著現有用戶升級成本極低,幾乎可以無縫遷移。據報告顯示,該模型參數約660B,略低于原先V3的671B,開源版本上下文長度為128K(網頁端、App和API提供64K上下文),依然采用MIT許可證,這使得開發者可以在各種場景下自由使用。
這些能力提升其實幅度不小,但DeepSeek沒有把它稱為V3.5、V3.7,而只是將它定義為一次V3小版本更新。
在行業版本迭代泛濫、概念炒作盛行的當下,通過低調務實的姿態贏得了更多開發者社區的尊重。雖然能力有顯著提升,但由于沒有大的技術路線突破,仍將其定位為小版本迭代,那么當DeepSeek真正發布R2時,那將是一次名副其實的重大升級,而非行業常見的“通貨膨脹式”命名。
這種對技術命名的誠實態度,也是外界格外期待R2的重要理由。
而這次更新最重要的地方還在于,DeepSeek的V3和R1出現后,如Anthropic等對手在嘗試用新方法超車,核心在于把推理模型和大語言模型融合,無論是產品上通過AI的自動調配來融合到一起,還是從模型層面就“合二為一”。
現在看來,DeepSeek此次更新也很直白的展示了自己接下來的路線,也是把V系列和R系列融合成一個新模型。
官方報告中明確指出,此次更新與之前的DeepSeek-V3使用同樣的base模型,僅改進了后訓練方法,并借鑒了DeepSeek-R1模型訓練過程中的強化學習技術。
這是純RL路線的再一次的驗證和公示,在對手們繼續閉源并使用“唯一混合模型”這樣的概念來吸引人的時候,它繼續通過開源為行業提供公開的高效迭代思路。DeepSeek這開源的仗還會繼續打下去,好戲還在后面。
點個“愛心”,再走吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.