網易首頁 > 網易號 > 正文申請入駐

火線實測: DeepSeek V3重新定義“小更新”，編碼能力比肩Claude3.7 超越 R1

2025-03-25 08:05:42　來源: AI先鋒官

北京舉報

分享至

作者｜沐風

來源｜AI先鋒官

3月24日，DeepSeek在其官方交流群宣布稱，“DeepSeek V3模型已完成小版本升級，歡迎前往官方網頁、APP、小程序試用體驗（關閉深度思考），API接口和使用方式保持不變。”

據悉，此次更新的版本號為V3-0324，其開源版本目前已經上架Hugging Face。

這一版本雖被官方稱為“小更新”，但其技術能力表現再次讓人震驚。

DeepSeek-V3作為去年12月發布的自研MoE模型，憑借671B參數在多項評測中超越Qwen2.5-72B和Llama-3.1-405B等開源模型，性能接近GPT-4o與Claude-3.5-Sonnet等閉源頂尖模型。

此次V3-0324作為一款參數規模達685B的混合專家（MoE）模型，其性能在編程、數學推理等核心領域實現了顯著提升。

根據開發者社區的實測反饋，其編碼能力已接近國際頂尖閉源模型Claude 3.7 Sonnet，尤其是在前端代碼生成和復雜邏輯處理中，表現出更高的準確性與流暢性。

例如，在處理多線程異步任務或動態網頁交互設計時，模型能生成更符合工程規范的代碼結構，甚至能主動提示潛在的性能優化點。

在X上，有專業用戶對V3-0324、V3-old、Claude 3.5、Claude 3.7下達了同樣的任務，實際產出的效果也出現了巨大差異。

提示詞：創建包含CSS和JavaScript的單個HTML文件，以生成動畫天氣卡。卡片應以不同的動畫直觀地表示以下天氣狀況：風：（例如，移動的云、搖曳的樹木或風線）雨：（例如，落下的雨滴、形成的水坑）太陽：（例如，閃亮的光線、明亮的背景）雪：（例如，飄落的雪花、積雪）并排顯示所有天氣卡片卡片應具有深色背景。在此文件中提供所有HTML、CSS和JavaScript代碼。JavaScript應包括一種在不同天氣條件之間切換的方法（例如，一個函數或一組按鈕），以演示每種天氣條件的動畫。

提示詞：“創建 Saas 登陸頁面”

可以看出，V3-0324的編碼能力比之前的老版本v3的能力要強的多,并且已經接近目前號稱“編程能力最強模型”Claude3.7了。

有網友利用 github 開源評測環境，對DeepSeek-V3-0324 進行了代碼實測。

DeepSeek-V3-0324 以 328.3 分在 KCORES 大模型競技場排名第三，僅次于 claude-3.7-sonnet-thinking 和 claude-3.5 ，超越了DeepSeek-R1、claude-3.7-sonnet 等。

要知道，DeepSeek-V3-0324不是一個 Thinking 模型！

四項評測中——

20 個小球碰撞測試：肉眼可見的進步，之前 DeepSeek-V3 的小球擠成一團，現在物理運動模擬得非常好，僅因掉出了7邊形扣了5分，項目排名第5。

mandelbrot-set-meet-libai 測試：沒有過多變化，分數較DeepSeek-V3 低了2分，主要還是將渲染方向搞反了以至于拖累了渲染性能，但是完成度可以看到比之前高很多，項目排名第12。

火星任務測試：巨大的提升，這次星球，圖例均渲染正確，甚至發射和返回窗口計算也有很大進步，項目排名并列第2 。

九大行星模擬測試：也是巨大的提升，它是測試的25個模型中，唯一一個畫了土星環的大模型！（畫土星環就如同畫時鐘要寫3，6，9，12），項目排名并列第13。

此外， V3-0324延續了與R1一樣的開源許可MIT，這意味著V3-0324有著比初代V3更寬松的開源使用條件。

并且MIT開源許可一向以商業友好而著稱，使用MIT許可的項目可以與商業和專有軟件集成。

總體而言，DeepSeek-V3-0324 表現出來的技術能力進化讓人難以相信這只是個小版本迭代，不是 R2，甚至不是 V4。

這讓我們比期待 ChatGPT5 ，更數倍的期待 DeepSeek-R2 的發布了！

掃碼邀請進群，我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型，順便學一些AI搞錢技能。

往期文章回顧

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.