作者|沐風
來源|AI先鋒官
3月24日,DeepSeek在其官方交流群宣布稱,“DeepSeek V3模型已完成小版本升級,歡迎前往官方網頁、APP、小程序試用體驗(關閉深度思考),API接口和使用方式保持不變。”
據悉,此次更新的版本號為V3-0324,其開源版本目前已經上架Hugging Face。
這一版本雖被官方稱為“小更新”,但其技術能力表現再次讓人震驚。
DeepSeek-V3作為去年12月發布的自研MoE模型,憑借671B參數在多項評測中超越Qwen2.5-72B和Llama-3.1-405B等開源模型,性能接近GPT-4o與Claude-3.5-Sonnet等閉源頂尖模型。
此次V3-0324作為一款參數規模達685B的混合專家(MoE)模型,其性能在編程、數學推理等核心領域實現了顯著提升。
根據開發者社區的實測反饋,其編碼能力已接近國際頂尖閉源模型Claude 3.7 Sonnet,尤其是在前端代碼生成和復雜邏輯處理中,表現出更高的準確性與流暢性。
例如,在處理多線程異步任務或動態網頁交互設計時,模型能生成更符合工程規范的代碼結構,甚至能主動提示潛在的性能優化點。
在X上,有專業用戶對V3-0324、V3-old、Claude 3.5、Claude 3.7下達了同樣的任務,實際產出的效果也出現了巨大差異。
提示詞:創建包含CSS和JavaScript的單個HTML文件,以生成動畫天氣卡。卡片應以不同的動畫直觀地表示以下天氣狀況:風:(例如,移動的云、搖曳的樹木或風線) 雨:(例如,落下的雨滴、形成的水坑) 太陽:(例如,閃亮的光線、明亮的背景) 雪:(例如,飄落的雪花、積雪) 并排顯示所有天氣卡片 卡片應具有深色背景。在此文件中提供所有HTML、CSS和JavaScript代碼。JavaScript應包括一種在不同天氣條件之間切換的方法(例如,一個函數或一組按鈕),以演示每種天氣條件的動畫。
提示詞:“創建 Saas 登陸頁面”
可以看出,V3-0324的編碼能力比之前的老版本v3的能力要強的多,并且已經接近目前號稱“編程能力最強模型”Claude3.7了。
有網友利用 github 開源評測環境,對DeepSeek-V3-0324 進行了代碼實測。
DeepSeek-V3-0324 以 328.3 分在 KCORES 大模型競技場排名第三,僅次于 claude-3.7-sonnet-thinking 和 claude-3.5 ,超越了DeepSeek-R1、claude-3.7-sonnet 等。
要知道,DeepSeek-V3-0324不是一個 Thinking 模型!
四項評測中——
20 個小球碰撞測試:肉眼可見的進步,之前 DeepSeek-V3 的小球擠成一團,現在物理運動模擬得非常好,僅因掉出了7邊形扣了5分,項目排名第5。
mandelbrot-set-meet-libai 測試:沒有過多變化,分數較DeepSeek-V3 低了2分,主要還是將渲染方向搞反了以至于拖累了渲染性能,但是完成度可以看到比之前高很多,項目排名第12。
火星任務測試:巨大的提升,這次星球,圖例均渲染正確,甚至發射和返回窗口計算也有很大進步,項目排名并列第2 。
九大行星模擬測試:也是巨大的提升,它是測試的25個模型中,唯一一個畫了土星環的大模型!(畫土星環就如同畫時鐘要寫3,6,9,12),項目排名并列第13。
此外, V3-0324延續了與R1一樣的開源許可MIT,這意味著V3-0324有著比初代V3更寬松的開源使用條件。
并且MIT開源許可一向以商業友好而著稱,使用MIT許可的項目可以與商業和專有軟件集成。
總體而言,DeepSeek-V3-0324 表現出來的技術能力進化讓人難以相信這只是個小版本迭代,不是 R2,甚至不是 V4。
這讓我們比期待 ChatGPT5 ,更數倍的期待 DeepSeek-R2 的發布了!
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.