5月29日消息,在官宣“小版本更新”并開源新模型之后。晚間,DeepSeek 終于官宣。
官方表示其旗下旗艦模型 DeepSeek-R1完成小版本更新,版本號升級為 DeepSeek-R1-0528。新版本已在官網、App、小程序及 API 全面上線,用戶啟用“深度思考”功能后即可體驗。
本次升級,主要集中在模型的深度思考能力的強化、幻覺的改善,以及創意寫作方面。
官方表示,DeepSeek-R1-0528依舊基于 DeepSeek V3 Base 模型構建,但在后訓練階段投入更多算力,使其在數學、編程、邏輯推理等任務中表現大幅提升。
官方數據顯示,新版模型在復雜數學測評 AIME 2025中的準確率由原來的70% 提升至87.5%。平均每題推理使用 token 數從12K 提高到23K,顯著表明其在“深度思考”過程中的路徑更長、分析更細。
DeepSeek-R1-0528在各項評測集上均取得了優異表現
圍繞“思維鏈”技術,DeepSeek 還將 R1-0528的推理路徑蒸餾至 Qwen3-8B Base 模型,推出小模型 DeepSeek-R1-0528-Qwen3-8B,在 AIME 2024中表現超越 Qwen3-8B,逼近 Qwen3-235B,驗證了高質量推理鏈的通用性與遷移能力。
在文本生成方面,R1-0528優化了議論文、小說、散文等寫作能力,能輸出更長、更符合人類偏好的長篇內容。同時,幻覺率下降45~50%,在改寫、總結、理解等場景中輸出更為精準。
此外,R1-0528還支持工具調用。在 Tau-Bench 測評中,其工具調用能力已與 OpenAI o1-high 相當。前端代碼生成、網頁開發、角色扮演等能力也都有更新。(袁寧)