5月29日晚間,深度求索微信公眾號公布了 DeepSeek-R1-0528 更新的詳細升級內容,DeepSeek-R1-0528 仍然使用 2024年12月所發布的 DeepSeek V3 Base 模型作為基座,但在后訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新后的 R1 模型在數學、編程與通用邏輯等多個基準測評中取得了當前國內所有模型中首屈一指的優異成績,并且在整體表現上已接近其他國際頂尖模型,如 o3 與 Gemini-2.5-Pro。
圖片來源:視覺中國
其他能力更新比如:
1.幻覺改善:新版 DeepSeek R1 針對“幻覺”問題進行了優化。與舊版相比,更新后的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了 45~50% 左右,能夠有效地提供更為準確、可靠的結果。
2.創意寫作:在舊版 R1 的基礎上,更新后的 R1 模型針對議論文、小說、散文等文體進行了進一步優化,能夠輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。
3.工具調用:DeepSeek-R1-0528 支持工具調用(不支持在 thinking 中進行工具調用)。當前模型 Tau-Bench 測評成績為 airline 53.5% / retail 63.9%,與 OpenAI o1-high 相當,但與 o3-High 以及 Claude 4 Sonnet 仍有差距。
5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平臺開源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級,用戶可通過官方網頁、App、小程序進行測試(打開深度思考),API接口和使用方式保持不變。
每日經濟新聞綜合公開消息
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.