日前,DeepSeek方面宣布旗下DeepSeek-R1模型已完成小版本升級、當前版本為DeepSeek-R1-0528。據了解,目前用戶通過DeepSeek官方網站、App或小程序進入對話界面后,開啟“深度思考”功能即可體驗DeepSeek-R1-0528,同時API也已同步更新,調用方式不變。
據DeepSeek方面介紹,DeepSeek-R1-0528仍然使用發布于2024年12月的DeepSeek V3 Base 模型作為基座,但得益于在后訓練過程中投入更多算力,其思維深度與推理能力得到了“顯著提升”。
DeepSeek方面公布的相關信息中顯示,DeepSeek-R1-0528在數學、編程與通用邏輯等多個基準測評中取得了當前國內所有模型中首屈一指的優異成績,并且在整體表現上已接近其他國際頂尖模型,如o3與Gemini-2.5-Pro。
同時DeepSeek方面還蒸餾DeepSeek-R1-0528的思維鏈后訓練Qwen3-8B Base,得到了DeepSeek-R1-0528-Qwen3-8B。據了解,該模型在數學測試AIME 2024中僅次于DeepSeek-R1-0528,超越了Qwen3-8B ,與Qwen3-235B相當。對此DeepSeek方面表示,“我們相信,DeepSeek-R1-0528 的思維鏈對于學術界推理模型的研究和工業界針對小模型的開發都將具有重要意義”。
據悉,DeepSeek-R1-0528的升級與更新還涉及幻覺、創意寫作、工具調用等方面。其中在幻覺方面,與舊版相比,DeepSeek-R1-0528在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了 45-50% ,能夠有效地提供更為準確、可靠的結果。
在創意寫作方面,在舊版本的基礎上,DeepSeek-R1-0528針對議論文、小說、散文等文體進行了進一步優化,能夠輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。二在工具調用方面,與舊版相比,DeepSeek-R1-0528已支持工具調用,并且其在Tau-Bench的測評成績為airline 53.5%/retail 63.9%,與OpenAI o1-high相當。
值得一提的是,在DeepSeek-R1-0528發布后,獨立AI分析網站Artificial Analysis方面表示,DeepSeek一舉超越xAI、Meta和 Anthropic,與谷歌并列成為全球第二大人工智能實驗室,并成為"開源權重領域無可爭議的領導者"。
據了解,DeepSeek-R1-0528在Artificial Analysis智能指數中的得分從60分躍升至68分,這一提升幅度與OpenAI的o1模型到o3模型的差距相當。
【本文圖片來自網絡】
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.