DeepSeek 昨天低調發布了 R1 新版:DeepSeek-R1-0528。
該模型具有 685B 規模,支持 BF16,目前已上架 HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
據悉,升級后的 DeepSeek R1 在語義理解精準性、復雜邏輯推理、長文本處理穩定性等方面進行了強化。
網友總結的 DeepSeek-R1-0528 核心更新亮點:
- 能像谷歌模型一樣深度推理
- 文本生成優化:更自然,格式更佳
- 獨特的推理風格:不僅快,而且更縝密
- 支持長時思考:單任務處理時長可達30-60分鐘
此外,代碼測試平臺 LiveCodeBench 上的數據顯示,DeepSeek R1 得分非常接近 O3 (High) 和 O4-Mini。
AI 科技博主「karminski-牙醫」用同一個 prompt 測試了 DeepSeek-R1-0528 和 Claude 4 Sonnet 后發現,不管是光線照射在墻上形成的漫反射,還是球在撞擊后的運動方向,亦或是控制面板的美觀程度,這一把 R1 穩贏。
這是自 3 月底以來 DeepSeek 的一次最新動作。
DeepSeek-V3 模型更新,各項能力全面進階
3 月 25 日晚,DeepSeek 公司在官方賬號上正式宣布 V3 模型完成小版本升級的消息,并介紹了新版本 DeepSeek-V3-0324 模型的提升細節,包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.