DeepSeek R1型號(hào)進(jìn)行了小版本升級(jí),當(dāng)前版本是DeepSeek-R1-0528。
這次更新中,DeepSeek R1通過利用增加的計(jì)算資源并在訓(xùn)練后引入算法優(yōu)化機(jī)制,顯著提高了其推理深度和推理能力。 該模型在包括數(shù)學(xué)、編程和一般邏輯在內(nèi)的各種基準(zhǔn)評(píng)估中都表現(xiàn)出了出色的表現(xiàn)。 它的整體性能現(xiàn)在接近領(lǐng)先模型,如O3和Gemini 2.5 Pro。
除了核心的推理能力,新版本在減少幻覺、增強(qiáng)函數(shù)調(diào)用支持以及提升“vibe coding”方面也有所優(yōu)化
MIT許可
DeepSeek不僅在旗艦?zāi)P蜕习l(fā)力,還考慮到了小型化模型的應(yīng)用前景。他們將DeepSeek-R1-0528的“思考鏈”(chain-of-thought)能力蒸餾到了Qwen3 8B基礎(chǔ)模型上,成功打造出DeepSeek-R1-0528-Qwen3-8B
這款8B模型在AIME 2024測(cè)試中,超越了原版Qwen3 8B并且達(dá)到了與Qwen3-235B-thinking版本相媲美的性能,成為開源8B模型在該測(cè)試上的SOTA 。這對(duì)于推動(dòng)小型化推理模型在學(xué)術(shù)研究和工業(yè)界的落地具有重要意義
例如,在AIME 2024上,DeepSeek-R1-0528-Qwen3-8B得分86.0,而Qwen3-8B為76.0,Qwen3-235B-A22B為85.7
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.