網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

DeepSeek R1 迎來小更新大升級(jí)，性能直逼 OpenAI o3！

2025-05-29 16:10:41　來源: AI科技大本營(yíng)

北京舉報(bào)

分享至

整理 | 蘇宓

出品 | CSDN（ID：CSDNnews）

昨日，DeepSeek 悄然發(fā)布了其 R1 大模型的最新版本——DeepSeek-R1-0528，目前已開啟公測(cè)。

一貫低調(diào)的 DeepSeek 在此番發(fā)布時(shí)，并未附帶詳細(xì)的技術(shù)說明，只是在官方微信社群中告知用戶，“DeepSeek R1 模型已完成小版本試升級(jí)”，大家可以自行前往官方網(wǎng)頁、APP、小程序進(jìn)行測(cè)試。

Hugging Face 地址：https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

但從用戶體驗(yàn)反饋來看，本次名曰”小更新“也依然帶來了不小的實(shí)質(zhì)性改進(jìn)，尤其是在推理和輸出方面。具體來看，新版的 DeepSeek R1：

推理能力增強(qiáng)：模型在“思維鏈”（Chain-of-Thought）推理方面表現(xiàn)更為結(jié)構(gòu)化，邏輯性更強(qiáng)。

文本輸出質(zhì)量提升：生成的文本更具條理，語言風(fēng)格更為成熟，接近 Google 等領(lǐng)先模型的水平。
代碼生成優(yōu)化：在編程任務(wù)中，R1 的輸出更為連貫，代碼質(zhì)量更高。

對(duì)此，Reddit 用戶 B89983ikei 在使用后表示：“它在編程方面真的非常厲害！！只用一次對(duì)話，就能創(chuàng)建一個(gè)完整的游戲，包含多個(gè)選項(xiàng)，而且完全可玩！！

我注意到新版 R1 的一個(gè)顯著變化是……它在編程方面更強(qiáng)了！！但它卻在一些（未知的）演繹推理挑戰(zhàn)上失敗了……這些題它以前可是能答對(duì)的！！另一個(gè)明顯的變化是，現(xiàn)在它在推理時(shí)會(huì)體現(xiàn)出差異性，而且會(huì)用用戶的母語思考，不再像以前那樣只用英文。”

不過，B89983ikei 也補(bǔ)充道：「對(duì)我來說，我很喜歡解決那種偏“抽象”的推理題……所以我覺得這個(gè)版本的 R1 反而變?nèi)趿恕Ｎ也逻@是因?yàn)樗F(xiàn)在的思維方式發(fā)生了變化……它更專注于精確的問題，反而忽略了更抽象的部分。我不確定這是不是一件好事！！對(duì)我來說，這是個(gè)倒退……

當(dāng)我們?nèi)サ裟切└橄蟮乃季S時(shí)，也許就等于在去掉更接近“真實(shí)思考”的東西！！如果你能明白我在說什么……有沒有其他人也注意到了這一點(diǎn)！？

還有，這次更新的文本格式我也不太喜歡……更讓人困惑！！沒有以前看著舒服了……用了太多沒必要的 emoji！！這些是一個(gè)喜歡并一直在用 DeepSeek 的用戶的建設(shè)性批評(píng)！！」

與此同時(shí)，也有網(wǎng)友發(fā)現(xiàn)新版 DeepSeek R1 在響應(yīng)時(shí)間上略有增加，但多數(shù)用戶認(rèn)為這是為了獲得更準(zhǔn)確結(jié)果而值得的權(quán)衡。

在進(jìn)行測(cè)試后，還有用戶給出了新款 Deepseek R1 的第一個(gè)基準(zhǔn)測(cè)試！

新的 Deepseek R1-0528 在 LiveCodeBench 基準(zhǔn)測(cè)試中的表現(xiàn)幾乎與 o3（high）相當(dāng)。

X 網(wǎng)友 Yuchen Jin 經(jīng)過實(shí)測(cè)還發(fā)現(xiàn)，”我的氛圍檢查：它似乎是唯一能夠始終正確回答’9.9 - 9.11 是多少？‘的模型。“

和舊版對(duì)比時(shí)，OpenRouter 透露，“新版本的 DeepSeek R1 目前已訓(xùn)練至 1 億 tokens，且還在持續(xù)增長(zhǎng)，其中還包括一個(gè)免費(fèi)版本！”對(duì)比圖如下所示：

整體來看，DeepSeek 自 2023 年成立以來，一直在專注打造高性能的通用人工智能模型。像 DeepSeek v3 和 R1 這樣的模型，在多個(gè)評(píng)測(cè)中都拿到了很不錯(cuò)的成績(jī)。特別是 R1，它是開源的，采用 MIT 協(xié)議，大家可以免費(fèi)使用、修改，甚至拿來做商業(yè)項(xiàng)目，這對(duì)于推動(dòng) AI 技術(shù)的普及和創(chuàng)新有很大幫助。

那么你試用上最新的 R1 模型了嗎？感覺怎么樣？歡迎留言分享你的使用體驗(yàn)

2025 全球產(chǎn)品經(jīng)理大會(huì)

2025 年 8 月 15–16 日

北京·威斯汀酒店

2025 全球產(chǎn)品經(jīng)理大會(huì)將匯聚互聯(lián)網(wǎng)大廠、AI 創(chuàng)業(yè)公司、ToB/ToC 實(shí)戰(zhàn)一線的產(chǎn)品人，圍繞產(chǎn)品設(shè)計(jì)、用戶體驗(yàn)、增長(zhǎng)運(yùn)營(yíng)、智能落地等核心議題，展開 12 大專題分享，洞察趨勢(shì)、拆解路徑、對(duì)話未來。

更多詳情與報(bào)名，請(qǐng)掃碼下方二維碼。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.