網易首頁 > 網易號 > 正文申請入駐

DeepSeek R1迎來小更新大升級，性能直逼OpenAI o3！

2025-05-29 09:40:00　來源: CSDN

北京舉報

分享至

整理 | 蘇宓

出品 | CSDN（ID：CSDNnews）

昨日，DeepSeek 悄然發布了其 R1 大模型的最新版本——DeepSeek-R1-0528，目前已開啟公測。

一貫低調的 DeepSeek 在此番發布時，并未附帶詳細的技術說明，只是在官方微信社群中告知用戶，“DeepSeek R1 模型已完成小版本試升級”，大家可以自行前往官方網頁、APP、小程序進行測試。

Hugging Face 地址：https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

但從用戶體驗反饋來看，本次名曰”小更新“也依然帶來了不小的實質性改進，尤其是在推理和輸出方面。具體來看，新版的 DeepSeek R1：

推理能力增強：模型在“思維鏈”（Chain-of-Thought）推理方面表現更為結構化，邏輯性更強。

文本輸出質量提升：生成的文本更具條理，語言風格更為成熟，接近 Google 等領先模型的水平。
代碼生成優化：在編程任務中，R1 的輸出更為連貫，代碼質量更高。

對此，Reddit 用戶 B89983ikei 在使用后表示：“它在編程方面真的非常厲害?。≈挥靡淮螌υ挘湍軇摻ㄒ粋€完整的游戲，包含多個選項，而且完全可玩??！

我注意到新版 R1 的一個顯著變化是……它在編程方面更強了?。〉鼌s在一些（未知的）演繹推理挑戰上失敗了……這些題它以前可是能答對的！！另一個明顯的變化是，現在它在推理時會體現出差異性，而且會用用戶的母語思考，不再像以前那樣只用英文?！?/p>

不過，B89983ikei 也補充道：「對我來說，我很喜歡解決那種偏“抽象”的推理題……所以我覺得這個版本的 R1 反而變弱了。我猜這是因為它現在的思維方式發生了變化……它更專注于精確的問題，反而忽略了更抽象的部分。我不確定這是不是一件好事??！對我來說，這是個倒退……

當我們去掉那些更抽象的思維時，也許就等于在去掉更接近“真實思考”的東西??！如果你能明白我在說什么……有沒有其他人也注意到了這一點??？

還有，這次更新的文本格式我也不太喜歡……更讓人困惑！！沒有以前看著舒服了……用了太多沒必要的 emoji！！這些是一個喜歡并一直在用 DeepSeek 的用戶的建設性批評??！」

與此同時，也有網友發現新版 DeepSeek R1 在響應時間上略有增加，但多數用戶認為這是為了獲得更準確結果而值得的權衡。

在進行測試后，還有用戶給出了新款 Deepseek R1 的第一個基準測試！

新的 Deepseek R1-0528 在 LiveCodeBench 基準測試中的表現幾乎與 o3（high）相當。

X 網友 Yuchen Jin 經過實測還發現，”我的氛圍檢查：它似乎是唯一能夠始終正確回答’9.9 - 9.11 是多少？‘的模型?！?/p>

和舊版對比時，OpenRouter 透露，“新版本的 DeepSeek R1 目前已訓練至 1 億 tokens，且還在持續增長，其中還包括一個免費版本！”對比圖如下所示：

整體來看，DeepSeek 自 2023 年成立以來，一直在專注打造高性能的通用人工智能模型。像 DeepSeek v3 和 R1 這樣的模型，在多個評測中都拿到了很不錯的成績。特別是 R1，它是開源的，采用 MIT 協議，大家可以免費使用、修改，甚至拿來做商業項目，這對于推動 AI 技術的普及和創新有很大幫助。

那么你試用上最新的 R1 模型了嗎？感覺怎么樣？歡迎留言分享你的使用體驗！

2025 全球產品經理大會

2025 年 8 月 15–16 日

北京·威斯汀酒店

2025 全球產品經理大會將匯聚互聯網大廠、AI 創業公司、ToB/ToC 實戰一線的產品人，圍繞產品設計、用戶體驗、增長運營、智能落地等核心議題，展開 12 大專題分享，洞察趨勢、拆解路徑、對話未來。

更多詳情與報名，請掃碼下方二維碼。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.