整理 | 蘇宓
出品 | CSDN(ID:CSDNnews)
昨日,DeepSeek 悄然發布了其 R1 大模型的最新版本——DeepSeek-R1-0528,目前已開啟公測。
一貫低調的 DeepSeek 在此番發布時,并未附帶詳細的技術說明,只是在官方微信社群中告知用戶,“DeepSeek R1 模型已完成小版本試升級”,大家可以自行前往官方網頁、APP、小程序進行測試。
Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
但從用戶體驗反饋來看,本次名曰”小更新“也依然帶來了不小的實質性改進,尤其是在推理和輸出方面。具體來看,新版的 DeepSeek R1:
推理能力增強:模型在“思維鏈”(Chain-of-Thought)推理方面表現更為結構化,邏輯性更強。
文本輸出質量提升:生成的文本更具條理,語言風格更為成熟,接近 Google 等領先模型的水平。
代碼生成優化:在編程任務中,R1 的輸出更為連貫,代碼質量更高。
對此,Reddit 用戶 B89983ikei 在使用后表示:“它在編程方面真的非常厲害?。≈挥靡淮螌υ挘湍軇摻ㄒ粋€完整的游戲,包含多個選項,而且完全可玩??!
我注意到新版 R1 的一個顯著變化是……它在編程方面更強了?。〉鼌s在一些(未知的)演繹推理挑戰上失敗了……這些題它以前可是能答對的!!另一個明顯的變化是,現在它在推理時會體現出差異性,而且會用用戶的母語思考,不再像以前那樣只用英文?!?/p>
不過,B89983ikei 也補充道:「對我來說,我很喜歡解決那種偏“抽象”的推理題……所以我覺得這個版本的 R1 反而變弱了。我猜這是因為它現在的思維方式發生了變化……它更專注于精確的問題,反而忽略了更抽象的部分。我不確定這是不是一件好事??!對我來說,這是個倒退……
當我們去掉那些更抽象的思維時,也許就等于在去掉更接近“真實思考”的東西??!如果你能明白我在說什么……有沒有其他人也注意到了這一點???
還有,這次更新的文本格式我也不太喜歡……更讓人困惑!!沒有以前看著舒服了……用了太多沒必要的 emoji!!這些是一個喜歡并一直在用 DeepSeek 的用戶的建設性批評??!」
與此同時,也有網友發現新版 DeepSeek R1 在響應時間上略有增加,但多數用戶認為這是為了獲得更準確結果而值得的權衡。
在進行測試后,還有用戶給出了新款 Deepseek R1 的第一個基準測試!
新的 Deepseek R1-0528 在 LiveCodeBench 基準測試中的表現幾乎與 o3(high)相當。
X 網友 Yuchen Jin 經過實測還發現,”我的氛圍檢查:它似乎是唯一能夠始終正確回答’9.9 - 9.11 是多少?‘的模型?!?/p>
和舊版對比時,OpenRouter 透露,“新版本的 DeepSeek R1 目前已訓練至 1 億 tokens,且還在持續增長,其中還包括一個免費版本!”對比圖如下所示:
整體來看,DeepSeek 自 2023 年成立以來,一直在專注打造高性能的通用人工智能模型。像 DeepSeek v3 和 R1 這樣的模型,在多個評測中都拿到了很不錯的成績。特別是 R1,它是開源的,采用 MIT 協議,大家可以免費使用、修改,甚至拿來做商業項目,這對于推動 AI 技術的普及和創新有很大幫助。
那么你試用上最新的 R1 模型了嗎?感覺怎么樣?歡迎留言分享你的使用體驗!
2025 全球產品經理大會
2025 年 8 月 15–16 日
北京·威斯汀酒店
2025 全球產品經理大會將匯聚互聯網大廠、AI 創業公司、ToB/ToC 實戰一線的產品人,圍繞產品設計、用戶體驗、增長運營、智能落地等核心議題,展開 12 大專題分享,洞察趨勢、拆解路徑、對話未來。
更多詳情與報名,請掃碼下方二維碼。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.