整理 | 蘇宓
出品 | CSDN(ID:CSDNnews)
昨日,DeepSeek 悄然發(fā)布了其 R1 大模型的最新版本——DeepSeek-R1-0528,目前已開啟公測(cè)。
一貫低調(diào)的 DeepSeek 在此番發(fā)布時(shí),并未附帶詳細(xì)的技術(shù)說明,只是在官方微信社群中告知用戶,“DeepSeek R1 模型已完成小版本試升級(jí)”,大家可以自行前往官方網(wǎng)頁、APP、小程序進(jìn)行測(cè)試。
Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
但從用戶體驗(yàn)反饋來看,本次名曰”小更新“也依然帶來了不小的實(shí)質(zhì)性改進(jìn),尤其是在推理和輸出方面。具體來看,新版的 DeepSeek R1:
推理能力增強(qiáng):模型在“思維鏈”(Chain-of-Thought)推理方面表現(xiàn)更為結(jié)構(gòu)化,邏輯性更強(qiáng)。
文本輸出質(zhì)量提升:生成的文本更具條理,語言風(fēng)格更為成熟,接近 Google 等領(lǐng)先模型的水平。
代碼生成優(yōu)化:在編程任務(wù)中,R1 的輸出更為連貫,代碼質(zhì)量更高。
對(duì)此,Reddit 用戶 B89983ikei 在使用后表示:“它在編程方面真的非常厲害!!只用一次對(duì)話,就能創(chuàng)建一個(gè)完整的游戲,包含多個(gè)選項(xiàng),而且完全可玩!!
我注意到新版 R1 的一個(gè)顯著變化是……它在編程方面更強(qiáng)了!!但它卻在一些(未知的)演繹推理挑戰(zhàn)上失敗了……這些題它以前可是能答對(duì)的!!另一個(gè)明顯的變化是,現(xiàn)在它在推理時(shí)會(huì)體現(xiàn)出差異性,而且會(huì)用用戶的母語思考,不再像以前那樣只用英文。”
不過,B89983ikei 也補(bǔ)充道:「對(duì)我來說,我很喜歡解決那種偏“抽象”的推理題……所以我覺得這個(gè)版本的 R1 反而變?nèi)趿恕N也逻@是因?yàn)樗F(xiàn)在的思維方式發(fā)生了變化……它更專注于精確的問題,反而忽略了更抽象的部分。我不確定這是不是一件好事!!對(duì)我來說,這是個(gè)倒退……
當(dāng)我們?nèi)サ裟切└橄蟮乃季S時(shí),也許就等于在去掉更接近“真實(shí)思考”的東西!!如果你能明白我在說什么……有沒有其他人也注意到了這一點(diǎn)!?
還有,這次更新的文本格式我也不太喜歡……更讓人困惑!!沒有以前看著舒服了……用了太多沒必要的 emoji!!這些是一個(gè)喜歡并一直在用 DeepSeek 的用戶的建設(shè)性批評(píng)!!」
與此同時(shí),也有網(wǎng)友發(fā)現(xiàn)新版 DeepSeek R1 在響應(yīng)時(shí)間上略有增加,但多數(shù)用戶認(rèn)為這是為了獲得更準(zhǔn)確結(jié)果而值得的權(quán)衡。
在進(jìn)行測(cè)試后,還有用戶給出了新款 Deepseek R1 的第一個(gè)基準(zhǔn)測(cè)試!
新的 Deepseek R1-0528 在 LiveCodeBench 基準(zhǔn)測(cè)試中的表現(xiàn)幾乎與 o3(high)相當(dāng)。
X 網(wǎng)友 Yuchen Jin 經(jīng)過實(shí)測(cè)還發(fā)現(xiàn),”我的氛圍檢查:它似乎是唯一能夠始終正確回答’9.9 - 9.11 是多少?‘的模型。“
和舊版對(duì)比時(shí),OpenRouter 透露,“新版本的 DeepSeek R1 目前已訓(xùn)練至 1 億 tokens,且還在持續(xù)增長(zhǎng),其中還包括一個(gè)免費(fèi)版本!”對(duì)比圖如下所示:
整體來看,DeepSeek 自 2023 年成立以來,一直在專注打造高性能的通用人工智能模型。像 DeepSeek v3 和 R1 這樣的模型,在多個(gè)評(píng)測(cè)中都拿到了很不錯(cuò)的成績(jī)。特別是 R1,它是開源的,采用 MIT 協(xié)議,大家可以免費(fèi)使用、修改,甚至拿來做商業(yè)項(xiàng)目,這對(duì)于推動(dòng) AI 技術(shù)的普及和創(chuàng)新有很大幫助。
那么你試用上最新的 R1 模型了嗎?感覺怎么樣?歡迎留言分享你的使用體驗(yàn)
2025 全球產(chǎn)品經(jīng)理大會(huì)
2025 年 8 月 15–16 日
北京·威斯汀酒店
2025 全球產(chǎn)品經(jīng)理大會(huì)將匯聚互聯(lián)網(wǎng)大廠、AI 創(chuàng)業(yè)公司、ToB/ToC 實(shí)戰(zhàn)一線的產(chǎn)品人,圍繞產(chǎn)品設(shè)計(jì)、用戶體驗(yàn)、增長(zhǎng)運(yùn)營(yíng)、智能落地等核心議題,展開 12 大專題分享,洞察趨勢(shì)、拆解路徑、對(duì)話未來。
更多詳情與報(bào)名,請(qǐng)掃碼下方二維碼。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.