99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek-R1 更新,思考更深,推理更強

0
分享至

DeepSeek R1 模型已完成小版本升級,當前版本為 DeepSeek-R1-0528。用戶通過官方網站、APP 或小程序進入對話界面后,開啟“深度思考”功能即可體驗最新版本。API 也已同步更新,調用方式不變。


深度思考能力強化

DeepSeek-R1-0528 仍然使用 2024 年 12 月所發布的 DeepSeek V3 Base 模型作為基座,但在后訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。

更新后的 R1 模型在數學、編程與通用邏輯等多個基準測評中取得了當前國內所有模型中首屈一指的優異成績,并且在整體表現上已接近其他國際頂尖模型,如 o3 與 Gemini-2.5-Pro。


DeepSeek-R1-0528 在各項評測集上均取得了優異表現

(基準測試使用 64K 輸出長度;在 Humanity's Last Exam 中,只使用其中的文本題目進行測試)

相較于舊版 R1,新版模型在復雜推理任務中的表現有了顯著提升。例如在 AIME 2025 測試中,新版模型準確率由舊版的 70% 提升至 87.5%。這一進步得益于模型在推理過程中的思維深度增強:在 AIME 2025 測試集上,舊版模型平均每題使用 12K tokens,而新版模型平均每題使用 23K tokens,表明其在解題過程中進行了更為詳盡和深入的思考。

同時,我們蒸餾 DeepSeek-R1-0528 的思維鏈后訓練 Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。該 8B 模型在數學測試 AIME 2024 中僅次于 DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),與 Qwen3-235B 相當。我們相信,DeepSeek-R1-0528 的思維鏈對于學術界推理模型的研究和工業界針對小模型的開發都將具有重要意義。


DeepSeek-R1-0528-Qwen3-8B 等開源模型的 AIME 2024 對比結果

其他能力更新

  • 幻覺改善:新版 DeepSeek R1 針對“幻覺”問題進行了優化。與舊版相比,更新后的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了 45~50% 左右,能夠有效地提供更為準確、可靠的結果。

  • 創意寫作:在舊版 R1 的基礎上,更新后的 R1 模型針對議論文、小說、散文等文體進行了進一步優化,能夠輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。


上下滑動查看完整內容


  • 工具調用:DeepSeek-R1-0528 支持工具調用(不支持在 thinking 中進行工具調用)。當前模型 Tau-Bench 測評成績為 airline 53.5% / retail 63.9%,與 OpenAI o1-high 相當,但與 o3-High 以及 Claude 4 Sonnet 仍有差距。



示例為通過 LobeChat 使用 DeepSeek-R1-0528 的工具調用能力得到的網頁文章總結

此外,DeepSeek-R1-0528 在前端代碼生成、角色扮演等領域的能力均有更新和提升。


示例為在網頁端調用 DeepSeek-R1-0528 使用 HTML/CSS/JavaScript 開發的一個現代簡約風格的單詞卡片應用

API 更新

API 已同步更新,接口與調用方式保持不變。新版 R1 API 仍支持查看模型思考過程,同時還增加了 Function Calling 和 JsonOutput 的支持。

我們對新版 R1 API 中 max_tokens 參數的含義做了調整:現在 max_tokens用于限制模型單次輸出的總長度(包括思考過程),默認為 32K,最大為 64K。請 API 用戶及時調整 max_tokens 參數以防輸出被提前截斷。

R1 模型的使用方法詳見 API 指南:

https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

本次 R1 更新后,官方網站、小程序、App 端和 API 中的模型上下文長度仍為 64K。如果用戶對更長的上下文長度有需求,可以通過其他第三方平臺調用上下文長度為 128K 的開源版本 R1-0528 模型。

模型開源

DeepSeek-R1-0528 與之前的 DeepSeek-R1 使用同樣的 base 模型,僅改進了后訓練方法。私有化部署時只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相關變動)。模型參數為 685B(其中 14B 為 MTP 層),開源版本上下文長度為 128K(網頁端、App 和 API 提供 64K 上下文)。

DeepSeek-R1-0528 模型權重下載請參考:

Model Scope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528

Huggingface:

https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

與舊版本的 DeepSeek-R1 保持一致,此次我們的開源倉庫(包括模型權重)仍然統一采用 MIT License,并允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為什么伊朗被打,全體穆斯林世界都裝聾作啞?

為什么伊朗被打,全體穆斯林世界都裝聾作啞?

七分日記
2025-06-24 00:13:22
億萬年的演化迭代,大自然嚴選!B-2是美國制造業工業設計的巔峰之作

億萬年的演化迭代,大自然嚴選!B-2是美國制造業工業設計的巔峰之作

高博新視野
2025-06-23 16:18:58
正在使用的20元紙幣,一張1.47萬元,誰還有。

正在使用的20元紙幣,一張1.47萬元,誰還有。

談錢說幣
2025-06-18 14:24:10
恩里克:國際足聯要每兩年辦屆世俱杯?那不如每兩個月一次吧

恩里克:國際足聯要每兩年辦屆世俱杯?那不如每兩個月一次吧

懂球帝
2025-06-25 05:20:28
兩大官方媒體表態后,中央明確違規餐飲界限!糾正偏差機制啟動

兩大官方媒體表態后,中央明確違規餐飲界限!糾正偏差機制啟動

娛樂圈見解說
2025-06-25 14:14:14
港媒曝:頂流姜濤因不開心服藥墜海,已獲救,姜濤經紀人發文回應

港媒曝:頂流姜濤因不開心服藥墜海,已獲救,姜濤經紀人發文回應

娛圈小愚
2025-06-25 08:53:38
高圓圓雖然很漂亮,但到這個年齡還是少穿這種露肉的衣服好。

高圓圓雖然很漂亮,但到這個年齡還是少穿這種露肉的衣服好。

TVB的四小花
2025-06-12 10:14:51
一小學食堂被曝使用發臭豬肉,四川富順縣通報:涉事學校、縣教體局、縣市場監管局相關負責人停職檢查!

一小學食堂被曝使用發臭豬肉,四川富順縣通報:涉事學校、縣教體局、縣市場監管局相關負責人停職檢查!

新京報
2025-06-24 14:11:16
拒絕加盟,再見勇士!金州失去吸引力,庫里第5冠還有希望嗎?

拒絕加盟,再見勇士!金州失去吸引力,庫里第5冠還有希望嗎?

山河入畫屏
2025-06-25 08:26:14
熊貓中心辟謠“大熊貓背部有血洞”:是毛被泥染色,不是血色

熊貓中心辟謠“大熊貓背部有血洞”:是毛被泥染色,不是血色

南方都市報
2025-06-25 10:51:10
A股出其不意大漲,6月25日,明天的A股漲跌或直接定調!

A股出其不意大漲,6月25日,明天的A股漲跌或直接定調!

風口招財豬
2025-06-25 03:05:26
杜蘭特上賽季將對位人命中率限制到41.1% 聯盟第2好 僅次于阿門

杜蘭特上賽季將對位人命中率限制到41.1% 聯盟第2好 僅次于阿門

直播吧
2025-06-25 16:57:15
李善德將荔枝運到長安為啥花費了56720貫?相當于現在多少錢?

李善德將荔枝運到長安為啥花費了56720貫?相當于現在多少錢?

卿昀
2025-06-19 18:21:35
美國和伊朗聯手演戲,騙了全世界,最大輸家出現,并非以色列

美國和伊朗聯手演戲,騙了全世界,最大輸家出現,并非以色列

侃侃娛季
2025-06-25 15:12:57
為何被毒蛇咬死的雞不僅沒毒,反而更加美味?蛇咬死的雞真能吃嗎?

為何被毒蛇咬死的雞不僅沒毒,反而更加美味?蛇咬死的雞真能吃嗎?

農夫也瘋狂
2025-06-25 10:10:41
中方等了15年,俄羅斯終于松口,普京對華交了底,中俄關系迎質變

中方等了15年,俄羅斯終于松口,普京對華交了底,中俄關系迎質變

史海無崖
2025-06-24 09:51:57
上臺前李在明對華友好,剛上臺便引發黃海爭端,變臉比翻書還快?

上臺前李在明對華友好,剛上臺便引發黃海爭端,變臉比翻書還快?

小柨拍客在北漂
2025-06-24 11:36:12
個人養老金為何要交3%個稅?專家詳解

個人養老金為何要交3%個稅?專家詳解

第一財經資訊
2025-06-25 14:40:19
56農民工父親陪女兒高考,自己考678分,清華:38年前找過他

56農民工父親陪女兒高考,自己考678分,清華:38年前找過他

磊子講史
2025-06-21 11:54:10
滿屏的帥35歲貝爾合影61歲布拉德皮特

滿屏的帥35歲貝爾合影61歲布拉德皮特

直播吧
2025-06-24 19:59:12
2025-06-25 18:08:49
開源中國 incentive-icons
開源中國
每天為開發者推送最新技術資訊
7147文章數 34424關注度
往期回顧 全部

科技要聞

小米YU7已下線500輛展車 26日前運往全國

頭條要聞

特朗普稱中國可以繼續從伊朗購買石油 外交部回應

頭條要聞

特朗普稱中國可以繼續從伊朗購買石油 外交部回應

體育要聞

山西太原大媽,在NBA闖出一片天

娛樂要聞

向佐接機郭碧婷,全程無交流像陌生人

財經要聞

滬指創年內新高 這次真不一樣了?

汽車要聞

售14.99萬/限量200臺 別克昂科威S新增丹霞紅內飾

態度原創

手機
藝術
教育
數碼
軍事航空

手機要聞

榮耀Magic V5頂配首發全新青海湖刀片電池 硅含量遙遙領先

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

提前批志愿推進平行志愿模式改革 考生該如何報考

數碼要聞

小米明晚發布小米手表S4,表殼尺寸41mm

軍事要聞

伊朗總統:12天戰爭結束 重建工作開啟

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 那曲县| 德格县| 巴彦县| 凤阳县| 乃东县| 万荣县| 民丰县| 孟津县| 彰化市| 广宗县| 海伦市| 腾冲县| 丰宁| 永修县| 内江市| 泾源县| 南汇区| 茶陵县| 雅安市| 威信县| 利川市| 莒南县| 石城县| 十堰市| 利津县| 合江县| 岳阳县| 和林格尔县| 历史| 通辽市| 锡林郭勒盟| 芜湖县| 辉南县| 中阳县| 海淀区| 西和县| 景洪市| 玉林市| 阜南县| 陇西县| 鹿邑县|