99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

剛剛!DeepSeek-Prover-V2 技術細節公布,附論文

0
分享至


大家好,我是 Ai 學習的老章

DeepSeek 一貫的作風,先敲不作聲放出模型文件,隨后才公布技術細節。

1 小時前,DeepSeek 在其 GitHub 賬號放出了部分技術文檔和論文


項目地址:https://github.com/deepseek-ai/DeepSeek-Prover-V2論文:https://github.com/deepseek-ai/DeepSeek-Prover-V2/blob/master/DeepSeek_Prover_V2.pdf

1. 引言:形式化推理的挑戰與 DeepSeek 的方案

DeepSeek-Prover-V2 是一個開源的大型語言模型,專為 Lean 4 形式化定理證明而設計。該模型的初始化數據是通過 DeepSeek-V3 驅動的遞歸定理證明流程收集而來。其冷啟動訓練過程始于提示 DeepSeek-V3 將復雜問題分解為一系列子目標。已解決子目標的證明被合成為思維鏈過程,結合 DeepSeek-V3 的逐步推理,為強化學習創建初始冷啟動。這一過程使我們能夠將非形式化和形式化數學推理整合到一個統一的模型中。

DeepSeek-Prover-V2 正是為了應對這一挑戰而生,其核心創新在于:

  • 結合非形式化與形式化推理:利用強大的基礎模型 (DeepSeek-V3) 進行初始的非形式化推理(如生成證明思路、分解問題),然后將其與嚴謹的形式化證明步驟相結合。

  • 強化學習優化:通過強化學習,特別是利用子目標分解的策略,進一步提升模型在形式化證明構建中的能力。

2. 核心技術:遞歸證明搜索與強化學習

DeepSeek-Prover-V2 的訓練過程獨具特色,主要包含兩個階段:

a) 冷啟動數據合成 (Synthesize Cold-Start Reasoning Data)

  • 遞歸證明流水線:團隊開發了一個簡潔有效的遞歸定理證明流水線。首先,利用 DeepSeek-V3 將復雜的定理分解為高級別的證明草圖(Proof Sketches)和一系列子目標(Subgoals)。

  • 子目標證明:為了降低計算成本,使用一個較小的 7B 參數模型來處理每個子目標的證明搜索。

  • 數據合成:當一個復雜問題的所有子目標都被解決后,將完整的、逐步的形式化證明(由子目標證明組合而成)與 DeepSeek-V3 生成的相應思維鏈(Chain-of-Thought, CoT,包含高級證明思路和引理分解)配對,形成用于模型初始訓練的“冷啟動”推理數據。這一過程巧妙地將非形式化的解題思路與形式化的證明步驟融為一體。

b) 基于合成數據的強化學習 (Reinforcement Learning with Synthetic Cold-Start Data)

  • 篩選挑戰性問題:選取一部分對于 7B 模型來說端到端無法解決、但其所有分解子目標都已被成功證明的難題。

  • 數據增強:將這些難題的完整形式化證明(由子目標證明拼接而成)附加到 DeepSeek-V3 對應的 CoT 后面,生成更豐富的訓練數據。

  • 強化學習微調:在冷啟動數據上進行初步微調后,采用強化學習進一步優化模型。獎勵信號主要采用二元反饋(證明正確或錯誤),目標是增強模型連接非形式化推理和形式化證明構建的能力。

3. 模型與性能

DeepSeek-Prover-V2 發布了兩個尺寸的模型:

  • DeepSeek-Prover-V2-7B:基于 DeepSeek-Prover-V1.5-Base 構建,上下文長度擴展至 32K tokens。

  • DeepSeek-Prover-V2-671B:基于 DeepSeek-V3-Base 訓練。

性能方面,DeepSeek-Prover-V2-671B表現出色,達到了當前神經定理證明領域的 SOTA (State-of-the-Art) 水平:

  • MiniF2F-test數據集上達到88.9%的通過率。

  • 解決了PutnamBench數據集中 658 個問題中的49個。

團隊還公開了模型在 miniF2F 數據集上生成的證明,可供下載研究:minif2f-solutions.zip[1]

模型文件:https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B


4. ProverBench: 新的基準測試集

為了更全面地評估模型在不同難度數學問題上的能力,團隊還推出了ProverBench基準測試集,包含 325 個問題:

  • 15 個 AIME 問題:來自近兩年的美國數學邀請賽 (AIME 24, 25) 的數論和代數題目,代表了真實的高中競賽水平挑戰。

  • 310 個教科書/教程問題:來自精選的教科書案例和教育教程,提供了多樣化且具有教學意義的形式化數學問題。

ProverBench 旨在覆蓋從高中競賽到本科水平的數學問題,為形式化推理模型的評估提供了更豐富的視角。

ProverBench 數據集地址:https://huggingface.co/datasets/deepseek-ai/DeepSeek-ProverBench[2]

5. 如何開始使用 DeepSeek-Prover-V2

用戶可以直接通過 Hugging Face 的transformers庫來使用 DeepSeek-Prover-V2 進行推理。

  • 模型下載:

    • 7B 模型: https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-7B [3]

    • 671B 模型: https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B [4]

  • 架構說明:DeepSeek-Prover-V2-671B 與 DeepSeek-V3 共享相同架構,詳細信息可參考 Hugging Face 上的 DeepSeek-V3 文檔 [5] 。

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

參考資料

minif2f-solutions.zip: https://github.com/deepseek-ai/DeepSeek-Prover-V2/raw/master/minif2f-solutions.zip

https://huggingface.co/datasets/deepseek-ai/DeepSeek-ProverBench: https://huggingface.co/datasets/deepseek-ai/DeepSeek-ProverBench

https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-7B: https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-7B

https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B: https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B

[5]

Hugging Face 上的 DeepSeek-V3 文檔: https://github.com/huggingface/transformers/blob/main/docs/source/en/model_doc/deepseek_v3.md

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
突發!300849,被證監會立案!

突發!300849,被證監會立案!

新浪財經
2025-06-27 20:09:47
2025養老金調整無進展,人社部卻連發三條動態,真令人浮想聯翩

2025養老金調整無進展,人社部卻連發三條動態,真令人浮想聯翩

社保精算師
2025-06-27 17:33:19
老祖宗常告誡“勿近白虎”,“白虎”究竟是什么?真有這么可怕嗎

老祖宗常告誡“勿近白虎”,“白虎”究竟是什么?真有這么可怕嗎

大千世界觀
2025-05-22 16:57:05
42歲技術總監被辭僅得8萬,秒退所有工作群,次日217個未接來電

42歲技術總監被辭僅得8萬,秒退所有工作群,次日217個未接來電

磊子講史
2025-06-21 16:39:29
83歲蔡瀾去世!遺體已火化,生前住酒店無兒無女,四大才子全離世

83歲蔡瀾去世!遺體已火化,生前住酒店無兒無女,四大才子全離世

萌神木木
2025-06-27 16:02:42
央視暗訪,這些網紅醫生被曝光

央視暗訪,這些網紅醫生被曝光

新浪財經
2025-06-27 14:31:53
愛沙尼亞準備接收可搭載核武器戰機,克宮:對俄構成直接威脅

愛沙尼亞準備接收可搭載核武器戰機,克宮:對俄構成直接威脅

界面新聞
2025-06-27 20:04:56
董軍防長給足面子,印度防長仍拒簽聯合聲明,但對華作出罕見承諾

董軍防長給足面子,印度防長仍拒簽聯合聲明,但對華作出罕見承諾

愛史紀
2025-06-27 12:15:58
民航局發緊急通知,大量充電寶被丟棄在機場,有無這個標識是關鍵

民航局發緊急通知,大量充電寶被丟棄在機場,有無這個標識是關鍵

市井覓食記
2025-06-27 13:57:24
從特工偷拍渣土車到突襲成功:美軍花了15年才摸清伊朗核設施情況

從特工偷拍渣土車到突襲成功:美軍花了15年才摸清伊朗核設施情況

湊近看世界
2025-06-27 07:00:14
葛斯齊曝汪小菲和S媽的聊天記錄是S媽給他爆料的,網友:騙傻子?

葛斯齊曝汪小菲和S媽的聊天記錄是S媽給他爆料的,網友:騙傻子?

心靜物娛
2025-06-27 10:09:02
已確認!是知名演員胡歌

已確認!是知名演員胡歌

FM93浙江交通之聲
2025-06-26 15:06:45
楊瀚森將在開拓者穿16號,球衣已在官方商店上架,售價140美元起

楊瀚森將在開拓者穿16號,球衣已在官方商店上架,售價140美元起

懂球帝
2025-06-27 14:23:14
熊磊要搬出許敏萬達的房子了!這還不是結尾, 許敏還將繼續上告

熊磊要搬出許敏萬達的房子了!這還不是結尾, 許敏還將繼續上告

魔都姐姐雜談
2025-06-27 11:32:04
明星老了不忍直視!鞠萍一臉兇相,任達華干瘦蠟黃,郭達長老年斑

明星老了不忍直視!鞠萍一臉兇相,任達華干瘦蠟黃,郭達長老年斑

洲洲影視娛評
2025-05-20 21:05:49
曝小米總監出軌200多人,6個私生子拍多張親密照,還有美女高中生

曝小米總監出軌200多人,6個私生子拍多張親密照,還有美女高中生

壹月情感
2025-06-26 22:26:40
自取滅亡的立陶宛,想讓中國妥協?中國這回真的沒手軟

自取滅亡的立陶宛,想讓中國妥協?中國這回真的沒手軟

任紀煙
2025-05-31 06:49:20
美國終明白擺脫不了稀土卡脖子,中方下命令:稀土專家上交護照

美國終明白擺脫不了稀土卡脖子,中方下命令:稀土專家上交護照

深析古今
2025-06-27 10:05:55
孩子吹空調26°最好?兒科醫生:錯,想要娃不生病,得開這個溫度

孩子吹空調26°最好?兒科醫生:錯,想要娃不生病,得開這個溫度

河山銳新聞
2025-06-23 13:53:16
這女人,果然是妖精

這女人,果然是妖精

妮妮玩不夠
2025-06-26 12:19:47
2025-06-27 21:39:00
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
3014文章數 11024關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

炸裂!榜一大姐深夜怒錘頂流

財經要聞

合新鐵路建設材料以次充好 多家單位被罰

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

教育
房產
健康
本地
公開課

教育要聞

昌平感知覺統合培訓班結業式暨鞏華中心小學一體化生態課間研討會

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

呼吸科專家破解呼吸道九大謠言!

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 六枝特区| 铜川市| 营山县| 喀喇沁旗| 石泉县| 衡南县| 都匀市| 开鲁县| 株洲县| 右玉县| 南川市| 同仁县| 乌兰察布市| 克什克腾旗| 虞城县| 兴仁县| 陕西省| 临武县| 弥勒县| 济南市| 武鸣县| 平武县| 定安县| 丁青县| 大方县| 贺州市| 剑阁县| 靖安县| 合肥市| 武川县| 斗六市| 辛集市| 达孜县| 桃江县| SHOW| 新营市| 永顺县| 巫溪县| 东兰县| 榆社县| 洪湖市|