大家好,我是 Ai 學習的老章
之前推薦過 N 多讀論文神器,比如可以的 ArXiv MCP 服務器、整篇翻譯并保留樣式的、還有最近剛剛分享的的 AlphaXiv
今天再推薦一個更強大的,可以復現機器學習論文代碼的工具——Paper2Code
開源代碼不支持 DeepSeek ,稍作修改就可以使用 DeepSeek API 了
https://arxiv.org/pdf/2504.17192
一句話總結,PaperCoder
旨在通過利用大型語言模型(LLM)在多代理系統中直接從機器學習研究論文中生成完整的、可執行的代碼庫。
PaperCoder 框架的三階段方法,展示了它如何通過規劃、分析和編碼階段將研究論文轉換為代碼庫
"盡管機器學習研究快速增長,相應的代碼實現通常不可用,使研究人員復現結果和基于先前工作構建變得緩慢且勞動密集。"
頂級機器學習會議的分析表明,只有一小部分被接受的論文提供了相應的代碼:
在 ICLR 2024 上接受的論文中只有 21.2%,在 NeurIPS 2024 上接受的論文中只有 10.9%,在 ICML 2024 上接受的論文中只有 31.6% 提供了公開發布的代碼
PaperCoder
通過將研究庫生成形式化為軟件開發問題來解決可重復性挑戰。
該框架可以表示為 M(R) = C,其中:
R 是包含方法和算法的研究論文
C 是生成的代碼庫
M 是執行轉換的基于 LLM 的模型
該系統采用三階段方法,該方法反映了人類的軟件開發過程:
規劃階段:創建高級路線圖,包括架構設計(類圖和序列圖)、文件依賴關系識別和配置文件生成。
分析階段:對每個文件和函數進行細粒度的解釋,分析輸入、輸出、交互和算法約束。
生成階段:根據規劃期間確定的執行順序合成整個代碼庫。
每個階段都使用專門的 LLM 代理來實現,這些代理協同工作以完成任務,這使得PaperCoder
成為一個復雜的多代理系統。
效果怎么樣呢?
PaperCoder
的性能優于軟件開發工作基線,如ChatDev
和MetaGPT
,表明其專門設計的有效性。
作者與專家(包括原始論文作者)進行了評估,以評估生成代碼的質量。結果顯示:
PaperCoder 生成的存儲庫中有 77% 被人類評估者評為最佳
85% 的人類評審員報告說生成的存儲庫很有幫助

如何使用呢?
安裝
pip install openai export OPENAI_API_KEY=" " git clone https://github.com/going-doer/Paper2Code cd Paper2Code git clone https://github.com/allenai/s2orc-doc2json.git cd scripts bash run.sh
輸出結果如下
outputs ├── Transformer │ ├── analyzing_artifacts │ ├── coding_artifacts │ └── planning_artifacts └── Transformer_repo # Final output repository
系統的工作流程是:
將 PDF 論文轉換為 JSON 格式 0_pdf_process.py:4-17
分析論文內容并生成實現計劃 1_planning.py:26-36
進行邏輯分析 2_analyzing.py:49-54
生成代碼實現 3_coding.py:43-50

不過這個項目是默認 OpenAI 的 api,本地運行也只支持 vllm 拉起的模型。
我看了一下,其實該起來也非常簡單
比如把 OpenAI 切換為 DeepSeek,需要修改的腳本不多
修改 API 客戶端初始化和調用:
codes/1_planning.py
- 規劃生成組件 1_planning.py:1-16codes/2_analyzing.py
- 邏輯分析組件 2_analyzing.py:1-20codes/3_coding.py
- 代碼生成組件 3_coding.py:1-19
client = OpenAI(api_key = os.environ["OPENAI_API_KEY"])
修改為下面即可
client = OpenAI(api_key = os.environ["OPENAI_API_KEY"],base_url="https://api.siliconflow.cn/v1")
如果你用的是 DeepSeek 官方 API,base_url 改為 https://api.deepseek.com_/v1
其他類似
然后修改scripts/run.sh
中的環境變量設置: run.sh:1-3
export OPENAI_API_KEY="sk-XXXXXX" GPT_VERSION="deepseek-ai/DeepSeek-R1"
然后就全部 ok
最后推薦一個我正在學習的Cusor快速入門與實戰
制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.