昨晚,OpenAI 上了個新功能:
Codex,云端的 Coding Agent
Codex 簡要概述 這東西,由 3 部分組成: codex-1 模型、云端沙盒、GitHub 接口封裝 不錯的產品,交互很贊 但不能自主裝依賴,目前干不了活
這個 Agent 的功能大概包含:
? 問答 Git 上的項目
? 跑現成的代碼
? 修代碼,提 PR(修改代碼,然后提交上去)
按 OpenAI 員工的說法,他們部分時候也會拿這個處理代碼
總評:非常沒用 用例實測
我必須再次說:這東西目前限制很多,包括不僅限于:
? ? 不能聯網 (不能訪問外部 API、網站)
? ? 不能臨時裝依賴 (如 pip install 無效)
? ? 只能用你倉庫里已有的代碼 + 你事先配置好的環境
所以這東西,只能做縫補,幾乎干不了重活
我能想到的幾個典型場景:
? QA 大佬們的代碼
? 寫一點不需要配環境的代碼
DeepEP 是之前 DeepSeek 開源的 Infra 框架,我先把它丟進去,選擇「詢問」就好了
寫 Verilog
我本職專業,是EE。
Verlog 這東西,和常規環境沒啥關系,但非常依賴 AI 對整體項目的理解,而且完全不能依賴 Rag 代碼。
效果是不錯的,改改能用(畢竟 o3)。
背后的實現
說真的,這東西的實現并不復雜,相信很快就會有一堆類似的。
分為三塊:模型、云端沙盒、打通 GitHub,分別來說說
模型
Codex 背后的模型是 codex-1,通過 o3 調出來的,讓風格更貼近「人寫的代碼」,并且準確性也提升了一些。
以及,發了一個同源的模型:codex-mini-latest,輸入 $1.5,輸出 $6 每百萬 token,比 o4-mini 貴了 30%左右。
在代碼場景下,效果比 o3 更好一點
調的方法,叫做 Reinforcement Learning, 強化微調,之前介紹過:
云端沙盒
Codex 的代碼是跑在云端的,會為每個任務啟動一個獨立的云端沙盒環境,這環境里:
? 預先拉好你選的 GitHub 倉庫(只讀)
? 跑你配置好的構建腳本、測試命令、lint 等
? 不聯網,也沒辦法 pip install
大致就是“開了一臺干凈的服務器”,只裝你確認過的東西,它再在里面開始「干活」。
在代碼場景下,效果比 o3 更好一點
注意:所有修改都只在這個沙盒里完成,Codex 不能直接動你線上倉庫的代碼,最終得你點按鈕發 PR 或下載補丁。
打通 GitHub
Codex 需要你授權 GitHub:
? 你點「Connect GitHub」之后,它會拿到你的倉庫只讀權限(或者寫權限,如果你開了)
? 如果你是團隊賬戶,還要選組織、設定權限范圍
? 需要啟用 MFA(多因素認證),畢竟你讓 AI 有權限提 PR,可以用 Google Auth 或者任何,這里我用的 OnePass

老實講...
這些任務,不用 Codex 也能完成
這個東西全名叫 Codex Research Preview,單純 Preview 已經不夠了,還得加上 Research,畢竟啥活也干不了,不要有太高的期待
但是,方向是很贊的。
假想一下 你干活干到一半去吃法了,AI 無縫接管了你的環境,繼續完成你的工作總結一下
Codex 是 ChatGPT 新加的遠程代碼助手。它:
? 產品設計確實不錯,放心也很穩
? 云上跑,隔離安全
? 模型靠譜(codex-1 微調自 o3)
? 流程清晰,輸出可追溯(log、diff、測試結果)
但:
? 不能聯網
? 不能裝包
? 只能在你給定的框架里改點東西
保持關注 這個東西全名叫 Codex Research Preview,單純 Preview 已經不夠了,還得加上 Research,目前不要有太高的期待
chatgpt.com/codex
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.