Altman 昨天早上還在 X 上賣關子,說有個研究預覽版本快上線,要給它起個「如果它成了會很好記」的名字。
就在剛剛,OpenAI 正式發布 Codex。
這是一款基于云端運行的軟件工程智能 Agent,能夠并行處理多個開發任務,協助開發者高效完成編程工作。
UI 設計沒整花活, Codex 提供一個輸入框和兩個按鈕——「Ask」(提問)和 「Code」(編碼)。你只需明確描述任務,它就會開始執行。
興奮的 Altman 在 X 平臺連發數條推文表示:
像這樣的工具,讓一個人能開發出的軟件數量,實在令人驚嘆又令人興奮。「你其實可以直接去做」是我最喜歡的梗之一;我原本沒想到,它會這么快以如此重要的方式應用到 AI 本身以及它的使用者身上。
Codex 能勝任的工作不僅僅是編寫功能代碼,還包括理解代碼結構、回答關于代碼庫的問題、修復 bug,甚至直接提交可審查的拉取請求(Pull Request)。
每個任務都在云端獨立的沙箱環境中執行,自動加載用戶的代碼倉庫。運行時長從 1 分鐘到 30 分鐘不等,取決于任務復雜度,同時用戶可以實時查看任務進度。
任務完成后,Codex 會輸出一整套可追溯的執行結果,包括終端日志、測試記錄等驗證信息。你可以對修改結果進行審查、提出建議,甚至直接在 GitHub 上發起 PR,或者合并進本地項目。
借助項目中的 AGENTS.md 文件,用戶還可自定義 Codex 的行為,讓它更貼合具體項目的開發規范與測試標準。
Codex 的核心模型為 codex-1,這是 OpenAI o3 系列里專為軟件工程微調過的版本。
基準測試結果顯示,codex-1 在 SWE-Bench 的得分為 72.1%,紙面參數優于 Claude 3.7 以及 o3-high。
訓練方式也很「實戰」,通過在真實開發環境中進行強化學習訓練,Codex 能夠生成更符合人類編碼風格和審查偏好的代碼,嚴格按照指令執行,并不斷運行測試,直到測試通過為止。
從今天開始,Codex 將向 ChatGPT Pro、Enterprise 和 Team 用戶開放,而 Plus 和 Edu 用戶的支持也將很快上線。
安全性方面,Codex 做得也夠克制。執行任務時,它只會訪問你提供的代碼庫和預設依賴,不能聯網、不能訪問外部 API,遇到不確定問題會停下來提示你處理。
并且,Codex 經過專門訓練,能夠識別并拒絕與惡意開發相關的請求,避免被濫用于開發惡意軟件。
目前,OpenAI 已在內部廣泛使用 Codex,協助工程師完成重構、命名規范、編寫測試等重復性任務,顯著提升開發效率。一些外部合作團隊也給出了積極反饋,比如 Cisco 與 Temporal 借助 Codex 加快了開發與調試節奏。
在深夜直播中,OpenAI 的員工展示了 Codex 更具實用性的能力:
它能夠理解整個代碼庫的結構,自動定位并修復 bug,處理超時設置或拼寫錯誤等常見問題。即使是在命令行報錯時,Codex 也能分析出錯原因,自動生成修復腳本和相應的測試用例。
此外,它還具備代碼審查功能,能梳理所有改動點,并指出可能導致測試失敗的風險。換句話說,Codex 正在逐步進化為一個真正可用的編程協作助手。
OpenAI 員工也分享了他們用 Codex 管理大型代碼變更的經驗,即使這些變更代碼從未跑過本地環境,也能順利合并、通過測試。
知名科技作者 Dan Shipper 提前體驗了 Codex,并用一篇博客分享了他的使用感受。
在他看來,通過 Codex,用戶可以像管理團隊一樣分配任務,而不需要編寫代碼。Codex 特別適合資深開發者,在執行任務時能夠產生簡潔高效的代碼變更,并自動生成 pull request 提交到 GitHub。
然而,Codex 也有一些局限性,比如對于新手工程師不太友好,不擅長處理后續的修改與補充任務,并且尚未完全整合到主流開發平臺如 GitHub 和 Slack。
它的設計主要面向專業開發者,而不是那些喜歡邊聊邊編程的用戶。Codex 的核心優勢在于提高高級開發者的工作效率,使他們能夠同時管理多個任務,從而加速開發進程。
如果你是技術主管、需要在已有項目中添加功能或修復 bug,那么 Codex 是你會常用的工具;但如果你是在從零開始搞一個 「一人十億級美元 SaaS」,可能就用不上它。
簡單來說,如果你一個人做了一個網站或工具,用戶通過訂閱使用,每月收入達到幾百萬,年收入破千萬甚至過億,那么你就是在做「一人十億級美元 SaaS」。
除了云端主力模型之外,OpenAI 還同步推出了專為命令行優化的輕量模型 codex-mini-latest,支持開發者在本地環境快速接入 AI。
Codex CLI 登錄流程簡潔,可直接使用 ChatGPT 賬號接入,并享受基礎的免費 API 配額。目前已向全球范圍內的 Pro、Enterprise 和 Team 用戶開放,未來幾周內還將陸續支持 Plus 與 Edu 用戶。
對于接入 codex-mini-latest 的開發者,該模型可通過 Responses API 調用,價格為每百萬輸入 tokens 花費 1.5 美元、每百萬輸出 tokens 花費 6 美元,支持高達 75% 的提示緩存折扣,進一步降低調用成本。
OpenAI 對 Codex 的長線愿景很明確:
它不僅是一個寫代碼的工具,更是未來協作模式的雛形。多代理、異步執行、自動匯報進度,這一套邏輯未來可能內嵌進 IDE、Git 工具、甚至 Slack 里,成為開發者真正的「副駕駛」。
目前 Codex 仍處于研究預覽階段,圖像輸入等高級功能尚未開放。
但過去那些對 AI 編程助手的暢想,比如自動寫代碼、提 PR、修 bug,終于在 Codex 身上以可用工具的形式落地,成為真正能上手、能跑進實際工作流的產品。
本文作者APPSO,首發于公眾號「APPSO」(ID:appsolution),這是一個燃你手機更好用的專業媒體,歡迎點擊下方卡片進行關注。
點個愛心,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.