網易首頁 > 網易號 > 正文申請入駐

剛剛，OpenAI最強編程智能體上線ChatGPT！AI的「終極外掛」來了

2025-05-17 09:32:07　來源: 硅星人

北京舉報

分享至

Altman 昨天早上還在 X 上賣關子，說有個研究預覽版本快上線，要給它起個「如果它成了會很好記」的名字。

就在剛剛，OpenAI 正式發布 Codex。

這是一款基于云端運行的軟件工程智能 Agent，能夠并行處理多個開發任務，協助開發者高效完成編程工作。

UI 設計沒整花活， Codex 提供一個輸入框和兩個按鈕——「Ask」（提問）和「Code」（編碼）。你只需明確描述任務，它就會開始執行。

興奮的 Altman 在 X 平臺連發數條推文表示：

像這樣的工具，讓一個人能開發出的軟件數量，實在令人驚嘆又令人興奮。「你其實可以直接去做」是我最喜歡的梗之一；我原本沒想到，它會這么快以如此重要的方式應用到 AI 本身以及它的使用者身上。

Codex 能勝任的工作不僅僅是編寫功能代碼，還包括理解代碼結構、回答關于代碼庫的問題、修復 bug，甚至直接提交可審查的拉取請求（Pull Request）。

每個任務都在云端獨立的沙箱環境中執行，自動加載用戶的代碼倉庫。運行時長從 1 分鐘到 30 分鐘不等，取決于任務復雜度，同時用戶可以實時查看任務進度。

任務完成后，Codex 會輸出一整套可追溯的執行結果，包括終端日志、測試記錄等驗證信息。你可以對修改結果進行審查、提出建議，甚至直接在 GitHub 上發起 PR，或者合并進本地項目。

借助項目中的 AGENTS.md 文件，用戶還可自定義 Codex 的行為，讓它更貼合具體項目的開發規范與測試標準。

Codex 的核心模型為 codex-1，這是 OpenAI o3 系列里專為軟件工程微調過的版本。

基準測試結果顯示，codex-1 在 SWE-Bench 的得分為 72.1%，紙面參數優于 Claude 3.7 以及 o3-high。

訓練方式也很「實戰」，通過在真實開發環境中進行強化學習訓練，Codex 能夠生成更符合人類編碼風格和審查偏好的代碼，嚴格按照指令執行，并不斷運行測試，直到測試通過為止。

從今天開始，Codex 將向 ChatGPT Pro、Enterprise 和 Team 用戶開放，而 Plus 和 Edu 用戶的支持也將很快上線。

安全性方面，Codex 做得也夠克制。執行任務時，它只會訪問你提供的代碼庫和預設依賴，不能聯網、不能訪問外部 API，遇到不確定問題會停下來提示你處理。

并且，Codex 經過專門訓練，能夠識別并拒絕與惡意開發相關的請求，避免被濫用于開發惡意軟件。

目前，OpenAI 已在內部廣泛使用 Codex，協助工程師完成重構、命名規范、編寫測試等重復性任務，顯著提升開發效率。一些外部合作團隊也給出了積極反饋，比如 Cisco 與 Temporal 借助 Codex 加快了開發與調試節奏。

在深夜直播中，OpenAI 的員工展示了 Codex 更具實用性的能力：

它能夠理解整個代碼庫的結構，自動定位并修復 bug，處理超時設置或拼寫錯誤等常見問題。即使是在命令行報錯時，Codex 也能分析出錯原因，自動生成修復腳本和相應的測試用例。

此外，它還具備代碼審查功能，能梳理所有改動點，并指出可能導致測試失敗的風險。換句話說，Codex 正在逐步進化為一個真正可用的編程協作助手。

OpenAI 員工也分享了他們用 Codex 管理大型代碼變更的經驗，即使這些變更代碼從未跑過本地環境，也能順利合并、通過測試。

知名科技作者 Dan Shipper 提前體驗了 Codex，并用一篇博客分享了他的使用感受。

在他看來，通過 Codex，用戶可以像管理團隊一樣分配任務，而不需要編寫代碼。Codex 特別適合資深開發者，在執行任務時能夠產生簡潔高效的代碼變更，并自動生成 pull request 提交到 GitHub。

然而，Codex 也有一些局限性，比如對于新手工程師不太友好，不擅長處理后續的修改與補充任務，并且尚未完全整合到主流開發平臺如 GitHub 和 Slack。

它的設計主要面向專業開發者，而不是那些喜歡邊聊邊編程的用戶。Codex 的核心優勢在于提高高級開發者的工作效率，使他們能夠同時管理多個任務，從而加速開發進程。

如果你是技術主管、需要在已有項目中添加功能或修復 bug，那么 Codex 是你會常用的工具；但如果你是在從零開始搞一個「一人十億級美元 SaaS」，可能就用不上它。

簡單來說，如果你一個人做了一個網站或工具，用戶通過訂閱使用，每月收入達到幾百萬，年收入破千萬甚至過億，那么你就是在做「一人十億級美元 SaaS」。

除了云端主力模型之外，OpenAI 還同步推出了專為命令行優化的輕量模型 codex-mini-latest，支持開發者在本地環境快速接入 AI。

Codex CLI 登錄流程簡潔，可直接使用 ChatGPT 賬號接入，并享受基礎的免費 API 配額。目前已向全球范圍內的 Pro、Enterprise 和 Team 用戶開放，未來幾周內還將陸續支持 Plus 與 Edu 用戶。

對于接入 codex-mini-latest 的開發者，該模型可通過 Responses API 調用，價格為每百萬輸入 tokens 花費 1.5 美元、每百萬輸出 tokens 花費 6 美元，支持高達 75% 的提示緩存折扣，進一步降低調用成本。

OpenAI 對 Codex 的長線愿景很明確：

它不僅是一個寫代碼的工具，更是未來協作模式的雛形。多代理、異步執行、自動匯報進度，這一套邏輯未來可能內嵌進 IDE、Git 工具、甚至 Slack 里，成為開發者真正的「副駕駛」。

目前 Codex 仍處于研究預覽階段，圖像輸入等高級功能尚未開放。

但過去那些對 AI 編程助手的暢想，比如自動寫代碼、提 PR、修 bug，終于在 Codex 身上以可用工具的形式落地，成為真正能上手、能跑進實際工作流的產品。

本文作者APPSO，首發于公眾號「APPSO」（ID：appsolution），這是一個燃你手機更好用的專業媒體，歡迎點擊下方卡片進行關注。

點個愛心，再走吧

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

爆火AI編程Windsurf突遭Claude全面斷供，開發者大量退訂！直接打臉OpenAI

新智元 2025-06-04 19:34:56
6 跟貼 6
12名工程師，估值190億，AI黑馬的夢幻故事

智東西 2025-01-14 20:23:26
43 跟貼 43

Claude腦回路被開盒：AI會撒謊和暗中計劃

量子位 2025-04-04 12:20:26
0 跟貼 0

所有AI工具共享記憶！MCP協議無需云端，Cursor、Claude都能用

量子位 2025-05-14 14:00:47
46 跟貼 46
又一開源AI神器！將機器學習論文自動轉為可運行代碼庫

量子位 2025-05-01 11:42:03
0 跟貼 0

智能體大潮洶涌，但留給天工和階躍們的時間不多了

雷科技 2025-06-05 21:09:48
0 跟貼 0

AI摧毀就業？DeepMind CEO：這是一場比互聯網更猛的職業洗牌

新智元 2025-06-05 19:41:15
2 跟貼 2
DeepMind揭驚人答案：智能體就是世界模型！跟Ilya 2年前預言竟不謀而合

新智元 2025-06-05 17:10:50
2 跟貼 2

AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
訓練步數翻倍=推理能力質變，小模型突破推理極限

機器之心Pro 2025-06-04 19:08:50
1 跟貼 1
效率飆漲177%！清華、螞蟻聯合開源全異步RL新成果，8B/14B模型斬獲同尺寸SOTA

智東西 2025-06-05 20:02:52
5 跟貼 5
DeepSeek開口說話了反應超神無限打斷只要兩行代碼15分鐘

量子位 2025-03-07 14:20:34
0 跟貼 0
拿下2000臺人形機器人訂單、總合同額超1億，松延動力創始人詳解技術秘籍

智東西 2025-06-05 21:44:01
10 跟貼 10
飛書一個聊天框，激活了機器之心編輯部的知識資產

機器之心Pro 2025-05-21 15:39:31
0 跟貼 0
AI 時代的超級應用，是一個超級框

愛范兒 2025-03-13 11:56:19
0 跟貼 0
人人都能做開發者！連小學生都能輕松上手的0代碼開發平臺來了

量子位 2025-04-15 11:59:12
0 跟貼 0
家政機器人上線，陌生環境秒懂指令，網友：哪里賣？

機器之心Pro 2025-05-06 18:16:58
0 跟貼 0
ACI.dev能一站直連600+工具，讓你的智能體秒變全能王！

機器之心Pro 2025-04-30 17:13:00
0 跟貼 0
陶哲軒重寫20年本科經典教材！Lean編程數學證明，GitHub已放出

硅星人 2025-06-02 10:05:54
25 跟貼 25
女司機開口要150的水，男收費員秒懂：沖奶粉是吧

大象新聞 2025-06-05 19:15:34
73 跟貼 73
Cursor 1.0首個大版本來襲！自動捉bug，秒改屎山代碼，AI編程分水嶺已至

新智元 2025-06-05 12:26:08
43 跟貼 43
讓ChatGPT連讀“A”，直接崩潰到念廣告詞，網友：拿我們做測試？

量子位 2025-06-02 12:21:33
4 跟貼 4
大神卡帕西親自演繹零基礎開發APP，ChatGPT四輪對話搞定

量子位 2025-03-24 16:04:01
9 跟貼 9
區區保密文件，高考生馬上就要隨便看啦

娛樂俠女玉嬌龍 2025-06-04 12:32:32
2 跟貼 2
美國一票否決加沙停火協議草案中方代表：非常失望

魯中晨報 2025-06-05 08:26:06
20192 跟貼 20192
OpenAI董事會變動鬧劇將被改編為電影

環球Tech 2025-06-05 15:34:35
1 跟貼 1
鬧大了！小伙花1000元吃新疆燒烤，被老板指鼻子罵，新疆人全遭殃

史行途 2025-06-04 09:19:55
4434 跟貼 4434
不用等六代機，簡氏從殲35身上看到了西方差距：同時交付三大用戶

瑩瑩觀點 2025-06-05 16:19:43
2 跟貼 2
Gemini 2.5彎道超車背后的靈魂人物

鈦媒體APP 2025-06-05 17:34:43
0 跟貼 0
陳意涵做完臉「走一走突然就歪了」！保養出包…正面對比照超驚悚

ETtoday星光云 2025-06-05 17:01:15
1 跟貼 1
618大促殺瘋了！探店比亞迪夏終端價格直降7萬！

玩車教授 2025-06-04 14:08:11
0 跟貼 0
河南一水庫水位下降現千佛石窟，有1043尊石佛幾乎全部被敲掉頭部，水庫管理人員：汛期將至，禁止參觀

魯中晨報 2025-06-02 10:19:03
4026 跟貼 4026
上海宣布：南北高架打通新通道，通行提速！終于不用堵了→

魯中晨報 2025-06-05 20:00:00
132 跟貼 132
絕了！這3個WPS表格小技巧，實在是太好用了！

秋葉excel 2025-06-05 11:58:09
0 跟貼 0
如果合同存在版本迭代，如何系統化追蹤條款的歷史變更？

數智化解決方案 2025-06-04 15:25:22
0 跟貼 0
創新還是噱頭？米其林主廚用 ChatGPT 設計菜譜

IT之家 2025-06-05 10:20:10
0 跟貼 0
足協最擔心的事終于要發生了，廣東也要辦省內聯賽

史行途 2025-06-05 14:59:10
1114 跟貼 1114
配備“獨立老板位”，問界M9大五座版，能吸引邁巴赫GLS用戶？

車域無疆 2025-06-05 10:57:11
3 跟貼 3
終端優惠15萬級，天神之眼加持，比亞迪宋L EV都有哪些優缺點？

駕享來電 2025-06-05 15:52:26
1 跟貼 1
太膈應！一業主稱對門鄰居搬進來，入住當天就在門口掛條大紅綢帶

火山詩話 2025-06-05 17:26:19
987 跟貼 987

硅星人

硅（Si）是創造未來的基礎，歡迎來到這個星球。

2236文章數 10341關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

游戲

本地

公開課

軍事航空

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
指紋識別有可能認錯人嗎？
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

剛剛，OpenAI最強編程智能體上線ChatGPT！AI的「終極外掛」來了

對話盛景網聯彭志強：跳出SaaS虧損黑洞！從“賣工具”到“賣結果”的AI RaaS轉型法則

特朗普：我要求馬斯克離開 馬斯克瘋了

特朗普：我要求馬斯克離開 馬斯克瘋了

提前無緣美加墨世界杯 國足眾將賽后落淚

陳赫宴請好友，李乃文攜妻子罕見亮相

習近平同美國總統特朗普通電話

旗艦+大六座+百萬級 阿維塔全新SUV預計明年量產

態度原創

領先蘋果iPhone 17 Air！華為Mate XTs三折疊將國內首發eSIM

《馬里奧賽車世界》M站已有評測：兩家媒體給90+分

非遺里的河南 | 黃河泥變身千年墨寶，寫字都帶仙氣兒～

普京明確：沒有人會與“恐怖分子”談判

特朗普：我要求馬斯克離開馬斯克瘋了

特朗普：我要求馬斯克離開馬斯克瘋了

提前無緣美加墨世界杯國足眾將賽后落淚

旗艦+大六座+百萬級阿維塔全新SUV預計明年量產