網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

OpenAI祭出代碼殺器，Codex代理橫空出世，1.5美元/百萬token血洗編程界

2025-05-18 12:36:46　來源: 大數(shù)據(jù)文摘

北京舉報

分享至

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自頭部科技

文丨丁靈波

今天，OpenAI推出了該公司迄今為止功能最強的AI編碼代理：Codex研究預覽版。

這是一款基于云的軟件工程代理，可以并行處理多項任務(wù)，例如編寫功能、解答代碼庫相關(guān)問題、修復錯誤以及提交拉取請求以供審核等，每個任務(wù)都在其專屬的云沙盒環(huán)境中運行，并能預加載代碼庫。

近幾個月來，面向軟件工程師（也稱為氛圍編碼員）的AI工具人氣持續(xù)飆升。谷歌和微軟等大廠紛紛對外宣稱，他們公司大約30%的代碼現(xiàn)在已由人工智能編寫。今年2月，Anthropic發(fā)布了自己的代理編碼工具Claude Code；4月，谷歌更新了其人工智能編碼助手Gemini Code Assist，增加了更多代理功能；5月份，OpenAI被曝達成協(xié)議將以30億美元收購AI開發(fā)工具初創(chuàng)公司W(wǎng)indsurf，但雙方均未明確回應(yīng)。

外界推測，Codex的最新發(fā)布表明，OpenAI可能轉(zhuǎn)向于自主構(gòu)建而非直接收購AI編碼產(chǎn)品。

01 一波三折的Codex

Codex系列并非第一次推出，過去幾年經(jīng)歷了多次演變。

最初的Codex于2021年就首次亮相，作為將自然語言翻譯成代碼的模型，可通過OpenAI的應(yīng)用程序編程接口 (API) 使用，它是GitHub Copilot背后的引擎，GitHub Copilot是一款流行的自動完成式編碼助手，由微軟、GitHub和OpenAI聯(lián)合開發(fā)。

GitHub Copilot于2023年3月正式脫離OpenAI的Codex模型，采用GPT-4作為其Copilot X升級的一部分，以實現(xiàn)更深層次的IDE集成，同年，OpenAI關(guān)閉了對Codex的公開訪問，然而，由于來自研究者們的公開呼吁，Codex模型最終保留可供OpenAI研究訪問計劃的研究者使用。

當下，OpenAI正在構(gòu)建一個開源輕量級編碼代理Codex CLI，目前該項目在GitHub上已獲得21.8k顆星，得到開發(fā)者廣泛關(guān)注。

最新版的Codex由codex-1模型提供支持，codex-1是OpenAI o3模型的一個衍生版本，專門針對軟件工程進行了優(yōu)化，它使用強化學習在各種環(huán)境中針對真實世界的編碼任務(wù)進行訓練，以生成與人類風格和PR偏好高度相似的代碼，精確遵循指令，并可以迭代運行測試直至獲得通過結(jié)果。

今天，OpenAI還發(fā)布了codex-1的精簡版本，這是專為Codex CLI使用而設(shè)計的o4-mini版本，這個新模型支持CLI中更快的工作流程，并針對低延遲代碼問答和編輯進行了優(yōu)化，同時保留了指令遵循和樣式方面的相同優(yōu)勢，它現(xiàn)在作為Codex CLI中的默認模型，并在API中以codex-mini-latest的形式提供。

OpenAI方面表示，未來幾周，用戶將可以免費暢享Codex的強大功能，之后，將推出限速訪問和靈活的定價方案，開發(fā)者可以按需購買更多使用量。對于使用codex-mini-latest構(gòu)建的開發(fā)人員，該模型可在Responses API上使用，價格為每100萬個輸入令牌1.50美元，每100萬個輸出令牌6美元，目前有75%的即時緩存折扣。

02 專為編碼定制模型

開發(fā)者目前可以通過ChatGPT的側(cè)邊欄訪問Codex，并通過輸入提示并點擊“代碼”按鈕為其分配新的編碼任務(wù)，每個任務(wù)都在預加載了開發(fā)者代碼庫的獨立隔離環(huán)境中獨立處理。

Codex可以讀取和編輯文件，以及運行包括測試工具、linters和類型檢查器在內(nèi)的命令，任務(wù)完成通常需要1到30分鐘，具體取決于復雜程度，開發(fā)者可以實時監(jiān)控Codex的進度。

在產(chǎn)品中，開發(fā)者可以配置Codex環(huán)境，使其盡可能與實際開發(fā)環(huán)境匹配。

Codex可以通過放置在代碼庫中的AGENTS.md文件進行引導，開發(fā)者可以在其中告知Codex如何導航代碼庫、運行哪些命令進行測試以及如何最好地遵循項目的標準實踐，與人類開發(fā)人員一樣，Codex代理在配置好開發(fā)環(huán)境、可靠的測試設(shè)置和清晰的文檔后，性能最佳。

在編碼評估和內(nèi)部基準測試中，codex-1表現(xiàn)出強勁性能。

OpenAI表示，訓練codex-1的主要目標是使輸出與人類的編碼偏好和標準緊密結(jié)合，與OpenAI o3模型相比，codex-1始終能夠生成更清晰的補丁，可供立即進行人工審核并集成到標準工作流程中。

為了平衡安全性和實用性，Codex經(jīng)過了訓練，能夠識別并精準拒絕旨在開發(fā)惡意軟件的請求，同時清晰區(qū)分并支持合法任務(wù)。

此外，Codex代理完全在云端安全隔離的容器中運行，在任務(wù)執(zhí)行期間，互聯(lián)網(wǎng)訪問被禁用，代理的交互僅限于通過GitHub代碼庫明確提供的代碼以及用戶通過安裝腳本配置的預安裝依賴項，代理無法訪問外部網(wǎng)站、API或其他服務(wù)。

最后，OpenAI宣稱其技術(shù)團隊已開始將Codex納入其日常工具包，OpenAI 工程師最常使用它來替代那些重復且范圍明確的任務(wù)，例如重構(gòu)、重命名和編寫測試，它同樣適用于構(gòu)建新功能、連接組件、修復錯誤以及起草文檔。

03 OpenAI的AI編碼展望

對于AI編碼布局，OpenAI表示最新版的Codex僅僅是個開始。

未來，開發(fā)者可以自主掌控想要完成的重點工作，其余工作則能全面委托給代理——借助AI，開發(fā)速度會更快，效率更高，為了實現(xiàn)這一目標，OpenAI正在構(gòu)建一整套Codex相關(guān)工具，支持實時協(xié)作和異步委托。

最終，實時配對和任務(wù)委托將逐漸融合，開發(fā)者將通過IDE和日常工具與AI代理協(xié)作，提出問題、獲取建議并卸載耗時較長的任務(wù)，所有這些都在統(tǒng)一的工作流程中進行。

OpenAI還在推進與開發(fā)者現(xiàn)有的工具進行更深入的集成：目前Codex已與GitHub連接，不久后開發(fā)者將能夠從Codex CLI、ChatGPT桌面應(yīng)用，甚至是問題跟蹤器或CI系統(tǒng)等工具中分配任務(wù)。

根據(jù)SimilarWeb的市場分析數(shù)據(jù)，過去12周內(nèi)，以開發(fā)人員為中心的AI工具的流量激增了75%，凸顯了行業(yè)對編碼助手作為基本基礎(chǔ)設(shè)施而非實驗性附加組件的需求日益增長。

OpenAI曾與快速發(fā)展的AI開發(fā)工具初創(chuàng)公司Cursor和Windsurf進行收購談判，據(jù)稱，Cursor拒絕了收購，Windsurf原則上同意OpenAI以30億美元價格收購，但這筆收購目前尚沒有塵埃落定，就在昨天，Windsurf還推出了其專注于編碼的基礎(chǔ)模型SWE-1強化市場競爭。

新的Codex代理推出，外界分析認為是OpenAI向Windsurf、Cursor等施壓的一種方式，增加談判籌碼進而達成更有性價比的交易或收購，同時與谷歌、Anthropic等在AI編碼代理領(lǐng)域展開正面對抗，重塑市場競爭格局。

原標題：《加速AI編碼競賽！OpenAI上線軟件工程代理Codex研究預覽版，可并行處理多項任務(wù)》

GPU算力按需租用

A100/H100 GPU算力按需租用，

秒級計費，平均節(jié)省開支30%以上！

掃碼了解詳情?

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.