大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自頭部科技
文丨丁靈波
今天,OpenAI推出了該公司迄今為止功能最強的AI編碼代理:Codex研究預覽版。
這是一款基于云的軟件工程代理,可以并行處理多項任務(wù),例如編寫功能、解答代碼庫相關(guān)問題、修復錯誤以及提交拉取請求以供審核等,每個任務(wù)都在其專屬的云沙盒環(huán)境中運行,并能預加載代碼庫。
近幾個月來,面向軟件工程師(也稱為氛圍編碼員)的AI工具人氣持續(xù)飆升。谷歌和微軟等大廠紛紛對外宣稱,他們公司大約30%的代碼現(xiàn)在已由人工智能編寫。今年2月,Anthropic發(fā)布了自己的代理編碼工具Claude Code;4月,谷歌更新了其人工智能編碼助手Gemini Code Assist,增加了更多代理功能;5月份,OpenAI被曝達成協(xié)議將以30億美元收購AI開發(fā)工具初創(chuàng)公司W(wǎng)indsurf,但雙方均未明確回應(yīng)。
外界推測,Codex的最新發(fā)布表明,OpenAI可能轉(zhuǎn)向于自主構(gòu)建而非直接收購AI編碼產(chǎn)品。
01 一波三折的Codex
Codex系列并非第一次推出,過去幾年經(jīng)歷了多次演變。
最初的Codex于2021年就首次亮相,作為將自然語言翻譯成代碼的模型,可通過OpenAI的應(yīng)用程序編程接口 (API) 使用,它是GitHub Copilot背后的引擎,GitHub Copilot是一款流行的自動完成式編碼助手,由微軟、GitHub和OpenAI聯(lián)合開發(fā)。
GitHub Copilot于2023年3月正式脫離OpenAI的Codex模型,采用GPT-4作為其Copilot X升級的一部分,以實現(xiàn)更深層次的IDE集成,同年,OpenAI關(guān)閉了對Codex的公開訪問,然而,由于來自研究者們的公開呼吁,Codex模型最終保留可供OpenAI研究訪問計劃的研究者使用。
當下,OpenAI正在構(gòu)建一個開源輕量級編碼代理Codex CLI,目前該項目在GitHub上已獲得21.8k顆星,得到開發(fā)者廣泛關(guān)注。
最新版的Codex由codex-1模型提供支持,codex-1是OpenAI o3模型的一個衍生版本,專門針對軟件工程進行了優(yōu)化,它使用強化學習在各種環(huán)境中針對真實世界的編碼任務(wù)進行訓練,以生成與人類風格和PR偏好高度相似的代碼,精確遵循指令,并可以迭代運行測試直至獲得通過結(jié)果。
今天,OpenAI還發(fā)布了codex-1的精簡版本,這是專為Codex CLI使用而設(shè)計的o4-mini版本,這個新模型支持CLI中更快的工作流程,并針對低延遲代碼問答和編輯進行了優(yōu)化,同時保留了指令遵循和樣式方面的相同優(yōu)勢,它現(xiàn)在作為Codex CLI中的默認模型,并在API中以codex-mini-latest的形式提供。
OpenAI方面表示,未來幾周,用戶將可以免費暢享Codex的強大功能,之后,將推出限速訪問和靈活的定價方案,開發(fā)者可以按需購買更多使用量。對于使用codex-mini-latest構(gòu)建的開發(fā)人員,該模型可在Responses API上使用,價格為每100萬個輸入令牌1.50美元,每100萬個輸出令牌6美元,目前有75%的即時緩存折扣。
02 專為編碼定制模型
開發(fā)者目前可以通過ChatGPT的側(cè)邊欄訪問Codex,并通過輸入提示并點擊“代碼”按鈕為其分配新的編碼任務(wù),每個任務(wù)都在預加載了開發(fā)者代碼庫的獨立隔離環(huán)境中獨立處理。
Codex可以讀取和編輯文件,以及運行包括測試工具、linters和類型檢查器在內(nèi)的命令,任務(wù)完成通常需要1到30分鐘,具體取決于復雜程度,開發(fā)者可以實時監(jiān)控Codex的進度。
在產(chǎn)品中,開發(fā)者可以配置Codex環(huán)境,使其盡可能與實際開發(fā)環(huán)境匹配。
Codex可以通過放置在代碼庫中的AGENTS.md文件進行引導,開發(fā)者可以在其中告知Codex如何導航代碼庫、運行哪些命令進行測試以及如何最好地遵循項目的標準實踐,與人類開發(fā)人員一樣,Codex代理在配置好開發(fā)環(huán)境、可靠的測試設(shè)置和清晰的文檔后,性能最佳。
在編碼評估和內(nèi)部基準測試中,codex-1表現(xiàn)出強勁性能。
OpenAI表示,訓練codex-1的主要目標是使輸出與人類的編碼偏好和標準緊密結(jié)合,與OpenAI o3模型相比,codex-1始終能夠生成更清晰的補丁,可供立即進行人工審核并集成到標準工作流程中。
為了平衡安全性和實用性,Codex經(jīng)過了訓練,能夠識別并精準拒絕旨在開發(fā)惡意軟件的請求,同時清晰區(qū)分并支持合法任務(wù)。
此外,Codex代理完全在云端安全隔離的容器中運行,在任務(wù)執(zhí)行期間,互聯(lián)網(wǎng)訪問被禁用,代理的交互僅限于通過GitHub代碼庫明確提供的代碼以及用戶通過安裝腳本配置的預安裝依賴項,代理無法訪問外部網(wǎng)站、API或其他服務(wù)。
最后,OpenAI宣稱其技術(shù)團隊已開始將Codex納入其日常工具包,OpenAI 工程師最常使用它來替代那些重復且范圍明確的任務(wù),例如重構(gòu)、重命名和編寫測試,它同樣適用于構(gòu)建新功能、連接組件、修復錯誤以及起草文檔。
03 OpenAI的AI編碼展望
對于AI編碼布局,OpenAI表示最新版的Codex僅僅是個開始。
未來,開發(fā)者可以自主掌控想要完成的重點工作,其余工作則能全面委托給代理——借助AI,開發(fā)速度會更快,效率更高,為了實現(xiàn)這一目標,OpenAI正在構(gòu)建一整套Codex相關(guān)工具,支持實時協(xié)作和異步委托。
最終,實時配對和任務(wù)委托將逐漸融合,開發(fā)者將通過IDE和日常工具與AI代理協(xié)作,提出問題、獲取建議并卸載耗時較長的任務(wù),所有這些都在統(tǒng)一的工作流程中進行。
OpenAI還在推進與開發(fā)者現(xiàn)有的工具進行更深入的集成:目前Codex已與GitHub連接,不久后開發(fā)者將能夠從Codex CLI、ChatGPT桌面應(yīng)用,甚至是問題跟蹤器或CI系統(tǒng)等工具中分配任務(wù)。
根據(jù)SimilarWeb的市場分析數(shù)據(jù),過去12周內(nèi),以開發(fā)人員為中心的AI工具的流量激增了75%,凸顯了行業(yè)對編碼助手作為基本基礎(chǔ)設(shè)施而非實驗性附加組件的需求日益增長。
OpenAI曾與快速發(fā)展的AI開發(fā)工具初創(chuàng)公司Cursor和Windsurf進行收購談判,據(jù)稱,Cursor拒絕了收購,Windsurf原則上同意OpenAI以30億美元價格收購,但這筆收購目前尚沒有塵埃落定,就在昨天,Windsurf還推出了其專注于編碼的基礎(chǔ)模型SWE-1強化市場競爭。
新的Codex代理推出,外界分析認為是OpenAI向Windsurf、Cursor等施壓的一種方式,增加談判籌碼進而達成更有性價比的交易或收購,同時與谷歌、Anthropic等在AI編碼代理領(lǐng)域展開正面對抗,重塑市場競爭格局。
原標題:《加速AI編碼競賽!OpenAI上線軟件工程代理Codex研究預覽版,可并行處理多項任務(wù)》
GPU算力按需租用
A100/H100 GPU算力按需租用,
秒級計費,平均節(jié)省開支30%以上!
掃碼了解詳情?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.