新智元報道
編輯:英智
【新智元導讀】OpenAI如何以自下而上的文化和行動導向,推動大模型突破?從零到上線僅用7周,Calvin帶你走進OpenAI編程智能體Codex的誕生過程,體驗高強度沖刺的魔力。
外界對于OpenAI眾說紛紜,很少有人從內部視角描述它的真實文化。
三周前,在推出Codex后,Calvin French-Owen離開了OpenAI。
在2024年5月,他加入了OpenAI,全程見證了OpenAI編程智能體Codex的誕生。
如今,Calvin French-Owen想趁熱打鐵,效仿Nabeel Quereshi的《對Palantir的反思》,揭秘OpenAI的獨特之處。
沒有任何商業機密,更多的是他對當下歷史性時刻的思考——在當前階段,關于這個史上最迷人組織之一所呈現的樣貌。
首先澄清:離開OpenAI并非因為個人矛盾,實際上他對這個決定非常糾結。
從創業公司創始人,轉變為一家3000人規模企業的員工,這個角色轉變并不容易。
現在,他渴望一個全新的開始。
但這份優質的工作完全有可能再次吸引他回來。
構建AGI是無與倫比的使命,LLM無疑是這十年最重要的技術突破。
他很幸運能親眼見證一些技術進展,并參與了Codex的發布。
當然,這些僅為個人觀點,不代表公司立場。OpenAI海闊天空,這只是管中窺豹的一瞥。
深度揭秘OpenAI文化
首先,要了解的是OpenAI的發展速度之快。
2024年5月,他加入時,OpenAI大約有1000多人。
一年后,員工數暴增至3000多人,他的工齡竟然排在前30%。
幾乎所有領導層如今負責的工作,都與他們兩三年前的大相徑庭。
如此快速的擴張導致許多機制出現問題:內部溝通、組織架構、產品發布流程、人員管理和招聘體系等,都在不斷調整。
不同團隊的文化差異顯著:有的團隊全力沖刺,有的負責大型計算任務,有的則節奏更平穩。
因此,OpenAI的體驗因團隊而異,研究、應用和市場團隊的工作節奏完全不同。
Slack驅動一切
OpenAI的獨特之處在于,所有事情——沒錯就是指所有事情——都依賴Slack運轉。
幾乎所有工作都在Slack上完成,沒有電子郵件。
如果不擅長信息管理,這種模式會讓你分心到崩潰;但如果精心規劃頻道和通知設置,這套系統其實相當高效。
OpenAI的文化非?!缸韵露稀?,尤其是在研究領域。
剛加入時詢問下一季度的路線圖,他得到的回答是:「沒有路線圖」(現在有了)。
好的想法可以來自任何地方,很難提前預測哪個想法會成功。
相比宏大的總體計劃,OpenAI的進展靠不斷試錯和研究突破推動。
得益于這種文化,OpenAI也極為推崇「實力至上」。
公司領導者的晉升主要基于他們提出好點子并付諸實踐的能力。
許多優秀領導并不擅長演講或辦公室政治,但在OpenAI,這不是重點。
真正的好想法往往能脫穎而出。
行動導向!
公司鼓勵直接行動。不同團隊常不約而同地探索類似想法。
剛加入時,他參與了一個與ChatGPT Connectors類似的內部項目。
Codex發布前,內部有3-4個不同的原型項目,通常由幾個人自發啟動,無需特別審批。
一旦顯現出潛力,團隊便會迅速圍繞它們集結起來。
Codex負責人Andrey曾說,研究員就像獨立的小高管,獨立探索項目。
優秀的研究經理和項目經理(PM)影響力巨大,同時也極為稀缺。
最頂尖的經理能將眾多不同的研究項目串起來,推動更大規模的模型訓練。
他合作的ChatGPT工程經理非常沉穩,他們大多放手管理,但擅長招聘優秀人才,并盡力為他們創造成功的條件。
OpenAI能快速調整戰略方向,決策調整非常迅速。
這是創業時就很看重的:根據新信息做正確的事,遠比固守計劃重要。
令人驚訝的是,OpenAI這樣的大公司仍保持這種靈活性,谷歌顯然做不到。
一旦決定某個方向,公司會全力以赴。
OpenAI備受外界關注。內部尚未公布的消息常被媒體提前曝光。甚至有X用戶用腳本監控OpenAI的新功能發布。
因此,公司內部非常注重保密,無法詳細透露工作內容。
Slack工作空間有不同權限,收入和支出數據更是嚴格保密。
OpenAI也比你想象的要嚴肅,這里的風險和機遇都太大了。
一方面,公司追求AGI,責任重大;另一方面,產品服務數億用戶,涵蓋醫療建議到心理咨詢等場景。
盡管OpenAI常被媒體批評,他遇到的每個同事都在努力做正確的事。
作為最受關注的AI實驗室,OpenAI容易招致批評。
不應該將OpenAI視為單一的整體。
它最初是一群科學家和技術愛好者,共同探索科學的前沿。
這個團體偶然間催生了歷史上最具病毒傳播效應的消費級應用。隨后,它又萌生了向政府和企業銷售產品的雄心。
因此,不同時期加入、身處不同部門的員工,其目標和視角也大相徑庭。
待得越久,就越可能傾向于從「研究實驗室」或「非營利組織」的視角看待公司。
積極分享成果
最欣賞的一點是,公司在分享AI成果方面,是真正地說到做到。
頂尖模型沒有被限制在高價企業套餐中,任何人都能免費使用ChatGPT獲取答案。
API向初創公司開放,最先進的模型通常很快接入API。
這一點OpenAI值得高度贊揚,也是公司文化的核心。
OpenAI對安全的重視超出外界猜測。
許多人在開發安全系統,重點關注實際風險(如仇恨言論、濫用、政治偏見、生物武器、自我傷害、提示注入等),而非理論風險(如智能爆炸)。
安全方面的工作大多未公開,OpenAI應更積極分享這方面成果。
紀念品稀缺:不像其他公司大肆發放紀念品,OpenAI的紀念品限量分發。第一次投放需求太大,Shopify商店直接崩潰。內部還流傳了如何用JSON繞過限制的教程。
GPU成本驚人:相比GPU開支,其他成本幾乎微不足道。比如,Codex一個功能模塊的GPU成本,就相當于我們整個Segment基礎設施的開支。
雄心勃勃:OpenAI可能是最有野心的組織。不僅滿足于頂級消費級應用,還想在API、深度研究、硬件、代碼代理、圖像生成等多個領域競爭。這里是實現想法的沃土。
X驅動:公司很關注X。病毒式傳播的OpenAI相關內容常被內部注意到。朋友開玩笑說:這家公司靠X氛圍驅動。
團隊流動性:團隊協作非常靈活。Codex發布時,需要ChatGPT工程師支持,第二天就來了兩位高手加入,沒有繁瑣的審批流程。
高管參與度高:領導層非常投入,gdb、sama、kw、mark、dane等人常在Slack上發言,沒有甩手掌柜式的領導。
代碼與技術棧
OpenAI使用一個龐大的單一代碼庫(monorepo),以Python為主,但也加入了Rust(用于部分服務)和Golang(用于網絡代理等)。
由于Python的靈活性,代碼風格差異很大:既有谷歌十年老兵設計的可擴展庫,也有剛畢業的博士寫的臨時Jupyter筆記本。
API開發主要依賴FastAPI,數據驗證用Pydantic,但公司沒有統一的代碼風格規范。
OpenAI的全部基礎設施運行在Azure上,只有三項服務被認為是可靠的:
AzureKubernetes Service:用于容器管理。
CosmosDB:Azure的文檔存儲。
BlobStore:用于對象存儲。
OpenAI較少依賴自動擴展單元,權限管理(IAM)功能也比AWS更受限。公司傾向于「自研優先」。
在工程團隊中,有大量從Meta(包括Instagram)跳槽到OpenAI的人才。
OpenAI在很多方面類似早期Meta:擁有現象級消費應用、基礎設施尚在發展、追求快速行動。
這些Meta背景的工程師為OpenAI帶來了強大的基礎設施經驗,也導致OpenAI的基礎設施有些Meta的影子,比如:
自研了類似Meta TAO的系統(用于圖數據庫)。
在網絡邊緣整合身份認證的嘗試。
代碼為王(Code wins)
OpenAI沒有中央架構或規劃委員會,決策通常由執行工作的團隊做出,這帶來強烈的行動導向,但也導致代碼庫中存在大量重復功能。
例如,至少有六種隊列管理和代理循環的庫。
值得稱贊的是,內部團隊正投入大量精力來改善這一狀況。
消費級品牌的運作
OpenAI以「專業訂閱」(pro subs)為核心衡量指標。
即使是Codex這樣的產品,也主要考慮個人用戶而非團隊使用。這對于B2B/企業背景的人來說有點顛覆認知。
產品上線第一天就能吸引大量流量,令人震撼。
大模型訓練
訓練過程介于「實驗」和「工程」之間:
初期是小規模實驗,調整核心算法和數據組合,仔細分析結果。
如果實驗結果有潛力,會被納入更大規模的訓練。
大規模訓練類似分布式系統工程,會遇到各種意外情況,需要不斷調試。
Codex發布
過去三個月,他參與了Codex的發布,這無疑是職業生涯的亮點之一。
2024年11月,OpenAI定下2025年推出編程智能體的目標。
到2025年2月,內部已有幾個工具效果不錯,市場對編程智能體的需求日益明確,模型在編程任務上已非常實用。
他提前結束陪產假,加入Codex發布工作。
回歸一周后,兩支團隊合并,開始了瘋狂沖刺。
從第一行代碼到產品上線,僅用了7周!
Codex的開發是近十年來最艱苦的工作。
每天工作到深夜11點或凌晨,早上5:30被新生兒吵醒,7點到辦公室,周末也幾乎都在工作。
整個團隊全力以赴,每一周都至關重要,感覺像回到了Y Combinator的創業節奏。
這種速度令人嘆為觀止。從未見過任何組織(無論大?。┠茉谌绱硕痰臅r間內從想法到免費上線的完整產品。
Codex構建了容器運行時、優化了代碼庫下載、微調了代碼編輯模型、支持了各種Git操作、引入了全新功能界面、啟用了網絡訪問。
最終打造了一款讓用戶用起來得心應手、體驗極佳的產品。
OpenAI依然保有那種全力以赴、快速發布產品的沖勁。
對的人聚在一起,真的能創造奇跡。
團隊有8名資深工程師、4名研究員、2名設計師、2名市場人員和1名項目經理。
如果有機會與Codex團隊的成員共事,他們每一個人都非常出色。
發布之夜
發布前夜,五個人一直熬到凌晨4點,部署巨大的單體服務(一個耗時數小時的流程)。
早上8點,他們回到辦公室進行發布直播,打開功能開關后,流量迅速涌入。
他從未見過一個產品僅靠出現在ChatGPT側邊欄就立即獲得如此大的流量——這就是ChatGPT的力量。
Codex采用完全異步的形式。
與當時的Cursor或Claude Code不同,團隊希望用戶能像與同事合作一樣使用編程智能體:發送任務,代理在獨立環境中運行,完成后返回拉取請求(PR)。
這是一個大膽的嘗試。當前模型雖好,但還不夠完美,能運行幾分鐘但無法持續幾小時。
用戶對模型能力的信任度千差萬別,甚至不清楚模型的真正的上限在哪里。
Codex在處理大型代碼庫時表現優異,能很好地理解和導航代碼結構。
與其他工具相比,它最大的優勢是能同時啟動多個任務,并比較它們的輸出結果。
公開數據顯示,Codex自發布以來生成了63萬個PR,平均每個工程師在53天內貢獻了約7.8萬個公開PR(私有PR的數量可能更多)。
這可能是他職業生涯中最具影響力的項目。
坦白說,最初加入OpenAI時有些猶豫。
放棄創業者的自由、接受管理、成為大機器中的小齒輪,他不確定能否適應。
如果創業者感到停滯不前,可以:
深入反思如何能進行更多、更大膽的嘗試;
加入一家頂級的AI實驗室。現在是投身創造的絕佳時機,也是窺探未來的絕佳時機。
目前,通向AGI的競爭三足鼎立:OpenAI、Anthropic和Google。
公司路徑因其DNA不同(消費級產品 vs. 企業級服務 vs. 堅如磐石的基礎設施+數據),在其中任何一家工作,都將是大開眼界的經歷。
參考資料:
https://calv.info/openai-reflections
https://techcrunch.com/2025/07/15/a-former-openai-engineer-describes-what-its-really-like-to-work-there/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.