來源:騰訊科技(ID:qqtech)
5月13日消息,OpenAI聯合創始人兼首席執行官山姆·奧特曼,于美國當地時間5月12日出席了全球知名投資機構紅杉資本舉辦的“2025 AI Ascent”大會。在本次專訪中,奧特曼分享了OpenAI的創業歷程、產品規劃與發展路徑,并深入探討了他對AI行業未來的洞察。
奧特曼回顧了OpenAI從一個僅有14人的研究實驗室,成長為全球領先的人工智能平臺的歷程。他設想將ChatGPT演進為一種高度個性化的AI服務——它能夠記住用戶的完整生活背景,從對話記錄到電子郵件內容,同時能夠在多個應用和服務之間無縫銜接、自然協作。
他指出,年輕一代用戶已經將人工智能視為操作系統,而不僅僅是搜索工具。這種趨勢預示著一個全新的未來:一個高效、統一的大模型,能夠在無需重新訓練的前提下,基于超大規模的上下文進行推理,全面理解用戶的歷史信息,從根本上重塑人與技術的交互方式。
以下為奧特曼最新專訪精華內容:
01
OpenAI的“從0到1”:
ChatGPT是如何誕生的?
問:這是你們當年成立時的辦公室(如下圖)?
奧特曼:沒錯,這正是我們最初的辦公地點,2016年我們就在這里起步!
問:2016年的你可曾預見OpenAI會有現在的光景嗎?
奧特曼:完全沒想過。那時我們14個人擠在角落里,圍著白板討論我們到底應該做什么。說實在的,那時我們就是個純粹的研究實驗室,雖然有著非常強烈的信念和方向感,但沒有明確的行動計劃。別說商業化產品了,連“大語言模型”(LLM)的概念都還很遙遠。
問:從公司初創到ChatGPT問世,歷經六年時間,你們是如何設定里程碑的?
奧特曼:其實我們的第一個面向消費者的產品并不是ChatGPT,而是DALL·E(文本生成圖像系統),更早的則是API接口服務。我們曾嘗試過多個方向,包括游戲AI、機械臂控制等。
后來有團隊專注于無監督學習,這才誕生了GPT-1和GPT-2。但直到GPT-3,我們才感覺手頭真的有了點“東西”,雖然當時還不清楚該用它來做什么。
與此同時,我們也意識到,如果想繼續擴展模型規模,就必須籌集更多資金。像GPT-4這樣的模型,其開發成本達十億美元級,已不是靠科研資助能支撐的,除非是像粒子加速器那樣的國家級項目。因此,我們開始認真思考,如何將這一研究轉化為可持續的商業模式。
我們隱約意識到,這項技術終將變得非常實用。雖然我們開源發布了GPT-2的模型權重,但市場反應平平。
然而,通過觀察許多創業公司,我發現一個模式:開放API接口往往能帶來意想不到的價值,這在很多YC孵化項目中被多次驗證。另一個關鍵體會是:技術越易用,其價值通常越大。
當時運行這些大模型仍然非常困難,因此我們決定構建專用軟件以優化部署體驗。由于尚未明確產品形態,我們選擇在2020年6月開放GPT-3的API接口,想看看開發者們是否能基于它打造出有價值的應用。
有趣的是,雖然全球市場反應較為冷淡,但硅谷創業圈敏銳地意識到這項技術的潛力,有人甚至認為它是通用人工智能(AGI)的雛形。
就我所知,真正基于GPT-3 API構建起可持續商業模式的公司并不多,主要集中在文案生成服務上,這是當時唯一能夠突破商業化門檻的應用場景。
但我們注意到一個異常現象:盡管人機對話功能尚不成熟,用戶卻樂此不疲地與模型互動。要知道那時的聊天體驗并不理想,因為還沒有引入基于人類反饋的強化學習(RLHF),但大家依然愛不釋手。
除了文案生成,人機對話幾乎是唯一具備“殺手級應用”潛力的功能,這最終促使我們決定開發ChatGPT。在ChatGPT 3.5發布時,API已支持八大類商業應用場景,遠遠超出早期的單一功能。我們也愈發堅信——人們渴望與AI對話。
雖然DALL·E的表現也不錯,但考慮到我們在微調技術方面的積累,我們最終決定投入資源,專門打造一款面向對話的AI產品。
經過六年的打磨與探索,ChatGPT終于在2022年11月30日正式上線。如今,每周有超過5億用戶與之互動。
02
從精簡團隊到高效協作,
OpenAI是如何做到“越大越快”的?
問:最近半年,你們似乎在持續不斷地發布新產品?
奧特曼:是的,確實如此。我們發布了很多重量級更新,而且產品發布節奏越來越快,連我們自己也覺得非常驚人。
問:你是如何在一家如此規模龐大的公司中,仍然保持快速的產品迭代能力?
奧特曼:我認為,很多公司都會陷入一個典型誤區:隨著公司規模的擴大,產出卻陷入停滯。他們只是為了擴張而擴張,卻沒有同步提升產品的研發與迭代效率,這就是所謂的“效率停滯”。
我始終堅持幾個基本原則:讓每個人都高效運轉;保持團隊小而精;確保人均產出與公司規模相匹配。否則,你就會看到一個40人的會議,為了一個小功能而爭論不休。
商業界有句老話:“優秀的管理者永遠很忙”,因為沒有人希望看到閑著的人到處攪局、影響效率。
在我們公司,也像許多科技公司一樣,真正創造價值的是研究員、工程師和產品經理。你必須確保這些關鍵崗位上的人始終專注、高效地推進工作,產生實際影響。如果你打算擴張公司規模,那就意味著必須同時增加項目數量,否則就只會增加無謂的會議和內耗。
因此,我們盡量保持精簡的團隊結構,但賦予每個人極大的責任感。要實現這一點,唯一的方式就是同時推進大量項目。
現在,我們確實有機會打造下一代互聯網的核心平臺。要實現“終身個性化AI助手”的愿景,意味著必須跨越不同的服務場景,覆蓋主流與長尾應用,而這需要構建豐富的功能模塊和配套能力。
問:在過去這六個月里,有沒有哪個產品讓你特別自豪?
奧特曼:我最自豪的是模型能力的持續躍升。當然,我們距離目標還有不少改進空間,但我們正在以非常快的速度迭代。
目前的ChatGPT已經是一款非常優秀的產品,而它之所以如此強大,核心就在于底層模型的出色表現。一個模型能夠高質量地完成如此多樣的任務,這一點讓我感到由衷驚嘆。
03
核心AI服務之外,機會無限
問:你們既在開發小模型,也在推進大模型,幾乎什么都在做。那么我們這些從業者該怎么做,才能不被OpenAI“碾壓”?
奧特曼:你可以這樣理解我們在做的事情:我們希望成為用戶的核心AI訂閱服務提供商。這其中一部分功能將通過ChatGPT實現,其他還會涵蓋一些關鍵模塊。
但最核心的,還是打造更智能的模型,探索新的交互入口,比如專屬硬件終端設備,甚至類似操作系統的基礎平臺。至于API或SDK 的形態,我們現在還沒有完全想清楚,但一定會找到合理的路徑。可能會經歷幾輪嘗試,但最終我們會做成。我希望我們的平臺能為全世界創造巨大的價值,成為其他開發者創新的基礎。
問:OpenAI未來的發展目標是什么?
奧特曼:我們就是繼續打造更強大的模型,推出用戶喜歡的產品。除此之外,沒有什么復雜的“終極藍圖”。我們更關注眼下要做什么。現場有很多OpenAI的老同事可以作證,我們不是那種喜歡坐下來制定繁復計劃的團隊。
我始終相信——如果你從一個“宏大終點”向回推規劃,很容易走偏。與其設計一個自上而下的總體戰略,不如一步步往前走,靠用戶反饋和現實成果驅動決策。
我們知道接下來會需要龐大的AI基礎設施,要建“AI工廠”。與此同時,我們會不斷提升模型性能,打磨優秀的終端產品,從模型到接口再到硬件,每一部分都要做到最好。
我們以靈活應變為榮。隨著外部世界不斷變化,我們也會及時調整戰術。目前我們還沒開始規劃明年要發布的產品,但我們有信心打造出真正打動用戶的創新。我對我們目前的研究路線充滿信心,從未像現在這樣樂觀。
問:接下來的研究路線圖是怎樣的?
奧特曼:更智能化的模型,這是我們的中心目標。但每一步如何走,我們會邊走邊看,通常是走一步看兩步。
問:所以你更相信“從現在出發,逐步演進”,而不是“自上而下反向規劃”?
奧特曼:完全正確。我聽過很多人講他們有一個宏大的戰略藍圖:比如“最終要統治世界”,然后再往回推算每一步該做什么……但我從來沒見過,這樣的路徑能真正帶來巨大成功。
04
年長者用AI查信息
年輕人用AI過人生
問:你認為大公司在轉型為AI原生組織時,常犯哪些錯誤?無論是在使用 AI 工具還是構建 AI 產品方面?為什么初創公司明顯在創新上更具優勢?
奧特曼:幾乎每一次技術革命都會出現類似現象,所以這并不令人驚訝。他們犯的錯誤與以往如出一轍:過度依賴傳統流程,固守舊有思維。
當技術每隔一兩個季度就發生飛躍,而你還在依賴一年才開一次會的信息安全委員會來決定是否引入新應用、如何處理數據,那么這種轉型注定將異常艱難。這正是“創造性顛覆”的核心,也是初創企業往往能勝出的根本原因。行業就是在這種顛覆中不斷前進的。
我對大公司的轉型速度感到失望,但并不意外。我的判斷是,未來一到兩年里,它們仍會經歷掙扎期——試圖假裝AI不會顛覆一切,等真正危機降臨時才匆忙轉型,但往往已經為時過晚。屆時,初創公司早已利用靈活機制和新范式完成“彎道超車”。
而這種落差不僅體現在組織層面,也反映在人身上。比如,你可以觀察一下一個20歲的年輕人與35歲用戶在使用 ChatGPT 時的差異,簡直天壤之別。
這就像智能手機剛問世時,孩子們能迅速上手,而年長者可能要花三年時間才能掌握基本功能。今天的AI工具,也在重演類似的“代際斷層”,而企業的行為,往往只是個體趨勢的放大。
問:你觀察到年輕人在使用 ChatGPT 上有哪些獨特的創新方式?
奧特曼:他們真的已經把 ChatGPT 當作一個操作系統來使用了。他們會結合文件、工具鏈與提示詞,設定復雜的操作流程,甚至精心設計提示詞并記在腦子或文檔里,就像使用一門語言一樣。
讓我印象最深的是,如今很多年輕人在做人生重大決策之前,都會先來問 ChatGPT 的意見。因為它已經擁有他們完整的背景信息、過往的對話記錄與行為偏好,具備了“記憶”能力,這使人們與它的互動方式發生了根本變化。
簡單來說:年長用戶把 ChatGPT 當作谷歌的替代品,20–30 歲的用戶視其為“人生顧問”,而大學生則已經把它當作操作系統來用了。
問:OpenAI內部是如何使用 ChatGPT 的?
奧特曼:ChatGPT在我們內部主要用于大規模輔助編程。具體比例難以精確衡量,用“代碼行數”統計是沒有意義的。
例如微軟會說:“我們有20%或30%的代碼由 AI 編寫。”但我認為,用行數衡量是非常愚蠢的方式。真正關鍵的是,它是否能產出高質量、有意義的代碼——那些真正解決問題的核心代碼,而不是邊角料。這才是價值所在。
問:你剛才提到你們的核心是打造面向消費者的訂閱服務,收入也主要來自消費端用戶。那為什么還要繼續保留 API?
奧特曼:我的希望是,最終實現一個統一融合的系統——用戶可以用同一個 OpenAI 賬號登錄所有服務,第三方也能通過 SDK 將 ChatGPT 深度集成進自己的應用界面。
一旦個性化 AI 掌握了你的完整信息與使用偏好,你自然希望無論在哪種應用場景下,它都能與你保持一致的個性化體驗。雖然今天的API離這個目標還有相當距離,但我相信我們終將實現它。
05
OpenAI的終極目標:
成為AI時代的“操作系統”
問:對于構建應用層產品的開發者來說,我們非常希望能用上你們各種API,比如Deep Research API(雖然還沒發布)。你們是否會優先打造一個更開放的平臺供大家使用?
奧特曼:我希望未來能出現一種介于“完全封閉”和“完全開放”之間的新范式,類似一種“HTTP協議級別的AI互聯網標準”。
我設想的是,未來的網絡結構將支持更加細粒度的功能模塊調用、智能體系統之間的高效協作,并內建身份認證、支付、數據交換等機制,做到“工具互通、系統互信”。
目前我們還無法確切描述這個系統最終會長什么樣,但我們對這個方向越來越清晰。要實現這樣的平臺,可能需要經歷幾輪嘗試和演化,但我們希望這是AI生態發展的主路徑。
問:AI想更好理解現實世界,需要更多輸入數據。你們有沒有考慮讓模型接收來自傳感器的數據,比如溫度、環境等?
奧特曼:實際上,已經有不少開發者在這么做了。他們通過我們的 API 把傳感器數據接入,比如使用GPT-4(03模型)來進行處理。某些場景下,這種做法效果非常出色。
更重要的是,我們的最新模型在處理這類非結構化或多模態數據時,比以往更強大。未來我們很有可能會在模型架構上,更明確地支持這類輸入。
問:語音模型在OpenAI 的技術棧中處于怎樣的位置?未來會如何整合進 ChatGPT?
奧特曼:語音交互對我們來說極其重要。坦率地說,目前我們的語音產品還遠未達到理想狀態,但沒關系。我們在文本模型上也經歷了很長的迭代過程,最終做得很好,語音也一樣會做到。
我認為,一旦語音技術成熟,很多用戶都會更愿意通過語音與 AI 互動。最讓我著迷的是,我們發布的語音模式允許用戶一邊講話、一邊操作手機界面,這是一種“語音 + UI”的混合交互方式,非常有潛力。
雖然目前還不夠理想,但一旦純語音體驗完善,它不僅將在現有設備上大放異彩,還可能催生全新的人機交互設備形態。如果AI真的實現“類人語音交互”,一切都將不同。
問:編程對于OpenAI來說,是一個垂直場景,還是核心戰略?
奧特曼:編程絕對是我們的核心戰略之一。目前,你向ChatGPT 提問,它返回的可能是文字或圖像。但未來,我們希望它直接返回可運行的程序代碼。我們認為,編程將成為AI與現實世界互動的主要方式,AI通過寫代碼調用API,實現任務執行。
因此,ChatGPT 必須成為世界上最好的編程助手。我們的愿景是:從“助手”演進為“智能體”,再演化成“完整的應用系統”。這個過程會是連續的、逐步推進的。
問:在打造更強大模型的過程中,除了常見的“數據、算力、架構”三要素之外,還有哪些關鍵因素被大家低估了?
奧特曼:這些基礎要素確實都非常關鍵,但我認為,真正能帶來質變的,是算法層面的重大突破。我們還可能看到一兩個“數量級級別”的算法創新(10倍甚至100倍提升),雖然出現的幾率不高,但只要出現一次,就將產生巨大影響。
問:作為世界頂級機器學習團隊的領導者,你是如何在“放手讓天才研究自己感興趣的課題”和“自上而下推動重點項目”之間取得平衡的?
奧特曼:確實有些項目必須高度協調,必須自上而下推進。但我認為很多組織在這方面走得太遠了。我們在創立 OpenAI 時,花了很多時間研究歷史上優秀研究實驗室的運作模式。現代參考案例其實并不多,所以我們主要從歷史中汲取經驗。
經常有人問:“為什么 OpenAI 總能不斷創新,而別的實驗室只是跟隨?”我們其實公開分享過那些經驗與原則,但很多團隊聽完之后,還是更傾向于走自己的老路,結果并不理想。說到底,科學研究本身是可以高效管理的,但前提是你得真正理解“管理”不等于“管死”。
問:現在的大模型似乎已經可以幫助研究者解決一些人文學科長期未解的問題,比如藝術周期的變化、系統性偏見等。OpenAI 是否考慮與學術界展開合作,推動這類研究?
奧特曼:我們確實設有學術合作項目,核心資源是模型訪問權限。其實,大多數研究者并不需要完全定制的技術支持,他們想要的是:對通用模型的自由調用,或者獲得底層基礎模型的運行權限。好在我們的架構非常適合這類需求。
許多學術項目只需標準化API即可完成,OpenAI模型天然適合支持這類探索。雖然我們偶爾會參與一些定制化研究,但我們90%以上的精力,還是集中在提升通用模型能力。這是我們認為最具長期價值的路徑。
06
OpenAI真正的野心
是“讀懂你一生的AI”
問:你怎么看待模型的定制化?它是過渡方案還是長期路徑?
奧特曼:在我理想中的狀態是這樣的:未來會有一個極其輕量、推理能力強大的模型,擁有萬億級 token 的上下文窗口。它能夠記住你一生的所有對話、讀過的書、郵件、瀏覽記錄,并持續吸收新增信息。它無需調整模型權重,僅憑這些上下文信息就能做出精準推理。
當前技術距離這一愿景還有相當距離,所有現有方案都只能算是對理想形態的妥協。但我希望最終我們能實現這種純粹由上下文驅動的個性化AI系統。
問:你認為未來12個月AI領域的主要價值創造點在哪里?是記憶功能、安全協議,還是智能體與現實世界的連接?
奧特曼:歸根結底,價值創造依然集中在三大方向:AI基礎設施建設(更大規模的計算和部署能力)、更聰明的模型、以及將AI納入現實社會結構的“支架”——包括接口、流程和信任機制等。只要持續推進這三項,其他進展自然會跟上。
如果細化來看,我認為2025年將是“AI智能體突破年”,尤其在編程領域,智能體可能成為主流應用場景之一。2026年或許將成為AI輔助發現新知識的元年,也許AI會參與甚至主導人類歷史上的重要科學發現。
長遠來看,一旦人類完成對地球的“擴散與殖民”,經濟增長將主要依賴科學進步與知識的應用落地。我猜測2027年將是AI從“認知層”轉向“物理世界”的關鍵節點,機器人將從探索性項目變為真正的生產力工具。當然,這只是我的直覺式預測。
問:GPT-5會不會比我們所有人加起來都聰明?
奧特曼:如果你現在還覺得自己比GPT-4聰明很多,那也許還真得加把勁了—— 畢竟GPT-3已經非常強大了。
問:你上次來這里時,剛經歷了OpenAI的“高層風波”。事過半年,有什么建議可以給創業者,關于“韌性”、“耐力”和“抗壓”能力嗎?
奧特曼:作為創始人,你一定會不斷面臨新的挑戰,它們會越來越復雜,賭注也越來越高。但好消息是,你的情緒承受力會不斷增強。即便挑戰更大,處理它們所需的心理能量卻越來越少。你會逐漸變得更“抗打擊”,更擅長應對壓力。
問:哪一部分最難?是危機爆發當時,還是之后的余波?
奧特曼:其實,最難的不是危機爆發的那一刻。在那個時點,你往往會被腎上腺素驅動,資源和支持也會快速聚集到你身邊,你甚至會“自動進入戰斗狀態”。最艱難的是風暴過后的恢復期。比如到了第60天,喧囂褪去,你開始清點殘局、重建信心、重新組織團隊——這才是真正考驗心理韌性的階段。
很多人關注如何應對“Day 0”的危機爆發,卻忽視了“Day 60”的重建過程。而真正寶貴的能力,是你能在那種低谷中重新站起來。沒有哪本書能教你怎么做,但每經歷一次,你就能變得更強。
THE END
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.