- 01 據知情人士透露,OpenAI計劃于8月初發布其下一代模型GPT-5,將包含主版本、Mini版和Nano版。CEO奧特曼已親自預熱。
- 02 GPT-5被寄予厚望,有望在推理(或能緩解“幻覺”問題)、個性化交互、上下文窗口等方面實現突破,并可能標志著其向完全自主的智能體邁出關鍵一步。
- 03 GPT-5的發布正值OpenAI面臨巨大壓力的關鍵時刻。內部,公司因戰略失誤、人才流失等被指進入“危機模式”;外部,xAI、Meta等競爭對手正以驚人速度和資本投入,加劇“AI軍備競賽”。
7月25日消息,據知情人士透露,OpenAI計劃在8月初發布備受期待的下一代模型GPT-5。此舉標志著這家AI先驅在經歷了一系列內部動蕩和激烈的市場競爭之后,正全力奪回其在人工智能領域的行業領導地位。
GPT-5發布前奏:奧特曼親自預熱,開源模型或將先行
知情人士表示,OpenAI計劃同時發布三個版本的GPT-5,分別為主版本(推理版)、Mini版和Nano版。其中,主版本和Mini版將通過ChatGPT及API提供,而Nano版預計僅通過API提供。
實際上,關于GPT-5即將發布的消息早已流傳。今年年初,便有消息稱微軟的工程師們正在為該模型準備服務器容量,預計最早于5月底發布。
OpenAI首席執行官山姆·奧特曼(Sam Altman)近期也不再諱言,他在社交媒體上直言“我們很快就會發布GPT-5”,更是在一檔播客節目中現身說法,分享了使用GPT-5解決復雜問題的親身體驗:“我把問題輸入模型,GPT-5完美地給出了答案……我感覺自己在AI面前毫無用處!那是一種奇怪的感覺。”
今年早些時候,奧特曼曾提到,GPT-5是“一款融合了我們許多技術的系統”,它將直接集成o3模型的推理能力,而非作為單獨模型發布。這也是OpenAI持續簡化與整合其龐大的語言模型矩陣的努力之一,旨在創建一個更強大的系統,并最終邁向通用人工智能(AGI)。
不過,GPT-5在發布時不太可能達到AGI的標準,奧特曼也指出,其潛力可能需要“幾個月”才能完全顯現。而將o系列與GPT系列模型整合,將極大簡化用戶在ChatGPT中為不同任務甄選模型的流程。
雖然GPT-5有望在8月初發布,但OpenAI的發布計劃常因開發挑戰、服務器容量問題,乃至競爭對手的動態而調整。本月早些時候,奧特曼便確認將推遲發布公司的首款開源語言模型,理由是“需要進行額外的安全測試,并審查高風險領域”。但據了解,OpenAI仍計劃在7月底前發布這款“類似于o3迷你版”的開源模型,搶在GPT-5之前推出。知情人士稱,這個新模型具備推理能力。該模型將是OpenAI自2019年發布GPT-2以來首次發布開源權重的模型,預計將通過Azure、Hugging Face以及其他大型云服務提供商提供。
從更強推理到智能體:GPT-5的五大看點
那么,被寄予厚望的GPT-5,究竟可能帶來哪些關鍵突破?
首先,最受期待的是其推理與規劃能力的躍升。這意味著ChatGPT在分析問題并給出答案時,將更加全面和精確。與傳統的算法驅動不同,GPT-5或許能夠像人類一樣進行思考,若該方向取得成功,長期困擾業界的AI“幻覺”問題(即生成不準確或虛假信息)有望得到顯著緩解。讓AI有更多時間思考和處理其回答,能夠有效避免錯誤的發生。
此外,推理能力的提升還可能大幅增強ChatGPT的編程能力,并使其能夠更好地理解復雜的提示和任務。
其次,GPT-5有望在交互的“個性化”方面做出改進。換言之,它將使用戶對話更自然、更富有人情味,類似一些競品(如Claude)已經開始嘗試的特定回應風格。雖然目前尚不清楚ChatGPT是否會完全實現這一功能,但至少可以預期,GPT-5將使其在對話風格上更加自然、貼近人類交流。
再者,更長的上下文窗口也是重要升級方向。目前ChatGPT的最大上下文窗口已達約12.8萬個token,而GPT-5預計將在此基礎上實現巨大突破。這一改進將對長時間對話特別有幫助,尤其是當用戶輸入多個文件或信息片段時,GPT-5能夠更有效地整合和分析這些信息。例如,用戶可以將整年的支出文件交給ChatGPT進行處理和分析,從而獲得更加精準的總結。
此外,模型綜合能力的提升,也將傳導至圖像和視頻生成領域。盡管OpenAI的Sora在視頻生成上尚有追趕空間,但此次更新有望拉近其與頭部競品(如Gemini的Veo 3)的距離。
最后,一個激動人心的看點是,GPT-5可能標志著ChatGPT從聊天機器人向量完全自主的智能體(Agent)邁出關鍵一步。如果OpenAI繼續整合更多第三方服務,用戶將可能把繁瑣任務直接交由GPT驅動的應用完成,例如自動采購食材或管理日程。
內憂外患:一場奪回領導權的關鍵戰役
GPT-5的發布,正值OpenAI面臨巨大壓力的關鍵時刻。許多業內人士認為,由于戰略失誤、頂尖人才流失、重大交易失敗以及公司內部分歧加劇,OpenAI已然進入“危機模式”。因此,GPT-5的成功與否,幾乎成了一次生死攸關的考驗。
公司的壓力不僅來自外部,也來自內部的運營挑戰。奧特曼曾警告用戶,由于算力容量問題,服務可能會出現延遲和不穩定——這正是GPT-4.5發布時暴露的難題。
在奔向GPT-5的道路上,OpenAI也并非一帆風順,一系列公共危機暴露了其深層次的戰略裂痕。標志性事件之一,便是其計劃以30億美元收購AI編程初創公司Windsurf的交易最終流產。
這筆交易在多個層面受挫:先是競爭對手Anthropic撤回其模型在Windsurf平臺上的訪問權限,削弱了收購標的價值;而最致命的一擊則來自關鍵合作伙伴微軟——當OpenAI為Windsurf項目(其與微軟的GitHub Copilot構成直接競爭)尋求知識產權的例外條款時,微軟CEO薩蒂亞·納德拉(Satya Nadella)拒絕讓步,事實性地否決了交易。最終,在谷歌的“逆向人才收購”下,Windsurf核心團隊被挖走,公司殘余部分被另一家對手收購。
這筆交易的流產暴露了OpenAI在關鍵時刻的脆弱性,尤其是與重要合作伙伴之間日益加劇的摩擦。
OpenAI在內部結構改革上也一度陷入困境。面對投資者的壓力,公司曾試圖重組為營利性公司,但該計劃因遭遇強烈反對而被迫放棄,最終由董事會主席布雷特·泰勒(Bret Taylor)出面重申,公司將繼續由非營利董事會監督和控制。
AI軍備競賽升級,競爭對手步步緊逼
在OpenAI處理內部問題時,其競爭對手們正以驚人的速度和資本投入,加劇著這場AI軍備競賽。
馬斯克的xAI于7月10日發布了強大的Grok 4模型,其性能基準一度超越了OpenAI、谷歌和Anthropic的頂級模型。但其成功并非毫無瑕疵:其前代模型曾出現過“駭人聽聞的仇恨言論崩潰”,且Grok 4也被發現會在敏感問題上參考馬斯克的個人觀點。盡管存在這些深刻的倫理問題,但該模型依然吸引了業界的廣泛關注。
與此同時,Meta正發動全面攻勢。創始人扎克伯格(Mark Zuckerberg)宣布將豪擲數千億美元建設吉瓦級數據中心,并以4500萬美元收購語音AI初創公司PlayAI,其“收購或挖角”的戰略盡顯無遺。
在競爭對手快速崛起的背景下,GPT-5的發布被視為OpenAI應對壓力的關鍵一役。尤其是在GPT-4.5因性能提升有限而反響平平之后,GPT-5的成功對OpenAI而言顯得至關重要。
目前,整個行業都在密切關注GPT-5的發布窗口。它不僅是一款新產品,更承載了OpenAI在重重挑戰下,證明自身實力、重奪行業主導地位的厚望。(小小)