ChatGPT 宕機了一整晚,全球網友已經亂成一鍋粥了。
OpenAI 的處理方案也有些另類,一邊抓緊時間修 bug,一邊突然上線了 o3-pro 模型。
從今天起,o3-pro 率先向 Pro 和 Team 用戶開放,在模型選擇器里將替代原本的 o1-pro,而 Enterprise 和 Edu 用戶還得等到下周。
只能說,Plus 用戶的命也是命。
o3-pro 登場,更強大,也更「慢」
作為推理模型 o3 的升級版,o3-pro 在處理復雜問題、給出更精準的回答方面表現更強,尤其在科學研究、編程、教育和寫作這些場景下,有著明顯優勢。
此外,它也支持調用 ChatGPT 的全套工具,比如網頁搜索、文件分析、圖像推理、Python 編程、記憶個性化等,整體執行力和整合能力都更強。
當然,功能多了,響應速度也稍微慢了下來。
由于任務調度和工具鏈調用更復雜,o3-pro 的響應速度一般要比 o1-pro 要長一點,所以更適合在你需要認真思考,或者對答案準確性要求較高的場景中使用。
在官方專家評估中,評審人員普遍認為 o3 Pro 在表達清晰度、答案完整性、指令執行能力和邏輯準確性方面都比 o3 模型更進一步,尤其適合用在科學、教育、編程、商業和寫作這些需要深度輸出的任務中。
學術評估也驗證了這一點,o3-pro 的整體表現持續優于 o1-pro 和 o3。
為了更科學評估模型的穩定性,OpenAI 引入了「四次全對」的評估標準——只有模型連續四次給出正確答案,才算成功。
可以說,這套機制大幅提升了對推理一致性的要求。
值得注意的是,o3 Pro 此次并未單獨發布系統卡。OpenAI 表示,由于 o3-pro 與 o3 使用相同的底層模型,其完整的安全性說明請參見 o3 系統卡。
但目前 o3 Pro 仍存在一些功能限制,比如不支持臨時對話、圖像生成和 Canvas 功能。如需生成圖像,用戶仍需使用 GPT-4o、o3 或 o4-mini 模型。
在正式上線之前,一些開發者已獲得 o3 Pro 的早期訪問權限。
前 SpaceX 軟件工程師及蘋果 visionOS 設計師的 Ben Hylak 在過去一周獲得了 o3-pro 的早期訪問權限,其體驗歷程也得到了 OpenAI CEO Sam Altman 在社交媒體上的轉發。
具體來說,Ben 與其聯合創始人 Alexis 花時間整理了 Raindrop 過去所有的規劃會議記錄、目標、甚至語音備忘錄,然后請 o3-pro 嘗試生成一個戰略性規劃文檔。
最終模型生成的結果讓他們大受震撼:內容清晰、結構完整,不僅覆蓋了目標和時間線,還自動梳理出優先級,甚至明確指出了哪些內容應被砍掉。
在 Ben 看來,模型再強,如果無法融入真實的工作環境,也難以成為真正有用的「成員」。
而 o3 Pro 在理解復雜環境、表達工具能力、提出適當問題、合理調度資源方面有明顯提升。盡管模型偶爾在缺乏上下文時會出現「過度思考」的問題,但整體表現已明顯優于此前版本。
▲o3 pro(左)vs o3(右):o3 pro 明顯更好地理解了自身的限制和能力范圍。
在與同類模型對比中,Ben 則是夸獎道,雖然 Claude Opus 體量感十足,但實戰表現平平無奇;而 o3-pro 則更實用,屬于「完全不同維度的存在」。
在經典升級版的六邊形彈跳小球挑戰中,博主 @flavioAd 認為 o3-pro 是第一個幾乎能完美處理小球與墻面真實碰撞效果的模型。
ARC-AGI 是一種用來評估語言模型是否具備類通用人工智能(AGI)推理能力的基準測試框架。
它旨在測試 AI 系統在面對新問題時的抽象推理和問題解決能力,類似于人類在面對新情況時能夠迅速適應并找到解決方案的能力。
最新測試結果如下:
可以看到,o3-pro 在高難任務上表現略好,但提升幅度不大,且成本隨難度上升。
企業是第二曲線,o3-pro 是一塊新基石
在 o3-pro 發布,OpenAI CEO Sam Altman 還在社交平臺公布了一項重磅消息:o3 模型價格直降 80%。
現在,o3 模型每輸入百萬 tokens 收費 2 美元,每輸出百萬 tokens 收費 8 美元。
OpenAI 首席產品官 Kevin Weil 發文表示,由于用戶反饋強烈,Plus 用戶的 o3 模型使用速率限制將提升一倍,該調整正在陸續上線中。
對比之下,o3-pro 每輸入百萬 tokens 收費 20 美元,每輸出百萬 tokens 收費 80 美元,比 o1-pro 便宜 87%。
OpenAI 建議在使用 o3-pro 時啟用「后臺模式」:對于耗時較長的任務,將會異步啟動,從而規避請求超時問題。
官方表示,這波大降價的背后,是 OpenAI 對推理服務架構的全面優化。模型沒變,但推理更高效,價格也就順勢調了下來。
而另一方面,或許離不開 OpenAI 在算力資源上的新動向。
自 ChatGPT 橫空出世以來,算力資源的限制一直是 OpenAI 的「老大難」,受限于微軟綁定協議的限制,Azure 云服務曾是 ChatGPT 的唯一數據中心基礎設施提供商。
而據路透社凌晨援引三位知情人士消息稱,為了緩解算力壓力,OpenAI 已于上個月與 Alphabet( Google 母公司)達成合作協議,引入 Google Cloud 作為額外云服務提供商。
這樣的合作既在意料之外,也在情理之中。
一方面,ChatGPT 是近年來對 Google 搜索業務最大的威脅之一,而 Google Cloud 現在卻成了它的新靠山。
而另一方面,Google Cloud 2024 年銷售額達 430 億美元,占 Alphabet 收入的 12%。因此,為了在云計算市場中超越亞馬遜和微軟,Google Cloud 一直致力于扮演一個「中立算力供應商」的角色。
此次合作的達成將是對 Google Cloud 的一次重大利好。截至發稿前,OpenAI、Google 和微軟均未就此報道置評。
與此同時,OpenAI 還在全球范圍內加速部署 AI 基礎設施網絡。
今年早些時候,OpenAI 還與軟銀和甲骨文推進了 5000 億美元規模的星門計劃,并與 CoreWeave 簽訂了價值數十億美元的算力采購協議。
高投入的前提離不開高回報,本周據外媒報道,去年,OpenAI 的 ARR 約為 55 億美元,而現在已突破 100 億美元,增長了近 80%。
需要說明的是,100 億美元僅包括其面向消費者的產品、ChatGPT 付費商品以及 API 收入,暫不包括微軟的授權收入和其他大額交易。在商業領域,ARR 是指企業從訂閱服務或長期合同中獲得的年度經常性收入。它反映了一種可預測的、持續的收入流,通常用于衡量訂閱模式業務的健康狀況和增長潛力。
簡單來說,一家提供軟件即服務(SaaS)的公司,與客戶簽訂了每年支付 1000 元的訂閱合同。如果有 100 個這樣的客戶,那么該公司的 ARR 就是 1000 元×100=100000 元。
上周,OpenAI COO Brad Lightcap 還透露 OpenAI 目前擁有 300 萬付費商業用戶,高于 2 月份報告的 200 萬,可以說,OpenAI 目前形勢一片大好。
一邊通過 o3 把基礎模型的成本打下來,一邊用 o3-pro 把復雜問題的解決能力拔上去,瞄準高價值場景,OpenAI 也正試圖在這兩端之間,打通一條通往下一個增長曲線的路徑:企業服務。
世界上最強的模型輪流發布,OpenAI 也是這波 AI 浪潮中的一個。
而更強的模型,更穩的算力,更豐富的工具調用,ChatGPT 的定位也早已不只是聊天機器人,而是生產力搭子,旨在吃下職場這個最具生產力的應用場景。
o3-pro 則是這條路上的一塊新基石。
至于它能不能撐起 OpenAI 的這份野心,還有待時間驗證。但至少現在,它已經讓人們重新想象了一次。
模型會開源,但不會在 6 月
就在剛剛,Sam Altman 還在社交媒體上表示,OpenAI 預計將在今年夏季晚些時候,發布公開權重的開源模型,而非 6 月份。
此外,Altman 剛剛還發布了個人新博客《The Gentle Singularity(溫和的奇點)》,探討 AI 發展對人類社會的影響,并指出這可能是他最后一次在完全沒有 AI 幫助下寫出的文章。
用他的話來說,從相對論的角度看,奇點是一點一點發生的,融合則是緩慢進行的。
附上博客原文地址:https://blog.samaltman.com/the-gentle-singularity
溫和的奇點
我們已經越過了事件視界,騰飛已經開始。人類正接近構建數字超級智能,而至少到目前為止,這一切并沒有看起來那么奇怪。
機器人還沒在街頭隨處可見,大多數人也還沒整天和 AI交 流。人類仍然會死于疾病,去太空依然困難重重,我們對宇宙的理解仍然非常有限。
盡管如此,我們最近已經構建出在許多方面比人類更聰明的系統,并且這些系統能顯著放大人類的產出。最不可能的部分已經完成——那些促成 GPT-4 和 o3 等系統誕生的科學突破來之不易,但它們將帶我們走得更遠。
AI 將在多個方面為世界帶來貢獻,但AI加速科學進步與提升生產力所帶來的生活質量提升將是巨大的;未來有望遠比現在更加美好。科學進步是整體進步的最大驅動力;一想到我們有可能獲得多少更多的成果,就令人振奮。
從某種意義上說,ChatGPT 已經比歷史上任何一個人都更強大。每天有數億人依賴它,且任務越來越重要;一項小的新增能力可能帶來極大的正面影響,而一個微小的不匹配在被數億人使用時,也可能造成很大的負面影響。
2025 年,我們迎來了能夠真正進行認知工作的智能代理;編寫計算機代碼的方式將徹底改變。2026 年,我們很可能會看到能產生原創見解的系統。2027 年,或許會出現能在現實世界中執行任務的機器人。
將有更多人能夠創作軟件和藝術。但世界對這兩者的需求也將大幅上升。專家們如果擁抱這些新工具,可能仍然比新手強得多。總體來看,2030 年一個人完成的事情將遠超 2020 年,這種變化將令人矚目,也會有許多人學會如何從中受益。
在最重要的方面,2030 年代也許不會有太劇烈的變化。人們依然會愛家人,釋放創造力,玩游戲,在湖里游泳。
但在仍然非常重要的其他方面,2030年代很可能與以往任何時代都大不相同。我們不知道人類智能的上限有多高,但我們即將找出答案。
到了 2030 年代,智慧和能源——即想法及實現想法的能力——將變得極其豐富。這兩者長期以來一直是人類進步的基本限制;如果智慧和能源變得充足(加上良好的治理),理論上我們可以實現一切。
現在我們已經與驚人的數字智能共處,并且在最初的震驚之后,大多數人已漸漸習慣。我們很快會從驚嘆AI能寫出優美段落,變成期待它寫出完整小說;從驚訝它能診斷疾病,變成期望它能研發治愈方法;從驚訝它能寫出小程序,變成希望它能創建整家公司。這就是「奇點」的方式:奇跡變成日常,然后變成起點。
已經有科學家告訴我們,他們的工作效率是過去的兩到三倍。高級AI之所以意義重大,其中一個最關鍵的原因是我們可以用它來加速AI研究本身。我們也許能發現新的計算材料、更好的算法,甚至更多未知的可能。如果我們能用一年、甚至一個月完成十年的研究,進步的速度顯然會大不一樣。
從現在開始,我們已有的工具將幫助我們發現更多科學洞見,并輔助我們創造更先進的AI系統。當然,這還不是AI完全自主地更新自身代碼,但這確實是「遞歸自我改進」的初始形態。
還有其他一些自我強化的循環正在發生。AI帶來的經濟價值推動了基礎設施建設的飛輪,越來越多的資源正用于運行這些強大的 AI 系統。而能夠制造其他機器人的機器人(在某種意義上,還有能建造其他數據中心的數據中心)離我們也不遠了。
如果我們必須用傳統方式制造出最初的一百萬個人形機器人,但它們隨后能接手整個供應鏈——開采和提煉礦物、駕駛卡車、運行工廠等——并制造更多機器人、芯片廠和數據中心,那進步的速度就會截然不同。
隨著數據中心的生產逐漸自動化,智能的成本最終應該會接近電力成本。(很多人關心ChatGPT每次查詢用多少能量;平均每次查詢大約耗電 0.34 瓦時,大概相當于烤箱運行一秒多一點,或高效燈泡使用幾分鐘。此外,每次查詢大約用水 0.000085 加侖,約等于十五分之一茶匙。)
科技進步的速度將持續加快,而人類也有很強的適應能力。雖然會有艱難的挑戰,比如整類工作消失,但另一方面,世界的財富增長如此之快,以至于我們將有機會認真考慮以前無法實現的新政策。我們可能不會一次性建立一套新的社會契約,但回顧幾十年后,會發現逐步變化的累積帶來了巨大轉變。
如果歷史可以作為參考,我們總能找到新事物去做、新欲望去追求,并迅速適應新工具(工業革命后的職業變遷就是個很好的例子)。人們的期望會提升,但能力也會隨之快速提升,我們會擁有更好的生活。我們會為彼此創造越來越美妙的事物。相比AI,人類有一個長期且重要的優勢:我們天生在意他人,以及他人怎么想、怎么做,而對機器卻沒什么感情。
如果一千年前的自給農民看到我們現在的生活,會覺得我們從事的是「假工作」,仿佛只是在自娛自樂,因為我們食物充足、奢華難以想象。我希望我們未來一千年后也能用同樣的眼光看待那些工作——覺得它們「非常假」,但毫無疑問,那些人會認為自己的工作極其重要且充實。
未來將涌現出大量的新奇跡。到 2035 年,我們會取得什么突破現在都難以想象;可能今年我們還在解決高能物理問題,明年就開始太空殖民;或今年在材料科學上取得重大突破,明年就實現真正高帶寬的腦機接口。很多人會選擇繼續以當下的方式生活,但也肯定會有人選擇「接入系統」。
展望未來,這些事現在聽起來難以想象。但真正經歷它時,可能會讓人驚嘆,卻仍在可控范圍內。從相對論的角度看,奇點是一點點發生的,融合是逐步進行的。我們正攀登那條技術指數增長的長弧線;向前看總覺得是陡峭的垂直,向后看則像是平緩的線,但其實它是一條平滑的曲線。(回想 2020 年,如果那時我們說 2025 年會接近 AGI,聽起來會很瘋狂,但對比過去五年所發生的一切,也許現在的預測不那么瘋狂了。)
當然,我們還面臨許多嚴峻挑戰。我們需要在技術上和社會層面解決安全問題,但在那之后,最重要的是確保超級智能能被廣泛獲取,因為這關系到經濟結構。未來的最好路徑可能包括以下幾個步驟:
首先解決「對齊問題」,也就是我們能有把握地確保AI系統長期學會并實現我們集體真正的意愿(比如社交媒體就是對齊失敗的例子:推薦算法非常擅長讓你不停刷,但它們是通過利用大腦短期偏好來壓制你長期目標的)。
接著,重點讓超級智能變得便宜、普及,并避免被某個個人、公司或國家高度集中掌控。社會具有韌性、創造力,也能迅速適應。如果我們能激發集體的意志和智慧,盡管會犯錯、也會有失控,但我們會迅速學習與調整,從而最大化收益、最小化風險。在社會廣泛設定的框架下,給予用戶更多自由將非常關鍵。世界越早開始關于這些框架及「集體對齊」如何定義的討論,就越好。
我們(整個行業,不只是 OpenAI)正在為世界構建一個「大腦」。這個大腦將高度個性化、人人易用;它的極限將取決于我們的好點子。長期以來,技術圈總愛嘲笑那些「只有想法的人」——他們有個點子,卻沒法實現。而現在,看起來他們的時代終于要到了。
OpenAI 如今做的事情很多,但最根本的身份仍是一個超級智能研究公司。我們還有大量工作要做,但前路已經被照亮,黑暗正迅速退去。我們對能做這些事情感到無比感激。
「智能幾乎免費」已近在眼前。也許聽起來瘋狂,但如果我們在 2020 年告訴你我們將在 2025 年到達現在這個水平,聽起來比我們現在對2030年的預測更瘋狂。
愿我們順利、指數級、平穩地邁入超級智能時代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.