剛剛OpenAI正式推出o3-pro,奧特曼專為此寫了一篇名為《溫和的奇點》的文章
o3-pro能為用戶提供最可靠、最精準的回答,尤其是在對準確性要求極高的復雜任務中。現在向所有 ChatGPT 和 API 的 Pro 個人用戶推出,企業版和教育版用戶還得等一周,另外plus用戶o3的速率限制將翻倍
本次發布最震撼的是相較于o1-pro,o3-pro的價格降低了87%
這是o1-pro,o3-pro,o3的輸入輸出價格具體比較
如果你認為奧特曼文章又是炒作或者你對文章不感興趣,但至少文章中這一段可以吸引你
很多人都會問,一次ChatGPT查詢究竟用多少電?答案是:平均每次查詢消耗約0.34瓦時。這個電量,差不多就是一個烤箱運行一秒多,或者一個高能效燈泡亮上幾分鐘。不僅如此,每次查詢還會用掉約0.000085加侖的水,換算一下,也就十五分之一茶匙那么多
奧特曼在文章中還預測2026年,我們或許將迎來能夠發現全新洞見的系統。而到了2027年,能夠在現實世界中執行任務的機器人可能就會問世,全文附在文后,先來看看o3 pro的表現
核心特性:為極致可靠性而生
o3-pro 的定位非常明確:當任務的可靠性遠比響應速度更重要時,它將是最佳選擇
深度思考能力:與其前代產品o1-pro相比,o3-pro被設計用于解決更具挑戰性的問題。它會花費更長的時間進行推理和分析,官方表示“多等待幾分鐘的權衡是值得的”
強大的集成工具集:如同o3模型,o3-pro能夠無縫調用多種工具來增強其能力,包括實時網頁搜索、分析上傳文件、理解視覺輸入、執行Python代碼以及利用記憶功能提供個性化回答
獲得專家一致認可:在由專家進行的評估中,o3-pro在所有測試類別中都獲得了比o3更高的偏好度。尤其在科學、教育、編程、商業和寫作輔助等關鍵領域,其回答的清晰度、全面性、指令遵循能力和準確性均獲得了持續性的更高評分
性能
1. pass@1 評估(首次嘗試成功率)
這項指標衡量模型一次性成功解決問題的能力。
競賽數學 (AIME 2024):o3-pro (93%)> o3 (90%) > o1-pro (86%)
博士級科學問題 (GPQA Diamond):o3-pro (84%) > o3 (81%) > o1-pro (79%)
編程競賽 (Codeforces):o3-pro (2748 Elo)> o3 (2517 Elo) > o1-pro (1707 Elo)
2. “4/4 可靠性”評估
這是OpenAI一項更為嚴苛的測試,要求模型在對同一問題的四次獨立嘗試中全部正確回答才算成功,以此衡量模型的穩定性和可靠性
競賽數學 (AIME 2024):o3-pro (90%)優于 o3 (80%) 和 o1-pro (80%)
編程競賽 (Codeforces):o3-pro (2301 Elo)領先 o3 (2011 Elo) 和 o1-pro (1423 Elo)。
當前限制
由于正在解決一個技術問題,臨時聊天功能目前在o3-pro中被禁用
o3-pro不支持圖像生成。用戶如需生成圖片,請使用 GPT-4o, OpenAI o3, 或 OpenAI o4-mini 等模型
Canvas(畫布)功能目前也暫不支持o3-pro
平緩的奇點
作者:Sam Altman
https://blog.samaltman.com/the-gentle-singularity
我們已經越過了事件視界(注:事件視界是黑洞周圍的一個邊界。一旦任何物體包括光越過了這個邊界,它就再也無法逃脫黑洞的巨大引力,注定會被吸入其中),起飛已經開始。人類正接近于構建出數字超級智能,而至少到目前為止,這一切的進展遠沒有想象中那么離奇。
機器人尚未在街頭漫步,我們大多數人也還未整日與AI交談。人們依然會因疾病而逝,我們仍無法輕易地前往太空,宇宙中還有太多我們無法理解的奧秘。
然而,我們最近構建的系統已在許多方面超越了人類,并且能顯著放大使用者的產出。這項工作中最艱難的部分已經過去;那些引領我們走到GPT-4和o3等系統面前的科學洞見來之不易,但它們將指引我們走向更遠的未來。
AI將從多方面為世界做出貢獻,但其中最大的增益,將來自于AI推動科學進步和生產力提升所帶來的生活質量飛躍。未來可以比現在美好得多。科學進步是整體進步的最大驅動力,一想到我們未來能擁有更多,就令人無比興奮。
從某種宏大的意義上說,ChatGPT已經比歷史上任何人類都更加強大。每天,數以億計的人依賴它完成日益重要的任務。一項微小的新功能就能創造巨大的積極影響;而一個微小的失調,在數億用戶的規模下,也可能造成巨大的負面沖擊。
2025年,我們見證了能夠完成真正認知工作的智能體的誕生,編寫計算機代碼的方式將被永遠改變。2026年,我們或許將迎來能夠發現全新洞見的系統。而到了2027年,能夠在現實世界中執行任務的機器人可能就會問世
將有更多的人能夠創作軟件和藝術。但世界對這兩者的需求遠未滿足,只要專家們愿意擁抱新工具,他們很可能依然會比新手出色得多。總的來說,到2030年,一個人能完成的工作量將遠超2020年,這將是一個驚人的變化,很多人都將找到從中受益的方式。
在最重要的方面,2030年代或許不會有天翻地覆的變化。人們依然會愛自己的家人,表達自己的創造力,玩游戲,在湖中游泳。
但在其他同樣非常重要的方面,2030年代可能會與以往任何時代都截然不同。我們不知道我們能超越人類水平的智能多遠,但我們即將找到答案。
在2030年代,智能和能源——也就是想法,以及將想法變為現實的能力——將變得極其充裕。長久以來,這兩者一直是限制人類進步的根本因素。有了充裕的智能和能源(以及良好的治理),理論上我們可以擁有其他任何東西。
我們已經生活在一個擁有驚人數字智能的世界,在最初的震驚過后,大多數人已經習以為常。我們很快就從“驚嘆AI能寫出優美的段落”轉為“思考它何時能寫出一部優美的小說”;從“驚嘆它能做出拯救生命的醫療診斷”轉為“思考它何時能研發出治愈方法”;從“驚嘆它能編寫小程序”轉為“思考它何時能創建一家全新的公司”。這就是奇點的演進方式:奇跡將變為常態,再變為基礎標配。
我們已經從科學家那里聽說,他們的生產力比使用AI之前提高了兩到三倍。先進AI的意義非凡,但也許沒有什么比我們能用它來加速AI自身的研究更重要了。我們或許能發現新的計算基底、更好的算法,以及天知道還有什么。如果能用一年甚至一個月的時間完成過去十年的研究,那么進步的速度顯然將截然不同。
從現在起,我們已有的工具將幫助我們獲得更多的科學洞見,并協助我們創造出更好的AI系統。當然,這不等同于一個AI系統完全自主地更新自己的代碼,但這無疑是一種遞歸式自我完善的雛形。
還有其他自我強化的循環正在發揮作用。AI創造的經濟價值已經開啟了基礎設施建設的復合增長飛輪,以運行這些日益強大的AI系統。而能夠制造其他機器人的機器人(某種意義上,能建造其他數據中心的數據中心)也已不再遙遠。
如果我們必須用傳統方式制造出首批一百萬個人形機器人,但之后它們便能運營整個供應鏈——挖掘和提煉礦物、駕駛卡車、運營工廠等等——來制造更多的機器人,而這些機器人又能建造更多的芯片工廠、數據中心等,那么進步的速度顯然將截然不同。
隨著數據中心生產的自動化,智能的成本最終應趨近于電力的成本。(人們常好奇一次ChatGPT查詢消耗多少能源:平均一次查詢大約消耗0.34瓦時,相當于一個烤箱工作一秒多,或一個高效燈泡亮幾分鐘。它還消耗約0.000085加侖的水,大概是十五分之一茶匙。)
科技進步的速度將持續加快,而人類適應幾乎任何事物的能力也將一如既往。過程中會有非常艱難的部分,比如整個類別的崗位消失,但另一方面,世界財富的增長將如此之快,以至于我們能夠認真考慮我們以前從未敢想的新政策理念。我們或許不會一蹴而就地采納新的社會契約,但幾十年后回望,這些漸進的改變將匯聚成巨大的變革。
如果歷史可為借鑒,我們會找到新的事情去做,產生新的欲望,并迅速吸收新工具(工業革命后的職業變遷就是一個很好的近代例子)。人們的期望會提高,但能力也會同樣迅速地提升,我們都將擁有更好的東西。我們將為彼此創造出越來越美好的事物。人類相對于AI有一個長期、重要且奇特的優勢:我們的天性就是關心他人以及他們的想法和行為,而我們對機器則沒有那么在意。
一千年前的自耕農看到我們今天所做的很多事,會說我們從事的是“虛假的工作”,覺得我們只是在自娛自樂,因為我們早已食物充足、奢侈品多到無法想象。我希望一千年后的人們看待未來的工作時,也會覺得它們非常“虛假”,但我毫不懷疑,從事這些工作的人們會感到它們無比重要且令人滿足。
新奇跡實現的速度將是驚人的。我們今天甚至難以想象到2035年我們會發現什么;也許我們會在一年內解決高能物理學難題,然后在下一年開啟太空殖民;或者在一年內取得重大的材料科學突破,然后在下一年實現真正的高帶寬腦機接口。許多人會選擇以大致相同的方式生活,但至少有些人可能會決定“接入”網絡。
展望未來,這一切聽起來令人難以置信。但親身經歷時,可能會感覺雖震撼卻尚可駕馭。從相對論的視角看,奇點是逐步發生的,融合是緩慢進行的。我們正在攀登指數級技術進步的漫長弧線;向前看時,它似乎總是陡峭垂直;向后看時,又顯得平坦無奇,但它其實是一條平滑的曲線。(回想一下2020年,如果有人說2025年我們將擁有接近AGI的東西,聽起來會有多瘋狂?再看看過去這五年實際的經歷,便會明白。)
伴隨著巨大的上行潛力,我們也需要直面嚴峻的挑戰。我們必須在技術和社會層面解決安全問題,但鑒于其經濟影響,將超級智能的訪問權限廣泛地分配出去也至關重要。最佳的前進道路可能是這樣的:
首先,解決對齊問題,即我們能穩健地保證AI系統能夠學習并按照我們人類集體的長期真實意愿行事(社交媒體的信息流就是未對齊AI的例子:那些算法在讓你持續滑動方面表現出色,清楚地理解你的短期偏好,但它們是通過利用你大腦中覆蓋了你長期偏好的機制來實現這一點的)。
然后,專注于讓超級智能變得廉價、普及,并且不會過度集中在任何個人、公司或國家手中。社會是富有韌性、創造力且適應迅速的。如果我們能駕馭人類的集體意愿和智慧,那么盡管我們會犯很多錯誤,有些事情會出大問題,但我們將能快速學習和適應,并利用這項技術實現效益最大化和風險最小化。在社會必須決定的廣泛邊界內,給予用戶大量的自由,似乎非常重要。世界越早開始就這些廣泛邊界是什么以及我們如何定義集體對齊展開對話,就越好
我們(整個行業,不僅是OpenAI)正在為世界構建一個大腦。它將是高度個性化的,每個人都能輕松使用;我們的限制將是好的想法。長久以來,初創圈的技術人員一直取笑那些“只有想法的人”,他們有一個點子,然后四處尋找團隊來實現它。現在在我看來,他們大放異彩的日子即將來臨。
今天的OpenAI已身兼數職,但歸根結底,我們首先是一家超級智能研究公司。我們面前還有大量工作,但前路的大部分已被照亮,黑暗的區域正在迅速退去。能夠從事我們現在所做的事,我們感到無比幸運。
“智能廉價到無需計量”的時代已觸手可及。這聽起來可能有些瘋狂,但如果我們在2020年告訴你我們今天會達到這個位置,那聽起來可能比我們現在對2030年的預測更加瘋狂。
愿我們能平穩、順利地,以指數級的方式,進入超級智能的時代。
參考:
https://help.openai.com/en/articles/9624314-model-release-notes
https://blog.samaltman.com/the-gentle-singularity
?星標AI寒武紀,好內容不錯過?
用你的贊和在看告訴我~
求贊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.