網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

OpenAI首席科學家Nature爆料：AI自主發(fā)現(xiàn)新科學！世界模型和RL是關鍵

2025-05-13 18:42:36　來源: 新智元

北京舉報

分享至

新智元報道

編輯：犀牛

【新智元導讀】近日，《自然》雜志獨家專訪了OpenAI首席科學家Jakub Pachocki，他揭示了推理模型、強化學習如何賦予AI自主發(fā)現(xiàn)科學的能力，并分享了AI如何在五年內重塑科學研究與經(jīng)濟格局的雄心。

ChatGPT推出后，迅速震驚了全球。

自那以后，OpenAI一直站在AI技術發(fā)展的最前沿。

去年9月，他們推出o系列模型，再次引領AI推理的浪潮。

到今天，推理模型已成主流。

最新、最強的模型，比如o3、Gemini 2.5 Pro、DeepSeek-R1，都是推理模型。

這些模型可以通過思維鏈（CoT），一步一步地「思考」來解決問題。比如，幫助研究人員潤色文章、編寫代碼、回顧文獻，甚至是提出假設。

可以說，OpenAI的迅速崛起極大推動了這次的AI革命。

在這其中，有個人一直在OpenAI扮演著關鍵角色。雖然很少有人聽說過他。

這就是OpenAI的首席科學家Jakub Pachocki。

2024年以來，Jakub Pachocki一直是OpenAI的首席科學家

Pachocki在2017年從學術界加入到OpenAI。在此之前，他是一名理論計算機科學家和競技程序員。

現(xiàn)在，Pachocki領導一項最先進的AI系統(tǒng)開發(fā)，這些系統(tǒng)旨在解決科學、數(shù)學和編程中的復雜任務。

就在昨天，《自然》雜志對Pachocki做了一次專訪，探討了AI能否做出獨立研究、通用人工智能（AGI），及公司即將推出的開源模型等熱門話題。

文章地址：https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809

以下是采訪精彩對話。

推理模型有多重要？

現(xiàn)在，你能和一個AI對話，但它還只是個需要不斷被引導的助手。

我（Pachocki，下同）覺得接下來這種情況會有很大改變。

我們已經(jīng)看到，像OpenAI的Deep Research這種AI工具，可以在沒有人監(jiān)督的情況下持續(xù)工作10到20分鐘，給出一份有用的結果。

但是，目前用于解決這些需求的計算量還不大。

強化學習有多重要？

第一階段的ChatGPT版本涉及一個無監(jiān)督的預訓練階段。在這個階段，模型會吞下海量的數(shù)據(jù)，并構建出某種「世界模型」。

然后，我們通過使用人類反饋的強化學習，訓練出一個有用的AI助手。

最近在推理模型上的進展，可以看作是更加重視強化學習的結果。

這樣，我們就不只是在提取知識，還使模型能夠找到自己的思考方式。

一個問題是，我們是否應該繼續(xù)將這些學習階段分開來考慮。

推理模型不是在真空中學習如何思考的，它們根植于一個預訓練模型。

我的很多關注點在于如何將模型的不同階段、方法結合起來，理解它們之間的相互作用。

模型真的會思考嗎？

首先，我們需要清楚，AI的運行方式與人腦不同。

預訓練的模型學到了一些關于世界的知識，但它并沒有真正理解它是如何學會這些事情的，也搞不清它學習這些事情的時間順序。

但我堅信我們有充分的證據(jù)表明模型能夠發(fā)現(xiàn)新科學。

我會說這是一種「推理」，但這并不意味著它跟人類的推理方式一樣。

在探索AI推理能力的同時，OpenAI也在考慮如何通過開源模型推動科學進步。

奧特曼說的新開源模型

對于這個問題，我特別興奮。尤其是能給研究人員提供一個開源的模型權重（他們可以下載并進一步訓練）。

隨著這些模型變得越來越強大，我們越來越有責任去理解在不同的方式下部署它們會如何影響大家。

我覺得要發(fā)布頂尖的前沿模型并開源權重會很困難，因為有安全方面的顧慮。

我想我們（OpenAI）發(fā)布的模型得比現(xiàn)有的開源模型更好。

AGI的定義是什么？何時達到？

我對AGI的定義及時間預期都發(fā)生了很大的變化。

剛進研究生院時，我覺得AGI的一個里程碑是能精通圍棋，得花上幾十年的時間。

結果，2016年這個目標就實現(xiàn)了。這對我來說簡直是震撼世界的時刻。

2017年加入OpenAI時，我還是公司里對AGI最大的質疑者之一，但新的突破接踵而來。

在圖靈測試上，我們已經(jīng)取得了很多的進展。數(shù)學和問題的解決能力也進步很快，我覺得最難的基準測試也會很快被突破。

所以，我現(xiàn)在思考的下一個重大里程碑——是AI能產(chǎn)生實實在在、可量化的經(jīng)濟影響，特別是能夠創(chuàng)造全新的科學研究。

這對我來說是最接近我心目中AGI的感覺。我們現(xiàn)在正聚焦于此，我預計在5年內會有非常大的進展。今年，人工智能可能還不會解決主要的科學問題，但幾乎可以自主地編寫有價值的軟件。

據(jù)報道，微軟和OpenAI已同意使用經(jīng)濟指標來衡量AGI的進展，具體目標是實現(xiàn)1000億美元的投資回報。這種方式與Pachocki定義的AGI相匹配。

Pachocki的愿景表明，AI不僅將成為科學研究的助手，更可能在未來五年內重塑全球經(jīng)濟與創(chuàng)新格局。

參考資料：

https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

o3完爆人類醫(yī)生，OpenAI基準直擊AGI！

新智元 2025-05-13 15:06:06
18 跟貼 18
Claude腦回路被開盒：AI會撒謊和暗中計劃

量子位 2025-04-04 12:20:26
0 跟貼 0

AGI時代的教育我們應該學什么？

經(jīng)濟觀察報 2025-05-09 15:41:04
0 跟貼 0

推理大模型1年內就會撞墻！FrontierMath團隊最新研究

量子位 2025-05-13 15:23:09
4 跟貼 4
AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0

宇樹機器人復雜環(huán)境穩(wěn)定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
0 跟貼 0

ICML 2025 | 如何在合成文本數(shù)據(jù)時避免模型崩潰？

機器之心Pro 2025-05-14 15:08:32
0 跟貼 0
AI大模型上天了！中國科學院全新研究成果打破美國太空技術領先地位｜鈦媒體AGI

鈦媒體APP 2025-05-12 13:09:14
32 跟貼 32

OpenAI被爆考慮在阿聯(lián)酋建數(shù)據(jù)中心

華爾街見聞官方 2025-05-14 03:28:07
1 跟貼 1
大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
單圖生成14秒吉卜力動畫，分享制作過程

量子位 2025-04-08 18:23:02
0 跟貼 0
研發(fā)自動化的初衷是讓每一個研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0
Manus的商業(yè)算盤能打響嗎？

虎嗅APP 2025-05-14 08:05:06
9 跟貼 9
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
人人都能做開發(fā)者！連小學生都能輕松上手的0代碼開發(fā)平臺來了

量子位 2025-04-15 11:59:12
0 跟貼 0
傳統(tǒng)MVP模型不成立了，AI時代要更多預測剛需場景

量子位 2025-04-22 14:14:16
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
4o生圖前端效果騙了太多人，網(wǎng)友扒出逐行生成的演示當不得真

量子位 2025-04-02 21:22:14
0 跟貼 0
老板想本地跑AI，只給10萬還想體驗滿血DS，我該咋辦？

量子位 2025-04-14 15:31:01
0 跟貼 0
陶哲軒攜AI再戰(zhàn)數(shù)學！o4-mini秒慫棄賽，Claude 20分鐘通關

新智元 2025-05-14 14:58:51
0 跟貼 0
Qwen3訓練秘籍公開：思考/非思考融進一個模型，大模型蒸餾小模型

量子位 2025-05-14 15:30:56
1 跟貼 1
字節(jié)最強多模態(tài)模型登陸火山引擎！Seed1.5-VL狂攬38項SOTA

機器之心Pro 2025-05-14 14:32:49
1 跟貼 1
AI假直播躺賺，明星急了

新周刊 2025-05-14 16:10:32
0 跟貼 0
GPT-5研發(fā)內幕首曝！OpenAI首席研究官：AGI指日可待

新智元 2025-05-12 19:11:09
41 跟貼 41
白車司機的技術不過關，好在有反光錐擋著，網(wǎng)友：為什么不車頭朝外

新知速報 2025-05-12 16:10:24
4 跟貼 4
美國與沙特簽署1420億美元軍售協(xié)議

新華社 2025-05-14 07:20:03
11005 跟貼 11005
我到底是誰？科學與佛法聯(lián)手指向一個真相！

佛道殊途同歸 2025-05-13 11:19:39
0 跟貼 0
今天全家移民美國了，告別一切的不舍。祝我們新的旅程愉快！

鹽系手札i 2025-05-14 01:36:25
9552 跟貼 9552
【通俗易懂】一張圖秒懂 AI大模型原理！99%小白看完震驚，零基礎也能手把手教你訓練AI模型！大模型

盧菁老師 2025-05-14 10:28:44
0 跟貼 0
科學家：地球的大氣層正在變薄，每年宇宙要吸走地球十萬噸大氣！

未來宇宙w 2025-05-12 17:18:45
0 跟貼 0
《贏在AI+》AI助理小主持技術大揭秘，機器人都有MBTI了？

量子位 2025-05-09 18:08:14
0 跟貼 0
真正的智能體軟件工程師：OpenAI研發(fā)A-SWE能寫代碼、測試質量、修復Bug

量子位 2025-04-14 19:04:43
0 跟貼 0
都知道錢老是科學界的超級大牛，但你知道他還有個副業(yè)是翻譯嗎？

星光樂世界 2025-05-14 05:29:40
0 跟貼 0
如果科學解決不了，那就交給愛吧！

圈內芒果撈 2025-05-13 21:07:36
0 跟貼 0
用物理學改進深度學習，AI大模型的新突破

量子位 2025-05-05 13:12:31
0 跟貼 0
拿下38項第一！字節(jié)發(fā)布Seed1.5-VL多模態(tài)推理模型

量子位 2025-05-14 14:22:19
0 跟貼 0
一個博士一個碩士，生了個道士，果然科學的盡頭是玄學！

唐尼二愛生活 2025-05-10 08:49:51
0 跟貼 0
國產(chǎn)大模型「五強爭霸」，決戰(zhàn)AGI！

新智元 2025-05-12 13:54:50
32 跟貼 32
大廠AI人才爭奪戰(zhàn)打響，騰訊阿里等相繼發(fā)布頂尖人才計劃

量子位 2025-05-13 18:52:55
0 跟貼 0
百大科技演講拉片：OpenAI研究員，智能體入口如何取代網(wǎng)頁？

親愛的數(shù)據(jù) 2025-05-12 23:17:02
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

OpenAI首席科學家Nature爆料：AI自主發(fā)現(xiàn)新科學！世界模型和RL是關鍵

最會賺錢的女投資人押寶 這些企業(yè)悶聲發(fā)財

小米近日陷入"退車風波" 雷軍的微博已開啟評論限制

小米近日陷入"退車風波" 雷軍的微博已開啟評論限制

NBA最被低估球員，帶隊爆殺東部第一

姜妍自曝上藝校時因為得了獎遭霸凌

對美關稅:125%→10% 24%稅率暫停90天

2026款豐田bZ北美市場亮相 下半年上市 bZ4X成歷史

態(tài)度原創(chuàng)

人到中年才發(fā)現(xiàn)！穿衣搭配記住“上短下長”，立馬變成大長腿

狂降40萬！海口這個改善盤殺出好價？你想多了！

網(wǎng)傳蘋果向渠道商下發(fā)調價通知，iPhone 16 Pro全系降價超千元

簡約端莊 現(xiàn)代美學體驗

美國與沙特簽署1420億美元軍售協(xié)議

最會賺錢的女投資人押寶這些企業(yè)悶聲發(fā)財

2026款豐田bZ北美市場亮相下半年上市 bZ4X成歷史

簡約端莊現(xiàn)代美學體驗