新智元報道
編輯:犀牛
【新智元導讀】近日,《自然》雜志獨家專訪了OpenAI首席科學家Jakub Pachocki,他揭示了推理模型、強化學習如何賦予AI自主發(fā)現(xiàn)科學的能力,并分享了AI如何在五年內重塑科學研究與經(jīng)濟格局的雄心。
ChatGPT推出后,迅速震驚了全球。
自那以后,OpenAI一直站在AI技術發(fā)展的最前沿。
去年9月,他們推出o系列模型,再次引領AI推理的浪潮。
到今天,推理模型已成主流。
最新、最強的模型,比如o3、Gemini 2.5 Pro、DeepSeek-R1,都是推理模型。
這些模型可以通過思維鏈(CoT),一步一步地「思考」來解決問題。比如,幫助研究人員潤色文章、編寫代碼、回顧文獻,甚至是提出假設。
可以說,OpenAI的迅速崛起極大推動了這次的AI革命。
在這其中,有個人一直在OpenAI扮演著關鍵角色。雖然很少有人聽說過他。
這就是OpenAI的首席科學家Jakub Pachocki。
2024年以來,Jakub Pachocki一直是OpenAI的首席科學家
Pachocki在2017年從學術界加入到OpenAI。在此之前,他是一名理論計算機科學家和競技程序員。
現(xiàn)在,Pachocki領導一項最先進的AI系統(tǒng)開發(fā),這些系統(tǒng)旨在解決科學、數(shù)學和編程中的復雜任務。
就在昨天,《自然》雜志對Pachocki做了一次專訪,探討了AI能否做出獨立研究、通用人工智能(AGI),及公司即將推出的開源模型等熱門話題。
文章地址:https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809
以下是采訪精彩對話。
推理模型有多重要?
現(xiàn)在,你能和一個AI對話,但它還只是個需要不斷被引導的助手。
我(Pachocki,下同)覺得接下來這種情況會有很大改變。
我們已經(jīng)看到,像OpenAI的Deep Research這種AI工具,可以在沒有人監(jiān)督的情況下持續(xù)工作10到20分鐘,給出一份有用的結果。
但是,目前用于解決這些需求的計算量還不大。
強化學習有多重要?
第一階段的ChatGPT版本涉及一個無監(jiān)督的預訓練階段。在這個階段,模型會吞下海量的數(shù)據(jù),并構建出某種「世界模型」。
然后,我們通過使用人類反饋的強化學習,訓練出一個有用的AI助手。
最近在推理模型上的進展,可以看作是更加重視強化學習的結果。
這樣,我們就不只是在提取知識,還使模型能夠找到自己的思考方式。
一個問題是,我們是否應該繼續(xù)將這些學習階段分開來考慮。
推理模型不是在真空中學習如何思考的,它們根植于一個預訓練模型。
我的很多關注點在于如何將模型的不同階段、方法結合起來,理解它們之間的相互作用。
模型真的會思考嗎?
首先,我們需要清楚,AI的運行方式與人腦不同。
預訓練的模型學到了一些關于世界的知識,但它并沒有真正理解它是如何學會這些事情的,也搞不清它學習這些事情的時間順序。
但我堅信我們有充分的證據(jù)表明模型能夠發(fā)現(xiàn)新科學。
我會說這是一種「推理」,但這并不意味著它跟人類的推理方式一樣。
在探索AI推理能力的同時,OpenAI也在考慮如何通過開源模型推動科學進步。
奧特曼說的新開源模型
對于這個問題,我特別興奮。尤其是能給研究人員提供一個開源的模型權重(他們可以下載并進一步訓練)。
隨著這些模型變得越來越強大,我們越來越有責任去理解在不同的方式下部署它們會如何影響大家。
我覺得要發(fā)布頂尖的前沿模型并開源權重會很困難,因為有安全方面的顧慮。
我想我們(OpenAI)發(fā)布的模型得比現(xiàn)有的開源模型更好。
AGI的定義是什么?何時達到?
我對AGI的定義及時間預期都發(fā)生了很大的變化。
剛進研究生院時,我覺得AGI的一個里程碑是能精通圍棋,得花上幾十年的時間。
結果,2016年這個目標就實現(xiàn)了。這對我來說簡直是震撼世界的時刻。
2017年加入OpenAI時,我還是公司里對AGI最大的質疑者之一,但新的突破接踵而來。
在圖靈測試上,我們已經(jīng)取得了很多的進展。數(shù)學和問題的解決能力也進步很快,我覺得最難的基準測試也會很快被突破。
所以,我現(xiàn)在思考的下一個重大里程碑——是AI能產(chǎn)生實實在在、可量化的經(jīng)濟影響,特別是能夠創(chuàng)造全新的科學研究。
這對我來說是最接近我心目中AGI的感覺。我們現(xiàn)在正聚焦于此,我預計在5年內會有非常大的進展。今年,人工智能可能還不會解決主要的科學問題,但幾乎可以自主地編寫有價值的軟件。
據(jù)報道,微軟和OpenAI已同意使用經(jīng)濟指標來衡量AGI的進展,具體目標是實現(xiàn)1000億美元的投資回報。這種方式與Pachocki定義的AGI相匹配。
Pachocki的愿景表明,AI不僅將成為科學研究的助手,更可能在未來五年內重塑全球經(jīng)濟與創(chuàng)新格局。
參考資料:
https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.