智東西
編譯 李水青
編輯 心緣
智東西6月19日報道,今天,OpenAI發(fā)布了其首期官方播客——聯合創(chuàng)始人兼CEO薩姆?阿爾特曼(Sam Altman)最新的40分鐘深度訪談。
在訪談中,阿爾特曼談及了AGI、GPT-5、AI新硬件、隱私、未來規(guī)劃等多個熱點話題,主要信息干貨如下:
1、GPT-5大概在今年夏天推出。但命名為GPT-5還是繼續(xù)迭代GPT-4,OpenAI內部還未確定。阿爾特曼希望以后不必對模型進行復雜的型號命名。
2、ChatGPT在5年后可能不是最受歡迎產品。5年后ChatGPT可能變?yōu)橥耆煌漠a品,甚至不再以ChatGPT命名。
3、不清楚是否接近AGI,但每一年都會有人聲稱我們接近AGI了。真正的突破可能在于能推動科學發(fā)現的“超級智能(Super Intelligence)”。
4、談及與喬納森·伊夫(Jony Ive)的合作,阿爾特曼還沒有用上聯合開發(fā)的AI新硬件,可能不會很快到來。因為當前的計算機、軟件和硬件都是為沒有AI的世界設計的,他們需要更“瘋狂”的創(chuàng)新。
5、計劃投資5000億美元的星際之門(Stargate)算力項目資金沒有完全到位,但會在未來幾年里逐步推進。
6、OpenAI不會修改大模型輸出內容以植入廣告,但可能就內容原生提及的產品及購買引流,進行收費。
7、信息流算法推薦是社交媒體時代的重大錯誤,AI時代需要規(guī)避,在滿足用戶短期需求和長期需求之間取得平衡。
8、作為新手奶爸,阿爾特曼會用ChatGPT搜育兒知識,未來也擔心孩子沉溺于AI,但總體持樂觀態(tài)度。
9、給25歲年輕人的建議:學用AI工具,更具有韌性、適應性、創(chuàng)造力。
▲薩姆?阿爾特曼訪談視頻截圖
作為OpenAI官方播客的第一期,本次訪談由前OpenAI應用團隊工程師安德魯·緬因(Andrew Mayne)擔任主持人,已上線蘋果播客、Spotify等平臺。
以下是薩姆?阿爾特曼訪談全程內容的編譯,智東西做了不改變原意的編輯。
一、新手奶爸談AI育兒:用ChatGPT搜百科,也擔心孩子沉溺
主持人:作為一位新手爸爸,ChatGPT對你有多少幫助?
阿爾特曼:幫了不少。雖然在沒有ChatGPT時人們也能很好地照顧孩子,但在最初有孩子的幾周里我不知道該怎么做,我不斷地問ChatGPT關于孩子發(fā)展階段的問題,我花了很多時間思考我的孩子將來如何使用AI。
主持人:我身邊有不少有孩子的朋友,會談論“這個AI怎么樣”這類話題,態(tài)度都是開放和樂觀的。
阿爾特曼:我認為這是一個好跡象。我的孩子永遠不會比AI更聰明,但他們也會成長,能夠做一些我們無法想象的事情。他們會非常擅長使用AI,我經常思考這個問題,但我更多思考的是他們將擁有什么,而不是我們沒有擁有的東西。我不認為我的孩子們會因為他們不比AI更聰明而受到困擾。
主持人:社交媒體上有人說他厭倦了和他的孩子談論托馬斯小火車,所以他把它放在ChatGPT,設置調到語音模式,能玩一個小時。
阿爾特曼:孩子們很喜歡ChatGPT語音模式,但恐怕這并不全是好事。人們會遇到問題或產生有問題的模擬社會關系。那么社會將不得不想出新的規(guī)范,但好處將是巨大的。我們社會總體上擅長探索如何弱化缺點。
主持人:是的,我也持樂觀態(tài)度。我們看到一些有趣的數據,老師在教室里引導學生使用ChatGPT效果很好,但學生單獨使用就讓家庭作業(yè)很難辦,就像孩子們用谷歌搜索搜答案一樣。
阿爾特曼:我是那些每個人都擔心的孩子之一。讓谷歌搜索出來時我就用它搜答案,然后就不學了。你知道(ChatGPT)結果得到較快,學校的孩子們已經適應了。所以我想我們會解決這個問題的。
二、5年后ChatGPT可能不再主流,不清楚是否已接近AGI
主持人:ChatGPT會是OpenAI五年后最受歡迎的產品嗎?
阿爾特曼:五年后ChatGPT會變成一個完全不同的東西。所以某種意義上不會是,但它還會被稱為ChatGPT嗎?可能不會了。
主持人:所以我們聽到的另一個東西是AGI,想聽聽你對AGI的定義。
阿爾特曼:如果你讓我或其他任何人在5年前基于軟件的認知的能力提出一個AGI的定義,我認為許多人會給出的定義現在已經被超越了。它會越來越聰明。每年都會有人認為我們已經達成了AGI,但定義會繼續(xù)擴展并變得更雄心勃勃,仍有很多人同意我們都接近了。但我們現有系統(tǒng)真正提高了人們的生產力,能夠做有價值的經濟工作。也許更好的問題是,我稱之為超級智能(Super Intelligence)的東西需要什么?如果我們有一個能夠自主發(fā)現新科學或大大提高人們使用該工具發(fā)現新科學的能力的系統(tǒng),對我來說這幾乎是一種重新定義的超級智能,對世界來說是一件美妙的事情。
主持人:你是否看到過類似的跡象,讓你覺得我們可能已經接近了?
阿爾特曼:沒有完全弄清楚,但我對探索的方向越來越有信心。比如,人們使用AI系統(tǒng)編寫代碼,讓研究人員更有效率,它顯然沒有做新的科學,但這肯定使科學家能夠更快地完成研究工作。我們也經常從科學家那里聽到o3的聲音,所以我不會說我們實現了超級智能,但我們正指導AI去幫助研發(fā)人員在得到很好的假說,而且進展速度驚人。從o1到o3,每隔幾周團隊就會說,我們有一個重要的新想法。當你熱衷于發(fā)現一個新的重大洞見時,事情會以驚人的速度發(fā)展。
主持人:我注意到最近OpenAI剛剛將Operator中的模型切換到o3,改進很大。我覺得之前遇到的問題還是穩(wěn)定性不夠,很多Agent系統(tǒng)遇到無法解決的問題時就會崩潰。
阿爾特曼:有趣的是,談到AGI問題,很多人告訴我,他們的個人時刻是o3的Operator,就像看AI在流暢使用電腦一樣,雖然不是完美的。o3是向前邁出的一大步,但它對我的影響好像沒有達到(AGI)那么大。
主持人:Deep Research像是一個很接近AGI的應用場景,當我對一個問題感興趣時,它會幫我搜索、梳理和總結,比我自己做得更好。
阿爾特曼:我最近遇到一個家伙,他瘋狂癡迷于自學,他使用Deep Research來生成他好奇的話題的報告,然后只是整天坐在那里,已經很擅長快速消化它們,知道接下來要問什么。對于那些真的有瘋狂學習欲望的人來說,Deep Research像是一個了不起的新工具。
三、GPT-5今夏推出,模型型號太多阿爾特曼也煩
主持人:GPT-5的時間計劃是什么樣的?
阿爾特曼:大概在今年夏天的某個時候吧。我們還在來回討論,是應該迭代GPT-5,還是就像GPT-4o一樣繼續(xù)迭代GPT-4。
主持人:當GPT-4出來的時候,我必須在它與GPT-3.5之間做比較,GPT-3.5也在迭代。那么GPT-5會不會只是GPT-4的一個更好的版本?
阿爾特曼:可能不一定。它可能會向兩種方向發(fā)展,我們可以繼續(xù)像GPT-4.5這樣迭代,或者在某個時候稱之為GPT-5。它曾經更加清晰,我們會訓練一個模型并將其推出,然后創(chuàng)建一個新的大模型再推出。但現在系統(tǒng)變得更加復雜,我們可以不斷地對它們進行訓練,使它們變得更好。我們現在正在考慮這個問題,沒有這個答案。但是我認為會有比GPT-4更好的方法。
主持人:是的,這是一個挑戰(zhàn),即使你很懂技術也不一定清楚這些版本的區(qū)別,比如,該用o4-mini還是o3?
阿爾特曼:我認為這是范式轉變的產物。我們在同時進行這兩件事情,已經接近了當前問題的尾聲。但我可以想象一個世界,我不知道它是什么,在那里我們發(fā)現了一些新的范式,這意味著模型樹需要長出新的分叉。
主持人:更復雜的命名?
阿爾特曼:希望我們不必這樣做。我很希望看到GPT-5和GPT-6,這對人們來說會更容易使用,不用再思考是用o4-mini(高版本)還是o3或GPT-4。
主持人:o4-mini(高版本)是我用來編程的,o3則拿來進行聊天對話。(阿爾特曼:我想我們很快就會走出這個困境。)當你懂它們時,擁有選擇是很有趣的。但我認為使模型更強的一大因素是記憶功能等集成,記憶一開始很簡單,現在變得更加復雜了。
阿爾特曼:記憶功能可能是我最近最喜歡的ChatGPT功能。第一次與GPT-3交談非常震撼,現在計算機能知道很多上下文。如果我用很少的詞語問它一個問題,它會基于對我過往生活的了解,非常自信地知道我想讓它做什么。有些人不喜歡它,但大多數人真的喜歡。我認為我們正在走向一個世界,如果你愿意,AI將會在充分掌握你的生活背景,并給你超級有用的答案。
四、不會硬改模型輸出內容做廣告,但可能收取引流費
主持人:對我來說很酷,但關閉(記憶功能)也是一個很大的挑戰(zhàn)。其中一個挑戰(zhàn)是《紐約時報》正在與OpenAI進行的訴訟,他們剛剛要求法OpenAI必須保留消費者ChatGPT用戶記錄超常規(guī)的30天的期限。你能解釋一下OpenAI的立場嗎?
阿爾特曼:顯然,我們要與之斗爭,我們會贏。我認為《紐約時報》要求這樣做太瘋狂了。我希望這是一個社會意識到隱私保護非常重要的時刻。隱私需要成為使用AI的核心原則。《紐約時報》這樣的媒體要求AI提供商損害用戶隱私很不應該,但我希望這能加速社會關于隱私和AI的對話。我們非常認真地對待它。人們現在正在與ChatGPT進行相當私密的對話,ChatGPT將是一個非常敏感的信息來源,我認為我們需要一個能反映這一點的框架。
主持人:這引發(fā)了另一個問題,有人會問,OpenAI現在可以訪問這些數據,一個是拿數據做訓練,OpenAI已經非常明確了何時能訓何時不能訓,用戶可以選擇關閉它;另一個是廣告這類東西。OpenAI如何應對?你們將如何承擔這個責任?
阿爾特曼:我們還沒有做過任何廣告產品。我并不完全反對它,我可能會選擇我喜歡廣告的領域,我認為Instagram上的廣告就很酷,我從他們那里買了很多東西。但我認為這很難,要做到這一點需要非常小心,人們對ChatGPT有非常高的信任度。
但我認為其中一部分原因是,如果你把我們比作社交媒體或網絡搜索,你就正在被貨幣化,而公司正試圖為你提供優(yōu)質的產品和服務,有的會像讓你點擊廣告或其他什么的,比如算法推薦的內容而非同質化信息。我認為那里有一種心理上的東西?因此如果我們開始修改大模型輸出的內容以為廣告主植入廣告,那將會感覺非常糟糕,破壞信任。但如果用戶點擊生成內容里原生存在的產品,我們再從中獲得一點點交易收入,這對每個人來說都是可接受的事情。也許在交易流之外會有類似的廣告,但我們一定會保證它沒有干擾大模型內容輸出。
主持人:是的,這將是一個困難的問題。我很想通過ChatGPT在家購物,幫我做出明智的購物引導。
阿爾特曼:確實很難。不過,如果我們能以某種非常清晰和一致的方式做到這一點,那也很好。建立良好的服務,人們?yōu)榇讼蛭覀冎Ц顿M用,很清楚。
主持人:新的Gemini 2.5是一個非常好的模型,但谷歌是一家廣告技術公司,我確實會想如果我在使用他們的聊天機器人,是否也會看到很多廣告。
阿爾特曼:谷歌搜索長期以來一直是一個了不起的產品。我確實覺得它退化了,之前出現了很多廣告,但我仍然認為這是互聯網上最好的東西。我喜歡谷歌搜索,所以我不喜歡成為一家優(yōu)秀的廣告驅動公司。
五、信息流算法推薦是重大錯誤,AI時代要規(guī)避
主持人:說到用戶體驗,隨著人們越來越多地使用ChatGPT等系統(tǒng),你如何看待未來AI與人的互動形態(tài),比如對AI具有人格這一個觀點持什么態(tài)度?
阿爾特曼:社交媒體時代的一個重大錯誤是Feed(信息流)算法。它對整個社會甚至個人用戶都產生了一系列意想不到的負面影響,盡管他們正在做用戶想要或目前認為用戶想要的事情,但這讓他們喜歡在網上花費時間,這就是社交媒體的巨大錯位。我認為還有很多其他的事情讓人們心煩意亂,陷入困境,而不僅僅是快樂和滿足。
我一直都知道,AI世界會有新的問題出現。這個世界會有一些不明顯的錯位,但我們最先遇到的一個問題肯定是,用戶希望提問后得到令他愉悅的答復。然后你嘗試建立一個對用戶最有幫助的模型,并向用戶展示兩個回復,哪一個對你更有幫助?對于任何給定的事物,您可能希望建模以單向行為。但是在整個過程中,你所使用的AI可能不匹配。我們確實看到了這些問題,如果你過于關注用戶信號以及我們在事后討論的許多其他事情,但我認為這只是一個短期內有趣的問題。在短時間內對用戶有幫助,但在很長一段時間內不會有幫助。
主持人:為什么我認為那個標志是DALL·E 3?我認為從技術上講DALL·E 3是一個非常有能力的模型,但它生成的圖像風格都有點趨同了。是不是用戶偏好反饋造成的?
阿爾特曼:我不記得DALL·E 3的情況了,但我想是這樣的。
六、星際之門算力工程5000億美元投資還沒到位,但會逐步推進
主持人:現在每一家都面臨算力問題。為了解決這個問題,我們聽說了“星際之門(Stargate)”項目,名字非常酷,據稱投資了5000億美元,請你介紹一下情況?
阿爾特曼:關于星際之門?這很簡單。這是一個為前所未有的計算量提供資金和搭建能力的項目。人們完全沒有足夠的計算能力來做想做的事情,但如果人們知道我們可以用更多的計算做什么,他們會想要更多算力。因此,在我們今天能夠為世界提供的能力與我們能夠為世界提供10倍以上的計算能力之間,存在著巨大差距。或者有朝一日,我希望能夠提供100倍以上的計算能力。而與我從事過的其他技術不同的是,至少在AI方面,向全球數億人提供有用服務的規(guī)模是基礎設施投資的規(guī)模。因此,“星際之門”是一項努力,旨在將大量資本、技術和運營專業(yè)知識結合起來,建立基礎設施,向所有需要的人提供下一代服務,并使信息盡可能豐富和廉價。
主持人:所以這是一個巨大的全球項目,你也在各地政府尋求合作。有人在社交媒體上問,5000億美元,你們有錢嗎?
阿爾特曼:我們實際上還沒有,錢還在銀行賬戶里,但我們將在未來多年里逐步投入。除非真的出了問題,比如客觀上我們無法制造這些計算機,我相信人們是看好這個項目的。
主持人:最近我去阿比林參觀了建立的第一個據點,這大約占星際門承諾投資5000億美元的10%,約5000億美元。我親眼看到成千上萬的人在施工以及GPU機架在建設,還是很震撼的。
阿爾特曼:站在第一個星際之門據點里,我真的只是在思考讓GPU運行需要多么復雜的全球系統(tǒng)啊。當你拿出手機在ChatGPT中輸入一些內容并得到答案時,你你可能甚至不認為這是特別令人驚訝的事了。
主持人:我讀了關于星際之門項目和國際伙伴關系發(fā)展的幕后故事,特別是關于阿聯酋的合作和馬斯克試圖的破壞,你看到了什么?聽說過什么?有什么看法?
阿爾特曼:我曾在對外說過,我認為馬斯克不會濫用他在政府中的權力來進行不公平的競爭。但很遺憾地說我錯了。總的來說,我不喜歡犯錯,但我認為他做這些事對國家來說真的很不幸。我真的不認為他會這樣做。我很感激政府真的做了正確的事情,抵制這種行為。
主持人:我認為改變的事情是,格雷格·布羅克曼(Greg Brockman)剛剛談到這個,幾年前人們認為誰先到誰就是贏家,游戲就結束了。現在我們意識到在其他地方也有很棒的AI實驗室,比如Anthropic正在構建很棒的工具,谷歌也有了新的發(fā)展。
阿爾特曼:是的。AI的探索在許多方面接近晶體管的發(fā)現:許多公司會以此為基礎打造偉大的產品,最終它會滲透到幾乎所有的產品中,但你不會一直考慮使用晶體管。所以我認為很多公司會在科學發(fā)現之上打造成功的業(yè)務,我希望埃隆(馬斯克)能少一點零和思維。
主持人:我剛剛參加了一個能源會議,讓我想到了能源需求。拿Grok 3來說,我猜他們必須在停車場放置發(fā)電機才能訓練該模型。這就是問題,能源將從哪里來?
阿爾特曼:我覺得到處都是,對吧?我認為現在是一個很大的組合。最終,我認為很多人都對先進的核能感到非常興奮,包括核裂變和核聚變。但現在我認為這是整體投資組合,天然氣、太陽能應有盡有。
傳統(tǒng)上,很難在世界各地轉移能源。但是如果你用能量交換智力,然后將智力在世界各地移動,那就容易多了。所以你可以在很多地方放置一個巨大的訓練中心甚至是大型的推理集群,然后就像在互聯網上傳輸輸出一樣。
七、下一代模型要能理解物理化學,能做研究
主持人:我參加了一個活動,有人談到使用詹姆斯·韋伯太空望遠鏡最大的瓶頸,是他們即將獲得TB級的數據,但沒有足夠的人員來瀏覽數據。在這里我們有關于宇宙的答案,但面臨大數據的問題。
阿爾特曼:是的,我一直開玩笑說,當我們有足夠的錢時,我們應該做的一件事是建造一個巨大的粒子加速器,徹底解決高能物理學。我認為這是一件宏偉壯觀的事情。但我想知道,一個真正聰明的AI能夠在沒有更多數據,沒有更大的粒子加速器的情況下查看我們目前擁有的數據并找出答案的可能性有多大?這不是不可能的。
主持人:在1990年代初,有人發(fā)現了一種類似Ozempic的藥物,但將其給制藥公司時被拒絕了。這種藥很多年后證明能夠緩解慢性肥胖。
阿爾特曼:我猜想還有很多其他的例子。我們可能已經有現有的藥物,我們知道它們有用,但改變下它們的使用方式,或者經過幾個小的修改,它們就非常接近偉大的事物。聽到科學家們使用當前這一代模型進行這種工作很令人振奮。
主持人:所以這聽起來像是我們需要的東西之一,對于下一代模型,作為理解物理和化學等知識的模型,Sora在這方面是一個嘗試嗎?
阿爾特曼:Sora可以理解牛頓物理學,但我不知道它是否能幫助我們發(fā)現新的化學要素和新的東西。但我很樂觀,用于推理模型的技術將在這些方面對我們有很大幫助。
主持人:推理模型的簡短定義是什么,和我問GPT-4.1問題會有什么區(qū)別?
阿爾特曼:GPT模型可以稍微推理一下。事實上,這是讓人們感到興趣的事情之一。在GPT模型的早期階段,你可以通過告訴模型來獲得更好的性能,讓我們一步一步地思考。然后它只輸出逐步思考的文本,并得到更好的答案,這有點令人驚訝,因為它真的有效。推理模型正在進一步推動這一點。
主持人:所以這個想法就像它能夠分解問題,并且可以在每個步驟上花費更多的時間一樣。
阿爾特曼:當你問我一個更難的問題,我可能會在腦海中思考并像我內心的獨白一樣去說,我可以做這個或那個。然后當我思考完后,可以提出一些要點輸出答案給你。
主持人:我現在觀察到的一個有趣的事情,當我使用App時,當我問一個問題然后將屏幕鎖屏后,AI仍在處理和思考它。好像Anthropic忘了拿一個度量標準來衡量思考時間,我認為這其中是有人性的。比如這個模型實際上已經花費了15分鐘或30分鐘來思考一件事情,這是一個很好的度量標準,但它需要真正給你正確的答案。
阿爾特曼:我感到驚訝的一件事是,人們出人意料地愿意花時間等待一個好的答案。我所有的直覺都是對重要事情的即時反應,用戶對于很多事情討厭等待。但對于難題和一個非常好的答案,人們很愿意等待。
八、談與喬納森合作,AI新硬件還需等待
主持人:OpenAI剛剛宣布正在打造硬件。你們已經和喬納森·伊夫(Jony Ive)談論和合作幾年了,你現在身上有這個一起研發(fā)的新設備嗎?
阿爾特曼:還沒有,這需要一段時間。我們將嘗試做一些像瘋狂的高質量水平一樣的事情,可能不會很快到來。但是當前的計算機、軟件和硬件,都是為沒有AI的世界設計的,現在我們處于一個非常不同的世界。而你想要從硬件和軟件中得到的東西正在迅速變化。
我們已經探索了一段時間,有幾個想法非常令人興奮。我認為人們需要時間來適應在這種世界中使用計算機意味著什么,因為現在它是如此不同。但如果你喜歡,真的信任一個AI來理解你生活的所有背景和你的問題,并代表你做出正確的判斷。你也可以說我們與ChatGPT互動的方式是受到上一代設備的影響。
主持人:手機之所以如此普及的原因之一就是我可以在公共場合看屏幕,我可以私下打電話并與之交談,我認為新設備面臨的挑戰(zhàn)之一就是試圖彌合我們在公共和私人領域使用的差距。
阿爾特曼:手機是不可思議的東西,從很多角度看它們很棒。你可以想象一種新設備,你可以在任何地方使用,但也有一些我在公開場合做的不同事情,可能你喜歡在家里。我在音樂中建有很棒的立體聲系統(tǒng)。當我在世界上行走時,我使用AirPods,這不會打擾我。是的,所以我認為在公共和私人用例中有些事情是不同的,但我同意一般目的很重要。
九、建議年輕人學用AI工具,更韌性和創(chuàng)造性
主持人:如果你現在正在給一個25歲的人提供建議,你跟他們說了什么?
阿爾特曼:顯而易見的建議可能是,比如學習如何使用AI工具。有趣的是,世界發(fā)展的有多快,從告訴20-25歲的人“學編程當程序員”到告訴他們“編程不重要,去學習使用AI工具”。我想知道接下來會是什么,但當然它們會成為下一個非常好的戰(zhàn)術建議。
然后在更廣泛的方面,我相信像韌性、適應性、創(chuàng)造力這樣的技能,以及弄清楚其他人想要什么,我認為這些都是可以學習的。這并不像說的那么容易,并不想練習使用ChatGPT一樣容易,但這是可行的。而這些技能我認為在接下來的幾十年里會有很大的回報。
主持人:你會說同樣的話嗎,一個45歲的人現在正在學習如何在你的角色中使用它?
阿爾特曼:是的,可能。
主持人:無論您對AGI有什么定義,以后還是會有更多的人為OpenAI工作?
阿爾特曼:是的,我在網上看到很多人說:“他們很優(yōu)秀,為什么要雇人?”我想,因為電腦不能做所有的事情。展開說就是,會有更多的人,但每個人所做的遠遠超過一個人在前 AGI時代所做的。這是技術的目標。
結語:阿爾特曼勾勒AGI路線圖,GPT-5快來了
在OpenAI首期播客中,阿爾特曼勾勒了OpenAI在通往AGI道路上的關鍵思考與實踐,從今夏即將到來的GPT-5(或迭代版本)、對超級智能的期待,到探索顛覆性的AI硬件、“星際之門”算力計劃,OpenAI正積極布局技術前沿,同時審慎思考AI的社會影響與商業(yè)模式。
阿爾特曼也談及了OpenAI及產業(yè)面臨的挑戰(zhàn),包括如平衡用戶隱私與功能需求、規(guī)避算法推薦陷阱、防止兒童過度依賴AI等,這些問題都值得產業(yè)關注和解決。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.