*ChatGPT 4.5據(jù)OpenAI Podcast第二期內(nèi)容整理,略經(jīng)ChatGPT 4o編輯
在我們開始習(xí)慣“讓AI來回答”的今天,很容易忘記,ChatGPT最初不過是一個低調(diào)推出的“研究預(yù)覽版”——上線前夜,OpenAI團隊內(nèi)部仍在爭論它“是否足夠好”。誰也未曾預(yù)料到,它將在短短幾天內(nèi)成為現(xiàn)象級產(chǎn)品,乃至引發(fā)全球范圍的技術(shù)模仿與社會討論。
從寫代碼、查資料,到傾訴、調(diào)解、陪伴,數(shù)以億計的對話構(gòu)成了一場關(guān)于“人類與AI共處”的密集試驗。而站在這場技術(shù)與人性交匯的浪潮背后,OpenAI自己也開始重新思考一個問題:我們真正低估的,是模型的能力,還是人的需求?
在OpenAI官方播客第二期中,OpenAI首席研究官Mark Chen與ChatGPT產(chǎn)品負責(zé)人Nick Turley首次共同回顧了這款產(chǎn)品從命名、決策到爆紅的全過程,也坦率分享了他們對“AI推理能力”的真實理解、對Agent系統(tǒng)“人格邊界”的探索,以及對AI未來角色的深層擔(dān)憂。這些故事提醒我們,人工智能的發(fā)展,遠不止是“更強模型”的競賽,更關(guān)乎如何與一個越來越“有想法”的工具共處。
ChatGPT爆紅之后:OpenAI為何感到意外?
“我們甚至不知道是否該發(fā)布ChatGPT。”Nick Turley回憶道。在ChatGPT上線的前一晚,OpenAI內(nèi)部對于是否要推出這一產(chǎn)品仍存在巨大爭議。當(dāng)時的ChatGPT在接受內(nèi)部嚴(yán)格測試時,只有一半的問題給出了令人滿意的答案。這種不確定性使團隊猶豫不決。然而,正式上線后,用戶的狂熱程度完全超出他們的預(yù)期。“發(fā)布后的第一天,我們以為后臺數(shù)據(jù)出了故障;第二天,以為可能只是日本Reddit用戶的小圈子熱潮;第三天我們意識到,這是一次病毒式傳播的開始;到了第四天,我們明白這將改變世界。”
團隊起初低估了ChatGPT真正的吸引力——不僅僅是因為產(chǎn)品本身的創(chuàng)新,更是因為它以一種人人都能接觸到的界面,首次將AI的通用能力展現(xiàn)給大眾。而在更大的圖景里,ChatGPT的成功迫使OpenAI重新思考一個問題:我們對AI“有用性”的理解是否過于狹隘?
正如Mark Chen所指出的,“AI的有用性并非一個臨界點,它是一個廣闊的頻譜。沒有哪一刻突然變得‘有用’,而是逐步顯現(xiàn)出來。”正是這種與現(xiàn)實的頻繁互動,使OpenAI意識到,僅憑實驗室里的標(biāo)準(zhǔn)無法完全預(yù)測公眾的接受程度,市場的真實反饋遠比實驗室評估更加重要。
AI系統(tǒng)的推理能力究竟意味著什么?
在播客中,“推理”(reasoning)這個概念被反復(fù)提及。對OpenAI來說,“推理”不再僅是狹義的邏輯運算,而是更寬泛地指AI在處理復(fù)雜任務(wù)時展現(xiàn)出的深度思考和多步驟推導(dǎo)的能力。
Mark Chen特別指出,目前的AI模型在解決問題時表現(xiàn)出與人類類似的“回溯思考”和“假設(shè)驗證”的能力。比如,當(dāng)面對復(fù)雜的填字游戲,模型能自動推測多種答案,評估它們之間的邏輯關(guān)聯(lián),最終確定最合理的方案。這種高級推理的進步,使得AI在數(shù)學(xué)、物理、甚至是醫(yī)學(xué)等領(lǐng)域展現(xiàn)出了巨大的潛力。
播客中提到,AI的推理能力已經(jīng)悄然滲透進了科研領(lǐng)域的日常工作,甚至成為科學(xué)研究過程中的“子程序”。物理學(xué)家們開始借助GPT-4等模型解決繁瑣的數(shù)學(xué)推導(dǎo),顯著提高科研效率。未來,這一趨勢將更為明顯,AI將成為推動科研突破的重要助力。
Agentic編碼與多模態(tài)助手:下一步往哪里走?
伴隨推理能力的進步,AI也在向“自主式編碼”(Agentic Coding)邁進。“自主式編碼”的概念意味著模型將不再被動地等待用戶逐步提示,而是能夠主動規(guī)劃、思考,并在后臺完成復(fù)雜任務(wù)后返回結(jié)果。簡單來說,未來人們可能只需向AI提出一個較為模糊的需求,如“幫我實現(xiàn)一個新功能”,AI便可自主完成復(fù)雜的軟件開發(fā)工作,而無需持續(xù)的人類干預(yù)。
Mark Chen認為,未來代碼開發(fā)領(lǐng)域的模型將逐漸從快速的實時響應(yīng)轉(zhuǎn)向更復(fù)雜的異步任務(wù)處理,AI將花費更多的時間去深度推理并實現(xiàn)高質(zhì)量的結(jié)果。這種發(fā)展趨勢不僅限于代碼領(lǐng)域,同樣適用于更廣泛的知識工作,包括數(shù)據(jù)分析和客戶支持等多種企業(yè)場景。
同時,OpenAI也看到了多模態(tài)助手的重要性。Nick Turley提到,“無論是文本、圖片、還是聲音,每一種模態(tài)都會有一個突破性的時刻,改變?nèi)藗兣cAI交互的方式。”比如近期上線的Image Gen,再次掀起了一場類似ChatGPT的熱潮,讓更多非文字型用戶也能直觀地感受到AI的強大。未來,視頻生成、實時語音交互也將在不遠的將來迎來類似的爆發(fā)時刻。
從實驗室到真實世界:OpenAI的思考轉(zhuǎn)變
播客中反復(fù)強調(diào)了OpenAI內(nèi)部一種明顯的轉(zhuǎn)變——從謹(jǐn)慎保守走向積極探索。在初期,團隊對產(chǎn)品的安全性持有高度保守態(tài)度,例如在圖像生成人臉方面的嚴(yán)格限制。但隨著對技術(shù)的掌控力和對用戶需求的理解不斷提升,OpenAI意識到,任意限制某種能力可能意味著犧牲許多良性和有價值的應(yīng)用場景。
Nick Turley坦言,“我們過去傾向于過多地考慮‘最壞情況’,這種模式適用于一些嚴(yán)肅的安全問題,但如果將其泛化到所有產(chǎn)品功能,反而可能阻礙技術(shù)進步。”因此,OpenAI越來越傾向于采取自由開放的默認態(tài)度,并在發(fā)布后快速收集反饋、持續(xù)迭代,以更靈活、更有效的方式平衡創(chuàng)新和風(fēng)險。
回顧ChatGPT爆發(fā)式增長帶來的深刻反思,OpenAI也展現(xiàn)出了一種更為務(wù)實的技術(shù)哲學(xué):面對不確定性,最好的應(yīng)對辦法是主動與現(xiàn)實互動,而非固守于實驗室的假設(shè)之中。
正如Nick在播客中所言:“AI的進步從來不是線性的,而是不斷地在與現(xiàn)實互動中,發(fā)現(xiàn)新的價值與可能性。”
Landing AI
Landing AI是由動點科技策劃的一檔聚焦人工智能領(lǐng)域的專題報道欄目。通過對AI落地前景以及幕后故事的發(fā)掘,我們將在這一專題中深入淺出地探討關(guān)于AI新浪潮下的一切可能。
本文為動點科技記者原創(chuàng)文章,未經(jīng)授權(quán)不得轉(zhuǎn)載,如需轉(zhuǎn)載或開白請在后臺回復(fù)“轉(zhuǎn)載”。
- - - - - - - - END - - - - - - - -
*想要獲取行業(yè)資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群里更有不定期福利發(fā)放!
精彩好文值得推薦
一鍵轉(zhuǎn)發(fā),戳個在看
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.