- 01 OpenAI宣布推出“ChatGPT智能體”功能。該功能允許其AI聊天機(jī)器人使用一臺(tái)虛擬計(jì)算機(jī),為用戶自主地瀏覽網(wǎng)頁(yè)、進(jìn)行研究、下載文件以及創(chuàng)建如PPT或Excel等新文件。
- 02 該功能標(biāo)志著用戶與AI互動(dòng)方式從提問(wèn)轉(zhuǎn)向任務(wù)委托的范式轉(zhuǎn)變。它能大幅縮短工作耗時(shí),如將數(shù)小時(shí)的財(cái)務(wù)分析及報(bào)告制作縮短至三十分鐘內(nèi)。此舉也使OpenAI在某些方面與微軟形成直接競(jìng)爭(zhēng)。
- 03 此功能是OpenAI對(duì)過(guò)往產(chǎn)品的迭代,它融合了“Operator”和“深度研究”兩大智能體的優(yōu)勢(shì),以克服它們各自的局限性。
7月18日凌晨,OpenAI宣布推出“ChatGPT智能體”功能,該功能允許其AI聊天機(jī)器人使用自己的虛擬計(jì)算機(jī),自主地為人類用戶瀏覽網(wǎng)頁(yè)、進(jìn)行廣泛研究、下載和創(chuàng)建新文件。
簡(jiǎn)而言之,ChatGPT現(xiàn)在擁有了“自己的個(gè)人電腦”,并且可以利用這臺(tái)虛擬計(jì)算機(jī)登錄用戶的賬戶,以下載或發(fā)送內(nèi)容。OpenAI解釋道:“至少在虛擬層面上,AI模型可以選擇使用文本瀏覽器或視覺(jué)瀏覽器打開(kāi)網(wǎng)頁(yè),下載文件,通過(guò)終端運(yùn)行命令進(jìn)行處理,并通過(guò)視覺(jué)瀏覽器查看輸出結(jié)果。模型會(huì)根據(jù)任務(wù)來(lái)自適應(yīng)地調(diào)整策略,以快速、精準(zhǔn)和高效地完成任務(wù)。”
深度集成第三方服務(wù),提升用戶體驗(yàn)
用戶可以通過(guò)點(diǎn)擊ChatGPT提示輸入框中的“工具”按鈕,打開(kāi)下拉菜單,并從可用選項(xiàng)中選擇“智能體模式”來(lái)啟用該智能體。
開(kāi)啟后,用戶只需要用自然語(yǔ)言描述任務(wù),智能體便能跨越網(wǎng)頁(yè)和本地應(yīng)用環(huán)境執(zhí)行相關(guān)操作。這使得推理能力與以往需要人工手動(dòng)完成的操作相結(jié)合,用戶無(wú)需親自處理繁瑣事務(wù)。
ChatGPT智能體能夠連接到個(gè)人或企業(yè)Gmail、GitHub等應(yīng)用,幫助用戶提取有用信息(如電子郵件或代碼),并完成指定任務(wù)。它還可以通過(guò)已連接的第三方應(yīng)用程序接口(API)獲取信息并利用相關(guān)服務(wù)。
如果網(wǎng)站需要登錄,用戶可以通過(guò)一種安全的瀏覽器視圖完成此操作,從而使智能體能夠執(zhí)行更深入的任務(wù),如檢查收件箱或代為填寫表單。
據(jù)OpenAI的ChatGPT智能體產(chǎn)品負(fù)責(zé)人尼爾·阿加拉普(Neel Ajjarapu)指出:“我們的模型在基礎(chǔ)財(cái)務(wù)分析任務(wù)中表現(xiàn)尤為出色。這類工作通常需要初級(jí)員工熬夜完成,特別是當(dāng)遇到上司臨時(shí)下達(dá)的緊急任務(wù)時(shí)。”
簡(jiǎn)單易用,突破“Operator”局限
新的ChatGPT智能體是在OpenAI于2025年1月推出的“Operator”智能體的基礎(chǔ)上進(jìn)行改進(jìn)和擴(kuò)展的。Operator智能體曾允許ChatGPT瀏覽網(wǎng)頁(yè)、填寫表單、下訂單等,然而,Operator僅限于與網(wǎng)站和基于Web的應(yīng)用程序進(jìn)行交互,而不能與那些也可以在個(gè)人電腦上本地運(yùn)行的程序(如Excel或PPT制作軟件)進(jìn)行交互。
現(xiàn)在,ChatGPT智能體不但可以瀏覽網(wǎng)站、與在線表單交互,還能運(yùn)行代碼、分析數(shù)據(jù),并根據(jù)用戶的指示生成最終的輸出文件,如可編輯的PPT或Excel——這一切都能通過(guò)簡(jiǎn)單的指令完成。
融合“Operator”和“深度研究”優(yōu)勢(shì)
事實(shí)上,ChatGPT智能體結(jié)合了OpenAI之前發(fā)布的“Operator”和“深度研究”兩大智能體的優(yōu)點(diǎn)。“深度研究”于2025年2月推出,能夠通過(guò)其專有的無(wú)頭文本瀏覽器進(jìn)行深入的網(wǎng)絡(luò)搜索,并編寫詳細(xì)報(bào)告。
OpenAI在其博客中指出:“Operator無(wú)法進(jìn)行深度分析或撰寫詳細(xì)報(bào)告,而‘深度研究’則不能與網(wǎng)站交互以細(xì)化結(jié)果或訪問(wèn)需要身份驗(yàn)證的內(nèi)容。實(shí)際上,我們發(fā)現(xiàn),很多通過(guò)Operator提出的查詢,其實(shí)更適合用‘深度研究’來(lái)處理,因此我們將兩者的優(yōu)勢(shì)融為一體。”
原有的Operator工具將被淘汰,但用戶仍可以通過(guò)ChatGPT界面的下拉菜單訪問(wèn)“深度研究”功能。
一套系統(tǒng),多種工具,全面支持各類應(yīng)用
無(wú)論是使用視覺(jué)瀏覽器瀏覽網(wǎng)站,還是通過(guò)終端運(yùn)行Python代碼,ChatGPT智能體都可以在同一會(huì)話中無(wú)縫切換不同工具。它支持各種應(yīng)用場(chǎng)景,包括競(jìng)爭(zhēng)分析、報(bào)告生成、旅行規(guī)劃、郵件摘要及預(yù)約管理等。
用戶可以隨時(shí)中斷、重定向或暫停任務(wù),智能體會(huì)從中斷的地方繼續(xù)執(zhí)行操作。
從今天開(kāi)始,ChatGPT每月200美元“Pro”級(jí)別的訂閱者將可以完全訪問(wèn)ChatGPT智能體,每月配額為400條消息。
“ChatGPT Plus”(每月20美元)和“Team”(每月30美元)的用戶將在接下來(lái)的幾天內(nèi)獲得訪問(wèn)權(quán)限,每月配額40條消息。企業(yè)版和教育版用戶則需等待幾周時(shí)間。此功能目前尚未在歐洲和瑞士推出。
強(qiáng)化安全與控制,確保用戶安全
鑒于ChatGPT智能體現(xiàn)在能夠代表用戶執(zhí)行操作,包括在已登錄的網(wǎng)站或已連接的應(yīng)用上進(jìn)行操作,OpenAI特別加強(qiáng)了安全保護(hù)措施。
這些安全措施包括:在執(zhí)行操作之前要求用戶確認(rèn)、對(duì)敏感任務(wù)進(jìn)行主動(dòng)監(jiān)督,以及設(shè)置技術(shù)性保障以限制意外行為的發(fā)生。
關(guān)鍵的安全保護(hù)措施包括:
- 在提交表單或發(fā)送電子郵件等操作之前,要求用戶進(jìn)行確認(rèn)。
- 在用戶處于非活動(dòng)狀態(tài)時(shí)暫停執(zhí)行任務(wù)(“觀察模式”)。
- 拒絕執(zhí)行高風(fēng)險(xiǎn)任務(wù),如金融轉(zhuǎn)賬或侵犯隱私等行為。
- 會(huì)話期間不會(huì)保留記憶。
加強(qiáng)對(duì)高風(fēng)險(xiǎn)領(lǐng)域的保護(hù),確保用戶隱私和數(shù)據(jù)安全
根據(jù)OpenAI的《準(zhǔn)備框架》,ChatGPT智能體被歸類為生物與化學(xué)領(lǐng)域中的“高能力系統(tǒng)”。雖然目前沒(méi)有直接證據(jù)表明它會(huì)被濫用,但OpenAI依然激活了最強(qiáng)的安全保護(hù)措施,以防萬(wàn)一。
這些措施包括增強(qiáng)的拒絕訓(xùn)練、由生物安全專家進(jìn)行的“紅隊(duì)”測(cè)試以及改進(jìn)的檢測(cè)系統(tǒng)。
此前,OpenAI的勁敵Anthropic發(fā)布的Claude Opus 4等模型的資料,以及其他關(guān)于先進(jìn)AI模型的調(diào)查顯示,當(dāng)AI系統(tǒng)獲得訪問(wèn)外部工具和應(yīng)用(如電子郵件)的權(quán)限時(shí),在某些情況下,它們可能會(huì)采取其自認(rèn)為道德和合乎倫理的行動(dòng),但實(shí)際上可能會(huì)危及用戶的隱私、安全和專有信息。例如,它可能會(huì)向政府機(jī)構(gòu)或記者發(fā)送電子郵件,舉報(bào)用戶涉嫌的不當(dāng)行為。
模型認(rèn)為自己像一個(gè)“告密者”一樣行事,但實(shí)際上,可能會(huì)損害用戶的隱私、安全和專有信息,并向當(dāng)局報(bào)告不存在的不當(dāng)行為,或者只是可疑的行為。
簡(jiǎn)化工作流程,或與微軟直接競(jìng)爭(zhēng)
ChatGPT智能體能夠創(chuàng)建PPT演示文稿和詳細(xì)的Excel草稿,之后用戶可以使用Microsoft Office或其他兼容軟件對(duì)其進(jìn)行編輯。OpenAI指出,相較于其他功能,這一功能更具創(chuàng)新性,有助于大幅減少用戶在制作PPT和分析報(bào)告時(shí)所需的時(shí)間,將通常需要幾個(gè)小時(shí)或幾天的工作縮短到三十分鐘內(nèi)。
盡管如此,ChatGPT智能體功能使OpenAI在某種程度上直接與商業(yè)軟件巨頭微軟展開(kāi)競(jìng)爭(zhēng),這可能加劇兩家公司之間的緊張關(guān)系,畢竟雙方的競(jìng)爭(zhēng)已逐漸升溫。
微軟也推出了類似的AI智能體,幫助用戶創(chuàng)建和編輯PPT演示文稿和Excel電子表格。其他公司也推出了旨在簡(jiǎn)化PPT和報(bào)告制作過(guò)程的AI智能體。
OpenAI表示,ChatGPT智能體暫不支持谷歌的Slides和Sheets,二者是谷歌與微軟Excel和PPT競(jìng)爭(zhēng)的產(chǎn)品。
實(shí)測(cè)性能亮眼,但仍存局限
ChatGPT智能體不僅在理論上表現(xiàn)出色,在實(shí)際測(cè)試中也達(dá)到了很高的水平。在“人類終極考試”中,它通過(guò)并行部署方法取得了44.4的高分;在“FrontierMath”基準(zhǔn)測(cè)試中,準(zhǔn)確率達(dá)到了27.4%。
在“SpreadsheetBench”基準(zhǔn)測(cè)試中,ChatGPT智能體得分為45.5%,是Excel中Copilot性能的兩倍多。
目前,ChatGPT智能體的部分功能(如幻燈片生成)仍在測(cè)試階段,可能在格式上存在一定差異,或者在應(yīng)用內(nèi)預(yù)覽和導(dǎo)出文件之間有所不同。OpenAI正在積極訓(xùn)練其下一代版本,以提高該功能的完善度和布局。
ChatGPT智能體的推出,標(biāo)志著用戶與AI互動(dòng)方式的一次范式轉(zhuǎn)變——從單純提問(wèn)到全權(quán)任務(wù)委托。
憑借其強(qiáng)大的推理、執(zhí)行和交付成果的能力,OpenAI相信,用戶越來(lái)越希望AI不僅僅是一個(gè)輔助工具,而是一個(gè)能夠?yàn)槠涔ぷ鳌椭鉀Q實(shí)際問(wèn)題的助手。雖然這一智能體功能仍在不斷發(fā)展中,但OpenAI將此次發(fā)布視為構(gòu)建未來(lái)互動(dòng)性更強(qiáng)、更注重行動(dòng)的AI的基礎(chǔ)。(小小)