- 01 OpenAI宣布推出“ChatGPT智能體”功能。該功能允許其AI聊天機器人使用一臺虛擬計算機,為用戶自主地瀏覽網頁、進行研究、下載文件以及創建如PPT或Excel等新文件。
- 02 該功能標志著用戶與AI互動方式從提問轉向任務委托的范式轉變。它能大幅縮短工作耗時,如將數小時的財務分析及報告制作縮短至三十分鐘內。此舉也使OpenAI在某些方面與微軟形成直接競爭。
- 03 此功能是OpenAI對過往產品的迭代,它融合了“Operator”和“深度研究”兩大智能體的優勢,以克服它們各自的局限性。
7月18日凌晨,OpenAI宣布推出“ChatGPT智能體”功能,該功能允許其AI聊天機器人使用自己的虛擬計算機,自主地為人類用戶瀏覽網頁、進行廣泛研究、下載和創建新文件。
簡而言之,ChatGPT現在擁有了“自己的個人電腦”,并且可以利用這臺虛擬計算機登錄用戶的賬戶,以下載或發送內容。OpenAI解釋道:“至少在虛擬層面上,AI模型可以選擇使用文本瀏覽器或視覺瀏覽器打開網頁,下載文件,通過終端運行命令進行處理,并通過視覺瀏覽器查看輸出結果。模型會根據任務來自適應地調整策略,以快速、精準和高效地完成任務?!?/p>
深度集成第三方服務,提升用戶體驗
用戶可以通過點擊ChatGPT提示輸入框中的“工具”按鈕,打開下拉菜單,并從可用選項中選擇“智能體模式”來啟用該智能體。
開啟后,用戶只需要用自然語言描述任務,智能體便能跨越網頁和本地應用環境執行相關操作。這使得推理能力與以往需要人工手動完成的操作相結合,用戶無需親自處理繁瑣事務。
ChatGPT智能體能夠連接到個人或企業Gmail、GitHub等應用,幫助用戶提取有用信息(如電子郵件或代碼),并完成指定任務。它還可以通過已連接的第三方應用程序接口(API)獲取信息并利用相關服務。
如果網站需要登錄,用戶可以通過一種安全的瀏覽器視圖完成此操作,從而使智能體能夠執行更深入的任務,如檢查收件箱或代為填寫表單。
據OpenAI的ChatGPT智能體產品負責人尼爾·阿加拉普(Neel Ajjarapu)指出:“我們的模型在基礎財務分析任務中表現尤為出色。這類工作通常需要初級員工熬夜完成,特別是當遇到上司臨時下達的緊急任務時?!?/p>
簡單易用,突破“Operator”局限
新的ChatGPT智能體是在OpenAI于2025年1月推出的“Operator”智能體的基礎上進行改進和擴展的。Operator智能體曾允許ChatGPT瀏覽網頁、填寫表單、下訂單等,然而,Operator僅限于與網站和基于Web的應用程序進行交互,而不能與那些也可以在個人電腦上本地運行的程序(如Excel或PPT制作軟件)進行交互。
現在,ChatGPT智能體不但可以瀏覽網站、與在線表單交互,還能運行代碼、分析數據,并根據用戶的指示生成最終的輸出文件,如可編輯的PPT或Excel——這一切都能通過簡單的指令完成。
融合“Operator”和“深度研究”優勢
事實上,ChatGPT智能體結合了OpenAI之前發布的“Operator”和“深度研究”兩大智能體的優點。“深度研究”于2025年2月推出,能夠通過其專有的無頭文本瀏覽器進行深入的網絡搜索,并編寫詳細報告。
OpenAI在其博客中指出:“Operator無法進行深度分析或撰寫詳細報告,而‘深度研究’則不能與網站交互以細化結果或訪問需要身份驗證的內容。實際上,我們發現,很多通過Operator提出的查詢,其實更適合用‘深度研究’來處理,因此我們將兩者的優勢融為一體。”
原有的Operator工具將被淘汰,但用戶仍可以通過ChatGPT界面的下拉菜單訪問“深度研究”功能。
一套系統,多種工具,全面支持各類應用
無論是使用視覺瀏覽器瀏覽網站,還是通過終端運行Python代碼,ChatGPT智能體都可以在同一會話中無縫切換不同工具。它支持各種應用場景,包括競爭分析、報告生成、旅行規劃、郵件摘要及預約管理等。
用戶可以隨時中斷、重定向或暫停任務,智能體會從中斷的地方繼續執行操作。
從今天開始,ChatGPT每月200美元“Pro”級別的訂閱者將可以完全訪問ChatGPT智能體,每月配額為400條消息。
“ChatGPT Plus”(每月20美元)和“Team”(每月30美元)的用戶將在接下來的幾天內獲得訪問權限,每月配額40條消息。企業版和教育版用戶則需等待幾周時間。此功能目前尚未在歐洲和瑞士推出。
強化安全與控制,確保用戶安全
鑒于ChatGPT智能體現在能夠代表用戶執行操作,包括在已登錄的網站或已連接的應用上進行操作,OpenAI特別加強了安全保護措施。
這些安全措施包括:在執行操作之前要求用戶確認、對敏感任務進行主動監督,以及設置技術性保障以限制意外行為的發生。
關鍵的安全保護措施包括:
- 在提交表單或發送電子郵件等操作之前,要求用戶進行確認。
- 在用戶處于非活動狀態時暫停執行任務(“觀察模式”)。
- 拒絕執行高風險任務,如金融轉賬或侵犯隱私等行為。
- 會話期間不會保留記憶。
加強對高風險領域的保護,確保用戶隱私和數據安全
根據OpenAI的《準備框架》,ChatGPT智能體被歸類為生物與化學領域中的“高能力系統”。雖然目前沒有直接證據表明它會被濫用,但OpenAI依然激活了最強的安全保護措施,以防萬一。
這些措施包括增強的拒絕訓練、由生物安全專家進行的“紅隊”測試以及改進的檢測系統。
此前,OpenAI的勁敵Anthropic發布的Claude Opus 4等模型的資料,以及其他關于先進AI模型的調查顯示,當AI系統獲得訪問外部工具和應用(如電子郵件)的權限時,在某些情況下,它們可能會采取其自認為道德和合乎倫理的行動,但實際上可能會危及用戶的隱私、安全和專有信息。例如,它可能會向政府機構或記者發送電子郵件,舉報用戶涉嫌的不當行為。
模型認為自己像一個“告密者”一樣行事,但實際上,可能會損害用戶的隱私、安全和專有信息,并向當局報告不存在的不當行為,或者只是可疑的行為。
簡化工作流程,或與微軟直接競爭
ChatGPT智能體能夠創建PPT演示文稿和詳細的Excel草稿,之后用戶可以使用Microsoft Office或其他兼容軟件對其進行編輯。OpenAI指出,相較于其他功能,這一功能更具創新性,有助于大幅減少用戶在制作PPT和分析報告時所需的時間,將通常需要幾個小時或幾天的工作縮短到三十分鐘內。
盡管如此,ChatGPT智能體功能使OpenAI在某種程度上直接與商業軟件巨頭微軟展開競爭,這可能加劇兩家公司之間的緊張關系,畢竟雙方的競爭已逐漸升溫。
微軟也推出了類似的AI智能體,幫助用戶創建和編輯PPT演示文稿和Excel電子表格。其他公司也推出了旨在簡化PPT和報告制作過程的AI智能體。
OpenAI表示,ChatGPT智能體暫不支持谷歌的Slides和Sheets,二者是谷歌與微軟Excel和PPT競爭的產品。
實測性能亮眼,但仍存局限
ChatGPT智能體不僅在理論上表現出色,在實際測試中也達到了很高的水平。在“人類終極考試”中,它通過并行部署方法取得了44.4的高分;在“FrontierMath”基準測試中,準確率達到了27.4%。
在“SpreadsheetBench”基準測試中,ChatGPT智能體得分為45.5%,是Excel中Copilot性能的兩倍多。
目前,ChatGPT智能體的部分功能(如幻燈片生成)仍在測試階段,可能在格式上存在一定差異,或者在應用內預覽和導出文件之間有所不同。OpenAI正在積極訓練其下一代版本,以提高該功能的完善度和布局。
ChatGPT智能體的推出,標志著用戶與AI互動方式的一次范式轉變——從單純提問到全權任務委托。
憑借其強大的推理、執行和交付成果的能力,OpenAI相信,用戶越來越希望AI不僅僅是一個輔助工具,而是一個能夠為其工作、幫助解決實際問題的助手。雖然這一智能體功能仍在不斷發展中,但OpenAI將此次發布視為構建未來互動性更強、更注重行動的AI的基礎。(小?。?/p>