網易首頁 > 網易科技 > IT業界 > 正文

OpenAI深夜發布"超級智能體"，AI"打工人"時代降臨！

2025-07-18 07:37:00　來源: 網易科技報道

北京舉報

分享至

核心提示

01 OpenAI宣布推出“ChatGPT智能體”功能。該功能允許其AI聊天機器人使用一臺虛擬計算機，為用戶自主地瀏覽網頁、進行研究、下載文件以及創建如PPT或Excel等新文件。
02 該功能標志著用戶與AI互動方式從提問轉向任務委托的范式轉變。它能大幅縮短工作耗時，如將數小時的財務分析及報告制作縮短至三十分鐘內。此舉也使OpenAI在某些方面與微軟形成直接競爭。
03 此功能是OpenAI對過往產品的迭代，它融合了“Operator”和“深度研究”兩大智能體的優勢，以克服它們各自的局限性。

7月18日凌晨，OpenAI宣布推出“ChatGPT智能體”功能，該功能允許其AI聊天機器人使用自己的虛擬計算機，自主地為人類用戶瀏覽網頁、進行廣泛研究、下載和創建新文件。

OpenAI深夜發布"超級智能體" （來源：網易科技報道）

簡而言之，ChatGPT現在擁有了“自己的個人電腦”，并且可以利用這臺虛擬計算機登錄用戶的賬戶，以下載或發送內容。OpenAI解釋道：“至少在虛擬層面上，AI模型可以選擇使用文本瀏覽器或視覺瀏覽器打開網頁，下載文件，通過終端運行命令進行處理，并通過視覺瀏覽器查看輸出結果。模型會根據任務來自適應地調整策略，以快速、精準和高效地完成任務?！?/p>

深度集成第三方服務，提升用戶體驗

用戶可以通過點擊ChatGPT提示輸入框中的“工具”按鈕，打開下拉菜單，并從可用選項中選擇“智能體模式”來啟用該智能體。

開啟后，用戶只需要用自然語言描述任務，智能體便能跨越網頁和本地應用環境執行相關操作。這使得推理能力與以往需要人工手動完成的操作相結合，用戶無需親自處理繁瑣事務。

ChatGPT智能體能夠連接到個人或企業Gmail、GitHub等應用，幫助用戶提取有用信息（如電子郵件或代碼），并完成指定任務。它還可以通過已連接的第三方應用程序接口（API）獲取信息并利用相關服務。

如果網站需要登錄，用戶可以通過一種安全的瀏覽器視圖完成此操作，從而使智能體能夠執行更深入的任務，如檢查收件箱或代為填寫表單。

據OpenAI的ChatGPT智能體產品負責人尼爾·阿加拉普（Neel Ajjarapu）指出：“我們的模型在基礎財務分析任務中表現尤為出色。這類工作通常需要初級員工熬夜完成，特別是當遇到上司臨時下達的緊急任務時?！?/p>

簡單易用，突破“Operator”局限

新的ChatGPT智能體是在OpenAI于2025年1月推出的“Operator”智能體的基礎上進行改進和擴展的。Operator智能體曾允許ChatGPT瀏覽網頁、填寫表單、下訂單等，然而，Operator僅限于與網站和基于Web的應用程序進行交互，而不能與那些也可以在個人電腦上本地運行的程序（如Excel或PPT制作軟件）進行交互。

現在，ChatGPT智能體不但可以瀏覽網站、與在線表單交互，還能運行代碼、分析數據，并根據用戶的指示生成最終的輸出文件，如可編輯的PPT或Excel——這一切都能通過簡單的指令完成。

融合“Operator”和“深度研究”優勢

事實上，ChatGPT智能體結合了OpenAI之前發布的“Operator”和“深度研究”兩大智能體的優點。“深度研究”于2025年2月推出，能夠通過其專有的無頭文本瀏覽器進行深入的網絡搜索，并編寫詳細報告。

OpenAI在其博客中指出：“Operator無法進行深度分析或撰寫詳細報告，而‘深度研究’則不能與網站交互以細化結果或訪問需要身份驗證的內容。實際上，我們發現，很多通過Operator提出的查詢，其實更適合用‘深度研究’來處理，因此我們將兩者的優勢融為一體。”

原有的Operator工具將被淘汰，但用戶仍可以通過ChatGPT界面的下拉菜單訪問“深度研究”功能。

一套系統，多種工具，全面支持各類應用

無論是使用視覺瀏覽器瀏覽網站，還是通過終端運行Python代碼，ChatGPT智能體都可以在同一會話中無縫切換不同工具。它支持各種應用場景，包括競爭分析、報告生成、旅行規劃、郵件摘要及預約管理等。

用戶可以隨時中斷、重定向或暫停任務，智能體會從中斷的地方繼續執行操作。

從今天開始，ChatGPT每月200美元“Pro”級別的訂閱者將可以完全訪問ChatGPT智能體，每月配額為400條消息。

“ChatGPT Plus”（每月20美元）和“Team”（每月30美元）的用戶將在接下來的幾天內獲得訪問權限，每月配額40條消息。企業版和教育版用戶則需等待幾周時間。此功能目前尚未在歐洲和瑞士推出。

強化安全與控制，確保用戶安全

鑒于ChatGPT智能體現在能夠代表用戶執行操作，包括在已登錄的網站或已連接的應用上進行操作，OpenAI特別加強了安全保護措施。

這些安全措施包括：在執行操作之前要求用戶確認、對敏感任務進行主動監督，以及設置技術性保障以限制意外行為的發生。

關鍵的安全保護措施包括：

在提交表單或發送電子郵件等操作之前，要求用戶進行確認。
在用戶處于非活動狀態時暫停執行任務（“觀察模式”）。
拒絕執行高風險任務，如金融轉賬或侵犯隱私等行為。
會話期間不會保留記憶。

加強對高風險領域的保護，確保用戶隱私和數據安全

根據OpenAI的《準備框架》，ChatGPT智能體被歸類為生物與化學領域中的“高能力系統”。雖然目前沒有直接證據表明它會被濫用，但OpenAI依然激活了最強的安全保護措施，以防萬一。

這些措施包括增強的拒絕訓練、由生物安全專家進行的“紅隊”測試以及改進的檢測系統。

此前，OpenAI的勁敵Anthropic發布的Claude Opus 4等模型的資料，以及其他關于先進AI模型的調查顯示，當AI系統獲得訪問外部工具和應用（如電子郵件）的權限時，在某些情況下，它們可能會采取其自認為道德和合乎倫理的行動，但實際上可能會危及用戶的隱私、安全和專有信息。例如，它可能會向政府機構或記者發送電子郵件，舉報用戶涉嫌的不當行為。

模型認為自己像一個“告密者”一樣行事，但實際上，可能會損害用戶的隱私、安全和專有信息，并向當局報告不存在的不當行為，或者只是可疑的行為。

簡化工作流程，或與微軟直接競爭

ChatGPT智能體能夠創建PPT演示文稿和詳細的Excel草稿，之后用戶可以使用Microsoft Office或其他兼容軟件對其進行編輯。OpenAI指出，相較于其他功能，這一功能更具創新性，有助于大幅減少用戶在制作PPT和分析報告時所需的時間，將通常需要幾個小時或幾天的工作縮短到三十分鐘內。

盡管如此，ChatGPT智能體功能使OpenAI在某種程度上直接與商業軟件巨頭微軟展開競爭，這可能加劇兩家公司之間的緊張關系，畢竟雙方的競爭已逐漸升溫。

微軟也推出了類似的AI智能體，幫助用戶創建和編輯PPT演示文稿和Excel電子表格。其他公司也推出了旨在簡化PPT和報告制作過程的AI智能體。

OpenAI表示，ChatGPT智能體暫不支持谷歌的Slides和Sheets，二者是谷歌與微軟Excel和PPT競爭的產品。

實測性能亮眼，但仍存局限

ChatGPT智能體不僅在理論上表現出色，在實際測試中也達到了很高的水平。在“人類終極考試”中，它通過并行部署方法取得了44.4的高分；在“FrontierMath”基準測試中，準確率達到了27.4%。

在“SpreadsheetBench”基準測試中，ChatGPT智能體得分為45.5%，是Excel中Copilot性能的兩倍多。

目前，ChatGPT智能體的部分功能（如幻燈片生成）仍在測試階段，可能在格式上存在一定差異，或者在應用內預覽和導出文件之間有所不同。OpenAI正在積極訓練其下一代版本，以提高該功能的完善度和布局。

ChatGPT智能體的推出，標志著用戶與AI互動方式的一次范式轉變——從單純提問到全權任務委托。

憑借其強大的推理、執行和交付成果的能力，OpenAI相信，用戶越來越希望AI不僅僅是一個輔助工具，而是一個能夠為其工作、幫助解決實際問題的助手。雖然這一智能體功能仍在不斷發展中，但OpenAI將此次發布視為構建未來互動性更強、更注重行動的AI的基礎。（小?。?/p>