網易首頁 > 網易號 > 正文申請入駐

剛剛，OpenAI 發布 ChatGPT 版 Manus！奧特曼：感受 AGI 時刻

2025-07-18 05:35:20　來源: 愛范兒

廣東舉報

分享至

過去大半年，Agent（智能體）是 AI 行業最常被提及的概念之一。

幾乎所有廠商都在講 Agent，概念不缺，demo 也不少，但真正做到產品級落地，始終缺一套完整的執行系統——既能理解復雜目標，又能調用多種工具串聯任務流程，還要隨時支持任務中斷、修改與恢復，真正貼合用戶工作流。

就在剛剛，OpenAI 正式發布 ChatGPT Agent 功能。

通過整合 Operator + Deep Research + ChatGPT 本體，用戶只需描述任務，ChatGPT Agent 就能自主判斷所需工具，自動訪問網頁、提取信息、運行代碼、生成幻燈片或表格等，并可在執行過程中實時展示步驟、接受中斷和修改指令。

發布會結束后，OpenAI CEO Sam Altman 在社交媒體上寫道：：

觀看 ChatGPT Agent 使用計算機完成復雜任務，對我來說是一個真正的「感受 AGI」時刻；看到計算機思考、計劃和執行，有種與眾不同的感覺。

亮點如下：

ChatGPT Agent 將 Operator、Deep Research 與 ChatGPT 本體三合一，構建了一個統一智能體系統。
內置圖形/文本瀏覽器、終端和 API 調用器等工具，支持手機端使用，任務完成后可自動推送結果；
可連接 Gmail、GitHub 等第三方應用，深度嵌入用戶真實工作流；
在多項基準測試中表現領先，綜合性能位居行業前列；
Pro 用戶每月享有 400 條調用額度，其他付費用戶為 40 條，并支持按需擴展配額。

ChatGPT Agent 正式上線，能購物，能寫 PPT，你的瀏覽器要被 AI 接管了

今天開始，你可以在任何對話中，通過聊天界面左下角的「工具」下拉菜單，選擇「Agent 模式」來啟用這一功能。

只需描述你想完成的任務，ChatGPT 能夠智能地瀏覽網站、篩選結果、在需要時安全提示你登錄、運行代碼、執行分析，甚至輸出可編輯的幻燈片和電子表格，總結任務結果。

整個執行過程是可視的——操作步驟會實時顯示在屏幕上，用戶可以隨時中斷、修改指令，甚至手動「接管瀏覽器」繼續操作，確保任務始終符合你的目標和需求。

在今天凌晨的演示中，OpenAI 展示了 ChatGPT Agent 在真實場景中的應用能力。

比如，為即將出席的婚禮做準備，一直是個難題?，F在只需發出請求，ChatGPT Agent 迅速搭建虛擬環境，自主判斷應調用瀏覽器、文本解析器還是終端，并開始依次調取婚禮日期、查詢場地天氣、推薦西裝搭配、篩選酒店。在這個過程中，模型可以與 OpenAI 研究員進行互動，并在適當節點請求確認需求。

更重要的是，用戶可以隨時中斷任務。

比如當 Agent 在推薦西裝過程中，OpenAI 研究員臨時插入了「幫我找一雙 9.5 碼黑色正裝鞋」的請求，模型立刻暫停當前任務，轉而處理新需求。

同樣地，當智能體認為有必要時，也會主動向你請求更多信息，確保任務始終與你的目標保持一致。如果任務超出預期時間或出現卡頓，你可以選擇暫停任務、請求進度摘要，或直接終止任務并獲取已有的部分結果。

「這種可打斷、可多輪對話的機制，是我們這次訓練模型的重點之一，」OpenAI 研究員解釋道。

這一能力背后，是 ChatGPT Agent 對三大系統的統一整合：Operator 提供網頁交互能力，支持自動滾動、點擊、填表；Deep Research 擅長信息整合與分析；ChatGPT 本體則負責自然語言理解與智能推理。

ChatGPT Agent 是通過強化學習在復雜的任務中訓練出來的，過去三者各有短板——前者難以深入分析，后者無法操作網頁，而 Agent 將三者優勢整合為一體，并輔以瀏覽器、終端、API 調用器等工具，形成一個完整的執行系統。

用戶不僅可以在桌面端啟動 Agent 模式，在手機端也同樣適用。

任務完成后還將自動推送結果通知。在第二個演示任務中，OpenAI 研究員在 ChatGPT App 上傳了團隊吉祥物 Bernie Doodle 的貼紙圖案，Agent 自動調用圖像生成 API 設計貼紙樣式，通過瀏覽器訪問電商平臺完成比價、樣式選擇、購物車添加，最終整理出定制貼紙的下單明細。

當然，為確保流程安全、靈活且清晰可控，面對涉及金額的支付環節，則只會由用戶手動接管瀏覽器完成。

通過連接器，用戶還可將 Gmail、GitHub 等日常應用接入 ChatGPT，讓模型讀取郵件、日歷或代碼庫等上下文內容，并執行諸如總結今天的郵箱內容或查找下周空閑會議時間等任務。

一個更典型的應用場景是，OpenAI 研究員能夠讓 ChatGPT Agent 匯總自己在多項基準測試中的表現，并制作成幻燈片。收到命令后，Agent 會調用 Google Drive 連接器讀取數據文件，用終端編寫代碼繪制圖表，并生成完整的 PPT。

這類自動化能力，都是 Agent 深度嵌入工作流的體現。

不過，可以看到，ChatGPT Agent 生成的 PPT 在設計審美方面表現比較一般，并且，雖然可以上傳電子表格供 ChatGPT 編輯或作為模板使用，但生成的 PPT 暫不支持二次修改。

需要說明的是，OpenAI 并不是讓 Agent 像人一樣打開 PPT或 Excel 文件，通過點擊來插入文本框和公式，而是直接生成代碼來創建文檔。這種做法的好處是可以利用模型在代碼編寫方面的天然優勢，避免因模擬點擊操作帶來的效率低下或出錯，也降低了對計算資源的消耗。

The Information 報道指出，如果 ChatGPT 要直接編輯 PPT 或 Excel 文件，就需要啟動一臺「虛擬機」（即通過 ChatGPT 運行的虛擬計算機環境），這會占用更多計算資源。

而直接生成代碼則更輕量、高效。盡管潛力巨大，但就目前來看，這一功能短期內很難對微軟的 Office 或者 Google Workspace 造成沖擊。

對于 ChatGPT Agent 功能，Pro 用戶將在今天之內獲得訪問權限；Plus 與 Team 用戶將在接下來的幾天內陸續開放；企業版（Enterprise）和教育版（Education）將在未來幾周內上線

Pro 用戶每月可使用 400 條消息，其他付費用戶每月可使用 40 條消息，并可通過彈性積分方案購買更多額度。

全線刷新「跑分」記錄，Agent 戰場迎來最強對手

ChatGPT Agent 能力的提升，也體現在「跑分」環節。

在評估 AI 解決跨學科專家級問題的基準測試 Humanity’s Last Exam（HLE）中，搭載智能體的 ChatGPT 模型以 41.6 的 pass@1 得分刷新紀錄。在啟用并行執行策略后，該得分進一步提升至 44.4。

在目前被認為最具挑戰性的數學基準 FrontierMath 中，面對難度極高、從未公開的題目，ChatGPT Agent 在具備終端代碼執行能力的前提下，取得了 27.4% 的準確率，遠高于此前模型。

在這一復雜且高經濟價值的知識型工作任務的內部基準測試中，ChatGPT Agent 在約一半的任務中輸出質量已達到甚至超過人類水平，表現也顯著優于 o3 和 o4-mini 模型。

在一個內部的投行建模任務基準中，ChatGPT 智能體的表現也顯著優于 Deep Research 和 o3 模型。每個任務都基于數百項關于公式正確性、格式規范等評分標準進行評估。

此外，在公開評估模型信息查找能力的 BrowseComp 基準上，Agent 以 68.9% 的準確率刷新記錄，較 Deep Research 高出 17.4 個百分點。在 WebArena 評估中，其網頁任務執行能力也優于基于 o3 的 CUA 模型。

從平臺視角看，Agent 能力的底層接口，正是瀏覽器。

在 Perplexity AI CEO Aravind Srinivas 最近的采訪中，他表示瀏覽器將會是 AI 的「殺手級應用」。在他看來，瀏覽器天然具備讓 AI 真正「動起來」的全部條件。

不同于傳統聊天機器人，AI Agent 的理想形態不是停留在對話框中生成文本，而是具備實際行動力——從訪問網頁、提取信息、填寫表單，到執行跨平臺操作。而這一切，瀏覽器恰好具備所需的操作權限和上下文獲取能力。

瀏覽器可以直接讀取頁面、模擬點擊、自動執行任務，幾乎無需額外授權。

在這個過程中，用戶與 AI 共處于同一個交互空間：AI 可以自動執行任務，用戶也能隨時中斷或接管，避免黑盒操作帶來的不確定性。這種可控性與透明度，是當前許多上下文協議仍難實現的能力。

如今，隨著 ChatGPT Agent 能力正式上線，所有聲稱要做 Agent 的廠商，恐怕都要重新審視自己的產品路徑。

當 ChatGPT 從語言交互工具，轉向具備協作、調度與承接任務能力的執行系統，開始接入用戶的真實工作流，Agent 的可用性門檻，也在此刻被實質性地拉高。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

浙大校友打造AI代碼測試神器，零代碼零bug，30分鐘創建網站

量子位 2025-07-24 13:33:46
1 跟貼 1
OpenAI拿下IMO金牌，職業數學家崩潰：我終于明白李世石為何會落淚

新智元 2025-07-24 13:07:06
4 跟貼 4

幾月前的傷心事，ChatGPT突然翻出來提醒我？網友當場破防：太會捅刀子了！

新智元 2025-07-22 09:43:39
3 跟貼 3

明星AI獨角獸Windsurf被瓜分的背后：資本拉鋸、背刺與共識破滅

鈦媒體APP 2025-07-24 12:24:07
0 跟貼 0
國內120+AI Agent開發/構建平臺大盤點（上）：互聯網、云計算、AI、傳統軟件廠商推出的智能體平臺

鈦媒體APP 2025-07-22 19:40:28
11 跟貼 11

可驗證的Agentic Workflow？MermaidFlow開啟安全、穩健的新范式

機器之心Pro 2025-07-24 16:05:58
0 跟貼 0

Nature：谷歌DeepMind團隊開發生成式AI模型，這一次，超越歷史學家

生物世界 2025-07-24 15:57:33
0 跟貼 0
「Manus+景鯤」領銜主演，華人AI Agent全球狂歡

36氪 2025-07-24 18:09:08
0 跟貼 0

ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動執行各種任務

量子位 2025-07-18 18:08:35
0 跟貼 0
DeepMind掌門自曝AGI倒計時5年！算力需求暴增10倍，推理計算吞噬一切

新智元 2025-07-24 17:51:41
0 跟貼 0
創智「小紅書」震撼上線

機器之心Pro 2025-07-22 17:16:14
0 跟貼 0
OpenAI反挖四位特斯拉、xAI、Meta高級工程師

機器之心Pro 2025-07-09 17:14:35
0 跟貼 0
ICML 2025 | 大模型能在信息不完備的情況下問出正確的問題嗎？

機器之心Pro 2025-07-24 16:14:06
0 跟貼 0
退款、補發、政務......多個客服場景智能體應用走向成熟丨ToB產業觀察

鈦媒體APP 2025-07-24 15:45:14
0 跟貼 0
AI音頻生成重要突破！清華×生數科技最新研究被ACM頂會收錄

智東西 2025-07-23 20:13:42
1 跟貼 1
首個“主任級AI醫生”來了，AI正成為患者問診第一站

鈦媒體APP 2025-07-24 18:04:06
0 跟貼 0
北大提出機器人學習新范式MP1，實現速度與成功率雙SOTA

機器之心Pro 2025-07-24 18:17:05
0 跟貼 0
倒計時3天！鎖定直播，共赴 2025 WAIC云帆獎頒獎典禮&摯友之夜！

機器之心Pro 2025-07-24 17:44:55
0 跟貼 0
大模型月級迭代下，金融AI Agent如何平衡創新與風險合規

每日經濟新聞 2025-05-19 23:01:58
0 跟貼 0
文獻閱讀體驗不好？兩款插件就可實現沉浸式閱讀

生物學霸 2025-03-31 17:53:36
0 跟貼 0
數據中的異常值，可以直接刪除嗎？

醫咖會 2025-03-17 19:48:53
1 跟貼 1
造福or替代程序員？實測阿里新模型

虎嗅APP 2025-07-23 22:42:47
6 跟貼 6
女友查手機，男友淡定的不像話，查到瀏覽器時不淡定了！

沙漠一支雕 2025-07-23 17:11:29
1 跟貼 1
小姑娘坐路邊哭著要聽歌，奧特曼踏山河，誰知道這是首什么歌！

皮皮怪 2025-07-23 11:31:55
1 跟貼 1
大神卡帕西親自演繹零基礎開發APP，ChatGPT四輪對話搞定

量子位 2025-03-24 16:04:01
0 跟貼 0
讓ChatGPT連讀“A”，直接崩潰到念廣告詞，網友：拿我們做測試？

量子位 2025-06-02 12:21:33
0 跟貼 0
深度挖掘：奧特曼中的搞笑穿幫還有哪些

M78阿偉_1 2025-07-23 17:02:17
0 跟貼 0
奧特曼首次體驗GPT-5！被嚇到眩暈癱坐，那一刻就像看到原子彈爆炸

新智元 2025-07-24 13:11:19
5 跟貼 5
鴻蒙電腦，靠國產軟件能用起來嗎？

愛范兒 2025-05-13 19:46:44
0 跟貼 0
一鍵提升科研效率，這幾款免費瀏覽器插件讓你文獻下載閱讀快人一步

生物學霸 2025-02-05 18:36:08
0 跟貼 0
奧特曼茶壺你見過嗎，這是誰設計的，網友：我兒子肯定喜歡.mp4

河海觀潮 2025-07-21 12:11:03
0 跟貼 0
奧特曼首次透露GPT-5上手體驗：在自己擅長領域感到無力

量子位 2025-07-24 16:03:28
3 跟貼 3
海洋+奧特曼親子主題公園！通州這一項目獲批施工許可

798守夜人 2025-07-23 20:15:42
1 跟貼 1
與中方簽完20多份文件，普京立刻安排下屬，給了中國最緊缺的東西

大地解密站 2025-07-23 21:54:49
0 跟貼 0
《星際迷航》如何從零探索新工作流+美術資料下載

CG世界 2025-07-24 10:46:39
1 跟貼 1
孫正義被奧特曼忽悠，五千億星際之門流產？馬斯克豪言：要上5000萬塊GPU！

新智元 2025-07-23 19:00:57
3 跟貼 3
夢幻：假設指令撤銷不限玩法？那就真的太良心了？

夢幻天真 2025-07-23 16:18:31
0 跟貼 0
蘭州牛肉面館隱藏菜單，8元干拌牛肉面，加肉加豆腐，一碗干到撐

老楊六要素 2025-07-22 15:24:29
4 跟貼 4
盤點奧特曼中的冷門三奧，這才是真正的冷門三斯

聽風剪影 2025-07-23 07:44:13
3 跟貼 3
每次隊員們都認定他必死無疑的時候，大古又突然出現了

聽風剪影 2025-07-22 10:34:54
1 跟貼 1

愛范兒

消費科技第一媒體

37557文章數 2599185關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

健康

時尚

房產

本地

手機 / 數碼

房產 / 家居

剛剛，OpenAI 發布 ChatGPT 版 Manus！奧特曼：感受 AGI 時刻

對話谷歌高管：營銷不懂用戶 AI也救不了你

女子面試后想刪身份證手機號被打致骨折 涉事公司回應

女子面試后想刪身份證手機號被打致骨折 涉事公司回應

兒薩夢成真!巴薩曬視頻 拉什福德笑得合不攏嘴

梓渝又翻車！正宮2號說他約P共同好友

中國，這一步棋實在太厲害

體驗全新一代博越 標配智慧座艙 還有新中式設計

態度原創

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

呼吸科專家破解呼吸道九大謠言！

到了中年，夏天穿褲子最好避開這兩種，選對了氣質立馬不一樣

突然，?？谟忠罅抠u地！

換個城市過夏天|風拂鹽湖，躲進格爾木的盛夏清涼

剛剛，OpenAI 發布 ChatGPT 版 Manus！奧特曼：感受 AGI 時刻

女子面試后想刪身份證手機號被打致骨折涉事公司回應

女子面試后想刪身份證手機號被打致骨折涉事公司回應

兒薩夢成真!巴薩曬視頻拉什福德笑得合不攏嘴

梓渝又翻車！正宮2號說他約P共同好友

中國，這一步棋實在太厲害

體驗全新一代博越標配智慧座艙還有新中式設計

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

呼吸科專家破解呼吸道九大謠言！

到了中年，夏天穿褲子最好避開這兩種，選對了氣質立馬不一樣

突然，?？谟忠罅抠u地！