99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

剛剛,OpenAI 發(fā)布 ChatGPT 版 Manus!奧特曼:感受 AGI 時刻

0
分享至


過去大半年,Agent(智能體)是 AI 行業(yè)最常被提及的概念之一。

幾乎所有廠商都在講 Agent,概念不缺,demo 也不少,但真正做到產(chǎn)品級落地,始終缺一套完整的執(zhí)行系統(tǒng)——既能理解復雜目標,又能調(diào)用多種工具串聯(lián)任務(wù)流程,還要隨時支持任務(wù)中斷、修改與恢復,真正貼合用戶工作流。

就在剛剛,OpenAI 正式發(fā)布 ChatGPT Agent 功能。


通過整合 Operator + Deep Research + ChatGPT 本體,用戶只需描述任務(wù),ChatGPT Agent 就能自主判斷所需工具,自動訪問網(wǎng)頁、提取信息、運行代碼、生成幻燈片或表格等,并可在執(zhí)行過程中實時展示步驟、接受中斷和修改指令。

發(fā)布會結(jié)束后,OpenAI CEO Sam Altman 在社交媒體上寫道::

觀看 ChatGPT Agent 使用計算機完成復雜任務(wù),對我來說是一個真正的「感受 AGI」時刻;看到計算機思考、計劃和執(zhí)行,有種與眾不同的感覺。

亮點如下:

  • ChatGPT Agent 將 Operator、Deep Research 與 ChatGPT 本體三合一,構(gòu)建了一個統(tǒng)一智能體系統(tǒng)。
  • 內(nèi)置圖形/文本瀏覽器、終端和 API 調(diào)用器等工具,支持手機端使用,任務(wù)完成后可自動推送結(jié)果;
  • 可連接 Gmail、GitHub 等第三方應(yīng)用,深度嵌入用戶真實工作流;
  • 在多項基準測試中表現(xiàn)領(lǐng)先,綜合性能位居行業(yè)前列;
  • Pro 用戶每月享有 400 條調(diào)用額度,其他付費用戶為 40 條,并支持按需擴展配額。


ChatGPT Agent 正式上線,能購物,能寫 PPT,你的瀏覽器要被 AI 接管了

今天開始,你可以在任何對話中,通過聊天界面左下角的「工具」下拉菜單,選擇「Agent 模式」來啟用這一功能。


只需描述你想完成的任務(wù),ChatGPT 能夠智能地瀏覽網(wǎng)站、篩選結(jié)果、在需要時安全提示你登錄、運行代碼、執(zhí)行分析,甚至輸出可編輯的幻燈片和電子表格,總結(jié)任務(wù)結(jié)果。

整個執(zhí)行過程是可視的——操作步驟會實時顯示在屏幕上,用戶可以隨時中斷、修改指令,甚至手動「接管瀏覽器」繼續(xù)操作,確保任務(wù)始終符合你的目標和需求。


在今天凌晨的演示中,OpenAI 展示了 ChatGPT Agent 在真實場景中的應(yīng)用能力。

比如,為即將出席的婚禮做準備,一直是個難題?,F(xiàn)在只需發(fā)出請求,ChatGPT Agent 迅速搭建虛擬環(huán)境,自主判斷應(yīng)調(diào)用瀏覽器、文本解析器還是終端,并開始依次調(diào)取婚禮日期、查詢場地天氣、推薦西裝搭配、篩選酒店。在這個過程中,模型可以與 OpenAI 研究員進行互動,并在適當節(jié)點請求確認需求。


更重要的是,用戶可以隨時中斷任務(wù)。

比如當 Agent 在推薦西裝過程中,OpenAI 研究員臨時插入了「幫我找一雙 9.5 碼黑色正裝鞋」的請求,模型立刻暫停當前任務(wù),轉(zhuǎn)而處理新需求。

同樣地,當智能體認為有必要時,也會主動向你請求更多信息,確保任務(wù)始終與你的目標保持一致。如果任務(wù)超出預期時間或出現(xiàn)卡頓,你可以選擇暫停任務(wù)、請求進度摘要,或直接終止任務(wù)并獲取已有的部分結(jié)果。

「這種可打斷、可多輪對話的機制,是我們這次訓練模型的重點之一,」OpenAI 研究員解釋道。

這一能力背后,是 ChatGPT Agent 對三大系統(tǒng)的統(tǒng)一整合:Operator 提供網(wǎng)頁交互能力,支持自動滾動、點擊、填表;Deep Research 擅長信息整合與分析;ChatGPT 本體則負責自然語言理解與智能推理。

ChatGPT Agent 是通過強化學習在復雜的任務(wù)中訓練出來的,過去三者各有短板——前者難以深入分析,后者無法操作網(wǎng)頁,而 Agent 將三者優(yōu)勢整合為一體,并輔以瀏覽器、終端、API 調(diào)用器等工具,形成一個完整的執(zhí)行系統(tǒng)。


用戶不僅可以在桌面端啟動 Agent 模式,在手機端也同樣適用。

任務(wù)完成后還將自動推送結(jié)果通知。在第二個演示任務(wù)中,OpenAI 研究員在 ChatGPT App 上傳了團隊吉祥物 Bernie Doodle 的貼紙圖案,Agent 自動調(diào)用圖像生成 API 設(shè)計貼紙樣式,通過瀏覽器訪問電商平臺完成比價、樣式選擇、購物車添加,最終整理出定制貼紙的下單明細。

當然,為確保流程安全、靈活且清晰可控,面對涉及金額的支付環(huán)節(jié),則只會由用戶手動接管瀏覽器完成。

通過連接器,用戶還可將 Gmail、GitHub 等日常應(yīng)用接入 ChatGPT,讓模型讀取郵件、日歷或代碼庫等上下文內(nèi)容,并執(zhí)行諸如總結(jié)今天的郵箱內(nèi)容或查找下周空閑會議時間等任務(wù)。

一個更典型的應(yīng)用場景是,OpenAI 研究員能夠讓 ChatGPT Agent 匯總自己在多項基準測試中的表現(xiàn),并制作成幻燈片。收到命令后,Agent 會調(diào)用 Google Drive 連接器讀取數(shù)據(jù)文件,用終端編寫代碼繪制圖表,并生成完整的 PPT。

這類自動化能力,都是 Agent 深度嵌入工作流的體現(xiàn)。


不過,可以看到,ChatGPT Agent 生成的 PPT 在設(shè)計審美方面表現(xiàn)比較一般,并且,雖然可以上傳電子表格供 ChatGPT 編輯或作為模板使用,但生成的 PPT 暫不支持二次修改。

需要說明的是,OpenAI 并不是讓 Agent 像人一樣打開 PPT或 Excel 文件,通過點擊來插入文本框和公式,而是直接生成代碼來創(chuàng)建文檔。這種做法的好處是可以利用模型在代碼編寫方面的天然優(yōu)勢,避免因模擬點擊操作帶來的效率低下或出錯,也降低了對計算資源的消耗。


The Information 報道指出,如果 ChatGPT 要直接編輯 PPT 或 Excel 文件,就需要啟動一臺「虛擬機」(即通過 ChatGPT 運行的虛擬計算機環(huán)境),這會占用更多計算資源。

而直接生成代碼則更輕量、高效。盡管潛力巨大,但就目前來看,這一功能短期內(nèi)很難對微軟的 Office 或者 Google Workspace 造成沖擊。

對于 ChatGPT Agent 功能,Pro 用戶將在今天之內(nèi)獲得訪問權(quán)限;Plus 與 Team 用戶將在接下來的幾天內(nèi)陸續(xù)開放;企業(yè)版(Enterprise)和教育版(Education)將在未來幾周內(nèi)上線

Pro 用戶每月可使用 400 條消息,其他付費用戶每月可使用 40 條消息,并可通過彈性積分方案購買更多額度。

全線刷新「跑分」記錄,Agent 戰(zhàn)場迎來最強對手

ChatGPT Agent 能力的提升,也體現(xiàn)在「跑分」環(huán)節(jié)。

在評估 AI 解決跨學科專家級問題的基準測試 Humanity’s Last Exam(HLE)中,搭載智能體的 ChatGPT 模型以 41.6 的 pass@1 得分刷新紀錄。在啟用并行執(zhí)行策略后,該得分進一步提升至 44.4。


在目前被認為最具挑戰(zhàn)性的數(shù)學基準 FrontierMath 中,面對難度極高、從未公開的題目,ChatGPT Agent 在具備終端代碼執(zhí)行能力的前提下,取得了 27.4% 的準確率,遠高于此前模型。


在這一復雜且高經(jīng)濟價值的知識型工作任務(wù)的內(nèi)部基準測試中,ChatGPT Agent 在約一半的任務(wù)中輸出質(zhì)量已達到甚至超過人類水平,表現(xiàn)也顯著優(yōu)于 o3 和 o4-mini 模型。


在一個內(nèi)部的投行建模任務(wù)基準中,ChatGPT 智能體的表現(xiàn)也顯著優(yōu)于 Deep Research 和 o3 模型。每個任務(wù)都基于數(shù)百項關(guān)于公式正確性、格式規(guī)范等評分標準進行評估。


此外,在公開評估模型信息查找能力的 BrowseComp 基準上,Agent 以 68.9% 的準確率刷新記錄,較 Deep Research 高出 17.4 個百分點。在 WebArena 評估中,其網(wǎng)頁任務(wù)執(zhí)行能力也優(yōu)于基于 o3 的 CUA 模型。


從平臺視角看,Agent 能力的底層接口,正是瀏覽器。

在 Perplexity AI CEO Aravind Srinivas 最近的采訪中,他表示瀏覽器將會是 AI 的「殺手級應(yīng)用」。在他看來,瀏覽器天然具備讓 AI 真正「動起來」的全部條件。

不同于傳統(tǒng)聊天機器人,AI Agent 的理想形態(tài)不是停留在對話框中生成文本,而是具備實際行動力——從訪問網(wǎng)頁、提取信息、填寫表單,到執(zhí)行跨平臺操作。而這一切,瀏覽器恰好具備所需的操作權(quán)限和上下文獲取能力。

瀏覽器可以直接讀取頁面、模擬點擊、自動執(zhí)行任務(wù),幾乎無需額外授權(quán)。

在這個過程中,用戶與 AI 共處于同一個交互空間:AI 可以自動執(zhí)行任務(wù),用戶也能隨時中斷或接管,避免黑盒操作帶來的不確定性。這種可控性與透明度,是當前許多上下文協(xié)議仍難實現(xiàn)的能力。

如今,隨著 ChatGPT Agent 能力正式上線,所有聲稱要做 Agent 的廠商,恐怕都要重新審視自己的產(chǎn)品路徑。

當 ChatGPT 從語言交互工具,轉(zhuǎn)向具備協(xié)作、調(diào)度與承接任務(wù)能力的執(zhí)行系統(tǒng),開始接入用戶的真實工作流,Agent 的可用性門檻,也在此刻被實質(zhì)性地拉高。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
情商低?韋世豪風波后王大雷評論其妻子:我們餃子最棒!網(wǎng)友狠批

情商低?韋世豪風波后王大雷評論其妻子:我們餃子最棒!網(wǎng)友狠批

我愛英超
2025-07-22 15:17:38
日本執(zhí)政黨慘敗,激進排外勢力大勝!制止“中國人踢奈良鹿”的網(wǎng)紅都當選議員了

日本執(zhí)政黨慘敗,激進排外勢力大勝!制止“中國人踢奈良鹿”的網(wǎng)紅都當選議員了

日本物語
2025-07-21 21:29:10
全球首例!乙肝TCR-T細胞療法投入臨床,2.5億人或?qū)[脫終身服藥

全球首例!乙肝TCR-T細胞療法投入臨床,2.5億人或?qū)[脫終身服藥

水皮M0RE
2025-07-22 16:41:35
央行:房地產(chǎn)貸款增速回升

央行:房地產(chǎn)貸款增速回升

界面新聞
2025-07-22 16:07:33
湖人傳聞:知情人士透露道爾頓·克內(nèi)希特的交易價值正在下降

湖人傳聞:知情人士透露道爾頓·克內(nèi)希特的交易價值正在下降

好火子
2025-07-23 03:11:13
杜建英同學發(fā)聲,稱宗馥莉沒教養(yǎng)是惡人,杜建英多年一直愁眉不展

杜建英同學發(fā)聲,稱宗馥莉沒教養(yǎng)是惡人,杜建英多年一直愁眉不展

大笑江湖史
2025-07-18 07:37:43
17輪僅出場2次,前恒大天才新星慘遭斯帥冷落,淪為中超透明人

17輪僅出場2次,前恒大天才新星慘遭斯帥冷落,淪為中超透明人

零度眼看球
2025-07-22 06:50:32
大結(jié)局!阿森納終簽下約克雷斯:轉(zhuǎn)會費7350萬歐 今夏已砸2.2億歐

大結(jié)局!阿森納終簽下約克雷斯:轉(zhuǎn)會費7350萬歐 今夏已砸2.2億歐

風過鄉(xiāng)
2025-07-22 22:17:32
油價調(diào)整消息:今天7月22日,全國加油站調(diào)整后92、95汽油新售價

油價調(diào)整消息:今天7月22日,全國加油站調(diào)整后92、95汽油新售價

沙雕小琳琳
2025-07-23 00:39:50
甘肅馬蹄寺景區(qū)被曝收300元/人“天價過路費”,當?shù)匚穆貌块T:屬實,已下發(fā)整改函

甘肅馬蹄寺景區(qū)被曝收300元/人“天價過路費”,當?shù)匚穆貌块T:屬實,已下發(fā)整改函

上游新聞
2025-07-22 17:29:05
除了商標全是假的!全球科技先鋒隕落,百年巨頭淪為貼牌工廠

除了商標全是假的!全球科技先鋒隕落,百年巨頭淪為貼牌工廠

聞識
2025-07-15 13:34:23
罕見一幕!六大期貨品種集體漲停,釋放什么信號?

罕見一幕!六大期貨品種集體漲停,釋放什么信號?

證券時報
2025-07-23 00:07:06
廣州擬于十五運會期間實行本市小客車單雙號通行!正征求意見

廣州擬于十五運會期間實行本市小客車單雙號通行!正征求意見

南方都市報
2025-07-23 00:27:05
比亞迪銷量遇冷:國內(nèi)增長放緩 海外擴張受阻 全年目標壓力大

比亞迪銷量遇冷:國內(nèi)增長放緩 海外擴張受阻 全年目標壓力大

樂趣談?wù)勑畔?/span>
2025-07-22 13:50:23
腦梗去世的人飆升!醫(yī)生含淚苦勸:無論多大年紀,天熱堅守6原則

腦梗去世的人飆升!醫(yī)生含淚苦勸:無論多大年紀,天熱堅守6原則

今日養(yǎng)生之道
2025-07-22 14:35:28
吃相太難看!網(wǎng)紅全程戴面具開演唱會惹眾怒,網(wǎng)友:誰給的自信?

吃相太難看!網(wǎng)紅全程戴面具開演唱會惹眾怒,網(wǎng)友:誰給的自信?

一娛三分地
2025-07-23 00:14:52
贏麻了,陳佩斯哭了,票房300倍逆襲,朱時茂百萬投資可掙了不少

贏麻了,陳佩斯哭了,票房300倍逆襲,朱時茂百萬投資可掙了不少

草莓解說體育
2025-07-21 17:59:38
20多國領(lǐng)導人確定出席!中方正式宣布,特朗普也接到了邀請

20多國領(lǐng)導人確定出席!中方正式宣布,特朗普也接到了邀請

一個有靈魂的作者
2025-07-22 13:46:12
女孩查分721,當晚選擇墜樓自殺,警方檢查手機短信,發(fā)現(xiàn)實情

女孩查分721,當晚選擇墜樓自殺,警方檢查手機短信,發(fā)現(xiàn)實情

罪案洞察者
2025-07-16 10:48:38
周驄設(shè)靈,90歲羅蘭冒大雨送別被攙扶著離開,陳慧珊哭紅雙眼

周驄設(shè)靈,90歲羅蘭冒大雨送別被攙扶著離開,陳慧珊哭紅雙眼

開開森森
2025-07-22 20:17:59
2025-07-23 06:48:49
愛范兒 incentive-icons
愛范兒
消費科技第一媒體
37550文章數(shù) 2599168關(guān)注度
往期回顧 全部

科技要聞

李開復推企業(yè)級Agent,誓要打造"超級員工"

頭條要聞

特朗普:將對菲律賓征收19%關(guān)稅 菲對美實行零關(guān)稅

頭條要聞

特朗普:將對菲律賓征收19%關(guān)稅 菲對美實行零關(guān)稅

體育要聞

記者:那不勒斯租借+強制買斷報價恩多耶,總價4000萬歐元

娛樂要聞

葉珂復播 自曝產(chǎn)女后與黃曉明徹底分手

財經(jīng)要聞

宗馥莉掌控離岸公司 遺產(chǎn)爭奪或早有布局

汽車要聞

看著像保時捷?賓利首款純電動車諜照曝光

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
親子
公開課
軍事航空

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

房產(chǎn)要聞

新增2500個學位!??谟忠怀墝W校來了!

親子要聞

拒絕毒友誼,給孩子講這個故事

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

25國發(fā)聯(lián)合聲明呼吁立即結(jié)束加沙戰(zhàn)爭 以色列嚴正拒絕

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 敦煌市| 凌云县| 泰州市| 安泽县| 江门市| 镇沅| 武宁县| 邓州市| 荣昌县| 水富县| 璧山县| 黄山市| 兰溪市| 榆社县| 离岛区| 墨玉县| 雷波县| 朝阳市| 互助| 肥城市| 辽中县| 大足县| 方山县| 佛冈县| 兴和县| 钟祥市| 尼勒克县| 清水河县| 兴文县| 托克逊县| 上高县| 凤翔县| 固阳县| 南安市| 湖南省| 呼图壁县| 芮城县| 巨鹿县| 伊金霍洛旗| 黄龙县| 乌拉特后旗|