99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

剛剛,OpenAI 發布 ChatGPT 版 Manus!奧特曼:感受 AGI 時刻

0
分享至

  過去大半年,Agent(智能體)是 AI 行業最常被提及的概念之一。

  幾乎所有廠商都在講 Agent,概念不缺,demo 也不少,但真正做到產品級落地,始終缺一套完整的執行系統——既能理解復雜目標,又能調用多種工具串聯任務流程,還要隨時支持任務中斷、修改與恢復,真正貼合任務流。

  就在剛剛,OpenAI 正式發布 ChatGPT Agent 功能。

  

  通過整合 Operator + Deep Research + ChatGPT 本體,用戶只需描述任務,ChatGPT Agent 就能自主判斷所需工具,自動訪問網頁、提取信息、運行代碼、生成 PPT 或表格等,并可在執行過程中實時展示相應步驟、接受臨時中斷和修改指令。

  看到這,你或許有種似曾相識的感覺。ChatGPT 這個新功能其實與 3 月份大火的 Manus 在體驗層面頗為相似,而 Manus 也正面回應了 OpenAI 這位競爭對手的入場。

  

  凌晨發布會結束后,OpenAI CEO Sam Altman 在社交媒體上寫道:

  觀看 ChatGPT Agent 使用計算機完成復雜任務,對我來說是一個真正的「感受 AGI」時刻;看到計算機思考、計劃和執行,有種與眾不同的感覺。

  亮點如下:

  ChatGPT Agent 將 Operator、Deep Research 與 ChatGPT 本體三合一,構建了一個統一智能體系統;

  內置圖形/文本瀏覽器、終端和 API 調用器等工具,支持手機端使用,任務完成后可自動推送結果;

  可連接 Gmail、GitHub 等第三方應用,深度嵌入用戶真實工作流;

  在多項基準測試中表現領先,綜合性能位居行業前列;

  Pro 用戶每月享有 400 條調用額度,其他付費用戶為 40 條,并支持按需擴展配額;

  

  ChatGPT Agent 正式上線,能購物,能寫 PPT,你的瀏覽器要被 AI 接管了

  今天開始,你可以在任何對話中,通過聊天界面左下角的「工具」下拉菜單,選擇「Agent 模式」來啟用這一功能。

  

  輸入你想完成的任務,ChatGPT Agent 就能瀏覽網站、篩選結果、在需要時安全提示你登錄、運行代碼、執行分析,PPT、電子表格等任務也都能信手拈來。

  

  整個執行過程是可視的——操作步驟會實時顯示在屏幕上,用戶可以隨時中斷、修改指令,甚至手動接管瀏覽器繼續操作,確保任務始終符合你的目標和需求。

  

  在今天凌晨的演示中,OpenAI 展示了 ChatGPT Agent 在真實場景中的應用能力。

  比如,為即將出席的婚禮做準備,一直是個難題。現在只需發出請求,ChatGPT Agent 迅速搭建虛擬環境,自主判斷應調用瀏覽器、文本解析器還是終端,并開始依次調取婚禮日期、查詢場地天氣、推薦西裝搭配、篩選酒店。

  在這個過程中,模型可以與 OpenAI 研究員進行互動,并在適當節點請求確認需求,而執行這樣一個任務只需十分鐘左右。

  

  更重要的是,用戶還可以隨時中斷任務。

  比如當 Agent 在推薦西裝過程中,OpenAI 研究員臨時插入了「幫我找一雙 9.5 碼黑色正裝鞋」的請求,模型立刻暫停當前任務,轉而處理新需求。

  同樣地,當 Agent 認為有必要時,也會主動向你請求更多信息,確保任務始終與你的目標保持一致。如果任務超出預期時間或出現卡頓,你可以選擇暫停任務、請求進度摘要,或直接終止任務并獲取已有的部分結果。

  「這種可打斷、可多輪對話的機制,是我們這次訓練模型的重點之一,」OpenAI 研究員解釋道。

  這一能力背后,是 ChatGPT Agent 對三大系統的統一整合:Operator 提供網頁交互能力,支持自動滾動、點擊、填表;Deep Research 擅長信息整合與分析;ChatGPT 本體則負責自然語言理解與智能推理。

  ChatGPT Agent 是通過強化學習在復雜的任務中訓練出來的,過去三者各有短板——前者難以深入分析,后者無法操作網頁,而 Agent 將三者優勢整合為一體,并輔以瀏覽器、終端、API 調用器等工具,形成一個完整的執行系統。

  

  用戶不僅可以在桌面端啟動 Agent 模式,在手機端也同樣適用。

  任務完成后還將自動推送結果通知。在第二個演示任務中,OpenAI 研究員在 ChatGPT App 上傳了團隊吉祥物 Bernie Doodle 的貼紙圖案,Agent 自動調用圖像生成 API 設計貼紙樣式,通過瀏覽器訪問電商平臺完成比價、樣式選擇、購物車添加,最終整理出定制 500 份貼紙的下單明細。

  當然,為確保流程安全、靈活且清晰可控,面對涉及金額的支付環節,則只會由用戶手動接管瀏覽器完成。

  通過連接器,用戶還可將 Gmail、GitHub 等日常應用接入 ChatGPT,讓模型讀取郵件、日歷或代碼庫等上下文內容,并執行諸如總結今天的郵箱內容或查找下周空閑會議時間等任務。

  一個更典型的應用場景是,OpenAI 研究員能夠讓 ChatGPT Agent 匯總自己在多項基準測試中的表現,并制作成 PPT。收到命令后,Agent 成功調用 Google Drive 連接器讀取數據文件,用終端編寫代碼繪制圖表,并完成任務。

  這類自動化能力,都是 Agent 深度嵌入工作流的體現。

  

  不過,可以看到,ChatGPT Agent 生成的 PPT 在設計審美方面表現比較一般,并且,雖然可以上傳電子表格供 ChatGPT 編輯或作為模板使用,但生成的 PPT 暫不支持二次修改。

  需要說明的是,OpenAI 并不是讓 Agent 像人一樣打開 PPT或 Excel 文件,通過點擊來插入文本框和公式,而是直接生成代碼來創建文檔。這種做法的好處是可以利用模型在代碼編寫方面的天然優勢,避免因模擬點擊操作帶來的效率低下或出錯,也降低了對計算資源的消耗。

  

  The Information 報道指出,如果 ChatGPT 要直接編輯 PPT 或 Excel 文件,就需要啟動一臺「虛擬機」(即通過 ChatGPT 運行的虛擬計算機環境),這會占用更多計算資源。

  而直接生成代碼則更輕量、高效。盡管潛力巨大,但就目前來看,這一功能短期內很難對微軟的 Office 或者 Google Workspace 造成沖擊。

  對于 ChatGPT Agent 功能,Pro 用戶將在今天之內獲得訪問權限;Plus 與 Team 用戶將在接下來的幾天內陸續開放;企業版和教育版將在未來幾周內陸續上線。

  Pro 用戶每月可使用 400 次,主打一個量大管飽,而其他付費用戶每月可使用 40 次,并可通過彈性積分方案購買更多額度。

  全線刷新「跑分」記錄,Agent 戰場迎來最強對手

  ChatGPT Agent 能力的提升,也體現在「跑分」環節。

  在評估 AI 解決跨學科專家級問題的基準測試 Humanity’s Last Exam(HLE)中,ChatGPT Agent 以 41.6 的 pass@1 得分刷新紀錄。在啟用并行執行策略后,該得分進一步提升至 44.4。

  

  在目前被認為最具挑戰性的數學基準 FrontierMath 中,面對難度極高、從未公開的題目,ChatGPT Agent 在具備終端代碼執行能力的前提下,取得了 27.4% 的準確率,遠高于此前模型。

  

  在這一復雜且高經濟價值的知識型工作任務的內部基準測試中,ChatGPT Agent 在約一半的任務中輸出質量已達到甚至超過人類水平,表現也顯著優于 o3 和 o4-mini 模型。

  

  在一個內部的投行建模任務基準中,ChatGPT Agent 的表現也顯著優于 Deep Research 和 o3 模型。每個任務都基于數百項關于公式正確性、格式規范等評分標準進行評估。

  

  此外,在公開評估模型信息查找能力的 BrowseComp 基準上,Agent 以 68.9% 的準確率刷新記錄,較 Deep Research 高出 17.4 個百分點。在 WebArena 評估中,其網頁任務執行能力也優于基于 o3 的 CUA 模型。

  

  從平臺視角看,Agent 能力的底層接口,正是瀏覽器。

  在 Perplexity AI CEO Aravind Srinivas 最近的采訪中,他表示瀏覽器將會是 AI 的「殺手級應用」。在他看來,瀏覽器天然具備讓 AI 真正「動起來」的全部條件。

  不同于傳統聊天機器人,AI Agent 的理想形態不是停留在對話框中生成文本,而是具備實際行動力——從訪問網頁、提取信息、填寫表單,到執行跨平臺操作。而這一切,瀏覽器恰好具備所需的操作權限和上下文獲取能力。

  

  瀏覽器可以直接讀取頁面、模擬點擊、自動執行任務,幾乎無需額外授權。

  在這個過程中,用戶與 AI 共處于同一個交互空間:AI 可以自動執行任務,用戶也能隨時中斷或接管,避免黑盒操作帶來的不確定性。這種可控性與透明度,是當前許多上下文協議仍難實現的能力。

  如今,隨著 ChatGPT Agent 能力正式上線,所有聲稱要做 Agent 的廠商,恐怕都要重新審視自己的產品路徑。

  當 ChatGPT 從語言交互工具,轉向具備協作、調度與承接任務能力的執行系統,開始接入用戶的真實工作流,Agent 的可用性門檻,也在此刻被實質性地拉高。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
庫里屈居第三!美媒曬NBA控衛TOP25:保羅8歐文11威少12東契奇19

庫里屈居第三!美媒曬NBA控衛TOP25:保羅8歐文11威少12東契奇19

鍋子籃球
2025-07-19 18:01:13
杜建英在美豪宅曝光!99年購入,宗馥莉留學住過,價值300萬美元

杜建英在美豪宅曝光!99年購入,宗馥莉留學住過,價值300萬美元

火山詩話
2025-07-17 19:05:28
賴清德還沒登機臺島,巴拉圭就找臺當局要錢,還希望與大陸做生意

賴清德還沒登機臺島,巴拉圭就找臺當局要錢,還希望與大陸做生意

奇思妙想生活家
2025-07-19 17:23:38
7月19日,多家上市公司發布重大利好利空好消息

7月19日,多家上市公司發布重大利好利空好消息

A股數據表
2025-07-19 05:30:03
名記:開拓者本想沖季后賽 現在卻為下賽季打不了的球員花4000萬

名記:開拓者本想沖季后賽 現在卻為下賽季打不了的球員花4000萬

直播吧
2025-07-19 13:48:07
俄專家:美國現在才發現,中國是天然超級大國

俄專家:美國現在才發現,中國是天然超級大國

星辰夜語
2025-07-18 21:44:14
廣州今夜起將有暴雨,風力增加!廣東多條河流可能有超警洪水

廣州今夜起將有暴雨,風力增加!廣東多條河流可能有超警洪水

南方都市報
2025-07-19 12:16:59
90年山東黑老大聶磊被槍決前冷笑:你們查到的還不到十分之一

90年山東黑老大聶磊被槍決前冷笑:你們查到的還不到十分之一

懸案解密檔案
2025-05-05 20:20:25
外媒:巴西對中國稀土出口量激增

外媒:巴西對中國稀土出口量激增

參考消息
2025-07-18 21:32:29
全場夢游被橫掃!鳳凰組合0-2不敵世界第5,國羽無緣會師混雙決賽

全場夢游被橫掃!鳳凰組合0-2不敵世界第5,國羽無緣會師混雙決賽

生活新鮮市
2025-07-19 17:36:40
知情人曝宗慶后有3個情人,72歲色心不改,小情人曾大鬧總部

知情人曝宗慶后有3個情人,72歲色心不改,小情人曾大鬧總部

葉公子
2025-07-17 11:23:24
下班回家女助理蹭老公車還要坐副駕,我安靜坐后面,到家后老公懵了

下班回家女助理蹭老公車還要坐副駕,我安靜坐后面,到家后老公懵了

小影的娛樂
2025-07-19 10:30:00
預約天府機場貴賓廳要驗資2000萬?銀行回應:屬實,國內僅此一地需驗資

預約天府機場貴賓廳要驗資2000萬?銀行回應:屬實,國內僅此一地需驗資

板扎在線
2025-07-19 07:33:47
47歲女高管與23歲男助理爬山,雙雙墜崖后,警方打開其帳篷愣住

47歲女高管與23歲男助理爬山,雙雙墜崖后,警方打開其帳篷愣住

懸案解密檔案
2025-07-18 15:54:04
林仲勛高調曬未婚妻,申裕斌被封姑奶奶,混雙搭檔的流言徹底破防

林仲勛高調曬未婚妻,申裕斌被封姑奶奶,混雙搭檔的流言徹底破防

永恒之誓
2025-07-19 11:05:08
敘利亞折騰到現在,朱拉尼應該明白了,擺在他面前只有兩條路可走

敘利亞折騰到現在,朱拉尼應該明白了,擺在他面前只有兩條路可走

董董歷史燴
2025-07-19 17:02:11
1975年李富春病逝,蔡暢堅決不許女兒送葬,聶帥出面勸說都沒用

1975年李富春病逝,蔡暢堅決不許女兒送葬,聶帥出面勸說都沒用

柳絮憶史
2025-07-11 11:35:25
布朗尼:我能進入NBA,跟我爸是詹姆斯一點關系都沒有!

布朗尼:我能進入NBA,跟我爸是詹姆斯一點關系都沒有!

田先生籃球
2025-07-19 15:01:41
要警惕時代的進程,歐美關閉當地中國企業,成為一種潮流

要警惕時代的進程,歐美關閉當地中國企業,成為一種潮流

藍色海邊
2025-07-19 09:29:39
中方動真格了!圍堵中國使館,中國正式發函韓國,李在明卻沉默了

中方動真格了!圍堵中國使館,中國正式發函韓國,李在明卻沉默了

格斗聯盟
2025-07-19 18:00:08
2025-07-19 18:55:00
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
5489文章數 26583關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

越南前國家領導人阮春福、武文賞等3人被解除黨內職務

頭條要聞

越南前國家領導人阮春福、武文賞等3人被解除黨內職務

體育要聞

韋德:楊瀚森讓我想起王治郅 打球都非常聰明

娛樂要聞

肖戰微博改名:去掉X玖少年團頭銜

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

家居
親子
旅游
時尚
公開課

家居要聞

簡構智居 現代功能美學

親子要聞

這下完了,被果果抓現成了!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

造城者“她”,用設計重塑城市溫度

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 安丘市| 禹州市| 松桃| 农安县| 太湖县| 元氏县| 屯留县| 喀喇| 大悟县| 宁波市| 抚松县| 五大连池市| 浠水县| 黄骅市| 兴文县| 资兴市| 荣昌县| 望都县| 葫芦岛市| 阿合奇县| 漾濞| 广元市| 马龙县| 玛沁县| 新晃| 红原县| 登封市| 都昌县| 黎川县| 永丰县| 漳州市| 乌兰县| 迁西县| 东兰县| 资中县| 茌平县| 石城县| 衡阳县| 中牟县| 韶山市| 宣化县|