99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<tbody id="yuasm"></tbody>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

剛剛，奧特曼放出ChatGPT「統一智能體」！驚呼真AGI，最卷打工人來了

2025-07-18 06:31:16　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：桃子好困

【新智元導讀】ChatGPT agent誕生了！奧特曼深夜帶隊直播，首個統一智能體無縫融合三大AI，自主思考決策，還能上網直出PPT、Excel。2025年，作為全新AI杠桿，ChatGPT正在解鎖「超級個體」新模式。

今晚，ChatGPT和Deep Research、Operator「三劍客」首度合體！

奧特曼親自帶隊，25分鐘高能直播重磅發布ChatGPT agent，開啟人類和智能體協作全新時代。

ChatGPT agent的核心，是一個統一的智能體系統。

簡言之，它融合了此前三大技術突破的優勢：Operator與網站交互的能力，Deep Research整合信息的技巧，以及ChatGPT智能對話優勢。

如今，ChatGPT可以直接使用計算機，全程自主為你工作。

從智能瀏覽網頁、篩選結果，在需要時提醒安全登錄、運行代碼、進行分析，還能直出PPT和Excel匯總發現結果。

最最重要的是，一切盡在掌控之中。

人類隨時可以中斷任務、接管瀏覽器，或是完全停止。

在HLE測試中，ChatGPT agent拿下了41.6%高分；并在數學FrontierMath基準上，同樣刷新SOTA，碾壓o4-mini和o3模型。

順便提一句，ChatGPT Agent在HLE上仍不及馬斯克的Grok 4 Heavy

誰能想到，上面這張PPT，還是ChatGPT agent自己做的。在基準測試中，其操作辦公軟件的能力，幾乎沒給人類留下多少余地了。

網友辣評：打工人的好日子到頭了

奧特曼感慨道，ChatGPT agent使用計算機執行復雜任務，對自己來說是一個真正「感受AGI」的時刻。

從今天起，Pro、Plus和Team用戶直接可以開啟體驗，在對話框下拉欄中，選擇「Agent mode」即可。

其中，Pro用戶每月有400次的額度，Plus和Team為每月40次。

太長不看版：（節選自OpenAI研究員張熙堃的X）

Deep Research擅長做研究，Operator會執行操作，而ChatGPTagent則能同時完成所有這些任務！
端到端強化學習的威力！基于RL Scaling，ChatGPT agent的高效性和數據利用率非常驚人。
人機協作，依舊是核心！任務過程中可隨時打斷，引導ChatGPT完成新任務。在支付、刪除文件等操作前，會向人類主動確認。只有在必要時，它才會提問以獲取更清晰的指令。
真實世界表現 > 追逐基準排名！ChatGPT agent確實橫掃了很多榜單。但在模型開發過程中，OpenAI既不會一門心思去刷分，也不太在意最終在排行榜上的位置。

三強首度合體

ChatGPT agent正式登場

今年1月，OpenAI發布了首個智能體Operator，讓AI像人類一樣直接與GUI交互。

緊接著2月初，他們又推出了首個Deep Research，推理模型直接可以使用工具，開展研究。

這兩個工具各有專長，Operator可以自主上網、點擊和輸入，而Deep Research則擅長分析和總結信息。

然而，前者無法開啟深度分析、撰寫詳細報告；后者無法與網站交互獲得精確結果。

今天，OpenAI正式將其合二為一——ChatGPT agent，「單一模型」即可解鎖全新能力。

ChatGPT agent配備了一整套工具：

· 可視化瀏覽器：用于圖形用戶界面與網頁交互

·文本瀏覽器：用于處理簡單推理和網頁查詢

·終端+直接API訪問權限：圖像API

agent還能借助ChatGPT連接器，連接Gmail、Github等應用，便于根據提示找到相關信息并給出回復。

不僅如此，接管瀏覽器后登錄任何網站，讓ChatGPT agent進行更深入、更廣泛的研究和任務執行。

由此，ChatGPT便能選擇最佳路徑，高效地執行任務。

打工人的PPT，ChatGPT代勞了

為了展示ChatGPT agent能力，團隊現場演示了一個真實場景：為朋友Minnie和Sarah策劃一場婚禮。

根據提示，這項任務需要AI依據著裝要求和天氣情況，推薦精美價格合理的禮服、為參會者預訂酒店，以及為新人準備婚禮禮物。

ChatGPT agent在理解提示后，并沒有直出報告，而是再次重述確認任務要求，比如確切的婚禮日期。

當一切確認之后，接下來，它便自主打開瀏覽器，并在交互頁面上顯示逐步執行的每一個過程，即思維鏈。

需要注意的是，agent會在幾秒內配置好的虛擬計算環境中，開始執行任務。

任務執行中，agent使用文本瀏覽器查詢，并找到了合適的西裝，然后切換到視覺瀏覽器，等待確認。

在ChatGPT執行婚禮策劃任務同時，還可以讓它做另一個任務：購買一雙9.5碼黑色鞋子。

也就意味著，ChatGPT agent不懼被打斷。即便上一個任務規劃時間很長，也不耽誤接下來的事情。

最后，ChatGPT agent生成了一份非常全面的報告，包括禮服、酒店、鞋子、禮物全部給出了規劃和建議。

在另一個演示中，團隊用ChatGPT應用開啟任務——上傳一張團隊吉祥物——可愛小狗的圖片，做成筆記本貼紙，并訂購500個。

然后，它便開始調用工具Imagen生成動漫版圖片，并設計貼紙，從StickerMule訂購500份寄到xxx。

更令人驚喜的是，ChatGPT agent還能通過連接器，比如Google Drive提取評估數據，自己生成PPT。

在此過程中，agent會編寫代碼，并將其編譯成最終幻燈片。它還會借用圖像工具，為PPT頁面進行裝飾。

不一會功夫，它就直接輸出了第一張HLE、FrontierMath的PPT，但不夠精致，然后它再次通過RL不斷優化。

最終，就得到了一個優美的PPT文件，可以在辦公軟件中直接打開。

不得不說，ChatGPT agent太強了。

甚至，你還可以讓ChatGPT agent制定一個參觀30+美國職棒大聯盟球場的最佳行程。

耗時25分鐘，它迅速生成一個直觀可視化的Excel，以后做數據也徹底解放了雙手。

HLE拿下41.6%高分

多項基準破紀錄

統一后的agent，大幅提升了ChatGPT在日常和專業領域的實用性。

不僅在網頁瀏覽，還是現實任務完成能力的評估中，ChatGPT agent全部刷新了SOTA。

如上提及的，在人類最后考試（HLE）中，ChatGPT agent以41.6%的得分，刷新了pass@1最高紀錄。

當研究團隊采用并行策略后，即同時運行最多8次并選取自信度最高結果，HLE得分直接刷到了44.4%。

在最難的數學基準測試FrontierMath中，ChatGPT agent借助代碼終端等工具，實現了27.4%準確率，大幅超越o3和o4-mini。

不僅如此，在內部設計的「高經濟價值知識工作」測試中，ChatGPT agent在半數案例中，輸出質量與人類相當，甚至碾壓人類。

任務來自真實專業工作場景，比如為按需緊急護理服務商撰寫競品分析、編制詳細的攤銷表，以及為新的綠色氫能設施尋找可行的水源

在評估數據科學生產力任務的DSBench中，ChatGPT agent以顯著優勢超越了人類表現。

在Excel編輯能力的SpreadsheetBench測試中，其表現同樣遠超現有模型。

當獲得直接編輯權限時，ChatGPT agent以45.5%的得分顯著超越Excel Copilot的20.0%。

在投行分析師1-3年級建模任務的內部評估中，ChatGPT agent底層模型碾壓Deep Research和o3模型。

此外，在OpenAI發布的BrowseComp基準測試中，ChatGPT agent以68.9%的準確率刷爆紀錄，比Deep Research高出17.4%。

在WebArena基準測試中，其表現也優于基于o3的CUA（即Operator背后的底層模型）。

BrowseComp基準專門評估瀏覽智能體在網絡上定位難尋信息的能力；WebArena用于評估網頁瀏覽智能體完成現實網絡任務的能力

2025下一個熱點

AI智能體「杠桿」

ChatGPT agent這么強，能為我們帶來什么價值？

最近，剛剛離職OpenAI研究員Hyung Won Chung分享演講視頻中表示，「AI正成為有史以來最強大的『杠桿』」。

他表示，AI智能體結合了兩種杠桿：人力和代碼。

它就像雇了個幫手，替你干活（人力杠桿）；而且它又是軟件，能無限復制（代碼杠桿）。

1. 人力杠桿：AI智能體可以替人類完成工作，就像一個人AI助理。

2. 代碼杠桿：當前的AI智能體是純軟件形式，可以輕松復制。如果你想要10倍的產出，就運行10個智能體；想要12倍，就再加兩個。這種杠桿不需要許可，可以隨意擴展。

在這場發布會上，OpenAI重提了「AI杠桿」這一核心話題。

他們同樣認為，2025年之后，AI智能體將成為一種全新的杠桿機制。

它不僅能代替人類完成工作，還能通過「復制粘貼」無限擴展。不論是10個，還是更多智能體，不需要額外的許可，即可一鍵部署。

研究人員舉例稱，Deep Research發布之后近半年里，極大地提升了個體和小團隊的產出。

過去，團隊規模化需要依賴「人力杠桿」，但人類協作的溝通成本，甚至包括摩擦，往往成為了瓶頸。

而現在，ChatGPT agent的出現一個重大意義在于，讓小團隊創造巨大的價值。

一個10人或20人的初創公司，借助AI杠桿，可能創造出媲美科技巨頭的成就。

這種「超級個體」模式，或許在未來將重塑企業的組織架構，憑借AI實現指數級增長。

北大校友領銜出鏡

值得一提的是，這次直播中，有兩位華人學者同時出鏡。

Zhiqing Sun（孫之清）

孫之清于2024年6月加入OpenAI，擔任研究科學家。

他于2025年在卡內基梅隆大學獲得計算機科學博士學位，于2019年在北京大學獲得計算機科學學士學位。

在OpenAI期間，他不僅參與到了o3/o4-mini、計算機使用智能體，以及Deep Research這幾個關鍵項目當中，而且還是Deep Research的研究負責人。

Casey Chu

Casey Chu于2020年4月加入OpenAI，擔任研究員。

此前，他于2019年在斯坦福大學獲得計算數學碩士學位，并于2016年在哈維穆德學院獲得數學學士學位。

后來他曾嘗試攻讀斯坦福大學的計算數學博士學位，但中途選擇了退學。

別看他的title只是研究員，但他不僅是DALL·E 2的共同一作，而且還主導了GPT-4視覺輸入的初始原型的開發。

參考資料：

https://openai.com/index/introducing-chatgpt-agent/

https://x.com/xikun_zhang_/status/1945895070269583554

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

OpenAI放“王炸”！ChatGPT Agent重磅發布：能上網搜、會做PPT、精通Excel，甚至能規劃全美看球路線！但炒股？它說“NO”！

每日經濟新聞 2025-07-18 07:31:03
0 跟貼 0
ChatGPT智能體于昨夜正式發布

量子位 2025-07-18 08:47:00
1 跟貼 1

你的模型評測搭子上線：Evaluation Agent懂你更懂AI

機器之心Pro 2025-07-17 19:07:55
0 跟貼 0

失敗147次后，他三天寫出萬能提示詞模板，600萬網友吵翻了

量子位 2025-07-13 17:09:11
0 跟貼 0
Jason Wei火速被挖走，奧特曼哭暈！OpenAI龍脈被挖，一億刀偷走思維鏈之父？

新智元 2025-07-16 14:13:30
15 跟貼 15

500美元刷新SOTA！訓練成本砍到1/200，華人團隊重構視頻生成范式

量子位 2025-07-17 14:45:03
0 跟貼 0

Le Chat全方面對標ChatGPT，歐洲AI新貴窮追不舍

機器之心Pro 2025-07-18 10:40:10
0 跟貼 0
AGI時代的教育我們應該學什么？

經濟觀察報 2025-05-09 15:41:04
0 跟貼 0

黃仁勛：下一波浪潮就是物理AI，所有能力都能融入物理世界

每日經濟新聞 2025-07-18 11:55:30
1 跟貼 1
實探 | 合肥落地全國首家政府主辦機器人“大學”，企業“拎包即可訓練”

每日經濟新聞 2025-07-16 19:41:23
0 跟貼 0
深謀科技獨家發布：真正為人類服務的新一代人形機器人核心技術

量子位 2025-07-17 14:10:19
1 跟貼 1
研發自動化的初衷是讓每一個研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
0 跟貼 0
下個萬億美元市場！老黃：人形機器人要落地

量子位 2025-05-19 20:06:49
13 跟貼 13
宇樹機器人復雜環境穩定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
199 跟貼 199
OpenAI o1核心大佬離職后首次演講！AI智能體=人力+代碼「無限杠桿」

新智元 2025-07-18 12:42:50
0 跟貼 0
AI開發圈地震！Cursor多款模型在中國大陸不能用了，程序員要求退錢

智東西 2025-07-18 12:52:19
0 跟貼 0
黃仁勛對話王堅：開源不僅僅是開放研究，還要開放工程

每日經濟新聞 2025-07-18 12:57:13
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
網友實測Veo3視頻旋風：模擬車展、上課、ASMR

量子位 2025-05-25 09:14:22
0 跟貼 0
大模型月級迭代下，金融AI Agent如何平衡創新與風險合規

每日經濟新聞 2025-05-19 23:01:58
0 跟貼 0
超算互聯網上線開源AI社區！模型+數據+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
傳統MVP模型不成立了，AI時代要更多預測剛需場景

量子位 2025-04-22 14:14:16
0 跟貼 0
AI的母語是什么？人類進化花了200萬年，AI只需一個晚上

量子位 2025-05-23 19:24:56
0 跟貼 0
AI的母語是什么？不是英語，不是漢語

量子位 2025-05-23 17:58:54
0 跟貼 0
4o生圖前端效果騙了太多人，網友扒出逐行生成的演示當不得真

量子位 2025-04-02 21:22:14
0 跟貼 0
天橋腦科學研究院與AAAS宣布 2024 年 AI 驅動科學大獎獲獎名單

鈦媒體APP 2025-07-18 12:53:07
0 跟貼 0
山西運城：《我是刑警》東林案的原型，山西絳縣三女童被殺案！

老驢探案 2025-07-16 15:43:29
61 跟貼 61
成毅人機感好濃

影視前線 2025-07-15 19:40:08
99 跟貼 99
早報｜iPhone 17 Pro 或推「液態玻璃」配色/ChatGPT Agent 發布，可操控電腦/美團回應 0 元購：本來不想卷

愛范兒 2025-07-18 10:02:14
0 跟貼 0
2025.7.15日報第三集（共三集，注意查看主頁）

獨夫之心 2025-07-17 08:58:53
0 跟貼 0
OpenAI離職員工自曝：干了一年就潤了！007壓力逼到極限，AGI成宗教

新智元 2025-07-16 12:43:40
35 跟貼 35
財政部調整超豪華小汽車消費稅政策

財聯社 2025-07-17 17:53:18
16126 跟貼 16126
河北邯鄲初中數學求值題，構造零零模型來解題！

三樂大掌柜 2025-07-17 07:48:11
5 跟貼 5
熊三蛋子叫囂她請的律師不是吃干飯，又一個地中海

春風自如 2025-07-17 12:46:48
0 跟貼 0
聽老湯說他們為什么阻止52會議召開！

春風自如 2025-07-17 21:52:32
49 跟貼 49
離散擴散語言模型如何演化？NUS綜述解構技術圖譜與應用前沿

機器之心Pro 2025-07-17 10:24:10
0 跟貼 0
堂嫂土豆唇亡齒寒

春風自如 2025-07-18 09:42:34
11 跟貼 11
滿車奧特曼飛馳桂林高速，現實版“光之集結”，小孩：我爸爸拉過奧特曼

南陽日報 2025-07-17 14:04:37
0 跟貼 0

媒體人：中國男籃集訓隊結束歐洲拉練，已經平安落地北京首都國際機場。

媒體人：中國男籃集訓隊結束歐洲拉練，已經平安落地北京首都國際機場。

雷速體育

2025-07-18 10:23:51

5國采購中國大量武器，法國坐不住了，聲稱我國影響“陣風”銷路

5國采購中國大量武器，法國坐不住了，聲稱我國影響“陣風”銷路

軍行美

2025-07-16 17:20:07

一場抗戰前前后后打了十四年，到底是誰在抗日呢？

一場抗戰前前后后打了十四年，到底是誰在抗日呢？

翻開歷史和現實

2025-07-14 23:59:46

房子斌夫婦回應女兒高考成績，謙虛稱不至于夸耀，女兒長相很漂亮

房子斌夫婦回應女兒高考成績，謙虛稱不至于夸耀，女兒長相很漂亮

娛樂官已上任

2025-07-18 08:28:17

觸目驚心！甘肅幼兒園血鉛事件，調查組突查發現更可怕！

觸目驚心！甘肅幼兒園血鉛事件，調查組突查發現更可怕！

戶外釣魚哥阿勇

2025-07-18 09:35:27

開拓者媒體：利拉德拒絕多支爭冠球隊邀約回到開拓者，他是開拓者永恒的傳奇

開拓者媒體：利拉德拒絕多支爭冠球隊邀約回到開拓者，他是開拓者永恒的傳奇

雷速體育

2025-07-18 06:28:23

韋德：利拉德回到了他該在的地方，祝他在開拓者一切順利

韋德：利拉德回到了他該在的地方，祝他在開拓者一切順利

雷速體育

2025-07-18 06:28:11

沒拿“三哥”當自己人！ModelY印度上市，價格讓國內車主直呼幸福

沒拿“三哥”當自己人！ModelY印度上市，價格讓國內車主直呼幸福

小李車評李建紅

2025-07-17 07:58:08

李某蒔私密視頻上12國熱搜？4個月不報警，躲學校的原因才是關鍵

李某蒔私密視頻上12國熱搜？4個月不報警，躲學校的原因才是關鍵

小娛樂悠悠

2025-07-17 09:48:34

一定要戴手套！上海男子8天離世，死亡率近100%：你我都在犯！

一定要戴手套！上海男子8天離世，死亡率近100%：你我都在犯！

華庭講美食

2025-07-17 01:55:44

起底宗盛科技，宗馥莉親叔叔宗澤后的商業版圖

起底宗盛科技，宗馥莉親叔叔宗澤后的商業版圖

高見pro

2025-07-17 17:59:14

世亞預賽程引爭議：沙特卡塔爾均可休息5天，小組對手只能休2天

世亞預賽程引爭議：沙特卡塔爾均可休息5天，小組對手只能休2天

雷速體育

2025-07-18 12:35:20

超80個高溫紅色預警信號生效中！成都已下“開水”，四川周末迎降溫

超80個高溫紅色預警信號生效中！成都已下“開水”，四川周末迎降溫

魯中晨報

2025-07-17 14:32:28

44歲阿嬌北京獨居200平豪宅，落淚自曝：我本該有個20歲的孩子

44歲阿嬌北京獨居200平豪宅，落淚自曝：我本該有個20歲的孩子

橙星文娛

2025-07-16 12:55:37

當初全網吹爆的“神仙設計”，如今個個破爛不堪，你家還剩幾個？

當初全網吹爆的“神仙設計”，如今個個破爛不堪，你家還剩幾個？

裝修秀

2025-07-06 10:20:03

我們的大腦正被手機榨干！諾貝爾獎得主警告：信息富足的時代，稀缺的是注意力

我們的大腦正被手機榨干！諾貝爾獎得主警告：信息富足的時代，稀缺的是注意力

風向觀察

2025-07-11 17:12:47

親叔叔背刺不到24小時，又一方下場，宗馥莉最擔心的事還是發生了

親叔叔背刺不到24小時，又一方下場，宗馥莉最擔心的事還是發生了

小嵩

2025-07-18 07:58:48

預售慘淡，那英演唱會崩盤，刀郎場場爆滿！網友：蒼天饒過誰？

預售慘淡，那英演唱會崩盤，刀郎場場爆滿！網友：蒼天饒過誰？

喜歡歷史的阿繁

2025-07-18 06:05:24

男子情緒失控怒摔充電寶，機場立馬報警將其拘留5日

男子情緒失控怒摔充電寶，機場立馬報警將其拘留5日

映射生活的身影

2025-07-17 17:04:52

河南一女子殺害丈夫，警方卻找不到任何證據，半年后真相浮出水面

河南一女子殺害丈夫，警方卻找不到任何證據，半年后真相浮出水面

坦然風云

2025-07-17 03:30:03

AI產業主平臺領航智能+時代

13090文章數 66099關注度

往期回顧全部

科技要聞

凌晨，OpenAI重磅更新，Manus們算白忙活嗎

頭條要聞

宗慶后三弟:宗馥莉就是她自己根本不和宗家人來往

頭條要聞

宗慶后三弟:宗馥莉就是她自己根本不和宗家人來往

體育要聞

楊瀚森4戰43+20+15+9帽：開拓者4戰3勝

娛樂要聞

演員曹駿被曝新戀情？和女生舉止親密

財經要聞

美國國會正式批準穩定幣法案

汽車要聞

哈弗大狗2026款上市限時權益價9.89萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

旅游

游戲

健康

公開課

教育要聞

學簽放寬+工簽延長！新西蘭悄悄成為留學性價比新黑馬！

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

《大金剛蕉力全開》媒體評分解禁、M站均分90分成年度游戲候選

呼吸科專家破解呼吸道九大謠言！

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
你到底該和什么樣的人做朋友？
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：东至县| 濮阳市| 兴化市| 房产| 霍城县| 扎赉特旗| 鹤庆县| 仲巴县| 襄垣县| 长治县| 东源县| 德化县| 青海省| 隆安县| 凤山县| 河北区| 东乡族自治县| 房产| 娱乐| 积石山| 磴口县| 江华| 通化县| 启东市| 洞口县| 敦化市| 金塔县| 嘉兴市| 石狮市| 克拉玛依市| 沅江市| 大兴区| 来安县| 筠连县| 凯里市| 定州市| 静乐县| 盐边县| 郧西县| 平邑县| 东乡族自治县|

<blockquote id="ufjbk"><i id="ufjbk"><video id="ufjbk"></video></i></blockquote>