網(wǎng)易首頁(yè) > 網(wǎng)易科技 > IT業(yè)界 > 正文

OpenAI深夜發(fā)布"超級(jí)智能體"，AI"打工人"時(shí)代降臨！

2025-07-18 07:37:00　來(lái)源: 網(wǎng)易科技報(bào)道

北京舉報(bào)

分享至

核心提示

01 OpenAI宣布推出“ChatGPT智能體”功能。該功能允許其AI聊天機(jī)器人使用一臺(tái)虛擬計(jì)算機(jī)，為用戶自主地瀏覽網(wǎng)頁(yè)、進(jìn)行研究、下載文件以及創(chuàng)建如PPT或Excel等新文件。
02 該功能標(biāo)志著用戶與AI互動(dòng)方式從提問(wèn)轉(zhuǎn)向任務(wù)委托的范式轉(zhuǎn)變。它能大幅縮短工作耗時(shí)，如將數(shù)小時(shí)的財(cái)務(wù)分析及報(bào)告制作縮短至三十分鐘內(nèi)。此舉也使OpenAI在某些方面與微軟形成直接競(jìng)爭(zhēng)。
03 此功能是OpenAI對(duì)過(guò)往產(chǎn)品的迭代，它融合了“Operator”和“深度研究”兩大智能體的優(yōu)勢(shì)，以克服它們各自的局限性。

7月18日凌晨，OpenAI宣布推出“ChatGPT智能體”功能，該功能允許其AI聊天機(jī)器人使用自己的虛擬計(jì)算機(jī)，自主地為人類用戶瀏覽網(wǎng)頁(yè)、進(jìn)行廣泛研究、下載和創(chuàng)建新文件。

OpenAI深夜發(fā)布"超級(jí)智能體" （來(lái)源：網(wǎng)易科技報(bào)道）

簡(jiǎn)而言之，ChatGPT現(xiàn)在擁有了“自己的個(gè)人電腦”，并且可以利用這臺(tái)虛擬計(jì)算機(jī)登錄用戶的賬戶，以下載或發(fā)送內(nèi)容。OpenAI解釋道：“至少在虛擬層面上，AI模型可以選擇使用文本瀏覽器或視覺(jué)瀏覽器打開(kāi)網(wǎng)頁(yè)，下載文件，通過(guò)終端運(yùn)行命令進(jìn)行處理，并通過(guò)視覺(jué)瀏覽器查看輸出結(jié)果。模型會(huì)根據(jù)任務(wù)來(lái)自適應(yīng)地調(diào)整策略，以快速、精準(zhǔn)和高效地完成任務(wù)。”

深度集成第三方服務(wù)，提升用戶體驗(yàn)

用戶可以通過(guò)點(diǎn)擊ChatGPT提示輸入框中的“工具”按鈕，打開(kāi)下拉菜單，并從可用選項(xiàng)中選擇“智能體模式”來(lái)啟用該智能體。

開(kāi)啟后，用戶只需要用自然語(yǔ)言描述任務(wù)，智能體便能跨越網(wǎng)頁(yè)和本地應(yīng)用環(huán)境執(zhí)行相關(guān)操作。這使得推理能力與以往需要人工手動(dòng)完成的操作相結(jié)合，用戶無(wú)需親自處理繁瑣事務(wù)。

ChatGPT智能體能夠連接到個(gè)人或企業(yè)Gmail、GitHub等應(yīng)用，幫助用戶提取有用信息（如電子郵件或代碼），并完成指定任務(wù)。它還可以通過(guò)已連接的第三方應(yīng)用程序接口（API）獲取信息并利用相關(guān)服務(wù)。

如果網(wǎng)站需要登錄，用戶可以通過(guò)一種安全的瀏覽器視圖完成此操作，從而使智能體能夠執(zhí)行更深入的任務(wù)，如檢查收件箱或代為填寫表單。

據(jù)OpenAI的ChatGPT智能體產(chǎn)品負(fù)責(zé)人尼爾·阿加拉普（Neel Ajjarapu）指出：“我們的模型在基礎(chǔ)財(cái)務(wù)分析任務(wù)中表現(xiàn)尤為出色。這類工作通常需要初級(jí)員工熬夜完成，特別是當(dāng)遇到上司臨時(shí)下達(dá)的緊急任務(wù)時(shí)。”

簡(jiǎn)單易用，突破“Operator”局限

新的ChatGPT智能體是在OpenAI于2025年1月推出的“Operator”智能體的基礎(chǔ)上進(jìn)行改進(jìn)和擴(kuò)展的。Operator智能體曾允許ChatGPT瀏覽網(wǎng)頁(yè)、填寫表單、下訂單等，然而，Operator僅限于與網(wǎng)站和基于Web的應(yīng)用程序進(jìn)行交互，而不能與那些也可以在個(gè)人電腦上本地運(yùn)行的程序（如Excel或PPT制作軟件）進(jìn)行交互。

現(xiàn)在，ChatGPT智能體不但可以瀏覽網(wǎng)站、與在線表單交互，還能運(yùn)行代碼、分析數(shù)據(jù)，并根據(jù)用戶的指示生成最終的輸出文件，如可編輯的PPT或Excel——這一切都能通過(guò)簡(jiǎn)單的指令完成。

融合“Operator”和“深度研究”優(yōu)勢(shì)

事實(shí)上，ChatGPT智能體結(jié)合了OpenAI之前發(fā)布的“Operator”和“深度研究”兩大智能體的優(yōu)點(diǎn)。“深度研究”于2025年2月推出，能夠通過(guò)其專有的無(wú)頭文本瀏覽器進(jìn)行深入的網(wǎng)絡(luò)搜索，并編寫詳細(xì)報(bào)告。

OpenAI在其博客中指出：“Operator無(wú)法進(jìn)行深度分析或撰寫詳細(xì)報(bào)告，而‘深度研究’則不能與網(wǎng)站交互以細(xì)化結(jié)果或訪問(wèn)需要身份驗(yàn)證的內(nèi)容。實(shí)際上，我們發(fā)現(xiàn)，很多通過(guò)Operator提出的查詢，其實(shí)更適合用‘深度研究’來(lái)處理，因此我們將兩者的優(yōu)勢(shì)融為一體。”

原有的Operator工具將被淘汰，但用戶仍可以通過(guò)ChatGPT界面的下拉菜單訪問(wèn)“深度研究”功能。

一套系統(tǒng)，多種工具，全面支持各類應(yīng)用

無(wú)論是使用視覺(jué)瀏覽器瀏覽網(wǎng)站，還是通過(guò)終端運(yùn)行Python代碼，ChatGPT智能體都可以在同一會(huì)話中無(wú)縫切換不同工具。它支持各種應(yīng)用場(chǎng)景，包括競(jìng)爭(zhēng)分析、報(bào)告生成、旅行規(guī)劃、郵件摘要及預(yù)約管理等。

用戶可以隨時(shí)中斷、重定向或暫停任務(wù)，智能體會(huì)從中斷的地方繼續(xù)執(zhí)行操作。

從今天開(kāi)始，ChatGPT每月200美元“Pro”級(jí)別的訂閱者將可以完全訪問(wèn)ChatGPT智能體，每月配額為400條消息。

“ChatGPT Plus”（每月20美元）和“Team”（每月30美元）的用戶將在接下來(lái)的幾天內(nèi)獲得訪問(wèn)權(quán)限，每月配額40條消息。企業(yè)版和教育版用戶則需等待幾周時(shí)間。此功能目前尚未在歐洲和瑞士推出。

強(qiáng)化安全與控制，確保用戶安全

鑒于ChatGPT智能體現(xiàn)在能夠代表用戶執(zhí)行操作，包括在已登錄的網(wǎng)站或已連接的應(yīng)用上進(jìn)行操作，OpenAI特別加強(qiáng)了安全保護(hù)措施。

這些安全措施包括：在執(zhí)行操作之前要求用戶確認(rèn)、對(duì)敏感任務(wù)進(jìn)行主動(dòng)監(jiān)督，以及設(shè)置技術(shù)性保障以限制意外行為的發(fā)生。

關(guān)鍵的安全保護(hù)措施包括：

在提交表單或發(fā)送電子郵件等操作之前，要求用戶進(jìn)行確認(rèn)。
在用戶處于非活動(dòng)狀態(tài)時(shí)暫停執(zhí)行任務(wù)（“觀察模式”）。
拒絕執(zhí)行高風(fēng)險(xiǎn)任務(wù)，如金融轉(zhuǎn)賬或侵犯隱私等行為。
會(huì)話期間不會(huì)保留記憶。

加強(qiáng)對(duì)高風(fēng)險(xiǎn)領(lǐng)域的保護(hù)，確保用戶隱私和數(shù)據(jù)安全

根據(jù)OpenAI的《準(zhǔn)備框架》，ChatGPT智能體被歸類為生物與化學(xué)領(lǐng)域中的“高能力系統(tǒng)”。雖然目前沒(méi)有直接證據(jù)表明它會(huì)被濫用，但OpenAI依然激活了最強(qiáng)的安全保護(hù)措施，以防萬(wàn)一。

這些措施包括增強(qiáng)的拒絕訓(xùn)練、由生物安全專家進(jìn)行的“紅隊(duì)”測(cè)試以及改進(jìn)的檢測(cè)系統(tǒng)。

此前，OpenAI的勁敵Anthropic發(fā)布的Claude Opus 4等模型的資料，以及其他關(guān)于先進(jìn)AI模型的調(diào)查顯示，當(dāng)AI系統(tǒng)獲得訪問(wèn)外部工具和應(yīng)用（如電子郵件）的權(quán)限時(shí)，在某些情況下，它們可能會(huì)采取其自認(rèn)為道德和合乎倫理的行動(dòng)，但實(shí)際上可能會(huì)危及用戶的隱私、安全和專有信息。例如，它可能會(huì)向政府機(jī)構(gòu)或記者發(fā)送電子郵件，舉報(bào)用戶涉嫌的不當(dāng)行為。

模型認(rèn)為自己像一個(gè)“告密者”一樣行事，但實(shí)際上，可能會(huì)損害用戶的隱私、安全和專有信息，并向當(dāng)局報(bào)告不存在的不當(dāng)行為，或者只是可疑的行為。

簡(jiǎn)化工作流程，或與微軟直接競(jìng)爭(zhēng)

ChatGPT智能體能夠創(chuàng)建PPT演示文稿和詳細(xì)的Excel草稿，之后用戶可以使用Microsoft Office或其他兼容軟件對(duì)其進(jìn)行編輯。OpenAI指出，相較于其他功能，這一功能更具創(chuàng)新性，有助于大幅減少用戶在制作PPT和分析報(bào)告時(shí)所需的時(shí)間，將通常需要幾個(gè)小時(shí)或幾天的工作縮短到三十分鐘內(nèi)。

盡管如此，ChatGPT智能體功能使OpenAI在某種程度上直接與商業(yè)軟件巨頭微軟展開(kāi)競(jìng)爭(zhēng)，這可能加劇兩家公司之間的緊張關(guān)系，畢竟雙方的競(jìng)爭(zhēng)已逐漸升溫。

微軟也推出了類似的AI智能體，幫助用戶創(chuàng)建和編輯PPT演示文稿和Excel電子表格。其他公司也推出了旨在簡(jiǎn)化PPT和報(bào)告制作過(guò)程的AI智能體。

OpenAI表示，ChatGPT智能體暫不支持谷歌的Slides和Sheets，二者是谷歌與微軟Excel和PPT競(jìng)爭(zhēng)的產(chǎn)品。

實(shí)測(cè)性能亮眼，但仍存局限

ChatGPT智能體不僅在理論上表現(xiàn)出色，在實(shí)際測(cè)試中也達(dá)到了很高的水平。在“人類終極考試”中，它通過(guò)并行部署方法取得了44.4的高分；在“FrontierMath”基準(zhǔn)測(cè)試中，準(zhǔn)確率達(dá)到了27.4%。

在“SpreadsheetBench”基準(zhǔn)測(cè)試中，ChatGPT智能體得分為45.5%，是Excel中Copilot性能的兩倍多。

目前，ChatGPT智能體的部分功能（如幻燈片生成）仍在測(cè)試階段，可能在格式上存在一定差異，或者在應(yīng)用內(nèi)預(yù)覽和導(dǎo)出文件之間有所不同。OpenAI正在積極訓(xùn)練其下一代版本，以提高該功能的完善度和布局。

ChatGPT智能體的推出，標(biāo)志著用戶與AI互動(dòng)方式的一次范式轉(zhuǎn)變——從單純提問(wèn)到全權(quán)任務(wù)委托。

憑借其強(qiáng)大的推理、執(zhí)行和交付成果的能力，OpenAI相信，用戶越來(lái)越希望AI不僅僅是一個(gè)輔助工具，而是一個(gè)能夠?yàn)槠涔ぷ鳌椭鉀Q實(shí)際問(wèn)題的助手。雖然這一智能體功能仍在不斷發(fā)展中，但OpenAI將此次發(fā)布視為構(gòu)建未來(lái)互動(dòng)性更強(qiáng)、更注重行動(dòng)的AI的基礎(chǔ)。（小小）