當地時間7月17日,OpenAI方面宣布推出全新通用人工智能代理ChatGPT agent。
據了解,ChatGPT agent在保留ChatGPT智能對話能力與流暢性的同時,整合了OpenAI此前發布的多種智能體工具相關能力,其中包括Operator的網頁交互能力、Deep Research的信息整合與分析能力等。同時OpenAI還為ChatGPT agent配備了一系列工具,包括可視化瀏覽器、文本瀏覽器和直接API訪問權限等。
據OpenAI方面透露,ChatGPT agent可以思考和行動,能夠主動從代理技能工具箱中進行選擇,使用計算機為用戶完成復雜的多步驟任務。例如用戶可以要求ChatGPT agent處理諸如“查看我的日歷,并根據最新消息向我簡要介紹即將召開的客戶會議”、“計劃并購買食材制作四人份早餐”、“分析三個競爭對手并制作幻燈片”等任務。
同時OpenAI方面還強調,ChatGPT agent專為迭代協作式工作流程而設計,其交互性和靈活性遠超以往產品。據悉,在ChatGPT agent運行過程中用戶可以隨時中斷任務,“以澄清您的指令、引導其朝著預期結果前進,或徹底更改任務”。如果任務耗時超過預期或進度停滯,用戶可以暫停任務、要求ChatGPT agent提供進度摘要,或是完全停止任務并接收部分結果。如果用戶在手機設備上安裝了ChatGPT應用,還能夠在任務完成后收到相關通知。
OpenAI方面公布的測試數據顯示,ChatGPT agent在多項測試中表現優異。例如在 “人類終極考試” 中,ChatGPT agent單次嘗試通過率達41.6%,取得SOTA成績,采用并行策略時分數提升至44.4;在“前沿數學”基準中,ChatGPT agent準確率達27.4%,大幅超越以往模型;在BrowseComp基準中,ChatGPT agent以68.9% 的成績創SOTA。
對此OpenAI CEO山姆·奧特曼表示,ChatGPT agent代表了AI系統能力的新高度。
安全性方面,在執行涉及敏感(例如發送郵件、購買商品、提交個人數據)或重要操作前,ChatGPT agent會明確征得用戶的授權,確保用戶始終掌握控制權。同時ChatGPT agent還具備主動監督和風險緩解功能,能夠主動拒絕高風險任務,例如金融交易或敏感法律互動。
據了解,目前ChatGPT agent已率先向ChatGPT Pro開放,并將逐步向ChatGPT Plus、ChatGPT Team等用戶開放。其中,ChatGPT Pro用戶每月有400次使用次數,其他付費用戶每月有40次使用次數,同時用戶還可以額外付費以獲得更多的使用量。相關用戶在與ChatGPT對話時,通過編輯器中的工具下拉菜單選擇“代理模式”,即可直接激活ChatGPT agent。
面向未來,OpenAI方面表示,“ChatGPT agent雖然已經是一款處理復雜任務的強大工具,但今天的發布僅僅是一個開始。我們將繼續定期迭代添加重大改進,使其功能更強大,并隨著時間的推移惠及更多用戶”。
此外需要注意的是,日前OpenAI方面還宣布,隨著ChatGPT agent的上線,現有的Operator研究預覽版將在幾周后關停,而Deep Research則不受影響。
【本文圖片來自網絡】
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.