昨天凌晨,OpenAI 推出了一款新產(chǎn)品,ChatGPT agent。
最興奮的不是廣大用戶(畢竟 200 刀的 Pro 用戶沒那么多),而是各家 Agent 競品。
Manus 發(fā)布多則推文與 ChatGPT agent 「正面較量」。圖片來自:https://x.com/ManusAI_HQ/status/1945954009547677992
Manus 連發(fā)十幾條推文,把自己的 Agent 產(chǎn)品和 OpenAI 的新 Agent 一項項對比,暗示自己才是更早、更快、更好用的那一個。
Genspark 創(chuàng)始人發(fā)推文展示 Genspark 和 ChatGPT agent 結果對比。 圖片來自:https://x.com/genspark_ai/status/1946005869533311030
Genspark 也發(fā)了個輕描淡寫但意味深長的 demo,說自己在同樣的提示詞下「一次搞定」,并補了一句:
我們不想制造什么 drama(戲劇性效果),只是為整個 Agent 生態(tài)感到興奮。當然,也為我們自己的絲滑體驗小小自豪一下。
這場熱鬧,不像是一家巨頭發(fā)布新品,更像是扔進 Agent 市場的一顆「競品炸彈」。
OpenAI 發(fā)布的這個 ChatGPT agent 到底怎么樣?能讓同類產(chǎn)品連夜上線 battle 模式?
目前 ChatGPT agent 已經(jīng)向全部的 Pro 用戶推出。而由于需求高于預期,Plus 和 Team 用戶將于周一開始獲得訪問權限。
我們搜集了一些網(wǎng)友們的實測案例分享,試著還原一下 Agent 的基本樣子,也找來了 Kimi、Manus、Minimax 幾個典型的對手,做了一次實測對比。
看看這個遲到幾個月才出現(xiàn)的 ChatGPT Agent,到底是王者歸來,還是落后補作業(yè)。
它確實能替你干活,但是不是「萬能」還得另說
博主 @rowancheung 提前獲得了訪問權限,他嘗試要 ChatGPT agent 給他生成一份完整的退休計劃 PPT。
他輸入的提示詞是:
為年收入 50 萬美元、希望 30 歲退休并擁有 500 萬美元的人創(chuàng)建一個 FIRE 模型。
模型包括極端儲蓄率(80%+)、稅收優(yōu)化、高效復利的投資策略,以及在加拿大溫哥華生活的生活成本。包含不同提款率的情景,并展示與傳統(tǒng)退休計劃相比需要作出的犧牲。
然后,創(chuàng)建一個可下載的演示文稿。
ChatGPT agent 的流程還是很順的,只花了 20 分鐘左右的時間就幫他完成了任務,生成了完整的 PPT。
查找當?shù)囟惙ǎ馗缛A),并分析平均每月支出率
計算 30 歲退休所需的儲蓄,研究最優(yōu)投資配置
發(fā)現(xiàn)全新的稅收優(yōu)化策略,構建多個 FIRE 場景
創(chuàng)建了可下載的演示文稿,其中包含結果
依舊是在 ChatGPT 的聊天窗口里面進行,它甚至不需要詢問額外的偏好或者其他信息,直接啟用虛擬電腦,自動搜索和總結歸納信息,過程中完全不需要自己動手點擊。
最后 ChatGPT agent 生成了一份 14 頁的 PPT 文檔。說實話,我看到這個成品是有點失望的,因為實在是太簡陋了。
上下滑動查看更多內容,來源: https://x.com/rowancheung/status/1945896543263080736
這位博主說如果他請一位財務顧問來做這件事,他需要花費 5000 多美元,而且要花幾周的時間。
當被其他用戶問到,覺得 ChatGPT agent 怎么樣,是不是一款令人驚喜的產(chǎn)品,還是僅僅是功能的增強時?他也直接說,
最令人印象深刻的是電子表格和幻燈片生成功能,但結果與我使用 Manus 或 Genspark 獲得的結果類似。
鑒于大多數(shù)人還沒有嘗試過其他工具,它對大多數(shù)人來說都會是令人興奮的。
言外之意大概是,如果你嘗試過其他工具,大概興奮不起來。
還有其他用戶分享通過 ChatGPT agent 來幫助他準備一份購物清單。他說看著 ChatGPT 瀏覽網(wǎng)站、提示他輸入登錄詳細信息、將商品添加到購物車并自主完成整個過程,是令人難以置信。
請幫我為這個周末兩個人的烤肉晚餐,準備一個特易購購物清單,并包括一道甜點。
來源: https://x.com/thealexbanks/status/1945921363237052589
不過他在評論區(qū)也提到如果是自己去做這件事情,可能會更快。
網(wǎng)上的案例分享大多都是在解決一些生成 PPT、表格或者制定計劃清單等任務上。但很明顯,我們的生活里面遠不止這些問題需要 Deep Research。
同樣的,規(guī)劃行程之類的問題還是更偏向于模糊性質的任務,對于我們實際工作生活中要處理的,更嚴肅的,需要更高準確度的任務,ChatGPT agent 輸出的內容想必經(jīng)不起太多的推敲。
不過,它確實是做到了一個「進化版」的 ChatGPT。
Manus、Kimi、Minimax 表示:我做得更好
我們讓 Kimi、Minimax、和 Manus 也一起來做了「加拿大退休計劃」這個任務,看看 ChatGPT agent 是否比這些先前推出的產(chǎn)品更出色。
首先是 Manus,它的速度是最快的。我把需求發(fā)送給它,十分鐘不到的時間,它就結束了整個任務。
和 ChatGPT agent 一樣,Manus 也會啟用一個「Manus 的電腦」來可視化模型執(zhí)行任務的過程。
但是最后的結果,明顯會比使用 ChatGPT agent 生成的 PPT 更「好看」的感覺。至少,Manus 不像 ChatGPT agent 只是單純的黑白。
而在內容上,它給我生成了 10 頁的 PPT,可能是中英文切換的原因,Manus 內容比 ChatGPT 要更寬泛一點,整體上是差不多。
此外,相比 ChatGPT agent,Manus 不會在 PPT 文檔里面標注引用的信息源。
上下滑動查看更多內容,訪問鏈接:https://manus.im/share/kwujwPDSTQe4y8vAKQZR5Q
Manus 官方自己也下場,做了多個和 ChatGPT agent 對比的嘗試,正面硬剛。
首先是在新加坡設立企業(yè)這個任務,Manus 說,自己能夠提供更優(yōu)質的研究和演示文稿。
在加拿大退休計劃任務上,Manus 是實際地完成了這件事情,而 ChatGPT agent 停留在空泛的計劃上。
第三個對比是計劃一次 3 天的棕櫚泉網(wǎng)球之旅,ChatGPT 依舊是白底黑字的 PPT,Manus 則是色彩豐富,使用符合棕櫚泉、網(wǎng)球等特點的圖片背景。
在舊金山城市預算分析與演示這個任務上,Manus 提到自己不僅是給你數(shù)據(jù),還完成了一個項目;截圖里顯示 ChatGPT 生成的 PPT 只是表格,而沒有可視化的分析……
多個對比,從電子商務、金融分析、餐廳預訂、航班查找、行程規(guī)劃、和報告分析等不同的任務上,Manus 都表示比 ChatGPT agent 聰明,且生成的內容更全面、更好看。
Manus 還在更新相關的對比情況,目前是已經(jīng)發(fā)布了 10 個與 ChatGPT agent 比較的推文。
第二個我們嘗試了 Minimax,它花的時間很長,大概有將近一個小時。Minimax 也會有一個類似虛擬電腦的「Minimax 視窗」,就像 ChatGPT agent 或者 Manus 一樣,實時的顯示它的思考和行動過程。
讓我感到驚喜的是,Minimax 不僅給我提供了可以下載編輯的 PPT 文檔,還有一份純文字的 PDF 報告,同時還給了我一份在線瀏覽的鏈接。
Minimax 生成的文字報告
上下滑動查看更多內容,在線瀏覽:https://rd4hl2nxlutu.space.minimax.io/
對比 Manus,我覺得 Minimax 這份報告又更嚴謹,無論是內容上要更詳盡,還是數(shù)據(jù)的可視化效果,都做的比 ChatGPT agent 和 Manus 要好。
最后是花了最長研究時間的 Kimi,大概有超過一個小時。它是目前還沒有被完全叫做 Agent 的一個產(chǎn)品,仍然是以 Deep Research 的形式出現(xiàn),所以它沒有虛擬電腦實時顯示過程這個頁面。
就像前段時間,Kimi 團隊成員在自己的博客里面寫到的一樣,Kimi 做的不只是一個聊天機器人。它可以做的,不再是簡單的返回 Markdown 文本,而是從 chat-first 到 artifact-first(從「以對話為中心」到「以任務成果為中心」),讓 AI 構建交互式前端。
博客里面也提到,他對于 Agentic Model 的理解,是一個必須能循環(huán)性完成任務的模型。一個 Agentic Model,不是你問一句、它答一句的「問答機」,而是一個能自己「觀察、思考、嘗試、糾錯、再嘗試」,最終完成復雜任務的模型。
大概正因為如此,Kimi 也是唯一一個,在獲取到我的任務提示詞之后,會問我現(xiàn)在多大,租房還是買房等等問題的助手。這也讓我覺得,這才像是一個現(xiàn)實生活中真正的「秘書」。
最后,Kimi 深度研究的結果也是最讓我滿意的,它生成的報告非常非常的長,內容也是最詳細的,同樣在 PPT 文檔里面也會有信息引用的標注。
上下滑動查看更多內容;此處僅展示全部內容的 50% 左右,預覽鏈接:https://www.kimi.com/preview/1981ba88-3871-8785-9e20-edd331000509
ChatGPT agent 作為新入局的 Agent 產(chǎn)品,給我的感覺就是像他們直播的時候說的一樣,
ChatGPT 智能體將 Operator 與網(wǎng)站交互的能力、深入研究在整合網(wǎng)絡信息方面的優(yōu)勢,以及 ChatGPT 的對話能力有機融合,形成一個統(tǒng)一的智能體系統(tǒng)。
它也就只是把 Deep Research、Operator、ChatGPT 這三樣結合起來了。
所以,它生成的 PPT 會很像是 Deep Research 的文字版,不會像 Kimi、Manus 這些產(chǎn)品,在前端、產(chǎn)品美學上下功夫。
但他們還是有一個共同點,就是這些 Agent 產(chǎn)品已經(jīng)能完成復雜內容任務,且體驗越來越像是「協(xié)作型 AI 工具」而非「問答機器人」了。
我想這次 ChatGPT agent 的出現(xiàn),可能不是多么厲害的「革命性升級」,但確實是另一個信號:
從「回答問題」到「執(zhí)行任務」,AI 的形態(tài)正在變化,而大模型 AI 公司的野心也開始從語言模型本身,擴展到「誰來承載未來人機交互的主入口」。
歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.