99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

深度實測Manus,這就是AI Agent行業的DeepSeek時刻

0
分享至

文 | 闌夕

Manus刷屏一天,從開始的一夜成名,到中間的一碼難求,再到質疑它的宣發一擲千金,整個過程里,FOMO情緒和直覺警惕交纏不休,是很有意思的傳播學樣本。

其實AI行業這幾年來一直都是「炸裂驅動型」的資訊模式,了解的都已經祛魅了,不了解的卻還會少見多怪,但是有一說一,天天這么炸裂下來,客觀上也會存在真的炸裂蒙混其中。

而我對Manus的評價就是,它確實屬于真·炸裂的那一桌,稱得上AI Agent行業的DeepSeek時刻,不過有個補丁,結尾時我再疊上。

先看Manus的一個演示效果:

讓它開發一款文字互動游戲,可以扮演谷歌公司的CEO,通過體驗公司歷史上的重要決策,既能獲得游戲的樂趣,也可以順便了解公司的文化。



用了差不多一個小時,Manus把谷歌CEO模擬器的網頁游戲開發好了,完成度很高,點擊開始游戲,還會讓你自選難度,接著就會面對谷歌發展史上的每一次轉變節點,你的選擇會決定公司資源的變化,并影響最終的游戲結局。

在一個小時里,用一句話,做一個游戲出來,這就是AI Agent的能力。

它和傳統的對話式AI不同,不再只是提供信息層的答案,而是能夠操作電腦完成更加具體的工作任務,包括但不限于寫程序、做網頁、整報告、篩簡歷等等等等,它能夠完全自主的解決過程中遇到的各種困難,并交付工作結果,當然也有例外,這個例外我們后面再說。

目前主流的AI Agent服務不多,而且普遍很貴,比如ChatGPT Operator需要200美元一個月Pro會員才能使用,還有主打編程市場的AI工程師產品Devin,每個月的費用更是要500美元。

Manus的開發商是中國大模型團隊Monica,目前是免費測試階段,單任務成本壓縮到了2美元,是OpenAI的1/10,同時在基準測試的排行榜上已經超過OpenAI拿下了全球最強。

我在拿了邀請碼后,已經在幾個小時之內耗盡了Manus的單日計算資源,確實非常興奮,效果也非常震撼。

展示幾個實測案例吧:

首先我讓它幫我做一張linktree風格的個人主頁,Manus把這個任務拆成了8個步驟,先在全網搜集我的資料信息,包括我在各個平臺的鏈接以及代表作,然后基于linktree的設計風格開始編寫網頁代碼,半個小時之后,它交付了這么一個作品給我。

簡單,但是完美符合要求,交互也都沒問題,寫輪眼級的復制效果,如果想做得更美觀,還可以繼續寫提示詞讓它修改。

第二個測試,是我用Manus幫一個工程師群友解決實際問題,他在工廠里負責維護的阿特拉斯機械臂出了點小問題,找售后的話費用要花幾千塊錢,不如自己想辦法找補,他又懶得看文檔,于是直接給了我一段話,讓Manus看看怎么處理。



注意啊,這個需求理論上普通的對話式AI也能接住,但會需要更多的交互流程,比如你得把文檔喂給它,一步一步的得到答案,但是Manus不需要這些,它會自己去阿特拉斯官網下載文檔,讀完之后找到解決問題所需的關鍵內容,仔細分析,創建程序,最后的代碼我發給了朋友,有點小瑕疵但手工修改之后完全可用,直接省掉了一次售后呼叫的次數。

第三個測試,是我的微博讀者提議,讓Manus去做一個國家的極簡編年史,我增加了漫畫表選和網頁設計的要求,最后交付的作品配色有點難繃——AI沒有審美,這點必須反復強調——但是這時Manus的服務器已經宕機了,暫時沒法修改,所以我也就把半成品展示出來吧。



可以看到,Manus將英國的歷史分成了10個不同的時代,并基于時代風貌繪制了SVG圖片,最后呈現在HTML的網頁端,可以說是人機協同的樣板間了,無論是作為課外教案還是作品預覽,都有極其便捷的上手門檻。

最后一個案例,是我讓Manus做一款消消樂游戲,但是圖標得用原神的角色,它先是開始研究消消樂的游戲機制和實現方法,接著試圖搜集原神的圖片素材,這個時候就出現例外了,它第一次發出了接管請求,原因也很讓人無語,它的運行邏輯被一個網盤給堵住了,沒法注冊賬號,所以下載不了資源,想讓我幫它去下載。

看來再強大的AI,也會被網盤的會員攔在門外。

本著盡可能讓AI Agent獨立完成工作的原則,我沒有這么做,而是稍微改了一下需求,讓Manus改用科技公司的logo來做游戲圖標,因為開放版權的SVG素材全網都是,所以這下Manus跑起來就沒什么問題了,很快就做完了一個帶積分的消消樂游戲,玩起來也算順暢。



不過也能看到,在解決這類相對復雜的問題時,Manus在細節方面的缺失還是有的,這也和人類(我)參與過少有關,比如對屏幕的適配問題,需要給它更多的說明,Manus的修改響應也不慢,但因為同樣遇到了服務器宕機的麻煩,這個任務暫時沒有繼續精進下去。

我覺得這幾個實測例子已經可以非常清晰的表明,AI Agent在現階段的能力和不足,Manus已經不是那種只能操作瀏覽器的產品了,它本身具有沙盒環境,能在完成工作之前自行進行測試,驗收合格再做交付,但也限于互聯網的數據邊界,如果網絡上的資源不夠,它是沒有辦法生產資源自給自足的。

我還做了一些偏文書類的測試,也可以用來對比AI Agent的特點:

比如我讓Manus根據B站最熱門的10個星見雅(游戲角色)視頻,給出她的操作技巧。



Manus是真的足足看完了10個視頻——花了一個多小時的時間——再去把各個UP主的小作文精煉成了我要的材料,而且相當準確,同樣的任務如果交給聯網的大模型去做,雖然也能完成,但幻覺的產生概率很高,在「老實」程度上不及AI Agent靠譜。

再如讓Manus去研究PolyMarket的套利可能,雖然我確實有那么一絲期待,想得到一個穩賺不賠的投資指南——別笑——Manus倒是兢兢業業的做足了功課,列出了四個套利機會,讓我只要在PolyMarket看到符合條件的項目出現,就能無腦按規則下注。



從回放來看,Manus每次都是從最基礎的信息開始切入,先了解PolyMarket是什么,再分析預測市場的游戲玩法,接著結合平臺規則構建風險策略,標準的實習生作風,任勞任怨,踏實耐用。

對了,回放這個設計,在我看來也是Manus的亮點之一,它有點像推理模型暴露思維鏈的選擇,很多時候,AI的思考過程要比答案供給更能給人啟發,Manus的每一個任務都有回放功能,且可被分享出去,它在解決問題的途中所展現出來的手段,完全稱得上是另一種形式的智能資產,可以扮演人類的老師。

所以話說回來,我評價Manus是AI Agent行業的DeepSeek時刻,這里需要打一個補丁,是DeepSeek-V2時刻,2024年5月,DeepSeek開源V2版本的模型,這是它第一次出圈,因為價格非常便宜,但是因為模型本身的能力一般,所以當時很多人只是覺得DeepSeek要來打價格戰了,感到意外但不重視,熱度也沒有持續太久。

直到DeepSeek-V3和R1的連續發布,大家這才發現事情完全不一樣,一夜之間整個大模型市場的成本邏輯都被顛覆了。

最初,沒有人在意這場災難,這不過是一場山火,一次旱災,一個物種的滅絕,一座城市的消失,直到這場災難和每個人息息相關。——「流浪地球」

我的意思是,AI技術的發展是連續性的,而在這條跌宕起伏的曲線上,每一次的信號強度都決定了后面的突破深度,就像DeepSeek沒有V2就不會有V3,更不會有R1,我對Manus的看法沒有變化,在把AI Agent服務從專業場景帶向通用場景的歷史轉折點,它就是開山立派的創始品牌。

從用例來看,作為AI Agent的功能性非常強大,對于拆解任務的熟練度很高,CoA(代理鏈)的觀測感覺和看CoT(思維鏈)很像,能「看到」AI在多個方案里評估并尋求最優解。

理論上應該是內置了海量的CoA來做承接,就和DeepSeek這類推理模型也是提前消化了足夠豐富的CoT之后才會推向大眾市場,盡可能的覆蓋到了主流需求,從官網的Use Case就能看到。

有什么問題可以在評論區留言,或者說出你們想讓Manus完成哪些任務,我可以幫著測試。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
從 454 萬到 7 億!數據撕開董宇輝被罵 "忘恩負義" 的遮羞布

從 454 萬到 7 億!數據撕開董宇輝被罵 "忘恩負義" 的遮羞布

不寫散文詩
2025-06-04 20:30:07
巴勃羅-托雷:尊重弗里克不讓我上場的決定,但很多時候我并不理解

巴勃羅-托雷:尊重弗里克不讓我上場的決定,但很多時候我并不理解

懂球帝
2025-06-06 03:18:16
俄軍炸出大事了,俄羅斯又給我們上了一課:敵人不投降就停水停電

俄軍炸出大事了,俄羅斯又給我們上了一課:敵人不投降就停水停電

星光歷史
2024-12-28 11:24:50
48歲左小青走紅毯,不知道她尷不尷尬,反正我挺尷尬的,何必呢

48歲左小青走紅毯,不知道她尷不尷尬,反正我挺尷尬的,何必呢

喜歡歷史的阿繁
2025-06-03 11:36:18
黑暗中的一點光,你看好王鈺棟、劉誠宇成為下屆世預賽核心嗎?

黑暗中的一點光,你看好王鈺棟、劉誠宇成為下屆世預賽核心嗎?

懂球帝
2025-06-05 23:57:03
吳邦國的父親吳忠性簡介:解放前拒絕去臺灣,被譽為“測繪將軍”

吳邦國的父親吳忠性簡介:解放前拒絕去臺灣,被譽為“測繪將軍”

方圓文史
2025-06-03 23:59:44
北京一家8口去吃席,海鮮茅臺吃到撐,回家發現忘記隨禮了

北京一家8口去吃席,海鮮茅臺吃到撐,回家發現忘記隨禮了

濤哥美食匯
2025-04-23 08:45:43
粉的,白的,紅的,紫的!!!

粉的,白的,紅的,紫的!!!

風子說個球
2025-05-22 12:01:06
比亞迪降價風暴:庫存1544億背后的生死時速

比亞迪降價風暴:庫存1544億背后的生死時速

新電實驗室
2025-06-04 00:19:13
保時捷女銷冠真容曝光!2年賣出340輛,同事披露她賣車多真正原因

保時捷女銷冠真容曝光!2年賣出340輛,同事披露她賣車多真正原因

博覽歷史
2025-06-05 16:15:03
山東再添一家市級三甲醫院,總投資約27億,計劃2026年底竣工!

山東再添一家市級三甲醫院,總投資約27億,計劃2026年底竣工!

醫脈圈
2025-06-05 22:00:05
三亞衛健委再通報女子被咬身亡事件:就尸檢等問題與家屬溝通,以進一步查明死因

三亞衛健委再通報女子被咬身亡事件:就尸檢等問題與家屬溝通,以進一步查明死因

極目新聞
2025-06-06 00:39:31
破案了!終于知道具俊曄為什么暴瘦!原來他每天都去金寶山看大S

破案了!終于知道具俊曄為什么暴瘦!原來他每天都去金寶山看大S

小娛樂悠悠
2025-05-13 07:50:26
浪姐成團夜最大意難平:侯佩岑的告別文案比舞臺更戳心

浪姐成團夜最大意難平:侯佩岑的告別文案比舞臺更戳心

陳意小可愛
2025-06-06 03:56:58
支付100億,波音天價和解!

支付100億,波音天價和解!

民航之翼
2025-06-05 14:04:14
京媒評“蘇超”:體育局長輸球的委屈全寫在文旅局長的笑臉上

京媒評“蘇超”:體育局長輸球的委屈全寫在文旅局長的笑臉上

懂球帝
2025-06-05 00:23:13
又作妖?美國狂推穩定幣,又一場貨幣戰爭?才明白中國的先見之明

又作妖?美國狂推穩定幣,又一場貨幣戰爭?才明白中國的先見之明

大歪歪
2025-06-05 17:58:29
6月4日俄烏最新:左右逢源行不通了

6月4日俄烏最新:左右逢源行不通了

西樓飲月
2025-06-04 19:27:36
發現沒有?今年反常的很,老百姓不再關心房價漲跌、國際形勢如何

發現沒有?今年反常的很,老百姓不再關心房價漲跌、國際形勢如何

詩詞中國
2025-05-19 13:06:10
多地停止申領!只因“國補”資金用完了,別急....

多地停止申領!只因“國補”資金用完了,別急....

電腦報
2025-06-04 18:08:52
2025-06-06 04:52:49
闌夕 incentive-icons
闌夕
最具觀點的互聯網商業評論
2322文章數 73916關注度
往期回顧 全部

科技要聞

對話盛景網聯彭志強:跳出SaaS虧損黑洞!從“賣工具”到“賣結果”的AI RaaS轉型法則

頭條要聞

特朗普:我要求馬斯克離開 馬斯克瘋了

頭條要聞

特朗普:我要求馬斯克離開 馬斯克瘋了

體育要聞

提前無緣美加墨世界杯 國足眾將賽后落淚

娛樂要聞

陳赫宴請好友,李乃文攜妻子罕見亮相

財經要聞

習近平同美國總統特朗普通電話

汽車要聞

旗艦+大六座+百萬級 阿維塔全新SUV預計明年量產

態度原創

親子
本地
手機
公開課
軍事航空

親子要聞

爸爸才是孩子真正的起跑線

本地新聞

非遺里的河南 | 黃河泥變身千年墨寶,寫字都帶仙氣兒~

手機要聞

領先蘋果iPhone 17 Air!華為Mate XTs三折疊將國內首發eSIM

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

普京明確:沒有人會與“恐怖分子”談判

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 全椒县| 云安县| 峨边| 云龙县| 彰武县| 潜山县| 大城县| 汉中市| 溧水县| 新安县| 农安县| 桂阳县| 祁东县| 青州市| 临江市| 水富县| 睢宁县| 札达县| 丽江市| 崇义县| 五指山市| 云龙县| 化州市| 铜梁县| 蕲春县| 陆丰市| 广丰县| 寿阳县| 汾西县| 平舆县| 无极县| 三门峡市| 乌什县| 余庆县| 旬邑县| 宁乡县| 通榆县| 夏邑县| 喜德县| 九江县| 东辽县|