Manus的X賬號,在不到一天的封禁之后重開。它發(fā)出了一條消息:
Manus聯(lián)合創(chuàng)始人季逸超,解釋了被封的原因:
我們的官方X賬戶昨日意外被暫停。我們正在積極與X的支持團隊合作解決此事。初步觀察表明,暫停可能與第三方提及的加密貨幣詐騙有關——這一領域與我們的業(yè)務完全無關。 特此澄清: Manus從未參與過加密貨幣項目、代幣發(fā)行或區(qū)塊鏈計劃 任何聲稱與我們有關聯(lián)的同名加密貨幣項目均為欺詐行為 我們正在對這些冒充者采取法律行動,并鼓勵用戶舉報可疑賬戶。
初試“國運”
從刷屏到反轉,Manus在國內(nèi)只用了不到一天。3月5日夜間,一個并不廣為人所知的中國團隊,突然發(fā)布了一個全英文的宣傳片,介紹了一款不從少量中獲得邀請碼就無法體驗的產(chǎn)品。它就是Manus,最大賣點是“全球首個通用Agent”。一些國內(nèi)的自媒體很快以為自己發(fā)現(xiàn)了“中國的下一個DeepSeek”,“核彈”、“王炸”、“國運”級別的文章立即紛紛出爐,提前“預告”了硅谷“一夜無眠”的震驚。
Manus的刷屏,吸引了國內(nèi)開發(fā)者與投資者,以及越來越多的圍觀者。他們一碼難求,開始深挖團隊背景。三名移動互聯(lián)網(wǎng)時代的創(chuàng)業(yè)者,曾在字節(jié)跳動負責產(chǎn)品的張濤,曾開發(fā)猛犸瀏覽器的季逸超,曾基于微信生態(tài)開發(fā)壹伴助手與微伴助手的肖弘。他們聯(lián)合創(chuàng)立了團隊Monica,據(jù)稱核心研發(fā)人員位于北京,此前推出的產(chǎn)品是一款AI瀏覽器插件Monica,主打“AI助手”。
Monica套殼了一堆美國的大模型,包括GPT、Claude、Gemini、Llama、Perplexity,等等,最近還添上了DeepSeek和GPT-4.5,第一印象是有點像一個模型小超市,也包括從這些模型中解鎖的一些常用的生成式AI功能,成為最初級的“智能體”商店。它還是Chrome和Edge這些瀏覽器的插件,因為無所不包,所以弄成了個“通用”的把戲。
Manus就很像Monica的Agent版。類似Sora或Devin剛發(fā)布的階段,Manus沒有開啟公開測試,官方也沒有提供技術報告,他們只是在內(nèi)部鼓搗,然后拿出來示人。人們只能根據(jù)有限的幾段官方演示,以及受邀測試者的反饋,大致拼湊出它的模樣:調(diào)用了若干大型語言模型的基礎能力,以及開源模型后訓練的能力,同時內(nèi)置了各類智能體,在一個相對受限的環(huán)境,通過預設的流程來執(zhí)行任務。這還是一個產(chǎn)品比較初級的階段,有點像拼出的積木,Manus就是Deep Research+Operator+Claude Computer。
Manus用的一些開源的技術,如Anthropic的模型上下文協(xié)議(MCP),將模型與不同數(shù)據(jù)源、工具聯(lián)系起來,如從Open Manus開源情況來看,Anthropic的Computer use項目和開源項目broswer-use給Manus提供了基本的支持。
但硅谷并沒有像國內(nèi)那樣“一夜無眠” ,國內(nèi)自媒體熬夜時,那里是白天。Manus在當?shù)貢r間5日在X平臺上官宣,第二天發(fā)布了一個GAIA測試碾壓OpenAI DeepSearch的結果,都沒有掀起波瀾,卻在國內(nèi)開始瘋轉內(nèi)銷。當天Manus還在X上發(fā)出邀請,關注者們提出自己的任務,由Manus完成并公布。然后,它就被查封了。
蹭、噴、開源......
在國內(nèi),Manus很快就被開源平替。MetaGPT團隊用3小時復刻的開源AI Agent產(chǎn)品Open Manus在國內(nèi)爆火,而來自開源平臺CAMEL-AI的團隊也實現(xiàn)“0天復刻”,還將系統(tǒng)中涉及的每一個部件單獨開源,供開發(fā)者選用。
OWL把Manus的核心工作流拆成了6步:
啟動一個Ubuntu容器(Agent遠程工位就位)
知識召回(把之前學過的內(nèi)容撿起來用)
連接數(shù)據(jù)源(數(shù)據(jù)庫、網(wǎng)盤、云存儲全覆蓋)
把數(shù)據(jù)掛載到Ubuntu(Agent的搬磚時刻)
自動生成http://todo.md/(規(guī)劃任務+寫待辦清單)
Ubuntu工具鏈+外接工具組合拳,執(zhí)行全流程任務
批評Manus的人,將其稱為“套殼”,各種功能其實已經(jīng)在很多其他產(chǎn)品里出現(xiàn)過;面對公開環(huán)境,泛化不足,上限較低。喜歡它的人,認為它將不同技術組合封裝起來,設計出簡潔直觀的交互界面,是直擊普通消費者內(nèi)心的產(chǎn)品;在一些任務上,它做的還行,基本符合預期。
Manus的宣傳并不比它的同行們更夸張,尤其是作為一家初創(chuàng)企業(yè)。它可以直接拿出一個半成品來,甚至只是產(chǎn)品功能層面或設計層面的一個小亮點,然后基于其使命拔高出一個產(chǎn)品概念,正體現(xiàn)出初創(chuàng)企業(yè)初生牛犢不怕虎的一面。很長一段時間,市場認為谷歌落后于OpenAI,就是因為與作為初創(chuàng)企業(yè)的OpenAI相比,谷歌這樣的大型上市公司,在發(fā)布產(chǎn)品時顧慮更多,至少要等待產(chǎn)品相對成熟。
只不過,現(xiàn)在輪到Manus“碰瓷”O(jiān)penAI了。據(jù)其官方介紹,在GAIA基準測試(評估通用AI助手解決真實世界問題的能力)中,Manus在所有三個難度級別上,都遠遠甩開了 OpenAI。但是,在GAIA位于Hugging Face經(jīng)常更新的排行榜上,看不到Manus的排名,盡管按照它在官網(wǎng)上公布的得分,目前仍然超過了榜單上的第一名。
反而是開源社區(qū)CAMEL-AI打造的OWL在GAIG榜上排名第三,超越了之前開源社區(qū)Hugging Face打造的Open Deep Research。
(來源:https://huggingface.co/spaces/gaia-benchmark/leaderboard)
產(chǎn)品出海
Manus邀請制的測試方式,包括它在X平臺上邀請其關注提出的任務要求,由團隊來完成再公布,而不是由用戶自己操作來完成,這也被許多人指責為對未來的饑餓營銷,但Manus有限的資源和不成熟的產(chǎn)品,是更實在的原因。
在Manus的X賬戶下,在其官網(wǎng)上,應網(wǎng)友的要求而完成的任務五花八門,如:
創(chuàng)建一個英偉達股市行情及分析的動態(tài)儀表盤;用SARSA強化學習提升股票交易策略;
通過計算機模擬設計出室溫超導的計劃;
在地球上某一具體地點,給出一個全太陽能自足的房屋建造計劃;
證明某一天文學現(xiàn)象;
設計一個四象限圖,用來分析所有NBA球員的得分特征;
某一階段某一國家關于其媒體和語言學研究的最好的著作,每類15分以上,并且概述其好在哪里;
結合具體的戰(zhàn)役,研究美國海軍在二戰(zhàn)中的軍艦損傷及起火控制及修復技術,在太平洋戰(zhàn)爭中戰(zhàn)勝日本海軍起到了決定性作用;
創(chuàng)建量子計算教學的動態(tài)網(wǎng)頁;
設計一個劇本寫作工具;
在周圍十個街區(qū)范圍內(nèi)找到一個價格45刀以下的健身房;
概述近期在高溫超導研究中取得的進展,以及建議攻讀博士學位的十個研究方向;
十個城市最大的地產(chǎn)經(jīng)紀,員工人類、成交數(shù)量、銷售收入、以及傭金標準;
還有設計旅行各種計劃的……
從Manus在網(wǎng)站上展示的實例來看,其左側的思維鏈很長,右側展示任務進度,直至最后交付,耗費了大量的token,有的也耗費了大量的時間。如Manus在視頻中展示的分析特斯拉股票的實例,完成這一任務,實際上用了大約一小時十分鐘。當然,耗時也意味著費錢。
X上的AI大V Chubby在測試了Manus之后,認為它的一些結果令人驚嘆,超過了OpenAI的Deep Research。尤其是他在詢問了一種疾病的治療方法,得到了一份28頁的詳細報告,令其感到這是所使用過的最好的智能體。
要花多少錢?Manus沒有說。Open Manus的一位用戶測試了下。提出問題是“杭州哪些醫(yī)院支持異地醫(yī)保直接結算?” 他找到了杭州醫(yī)保的界面,下載了其中的醫(yī)院列表,并保存為txt文件。
這一過程消耗了大量token。這位用戶使用的是Claude 3.7模型的API,花費了3.6美元(約合人民幣26元)。根據(jù)Claude 3.7 API價格(每百萬tokens/15美元)進行反向推算,這則問答耗費了整整24萬tokens,約等于36萬到48萬中文字符。
實際上,其中大量問題,是可以在DeepSeek上更快免費找到的,通過幾家前沿模型的推理、搜索、Deep Research等功能,同樣可以得到結果。Manus所做的,正是在Anthropic、OpenAI、Gemini、DeepSeek等模型的推理能力、多模型能力和智能體工具之上,再做出一個具備更鮮明智能體用戶體驗的產(chǎn)品,相當于AI搜索中的Perplexity。
真正的智能體
Manus是智能體共識在2025年的又一次體現(xiàn)。但不會是唯一一次,也不肯定會是最接近“DeepSeek時刻”的一次。中國企業(yè)正在加入基礎模型創(chuàng)新,也將在創(chuàng)新與應用中創(chuàng)造中國范式。
中國和美國整個AI界都在爭分奪秒地推出第一個真正的智能體,如果成功,肯定是殺手級應用。去年底,伊萊亞就宣告超級智能時代注定來臨,AI Agent將像人一樣思考。谷歌DeepMind發(fā)布DeepResearch等應用,哈薩比斯高調(diào)宣布2025年就是AI Agent之年。年初,OpenAI與xAI等都發(fā)布了類似產(chǎn)品。前者更是計劃讓月薪2萬美元的博士級智能體批量上崗,未來,類似的智能體將為其帶來20%以上的收入。
即使考慮到過度推理的問題,智能體也在正在成為算力消耗大戶。DeepSeek兩周就獲得上億用戶,成為史上增長最快的應用,但也讓自己陷入算力不足的處境,用戶體驗并不好。智能體的數(shù)量、能力,以及相互連接的通路,都可以近乎無限地增長,將指數(shù)級地消耗算力。看看吧,即使開放了少的可憐的邀請碼,Manus很快就宣告算力不足。
智能體性能的天花板,仍然是基礎模型的性能。Anthropic認為,Agent首先需要一個強大的模型。OpenAI認為,要通往AGI,就要先從推理者階段(L2)進化到智能體階段(L3)。但推理仍然充滿幻覺,面對現(xiàn)實世界的真實任務,拆分出來的步驟越多,“幻覺”就會累積到無法忽視的程度,到最終交付任務的時候,可能已經(jīng)相當走樣了。在數(shù)字世界都處理不好,就更難在物理世界起到真正作用了。
AI團隊如果僅僅交出經(jīng)過精心剪輯的Demo,不管是機器人還是智能體,已經(jīng)看起來越來越像噱頭了。Manus要證明自己,就要盡快足夠開放,也許它不像DeepSeek那樣,能最快吸引到專家大佬試試,但盡最大努力讓開發(fā)者和用戶大量參與進去,才有可能讓一個“通用AI智能體”生存下去。
如何不被追殺
搭車、對標,找個獨特的視角展示自己最閃亮的一面,是AI應用圈里子人人在玩的游戲。市場越狂熱,初創(chuàng)企業(yè)越多,越印證應用正在走向繁榮。期間,會有很多產(chǎn)品與創(chuàng)新像流星那樣一閃而過。號稱第一個機器人程序員的Devin就是這樣,演示、內(nèi)測令人振奮,但后續(xù)逐漸被其他同類產(chǎn)品淹沒。對于Manus來說,更重要的是在內(nèi)測階段如何更快完善產(chǎn)品,在正式推出時不被瘋狂開源平替的產(chǎn)品淹沒。
目前,Manus正在社交媒體平臺上與用戶互動,以了解真實應用場景,并招聘內(nèi)部測試體驗官,以改進優(yōu)化方向。Manus還在Discord上建立了社區(qū)。它還加強了海外的推廣。如這位X大V認為,Manus能在中國病毒式傳播,遲早也會傳到美國。不過他很老實,披露自己拿到了Manus的500個邀請碼。
中國當前AI應用的創(chuàng)業(yè)團隊,普遍經(jīng)過了移動互聯(lián)網(wǎng)的洗禮,積累了豐富的工程化與產(chǎn)品化的經(jīng)驗,能夠迅速迭代改進自己產(chǎn)品,令其獲得全球競爭力。兩個月內(nèi),DeepSeek將會開源R2,OpenAI很可能發(fā)布GPT-5。Manus可以邊改進,邊等待將新技術融入自己的產(chǎn)品。
但中國AI創(chuàng)業(yè)團隊也將面臨互聯(lián)網(wǎng)時代的巨頭競爭。在缺乏底層模型壁壘的情況下,產(chǎn)品很容易被像素級復制。在Manus發(fā)布一天后,市場上就已經(jīng)出現(xiàn)了開源平替版本,海外的復現(xiàn)也可能會如雨后春筍。如有必要,騰訊、字節(jié)跳動毫無疑問也能立刻推出自己的Manus。對它們的用戶生態(tài)而言,這是一個新的智能體入口。從通用搜索、通用AI搜索、通用AI智能體,這是一條清晰的進化與轉型軌跡。
進行產(chǎn)品和生態(tài)的創(chuàng)新,可能與技術的邏輯不太一樣。Manus沒有必要寫一篇論文發(fā)布。實際上,它甚至都沒有放到Github上。而那些揪住Manus不用中文首發(fā)的,大可不必,這是一家本來就是服務全球客戶的企業(yè),它的網(wǎng)站上有9種語言。
Move fast and break things!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.