Manus發布會視頻截圖
文/二湘
這幾天中國一個初創公司的AI產品,Manus,引起了國內一些所謂的AI 大V的狂歡。什么整個硅谷都在討論,什么太震驚了,什么炸裂,史詩級發布,比肩Deepseek之類的用詞,看起來非常振奮人心。
Manus據稱是業界第一款通用AI代理,什么是通用 AI 代理(General AI Agent)呢?就是具備自主學習、推理和決策能力的人工智能系統,能夠在多個領域執行多步驟的任務。現在我們用的AI,不管是GPT,還是Deepseek,基本就是你問我答,只能執行一步,但是通用AI代理可以完成復雜的多步驟的任務。
舉個例子大家就明白了。比如,你告訴它“幫我規劃一次去倫敦的旅行”,它不會像現在的生成式 AI 那樣只是返回一些航班和酒店的搜索結果,而是會綜合你的預算、時間、興趣點,自動幫你訂機票、酒店,生成行程安排,甚至提醒你辦簽證、兌換貨幣等等,如果你的計劃有變,它還能自動調整。這種 AI 代理不只是被動地執行簡單的指令,而是能做決策,能真正的做事情,完成任務,就像一個真正的人一樣。
如果是這樣,那么人類就相當接近AGI了。看他們官方發布的視頻,幾個任務也都是很順暢地執行,自動生成一些報表和文字,看起來挺impressive的。
Manus發布會視頻截圖
但是又看到說這個產品其實并沒有正式上線,現在還是內測階段,要內測就要有測試碼,據說一個測試碼要一萬,有的還炒到了兩三萬。這就有些不正常。
之前chatGPT和deekseek出來的時候,我都寫過文章,尤其是Deepseek,那時候質疑Deepseek抄襲openAI的聲音很大,我還專門寫了一篇文章《Deepseek是真正的創新還是穿著AI皇帝的新衣?》力挺Deepseek。我自己親測了Deepseek,而且認真看了他們的技術論文(technical paper),還四處咨詢了一些AI做同類產品的大拿,他們業內的反應都是Deepseek是非常不錯的產品,是真正的國貨之光,我才放心寫文章。
這次Manus,我沒有親測。某大V說整個硅谷都在討論,但我問了一些硅谷的AI工程師,他們反應都是沒怎么聽說過。這就很奇怪,他們的發布視頻全程都是英文,網站也都是英文,顯然是面向國際市場,為什么硅谷做AI的朋友都沒怎么聽說呢?我又去搜了一下,也沒有什么大媒體報道,只看南華早報有報道。上次Deepseek爆火是因為Meta的幾個工程師在社交媒體談到Deepseek多厲害,然后迅速出圈,被美國多家主流媒體如《華爾街日報》《華盛頓郵報》《紐約時報》相繼報道,接下來才回流到國內的媒體。
我又去X看了一下,相關信息非常少。Manus自己的X賬號是2025年3月才開的。而Deepseek是2023年10月入駐X,到2025年2月發布R1,中間有一年多的時間了。Manus感覺是為了宣發才匆匆進駐美國的社交媒體。今天最新的消息是Manus的X賬號被凍結,據Manus的創始人季逸超說,此次封禁可能與第三方提及的加密貨幣詐騙相關,與他們的運營完全無關。
圖源網絡
然后很快我又看到一些自媒體的質疑聲音了,我比較信任的一個科技自媒體博主包老師認為Manus和一些鼓吹Manus的自媒體很快就要塌房了,他還提到他后臺助理有收到一個AI代理項目的推廣合作,但他的助理說他們不接付費廣告。包老師說Manus已經成為測試科技自媒體良心和專業水準的試金石。
那么,Manus會不會是像姜萍事件那樣的造假呢?我認為也不太可能,畢竟他們的創始人還是有一定的credibiity。創始人肖弘畢業于華中科技大學,有連續創業的經歷。首席科學家,也就是發布視頻里的那個叫季逸超的小伙子,也算是業內有點小名氣,曾經創業還拿到過真格基金的投資。另外就是,有幾個拿到測試碼的博主,自己親測過,覺得還行。比如一位MIT的技術博主親測后認為是good product,but not a technical breakthrough,就是還不錯,但也不是什么技術突破。他認為Manus不夠好的三個理由:
1. 它主要遵循事先定義好的流程來執行任務。這種預定義的流程在短期內還行,但從長遠來看,它會顯著限制系統的功能。
2. 它運行在一個相對受限的環境中,介于瀏覽器和操作系統之間。在預定義的軟件工具之外,它就無法運行。例如,它無法控制 PowerPoint 來為你制作幻燈片。但實際運用中許多軟件都超出了 Manus 的工具箱范圍。
3. 真正的技術突破應該是在一個完全開放的、操作系統級別的環境中,能夠像人類一樣完成大多數任務并操作各種軟件。
圖源網絡
根據這位博主的說法,這個產品既不是下一個Deepseek,也不是姜萍,應該是介于其中的一款還可以的產品。
技術上來說,Manus做的就是一個串聯和縫合不同模型和工具的事情,它的短板是沒有自己的模型和硬核技術。Manus第一步就是要求事先寫好一個任務流程,然后根據這個流程,調用大模型獲取信息,比如倫敦的航班和景點,第二步就是用推理模型分析這些信息,然后再用LLM調用不同的工具來做不同的任務,但是他能調用的工具也很有限,都是他現在的環境限定的幾個工具,比如瀏覽器,虛擬機和Python,用Python自動編程生成網頁,訂票等等,最后把你的結果展示在網頁上。Manus 糾錯能力比較差,稍微出點差錯就不行了,因為Manus用的是固定的流程,比較死板,離真正自主的智能體還差很遠。相對而言,Open AI的智能體用的方法就不一樣,它用的是一個單獨的模型來處理不同的任務,直接和環境互動,這樣,就可以處理不同的情況,處理復雜的任務,容錯能力也強很多。但是這樣來說,技術上難度大很多,當然也就很貴。現在,OpenAI的AI agent要價是2000到兩萬美金。實在是太貴了。
當然Manus團隊肯定也是有聰明人,技術上肯定也是在不斷地改進,最后到底是騾子是馬我們還是再等等。不過我覺得他們的產品在業內科技圈還沒有站穩腳跟,就這樣找自媒體自夸自擂的風氣實在不太好,有些急功近利了,這樣的營銷反而可能起到負面作用,還是要踏踏實實做出產品,長期積累,以技術和創新取勝,先得到圈內人的認可,才可能出圈。
另外,不管是自媒體還是媒體,對一件事情做出判斷之前還是要做一些盡職調查(due diligence),自己要不斷求證,做fact check,尤其現在這么容易造假,很多信息本身就不準確。另外不能迷信主流說法,人云亦云,不能為了迎合大眾而違心地說話,更不能為了錢說瞎話,要有自己的獨立思考,自己的判斷,要有質疑精神,也不要預設立場。
姜萍事件的時候,我是少數發出質疑聲音的博主,連續發了好幾篇文章《達摩院道歉,姜萍事件真相水落石出》,那時候很多博主都堅信姜萍是真天才,甚至說質疑姜萍的人都是卑鄙無恥的,許多人還留言辱罵我,我還是堅持自己的立場。而到了Deepseek,許多人因為慣性地對國貨不信任,又認為Deepseek是造假抄襲。我又力挺Deepseek,因此又被許多老讀者不理解。
空間美國書店可發貨到美國
其實不管是姜萍,還是Deepseek,我都是本著求真求實的精神,自己求證,做調查,又咨詢業內專家,既保留質疑,又不帶偏見地做出判斷。只有這樣,才能慢慢積累一個平臺的可信度,如果一個平臺多次對一些事件做出錯誤的判斷,那么這個博主的判斷力就要大打折扣,將來的可信度也會降低。
作者:二湘,喜歡碼字,著有長篇小說《暗涌》《狂流》,小說集《重返2046》,最新小說集《心的形狀》。
~the end~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.