Manus的“上帝之手”稱號近日被一個新的AI智能體——Flowith旗下的Neo奪走了。這款智能體背后的團隊不僅異常年輕,還在社交媒體上宣稱在0營銷投入的情況下,實現了130萬美元的ARR收入。
在GAIA智能體評測標準的三個等級中,Neo不僅超越了Manus,還創下了新的評分記錄。其中Level1和Level3更是突破了“整數級”評分。
目前的智能體市場可謂是“大風起兮云飛揚”,新玩家不斷涌入這一賽道。從傳統互聯網巨頭到專注產品研發的初創團隊皆有涉足。
各類產品紛紛打著“AI智能體”的旗號,但正如一些網友所說:許多所謂的智能體,不過是在Manus的框架上又疊加了一層LLM而已,萬物皆可套殼。
今天,讓我們深入分析下這款標榜自己是“下一代AI生成力”的產品,看看它是否是“穿新鞋,走老路”。
01
Flowith Neo:無限步驟、無限上下文、無限工具
在Flowith產品官網中,如果點開輸入框右上角的Agent Mode,則自動啟用 Agent Neo,在此模式下,Neo可以智能調控各種大模型,完成長序列的復雜任務。
在非智能體模式下,Flowith則提供了諸如常規模式、聯網搜索、圖片/視頻生成等“垂類功能模式”。每一個模式里,都集成了數量非常多的市場主流LLM。
Flowith將它們能夠提供的所有存貨幾乎都擺了出來,并分成T1/T2兩個陣營,我稍微數了下,一共近30個模型。
它們集成了市場上幾乎所有主流的大模型,涵蓋了幾乎所有模態,例如Claude 3.7 Sonnet、Grok3、GPT Image1、Gemini 2.5 Pro preview、o3、o4 mini、DALL?E 3、Flux、Recraft和Kling等。
相對于Flowith的上一代智能體Oracle,Neo最大的提升在于它將任務搬到了云端執行,智能體嵌套、上下文、工作步驟都得到了大幅的性能和穩定性提升。
這款新晉智能體產品主要有三個亮點:無限步驟、無限上下文和無限工具。
我們通過一系列測試來逐一展示這些特點。
(1)無限步驟
Neo由于將任務的執行搬到了云端,現在的它幾乎可以在任務中一直工作,即便用戶關閉了網頁,它對于用戶本身網絡環境的依賴已經不再是必需的了。
一個最明顯的樣本是:它可以幫你訂閱幾乎大量平臺的關鍵KOL或者是新聞媒體,并調用推理和相關模型撰寫報告,發送到你的郵箱。并且用戶可以規定發送的頻率,Neo幾乎會無限制地在云端跑流程,不斷地重復工作步驟。
如果想要Neo完成此類任務,可以直接輸入一段非常簡單的Prompt:
請你幫我找到10家最主流AI新聞媒體,并將它們最新更新的消息做成簡報,每兩小時更新一次,發送到我的郵箱。
Neo 會以非常快的速度處理用戶的Prompt,它此時的第一步就是在工作流程中與用戶交互,確認我的電子郵件地址。
Neo制定了一個非常詳細的流程圖,明確每個步驟的任務,為自己做出了一個清晰的整體視圖。
Neo按步驟執行工作,收集所需知識和信息。信息來源十分廣泛,并且會不斷地檢查信息內容是否與用戶需求相一致。
以下就是Neo所找到的10家AI新聞信息源:
Neo會從先前確定的10家AI新聞媒體的官方網站分別獲取各自最新的3-5篇AI相關新聞報道的詳細內容,并使用browser從每個網站上獨立抓取信息。
Neo會多線程同時處理10家媒體的信息抓取任務,并將所有信息整合做出一份簡報:
第一份結構化的AI行業最新簡報順利地發到了我的郵箱,內容幾乎占用了12頁的Word文檔。
后續,我的郵箱中陸續收到了幾份來自Flowith在云端執行定時任務的稿件。
(2)無限上下文
從實際體驗來看,Neo 的上下文非常之長,常常能達到數萬甚至數十萬字的地步。
這種超長的上下文能力使得Neo能夠記住之前的對話內容,保持上下文連貫性,避免了頻繁重復之前的敘述或信息,從而提升了交互的效率和質量。
在實際應用中,這意味著我們可以與Neo進行長時間、多輪次的深入對話,而無需擔心它會“忘記”之前的討論內容。
比如,我試著讓它做了一個全球文科倒閉潮的可視化報道切片,提示詞比較簡略:
收集2024年至今中國大陸、新加坡、英國、美國、韓國、日本所有大學裁撤文科的情況,并在一張世界地圖上進行可視化呈現。
拿到提示詞后,Neo 會先在左側的 workflow 面板里自行規劃出一整套清晰的工作流程,然后按步驟一項項執行任務。
考慮到最終生成的內容可能過多導致混亂,它貼心地設置了一個 Files 面板,將所有生成的文件整理歸類,便于隨時查閱。
不到十分鐘,它就收集好了九個地區的數據,并自動整合成了一篇結構完整的報道。內容不僅詳實、分析有理,而且自帶思辨性,與用戶的意圖進行了對齊。
Neo設計的交互界面幾乎是一步到位,呈現效果也非常流暢自然。
“無限上下文”的Neo究竟能產生多少個文檔?這是一個無法給出確切數字的問題。
在這一項任務中,它就累計了如此多的信息內容:
(3)無限工具
Neo的操作流程兼容多種外部工具,并整合了Flowith自推出以來就廣受好評的知識花園功能。知識花園其實就是我們一般所說的“知識庫”,但Flowith會在你上傳知識內容后,以“Seed”作為最小單元識別其中的知識。
為了增強Neo的檢索能力,我會外掛知識花園中與AI相關的知識庫,以增強Neo的檢索能力,其中包含與人工智能相關的豐富信息。
然后輸入Prompt:
幫我找到 20 個非常專業的 AI 科技 X(原 Twitter)博主,做成網頁。
然后,我又讓AI模型自動豐富這些提示詞,規定好了顏色顯示等等條件。
Neo開始調用外掛工具,進行大量的相關信息搜索:
在Neo實際的工作步驟中,Flowith將所有工作流搬到了“無限畫布”中,很直觀地顯示出了一個“紡錘形”的思考樣態。
在進行HTML網頁任務的前期,Neo會先進行知識積攢,這也是為何思維流程中體現出“兩邊細,中間寬”的形態。
經過三個版本的迭代,Neo成功制作了一個HTML網頁項目。
在這個網頁中,它將奧特曼、楊立坤、吳恩達等一眾X上的AI科學家和博主匯集在一起,為每個人貼上了標簽,并實現了交互功能。每個名字下方還附有該博主在X上的鏈接,用戶可以一鍵直接訪問。
可以看得出來,Neo非常適合這類“需要調用多種工具并且高度復雜的任務”,它對于大模型的調控和整體流程的把控都非常的嚴謹。
比如,Neo與其他AI智能體最大的一個區別就是:它會在工作流程中大量地嵌入審查機制,比如在每一個結果產出之前和之后都會進行自我反思。即便在所有項目結束后,也會給出好幾份審查報告、項目總結報告等等。
在每一個節點之中,Flowith都允許使用者進行單一節點的微調工具。
在文檔文件中,Flowith則允許用戶使用文本編輯器,實時手動更改文件內容甚至是代碼。無論是在編寫程序代碼還是修改文檔內容方面,Flowith都提供了一個直觀且友好的操作界面。
這樣將用戶也視作參與者的操作,雖然有放權嫌疑,但也能夠讓后續的效果更好。
Neo能將整個創作流程以可視化流程圖的方式展示出來,我可以對其中任意節點“點選修改”“局部重啟”,真正實現模塊化調用“無限工具”創作的自由調度。
這可能是 Neo 區別于傳統 Agent 的關鍵能力:不是“從頭再來”,而是“就地優化”。
02
Flowith,一家在OpenAI o1發布之前就早已深耕Agent賽道的選手
Flowith最初在全網嶄露頭角的名稱還只是“畫布式AI創作平臺”,但卻一直在探索智能體方向,第一代產品Oracle于2024年8月就已發布,甚至早于OpenAI的推理模型o1的發布。這款產品在各個社區都有一定的熱度。當時的Flowith憑借Oracle甚至被譽為“讓Chatbot式AI成為歷史的下一代工具”。
這家初創企業背后的團隊也異常年輕,Flowith由倪正民(Derek Nee)團隊于2024年正式推出。這位96后CEO在20歲前就曾創立X Academy、項目超過千萬人民幣ARR的Realm項目,都曾風動一時。據“觀察者網”心智觀察,Flowith的全體團隊都是95后,市場負責人郭梓溢本人則是00后。這家團隊在架構體系中幾乎將任務導向做到了新高度:每周團隊可能會有100個任務,而每個人只需摘取自己最適合的任務。他們在團隊構建中拋棄了傳統的任務分配機制,轉而采用鼓勵極致創新的開放式思路。
在這樣的團隊中孕育出來的Oracle顯然也帶有創新基因,這款產品最大的特色在于交互范式的創新。它沒有沿用傳統聊天框+黑箱執行的模式,而是開創性地引入了畫布多線程交互理念。Flowith 沒有自己訓練大模型,而是專注于上層架構和交互創新:通過可視化工作流編排,把LLM的推理能力、搜索工具、插件能力組合起來。
這一理念的背后,其實代表了兩種AI使用觀念的差異:Manus 等追求的是AI完全自主行動,用戶給出指令后AI自主完成一切;而 Flowith 則強調“用戶”角色,等同于坦誠了一個事實:現在還不存在通用AI智能體,但是有了用戶的參與,Flowith能夠表現地更好。
比如,在上面的操作演示中,我們可以清楚地看到Flowith為用戶提供了微調和干預流程的能力,確保 AI 輸出更精準地滿足特定需求。例如,用戶可以在 Flowith 畫布的特定節點添加自定義數據源,使最終報告的關鍵信息往往能超越 Manus。
03
與大廠截然不同的思路
百度Q1財報的公眾號文章中就把AI智能體放在了很重要的位置,不斷地強化自家平臺已經接入“幾千+MCP組件”,在未來更是會將通用AI智能體的任務類型擴展數十萬的水平。然而,Flowith 卻走了條不同的路:研發了個“模擬人類大腦思維流程”的AI智能體工作流。
這或許僅是一種噱頭,實際上更多地取決于使用者的個人偏好,這也反映了當前智能體市場所呈現的世界參差感:熱愛者視之為真愛,可能是通向AGI的必由之路,而不喜歡者則覺得這玩意就是個噱頭。
不過,不得不說的是Flowith仍然使用行業主流的LLM,在智能能力上沒有顯著突破。它的優勢在于速度更快、操作更流暢以及更強的反思能力。盡管如此,Flowith還是成功地將智能體產品投入市場,因此建立了獨特的競爭優勢。
Flowith 所塑造的競爭壁壘主要在于用戶社區和創新速度。前一代Oracle自發布以來,到今年Neo推出之前,一直在小眾社區中保持了一定的熱度,但也受到不少批評,比如多線程工作容易卡死、非云端導致用戶過于依賴網絡環境。
不過,Neo的上線很大程度上解決了這些問題。
Flowith的另一個潛在壁壘是團隊一直想要構造的“社區”。各網絡平臺上其實一直都有這么一句笑言:少玩產品,多搞社區。像是Flowith很早就搞了個“知識花園”功能模塊,每個人跑完自己的工作流程還可以繼續分享Recipe到社區里。這就會形成獨特的知識共享網絡,這會吸引新用戶的加入。
總的來說,Manus、Lovart、字節的扣子空間、百度的心響,以及一些將AI智能體應用于自家搜索產品的公司,構成了整個智能體賽道。
但目前來看,與行業熱度一起到來的還有些許亂象。
從Manus 在 GAIA 上的綜合成功率顯著超過了 OpenAI 的 DeepResearch 等系統,刷新了該基準的SOTA性能記錄開始,幾乎所有大廠全部下場搞智能體。然而,沒過多久,這些產品的宣傳重點從智能體的能力轉向了產品本身的能力,接著又開始宣傳MCP工具的接入。
整個行業好像已經從AI能力優先,轉化為生態優先。先將產品做出來,搶奪完用戶,再煮酒論英雄。像Flowith這樣的智能體在整體工作流程中幾乎將自己的“腸子”都挖出來,向各位看官證明一下自己吃了幾碗粉,仿佛成了一股清流。
前OpenAI 副總裁 Lilian Weng 曾在博文中將智能體的標配總結為:Agent = LLM + Memory + Planning + Tool Use。
而在預訓練大模型幻覺率仍居高不下的當今,我們將會看到這樣一個局面:再靠純LLM能力突圍已經不再現實,從基礎模型上挖掘不到更多的寶藏。各家廠商都在產品側,以產品經理的思維尋找突破口。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.