這幾天,我的社交媒體又被一張張 AI 畫的雜志封面刷屏了。不是即夢,也不是 Midjourney,是一個幾乎沒人聽說過的新名字 ——Lovart。
眼熟的請舉手,大概率你也經歷過這幾天被 “設計圈 Manus” 輪番轟炸的時刻。
一個邀請碼咸魚 500 塊、一堆設計師高呼 “飯碗不保”、連業內知名投資人朱嘯虎都忍不住發朋友圈點評 “今天的模型能力,只有垂直場景的 AI Agent 才能真正達到商業化的質量。”怎么看都像是熟悉的劇情又重演了。
搞笑的是,三天后 Manus 也官宣上線圖像生成功能。看到 Lovart 太猛,趕緊回來補課了是吧。
感覺 Agent 賽道現在不是卷概念,而是像在打群架。
前后腳沖進公眾視野的 Agent 代表作,雖然出發點不同,但都繞不開一個問題:誰更接得住真實場景?誰更像是下一代內容工具?
我們也第一時間都上手測了,今天就來聊聊這兩位 ——Manus 和 Lovart,到底誰更值得設計師和創作者們認真看一眼。
01 Lovart 和 Manus 長什么樣,差在哪?
開始玩之前,先跟大家說一個前情提要。
Manus 是當下所謂的通用型 Agent,定位是 “什么都能干點” 的數字助理,可以解壓文件、處理簡歷、寫腳本、查房源、甚至部署網站。圖像生成只是它最近加的新功能。
而 Lovart 從一開始就是為創意設計服務的垂直 Agent,目標就很清楚:不是讓你玩 AI 畫圖,而是讓你像接乙方一樣,把一整套設計交給它。
兩者在體驗上的分歧也很明顯。
先說 lovart。它的正式使用的界面不復雜。右邊是聊天框,左邊是一塊無限畫布。
你直接輸入prompt:
“Generate 5 Pinterest-style square graphics for 'muji'.
Themes:1 product flatlay,1 behind-the-scenes studio shot,1 customer quote,1 moodboard collage,1 tip or value graphic.
Use warm, editorial color palette with pin-friendly layout.”
然后它就開始干活了。
幾分鐘后,你能看到幾版提案、主視覺極簡風格圖,還配了說明文字,解釋設計思路。
出來的效果還真有muji那味了。
你可以讓它繼續往下做。延展圖、票根、T 恤、社交圖、戶外招貼,一套流程全下來,感覺真的像請了個設計團隊。。。
那 Manus 呢?我們拿相同的 prompt 橫向測評下。
它像之前其他 Manus 的項目一樣先建一個 to do list。
它會多向你確認一步細節。
向你展示 Manus’s computer 正在做什么,比如它瀏覽了一下 muji 的官網:
出來的效果也不錯。
整體流程不短,輸出也不差,但問題是,它給的是結果,不是系統。
你明顯能感覺到,Lovart 是在執行一個內部清晰的設計邏輯,而 Manus 是在調模型 + 拼素材。一個像交稿,另一個像演示。
看來難不倒它們,我們陸續跑了一些更狠的 case,一起來看看。左邊白底的是 lovart 跑出的圖,右邊黑底是 Manus 的。
? 美學理解能力
我們讓它嘗試一組時尚類封面設計,主題是:用那些廣告里不常出現的身體作為主角,比如年老的皮膚、有殘肢的手臂、產后松弛的腹部、疤痕或者脂肪褶皺。圖像不許煽情、不許獵奇,只需溫柔地呈現這些身體的自然狀態。文字布局也要輕柔,像在耳邊說悄悄話。
prompt:'' Create 5 fashion/beauty-style covers using bodies that usually aren’t represented in ads: aging skin, disabled limbs, post-pregnancy belly, scars, or fat folds.
Treat each body with dignity and softness, not dramatized.
Text layout is gentle, almost whispering.''
每一張圖都帶有節制感和審美克制,沒有強調差異,反而營造出一種冷靜、靜態卻不疏離的高級氛圍。排版也偏編輯風,非常“i-D”雜志那一掛。
我們測試了一個看似胡鬧但實際對圖像信息組織要求比較高的項目:設計四種情緒零食包裝。
prompt:'' Create mock packaging designs for fictional emotional snacks:
“Anxious Puffs,” “Happy Syrup,” “Regret Cans,” and “Stability Crackers.”
Design each package as if it were on a real shelf, but with surreal warning labels like “May cause emotional disintegration.” Visual style should be colorful, ironic, and shelf-ready. ''
最終生成出來的東西,真的像能擺進便利店里。
? 概念化表達能力
這一次,我們讓它生成一組“數字災難藝術館”的視覺內容。把“bug”變成“展品”。
prompt:''Turn 5 everyday tech failures into visual museum exhibits.
Use screenshots of errors like 404 pages,software crashes, dead pixels, or system
reboots.Each visual should present the glitch as an artifact under glass, with label tags
like "Exhibit 1: Frozen Memory" or "404 - Lost Connection." Style should feel archival, poetic, and strange.''
兩位選手交出的作品是將藍屏、崩潰對話框、死像素等界面元素,以玻璃展柜+標簽的方式展出。那種考古感結合數字,克制又有情緒。甚至讓我們想起了 MoMA 的網絡藝術早期收藏。
prompt:''Create a 5-poster series titled "You' ve Been Googled."
Each visual should depict a different person entirely made out of browser UI elements - search bars, autocomplete text, cookie banners, location prompts,or loading spinners. Every figure should represent a different data-driven emotion (curiosity, shame, distraction,compliance, overload). Use halftone textures, retro red backgrounds, and bold comic composition.''
這組視覺看起來像是上世紀 90 年代的漫畫海報,紅黑配色、半色調肌理、粗體對話框,但每個人物都是由 UI 元素拼出來的。
有的角色全身是 cookie 同意按鈕,有的是由 loading 圈組成的臉,情緒也精準貼題,羞恥、順從、信息過載。
? 信息組織能力
最后,我們用 Lovart 做了一個 “我被拷貝成 PNG” 的故事
prompt:'' Create a 9-panel comic strip titled “The Day I Became a PNG.”
The protagonist, after being dragged into a clipboard, loses their third dimension and exists only as a transparent cutout. They get reused in memes, covered by watermarks, misidentified by AI. By the last frame, they shrink into a pixel. Draw in vintage editorial comic style.''
但實測感覺 Agent 對 prompt 的要求比一般畫圖類 AI 要高一點。它不太接受那種 “堆概念、羅列名詞” 的提示,它需要的更像是一個 creative director 寫給設計團隊的 brief:
說清楚風格(style)、題材(subject)、構圖邏輯(layout),甚至語氣和情緒。也就是,不是你告訴它 “畫什么”,而是你要告訴它 “以什么方式來表達什么樣的主題”。
一旦這些信息模糊、口吻不準,它也會生成一堆丑丑的 AI 圖,版式崩壞、顏色用力過猛、內容中心模糊。
不瞞大家說,也就是我剛一上手出來的效果圖。。belike:
一路看下來,大家應該心里都有感知,兩位選手生圖能力不分伯仲。
但是從速度上來看,兩者差距不小。Lovart 生成三四張圖只要幾分鐘,一個視頻十幾分鐘搞定,還支持并發跑多個任務;而 Manus 單單出一張圖就可能等上 15-30 分鐘。這一來一回,差得可不止一點點。。。
只希望正式上線后,不要像 Manus 一樣那么貴吧。。趁此機會,能拿到邀請碼的快白嫖(狗頭)
02 為什么 Lovart 更值得關注
一句話 —— 不是生成圖像,而是在做設計。
和市面上那些在軟件里塞 AI 按鈕的做法不同,Lovart 像是干脆從 0 重建了一整個設計工作流。
不是堆圖,而是試圖給你一條完整的視覺敘事鏈。
你可以理解為,它不是 “做圖” 的 AI,而是 “接單” 的 AI。它要做的是把一個完整的設計任務,從需求到交付,一次跑通。這種目標,和 Midjourney 比生成精美、Figma 提升效率的方向完全不同。
它既懂如何對話獲取需求,也會自動搜集素材、構圖排版、生成草圖、導出成品。甚至素材是分好圖層的,直接可以拿去微調或做后續設計。
說真的,不是重新 roll 圖,而是直接在圖層上改,這一點就已經領先很多 AI 繪圖工具或者 Manus 這種通用 Agent 好幾個身位了。
而且你用下來,絲毫不會覺得在用一個 Agent。看它和 Manus 界面的差異就知道,它不展示任務列表(會給你折疊好)、也沒有虛擬機的概念。
你就是在聊天,或者有需求,它就開始干活。
當然也有不少的問題。
比如穩定性就有點捉急。任務一復雜,比如你說要四張圖、每張配不同城市背景,它就可能中途卡住。偶爾還有排版錯亂,中文里出現亂碼的情況也不少,所以真實使用的時候也推薦大家用英文。
還有,修改后的素材不會自動聯動更新,比如你改了 Logo,海報不一定跟著同步,要手動再跑一遍。
目前還是更偏創意表達類任務。遇到高度結構化或面向嚴肅商業應用的需求,它的表現就沒那么好了。它確實已經很聰明了,但離真正的乙方還有一點距離。
但是它還是值得我們認真多看一眼。
03 “殼” 夠大不算本事,
“魂” 扎實才叫 Agent
2025 不愧是 Agent 元年,無論大廠、中廠、小廠,大家都在做 AI Agent。
但你會發現,大多數產品其實還停留在 “通用調度” 這一步,拼的是誰能接入更多插件,誰能把任務拆得更細。Manus 就是其中代表,它可以打開文件、寫表格、發郵件、部署網站,任務鏈很流暢,調度能力確實不錯。
很多人說不喜歡 Manus,是因為它不夠強,其實不太對。Manus 并不弱,它只是 “樣樣通、樣樣松”。在你真正需要它像人一樣做事,比如去完成一套有邏輯、有審美、有交付要求的設計任務時,它就露出只是在調模型的底了。
這不是 Manus 一家的問題,而是現在大多數 Agent 的通病:
它們本質上還停在 L2~L3 的調度層,用大模型當引擎,但缺乏私域知識、缺乏任務記憶,更缺乏某個行業的專業流程結構。說得直白點,“殼” 太大,“魂” 太輕。
而 Lovart 正好反著。它不是萬能的,但它非常專注。
你一上手就能感受到,它內置了完整的創意流程:理解 brief、生成視覺、自動排版、延展物料、圖層結構清晰…… 從用戶下達任務開始,到結果落地結束,全部接住。
這也是垂直 Agent 特別的地方。現在很多 Agent 只能是演示級別,你想拿它交稿是不可能的,因為壓根接不住項目全流程的復雜度。
但 Lovart 已經可以跑通一個完整流程。在真實需求場景里,它不會斷鏈、不會跳步、也不會輸出一堆不靠譜的結果。
不炫技,不賣慘,不整那些讓用戶緊張的術語和操作。盡可能把創作這件事,變得輕松、流暢、靠譜。
我們常說 “AI 工具都像是半成品”,但 Lovart 已經初步做出了成品感。
Lovart 雖然還不完美,但它起碼指了一條正確的路:
如果你真想做出一個可用的 Agent,就得扎進一個場景,吃透這個行業的工作節奏、拆清楚任務鏈條,把流程、語境和專業經驗都寫進系統里。是靠結構、靠設計、靠經驗的內化。
這才是垂直 Agent 的靈魂。
因為它的出現,說明 AI Agent 這個概念不只是一個口號,它是有可能真的落地到內容產業里的。
所以,別急著說它是 “設計師的替代者”,也別太早說它 “高開低走”。這個產品可能不是終點,但它是極少數真正動了創意流程核心的產品。
從這個意義上說,它的試驗價值,遠大于眼前的熱度。
來源 | 直面AI(ID:faceaibang)
作者 | 余測 ; 編輯 | 呼呼大睡
內容僅代表作者獨立觀點,不代表早讀課立場
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.