機器之心報道
編輯:楊文、+0
一手實測。
還記得那個號稱「全球首個設計 Agent」的 Lovart嗎?
它是繼 Manus 后在海外爆火的另一款 Agent 產品,而且學到了 Manus 的「精髓」:有邀請碼才能體驗。當時國內出現了「一碼難求」的盛況。
最近,這個 Lovart 出了國內版,名叫星流 Agent,專注于設計和創意內容生成。
它背后接入了 F.1、Kling、Qwen、hailuo02 等數十個頂尖模型,不僅可以創建各種風格的圖像,包括照片、插畫、藝術作品等,還能制作視頻、品牌 logo、海報設計,甚至是 3D 模型。
體驗地址:https://www.xingliu.art/
與 Lovart 不同,星流 Agent 登錄即可用。首次登錄用戶可免費體驗三次,并有 150 個積分,如果邀請好友注冊,則可另外獲得 200 個積分。
我們在機器之心編輯部邀請了一堆好友,但積分消耗太快,只能花 49 塊錢去買了個會員。
接下來,我們就奉上一手評測,看看這錢花的到底值不值。
一手體驗
星流 Agent 的產品界面設計得蠻簡潔,主要分為四個區域。
左上角為工具欄,包括 AI 工具箱、插入、智能畫板等;下面則是生成器設置區,可選擇基礎模型、圖片和顏色參考以及生圖尺寸等;中間部分為輸出作品區,以無限畫布的形式預覽、編輯作品;最右側則是最核心的AI 對話區,我們在此輸入提示詞、聯網來指使它干活。
生成圖片或編輯功能
先來試試海報制作。
我們上傳一張時尚照片,輸入提示詞:
提示詞:使用這張圖片,創作高端時尚商業海報,展示穿蓬松白色服裝的優雅女性。添加“Business”、“Negin Mirsalehi”、“MODE 101 ZOMERSE ITEMS”、“BEAUTY Eyeliners”、“OP REIS KOPENHAGEN”等文字內容。
領到任務后,它先是進行用戶需求和圖片分析,然后給出 4 種設計方向,我們選擇其一后,它就開始 AI 潤色提示詞、設計要點拆解等,最終使用 F.1 Kontext 模型輸出圖像。
這張海報生成得簡約大氣,也完全遵循了提示詞,尤其是英文字體沒有出現拼寫錯誤,但是在后續生成中文海報時,星流 Agent 出現了 bug。
提示詞:新鮮飽滿的草莓,顆顆紅潤飽滿,表面帶有細膩水珠,質感細膩誘人,商品居于畫面中央,色調以鮮艷草莓紅為主基調,融入嫩綠葉片與象牙白裝飾點綴,背景為天然棉麻織物,襯托出清新自然的氣息。風格定位為自然健康,適用于電商促銷海報創作,營造出清爽、安心、天然的視覺情感氛圍。畫面強調高品質食品攝影質感,采用自然主義手法表現水果真實狀態,頂部設置醒目宣傳語 “來自自然的甜蜜”,底部配文 “當天采摘 新鮮直供”,輔以點綴文字 “香甜多汁”,突出商品特性與吸引力;特別強調品質標語 “自然好食材季”,英文標識為 “NATURAL FRESH HEALTHY & ORGANIC”。文字采用清爽圓潤字體,美觀實用并重,畫面層次清晰,商品質感突出,自然風格精準體現健康視覺沖擊,設計輸出須嚴格符合網格系統布局規范,確保元素對齊、間距統一、比例協調。
在第一次生成中,星流 Agent 選用 F.1 Kontext 模型,出現英文拼寫正確、中文亂碼的情況。我們繼續提要求:畫面中的文字使用正確的書寫。星流 Agent 依然使用 F.1 Kontext 模型,還是輸出一堆鬼畫符。
(冷知識:經過我們多次對比測評,生成中文字體效果最好的圖像生成模型是Seedream 3.0,可在即夢選擇「圖片3.0」使用)
直到第三次,星流 Agent 才完全搞定,至于最后使用的是哪個模型,思考過程并未提及。
再來看看九宮格表情包。
提示詞:一套 9 個超級可愛超萌的表情包,9 宮格,一只可愛的小兔子,第一格是小兔子揮手的動作,文字是 “你好呀”;第二格是小兔子鼓掌的動作,文字是 “加油哦” ;第三格是兩只小兔子擁抱的動作,文字是 “抱抱”,第四格是小兔子比心的動作,文字是 “謝謝”;第五格小兔子是大笑,文字是 “哈哈哈”;第六格是小兔子豎大拇指動作,文字是 "你好棒";第七格是小兔子開心跳躍的動作,文字是 “開心”;第八格是小兔子生氣鼓腮的動作,文字是 “哼!” ;第九格是小兔子睡覺的動作,文字是 “晚安啦”。極簡主義,手繪插圖風格, 淺色主色。
星流 Agent 先根據提示詞分別生成 9 張表情包圖片,然后將其組合成 9 宮格布局,不過在此過程中,它有兩個小毛病。
一是在單獨生成表情包時,第一張 「你好呀」 文字生成準確無誤,但拼接成 9 宮格后,出現了「吞字」的問題。
二是在排版設計 9 宮格布局時,經常遇到生成錯誤導致任務失敗。
我們又讓它給機器之心生成一個品牌 logo,并開啟「網絡搜索」。實話實說,這 4 個設計在美觀度上有所欠缺。
而在生成攝影風格圖片方面,星流 Agent 審美還挺在線。
比如輸入提示詞:兩位朋友在咖啡館里大笑,紀實攝影風格,自然光。
它會先使用知識庫生成相關的設計建議和優化提示詞,再使用優化后的提示詞生成圖像,設置適當參數,確保呈現出紀實攝影風格和自然光照明效果。
不過有時它潤色完提示詞后,輸出的圖像還是 AI 味較濃,手部細節會虛化。
我們還可以用它生成帶貨圖片。上傳人物照片和產品圖,輸入簡單的提示詞「讓圖一女生手里拿著圖二玩偶」即可。除了手指略顯奇怪外,其他細節幾乎沒什么瑕疵。
我們還可以打字 P 圖,只需在聊天框里給出指令:將圖片中的玩偶毛發顏色改成淺藍色。
此外,我們也可以在無限畫布上使用編輯工具修改,比如高清放大、擴圖、去背景、擦除、局部重繪、涂抹或摳圖等。
生成視頻或 3D 模型功能
我們首先拿機器之心的吉祥物「土撥鼠」進行了視頻生成測試。 上傳圖片后,輸入簡單的提示詞:生成視頻,讓圖中的土撥鼠拍手。
星流 Agent 立馬響應,經過分析圖像、制定計劃、生成視頻一通操作,最終生成的畫面還算流暢,甚至還有向上運鏡,只不過土撥鼠的眼睛稍有變化,耗時也較長,生成5秒視頻足足用了三分鐘左右。
從它的思考過程來看,視頻生成調用的工具是 Video3。
再嘗試一下 3D 建模,還是遵循上述工作流,轉換 3D 模型調用的是 VAST 旗下的 Tripo AI 工具,大約耗時 2 分鐘。
初次生成的模型效果不錯。它的大眼睛頗有《冰河世紀》中松鼠的神韻,整體輪廓與原圖高度吻合,甚至連服裝上的文字細節都通過貼圖精準還原了。
我們換了一張不同姿勢的圖片,看看效果怎么樣。
這個模型的形態匹配度更高,但臉部顯得有些災難,像被大卡車壓過一樣(sos)。
為了評估其后期修改的潛力,我們將模型下載至本地。檢查發現,模型的多邊形網格(mesh)過于密集,拓撲結構也比較雜亂,這給后續的編輯和優化帶來了不便。
隨后,我們嘗試了一個曲面更簡潔的模型。
可以看到,對于這類幾何結構簡單的對象,生成效果有顯著提升。
模型結構更規整流暢,但拓撲問題依舊存在。
最后,我們體驗一下從文字直接到模型的完整工作流。
提示詞:生成圖片,Q 版小智和皮卡丘,站在比斗臺上,背景虛焦,折紙風格,紙張層次豐富,動作多樣,表情豐富,色彩鮮艷,立體動作,以獨特姿勢呈現,褶皺肌理,帶點紙張紋理質感,干凈背景,16K 分辨率,1:1
Q 版皮卡丘完成度很高,挑不出毛病,但小智憑空長出了一條「尾巴」。
接下來讓圖片動起來,這一步星流 Agent 自動調用的是可靈 2.1,并將之前的圖片作為起始幀、自動設置提示詞。
視頻開始還挺有意思,但后面折紙風格的小智被捏扁又突然出現顯得不合常理,這或許與 Agent 給出的提示詞有關。
這次我們把提示詞寫得詳細一點:讓圖片動起來,皮卡丘開合跳三次,小智原地慢跑。
皮卡丘開合跳停不下來,小智也沒有原地跑,屬于遵循指令但沒完全遵循。
最后來試試建模效果。
對比官網會發現,雖然生成的效果差不多,但是官網更多的操作選項會提升模型的質量,尤其是「重拓撲」的功能能大幅提升模型的后續可操作性。
一番體驗下來,星流 Agent 給我們最大的感受就是便捷。
以往我們用 AI 設計一個專屬的 3D 角色視頻,往往需要在多個 AI 工具中來回橫跳。比如先使用大語言模型生成提示詞,然后使用即夢或 Midjourney 等生成圖像,再用 Tripo AI 或混元 3D 等進行3D 建模,最后使用可靈、Veo3或 hailuo02 等生成視頻。
而現在我們只需輸入一句話描述需求,星流 Agent 就能自動拆解任務、分析風格、一站式生成「文字 - 圖片 - 建模 - 視頻」,大大節省了時間。
不過,它的問題也很明顯,比如生成圖像的手部細節會有瑕疵,中文也經常出現鬼畫符,視頻生成目前僅限 5 秒,無法滿足 10 秒以上需求,生成時間也較長。
此外,價格也不算便宜。星流 Agent 有三種套餐,分別是單年購買、連續包月和單月購買,其中最便宜的是每月 49 元,可獲得 4000 星流點數,大約生成 23 次 Agent 任務,這也就意味著,生成過程中只要反復修改,這些點數很快就會耗盡。
因此,如果是單純生成圖片、視頻或 3D 模型,而且審美、精度要求高,我們還是建議使用相應的 AI 工具;如果想快速創建無需高度精細化的作品,則可以選用星流 Agent。
起底背后團隊
作為 Lovart 的國內版,星流 Agent 的團隊背景與 Lovart 一致。
前段時間 Lovart 走紅時,不少人就好奇這背后到底是何方「神圣」,仔細一扒發現首席研究員是王浩帆。
乍一聽這個名字,有些讀者或許覺得陌生,但如果我說「20% 霉霉 + 80% 楊冪會長啥樣」,很多人就能想起那個名為 InstantID 的項目。這是去年一款讓 Yann LeCun 都自愿轉發的「AI 寫真」項目,由小紅書 InstantX 團隊開發,而王浩帆就是該團隊成員之一。
此后,他們又推出了風格化圖像生成項目 InstantStyle,再次小火一把。
據領英頁面顯示,王浩帆曾是加州大學伯克利分校的訪問學生,后在卡內基梅隆大學獲得電氣與計算機工程專業碩士學位。
他的工作經歷也是相當豐富。從 2017 年至今,他或兼職或全職干了 15 份工作,曾在中國科學院軟件研究所、地平線機器人、OpenMined、快手、小紅書實習或工作過,現在是 Lovart AI 的聯合創始人。
其實,Lovart AI 也只是 Liblib AI 的海外子公司。Liblib AI 成立于 2023 年 5 月,在短短一年內完成了四輪融資,累計金額達數億元人民幣。
Liblib AI 團隊成員主要畢業于清華大學、北京大學、卡內基梅隆大學等國內外名校,并具有騰訊、阿里、字節、微軟、奧美等互聯網和設計公司的從業經歷,具備 AI、互聯網和設計產業相關的背景。其中,多人曾有創業的經驗。
據有關媒體報道,其創始人之一陳冕曾在字節跳動擔任剪映商業化負責人,28 歲時成為字節最年輕的 4-1 職級。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.