作者 | 董道力
郵箱 | dongdaoli@pingwest.com
LiblibAI 近日推出了“星流Agent”,一款一站式創(chuàng)意設(shè)計(jì)智能體,已同步上線移動(dòng)端和網(wǎng)頁(yè)端。
簡(jiǎn)而言之,用戶只需用語(yǔ)言描述需求,星流Agent 就能進(jìn)行分析,生成所需的圖片、視頻或設(shè)計(jì)方案。若對(duì)生成的圖片、視頻或方案不滿意,同樣只需提出修改要求,它便會(huì)進(jìn)行調(diào)整。
在官方宣傳中,星流Agent 與 Lovart基本被形容為國(guó)內(nèi)版和國(guó)際版產(chǎn)品的分別,強(qiáng)調(diào)其深度優(yōu)化了中文語(yǔ)義理解,并融入了東方美學(xué)元素,能精準(zhǔn)適配本地設(shè)計(jì)場(chǎng)景,旨在成為“更懂中國(guó)設(shè)計(jì)師”的 AI 伙伴。
我們也第一時(shí)間上手深度評(píng)測(cè)了一下這款熱度很高的產(chǎn)品——體驗(yàn)時(shí),這產(chǎn)品一度因?yàn)榫W(wǎng)站流量過(guò)大而“崩潰”,可見(jiàn)人們對(duì)于它的好奇和需求。
在產(chǎn)品界面上,進(jìn)入網(wǎng)頁(yè)端星流Agent工作頁(yè)面,大致可以分為四個(gè)區(qū)域。左上角工具欄,包含模式選擇、插入畫(huà)布、添加圖片、AI工具等選項(xiàng)。工具欄下方是工具的細(xì)節(jié)設(shè)置區(qū),如生圖模型選擇、圖片尺寸設(shè)定等,功能類(lèi)似于簡(jiǎn)易版的 Stable Diffusion。中央?yún)^(qū)域是主要的畫(huà)布區(qū),用于預(yù)覽生成的圖片、視頻等內(nèi)容,可以在畫(huà)布上進(jìn)行快捷編輯。右側(cè)是本次測(cè)試的核心功能區(qū)——AI對(duì)話框,用戶的設(shè)計(jì)和修改需求都在此輸入。
我們將結(jié)合特定的工作場(chǎng)景,如設(shè)計(jì)海報(bào)、品牌設(shè)計(jì)、視頻生成等,與星流Agent共同協(xié)作,從AI對(duì)自然語(yǔ)言的理解力;人工參與的二次修改便利性等方向進(jìn)行測(cè)試。
1
網(wǎng)頁(yè)端:生成海報(bào)
我們嘗試了一個(gè)設(shè)計(jì)師常見(jiàn)的任務(wù):快速生成活動(dòng)海報(bào)。
Prompts:幫我生成6張未來(lái)主義風(fēng)格海報(bào),描繪面部解構(gòu)為埃舍爾式悖論建筑:金屬與玻璃碎片重組成無(wú)限循環(huán)樓梯的顴骨、拱門(mén)狀下頜線、馬賽克幾何前額,裂縫中流動(dòng)神經(jīng)元光帶。量子晶體懸浮面部中央折射全息數(shù)據(jù)流,賽博朋克紫綠漸變光影在宇宙黑幕上投射幾何陰影,漂浮的二進(jìn)制星群營(yíng)造深度幻覺(jué)——中央3D液態(tài)金屬字'AI產(chǎn)品'散發(fā)霓虹光暈,頂部全息'AI',底部光束鐫刻'攝影的起點(diǎn)與終點(diǎn)',左側(cè)微縮電路紋字'2025','0606'日期碎片嵌于建筑結(jié)構(gòu),'AI產(chǎn)品'徽章懸浮,超精細(xì)CGI質(zhì)感結(jié)合Beeple式未來(lái)主義美學(xué),電影級(jí)體積光與極簡(jiǎn)排版。
星流Agent 并未直接生圖,而是先對(duì)需求進(jìn)行理解與梳理,為用戶提供了四個(gè)優(yōu)化后的方向供選擇。相較于原始提示詞,星流Agent 提供的版本更為簡(jiǎn)練具體,明確了海報(bào)主題、元素位置、背景顏色設(shè)計(jì)等,并包含了“AI產(chǎn)品”、“0606”等關(guān)鍵文字信息。
選擇方向一后,星流Agent 開(kāi)始“工程化”處理該方向,生成包含海報(bào)比例、構(gòu)圖、主體元素、配色光效、文字排版、細(xì)節(jié)要求的設(shè)計(jì)說(shuō)明。這使用戶能清晰了解最終設(shè)計(jì)的構(gòu)成邏輯。隨后,它挑選合適的工具(如 kontext 或其他模型)進(jìn)行生圖。
生成的6張海報(bào)呈現(xiàn)在中央畫(huà)布中。審美見(jiàn)仁見(jiàn)智,但圖片的主體結(jié)構(gòu)基本符合提示詞要求,關(guān)鍵信息如“AI產(chǎn)品”、“0606”也得以生成。
1
網(wǎng)頁(yè)端:修改圖片
我們以第一張海報(bào)為例進(jìn)行微調(diào)。圖中“攝影的起點(diǎn)與終點(diǎn)”是星流Agent 自行添加的文字,我們嘗試:1) 刪除該文字;2) 修改該文字。
選中圖片后,畫(huà)布上方出現(xiàn)常用工具(高清放大、擴(kuò)圖、去背景、擦除等)。星流Agent 將每張圖片的處理過(guò)程打包成工作流,方便用戶追溯修改歷史。
使用擦除工具選中文字進(jìn)行刪除,這個(gè)操作,AI給出的效果非常不錯(cuò),畢竟LiblibAI做AIGC工具起家。
同樣,修改圖片也支持自然語(yǔ)言。選中圖片后,按下tab鍵就會(huì)進(jìn)入快速編輯模式,在輸入框中提出修改意見(jiàn),就可以“用嘴來(lái)p圖”。但“用嘴p圖”只能面向整張圖片,無(wú)法選中某個(gè)區(qū)域進(jìn)行修改。
prompts:把圖中[攝影的起點(diǎn)與終點(diǎn)]換成[AI產(chǎn)品改變生活]
星流Agent成功定位到需要修改的文字,卻把中文修改成英文。
也許是快捷編輯中的AI依然不夠智能,我們將圖片放在AI對(duì)話框中進(jìn)行處理,但星流仍然把中文改成了英文。
即便在prompts中明確使用中文,星流Agent還是返回了一張英文圖片,英文用到的單詞和上一張一樣,在翻譯的一致性上還是很穩(wěn)定的。
當(dāng)我再次強(qiáng)調(diào)是中文后,星流返回的文字效果異常。
這也體現(xiàn)了老問(wèn)題,大模型對(duì)中文的適配依然不夠——對(duì)中文進(jìn)行準(zhǔn)確的圖片化生成,一直是各路國(guó)產(chǎn)模型在解決的一大類(lèi)任務(wù),并且能用來(lái)反過(guò)來(lái)判斷模型各種能力的提高程度。
我們繼續(xù)又嘗試修改圖片中的其他元素。
prompts:把模特的眼鏡換成紅色墨鏡
星流Agent 確認(rèn)了眼鏡位置及特征,成功替換為紅色墨鏡,并保持了原有特征。
1
網(wǎng)頁(yè)端:電商海報(bào)
prompts:讓圖1中的人物,帶上圖2中的耳機(jī)
我們使用了兩張網(wǎng)絡(luò)素材模擬電商廣告場(chǎng)景。星流Agent 初次生成時(shí)在人物性別和耳機(jī)顏色識(shí)別上出了錯(cuò),但經(jīng)過(guò)第二輪解釋后成功完成任務(wù)。
相比 Stable Diffusion、ComfyUI 等工具,星流Agent 能幫助用戶生成更準(zhǔn)確的提示詞并選擇合適的工具。修改圖片時(shí)能自動(dòng)定位元素,節(jié)省了用戶手動(dòng)繪制蒙版或使用 context 控制修圖效果的時(shí)間。
不過(guò),這里也引申出星流這樣產(chǎn)品的定位的討論,因?yàn)閷?duì)于已熟練掌握 ComfyUI 等工具的設(shè)計(jì)師而言,它們?cè)谏尚Ч夏壳安o(wú)太大差別,而且星流使用的需求多了會(huì)需要支付費(fèi)用,對(duì)于他們來(lái)說(shuō)可能付費(fèi)意愿會(huì)受到影響。不過(guò),這樣的商業(yè)化產(chǎn)品瞄準(zhǔn)的目標(biāo)本來(lái)更多就是普通的沒(méi)有太多“動(dòng)手組裝AI流水線”經(jīng)驗(yàn)的人們,目前來(lái)看這些功能足夠打動(dòng)他們。與此同時(shí),接下來(lái)產(chǎn)品迭代方向里,生成的質(zhì)量如何比開(kāi)源和自己搭建的工作流有顯著提升,將是關(guān)鍵。
1
網(wǎng)頁(yè)端:品牌設(shè)計(jì)
prompts:我有一家名字叫[Hello AI]的咖啡店,幫我做一下品牌設(shè)計(jì)。
品牌設(shè)計(jì)是一個(gè)很寬泛的概念,相較于生圖、做海報(bào),需要AI像設(shè)計(jì)師一樣反復(fù)確認(rèn)甲方需求。
星流Agent在看完需求后會(huì)先詢問(wèn)用戶是否是要做“一套完整的品牌視覺(jué)識(shí)別系統(tǒng),包括標(biāo)志設(shè)計(jì)、色彩系統(tǒng)、字體選擇以及品牌應(yīng)用設(shè)計(jì)”,隨后還會(huì)從數(shù)據(jù)庫(kù)中提供一些參考案例,讓用戶來(lái)選擇。
在具體的細(xì)節(jié)設(shè)計(jì)中,星流給出了很詳細(xì)的設(shè)計(jì)建議,概念風(fēng)格、主視覺(jué)、logo、色彩字體系統(tǒng)等等。
我們畢竟不是專(zhuān)業(yè)人士,于是咨詢了專(zhuān)業(yè)設(shè)計(jì)師,其對(duì)星流Agent 提供的設(shè)計(jì)方案表示認(rèn)可。
1
網(wǎng)頁(yè)端:文生視頻
prompts:幫我生成一段10s的視頻,內(nèi)容是一條長(zhǎng)著翅膀的粉色哈士奇飛躍教堂。
在純文生視頻任務(wù)中,星流Agent 的表現(xiàn)并未超越如可靈、即夢(mèng)等平臺(tái)。其對(duì)提示詞的擴(kuò)展主要在豐富物品/人物細(xì)節(jié)層面,并未主動(dòng)提示用戶考慮景別等要素。經(jīng)多次嘗試,它目前能生成5秒視頻。
1
網(wǎng)頁(yè)端:圖生視頻
prompts:基于這張圖生成一段視頻,要求紅色方塊和藍(lán)色方塊互換位置
星流Agent 會(huì)先分析圖片,制定計(jì)劃(如先生成結(jié)束幀圖片,再調(diào)用視頻模型)。生成視頻后還會(huì)分析是否滿足需求,若不滿足會(huì)再次生成。測(cè)試中最多修改一次(生成兩個(gè)視頻)。
相比在其他平臺(tái)無(wú)頭緒地修改提示詞,星流Agent 通過(guò)多輪對(duì)話完成任務(wù)的方式更有效率。
1
網(wǎng)頁(yè):動(dòng)畫(huà)短片
prompts:我想做一個(gè)動(dòng)畫(huà)短片,內(nèi)容是哈士奇拆家
和品牌設(shè)計(jì)需求一樣,動(dòng)畫(huà)短片制作涉及風(fēng)格、角色、分鏡、劇情等多環(huán)節(jié),是較為復(fù)雜的AIGC任務(wù)。
星流Agent將動(dòng)畫(huà)短片任務(wù)拆的很細(xì),免去了用戶在大模型問(wèn)答軟件、文生圖軟件、圖生視頻軟件等之間的來(lái)回切換的操作。
1
移動(dòng)端:生成壁紙
星流Agent的移動(dòng)端適合輕量級(jí)任務(wù),如調(diào)整圖片尺寸、制作表情包等。
prompts:把圖中藍(lán)色的星球改成太陽(yáng),并且修改成適合iphone壁紙的尺寸。
與網(wǎng)頁(yè)端流程一致,星流Agent 分析需求后選擇工具。但在這個(gè)案例里,最終結(jié)果不盡人意:太陽(yáng)被添加了星環(huán),生成圖片尺寸過(guò)長(zhǎng),并沒(méi)有按需求直接匹配 iPhone壁紙的大小。
此外,在試用過(guò)程中,我們發(fā)現(xiàn)星流Agent的網(wǎng)頁(yè)端和移動(dòng)端項(xiàng)目互通,但目前只通了一半。在網(wǎng)頁(yè)端后臺(tái)可以看到移動(dòng)端端項(xiàng)目,但項(xiàng)目名項(xiàng)目?jī)?nèi)容都無(wú)法顯示。而在移動(dòng)端可以顯示并編輯網(wǎng)頁(yè)端的內(nèi)容。
這類(lèi)顯示不完全的小問(wèn)題還有一些,比如在移動(dòng)端用戶積分和新對(duì)話的UI重疊。
另外,目前星流Agent還是會(huì)有報(bào)錯(cuò)的情況,有時(shí)會(huì)出現(xiàn)扣除點(diǎn)數(shù)但不工作,以及內(nèi)容生成預(yù)估時(shí)間和實(shí)際時(shí)間嚴(yán)重不符等。這些都是今天AI 產(chǎn)品快速發(fā)布快速迭代的常見(jiàn)問(wèn)題了。后續(xù)期待有所修復(fù)。
在定價(jià)上,星流Agent的價(jià)格并不便宜,我們按照49元4000 Agent點(diǎn)數(shù)的連續(xù)月包會(huì)員為例,相當(dāng)于1元=80點(diǎn)數(shù)。在星流Agent如今半價(jià)福利的情況下,80點(diǎn)智能生成6張圖片,2.5s視頻,還不算需求理解、內(nèi)容修改等。
試用一圈下來(lái),星流Agent還是有不少讓人驚艷的地方,它最打動(dòng)人的,不是生成了多少?gòu)垐D或視頻,而是它努力扮演“設(shè)計(jì)師”角色的嘗試——理解需求、提供方案、迭代修改。而且這些都被體現(xiàn)在了產(chǎn)品的細(xì)節(jié)里。當(dāng)然目前它并非萬(wàn)能也不完美,尤其在中文細(xì)節(jié)處理和性價(jià)比上仍有提升空間。
但對(duì)于那些“請(qǐng)專(zhuān)業(yè)設(shè)計(jì)師太麻煩,自己動(dòng)手又太費(fèi)勁”的輕量級(jí)、臨時(shí)性設(shè)計(jì)需求,星流Agent確實(shí)提供了一個(gè)值得考慮的選項(xiàng):
一杯咖啡的錢(qián),一個(gè)能陪你聊需求、出方案、改稿子的“AI設(shè)計(jì)師”,可能正是這類(lèi)AI產(chǎn)品面對(duì)的市場(chǎng)里的最大公約數(shù)。
點(diǎn)個(gè)愛(ài)心,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.