說個超級有意思的事。
今天凌晨,一個AI設計類的垂直Agent工具,在X上爆了。
可以直接看一下他們的片子。
可能很多老粉都知道,我其實是設計師出身,所以對這種AI設計類的產品,還是Agent的產品,本身就比較關注。
不過比較尷尬的是,他們又是那種內測制,要排隊。
不過好像海外都看到Manus的火爆了,所以他們也搞了邀請碼機制,關注評論就送碼。
我也就去隨手留了個言,大概意思就是:
我是一個中國的AI博主,有一點名氣,對Lovart產品很感興趣,希望可以獲得內測資格。
結果,沒一會,發現我的X,真的收到了一條私信。。。
說實話,我對這種機會一般是不抱有啥希望的,結果沒想到,居然還真的,拿到了邀請碼。
本來都準備睡了,于是果斷起床,一手體驗了一波。
這個設計類的Agent產品,Lovart。
在玩到早上6點以后,我想說,Lovart真的是有一點東西,雖然因為是內測版,在很多細節上,做的還有一點粗糙,但是大的框架,已經很看到了。
而且,是真實的有用。
這是我做的一些小case。
網址在此:https://www.lovart.ai/
一進來,就是一個非常有視覺沖擊力的主頁。
直接點Get Started就行, 你們可能還沒有資格,就正常按照流程申請排隊就行,當然,你也可以去他們的X評論區留言看看,說不定也會直接給你發。
發完就在這個邀請碼的地方填就行。
如果你有資格了之后。
一進來,是一個非常像AI Chat的界面。
很簡潔。
但是其實我在各種場合表達過很多次觀點,在我的認知里,從來沒有什么AI+行業,而是行業+AI,就像我之前寫飛豬那個垂直的旅游Agent的時候。
行業里的Know How,才是最重要的,你到底是有什么痛點,有什么需求,有什么場景,什么時候該調用什么模型,什么時候該調用什么工具,這些東西,疊加你的AI的能力,才是真正的護城河。
所以我對Lovart,是真的還有一些期待的。
我們可以在對話框中,隨便跟他提一個設計要求。
比如我就寫了一段:
幫我畫一組“貓貓去世界各地旅行”的插畫系列,總共8張圖,每張都畫一只米白色、站著走路的Q版貓貓,穿著當地的傳統服飾,比如去日本就穿和服,去法國就帶貝雷帽,去西安就穿唐裝。貓的形象要一模一樣,要站在畫面中間偏下,后面是有代表性的地標,比如東京的街道、巴黎鐵塔、西安城墻等等,但背景不要太復雜。畫風要偏日系插畫,線條細一點,顏色柔和一點,每張右下角能加一句旅游口號,比如“Spring in Tokyo”。整套適合做小紅書日簽那種風格,尺寸是3:4。
發給Lovart之后,我直接錄了個屏,大家可以看一下,就是原來稍微有點慢,一個任務三分鐘,我就給加了2倍速。
大家也可以看看復現過程:https://www.lovart.ai/r/f1mjl6f
8個小貓咪,是不是超級可愛的。
畢竟是Agent產品,中間的思考過程,其實非常有趣。
在收到我的任務之后,其實不同于所有的其他Agent產品,它做的第一步,永遠是匹配風格。
我這個任務,雖然顯示沒有匹配到風格,但是我還是想說下。
他這個第一步,是完全沒毛病的。
這個其實就是設計任務場景,跟其他的場景不太一樣的地方了。
因為在設計場景里,畫風就是影響最大的那個爹,就是最高決策。
你風格一旦錯了,后面哪怕你畫得再好,都是廢圖。
就像你做一張海報,客戶說想要極簡風,你整了一套寫實疊素材+漸變爆炸+顆粒反光上去,你就是在純種找罵。
風格不對,全盤否定。
風格對了,哪怕細節差點,大家都覺得你是在一個頻道上。
這就是我所說的行業的Kow How,如果你是不懂這個行業的人,你可能意識不到,風格這事,會有這么高的優先級,甚至高于怎么把這玩意畫出來的優先級。
我自己寫的風格其實比較模糊,但是如果我們非常明確的寫一個,噪點插畫,它可能就會匹配上了。
而且這效果確實很好。
我大概扒了一下,這應該是1個LoRA模型。
所以在Lovart的判斷邏輯里,應該是會先判斷你的設計任務所要求的風格,在他們的庫里去匹配是否有LoRA模型能夠滿足,如果能滿足的話,不管從效果還是推理成本的角度,都應該用LoRA模型去做執行。
如果匹配不上的話,才會用其他的大模型比如Flux、GPT4o等等來去畫圖。
這個邏輯完全沒毛病,就是不知道他們庫里有多少LoRA。
在匹配之后,其實就是創建執行計劃了。
不過有時候,匹配風格這一步,也有可能會被Lovart放在執行計劃里,不過概率比較小。
我這個畫貓咪的小任務,就被拆成了3步,獲取知識、用GPT4o生圖、結束。
獲取知識這塊很有意思,其實就是把我的Prompt,變成了一個超級詳細的Prompt。
我必須要全部放出來給你們看,這也是我第一次見到這么詳細的在AI上的設計拆解。。。
不僅寫了通用性的設計規范,確定好的IP的樣式和總體布局,然后,還列了8個城市,給每個城市,單獨固定了調色板和單獨的Prompt。。。
真的,要是每一個設計師,在做一些系列化設計的時候,都能把設計規范和一些差異化的點,描述的這么清楚,那真的不用浪費那么多時間去做一些無用的所謂的視覺統一的工作了。。。
最后,是選擇調用了GPT4o,一口氣把八張圖,全部畫了出來。
效果非常好。
在我自己一夜的測試過程中,除了GPT4o之外,還有Flux、Gemini,還有Poster Gen,做海報的時候經常會用的,但是我查半天也不知道底層是什么模型,感覺是他們自己做的。
最后,全流程Ending,Lovart,把所有的圖,給你放在了左邊的畫板上。
并且,二次編輯的功能,做的還蠻全的。
頂上的放大、擴圖、摳圖、消除、修復、涂抹模糊,主流的功能,基本全都支持了。
而每一張圖,也可以單獨點擊,進行選區選擇。比如這個城市,我希望在右上角加一些和平鴿,peace and love才是真正的主旋律。
我涂上右上角的區域,就可以直接點下面的編輯,也可以添加到對話框中進行精準修改。
發送給他,很快,他就自己把和平鴿加上了。
除了小貓旅游之外,我又讓他做了一些海報。
還做了一整套游戲UI,我超級喜歡的蒸汽波+復古像素的風格。是我心中的404世界,那種在虛擬空間中,被廢棄的城市。
而且在我們日常設計任務中,其實還有很多尺寸延展的場景的,比如這個404世界的首頁。
我們可以讓他把這個豎著的,再延展成1:1,3:2,16:9這3個尺寸。
幾分鐘以后,他就全部給你改好。
可惜就是出現了一些語義理解的問題,最后的16:9沒給我生成,還是按3:2去生的。
同時,這里需要特別注意,如果是是寫的英文,在英文里,這種延展或者適配設計,一定要寫 Generate,而不是寫Extend,Extend不是延展,是擴圖,所以,如果你跟他說Extend的話,會很崩。
走的是純擴圖的邏輯,直接沒眼看了。
甚至我還發現了,一個非常有趣的事,就是,你可以直接把生成的海報,扔到對話框中,然后說: Generate an editable text version of this poste。
你就會發現文字和背景圖,真的被分離了,出來了一個可編輯的版本。
這個文字和背景分離的功能,其實是個超級剛需,做過AI繪圖的都知道,文字有時候是要重改的,明明手敲就行,但是很多時候,AI出來的就是一張,根本改無可改。
但是如果我們一句話,能把字體樣式、字體本身、背景圖給分離出來,那絕對是一件所有設計師有巨大加持的大事。
只不過現在Lovart雖然有了這個意思,會把字符、位置幾乎完美的還原,但是把背景做了一些很細節的微調,字體樣式也還沒有保持住,不過至少看到了希望,未來可期。
而且,他們不止能傳圖改圖,甚至他們還集成了可靈、11labs、suno,可以把圖片,生成視頻,再配上音樂和配音,然后剪輯在一起。。。
比如我就扔了一張非常經典的口紅戰神Dior999的產品圖上去。
給了一段Prompt:
我上傳了一張高品質的Dior999的口紅產品圖,請基于這張圖的質感和品牌定位,幫我生成一支專業感極強的Dior999品牌廣告片段,時長控制在30秒以內。 整個廣告需要延續這張圖的調性,鏡頭語言可以參考過去Dior、香奈兒、蘭蔻等高端美妝品牌的廣告片風格。 請生成完整的視頻腳本分鏡圖,包括文字、畫面描述和轉場邏輯。然后把這些圖轉成視頻,根據圖片主題,加背景音樂。
Lovart先分析了圖像,然后寫了一段非常詳細的,廣告視頻腳本。
然后,畫了所有的分鏡圖,和一個可視化的腳本。
隨后,他就給這些圖片,都用可靈轉成了視頻,還用Suno,生成了BGM音樂。
在跑了十幾分鐘以后,一個還算好看的Dior999的廣告視頻,出現了。
真的,搓個小的廣告片demo,Lovart真的沒啥問題。
核心能力,其實還是來自于設計領域的Know How。
用Agent來生成視頻+配樂這件事,其實不是啥難事,很多通用Agent都可以做,接接幾個API或者MCP就行,但是大家可以去對比一下一些通用的Agent產品,用相同的產品圖和Prompt,生成出來的視頻審美和質量。
其實你就能看出來差別。
本來我還想用這個功能,來直接搓一段故事腳本,但是我發現,它的人物一致性和影視級別的鏡頭語言,還有一些進步空間,就作罷了= =
最后的最后,我還是想來聊聊Lovart的意義。
他當然,還有很多的細節問題和不足。
就像我當年第一次看到Figma,意識到設計協作這個賽道會被重寫一樣。
今天第一次看到Lovart跑完需求→生成→尺寸延展→圖文分離→視頻合成→二次修改這一整鏈條,我也覺得:
在Agent的加持下,設計的工作流,未來也不一定是現在這樣了。
甚至設計師的定義,可能也是另一個描述。
在沒有所謂的設計Agent的時候。
你跟任何AI說我要一張圖,它給你的是作品。
但是,在Agent的加持下,你現在跟Lovart說我要一張圖,它給你的是產品。
是交付,是資源,是資產。
未來,直接一句話,生成潮玩IP、生成這個IP所有的延展、做完視頻、直出3D模型,并不是不可能。
可能,就在很快的未來。
現在的圖景,非常的清晰。
每一個垂類賽道,可能都會有它一個專屬的最牛逼的Agent。
有大通用的、有研究的、有旅游的、有設計的。
未來,垂直Agent的,一定會更快速的涌現。
現在又是凌晨6點了。
但是我還是還想感慨一句。
親身參與這個時代里。
實在是,太酷了。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克
>/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.