本文授權轉自:彩云譯設計(ID:caiyunyisheji)
最近,谷歌一口氣對AI模型能力做了一次大升級,其中最吸引我的是Gemini 2.0 Flash (Image Generation) ,這個模型對設計師來說,實用性很強。
然后谷歌這個模型也開放了API,可以很容易把它接入到comfyUI中,我自己試用后很興奮,忍不住在我的社群里跟大家分享,太驚喜了!
可能有朋友還不知道Gemini 2.0 Flash是個啥模型?能做什么?
我先簡單總結下:Gemini 2.0 Flash 最早是在2024年12月12號發布的,那時候只是作為一個實驗性的發布,并不對我們普通用戶開放。經過幾個月的測試后,在3月12號已經測試通過,正式全面向所有人開放了。它能通過自然語言生成或編輯圖片,和comfyUI有點類似,可控性很好。
可控性好就意味著在工作中將會變得實用,前段時間還跟騰訊的同事聊天,發現他們現在都已經要求團隊的人必須會comfyUI了,招人也是有這個要求,能通過搭建工作流解決工作問題,對這塊很是重視。
模型怎么用?
它的使用很簡單,打開官方這個鏈接 :
https://aistudio.google.com/prompts/new_chat
然后選擇Gemini 2.0 Flash (Image Generation) Experimental這個模型
在主頁上,它給了3個示例,可以分別點下這幾個示例,就大概知道怎么用了。
先快速說下官方給的這3個基礎用法示例
1)圖片編輯
用最直白的話就能對圖片進行修改。
這里的提示詞是:給牛角面包撒點巧克力。
我們還可以繼續用對話對圖片進行編輯,比如“給這張圖上面加點奶油”,如果覺得不大夠,還可以“奶油再多一些”。
基本上它的生成就是指哪打哪,不會把原圖搞亂,這就跟咱們在PS里修圖挺像的了,非常實用,AI改圖最怕的就是改完之后原圖搞不像了,可控性至關重要。下次你老板再戳你屏幕的時候,直接讓他幫意見打成文字,一分鐘給他改好。
2)創建圖片繪本
可以讓它幫你寫一段故事腳本,并且每一個場景配上一張圖,且每個片段的圖是連貫的。
這里的提示詞官方給了示例:生成一個故事,關于一只小山羊在一個農場冒險的故事,每個場景對應生成一張配圖。
點示例后,它很快就生成了9個故事場景,然后每個場景都會生成一張統一主角,統一風格的配圖。效果驚人!
以后繪本生意估計不好做了。家里小孩想看繪本,咱們自己都能很快出一套,打印出來就能做成冊了。親手做出來給孩子的繪本,成就感肯定不一樣,言傳身教。
3)生成生日卡片
它還能通過最直白的對話,生成一張海報,文字內容我看了下完全正確,直接就能發給朋友了。
好,官方的幾個示例都特別簡單,自己去試下絕對能明白,沒什么好說的。下面我要講下它的進階用法,我感覺這才是大招!這也是這個模型讓我覺得最有用的地方,它提供了API的方式,可以隨便免費插入到其他應用中,比如comfyUI。
我經常跟社群的朋友們說,一定要學會comfyUI,因為它真的能幫我們解決實際項目問題,我自己就在星球里已經打卡學習了100多天。但很多朋友的電腦配置帶不動comfyUI,有心無力,現在有了谷歌的這個新模型API,只要你能在電腦上啟動comfyUI,你的顯卡多差都無所謂,一樣能通過comfyUI工作流快速生成想要的效果。
具體在comfyUI里怎么接入這個模型?然后又有哪些進階玩法呢?咱們繼續說。
先啟動comfyUI,如果你還不知道怎么安裝,可以回翻我之前的文章。打開插件安裝器,搜Gemini-API(https://github.com/tatookan/comfyui_ssl_gemini_EXP ),注意看最新更新的時間,裝完之后重啟comfyUI,它就會生效。
上面是連單張圖的,如果你還想要通過2張圖合并生成,可以裝上這個節點:ComfyUI Gemini Flash(https://github.com/ShmuelRonen/ComfyUI_Gemini_Flash)節點。
然后雙擊comfyUI空白處,搜索gemini,把這個節點調出來
前面連上你想調的圖片,后面接上圖片預覽,就能用起來了。
但在這之前,面板上還有一個api_key需要填,這個從哪弄到呢?
還記得前面打開的google AI studio嗎?怕你忘了,地址再說一次:https://aistudio.google.com/prompts/new_chat
左上角有一個藍色按鈕,“Get API key” 。
點中間的創建API秘鑰
創建完之后,把這個秘鑰復制上
貼到comfyUI中剛才創建的節點里
到這配置就完成了,沒任何難度。
當結合comfyUI后,它能玩的東西就非常多了。相當于把之前可能需要一堆節點才能完成的事,現在用谷歌一個節點也能做。我給大家示例一些,其他的大家再發揮下想象力,把你想到的有意思的用途放在評論區。
1)給圖片去水印
本來我想找一張車的白模給大家演示,但找到的圖是帶水印的,那就先去掉水印。
提示詞:把這張圖中的水印去掉,只保留車。
修改結果,發現它不僅把水印給去掉了,還把位置和光影移動到了更好的位置,圖片的清晰度和質量都幫忙提升了。
2)上色+換背景
有了高質量白模圖,咱們繼續讓這張圖變得更真實。
給這張圖上個材質,換個環境
提示詞:給圖中的車上個色,讓它看起來更真實好看,車開在戶外的公路上,路兩邊有山林,保留車的角度和特征。
結果還行吧,基本特征算是繼承了下來。
3)換衣服
給車上完色,咱們接著來做點更實用的事,給模特換衣服,這在電商領域經常用到。
提示詞:給這位美女換一件白色襯衫
換完衣服,動作稍微有些變化,但畫面的背景,人物的其他特征基本上得到了保留。
4)給一件衣服做一張廣告圖
假如我們有一件衣服需要把它做成一張宣傳圖。
提示詞:給這件衣服添加一個小孩子模特,做出一張電商廣告圖,保持衣服的一致性
5)給人物換個表情
以前在comfyUI中換表情,調起來挺麻煩的,現在接入這個API后,換表情不要太容易,而且效果還不錯,人物特征保持的特別好。
比如我拿哪吒來嘗試,讓他張嘴笑起來。
提示詞:讓圖片中的人物大笑起來,嘴巴需要打開,保持人物的特征不變。
修改結果
上面這些操作,你也可以不用comfyUI,直接用谷歌的那個對話框也能搞定,只不過在comfyUI里有批量或者其他更多操作的時候,會更方便一些。
AI的發展,其實一直都在降低技術學習成本,comfyUI學習對很多人來說太復雜,我就知道早晚會把它的難度打下來,只是沒想到這么快。
果然在AI世界,每天都在發生巨變,我們要做的就是保持關注,積極接納,多用多學習。一起適應這個正在發生巨變的世界。
文章轉載:彩云譯設計,版權歸原作者所有
原文鏈接:https://mp.weixin.qq.com/s/j__YsgcG_pP7xIh-EKuChQ
版權聲明:“IXDC”所推送的文章,除非確實無法確認,我們都會注明作者和來源,本公眾號對轉載、分享的內容、陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完善性提供任何明或暗示的保證,僅供讀者參考。部分文章推送時未能與原作者取得聯系,若涉及內容或作品等版權問題,煩請原作者聯系我們,給出內容所在的網址并提供相關證明資料,我們會核查后立即更正或者刪除有關內容!本公眾號不承擔任何責任,并擁有對此聲明的最終解釋權。
聯系微信:18802086168
聯系電話:18802086168
編排 | 黃春燕
終審 | 蘇 菁
點這里,學習更多設計知識!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.