網易首頁 > 網易號 > 正文申請入駐

谷歌生圖模型來襲：讓你的ComfyUI學習過程輕松愉快！

2025-03-27 08:40:03　來源: 美啊教育

廣東舉報

分享至

本文授權轉自：彩云譯設計（ID：caiyunyisheji）

最近，谷歌一口氣對AI模型能力做了一次大升級，其中最吸引我的是Gemini 2.0 Flash (Image Generation) ，這個模型對設計師來說，實用性很強。

然后谷歌這個模型也開放了API，可以很容易把它接入到comfyUI中，我自己試用后很興奮，忍不住在我的社群里跟大家分享，太驚喜了！

可能有朋友還不知道Gemini 2.0 Flash是個啥模型？能做什么？

我先簡單總結下：Gemini 2.0 Flash 最早是在2024年12月12號發布的，那時候只是作為一個實驗性的發布，并不對我們普通用戶開放。經過幾個月的測試后，在3月12號已經測試通過，正式全面向所有人開放了。它能通過自然語言生成或編輯圖片，和comfyUI有點類似，可控性很好。

可控性好就意味著在工作中將會變得實用，前段時間還跟騰訊的同事聊天，發現他們現在都已經要求團隊的人必須會comfyUI了，招人也是有這個要求，能通過搭建工作流解決工作問題，對這塊很是重視。

模型怎么用？

它的使用很簡單，打開官方這個鏈接：

https://aistudio.google.com/prompts/new_chat

然后選擇Gemini 2.0 Flash (Image Generation) Experimental這個模型

在主頁上，它給了3個示例，可以分別點下這幾個示例，就大概知道怎么用了。

先快速說下官方給的這3個基礎用法示例

1）圖片編輯

用最直白的話就能對圖片進行修改。

這里的提示詞是：給牛角面包撒點巧克力。

我們還可以繼續用對話對圖片進行編輯，比如“給這張圖上面加點奶油”，如果覺得不大夠，還可以“奶油再多一些”。

基本上它的生成就是指哪打哪，不會把原圖搞亂，這就跟咱們在PS里修圖挺像的了，非常實用，AI改圖最怕的就是改完之后原圖搞不像了，可控性至關重要。下次你老板再戳你屏幕的時候，直接讓他幫意見打成文字，一分鐘給他改好。

2）創建圖片繪本

可以讓它幫你寫一段故事腳本，并且每一個場景配上一張圖，且每個片段的圖是連貫的。

這里的提示詞官方給了示例：生成一個故事，關于一只小山羊在一個農場冒險的故事，每個場景對應生成一張配圖。

點示例后，它很快就生成了9個故事場景，然后每個場景都會生成一張統一主角，統一風格的配圖。效果驚人！

以后繪本生意估計不好做了。家里小孩想看繪本，咱們自己都能很快出一套，打印出來就能做成冊了。親手做出來給孩子的繪本，成就感肯定不一樣，言傳身教。

3）生成生日卡片

它還能通過最直白的對話，生成一張海報，文字內容我看了下完全正確，直接就能發給朋友了。

好，官方的幾個示例都特別簡單，自己去試下絕對能明白，沒什么好說的。下面我要講下它的進階用法，我感覺這才是大招！這也是這個模型讓我覺得最有用的地方，它提供了API的方式，可以隨便免費插入到其他應用中，比如comfyUI。

我經常跟社群的朋友們說，一定要學會comfyUI，因為它真的能幫我們解決實際項目問題，我自己就在星球里已經打卡學習了100多天。但很多朋友的電腦配置帶不動comfyUI，有心無力，現在有了谷歌的這個新模型API，只要你能在電腦上啟動comfyUI，你的顯卡多差都無所謂，一樣能通過comfyUI工作流快速生成想要的效果。

具體在comfyUI里怎么接入這個模型？然后又有哪些進階玩法呢？咱們繼續說。

先啟動comfyUI，如果你還不知道怎么安裝，可以回翻我之前的文章。打開插件安裝器，搜Gemini-API（https://github.com/tatookan/comfyui_ssl_gemini_EXP ），注意看最新更新的時間，裝完之后重啟comfyUI，它就會生效。

上面是連單張圖的，如果你還想要通過2張圖合并生成，可以裝上這個節點：ComfyUI Gemini Flash（https://github.com/ShmuelRonen/ComfyUI_Gemini_Flash）節點。

然后雙擊comfyUI空白處，搜索gemini，把這個節點調出來

前面連上你想調的圖片，后面接上圖片預覽，就能用起來了。

但在這之前，面板上還有一個api_key需要填，這個從哪弄到呢？

還記得前面打開的google AI studio嗎？怕你忘了，地址再說一次：https://aistudio.google.com/prompts/new_chat

左上角有一個藍色按鈕，“Get API key” 。

點中間的創建API秘鑰

創建完之后，把這個秘鑰復制上

貼到comfyUI中剛才創建的節點里

到這配置就完成了，沒任何難度。

當結合comfyUI后，它能玩的東西就非常多了。相當于把之前可能需要一堆節點才能完成的事，現在用谷歌一個節點也能做。我給大家示例一些，其他的大家再發揮下想象力，把你想到的有意思的用途放在評論區。

1）給圖片去水印

本來我想找一張車的白模給大家演示，但找到的圖是帶水印的，那就先去掉水印。

提示詞：把這張圖中的水印去掉，只保留車。

修改結果，發現它不僅把水印給去掉了，還把位置和光影移動到了更好的位置，圖片的清晰度和質量都幫忙提升了。

2）上色+換背景

有了高質量白模圖，咱們繼續讓這張圖變得更真實。

給這張圖上個材質，換個環境

提示詞：給圖中的車上個色，讓它看起來更真實好看,車開在戶外的公路上，路兩邊有山林，保留車的角度和特征。

結果還行吧，基本特征算是繼承了下來。

3）換衣服

給車上完色，咱們接著來做點更實用的事，給模特換衣服，這在電商領域經常用到。

提示詞：給這位美女換一件白色襯衫

換完衣服，動作稍微有些變化，但畫面的背景，人物的其他特征基本上得到了保留。

4）給一件衣服做一張廣告圖

假如我們有一件衣服需要把它做成一張宣傳圖。

提示詞：給這件衣服添加一個小孩子模特，做出一張電商廣告圖，保持衣服的一致性

5）給人物換個表情

以前在comfyUI中換表情，調起來挺麻煩的，現在接入這個API后，換表情不要太容易，而且效果還不錯，人物特征保持的特別好。

比如我拿哪吒來嘗試，讓他張嘴笑起來。

提示詞：讓圖片中的人物大笑起來，嘴巴需要打開，保持人物的特征不變。

修改結果

上面這些操作，你也可以不用comfyUI，直接用谷歌的那個對話框也能搞定，只不過在comfyUI里有批量或者其他更多操作的時候，會更方便一些。

AI的發展，其實一直都在降低技術學習成本，comfyUI學習對很多人來說太復雜，我就知道早晚會把它的難度打下來，只是沒想到這么快。

果然在AI世界，每天都在發生巨變，我們要做的就是保持關注，積極接納，多用多學習。一起適應這個正在發生巨變的世界。

文章轉載：彩云譯設計，版權歸原作者所有

原文鏈接：https://mp.weixin.qq.com/s/j__YsgcG_pP7xIh-EKuChQ

版權聲明：“IXDC”所推送的文章，除非確實無法確認，我們都會注明作者和來源，本公眾號對轉載、分享的內容、陳述、觀點判斷保持中立，不對所包含內容的準確性、可靠性或完善性提供任何明或暗示的保證，僅供讀者參考。部分文章推送時未能與原作者取得聯系，若涉及內容或作品等版權問題，煩請原作者聯系我們，給出內容所在的網址并提供相關證明資料，我們會核查后立即更正或者刪除有關內容！本公眾號不承擔任何責任，并擁有對此聲明的最終解釋權。

聯系微信：18802086168

聯系電話：18802086168

編排 | 黃春燕

終審 | 蘇菁

點這里，學習更多設計知識！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.