作者|沐風
來源|AI先鋒官
就在昨天晚間,OpenAI也終于把GPT-4o的生圖的API發布了,新模型名為“GPT-image-1”。
此前,GPT-4o的生圖功能一經上線就火遍全球,據OpenAI表示,在首周,全球就有1.3億用戶用創作了超7億張圖片。
在此次開源的新模型GPT-image-1中,與GPT-4o相關的功能又有兩個:
生成(Generations):根據文本提示從頭開始生成圖像;
編輯(Edits):使用新提示詞部分或全部修改現有圖像。
與GPT-4o圖像生成不同的是,GPT-image-1支持指定圖像質量、大小、格式、壓縮以及是否需要透明背景來自定義輸出。
其中圖像質量包括:low、medium、high;
圖像大小包括:1024x1024、1536x1024、1024x1536;
圖像輸出格式包括:PNG、JPEG、WebP,模型默認輸出PNG圖像,JPEG和WebP格式的壓縮級別 (0-100%)。
另外,基于GPT-4o強大的語義處理能力,它不僅能結合世界知識進行連續對話、迭代創作,還能確保生成圖像與提示詞高度一致、創作多種風格圖片。
接下來,小編帶大家通過OpenAI官方放出的示例來直觀的了解一下GPT-image-1吧。
生成圖像
下面是一個用Python 快速生成圖片并保存的完整示例:
默認情況下,API返回一張圖片,但可通過設置參數n,讓其一次生成多張圖像。
生成的圖片如下:
編輯圖像
通過圖像編輯端點,你可以直接編輯現有圖片或上傳一張參考圖用來生成新圖像,再或者上傳一張圖像加蒙版,精準替換特定區域,即inpainting。
例如,上傳4張圖片,然后讓它生成禮品籃的新圖像,其中要包含參考圖像中的商品。
可以看到,它自動將參考圖中的物品組合到了禮品籃中。
其Python示例如下所示:
對于inpainting,你需要提供一個蒙版來指示應該編輯圖像的哪些地方。
蒙版中的透明區域將被替換,而其他區域保持不變。
不過,你也可以使用提示詞來描述完整的新圖像,而不僅僅是蒙板區域。
如果你上傳了多個圖像,則蒙版將應用于第一個圖像。
需要注意的是,圖像和蒙版需要具有相同的格式和尺寸,大小不能超過25MB,并且蒙版圖像還必須包含Alpha通道。
其Python示例如下所示:
接下來,我們來看一下GPT-image-1的API價格。
文本輸入:5美元100萬token;
圖像輸入:10美元100萬token;
圖像輸出:40美元100萬token。
按圖像大小和質量估算,生成單張低、中、高質量的1024x1024圖像大約花費0.02美元、0.07美元、0.19美元。
換算成人民幣大約為0.1元、0.5元、1.4元。
從單價來看,確實比一些競品要高。
最后,OpenAI也放出了許多GPT-image-1生成的圖片,我們一起來看看吧。
當看到最后這兩張圖片時,小編不禁感慨,這提示詞寫的堪比一篇作文。
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.