OpenAI 今日凌晨宣布,全新模型 gpt-image-1 現已通過 API 向開發者全面開放,目前也已經被包括 Adobe、Figma 在內等主流創意平臺采用。
模型特點如下:
1?? 更高精度、逼真度更強的圖像
2?? 多樣化的視覺風格
3?? 精準的圖像編輯功能
4?? 豐富的世界知識
5?? 一致、清晰的文本渲染
盡管目前新模型僅限通過 Image API 接入,OpenAI表示正積極推進對 Responses API 的支持擴展,以進一步簡化開發流程。
Image API 提供了三個端點,每個端點具備不同的功能:
1?? 生成(Generations):根據文本提示從零開始生成圖像
2?? 編輯(Edits):使用新的文本提示對已有圖像進行修改,可以是部分修改,也可以是整體修改
3?? 變化(Variations):基于已有圖像生成不同的變體(僅適用于 DALL·E 2)
與 ChatGPT 版本的圖像模型版本有所不同,開發者可以通過 moderation 參數來自定義內容審核的敏感度,還可以調整生成質量與速度的權衡、背景設置、輸出格式等選項。基于此,你也可以做自己的「吉卜力風生成器」了。
據 OpenAI 介紹,gpt-image-1 在生成圖像時,會首先構建圖像專用的 token,圖像的生成成本均與所需 token 數量成正比。
因此,圖像越大、質量要求越高,生成過程所需的 token 也會隨之增加: 文本輸入每百萬 token 收費 5 美元。圖像輸入每百萬 token 收費 10 美元,輸出每百萬 token 收費 40 美元。
OpenAI 官方表示,實際使用過程中,生成一張方形圖片的大致費用如下:
1?? 低質量圖像:約 0.02 美元
2?? 中等質量圖像:約 0.07 美元
3?? 高質量圖像:約 0.19 美元
想要體驗或接入這一功能的開發者,可訪問 OpenAI 平臺獲取完整的圖像生成功能指南:
https://platform.openai.com/docs/guides/image-generation
值得一提的是,OpenAI CEO Sam Altman 除了呼吁用戶使用新模型發揮創意,還宣布 Plus 用戶的 o3 和 o4-mini-high 的速率限制翻倍。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.