ChatGPT 凌晨發了新東西,通過 4o 模型,創建靠譜的圖像:光影、文字、細節栩栩如生
通過對話,可以進一步修改:遮擋、倒影等等都處理的非常到位
圖片質量相當高,可直接用于科普插畫,比如:分光三棱鏡
繼續對話,一致性相當好,比如讓他畫成書冊:
只能說:斗宗強者,竟恐怖如斯,OpenAI 的箱子里,還是有東西的。
讓我們細致看一看:本次更新,突破了以往的哪些邊界。
文本渲染絕佳
一圖勝千言,來感受一下。比如讓他根據對話內容,來畫一個菜單(文字是單獨給的)
或者讓他去畫一個婚禮邀請(同樣,文字單獨給到)
多輪生成很棒
這套圖像生成,是 GPT-4o 的原生功能,可通過對話,逐步進行圖像完善,并保持內容一致。比如這個:
也比如我把橘貓放在了魔獸世界里
甚至來說,我還可以要求他生成 png 透明版
指令遵循很強
在生成圖像的時候,4o 的指令遵循能力很強,可以處理包含 10-20 個不同物體的場景,并對物體與特征及關系的緊密綁定允許更好的控制。
比如:只有一滴紅酒的空玻璃杯
prompt: show me a wine glass with only the tiniest drop of red wine in it.
比如:看不見的大象
Prompt: We need evidence there is a currently present invisible elephant. Consider what an elephant is and does in the environment, then show us that, perhaps mid-process - but the elephant itself is not shown at all
我還讓他給畫了個擼貓指南
Prompt: 4-step photo guide on how to pet a cat
上下文關聯
如果很清楚知道自己要什么,可以直接上傳圖片給 ChatGPT,讓參考風格、精準輸出。比如給一些風格插畫,然后要求 GPT 來生成一個三角形輪子的自行車
吐槽:為啥是英國專利
而我,作為爐石玩家,我讓 ChatGPT 來生成一份奧特曼的專屬卡片
Hhhhh 太真實了,GPT 覺得奧特曼上不了傳說,種族屬于「戰吼」(特別能逼逼)
然后,還可以讓他做個實體版... 稀有度變成了普通,技能變成了嘲諷,hhhhh認真的嗎?
貫通現實知識
4o 的繪圖,能夠從大模型中直接獲取到知識,生成與現實世界知識相符的圖像,如:可以直接使用的雞尾酒配方
Prompt: Make me a professionally shot photorealistic diagram of the top selling cocktails in my bar with recipes labeled on each drink. put the recipes on handwritten cards in front of each drink. The cards are brown, and the text is black. Background is white.Title is "4 most popular cocktails"
制作一款披薩
Prompt: A graphic of an Italian chef giving instructions on how to make authentic pepperoni pizza
動量定理和沖量定理
Prompt: 畫一個有關沖量定理和動量定理的 infographic
Prompt:畫一個肯德基的簡體中文菜單,其中有一個套餐叫做“V 我 50”
風格多樣
4o 的這個模型,能輕松繪制各種風格的圖像。比如我讓他用莫奈的風格,來畫一只貓
Prompt:一只貓,莫奈風格
幻想風格的海豚地鐵
Prompt: A realistic underwater scene with dolphins swimming through the windows of an abandoned subway car, with bubbles and detailed water flow accurately simulated.
奧特曼在采棉花,頗有紀錄片的范兒
Prompt: 山姆奧特曼正在采棉花
一些限制
當然,這個模型也存在一些問題:
- 對于長圖像,會出現剪裁問題
- 可能產生幻覺,然后開始胡編亂造
- 難以準確渲染超過 20 個不同概念
- 多語言文本渲染:處理非拉丁語言(比如中文),不夠準確
- 對特定部分要求編輯,可能會出 bug
- 密集文本下,效果會不好
以及...出于安全考慮,很多內容不允許被生成,比如:米老鼠大戰皮卡丘的鈔票
最后
OpenAI 這次的更新的確非常棒,真沒得黑。
這項功能已經通過 ChatGPT & Sora 向 Plus、Pro、Team 和免費用戶推出,替換 DaLLE 作為默認圖像生成器。,Enterprise 和 Edu 用戶也將很快更新,API 也將在數周內進行更新。
所以,不要小瞧 OpenAI,箱子里有貨的
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.