99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

被誤導兩天,GPT-4o文生圖模型強到可怕

0
分享至


文:王智遠 | ID:Z201440

前天,寫了一篇關于ChatGPT文生圖功能的文章。

發到知乎后,一位 2021年的年度新知答主 提出了質疑,認為我使用的可能不是最新的模型,因為新舊版本差距很大。

他指出,最新版文生圖能力很強,而我展示的結果提示詞理解差,生成的文字也錯誤很多。

他舉例說,像提示詞「兩個人相互推對方」這種簡單概念,真正最新版模型應該能準確表現。他還建議我檢查是否使用了新模型,并給了我一個鏈接,稱那是最新版的界面。

他還分享了一個驗證方法:

輸入100+個英文單詞,如果文字全亂就是其他模型(如DALL·E),如果只錯一兩個字母才是最新版的ChatGPT

他還曬出了兩次按我的提示詞生成的結果,質疑不能都用“隨機性”來解釋。被他這么一說,我懷疑自己用錯了模型,我之前用的ChatGPT客戶端,拿它生成的來比,效果的確有有差異,于是,決定重新試一下。

首先,我用了這位新知答主給我的提示詞,如下:

Alright, here’s a shorter version:12 flowers in a 4x3 grid on a wooden tray with glass bottom and animal fat layer. From top to bottom
ylang-ylang, osmanthus, yellow champaca; tuberose, gardenia, jasmine; carnation, peony, pink hyacinth; blue iris, violet, wisteria. Photo taken on a sunny afternoon

英文原意比較長,翻譯成縮減的中文是:

從正上方俯拍的 12 種花,呈四行三列擺放。第一行有依蘭、桂花和黃緬梔子;第二行有晚香玉、梔子花和茉莉;

第三行有康乃馨、牡丹和粉色風信子;第四行有藍鳶尾、紫羅蘭和紫藤。所有的花都放在一個帶玻璃底的木質托盤上,玻璃上有一層透明的動物脂肪。照片拍攝于一個陽光明媚的下午,托盤被陽光完全照亮。



ChatGPT 很快給出了答案。這次生成與以往不同的是,它補充了一句話:根據你的描述,這是由 DALL·E 創建的。DALL·E 是 OpenAI 的圖像生成模型。

看來,不僅我遇到過前天提到的模型混淆問題,估計國外友人也遇到過類似情況。

從這里可以得出一個結論:ChatGPT 官方提到的免費試用最新的非自回歸模型(Non-autoregressive models)似乎并不支持,或者說做了一定限制。

于是,我直接把問題拋給了 ChatGPT:如何運用最新的文生圖模型?”它給出了三種答案:

第一種是直接使用 ChatGPT 內置的圖像生成功能,直接輸入詳細的描述,它會用最新的模型生成圖像。你可以優化提示詞(Prompt),比如:

  • 具體描述主體、背景、光照、風格等
  • 指定構圖,比如“俯視圖”“廣角鏡頭”
  • 選擇藝術風格,如“油畫風”“賽博朋克風”

第二種是使用 API,你可以進行批量生成或將其集中到作品中;第三種則是純介紹,它提到新的文生圖模型做了多模態結合,生成帶有故事性的連續圖像,用 AI 先生成草圖,再細化成精美插畫等。

不想太多,我直接按照的要求,把任務交給了 Kimi,讓 Kimi 幫我生成一個提示詞:

在昏暗的復古書房里,一盞臺燈散發著柔和的暖光,照亮了一張古老的木質書桌。書桌上散落著幾本泛黃的書籍和一支羽毛筆,旁邊是一杯冒著熱氣的紅茶。畫面采用油畫風格,營造出寧靜而懷舊的氛圍,仿佛時間在這里靜止。

ChatGPT生成的圖片如下,但是,它依然還是那句話,這是由 DALL·E 生成的圖像,展現了你描述的復古書房氛圍;很快,ChatGPT 將推出新的圖像生成模型,帶來更好的細節和風格控制。

所以,結論是:ChatGPT模型是無法使用最新的文生圖模型的。怎么辦?為了驗證準確度,好久沒有給ChatGPT充值的我,索性再來了一個月會員。



搞定后,切換到ChatGPT 4o對話界面,輸入提示詞:

在一片寧靜的海邊小鎮,夕陽的余暉灑在古老的燈塔上,燈塔的影子拉得很長。遠處的海面上,幾艘小船在金色的波光中緩緩航行,天空中飄著幾朵粉色的云。畫面采用水彩畫風格,色彩柔和而溫暖,營造出一種寧靜而夢幻的氛圍。

響應速度有點慢,不過,生成的圖片的確有意境:



所以,必須ChatGPT 4o才可以用,GPT還是老版本的DALL·E模型。隨后,我又給它了一個卡通人物的提示詞:

一個活潑可愛的卡通小貓,有著大大的藍色眼睛和柔軟的粉色耳朵,身上穿著一件紅色的小背帶褲,腳上蹬著一雙黃色的小靴子。
它正站在一個充滿魔法的森林里,周圍是五顏六色的蘑菇和閃爍的螢火蟲。畫面采用卡通風格,色彩鮮艷明亮,營造出一種奇幻又歡樂的氛圍。畫面比例為4:3。

我很好奇它能生成什么樣的畫面。你覺得怎么樣呢?



我確實不太好評價,只能說這張圖風格可愛、充滿童趣,色彩溫馨。如果用在兒童讀物、繪本,或者早教、幼教的互動課件、手工素材里,肯定是足夠的。

接著我把圖片拿給豆包,讓他深度思考一下,說:你評價一下效果怎么樣?我用的是ChatGPT 4o的最新文生圖模型。

豆包說:

這幅圖還挺不錯。小貓的表情和衣服細節畫得挺生動,蘑菇和螢火蟲也很有感覺。暖色調的小貓配上冷色的夜景,色彩搭配和諧,營造出一種夢幻又可愛的氛圍。
小貓在畫面中間,構圖看著很舒服,主題也很突出。畫面整體質量挺高,能用到不少地方,這模型生成的效果挺好。”

但是,問題來了,測試文生圖也看不出它的厲害之處,試試它兩張圖的融合能力怎么樣?

我從百度上隨機下載了兩個水杯的圖片,這兩個水杯都處于真實的場景中,且每個水杯都有手拿著。我想看看它是否能把手摳掉,把兩個杯子放在同一個平面上。

然后給到 Kimi,讓 Kimi 幫我寫個提示詞:

請將兩張水杯圖片中的手部部分去除,僅保留水杯本身,確保水杯的細節清晰完整。背景保持簡潔,以便用于電商海報設計。水杯的光影和質感需要保留,確保整體畫面自然且具有吸引力。



第一次它好像卡住了,跟我說:抱歉,我處理不了你的要求,要不你再試試?

估計是用的人太多了。我重新開個窗口,這回它很快就有反應了。問題是,第一張照片處理得挺干凈,但第二張直接被忽略了。



這下我可不干了,直接把要求說得清清楚楚,一共四點:

把兩只手都去掉,只留下水杯;水杯的細節、質感和光影得保留好,看著得自然;背景要簡單干凈,突出水杯;兩個水杯放在一起,比例要協調,畫面得好看。還特別提醒它,尺寸要4:3的。

結果它花了大概40秒,就搞定了。看到結果時,真的只能驚嘆:“這也太厲害了”,設計師要下崗了。



你覺得怎么樣?速度、效率遠比人工摳圖搞的快。

我又試了試Chat GPT 4o新出的知識圖功能,官方吹的吹得神乎其神,說有了這功能,AI生成圖片能把現實世界里的知識用起來,更懂用戶想啥,做出來的圖也更靠譜、更合乎常理。

簡單說:AI畫畫會琢磨現實里的那些細節,比如地方在哪兒、啥文化背景,還有物理規律那些。

這次,讓deepseek來,我說,你幫我寫一個帶因果邏輯的文生圖的提示詞。有一個細節就是圖片比例依然是4:3。這是它隨機給到的:

內容是一個陽光明媚的下午,一個小男孩坐在公園的長椅上,手里拿著一個冰淇淋,臉上露出開心的笑容。
因為他剛在游樂場玩得很開心,現在正享受著美味的冰淇淋。畫面采用溫馨的色調,背景是綠樹成蔭的公園,遠處有幾個小朋友在玩耍。圖片比例為4:3,整體風格清新自然。



額,這看不出什么因果邏輯。怎么辦?重新來過。索性直接把「定律」加在圖中間。這是deepseek給我的兩個提示詞:

一個是杠桿定律:生成一張圖,一個小孩在蹺蹺板上,通過杠桿原理把一個重物抬起來。小孩用力往下壓,重物被抬高,體現杠桿原理。背景簡單,比例4:3。



如上圖。這看著像嗎?的確很杠桿。給豆包后,它說:

這圖是說,有個小孩在壓蹺蹺板一頭,想把另一頭的大重物撬起來。就像玩蹺蹺板,坐一頭能把另一頭的人翹起來,利用這個方法,不用費老不用費老大勁就能把重東西抬起來,是一種省力的小竅門。

的確有點強。不過興許有些簡單,換一個:就拿「相對論的時間膨脹效應」來測試。

提示詞:

生成一張圖,展示兩個人:Alice 在地球上,Bob 在高速飛行的宇宙飛船里。因為相對論的時間膨脹效應,Bob 看起來比 Alice 年輕。地球上 Alice 在慢慢變老,而飛船里的 Bob 幾乎沒變。背景簡單,比例4:3。



你能看得出來嗎?

反正我能看得懂。不過,第一次生成時,Alice的名字被放在了腳下面,看起來有點奇怪。經過二次對話微調后,成功地把名字放到了正確的位置。

我認為還能在進化,比如:指定人物的性別等等。

除了文生圖、圖片與圖片合成、以及生成理解物理世界規律的圖以外,還有沒有其他玩法呢?

試試風格轉換。比如:將一張人物照片轉換為動漫風格,或者將一張圖片的風格與另一張圖片的內容融合,這種技術在藝術創作和設計時非常受用。

問題是怎么轉換呢?我現在有一張個人形象照,把問題甩給DeepSeek,讓它幫我想想。

DeepSeek說:如果你想測試OpenAI的ChatGPT文生圖模型的能力,可以出一個稍微復雜一點但又具體明確的問題,這樣既能考驗模型的理解能力,又能測試它的生成能力。

比如:我有一張個人形象照,我想把它變成動漫風格。希望你能幫我把照片里的我變成一個動漫角色,頭發換成深藍色的,整體風格有點賽博朋克那種酷酷的感覺。圖片比例是4:3就行。



不管了,一股腦甩給ChatGPT 4o來處理。這好像有點翻車了。不過,可能我要求太高了。



的確有點抽象,你怎么看?

不管怎么說,非自回歸模型(Non-autoregressive models)的進化速度確實很快,它改變了核心架構。

這個架構會先理解整個圖的結構和細節,有點像學生先聽完老師講完題目,把整張畫的輪廓勾勒出來,然后再一點點填充細節。

國內很多產品也在用這種能力了,希望能抓緊時間趕上并超越它。作為個人,我們也要思考一下:

如何快速掌握AI生成圖片的能力,并把它用到工作場景中。說到這兒,問題就來了:你會用它做什么呢?快去試試吧,記得,用ChatGPT 4o模型才有。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
后續來了!上海迪斯尼一家三口打架事件,警方發通報,輿論反轉了

后續來了!上海迪斯尼一家三口打架事件,警方發通報,輿論反轉了

小舟談歷史
2025-06-02 10:09:26
75歲薛家燕談小17歲男友,滿臉甜蜜:起初不想接受,現在覺得好難得

75歲薛家燕談小17歲男友,滿臉甜蜜:起初不想接受,現在覺得好難得

極目新聞
2025-06-02 07:39:23
銀行人員透露:6月開始,手握“定期存款”的人,提前做好5個準備

銀行人員透露:6月開始,手握“定期存款”的人,提前做好5個準備

生活新鮮市
2025-06-02 21:02:18
善惡終有報,曾為安倍晉三哭喪的影后呂麗萍,如今已成為“笑話”

善惡終有報,曾為安倍晉三哭喪的影后呂麗萍,如今已成為“笑話”

卷史
2025-05-02 13:38:20
李大雙狂曬兒子,祭拜奶奶拜佛像,透露離婚隱情,諷刺李琳不生育

李大雙狂曬兒子,祭拜奶奶拜佛像,透露離婚隱情,諷刺李琳不生育

陳意小可愛
2025-06-02 17:52:16
韓國總統選舉投票開始 一文讀懂這次選舉

韓國總統選舉投票開始 一文讀懂這次選舉

新華社
2025-06-03 07:19:06
“難怪小學女老師單身多”,一段私聊記錄流出,油膩是不分性別的

“難怪小學女老師單身多”,一段私聊記錄流出,油膩是不分性別的

熙熙說教
2025-06-02 21:24:18
露餡了!展車用“假”激光雷達,還被人“揭”起來了,真心尷尬

露餡了!展車用“假”激光雷達,還被人“揭”起來了,真心尷尬

小李車評李建紅
2025-06-02 07:23:41
賈靜雯一家三口患癌,巨大變故導致她心情大變,深情呼吁珍惜當下

賈靜雯一家三口患癌,巨大變故導致她心情大變,深情呼吁珍惜當下

快樂娛文
2025-06-02 16:23:19
香港發生銀行劫案!金額曝光

香港發生銀行劫案!金額曝光

港你知
2025-06-02 21:28:50
4511元!新Apple Watch突然大降價,直降2250元

4511元!新Apple Watch突然大降價,直降2250元

搞機小帝
2025-06-03 00:04:58
端午假期“蘇超”成頂流!江蘇文旅贏麻了,蘇超VS歐洲五大聯賽,人口、經濟均不落下風

端午假期“蘇超”成頂流!江蘇文旅贏麻了,蘇超VS歐洲五大聯賽,人口、經濟均不落下風

金融界
2025-06-02 15:25:50
DO:姆貝烏莫已決定加盟曼聯,曼聯將與布倫特福德展開談判

DO:姆貝烏莫已決定加盟曼聯,曼聯將與布倫特福德展開談判

懂球帝
2025-06-03 03:09:12
青島西海岸投資人:無條件支持邵佳一,他想怎么踢就怎么踢

青島西海岸投資人:無條件支持邵佳一,他想怎么踢就怎么踢

懂球帝
2025-06-02 21:19:16
油價塌方下跌!6月2日:調價后92,95號汽油價格,麥價陷入泥潭!

油價塌方下跌!6月2日:調價后92,95號汽油價格,麥價陷入泥潭!

豬友巴巴
2025-06-02 15:30:03
中山降級評為三級城市了,你還會留在中山嗎?這話題,太噎人了。

中山降級評為三級城市了,你還會留在中山嗎?這話題,太噎人了。

小影的娛樂
2025-06-02 17:56:36
八路軍喝上了蒸餾水?說是“緊急可飲水”!

八路軍喝上了蒸餾水?說是“緊急可飲水”!

深度報
2025-05-31 22:49:09
俄媒:普京正召開緊急會議,決定要用核武還是“榛樹”導彈回擊!

俄媒:普京正召開緊急會議,決定要用核武還是“榛樹”導彈回擊!

阿龍聊軍事
2025-06-02 08:44:01
軒子巨2兔自曝脖子長疣有斑,已約醫院,網友:梅事吧

軒子巨2兔自曝脖子長疣有斑,已約醫院,網友:梅事吧

動物奇奇怪怪
2025-06-02 20:46:24
周總理葬禮上喬冠華上前抱住棺槨,哭喊道:我當您兒子為您送終

周總理葬禮上喬冠華上前抱住棺槨,哭喊道:我當您兒子為您送終

領悟看世界
2025-06-03 02:55:33
2025-06-03 07:39:00
智遠同學 incentive-icons
智遠同學
暢銷書《復利思維》作者;精神生活與商業探索,關注科技人文、消費電商、品牌營銷、商業認知思維等方面。
438文章數 89關注度
往期回顧 全部

科技要聞

下周的WWDC,蘋果AI依舊不會有“驚喜”

頭條要聞

美媒稱俄軍遇襲后轟炸機在集體燃燒 烏方透露行動細節

頭條要聞

美媒稱俄軍遇襲后轟炸機在集體燃燒 烏方透露行動細節

體育要聞

傲了一輩子的恩里克,心中永遠住著一個小天使

娛樂要聞

大S女兒來北京!馬筱梅帶她喝下午茶

財經要聞

近期大火的"穩定幣、RWA"是什么?誰將受益?

汽車要聞

吉利汽車5月銷量23.52萬輛 同比增長46%

態度原創

健康
旅游
教育
數碼
手機

唇皰疹和口腔潰瘍是"同伙"嗎?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

教育要聞

越努力,越沒用?如何避開“雞娃”的陷阱

數碼要聞

希捷旗下 4TB 容量款 Xbox 存儲卡現身百思買電商平臺,429 美元

手機要聞

Google Pixel 10 手機將于 8 月 13 日發布

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 新竹市| 荔浦县| 普兰县| 榆社县| 兴仁县| 乌拉特中旗| 盈江县| 平潭县| 蒙山县| 桃园市| 侯马市| 剑河县| 泾源县| 浮山县| 迁西县| 磴口县| 双辽市| 张家港市| 郓城县| 紫金县| 新龙县| 高陵县| 昭觉县| 唐河县| 新乡市| 鹤壁市| 开原市| 安吉县| 盘山县| 新宾| 麻城市| 铜鼓县| 太和县| 锡林郭勒盟| 靖西县| 青岛市| 分宜县| 淳安县| 嘉黎县| 盐源县| 抚远县|