99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-4o怎么搶了Midjourney的飯碗

0
分享至



2025年3月26日,OpenAI凌晨官宣,GPT-4o的原生多模態(tài)圖像生成功能正式上線。用戶不再需要登錄OpenAI的文生圖模型DALL-E,可以直接在ChatGPT應(yīng)用里調(diào)用4o生成、修改圖片。

一夜之間,AI生成的吉卜力圖像在X等社交媒體上瘋傳,互聯(lián)網(wǎng)被一場(chǎng)溫柔的二次元畫(huà)風(fēng)浪潮淹沒(méi)。人們上傳自拍照,輸入“吉卜力風(fēng)格”,幾秒后,宮崎駿動(dòng)畫(huà)中的唯美與夢(mèng)幻便流淌在發(fā)絲衣角間,甚至連OpenAI創(chuàng)始人奧特曼也曬出自己的吉卜力頭像,為這場(chǎng)熱潮添了一把火。



不過(guò),吉卜力的火爆只是其一,更關(guān)鍵的是,GPT-4o的繪圖能力出圈打破了文生圖領(lǐng)域的固有格局,以Midjourney等垂類應(yīng)用為首的賽道第一次遭到了大模型的挑戰(zhàn)。

原來(lái),人們用Midjourney生圖時(shí),仍面臨著一個(gè)致命問(wèn)題:隨機(jī)性太強(qiáng),在提示詞過(guò)于復(fù)雜的時(shí)候,細(xì)節(jié)還原度就會(huì)顯著降低,而GPT-4o控圖能力的躍升,讓人類第一次感受到了與AI藝術(shù)家在多輪對(duì)話中精準(zhǔn)改圖的魅力。

那么,一個(gè)人類印象里只會(huì)聊天的通用大模型GPT-4o,是如何趕超文生圖領(lǐng)域?qū)I(yè)選手Midjourney的呢?



實(shí)際上,類似Midjourney一樣的應(yīng)用早在一年前就能生成吉卜力、賽博朋克、超現(xiàn)實(shí)等多種風(fēng)格的圖像,甚至在畫(huà)面細(xì)膩感、解析力上略勝于GPT-4o。但GPT-4o的聰明之處在于,它沒(méi)有選擇正面硬剛其藝術(shù)領(lǐng)域的生圖質(zhì)量,而是在應(yīng)用門檻、修圖改圖、跨學(xué)科能力等細(xì)分賽道彎道超車。

一是自然語(yǔ)言對(duì)話能力的提升大大降低了使用門檻。傳統(tǒng)文生圖領(lǐng)域,用戶必須掌握一套復(fù)雜的結(jié)構(gòu)化提示指令,比如風(fēng)格、鏡頭、色彩、角度、背景、主體等,差之毫厘、謬以千里。而GPT-4o可以精準(zhǔn)理解自然語(yǔ)言命令,只需要像跟好友一樣交流,張嘴畫(huà)圖成為現(xiàn)實(shí)。

自然語(yǔ)言就是大白話,日常生活中的口頭語(yǔ)。比如,如果你需要一張瀑布圖,只需要告訴GPT-4o,“幫我生成一幅清晨茂密森林里的彩虹瀑布”就可以了。但面對(duì)Midjourney就需要像下圖一般,用高度結(jié)構(gòu)化的prompt指令告訴它:這個(gè)圖像的主體有什么,背景是什么顏色,仰角、俯角還是平視,風(fēng)格是油畫(huà)、古典或者賽博朋克,需要細(xì)分到這種程度才可能達(dá)到理想效果,但就算分得這么細(xì)了,依然會(huì)有一些無(wú)關(guān)緊要的畫(huà)面元素跳出來(lái)畫(huà)蛇添足。



二是多模態(tài)能力帶來(lái)的圖生圖、圖改圖功能的上線。類似Midjourney一樣的應(yīng)用只能發(fā)文字指令,不支持上傳一張圖片再做修改,或者說(shuō)不支持AI生圖后,再調(diào)整圖像的分辨率、色彩、背景。如果成圖效果不理想,只能回到第一步重寫(xiě)提示詞碰運(yùn)氣,之前生成的圖像等同作廢。

GPT-4o的強(qiáng)悍就在于用戶可以隨便上傳一張圖片多次修改,可以是AI生成的,也可以是自己拍的。比如,你可以上傳一張全身照,把頭型換成大波浪,把衣服換成購(gòu)物車?yán)锏娜棺涌瓷仙硇ЧKС衷诂F(xiàn)有的圖片上去p圖去修改,相當(dāng)于我們不用學(xué)習(xí)PS這種具有高壁壘性質(zhì)的修圖技術(shù)。

更牛的是它還可以多輪對(duì)話,支持在原圖上不限次數(shù)地一直改,直到滿意為止。你可以一會(huì)兒改一個(gè)頭發(fā),一會(huì)兒把背景換成沙漠,或者一會(huì)兒調(diào)整濾鏡風(fēng)格。只要你想,它便滿足。



圖源:小紅書(shū)@Mr.湯先森

除了交互門檻的降低和控圖能力的提升,GPT-4o的跨學(xué)科知識(shí)儲(chǔ)備也讓人驚艷。集成了大語(yǔ)言模型原有知識(shí)庫(kù)的GPT-4o相當(dāng)于一個(gè)知天文、曉地理的畫(huà)家,不僅能解高數(shù)、做物理題,還原建筑草圖也不在話下。相比之下,Midjourney作為垂類應(yīng)用始終局限在藝術(shù)領(lǐng)域里,為電影宣發(fā)、廣告等文娛產(chǎn)業(yè)服務(wù)。

GPT-4o有多牛?給一個(gè)題目就可以生成函數(shù)圖像,相當(dāng)于一款畫(huà)圖指導(dǎo)版的拍照搜題應(yīng)用。甚至于你給他一個(gè)沒(méi)有任何色彩的鉛筆畫(huà)建筑草圖,它都能生成出施工后的房屋實(shí)景,完全跨越了學(xué)科的邊界,是一個(gè)文理雙全的全能型選手。



圖源:小紅書(shū)@云安

既然GPT-4o生圖改圖功能如此驚艷,我們就要發(fā)問(wèn)了,在其火爆出圈背后,能夠?yàn)槠胀ㄈ藥?lái)什么實(shí)際價(jià)值呢?



就在其上線一周內(nèi),Midjourney CEO大衛(wèi)·霍爾茲坐不住了,發(fā)文稱:GPT-4o只是花架子,Midjourney-v7下周上線。





GPT-4o和Midjourney孰優(yōu)孰劣,現(xiàn)在還難以定論。但能夠肯定的是,GPT-4o火出圈了,它沖出了設(shè)計(jì)師這個(gè)小眾的圈子,走入了大多數(shù)人的工作場(chǎng)景里,就算完全不知道AI生圖是什么,但一定也知道社交媒體上突然冒出一個(gè)能用嘴P圖的網(wǎng)絡(luò)工具。

那么,GPT-4o為什么這么火,給我們帶來(lái)的一個(gè)最實(shí)際的價(jià)值點(diǎn)在哪里?

首先,它真的做到了應(yīng)用零門檻,用戶甚至不需要任何藝術(shù)功底和AI基礎(chǔ),毫無(wú)基礎(chǔ)的普通人也能直接上手。用Midjourney,你必須知道一些基本的流派、色彩、光學(xué)、框架等繪畫(huà)知識(shí)以及/imagine(生成圖像)、--ar(圖像寬高比)等基礎(chǔ)英文提示指令。但用GPT-4o,你也可以不懂透視、框架、光線,也不需要知道什么是結(jié)構(gòu)化提示詞,完全不用任何專業(yè)基礎(chǔ),就像跟朋友對(duì)話一般交流就可以修圖。



圖源:小紅書(shū)@Geek4Fun

除了使用門檻降低,模型產(chǎn)品的質(zhì)量和效能也大幅提升。一是生圖更快,以前用Midjourney解析復(fù)雜指令需要1min左右,GPT-4o在20s內(nèi)就可以還原。

第二,生圖和改圖的控制性提高了,GPT-4o能夠完全還原你給它的指令。比如同樣的一個(gè)指令“給我生成一個(gè)貓貓和狗狗在草地里玩耍的場(chǎng)景”,GPT-4o生成的就是一只貓和一只狗在草地上玩,沒(méi)有任何其他會(huì)突然冒出的元素,但Midjourney可能在草坪上多一個(gè)公園或建筑,不會(huì)完全按指令來(lái)。通俗地講,就是GPT-4o更能聽(tīng)你的人話了,它就像你的電子仆人一樣,你讓他干嘛,他就干嘛,多余的事一件不做,該做的事也絕不少干,精確度更強(qiáng)了。

由此,GPT-4o打開(kāi)全民賽道,進(jìn)入到我們工作場(chǎng)景里。之前,普通用戶用Midjourney更多還是出于興趣,娛樂(lè)屬性強(qiáng)、工具屬性弱。生成的油畫(huà)、動(dòng)漫等各種風(fēng)格的圖像雖好看,但既不能提升工作效率,也不能賺錢,主要起到了一個(gè)造型上的作用。



而GPT-4o的用嘴P圖讓AI繪圖能夠落地的行業(yè)增多,從娛樂(lè)化與藝術(shù)性走向了專業(yè)化與生產(chǎn)力,可以應(yīng)用到電商、教育、建筑、設(shè)計(jì)等各行各業(yè)。比如你的小孩不會(huì)做題,以前需要請(qǐng)教課老師或者下載作業(yè)幫,輔導(dǎo)費(fèi)用貴而作業(yè)幫的講解只有干巴巴的一段文字,令人費(fèi)解。但是GPT-4o完全可以生成一張講解草稿圖,函數(shù)怎么生成的,答案怎么得來(lái)的,推導(dǎo)過(guò)程流暢自然。

再比如電商行業(yè)的宣傳海報(bào),甲方需要你生成一個(gè)針對(duì)歐美市場(chǎng)的英語(yǔ)海報(bào),其中設(shè)計(jì)元素和語(yǔ)言都需要做本地化潤(rùn)色。之前的流程是對(duì)接設(shè)計(jì)師修改元素、去翻譯軟件潤(rùn)色,再導(dǎo)入PS軟件修改,費(fèi)時(shí)費(fèi)力。但現(xiàn)在GPT-4o只需要一句話,“把這張海報(bào)改成歐美風(fēng),語(yǔ)言變成英語(yǔ)”,它就很快就能設(shè)計(jì)一張符合要求的海報(bào),跨領(lǐng)域跨學(xué)科的集成能力非常強(qiáng)悍。



聊完GPT-4o的畫(huà)圖出圈,不如再聊聊,GPT-4o作為一種底層模型還有什么可挖掘的地方。

我們都知道,Midjourney是一個(gè)架構(gòu)在模型上的應(yīng)用,但GPT-4o本身就是一個(gè)模型,生圖是它的能力之一。2022年剛出道的ChatGPT只是一個(gè)能夠文字交流的對(duì)話助手,后來(lái)可以語(yǔ)音打電話,現(xiàn)在又能畫(huà)圖,一直不停在不同維度上迭代升級(jí)。



而此次GPT-4o能繪圖賽道突出重圍,真要感謝其原生多模態(tài)模型能力的大幅涌現(xiàn)。跟Midjourney不一樣,GPT-4o有更多技術(shù)路徑可走。現(xiàn)在文生圖領(lǐng)域應(yīng)用普遍用的底層模型叫擴(kuò)散模型diffusion model,原理是先生成一個(gè)大概的圖像,再消除噪點(diǎn),就像雪中作畫(huà)、霧里看花,還原能力不強(qiáng)。而GPT-4o沿用文生圖自回歸模型,相當(dāng)于把之前預(yù)測(cè)token的邏輯推理能力進(jìn)一步延伸到了文生圖領(lǐng)域,通過(guò)逐幀繪制的方式,從已生成的像素推測(cè)下一個(gè)像素,本質(zhì)是模仿人類畫(huà)畫(huà)。這意味著,與垂類應(yīng)用不同,大模型可以從底層架構(gòu)上選擇不同的技術(shù)路徑,而架構(gòu)的升級(jí)通常會(huì)帶來(lái)性能的躍升,基于GPT-4o等原生模型的功能有更多的生長(zhǎng)空間。



第二個(gè)是,多模態(tài)融合會(huì)帶來(lái)跨領(lǐng)域的融會(huì)貫通,GPT-4o作為一種通用大模型,擁有整合文字、音頻、圖像等不同格式信息的能力,現(xiàn)階段已經(jīng)可以打電話、生圖改圖了。而在未來(lái),是不是可以直接生成音樂(lè)和視頻,也值得期待。實(shí)際上,GPT-4o本次上線的生圖功能就脫胎于OpenAI的文生圖模型DALL-E。或許,OpenAI旗下的文生視頻模型Sora也可能通過(guò)某種技術(shù)被整合到GPT模型里。屆時(shí),在一個(gè)模型里交叉處理多種模態(tài)的信息將不再遙遠(yuǎn)。

而多模態(tài)創(chuàng)新也進(jìn)一步說(shuō)明,模型走向多功能后,處理各種任務(wù)的能力越來(lái)越強(qiáng),帶來(lái)的總AI使用成本降低。一個(gè)可以預(yù)見(jiàn)的趨勢(shì)是,大模型正在試圖成為一個(gè)一站式打包站點(diǎn),將代碼、設(shè)計(jì)、音樂(lè)、數(shù)據(jù)處理等多種任務(wù)集成在一起。可能在未來(lái)某一天,類似于ChatGPT一樣的模型強(qiáng)悍到在任何領(lǐng)域都能做到前三,我們也不再需要下載畫(huà)圖的Midjourney、寫(xiě)代碼的coze、做音樂(lè)的suno等垂類應(yīng)用,直接下載類似于ChatGPT一樣的模型,就能解決所有的事情。這樣一來(lái),手機(jī)的內(nèi)存更大了,運(yùn)行效率也快了。每個(gè)月還可以省下了垂類應(yīng)用一百塊左右的會(huì)員定制費(fèi),性價(jià)比更高了。



簡(jiǎn)言之,GPT-4o繪圖能力的出圈讓我們看到了底層大模型集成多應(yīng)用的能力。而從這個(gè)能力衍生出的愿景是,我們未來(lái)可以在一個(gè)一站式的模型里面同時(shí)使用繪畫(huà)、音樂(lè)、代碼等多維能力。并且,它的使用門檻是非常低的,低到任何一個(gè)毫無(wú)技術(shù)基礎(chǔ),甚至連AI都不了解的人都能用。

而這或許才是人類發(fā)明AI的終極目標(biāo)——讓技術(shù)普惠到每一個(gè)角落。



聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
上升20位!ClutchPoints最新模擬選秀:楊瀚森在46順位被魔術(shù)選中

上升20位!ClutchPoints最新模擬選秀:楊瀚森在46順位被魔術(shù)選中

直播吧
2025-06-03 11:31:19
廣東一幼兒園舉辦迷你版龍舟賽,選手平均年齡5歲,園長(zhǎng):今年三月就開(kāi)始訓(xùn)練了

廣東一幼兒園舉辦迷你版龍舟賽,選手平均年齡5歲,園長(zhǎng):今年三月就開(kāi)始訓(xùn)練了

極目新聞
2025-06-01 23:20:56
皇馬本賽季13支梯隊(duì)奪得聯(lián)賽冠軍,弗洛倫蒂諾與隊(duì)長(zhǎng)們合影

皇馬本賽季13支梯隊(duì)奪得聯(lián)賽冠軍,弗洛倫蒂諾與隊(duì)長(zhǎng)們合影

懂球帝
2025-06-03 01:33:16
男子哈工大本碩被裁員4個(gè)月,投200份簡(jiǎn)歷后找到工作,薪資降7000

男子哈工大本碩被裁員4個(gè)月,投200份簡(jiǎn)歷后找到工作,薪資降7000

奇思妙想草葉君
2025-06-01 21:27:32
校足教練:嗨球糾紛事件發(fā)生后,有青訓(xùn)機(jī)構(gòu)連夜開(kāi)會(huì)、請(qǐng)法務(wù)

校足教練:嗨球糾紛事件發(fā)生后,有青訓(xùn)機(jī)構(gòu)連夜開(kāi)會(huì)、請(qǐng)法務(wù)

懂球帝
2025-06-02 21:19:16
很多人在說(shuō):性蕭條時(shí)代來(lái)臨了

很多人在說(shuō):性蕭條時(shí)代來(lái)臨了

深度報(bào)
2025-05-29 22:26:07
龍賽羅:安切洛蒂本打算買人補(bǔ)強(qiáng)球隊(duì),但皇馬歐冠被淘汰后就停了

龍賽羅:安切洛蒂本打算買人補(bǔ)強(qiáng)球隊(duì),但皇馬歐冠被淘汰后就停了

直播吧
2025-06-03 12:14:07
身價(jià)上漲!德轉(zhuǎn)預(yù)熱K77最新身價(jià):最低8500萬(wàn)歐,最高1億歐

身價(jià)上漲!德轉(zhuǎn)預(yù)熱K77最新身價(jià):最低8500萬(wàn)歐,最高1億歐

直播吧
2025-06-03 07:25:15
韓國(guó)申遺醬油、黃豆醬成功!惹怒中國(guó)網(wǎng)友,專家們卻說(shuō):不用著急

韓國(guó)申遺醬油、黃豆醬成功!惹怒中國(guó)網(wǎng)友,專家們卻說(shuō):不用著急

boss外傳
2025-06-03 09:40:05
97歲協(xié)和名醫(yī)劉力生教授:不是少鹽、勤鍛煉就能降壓,關(guān)鍵在這3點(diǎn)

97歲協(xié)和名醫(yī)劉力生教授:不是少鹽、勤鍛煉就能降壓,關(guān)鍵在這3點(diǎn)

趣文說(shuō)娛
2025-05-12 09:20:50
結(jié)構(gòu)性行情或延續(xù),券商建議6月投資緊抓三大主線

結(jié)構(gòu)性行情或延續(xù),券商建議6月投資緊抓三大主線

澎湃新聞
2025-06-03 07:24:05
變了?字母可能去猛龍不是火箭!

變了?字母可能去猛龍不是火箭!

風(fēng)子說(shuō)個(gè)球
2025-06-03 12:54:07
在舊社會(huì)被當(dāng)做“肉屏風(fēng)”的家妓,吃老人痰,泡陰棗,比娼妓還慘

在舊社會(huì)被當(dāng)做“肉屏風(fēng)”的家妓,吃老人痰,泡陰棗,比娼妓還慘

午夜故事會(huì)
2025-05-08 11:52:29
北京一家人端午到河南吃席,席間上來(lái)一道菜,父親驚慌:吃完快走

北京一家人端午到河南吃席,席間上來(lái)一道菜,父親驚慌:吃完快走

濤哥美食匯
2025-06-03 09:03:47
亞朵,擠滿了偷偷開(kāi)房的中年女人

亞朵,擠滿了偷偷開(kāi)房的中年女人

快刀財(cái)經(jīng)
2025-05-20 22:21:25
登貝萊:我必須為年輕球員樹(shù)立榜樣,我已經(jīng)不再年輕了

登貝萊:我必須為年輕球員樹(shù)立榜樣,我已經(jīng)不再年輕了

雷速體育
2025-06-03 09:23:21
香港“第一惡人”方剛?cè)ナ溃簧椿闊o(wú)子,億萬(wàn)遺產(chǎn)誰(shuí)來(lái)繼承?

香港“第一惡人”方剛?cè)ナ溃簧椿闊o(wú)子,億萬(wàn)遺產(chǎn)誰(shuí)來(lái)繼承?

鋭娛之樂(lè)
2025-05-31 21:22:42
賴清德想跑路?國(guó)防部:“臺(tái)獨(dú)”首要分子想跑,是不可能的

賴清德想跑路?國(guó)防部:“臺(tái)獨(dú)”首要分子想跑,是不可能的

歷史求知所
2025-06-02 12:35:07
曼聯(lián)給姆貝莫周薪細(xì)節(jié)曝光!與庫(kù)尼亞持平隊(duì)內(nèi)第四,明年或成頂薪

曼聯(lián)給姆貝莫周薪細(xì)節(jié)曝光!與庫(kù)尼亞持平隊(duì)內(nèi)第四,明年或成頂薪

羅米的曼聯(lián)博客
2025-06-03 10:17:12
王思聰新女友“懶懶”美上熱搜!22歲穿MiuMiu像豪門千金,太絕了

王思聰新女友“懶懶”美上熱搜!22歲穿MiuMiu像豪門千金,太絕了

TVB的四小花
2025-06-03 07:22:29
2025-06-03 13:07:00
腦極體 incentive-icons
腦極體
從智能密鑰到已知盡頭
3347文章數(shù) 166874關(guān)注度
往期回顧 全部

科技要聞

李斌:樂(lè)道一線減員40% 銷量反要大漲40%

頭條要聞

眾多山區(qū)小商戶稱被寶潔起訴賣假貨:對(duì)方悄悄取證一年

頭條要聞

眾多山區(qū)小商戶稱被寶潔起訴賣假貨:對(duì)方悄悄取證一年

體育要聞

獎(jiǎng)金568萬(wàn)!鄭欽文挑戰(zhàn)薩巴沖法網(wǎng)4強(qiáng)

娛樂(lè)要聞

李小璐賈乃亮首合體!陪甜馨過(guò)六一

財(cái)經(jīng)要聞

霸王交卷,單店失蹄

汽車要聞

吉利汽車5月銷量23.52萬(wàn)輛 同比增長(zhǎng)46%

態(tài)度原創(chuàng)

家居
親子
教育
公開(kāi)課
軍事航空

家居要聞

北歐氛圍 清新活潑趣味

親子要聞

醫(yī)生宣判孩子手和胳膊都廢了,媽媽:只要有希望就行

教育要聞

洋蔥學(xué)園數(shù)字課程內(nèi)容數(shù)量突破1萬(wàn)節(jié),學(xué)習(xí)互動(dòng)超5000億次

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

中國(guó)記者拿著美菲勾結(jié)證據(jù)對(duì)質(zhì) 菲律賓防長(zhǎng)當(dāng)場(chǎng)急了

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 阳春市| 左贡县| 淳安县| 武安市| 芜湖县| 广安市| 溧水县| 威宁| 桐庐县| 永清县| 闽清县| 改则县| 铁岭市| 大邑县| 图片| 嘉荫县| 海丰县| 米脂县| 枣强县| 台北市| 虹口区| 来凤县| 凤翔县| 洛浦县| 杭锦旗| 瑞安市| 哈巴河县| 龙游县| 肥乡县| 陇西县| 伽师县| 安国市| 简阳市| 南部县| 黔西县| 会同县| 汝阳县| 巨野县| 玉山县| 林口县| 南溪县|