99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI的吉卜力,撞車了被字節(jié)起訴“投毒AI”的前實(shí)習(xí)生?

0
分享至


作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com

想象一下,耗費(fèi)動(dòng)畫大師宮崎駿數(shù)十年心血、一幀一畫精雕細(xì)琢的藝術(shù)風(fēng)格——比如《起風(fēng)了》中耗時(shí)一年多的四秒人群場(chǎng)景,或是《幽靈公主》里那個(gè)生物鉆地鏡頭背后一年零七個(gè)月的 5300 幀手繪,如今,在GPT-4o手中,似乎變得“唾手可得”。用戶們興奮地將個(gè)人照片、網(wǎng)絡(luò)梗圖甚至歷史影像紛紛“一鍵吉卜力化”,其效果之逼真、風(fēng)格之統(tǒng)一,迅速點(diǎn)燃了網(wǎng)絡(luò)。無數(shù)人的時(shí)間線都被塞入了宮崎駿的平行宇宙。OpenAI CEO Sam Altman透露,4o的圖像生成功能在一小時(shí)內(nèi)就吸引了百萬新用戶。


但如果你認(rèn)為這僅僅是OpenAI用一個(gè)更強(qiáng)的模型替換了之前的DALL-E,那可能就忽視了全貌。有敏銳的網(wǎng)友指出:“這不僅僅是一次產(chǎn)品更新——這很可能是一個(gè)徹底的范式轉(zhuǎn)變。” OpenAI 似乎正在解決那些長(zhǎng)期困擾AI圖像生成過程中,讓創(chuàng)作者望而卻步的問題。

那么,秘密武器是什么?OpenAI自己給出了線索:這次的圖像生成是直接內(nèi)置在GPT-4o模型中的,并且,與廣泛采用擴(kuò)散模型(Diffusion Models)的DALL-E、Midjourney、Stable Diffusion 不同,OpenAI在模型卡片中聲明:“與作為擴(kuò)散模型運(yùn)行的DALL·E不同,4o圖像生成是一個(gè)原生嵌入在ChatGPT中的自回歸模型”

值得注意的是,將自回歸思想應(yīng)用于圖像生成并非OpenAI的獨(dú)創(chuàng)。事實(shí)上,如何讓擅長(zhǎng)序列預(yù)測(cè)的自回歸模型在視覺領(lǐng)域發(fā)揮潛力,一直是AI研究者們?cè)噲D攻克的方向之一,意在尋找不同于主流擴(kuò)散模型的新范式。

例如此前獲得頂級(jí)學(xué)術(shù)會(huì)議NeurIPS 2024最佳論文獎(jiǎng)等《視覺自回歸建模:通過下一尺度預(yù)測(cè)實(shí)現(xiàn)可擴(kuò)展的圖像生成》(Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction)的研究,它不僅提出了一種創(chuàng)新的 VAR 方法,顯著提升了自回歸模型生成圖像的質(zhì)量和效率,更是在實(shí)驗(yàn)中首次證明了類 GPT 的純自回歸模型在圖像生成任務(wù)上,有潛力超越當(dāng)時(shí)頂尖的擴(kuò)散 Transformer 模型。

這篇論文由北京大學(xué)與字節(jié)跳動(dòng)的研究者共同完成。而為這篇技術(shù)含量極高的論文增添了更多話題性的,是其第一作者田柯宇的另一重身份——他正是那位因被指控惡意攻擊字節(jié)跳動(dòng)訓(xùn)練集群、面臨巨額索賠而備受關(guān)注的前字節(jié)實(shí)習(xí)生。

這位“含金量還在上升”的實(shí)習(xí)生,以一種意想不到的方式,與AI圖像生成的前沿探索交織在了一起。

1

自回歸的“復(fù)興”

GPT-4o 在圖像生成上的突破,關(guān)鍵之一在于其宣稱采用的自回歸技術(shù)(AR)路徑,這與主流的擴(kuò)散模型截然不同。理解這一差異,是把握這場(chǎng)潛在“范式轉(zhuǎn)變”的核心。

擴(kuò)散模型,如Midjourney和Stable Diffusion,其原理是從隨機(jī)噪聲出發(fā),通過學(xué)習(xí)數(shù)據(jù)分布逐步去噪,最終生成圖像,強(qiáng)項(xiàng)在于生成高質(zhì)量、逼真的圖像,但在速度、計(jì)算成本以及精確理解復(fù)雜指令(尤其是文字渲染)方面常顯不足。

自回歸模型則借鑒了GPT處理文本的方式:按順序預(yù)測(cè)下一個(gè)元素。在圖像上,這意味著模型基于已生成的部分(如像素或圖像標(biāo)記),逐步構(gòu)建出完整圖像。理論上,這賦予了AR在上下文理解、細(xì)節(jié)控制和連貫性上的優(yōu)勢(shì)。然而,傳統(tǒng)AR方法存在效率低、易出錯(cuò)的問題,長(zhǎng)期以來難以在效果上匹敵擴(kuò)散模型。

近年來,以 VAR(Visual Autoregressive Modeling)、掩碼自回歸建模(MAR)等研究,開始為 AR “正名”。VAR提出的“下一尺度預(yù)測(cè)”(從粗到細(xì)生成)等創(chuàng)新,顯著提升了AR模型的圖像質(zhì)量和生成效率,證明了AR路徑不僅可行,甚至有潛力超越擴(kuò)散模型。VAR等研究可能為GPT-4o提供了理論啟發(fā),而GPT-4o的實(shí)踐進(jìn)一步驗(yàn)證了自回歸模型在視覺生成中的可行性,讓 AR 在圖像生成領(lǐng)域迎來了“復(fù)興”的可能。


那么,GPT-4o 的圖像生成具體是如何運(yùn)作的?OpenAI強(qiáng)調(diào)其圖像功能原生集成于模型核心,而非獨(dú)立模塊。這意味著4o能充分利用其強(qiáng)大的語言理解和世界知識(shí)來指導(dǎo)圖像生成,實(shí)現(xiàn)前所未有的上下文理解和指令遵循能力——比如準(zhǔn)確畫出包含特定公式的白板。這種深度融合是 4o 效果出色的關(guān)鍵。

然而,一張流出的內(nèi)部白板圖(標(biāo)注了Transformer -> Diffusion流程)引發(fā)了對(duì)其“純粹”自回歸的質(zhì)疑,可能采用了混合架構(gòu):即利用 AR 的理解能力生成中間表示,再結(jié)合 Diffusion 的像素生成優(yōu)勢(shì)輸出最終圖像。這種猜測(cè)認(rèn)為4o可能融合了兩條路線的優(yōu)點(diǎn),以規(guī)避各自的短板。不過也不能排除是OpenAI在故意混淆事實(shí)。


由于沒有任何技術(shù)報(bào)告,其具體實(shí)現(xiàn)細(xì)節(jié)仍是謎團(tuán),但OpenAI的戰(zhàn)略意圖清晰可見:一是將自回歸原則置于下一代多模態(tài)模型圖像生成的核心位置;二是依托其超大規(guī)模的模型為這一切提供算力和智能基礎(chǔ)。 無論最終的技術(shù)“配方”如何,GPT-4o 都已將自回歸推向了前沿,這很可能會(huì)改變AI圖像生成的未來發(fā)展方向。

1

中美溫差

GPT-4o圖像生成功的成功,引出了一個(gè)值得關(guān)注的現(xiàn)象:無論是語言模型還是視頻模型,中國的企業(yè)追趕迅速,但在尖端圖像生成上,似乎總是美國公司在前沿“獨(dú)奏”?無論是從Midjourney到Gemini Image再到4o,在中國似乎都看不到能與之“對(duì)標(biāo)”的企業(yè)或產(chǎn)品。

我們可以從技術(shù)和商業(yè)兩個(gè)視角來看待這種“溫差”。技術(shù)上,美國頂尖公司似乎更傾向于探索和押注如自回歸(AR)等可能帶來范式革命的新路徑,這或許得益于其在基礎(chǔ)研究上的長(zhǎng)期投入和對(duì)風(fēng)險(xiǎn)的更高容忍度。OpenAI在2020年就推出的自回歸圖像生成模型Image GPT,旨在將自然語言處理中的Transformer架構(gòu)應(yīng)用于圖像生成領(lǐng)域。


而國內(nèi)力量可能更集中于優(yōu)化成熟的Diffusion路線并快速落地應(yīng)用,這在追趕階段十分有效,但也可能帶來一定的路徑依賴。同時(shí),頂尖模型所需的算力、高質(zhì)量數(shù)據(jù)和核心算法創(chuàng)新,本身就構(gòu)成了不低的壁壘。有觀點(diǎn)認(rèn)為, Diffusion模型可能已觸及瓶頸,亟待新的突破。

商業(yè)上,市場(chǎng)定位和變現(xiàn)模式也塑造了不同的發(fā)展方向。Midjourney、GPT-4o等似乎更瞄準(zhǔn)對(duì)效果要求極致的專業(yè)用戶或付費(fèi)意愿強(qiáng)的市場(chǎng),追求打造“爆款”工具并直接收費(fèi)。而中國龐大的應(yīng)用場(chǎng)景(電商、社交、營銷等)或許更看重成本、效率和與現(xiàn)有生態(tài)的融合,促使技術(shù)發(fā)展更偏向工程優(yōu)化和平臺(tái)賦能,而非單一工具的極限探索。不同的資本偏好和生態(tài)整合策略也加劇了這種分野。

當(dāng)然,這并非說中國在生圖領(lǐng)域毫無建樹。阿里巴巴、字節(jié)、DeepSeek等公司也在持續(xù)推出有競(jìng)爭(zhēng)力的模型。只是在全球“爆款”層面,暫時(shí)由美國公司領(lǐng)跑。

歸根結(jié)底,技術(shù)和商業(yè)的合力共同塑造了當(dāng)前的格局。隨著 GPT-4o可能引領(lǐng)的自回歸新浪潮,我們無疑等不及要看到這個(gè)方向的開源進(jìn)展,或是中國企業(yè)的快速跟進(jìn)與實(shí)現(xiàn)了。


點(diǎn)個(gè) “愛心”,再走吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國4月失業(yè)率4.2%

美國4月失業(yè)率4.2%

證券時(shí)報(bào)
2025-05-02 21:21:03
美媒:中方必須接受美國的領(lǐng)導(dǎo)!中國只能在美國劃的范圍內(nèi)發(fā)展!

美媒:中方必須接受美國的領(lǐng)導(dǎo)!中國只能在美國劃的范圍內(nèi)發(fā)展!

紅色鑒史官
2025-05-02 18:45:03
為一部手機(jī)賭命?中國留學(xué)生4天內(nèi)兩次攀登富士山,激怒全日本

為一部手機(jī)賭命?中國留學(xué)生4天內(nèi)兩次攀登富士山,激怒全日本

平祥生活日志
2025-05-03 03:34:31
被判刑10年的李天一,早已出獄!如今,他的狀況令人憤憤不平

被判刑10年的李天一,早已出獄!如今,他的狀況令人憤憤不平

詩意世界
2025-05-01 19:28:00
不是今天戰(zhàn)火延續(xù)火箭連扳勇士?jī)蓤?chǎng)將系列賽拖入搶七7?

不是今天戰(zhàn)火延續(xù)火箭連扳勇士?jī)蓤?chǎng)將系列賽拖入搶七7?

直播吧
2025-05-03 11:56:30
美媒:中國在準(zhǔn)備持久戰(zhàn),越來越多國家的錢,源源不斷流向中國!

美媒:中國在準(zhǔn)備持久戰(zhàn),越來越多國家的錢,源源不斷流向中國!

億通電子游戲
2025-05-03 02:23:48
超薄機(jī)皇!新機(jī)官宣:5月13日,正式發(fā)布!

超薄機(jī)皇!新機(jī)官宣:5月13日,正式發(fā)布!

科技堡壘
2025-05-03 13:35:55
一覺醒來,大設(shè)計(jì)師蘭玉天塌了!馬筱梅直接把“做個(gè)人吧”還給她

一覺醒來,大設(shè)計(jì)師蘭玉天塌了!馬筱梅直接把“做個(gè)人吧”還給她

小娛樂悠悠
2025-05-03 14:10:30
北大教授饒毅再談協(xié)和:醫(yī)生培養(yǎng)不是越久越好

北大教授饒毅再談協(xié)和:醫(yī)生培養(yǎng)不是越久越好

新民周刊
2025-05-02 20:11:05
我國越來越多的人確診肺癌!醫(yī)生告誡:4種食物,再饞也要忍住!

我國越來越多的人確診肺癌!醫(yī)生告誡:4種食物,再饞也要忍住!

窗外的光
2025-04-27 19:24:19
普京勃然大怒,俄羅斯80年來從沒受到過如此侮辱,中國汲取經(jīng)驗(yàn)

普京勃然大怒,俄羅斯80年來從沒受到過如此侮辱,中國汲取經(jīng)驗(yàn)

阿紿聊社會(huì)
2025-03-26 15:04:14
CBA最新消息!威爾斯離開遼寧,上海續(xù)約李添榮,劉雁宇合同到期

CBA最新消息!威爾斯離開遼寧,上海續(xù)約李添榮,劉雁宇合同到期

體壇瞎白話
2025-05-03 15:08:19
一頭累死的驢,據(jù)說這是當(dāng)下高校老師和行政的真實(shí)寫照

一頭累死的驢,據(jù)說這是當(dāng)下高校老師和行政的真實(shí)寫照

尚曦讀史
2025-05-02 09:28:06
胖東來狀告胖都來,葉璇、丁勇岱站臺(tái),網(wǎng)友:告不贏,總裁姓都

胖東來狀告胖都來,葉璇、丁勇岱站臺(tái),網(wǎng)友:告不贏,總裁姓都

蜜桔娛樂
2025-05-02 16:19:22
看到宋軼腿的一瞬間就自閉了,又細(xì)又白又長(zhǎng),到底是誰說她普的啊

看到宋軼腿的一瞬間就自閉了,又細(xì)又白又長(zhǎng),到底是誰說她普的啊

星改造
2025-04-17 09:18:29
0分1板2犯拿600萬頂薪?CBA半決賽第一混子:周琦估計(jì)都看懵了?

0分1板2犯拿600萬頂薪?CBA半決賽第一混子:周琦估計(jì)都看懵了?

籃球快餐車
2025-05-03 05:34:09
明目張膽的李爭(zhēng)、張華敏、曾慶平、何會(huì)林,被通報(bào)

明目張膽的李爭(zhēng)、張華敏、曾慶平、何會(huì)林,被通報(bào)

新京報(bào)政事兒
2025-05-03 14:15:15
好萊塢大片上映,日票房擊敗《哪吒2》,奪下第二!

好萊塢大片上映,日票房擊敗《哪吒2》,奪下第二!

熱薦電影
2025-04-30 23:36:46
“繼承權(quán)”不用爭(zhēng)了!2025年新規(guī)下:父母的房子全部將這樣處理

“繼承權(quán)”不用爭(zhēng)了!2025年新規(guī)下:父母的房子全部將這樣處理

白馬驚天劍
2025-05-01 13:55:12
32歲章澤天曬不丹徒步照,純素顏充滿生命力,同行朋友都來頭不小

32歲章澤天曬不丹徒步照,純素顏充滿生命力,同行朋友都來頭不小

小咪侃娛圈
2025-05-03 09:08:59
2025-05-03 17:31:00
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個(gè)星球。
2156文章數(shù) 10335關(guān)注度
往期回顧 全部

科技要聞

特朗普下手,英偉達(dá)對(duì)華“特供版”要改

頭條要聞

美烏礦產(chǎn)協(xié)議終于簽署后 另一個(gè)非洲資源大國也想仿效

頭條要聞

美烏礦產(chǎn)協(xié)議終于簽署后 另一個(gè)非洲資源大國也想仿效

體育要聞

北京請(qǐng)神馬布里?許利民真有“玄學(xué)”!

娛樂要聞

趙又廷節(jié)目中高調(diào)撒糖 大贊高圓圓超好

財(cái)經(jīng)要聞

巴菲特年度盛會(huì),六大看點(diǎn)前曕!

汽車要聞

易三方科技體驗(yàn)日·北京站上演硬核駕控

態(tài)度原創(chuàng)

家居
本地
數(shù)碼
游戲
藝術(shù)

家居要聞

意式輕奢 低飽和質(zhì)感美學(xué)

本地新聞

春色滿城關(guān)不住 | 花漾千陽!塬上秘境藏幾重詩意?

數(shù)碼要聞

小米推出米家凈水器 S1(1000G),國補(bǔ)價(jià) 1279.2 元起

與雌雄大盜葬禮是同一天?《GTA6》新發(fā)售日暗藏乾坤

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 乌苏市| 宁远县| 长葛市| 衡阳市| 左贡县| 海淀区| 镶黄旗| 色达县| 桃园市| 贡嘎县| 珠海市| 龙泉市| 句容市| 教育| 明星| 靖远县| 通山县| 浦城县| 抚松县| 昌都县| 来安县| 南投市| 宜都市| 博客| 晋宁县| 休宁县| 于田县| 来安县| 武功县| 台州市| 贵定县| 额济纳旗| 清水县| 扎兰屯市| 谢通门县| 珲春市| 沾益县| 承德市| 凤凰县| 波密县| 左云县|