全球AI視頻生成領(lǐng)域迎來(lái)重大突破。北京時(shí)間4月1日,美國(guó)AI初創(chuàng)公司Runway正式推出新一代視頻生成模型Gen-4,宣稱解決了AI視頻長(zhǎng)期存在的角色、場(chǎng)景連貫性難題,并首次實(shí)現(xiàn)“世界一致性”功能,為影視創(chuàng)作帶來(lái)顛覆性工具。
一
與上一代Gen-3相比,Gen-4的進(jìn)步堪稱跨越式。此前,AI生成的視頻多為獨(dú)立片段拼接,角色在不同場(chǎng)景中易出現(xiàn)形象偏差,例如頭發(fā)顏色突變或物體物理規(guī)律混亂。
而Gen-4通過(guò)“視覺(jué)參考+文本指令”的組合,僅憑一張角色或場(chǎng)景的參考圖,即可在不同光照、角度和動(dòng)作下生成連貫畫面。
例如,在短片《孤獨(dú)的小火焰》中,一只臭鼬的移動(dòng)路徑被精準(zhǔn)控制,其毛發(fā)細(xì)節(jié)和動(dòng)作軌跡在多個(gè)鏡頭中保持高度一致。
對(duì)比同類產(chǎn)品,Gen-4的差異化優(yōu)勢(shì)顯著。快手旗下的可靈1.6pro雖在物理仿真評(píng)測(cè)中領(lǐng)先,但其生成內(nèi)容仍局限于單場(chǎng)景;而Gen-4支持多角度場(chǎng)景重建,例如用戶上傳紐約街景照片后,模型可生成同一地點(diǎn)的俯視、平視及動(dòng)態(tài)鏡頭,甚至將虛擬角色無(wú)縫融入實(shí)拍背景。
二
Runway Gen-4的商用潛力已初步顯現(xiàn)。目前,付費(fèi)用戶可生成5秒或10秒的720p高清片段,未來(lái)還將推出“場(chǎng)景參考”功能,進(jìn)一步簡(jiǎn)化長(zhǎng)視頻制作流程。
這一技術(shù)已被應(yīng)用于實(shí)際項(xiàng)目:Runway與獅門影業(yè)合作,利用后者超2萬(wàn)部影視資料庫(kù)訓(xùn)練模型,輔助《饑餓游戲》等IP的特效制作;此外,Gen-4還為麥當(dāng)娜演唱會(huì)、Puma廣告提供視覺(jué)支持。
然而,AI工具對(duì)傳統(tǒng)影視業(yè)的沖擊同樣引發(fā)爭(zhēng)議。動(dòng)畫協(xié)會(huì)2024年研究顯示,75%采用AI的公司已削減崗位,預(yù)計(jì)到2026年,美國(guó)娛樂(lè)業(yè)超10萬(wàn)崗位或受沖擊。
夢(mèng)工場(chǎng)聯(lián)合創(chuàng)始人杰弗里·卡森伯格更直言,AI可能取代90%的動(dòng)畫崗位。對(duì)此,Runway CEO Cristóbal Valenzuela回應(yīng)稱,AI并非替代人類,而是“釋放創(chuàng)作者精力”——例如,導(dǎo)演無(wú)需再糾結(jié)算法細(xì)節(jié),可專注于故事本身。
三
Gen-4的誕生亦伴隨法律風(fēng)險(xiǎn)。Runway因訓(xùn)練數(shù)據(jù)來(lái)源不透明,正面臨藝術(shù)家群體的版權(quán)訴訟。盡管公司以“合理使用”原則抗辯,但爭(zhēng)議可能影響其融資進(jìn)程——目前Runway估值已達(dá)40億美元,年收入目標(biāo)3億美元。
業(yè)內(nèi)人士認(rèn)為,Gen-4標(biāo)志著AI視頻從“技術(shù)演示”邁向“實(shí)用創(chuàng)作”。其“生成式視覺(jué)特效(GVFX)”功能可將傳統(tǒng)特效制作周期從數(shù)周壓縮至數(shù)小時(shí),例如《牛群》短片中霧氣彌漫的草原和火焰蔓延效果,均由AI自動(dòng)模擬物理規(guī)律完成。
Runway Gen-4的發(fā)布,不僅捅破了AI視頻連貫性的“天花板”,更預(yù)示著一個(gè)新創(chuàng)作時(shí)代的來(lái)臨。當(dāng)工具足夠強(qiáng)大,創(chuàng)作者能否講好故事,將成為唯一需要回答的問(wèn)題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.