繼AI搜索大戰(zhàn)后,谷歌主動(dòng)掀起了AI短視頻大戰(zhàn)。昨日,YouTube迫不及待地宣布,會(huì)在今年夏天將最新的視頻生成模型Veo 3,帶給每一位YouTube Shorts的創(chuàng)作者。
它最大的競(jìng)爭(zhēng)對(duì)手是字節(jié)跳動(dòng)。此前,與Shorts通過(guò)Dream Screen,直接在平臺(tái)嵌入AI生成功能類似,TikTok通過(guò)AI Alive向創(chuàng)作者交付AI生成能力。現(xiàn)在,兩者都已經(jīng)鍛造出這個(gè)世界最強(qiáng)大的視頻生成模型,它們都在將其最新武裝到這個(gè)世界最受歡迎的視頻平臺(tái)上。
是用上了Veo3的YouTube Shorts更吸引人,還是用上了Seedance 1.0的TikTok更有黏性,AI面向消費(fèi)者市場(chǎng)的激烈競(jìng)爭(zhēng),在短視頻領(lǐng)域一觸即發(fā)。這不僅是一場(chǎng)關(guān)系到流量的競(jìng)爭(zhēng),還是一場(chǎng)關(guān)系到流量結(jié)構(gòu)的競(jìng)爭(zhēng)。平臺(tái)正在把流量的生成與流量的變現(xiàn)的主動(dòng)權(quán)掌握在自己手里。
誰(shuí)將是AI短視頻之王?
視頻生成模型競(jìng)賽
這是一場(chǎng)25億月活用戶的長(zhǎng)視頻平臺(tái),應(yīng)對(duì)10億月活用戶的短視頻平臺(tái)的王者之戰(zhàn)。但整個(gè)2023年,這兩家視頻內(nèi)容平臺(tái)的傳統(tǒng)巨頭,都在被動(dòng)挨打。到了2024年,雙方開(kāi)始追趕,瘋狂迭代。尤其是在OpenAI發(fā)布“期貨”Sora后,它們這才迅速拿出了自己的視頻生成模型。
視頻內(nèi)容是兩家巨頭的立身之本,誰(shuí)都不能再丟了。最近,在美國(guó),Runway更新了Gen-4,Midjourney推出首個(gè)視頻生成模型V1;在中國(guó),快手發(fā)布Kling 2.0,MiniMax更新了Hailuo02。
現(xiàn)在,在Artificial Analysis的視頻生成模型競(jìng)技場(chǎng)(Video Arena Leaderboard)上,無(wú)論是文生視頻,還是圖生視頻,排名第一的都是字節(jié)跳動(dòng)最近發(fā)布的Seedance 1.0,谷歌最新的Veo 3則占據(jù)著第二或第三的位次。
(來(lái)源:Artificial Analysis,圖生視頻競(jìng)技場(chǎng)排行榜)
5月20日,逐步,在I/O大會(huì)上發(fā)布了最新版本的Veo 3。它對(duì)物理規(guī)律的理解更深刻,并在業(yè)內(nèi)首次實(shí)現(xiàn)原生音頻生成功能。DeepMind創(chuàng)始人Demis Hassabis現(xiàn)場(chǎng)放話,Veo 3結(jié)束了視頻生成的無(wú)聲時(shí)代。同日,谷歌還推出了整合了Veo、Imagen和Gemini的AI視頻制作工具Flow。
這距離谷歌發(fā)布第一代Veo僅過(guò)去1年,差不多6個(gè)月迭代一次。真正用上初代Veo的人很少;Veo2在發(fā)布數(shù)月后通過(guò)Gemini API向開(kāi)發(fā)者開(kāi)放;Veo3幾乎發(fā)布即開(kāi)放,每個(gè)月交了250美元的Google AI Ultra訂閱用戶,現(xiàn)在就可以嘗試用它生成長(zhǎng)至8秒的短視頻。
很快,字節(jié)跳動(dòng)追了上來(lái),沒(méi)給谷歌喘息的機(jī)會(huì)。6月11日,字節(jié)跳動(dòng)的Seedance 1.0正式發(fā)布,已在即夢(mèng)及火山引擎API上開(kāi)放使用。其中,Seedance-1.0-pro的API調(diào)用價(jià)格,約為15元人民幣/百萬(wàn)token,生成一條10秒的1080p視頻,最高約7.34元;lite版還能便宜1/3。
風(fēng)險(xiǎn)投資機(jī)構(gòu)a16z合伙人Justine Moore迅速試用,贊嘆不已,認(rèn)為它排名第一,名副其實(shí)。它克服其他同類模型的頑疾,包括同一場(chǎng)景多角度視圖的統(tǒng)一性、大量高速運(yùn)動(dòng)場(chǎng)景下的連貫性等等,“物理”水平出眾。它能接受復(fù)雜的提示并嚴(yán)格遵循,同時(shí)輸出兼具風(fēng)格的多樣性。最讓她印象深刻的是分布外(Out-of-distribution)推理能力。“這些片段可能不會(huì)引起你的注意”,她說(shuō),自己從未在其他模型上,見(jiàn)過(guò)如此真實(shí)的草圖渲染與全息圖彈出。
(來(lái)源:Justine Moore,不起眼但體現(xiàn)“分布外推理”能力的表現(xiàn))
字節(jié)跳動(dòng)與谷歌的競(jìng)爭(zhēng),在外界看來(lái),有點(diǎn)“師出同門”的意味。年初,原來(lái)谷歌DeepMind的吳永輝,開(kāi)始在字節(jié)跳動(dòng)擔(dān)任Seed團(tuán)隊(duì)基礎(chǔ)研究負(fù)責(zé)人。不過(guò),字節(jié)跳動(dòng)對(duì)視頻生成的正式探索,始于去年上半年發(fā)布的AI創(chuàng)作平臺(tái)即夢(mèng)(Dreamina);同年9月,視頻生成大模型PixelDance和Seaweed正式上線,前者側(cè)重“敘事性”,能精準(zhǔn)捕捉與闡釋語(yǔ)義,后者側(cè)重“審美性”,能輸出細(xì)膩逼真的畫(huà)面。隨后,團(tuán)隊(duì)開(kāi)始探索自回歸對(duì)抗后訓(xùn)練(APT)。最終這些嘗試收斂到如今的Seedance。
對(duì)于消費(fèi)者市場(chǎng)而言,開(kāi)放生成的視頻長(zhǎng)度,是8秒還是10秒,幾乎沒(méi)有區(qū)別;但是Seedance 1.0暫缺的原生語(yǔ)音生成功能,對(duì)于普通用戶而言卻很關(guān)鍵。不過(guò),相信字節(jié)跳動(dòng)很快就會(huì)彌補(bǔ)這一切,并繼續(xù)推動(dòng)視頻生成能力的進(jìn)步,同時(shí)加深對(duì)物理世界的理解。
與谷歌一樣,字節(jié)跳動(dòng)已經(jīng)打造了多模態(tài)大模型“全家桶”,包括圖片(Seedream與SeedEdit)、語(yǔ)音(Seed-TTS與Seed-ASR)、音樂(lè)(Seed-Music),還包括多模態(tài)統(tǒng)一理解和生成(BAGEL)。
在尚未明確的方向上,團(tuán)隊(duì)繼續(xù)發(fā)散式探索,包括Shot2Story(多鏡頭視頻理解)、FlexWorld(視頻到視頻擴(kuò)散)、Video Depth Anything(超長(zhǎng)視頻一致性)、VideoWorld(無(wú)標(biāo)記數(shù)據(jù)自回歸視頻生成)等等,也許很快就會(huì)融入Seedance 2.0。
在哪里生成,在哪里留存
在模型競(jìng)爭(zhēng)逐漸焦灼的當(dāng)下,市場(chǎng)越來(lái)越重視速度。a16z合伙人Bryan Kim說(shuō),面向消費(fèi)者的AI市場(chǎng),速度就是一切。產(chǎn)品發(fā)布、獲取關(guān)注、搶占用戶心智的速度,都要一快再快。
GPT-4o生成的,已經(jīng)證明了這一點(diǎn);Veo3上線當(dāng)天,用其制作的切割玻璃水果的解壓視頻就開(kāi)始刷屏,再次證明了這一點(diǎn)。盡管Veo3與Seedance 1.0的發(fā)布,仍然很難真正沖擊好萊塢生態(tài),但已經(jīng)在龐大的消費(fèi)者市場(chǎng)掀起了一陣陣病毒式傳播。它們的操作足夠簡(jiǎn)單,但功能又足夠完整。
(來(lái)源:TikTok,新用戶憑借AI生成視頻迅速吸引流量)
Min Choi 和 PJ Ace這樣早期采用者迅速入場(chǎng),甚至喊出了Veo3的淘金潮來(lái)了。他們創(chuàng)作的AI短視頻,贏得的流量增長(zhǎng)前所未有。他們還總結(jié)出了淘金方法論:首先,用ChatGPT或Gemini生成簡(jiǎn)單的腳本;其次,把腳本黏貼進(jìn)去,用Veo3生成;再次,用在Capcut等工具上編輯……最后,導(dǎo)出視頻,分享到TikTok等平臺(tái)上。
這就是讓谷歌加快速度的原因。Veo3目前遇到了“生成之后它存于何處”的問(wèn)題。一方面,TikTok在短視頻領(lǐng)域更具用戶粘性;另一方面,Veo3缺乏一個(gè)成熟的可分享的平臺(tái),為別人做嫁衣裳。新興內(nèi)容生成平臺(tái)普遍缺乏內(nèi)容分發(fā)能力,也是目前面向消費(fèi)者市場(chǎng)的AI應(yīng)用的關(guān)鍵挑戰(zhàn)之一。但是,與其他初創(chuàng)企業(yè)不同,谷歌還有Shorts。于是,谷歌急迫地希望在這個(gè)夏天結(jié)束前,將Veo3塞進(jìn)Shorts里。
Veo3也能為YouTube Shorts帶去更多流量。從去年3月至今,Shorts的日均觀看量從700億次上升到2000億次,得益于Dream Screen在這一年里逐步完善了AI生成能力。更多的流量,意味著更有生命力的商業(yè)閉環(huán)。
Veo系列還給了YouTube的長(zhǎng)視頻一個(gè)新的機(jī)會(huì)。Shorts誕生于TikTok以摧枯拉朽之勢(shì)席卷美國(guó)的疫情時(shí)代。當(dāng)時(shí),這款谷歌CEO皮查伊所謂的“此前根本沒(méi)有人在討論”的中國(guó)應(yīng)用,基于AI推薦算法,迅速成為美國(guó)用戶離不開(kāi)社交媒體平臺(tái)。用戶行為越來(lái)越碎片化,創(chuàng)作者邊反對(duì),邊加入,為了避免用戶與創(chuàng)作者大量流失,深耕高質(zhì)量創(chuàng)作者生態(tài)的YouTube最終也不得不下場(chǎng)。至此,YouTube一直面臨長(zhǎng)視頻與短視頻生態(tài)左右互搏的狀態(tài)。
AI生成的視頻長(zhǎng)度,最終會(huì)越來(lái)越長(zhǎng),也就越來(lái)越契合長(zhǎng)視頻創(chuàng)作者的需求;圍繞視頻生成,也會(huì)誕生更多自動(dòng)化的視頻AI編輯工具。長(zhǎng)視頻部分演示內(nèi)容也可以通過(guò)AI生成出來(lái),現(xiàn)在很多用戶就寫(xiě)好腳本,用它來(lái)創(chuàng)作數(shù)段片段,然后拼接成稍長(zhǎng)一點(diǎn)的視頻。
先讓Veo3在Shorts上跑起來(lái),然后讓它或下一代Veo服務(wù)于YouTube的完整生態(tài),能讓谷歌最終在AI時(shí)代的內(nèi)容平臺(tái)占據(jù)上風(fēng)。
AI(短)視頻的商業(yè)模式
AI短視頻的商業(yè)模式,是像AI大模型或視頻公司,如OpenAI-Sora或Runway那樣,出賣生成服務(wù)或者創(chuàng)作內(nèi)容的智能體,訂閱收費(fèi);還是內(nèi)容創(chuàng)作者用來(lái)在社交媒體平臺(tái)上創(chuàng)造流量,廣告變現(xiàn)或內(nèi)容訂閱;還是科技巨頭把AI視頻全套工具交給其內(nèi)容創(chuàng)作者,增強(qiáng)其固有的內(nèi)容-分發(fā)-社交生態(tài),繼續(xù)賺取廣告與內(nèi)容訂閱的錢;最狠的可能是擁有前沿AI模型的巨頭會(huì)通吃賣token、賣廣告、賣內(nèi)容、賣鏟子(技術(shù)及工具)。
生成式AI時(shí)代與移動(dòng)互聯(lián)網(wǎng)時(shí)代不同,它的成本同樣快速下降,但相對(duì)仍然昂貴,尤其是多模態(tài)與多智能體交互在未來(lái)將成為主流,“免費(fèi)”的游戲需要調(diào)整一下玩法。這也是目前面向消費(fèi)者市場(chǎng)的AI應(yīng)用另一個(gè)關(guān)鍵挑戰(zhàn)之一。
谷歌已經(jīng)打響了AI搜索大戰(zhàn),但這一傳統(tǒng)業(yè)務(wù)的商業(yè)模式還沒(méi)有完全建立,谷歌不得不犧牲利潤(rùn)率去鞏固地盤(pán)。盡管皮查伊認(rèn)為,如果AI搜索的問(wèn)題是服務(wù)成本,那么自己有信心比幾乎任何對(duì)手都做得更好,但他也承認(rèn),“有些方面可能需要時(shí)間”。
但是,現(xiàn)在,谷歌可以通過(guò)AI短視頻實(shí)現(xiàn)商業(yè)閉環(huán),甚至反哺AI搜索。去年,YouTube廣告收入達(dá)到了361億美元,成為繼搜索以外的業(yè)務(wù)支柱之一。而且,更重要的是,AI短視頻的商業(yè)模式,仍然可以通過(guò)廣告或電商變現(xiàn),而不是AI搜索還沒(méi)有規(guī)模驗(yàn)證過(guò)的結(jié)果變現(xiàn)。
AI短視頻的商業(yè)閉環(huán),要比AI搜索清晰得多。創(chuàng)作者向谷歌購(gòu)買算力,為自己贏得以往所無(wú)法企及的流量規(guī)模,獲得更高的廣告收益分成;谷歌則不需要額外支出更多算力成本,也將從廣告收益中留存更多利潤(rùn)。此外,更多的視頻上傳到Shorts,也將成為谷歌訓(xùn)練大模型的數(shù)據(jù)來(lái)源,這將讓谷歌保持模型的競(jìng)爭(zhēng)優(yōu)勢(shì)。不過(guò),谷歌還沒(méi)有披露針對(duì)的Shorts創(chuàng)作者的Veo 3定價(jià)策略。難道它會(huì)免費(fèi)無(wú)限供給昂貴的token嗎?
字節(jié)跳動(dòng)自然也不會(huì)錯(cuò)過(guò)這一切。AI短視頻從創(chuàng)意到生成到分享的鏈條將會(huì)更短。AI短視頻將繼續(xù)推動(dòng)TikTok的全球擴(kuò)張。它目前海外市場(chǎng)月活用戶突破了10億大關(guān),但離Youtube整體尚有差距。字節(jié)跳動(dòng)去年國(guó)際營(yíng)收(主要為TikTok)約為 390 億美元,與Youtube的廣告收入接近,但如果后者再加上訂閱收入,TikTok仍然稍遜了一籌。
這是一場(chǎng)對(duì)流量的爭(zhēng)奪,也是一場(chǎng)對(duì)新的流量結(jié)構(gòu)的爭(zhēng)奪。傳統(tǒng)的“流量基礎(chǔ)設(shè)施”,正在重建流量來(lái)源方式與流量變現(xiàn)方式。優(yōu)質(zhì)創(chuàng)作者仍然是平臺(tái)核心競(jìng)爭(zhēng)力;但平臺(tái)開(kāi)始掌握流量生成的入口,將其釋放給每一位普通用戶。誰(shuí)能掌控這種新的流量結(jié)構(gòu),誰(shuí)就掌握了未來(lái)的注意力經(jīng)濟(jì)。
這也解釋了為什么Meta比任何時(shí)候都更焦慮。扎克伯格錯(cuò)過(guò)了短視頻,倉(cāng)促拿出Reels應(yīng)戰(zhàn);又正在錯(cuò)過(guò)大模型,到處收購(gòu)公司與挖人,從Scale AI到SSI再到OpenAI,據(jù)說(shuō)最頂級(jí)的人才已經(jīng)開(kāi)價(jià)上億美元,試圖重組自己的“超級(jí)智能”部門。也許,以前,Meta從TikTok那里吸引創(chuàng)作者,開(kāi)出的是5000美元獎(jiǎng)金,以后可能就是發(fā)放token了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.