大家好,這里是歸藏(guizang),今天帶來新鮮出爐的 Hailuo Video Agent 體驗(yàn)。
前幾天我就說隨著視頻生成模型成本的提高和提示詞遵循效果變好,成熟的視頻生成 Agent 應(yīng)該馬上就會(huì)出現(xiàn)了。
沒想到 MiniMax 先做了,他們將會(huì)分階段打造 Hailuo Video Agent。
- 第一個(gè)階段是提供專業(yè)視頻創(chuàng)意Agent模版,用戶上傳圖片或者打幾個(gè)字就能一鍵生成高質(zhì)量視頻
- 第二個(gè)階段將會(huì)實(shí)現(xiàn)讓用戶在任意的進(jìn)度自由的打斷和編輯
- 第三個(gè)階段就是端到端的完全自動(dòng)化 Agent
這個(gè)路徑是非常務(wù)實(shí)而正確的,剛好前幾天 Andrej Karpathy 也分享了類似的觀點(diǎn),應(yīng)該先做半自動(dòng)的鋼鐵俠戰(zhàn)甲組件,最后做完全自主的機(jī)器人。
我們應(yīng)該專注于構(gòu)建“鋼鐵俠戰(zhàn)甲”(增強(qiáng)工具),而不是“鋼鐵俠機(jī)器人”(完全自主Agent)這些產(chǎn)品應(yīng)具備自定義 GUI 和用戶體驗(yàn),以加速人類的生成-驗(yàn)證循環(huán),同時(shí)仍提供自主性滑塊,允許產(chǎn)品隨時(shí)間變得更加自主。
剛好今天他們開放了第一個(gè)階段的 Agent 使用權(quán)限,我試用了一下。
打磨的非常好,選擇你喜歡的模板,點(diǎn)“做同款”就行,門檻超級低,基本上傳圖片完事了,真正的有手就行。
模板覆蓋了你能想到的所有AI 視頻出圈玩法,不管是外國山海經(jīng)還是人像動(dòng)態(tài)寫真還是產(chǎn)品廣告視頻,你能想到的品類這里都能找到。
你現(xiàn)在在社交媒體刷到的最多的應(yīng)該是 AI 寫真類的內(nèi)容,以前大部分都是 AI 圖片,ID 保持也不是很好。
Hailuo 直接把這個(gè)玩法變成了視頻,而且 ID 保持非常好,跟原圖也有很順滑的過渡。
比如這里這個(gè)模板,我上傳的圖片會(huì)有個(gè)水漫上來的效果,然后變成在水下的禮服,之后會(huì)更換多套不同的禮服,面部相似度依然可以保持。
要是你說我不喜歡這套禮服怎么辦,沒事里面有非常多同類,玩法的模板,直接上傳照片,點(diǎn)確定一鍵生成。
從右側(cè) Agent 顯示的信息可以看到模型會(huì)先分析圖片信息,之后生成不同圖片的提示詞,之后生成視頻剪輯。
有了人物的動(dòng)態(tài)寫真怎么能沒有寵物呢,最近短視頻平臺(tái)的 AI 視頻品類常青樹就是可愛的動(dòng)物做飯或者其他日常生活,都快發(fā)展成 IP 宇宙了,生命力非常旺盛,現(xiàn)在依然在爆火。
Hailuo Video Agent 當(dāng)然也可以做,而且只需要上傳你寵物的照片就行,不需要任何提示詞。
這里我整了一個(gè)狗狗麥當(dāng)勞送貨的視頻,非常可愛,得益于 Hailuo 視頻模型的強(qiáng)大示例,基本穩(wěn)定生成。
然后再來個(gè)電商場景吧,產(chǎn)品展示類型的視頻應(yīng)該是最常見的電商視頻廣告需要的畫面,以往需要專門的打光和場地進(jìn)行拍攝。
現(xiàn)在你只需要上傳你的產(chǎn)品照片, Hailuo Video Agent 就可以直接一鍵搞定,只需要簡單描述一下產(chǎn)品的樣子就行。
可以看到三個(gè)分鏡下面化妝品瓶子的文字材質(zhì)都基本沒變,大小有些問題,可以在提示詞描述一下就行,連音樂都是卡點(diǎn)配好的。
短視頻平臺(tái)火爆的 AI 視頻另一個(gè)品類就是科普類視頻,一般用 AI 視頻給你講清楚一個(gè)概念或者事情。
我這里就讓 Hailuo 做了一個(gè)抹茶的歷史科普視頻,這個(gè)科普視頻有 80 秒,結(jié)果他除了音樂動(dòng)畫以外還有口播,選的聲音也非常合適,終于擺脫短視頻平臺(tái)的劣質(zhì) AI 配音了。
只能說現(xiàn)在可以搞定聲音加視頻全流程一流模型來做 Agent 的也就是 MiniMax 了。
最近流行的還有像素風(fēng)格的視頻,咱也可以一鍵生成了,只需要上傳一張情侶照片,然后給 Agent 描述一下你們?nèi)粘5膸讉€(gè)場景就行,不需要詳細(xì)只需要詞語。
Agent 會(huì)提取圖片中你們的裝束和樣貌去生成對應(yīng)的圖片和視頻再剪輯。
最后來個(gè)小牛馬自嘲吧,最近我們上班壓力都很大,所以大家都借 AI 視頻或者圖片來自嘲,不管是原來的 HelloKitty 膠片還是最近的第一人稱 Vlog AI 視頻都是這樣。
這里我整了一個(gè)牛馬上班的問答視頻,這個(gè) Workflow 非常復(fù)雜,涉及到了兩個(gè)不同語音風(fēng)格的對話,還有視頻上的圖片文字包裝,其中還有字幕的變化。
其實(shí)從上面這個(gè)視頻就能看到 Agent 可以調(diào)用的工具非常多,音樂、語音、音效、圖片包裝、字幕等。
基本上視頻制作需要的工具都已經(jīng)搞定了。
從這么多模板來看 Hailuo 肯定是有一個(gè) Agent 編輯工具的,不然不可能積累這么多,希望他們早日能把這個(gè)編輯工具的界面放出來,我都不敢想到時(shí)候能有多少流行玩法從這里出現(xiàn)。
我昨天看了 Karpathy 的分享之后發(fā)了個(gè)朋友圈,不可編輯和暫停修改的 Agent 不可進(jìn)化,從 Minimax 發(fā)布的三個(gè)階段來看他們是真的懂,希望盡快看到第二個(gè)階段的 Hailuo Video Agent。
好了,到這里教程基本就結(jié)束了,謝謝各位的雙擊和大大的贊,孩子餓壞了,給點(diǎn)吧。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.