機器之心報道
編輯:Youli
這次真的不一樣,遇到了「想象力的神」!
以前常說「要把自己活成一支隊伍」,如今感謝 AI,真的實現了。
最近,生數科技旗下 AI 視頻模型 Vidu Q1 推出參考生功能,極大簡化傳統內容生產流程,真正實現「一個人就是一個劇組」!
首先,我們來看一個視頻:
這幾個人物形象大家應該都很熟悉。
搖著羽扇、說著「想不到世間還有如此厚顏無恥之人」出現在各大鬼畜視頻中的諸葛亮,英國鐵血首相丘吉爾,以及戰績可查的拿破侖,如今他們跨越時空,圍坐在會議室中密切交談,實現「世紀大會晤」!
如果用常規的 AI 圖生視頻來做的話,一般要經過寫腳本、文生圖 / P 圖 / 融圖、圖片生成、圖生視頻、成片等步驟,但實際上,這里只用了三張圖片和 Vidu Q1 的參考生功能!
就像把大象放進冰箱只需要三步一樣,這里也只需要三個步驟:找到上傳照片、寫提示詞、成片。
看到這里,大概就可以看出 Vidu Q1 參考生功能的不尋常之處了。
只需上傳人物、道具、場景等參考圖,即可直接將多個參考元素融合為一段視頻素材,真正實現零分鏡生成,堪稱「拿來即用」。
對此,各路網友紛紛在社交平臺放出自己用 Vidu Q1 參考生視頻做出的作品,簡直是五花八門,對人類的想象力致以崇高敬意。
X 網友 Scobleizer 發布了這樣一個視頻,視頻中隨著車庫的門徐徐打開,一個只有頭顱的雕像從里面蹦蹦跳跳「走」出來,還時不時做出夸張的表情。
根據 Scobleizer 的介紹,這段視頻他只用了兩張照片,一張他拍攝的「硅谷的發源地」—— 惠普車庫,另外就是那個雕塑。將兩張圖片上傳到 Vidu Q1 參考生視頻后,他只用了一句提示詞:
「Open the doors of the garage in Image1 revealing the statue inside from Image2 dancing」(打開圖 1 中車庫的門,露出圖 2 中里面跳舞的雕像)。
可以看出,整個視頻很流暢,而雕塑的表情也很生動有趣。
還有一個很有腦洞大開的視頻,一個喵星人正在森林中拿著手機自拍,與此同時,后面有一只獅子正在緩緩靠近。
這是 X 網友 SohelBloom 的杰作,而根據視頻中的標注也可以看到,提示詞也只有一句很簡單的話,意思就是:圖 1(喵星人)正在拿著圖 2(手機)自拍,此時圖 3(獅子)正從后面走來……
更炫技的操作是,X 網友 Alex,她是一名藝術家兼程序員,在她的操作下,1989 年版本的蝙蝠俠與 1993 年版的侏羅紀公園霸王龍,不僅同框出現,還上演激烈「對打」,從畫面流暢度來看,堪稱一部好萊塢大片。
看到大家的視頻這么精彩,接下來,我們也親自實測一波,看看 Vidu Q1 參考生視頻是是不是真的那么好用(溫馨提示:以下實測均一次生成,無抽卡。)
打開官網可以很直觀地看到上新的「參考生視頻」,可以點擊試用:
體驗地址:
https://www.vidu.cn/create
大家應該都很喜歡宮崎駿的動漫,小時候想著可以住在里面,再大些想著可以畫出那樣的漫畫。所以,如果自己筆下的角色出現在宮崎駿的動畫中應該會是怎樣的?
我們試了一下,找到一張粗略畫成的簡筆畫小孩子圖片、兩張《龍貓》的經典畫面,然后「丟」給 Vidu Q1 參考生視頻,提示詞很簡單:
之后生成的視頻效果如下:
可以看出,原本是圖 1 只是個紙面形象,可進入宮崎駿的電影場景后,在保持自身特點的同時,風格會盡可能符合場景風格,仿佛真的進入到那個童話世界中。
夢想實現了,AI時代,人人都可以做5s中的漫畫家!
還有一點值得說的是,大家可以看到,視頻畫質非常清晰,這是因為 Vidu Q1 參考生視頻將清晰度提升到了 1080p!支持 1080P 視頻直出,也就是說無論是宏大的科幻敘事,還是可愛的童話動漫世界,又或是人物特寫的細微表情,都可以清晰呈現。
再來一個!
這次,我們請出故宮的大胖橘,讓它給我們來個表演!
提示詞只有一句話:大胖橘拿著紅纓槍,在樹林里練中國功夫!
效果如下:
可以看出,視頻基本符合提示詞的描述,而且原本圖片中的紅纓槍過長,為了使畫面更和諧,紅纓槍的大小也進行了自動調整,更適配大胖橘的「身材」。
接下來繼續上難度!
因為當前 Vidu Q1 的參考生功能還在持續迭代,目前最多支持 7 個主體輸入,也就是說,包括人物、場景、道具在內,最多可以上傳 7 張圖片,所以為了考驗一下 Vidu Q1 的極限,我們打算做個挑戰,上傳 7 張圖片,來試一試效果怎么樣!
前面說到諸葛亮、丘吉爾和拿破侖在會議室討論,那現在,我們思路打開,讓他們換個場地,再進行多一些的互動,就先去去長城打卡吧!
首先,要把這三個經典人物的標配物品給備齊,諸葛亮的扇子、丘吉爾的經典英倫風黑色小禮帽、拿破侖的佩劍,以及一張長城的圖片。
然后是提示詞:
[@圖 1] 拿著 [@圖 5] 中的扇子,[@圖 2] 中的男人頭上戴著 [@圖 4] 中的黑色帽子,[@圖 3] 手上拿著 [@圖 6] 中的佩劍,一起在 [@圖 7] 拍合照,他們彼此之間有互動,并做出拍照比耶的姿勢。
(溫馨提示:在寫提示詞時,如果需要多次提及圖片,可以使用「@ 」鍵,之后會出現此次所上傳的圖片列表,按需選擇!)
效果如下:
諸葛亮輕搖羽扇,丘吉爾戴上了小禮帽,拿破侖手持寶劍緩緩走來,之后三個人一起對著鏡頭,像大多數游客一樣,在長城上擺著拍照手勢,留下經典畫面。
好像沒什么問題,符合提示詞的描述,人物角色之間的互動也挺自然,看來 Vidu Q1 經受住了考驗!
不過再仔細看,有點小瑕疵:諸葛亮比耶的時候,仿佛搖了個畫手,變魔術一樣把扇子變不見了?相比之下,拿破侖只是把佩劍扔了,雖然不理解,但合理!
好吧,拍照打卡之旅繼續,再來一個,把他們三人一起打包到《冰與火之歌》中的鐵王座面前。
提示詞:[@圖 1] 拿著 [@圖 5] 的扇子,和 [@圖 2] 與 [@圖 3] 一起走向中間的座位前面,然后 [@圖 1] 和 [@圖 2]、[@圖 3] 一起做出拍照的姿勢!
表現依然不錯,不過宰相你的扇子都快要把拿破侖的臉給遮住了,往下放一放好不好?你看丘吉爾做得就很好啊。
其實從這幾個場景可以看到,不管是在會議室,還是長城,抑或是鐵王座面前,這三個人物形象保持高度一致性,甚至可以將這幾個視頻剪輯在一起,做成轉場視頻,鏡頭敘事的轉換很自然。而在傳統的視頻制作中,要想實現這么絲滑的轉場,要耗費大量的人力、物力、時間。
不過也必須要說,在這幾個視頻中,或許是因為人物形象與場景本身存在一些割裂,圖層融合得并不是十分好,甚至仔細看,有些些「摳圖」感。
當然,瑕不掩瑜,總的來說,Vidu Q1 參考生的功能還是非常強大的,操作簡單,只需要三個步驟,幾乎就可以生成你想要的圖片,只要是你能夠想到的,幾乎都可以變成現實,輕松實現導演夢想!
最后,來說一下大家關心的價格!用 Vidu Q1 參考生,制作一條長 5 秒、1080p 視頻,只要 20 積分,而當前官方標準版套餐價格為 48 元 / 月,包含 800 積分,換算下來的話,不到一瓶礦泉水的價格就可以制作一個視頻,價格應該說是非常親民!
感興趣的小伙伴可以自己動手試一下,體驗一下「導演夢」!
參考鏈接:
https://x.com/Scobleizer/status/1942694804183474316
https://x.com/alexfredo87/status/1942651670325805466
https://x.com/thetripathi58/status/1942632730233053285
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.