智東西AI前瞻(公眾號:zhidxcomAI)
作者 江宇
編輯 漠影
智東西AI前瞻7月9日報道,昨日,AI視頻生成平臺Vidu正式上線“參考生”功能,支持用戶通過上傳人物、場景和道具圖像,一鍵生成造型統一、動作自然的高清視頻內容。
系統最多可輸入七個主體圖像,讓人物不“變臉”、場景不混亂,多角色同框和跨場景復用成為可能。
該功能運行于Vidu Q1模型之上,支持1080P輸出,無需用戶手動控制每一幀畫面,也不依賴首尾幀設定,整體生成過程全部基于圖像設定自動完成。
目前,參考生已在 Vidu 網頁端與移動端同步上線。
體驗指路:https://www.vidu.cn/create
一、上傳圖片,就能拍出連續鏡頭,還能生成音效
在參考生功能中,用戶只需上傳一張角色圖像,系統便可識別人物外觀、服飾、動作特征,并自動生成5至10秒的視頻片段。畫面中角色不會在鏡頭間“變臉”或丟失細節,人物造型、動作風格能保持一致。
不僅角色可以設定,用戶也可以加入背景圖、道具圖,用于構建完整的場景設定。這些元素將在視頻生成時一起被識別,組成統一畫面。例如,輸入2個牛仔人物,2個場景,2把手槍的參考圖,即可生成“西部大片”。
除了畫面內容,Vidu此次也上線了AI音效功能,用戶只需輸入簡單描述,即可生成與畫面匹配的音效片段。
目前支持多個音效同時疊加,例如“雨聲+腳步聲+背景音樂”,并可自動適配畫面節奏。這一功能降低了創作者在后期配音、尋找素材庫等環節的操作成本,進一步向“全流程自動生成”方向靠近。
二、人物不變,場景可切,多角色互動更自然
參考生也支持將同一個人物放進不同環境中進行生成,這意味著用戶可以制作“同角色穿越多個地點”的連續內容。比如在廣告場景中,可用一個人物設定,同時生成多場景版本,更換不同的商拍素材,做出整套素材。
這種方式尤其適合需要統一人物形象的內容創作,比如品牌宣傳、IP角色運營、電商廣告等場景。
在以往,生成這樣一組內容通常需要反復“抽卡式”生成并后期篩選,而現在可一鍵完成。
參考生生成視頻還有一個明顯的變化:現在可以在一段視頻中加入多個角色,并讓他們同時出現在畫面中。這對于想要創作對話類短劇、劇情剪輯、甚至IP聯動內容的用戶來說,是此前AI工具較難實現的能力。
系統會自動識別每個角色的空間關系與相對動作,確保多個角色之間的互動看起來自然、穩定。
系統最多支持七個主體圖像同時輸入,包括主角、配角、場景、道具等多個元素。在生成過程中,系統會自動識別每個角色的空間位置與相對動作,確保互動關系自然、畫面結構穩定,且各角色在鏡頭切換中保持外觀、造型和細節的一致性。
這使得AI視頻創作從“單人獨白”邁向了更具場景表現力的“多人共演”。
比如讓來自不同朝代、國家、地域的三個人諸葛亮、丘吉爾和拿破侖出現在同一個會議室交流。用戶只需輸入三個人物圖片素材和相應提示詞(“[@諸葛亮]與[@丘吉爾]、[@拿破侖]在會議室面對面坐著討論”),即可生成一段三人對話的視頻。
三、體驗:畫面穩定、生成提速,圖像還原與動作連貫性較好
相比Vidu早期版本,Q1參考生在畫質、穩定性和生成效率上均有明顯提升,當前版本生成一條5秒的1080P視頻,所需時間約為1至2分鐘。
在成本方面,該平臺當前定價為5秒視頻約0.895元,按照基礎套餐估算,1000元可生成約48分鐘的視頻內容。
智東西第一時間對該功能進行了體驗。用戶登錄Vidu平臺后,可通過上傳圖片創建“主體角色”,系統將自動生成風格與描述文本,用戶可根據需要進行修改或自定義設定。
此外,還支持上傳背景圖片構建自定義場景,平臺提供基礎裁剪功能輔助畫面適配。
在本次體驗中,智東西選擇了兩張圖像作為輸入,并設定生成指令為“@安陵容在@圖2奔跑”。上傳完成后,系統自動識別人物姿態與背景結構,幾分鐘內即生成視頻成片。
輸出畫面中,人物造型、服飾細節、動作流暢度均較為穩定,背景融合自然,整體視覺效果貼近設定圖像所構建的情境。
結語:結構可控、一致性可復用,AI視頻更實用
相比以往的圖生視頻、文生視頻產品,Vidu Q1參考生的更新讓AI視頻第一次變得“可以反復使用”。用戶不再依賴生成運氣或剪輯技巧,只需準備好圖像,就可以批量輸出結構穩定的視頻內容。
這對很多中小型創作者、電商商家、內容團隊來說,是一次流程的簡化:不用租攝影棚,不用協調演員,也不需要復雜分鏡,只靠設定圖就能完成一整套內容制作。
接下來,如何生成更長、更復雜、更可控的視頻結構,會成為這一類產品進一步演進的方向。但對當前階段的用戶來說,參考生已經解決了“生成像不像”和“能不能用”的基本問題,這也是一次實用意義上的進化。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.