據騰訊開源公眾號消息,5月28日,騰訊混元發布并開源的語音數字人模型HunyuanVideo-Avatar,由騰訊混元視頻大模型(HunyuanVideo)及騰訊音樂天琴實驗室MuseV技術聯合研發,支持頭肩、半身與全身景別,以及多風格、多物種與雙人場景,面向視頻創作者提供高一致性、高動態性的視頻生成能力。用戶可上傳人物圖像與音頻,HunyuanVideo-Avatar模型會自動理解圖片與音頻,比如人物所在環境、音頻所蘊含的情感等,讓圖中人物自然地說話或唱歌,生成包含自然表情、唇形同步及全身動作的視頻。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.