網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

《現(xiàn)代電影技術(shù)》｜周雯等：基于 AI技術(shù)的影視虛擬角色創(chuàng)制：從數(shù)字仿真到智能共創(chuàng)

2025-02-21 09:10:44　來(lái)源: 電影技術(shù)微刊

北京舉報(bào)

分享至

本文刊發(fā)于《現(xiàn)代電影技術(shù)》2025年第1期

專家點(diǎn)評(píng)

隨著人工智能（AI）技術(shù)的不斷進(jìn)化，藝術(shù)創(chuàng)作領(lǐng)域正經(jīng)歷一場(chǎng)由新技術(shù)驅(qū)動(dòng)的虛擬與現(xiàn)實(shí)融合的變革。在AI技術(shù)的加持下，虛擬角色經(jīng)過(guò)不斷演化已步入到AI賦能的人機(jī)共創(chuàng)階段。在戲劇與影視領(lǐng)域，這一變革在推動(dòng)戲劇呈現(xiàn)方式、影像生產(chǎn)邏輯更迭的同時(shí)，也催生了藝術(shù)審美的重構(gòu)。在AI技術(shù)持續(xù)更新及藝術(shù)與生活關(guān)系遵循的雙重作用下，其藝術(shù)形象的再現(xiàn)生成路徑及由此引發(fā)的審美特征也在發(fā)生著不容忽視的變化，且有待進(jìn)行藝術(shù)品格及認(rèn)知倫理的重新辨識(shí)和定位。《基于AI技術(shù)的影視虛擬角色創(chuàng)制：從數(shù)字仿真到智能共創(chuàng)》一文密切關(guān)注最新技術(shù)前沿，聚焦AI技術(shù)在藝術(shù)創(chuàng)作特別是戲劇與影視領(lǐng)域虛擬角色創(chuàng)制方式及其應(yīng)用這一極具前瞻性的議題，契合當(dāng)下科技與藝術(shù)深度融合的發(fā)展趨勢(shì)。通過(guò)案例分析與理論闡述，深入剖析了從數(shù)字仿真到智能共創(chuàng)的技術(shù)應(yīng)用歷程及不同階段虛擬角色創(chuàng)制的特點(diǎn)，著重提出了AI在虛擬角色構(gòu)建、藝術(shù)創(chuàng)制過(guò)程中人機(jī)共創(chuàng)的路徑及其在藝術(shù)創(chuàng)作內(nèi)容生成模式上的革新，AI技術(shù)正在從輔助工具向共創(chuàng)主體轉(zhuǎn)變。同時(shí)還敏銳地察覺(jué)到AI參與創(chuàng)制所引發(fā)的倫理與創(chuàng)作身份界定等復(fù)雜問(wèn)題，對(duì)AI虛擬角色在跨文化交流中的作用以及未來(lái)藝術(shù)創(chuàng)作方向進(jìn)行了有說(shuō)服力的設(shè)想與展望。

——高雄杰

教授、博士生導(dǎo)師

中央戲劇學(xué)院學(xué)術(shù)委員會(huì)副主任、電影電視系主任

作者簡(jiǎn) 介

周雯

北京師范大學(xué)藝術(shù)與傳媒學(xué)院教授、博士生導(dǎo)師，主要研究方向：數(shù)字影像藝術(shù)、虛擬現(xiàn)實(shí)影像藝術(shù)。

北京師范大學(xué)藝術(shù)與傳媒學(xué)院數(shù)字媒體藝術(shù)專業(yè)大學(xué)本科在讀，主要研究方向：數(shù)字媒體藝術(shù)。

趙恬

摘要

為深入探究藝術(shù)創(chuàng)作領(lǐng)域從計(jì)算機(jī)合成虛擬角色到人工智能（AI）深度參與的人機(jī)共創(chuàng)模式的演變歷程、作用機(jī)制及其深遠(yuǎn)影響，本文通過(guò)梳理 AI 技術(shù)在影視與舞臺(tái)藝術(shù)中的應(yīng)用歷程，利用案例分析和理論闡述，提出 AI 正從輔助工具向共創(chuàng)主體轉(zhuǎn)變的論點(diǎn)。通過(guò)對(duì) AI 在虛擬角色構(gòu)建、人工智能生成內(nèi)容（AIGC）驅(qū)動(dòng)的藝術(shù)創(chuàng)作過(guò)程以及人機(jī)共創(chuàng)路徑等方面的詳盡剖析，發(fā)現(xiàn)AI 技術(shù)的持續(xù)演進(jìn)顯著增強(qiáng)了虛擬角色的表現(xiàn)力，革新了藝術(shù)創(chuàng)作內(nèi)容的生成模式，為藝術(shù)創(chuàng)作注入諸多創(chuàng)新元素，帶來(lái)沉浸式體驗(yàn)；然而，這一進(jìn)程也引發(fā)了倫理與身份界定等復(fù)雜問(wèn)題，如虛擬角色行為責(zé)任歸屬不明、引發(fā)觀眾情感依賴等。未來(lái)，AI虛擬角色可能在跨文化交流中發(fā)揮重要橋梁作用，AI的深度參與有望推動(dòng)藝術(shù)創(chuàng)作朝著虛擬與現(xiàn)實(shí)深度融合、多元文化體驗(yàn)拓展的方向持續(xù)發(fā)展。

關(guān)鍵詞

人工智能；虛擬角色；AIGC；人機(jī)共創(chuàng)；數(shù)字仿真

1 引言

近年來(lái)，人工智能（AI）的迅速發(fā)展正在藝術(shù)創(chuàng)作領(lǐng)域引發(fā)革命性變化。AI技術(shù)不僅提供了更豐富的視覺(jué)呈現(xiàn)和聽(tīng)覺(jué)體驗(yàn)，還通過(guò)多模態(tài)生成、實(shí)時(shí)響應(yīng)和個(gè)性化交互等方式，推動(dòng)了藝術(shù)表達(dá)的創(chuàng)新。這些技術(shù)變革讓舞臺(tái)表演與影視作品中的數(shù)字內(nèi)容具備了更加高度逼真的表現(xiàn)力和靈活的互動(dòng)性，從而逐漸突破傳統(tǒng)的藝術(shù)生成邊界[1]。在技術(shù)與藝術(shù)交織的進(jìn)程中，虛擬角色、智能生成角色和數(shù)字化舞臺(tái)效果等應(yīng)用形式成為新的藝術(shù)表現(xiàn)手段，使觀眾能在沉浸式環(huán)境中體驗(yàn)動(dòng)態(tài)、個(gè)性化的藝術(shù)互動(dòng)[2]。這一演變不僅重塑了文化內(nèi)容的生成方式，也為藝術(shù)創(chuàng)作帶來(lái)了廣泛的社會(huì)影響。

在舞臺(tái)表演與影視藝術(shù)中，AI技術(shù)逐步從技術(shù)輔助工具發(fā)展成為藝術(shù)表現(xiàn)的核心支撐。早期藝術(shù)內(nèi)容創(chuàng)作多通過(guò)動(dòng)作捕捉和三維建模等數(shù)字技術(shù)完成，而隨著生成式對(duì)抗網(wǎng)絡(luò)（GAN）、大語(yǔ)言模型（LLM）等技術(shù)的發(fā)展，藝術(shù)內(nèi)容的生成從單一仿真向智能化與自適應(yīng)轉(zhuǎn)變[3]。AI不僅能在創(chuàng)作過(guò)程中生成多模態(tài)的動(dòng)態(tài)效果，還能識(shí)別并回應(yīng)場(chǎng)景變化和觀眾情緒，形成靈活的交互。從底層邏輯上看，這些技術(shù)融合了深度學(xué)習(xí)與實(shí)時(shí)數(shù)據(jù)處理，使數(shù)字內(nèi)容能通過(guò)自我學(xué)習(xí)和優(yōu)化來(lái)調(diào)整表現(xiàn)方式，從而帶來(lái)類人化和高度個(gè)性化的表達(dá)[4]。舞臺(tái)表演和影視作品借助AI促進(jìn)沉浸式藝術(shù)體驗(yàn)的發(fā)展，為當(dāng)代藝術(shù)生成方式開(kāi)辟了新的理論框架和研究路徑。

本文通過(guò)梳理AI技術(shù)在舞臺(tái)與影視藝術(shù)中的應(yīng)用演變，對(duì)其技術(shù)發(fā)展路徑進(jìn)行階段性分析，探討從數(shù)字仿真到智能生成再到智能體（Agent）共創(chuàng)，AI如何逐步成為文化藝術(shù)表達(dá)的重要構(gòu)建要素，并探析未來(lái)AI協(xié)同藝術(shù)創(chuàng)作的發(fā)展路徑。

2 虛擬角色的演進(jìn)之路：AI技術(shù)參與的三重階段

2.1 數(shù)字仿真：AI前時(shí)代的虛擬映射

2.1.1 虛擬角色的被動(dòng)再現(xiàn)與技術(shù)框架

在 AI 技術(shù)尚未深度滲透藝術(shù)創(chuàng)作的早期，虛擬角色的生成主要依賴于計(jì)算機(jī)視覺(jué)（CV）、三維建模等傳統(tǒng)數(shù)字仿真技術(shù)。動(dòng)作捕捉通過(guò)傳感器捕捉真人的運(yùn)動(dòng)軌跡，獲取面部表情和身體細(xì)節(jié)的動(dòng)態(tài)數(shù)據(jù)，再通過(guò)算法轉(zhuǎn)化為數(shù)字形象。這一過(guò)程通常需要高分辨率的攝影機(jī)、傳感器和復(fù)雜的數(shù)據(jù)處理系統(tǒng)以確保真實(shí)感。三維建模則結(jié)合物理模擬與光影渲染技術(shù)，利用捕捉數(shù)據(jù)實(shí)現(xiàn)高度逼真的數(shù)字人物建模與場(chǎng)景再現(xiàn)。這種精細(xì)化的數(shù)字仿真雖尚未具備自主生成能力，但通過(guò)視覺(jué)上為觀眾帶來(lái)“回春”效果，強(qiáng)化了數(shù)字形象的表現(xiàn)力和情感感染力。

動(dòng)作捕捉、實(shí)時(shí)渲染和物理模擬技術(shù)共同構(gòu)成了這一階段的技術(shù)主干。虛擬角色生成的主要目的便在于實(shí)現(xiàn)對(duì)現(xiàn)實(shí)世界的“高度還原”，并通過(guò)細(xì)致的視覺(jué)表現(xiàn)為觀眾帶來(lái)具備高保真畫(huà)質(zhì)的沉浸體驗(yàn)。盡管技術(shù)在視覺(jué)逼真度和物理模擬方面取得了顯著進(jìn)展，但往往缺乏情感生成和互動(dòng)能力[5]，仍然屬于“工具性”的表現(xiàn)。因此，虛擬角色在這一階段的表現(xiàn)形式主要限于舞臺(tái)演出和影視藝術(shù)的數(shù)字還原。

2.1.2 虛擬演唱會(huì)與數(shù)字仿真呈現(xiàn)

數(shù)字仿真技術(shù)的基礎(chǔ)在于數(shù)字視覺(jué)處理與物理模擬間的深度交互。數(shù)字視覺(jué)處理通過(guò)傳感器和攝影機(jī)等設(shè)備采集高精度數(shù)據(jù)，并通過(guò)算法分析和重建，最終實(shí)現(xiàn)逼真的視覺(jué)呈現(xiàn)；物理模擬則專注于光線、材質(zhì)和運(yùn)動(dòng)的真實(shí)再現(xiàn)，以彌補(bǔ)計(jì)算機(jī)生成圖像（CGI）在現(xiàn)實(shí)感上的不足[6,7]。2018年11月，《英雄聯(lián)盟》游戲推出的虛擬角色女團(tuán)K/DA首次亮相，成為虛擬角色早期方法的代表。K/DA的成員由計(jì)算機(jī)圖形學(xué)（CG）建模生成，結(jié)合動(dòng)作捕捉技術(shù)呈現(xiàn)出逼真的舞臺(tái)表演效果，配音及后期也基于真人錄制，體現(xiàn)了虛擬角色作為靜態(tài)、被動(dòng)表現(xiàn)主體的特性。

從2022年起，瑞典ABBA樂(lè)隊(duì)的虛擬演唱會(huì)則可被稱為動(dòng)作捕捉和三維建模技術(shù)應(yīng)用的頂尖實(shí)例。4位ABBA成員平均年齡75歲，他們身著動(dòng)作捕捉服，在200臺(tái)攝影機(jī)的多角度捕捉下進(jìn)行了為期5周的表演。特效公司工業(yè)光魔（ILM）通過(guò)專有捕捉工具，將這些表演轉(zhuǎn)化為虛擬角色的動(dòng)態(tài)表現(xiàn)[8]。此外，通過(guò)對(duì)演唱會(huì)每件道具和服裝進(jìn)行掃描處理，確保了色溫、材質(zhì)和運(yùn)動(dòng)狀態(tài)在不同光線條件下的真實(shí)還原[8]。物理數(shù)據(jù)的獲取使這些元素在數(shù)字世界中得以精確重現(xiàn)，從而在整個(gè)舞臺(tái)空間中呈現(xiàn)出接近真實(shí)物理效果的光影體驗(yàn)。

此外，該虛擬演唱會(huì)還引入了體積視頻技術(shù)，通過(guò)多角度攝影機(jī)捕捉場(chǎng)景，以保留人物的神態(tài)和動(dòng)作細(xì)節(jié)，再利用算法重組這些數(shù)據(jù)，生成包含深度信息的三維模型[9]。傳統(tǒng)視頻以每秒30幀的靜態(tài)圖像構(gòu)成，而體積視頻則包含每秒30個(gè)三維靜態(tài)模型，可高度還原人物的表情和動(dòng)作。演唱會(huì)現(xiàn)場(chǎng)設(shè)置了左右各6塊9.52米滑軌可移動(dòng)立面屏、12塊滑軌可移動(dòng)屏以及中間1塊9.5米×25米的主屏，配以6500萬(wàn)像素高清屏幕和霓虹光效，為觀眾帶來(lái)了全方位的逼真視覺(jué)體驗(yàn)。高度逼真的裸眼3D效果有效模糊了虛擬與現(xiàn)實(shí)的邊界，觀眾幾乎無(wú)法察覺(jué)這4位成員是虛擬角色，從而避免了虛擬角色常見(jiàn)的恐怖谷效應(yīng)。

這一案例不僅展示了數(shù)字仿真技術(shù)在高保真影像呈現(xiàn)上的卓越能力，更在一定程度上代表了在AI深度介入舞臺(tái)藝術(shù)創(chuàng)作前，數(shù)字藝術(shù)制作的最高水準(zhǔn)。然而，這一實(shí)例也揭示了傳統(tǒng)數(shù)字仿真技術(shù)在虛擬角色生成上的局限性，即其仍需依賴真人表演才能達(dá)到高度的真實(shí)感。

2.2 內(nèi)容生成：AIGC驅(qū)動(dòng)下的多模態(tài)藝術(shù)表達(dá)

2.2.1 多模態(tài)應(yīng)用平臺(tái)的崛起：從圖像、音頻到視頻的全面覆蓋

生成式藝術(shù)的歷史可追溯至20世紀(jì)50年代和60年代，當(dāng)時(shí)的藝術(shù)家開(kāi)始使用數(shù)學(xué)和邏輯規(guī)則來(lái)創(chuàng)作藝術(shù)品。這種藝術(shù)形式的核心在于使用預(yù)定義的算法或規(guī)則來(lái)驅(qū)動(dòng)藝術(shù)的創(chuàng)作過(guò)程。隨著計(jì)算機(jī)技術(shù)的發(fā)展，生成式藝術(shù)在數(shù)字藝術(shù)領(lǐng)域獲得了更廣泛的應(yīng)用[10]。近年來(lái)，生成式人工智能（GAI）的迅猛崛起，使虛擬角色生成從早期的簡(jiǎn)單仿真邁向了多模態(tài)、自主生成的智能化階段。2023年1月，Metaverse娛樂(lè)公司與Kakao娛樂(lè)公司合作推出了AI偶像團(tuán)體MAVE。MAVE不僅利用深度學(xué)習(xí)（DL）和深度偽造（Deepfake）等技術(shù)生成逼真的虛擬角色，還結(jié)合了動(dòng)作捕捉與AI算法，使虛擬角色具備自然的外觀和多語(yǔ)言交互能力。這一階段代表了虛擬角色的生成方式開(kāi)始趨向于多模態(tài)融合的自主生成。

在圖像、音頻、視頻等多方面，AI已催生了如Midjourney、Stable Diffusion、Runway、Sora、Suno等現(xiàn)象級(jí)多模態(tài)生成式技術(shù)應(yīng)用平臺(tái)[11]。2023年12月，AI虛擬歌手Anna Indiana在個(gè)人YouTube頻道發(fā)布了首個(gè)AI生成音樂(lè)演唱視頻。此后，她每月更新1~3條新歌視頻，至今已發(fā)布15條。其創(chuàng)作涉及AI智能編曲、AI人聲模擬、虛擬角色生成、唇音同步等技術(shù)，充分展示了AI在音樂(lè)創(chuàng)作中提升創(chuàng)作效率與創(chuàng)新表達(dá)的潛力。隨著AI工具的功能整合，這類創(chuàng)作流程持續(xù)簡(jiǎn)化，呈現(xiàn)出從音樂(lè)到表演視頻的全自動(dòng)化生成過(guò)程，降低了音樂(lè)創(chuàng)作的門檻，并為更廣泛的用戶群體提供了參與可能[12]。

基于多模態(tài)生成技術(shù)，虛擬角色不再局限于單一的視覺(jué)呈現(xiàn)，而發(fā)展為能同時(shí)生成表情、聲音和情感等多種要素，實(shí)現(xiàn)協(xié)調(diào)自然的互動(dòng)效果。例如，虛擬角色可根據(jù)臺(tái)詞或指令生成相應(yīng)的面部表情或語(yǔ)音情緒，從而帶來(lái)更生動(dòng)的表演體驗(yàn)。多模態(tài)生成技術(shù)的應(yīng)用不僅增強(qiáng)了虛擬角色的表現(xiàn)力，使其在舞臺(tái)與屏幕上栩栩如生，具備“類人化”特征，也為虛擬內(nèi)容的多樣化和適應(yīng)性開(kāi)創(chuàng)了新的可能性，不僅有助于提高藝術(shù)內(nèi)容的生成效率，也為觀眾提供了更沉浸、更具個(gè)性化的體驗(yàn)效果，逐步推動(dòng)虛擬角色在影視和舞臺(tái)藝術(shù)中的自適應(yīng)表現(xiàn)。

2.2.2 動(dòng)態(tài)表演與人物置換：AI推動(dòng)影視領(lǐng)域創(chuàng)制的多元應(yīng)用

此前，AI視頻生成始終無(wú)法真正走向電影領(lǐng)域的重要障礙在于：AI視頻中的人物形象難以實(shí)現(xiàn)自然的唇音同步和復(fù)雜的大幅度動(dòng)作表演。如今，隨著AI在動(dòng)態(tài)表演和人物置換技術(shù)上的突破，影視制作和內(nèi)容創(chuàng)作的可能性被進(jìn)一步拓展[13]。2024年3月，Viggle AI推出2.0模型，通過(guò)對(duì)視頻剪輯中的運(yùn)動(dòng)模式進(jìn)行分析，并將其與圖像融合，能快速生成具有精細(xì)表情和動(dòng)態(tài)動(dòng)作的虛擬人物動(dòng)畫(huà)。用戶僅需上傳一張照片，并結(jié)合視頻或特定動(dòng)作指令，即可生成高度逼真的虛擬角色影像，從而輕松實(shí)現(xiàn)高質(zhì)量的虛擬內(nèi)容制作，在電影視效、廣告、社交媒體等領(lǐng)域均有廣泛的應(yīng)用前景。

D?ID Studio是基于音頻生成唇音同步視頻的應(yīng)用軟件。用戶可將語(yǔ)音或文字輸入D?ID系統(tǒng)，生成具備自然表情的虛擬人物形象，從而為不同情境的呈現(xiàn)帶來(lái)更高的真實(shí)感。該軟件通過(guò)將靜態(tài)圖像與語(yǔ)音輸入結(jié)合，生成同步的口型和動(dòng)態(tài)表情，使虛擬角色能夠逼真地展示面部動(dòng)作和情緒[14]。2024年9月，字節(jié)跳動(dòng)旗下的新項(xiàng)目Loopy在即夢(mèng)平臺(tái)上線，進(jìn)一步提升了中文語(yǔ)境下的唇音同步表現(xiàn)。一個(gè)月后，快手旗下的可靈AI也開(kāi)放了對(duì)口型功能的API服務(wù)，面向所有用戶提供支持。與此同時(shí)，AI生成音樂(lè)領(lǐng)域的代表公司Suno的Bark語(yǔ)音模型，通過(guò)文本轉(zhuǎn)音頻技術(shù)實(shí)現(xiàn)富有情感的語(yǔ)音生成，減少了虛擬角色對(duì)真人配音的依賴。這類技術(shù)不僅提升了內(nèi)容創(chuàng)作的效率，也賦予用戶創(chuàng)作、還原或置換角色的能力，為虛擬內(nèi)容的多樣化表現(xiàn)奠定了技術(shù)基礎(chǔ)。

在生成式對(duì)抗網(wǎng)絡(luò)（GAN）和深度學(xué)習(xí)（DL）的支撐下，AIGC的多模態(tài)生成能力不僅增強(qiáng)了虛擬角色的表現(xiàn)力，還為舞臺(tái)和影視藝術(shù)中的內(nèi)容生成提供了智能化解決方案。2024年4月，全球首個(gè)全AI女團(tuán)Sorai.ai正式出道。與此前依賴真人部分參與的虛擬角色不同，Sorai.ai的形象設(shè)計(jì)、歌詞創(chuàng)作、編曲和演唱全部由AI獨(dú)立完成，標(biāo)志著虛擬角色生成進(jìn)入完全由AI驅(qū)動(dòng)的階段[15]。這一階段AI在藝術(shù)創(chuàng)作中的主導(dǎo)性正開(kāi)始顯現(xiàn)，虛擬角色不再依賴真人數(shù)據(jù)，而具備了自主創(chuàng)作和表演的能力。

虛擬角色通過(guò)這種智能生成方式，能在視覺(jué)、聽(tīng)覺(jué)和情境多重層面上實(shí)現(xiàn)高度自適應(yīng)的表現(xiàn)，為藝術(shù)內(nèi)容的表現(xiàn)形式提供新的可能。多樣的AIGC工具為人類創(chuàng)意工作帶來(lái)了極大便利，大幅降低了大眾進(jìn)行藝術(shù)創(chuàng)作的門檻。這些生成模型在特定內(nèi)容生成上可能達(dá)到了媲美人類設(shè)計(jì)師的水平，但在應(yīng)對(duì)復(fù)雜的藝術(shù)創(chuàng)作流程和內(nèi)容時(shí)，仍需精通專業(yè)領(lǐng)域知識(shí)的人員通過(guò)大量工具和模型的設(shè)計(jì)與整合來(lái)完成完整工作流，無(wú)法實(shí)現(xiàn)創(chuàng)作全流程的自動(dòng)化以及以用戶為中心的創(chuàng)作知識(shí)自動(dòng)化，難以真正廣泛服務(wù)于普通人群。

2.3 類人智能：AI后時(shí)代的共創(chuàng)智能體

伴隨AI的進(jìn)一步發(fā)展，虛擬角色的生成已不再局限于靜態(tài)表現(xiàn)或簡(jiǎn)單響應(yīng)，正邁向類人化交互階段，虛擬角色不再是單向的被動(dòng)表演者，而逐漸成為能夠理解和回應(yīng)情境的主動(dòng)互動(dòng)體，即具備類人智能和自主交互能力的“共創(chuàng)智能體”。在AI影像敘事中，人物的概念已超越了傳統(tǒng)的真人演員與動(dòng)畫(huà)角色，甚至涵蓋到虛擬數(shù)字人。在AIGC技術(shù)的加持下，呈現(xiàn)出更大的自動(dòng)化程度，使電影中的虛擬數(shù)字人可以不再是被規(guī)定的狀態(tài)[16]。這些智能體能在藝術(shù)場(chǎng)景中實(shí)現(xiàn)多維度的情感反饋與動(dòng)態(tài)適應(yīng)，模擬人類的情緒、行為和情境反應(yīng)，為觀眾帶來(lái)沉浸式體驗(yàn)，并將推動(dòng)人機(jī)共創(chuàng)的藝術(shù)表現(xiàn)新模式。這種轉(zhuǎn)變不僅改變了虛擬角色的表現(xiàn)方式，也推動(dòng)了人機(jī)共創(chuàng)的新型藝術(shù)模式。根據(jù)類人化交互理論[17]，虛擬智能體的設(shè)計(jì)應(yīng)盡可能模擬人類的情感和行為，從而實(shí)現(xiàn)對(duì)觀眾更強(qiáng)的情感共鳴[18]。AIGC技術(shù)的加持，使虛擬智能體能通過(guò)自動(dòng)化生成情感化的反應(yīng)，從而在電影、舞臺(tái)藝術(shù)和交互應(yīng)用中提供沉浸式體驗(yàn)。

2023年5月，英偉達(dá)（NVIDIA）推出的Avatar Cloud Engine（ACE）即為這一技術(shù)趨勢(shì)的代表性應(yīng)用。ACE通過(guò)結(jié)合語(yǔ)音生成、情感驅(qū)動(dòng)和面部動(dòng)畫(huà)技術(shù)，使虛擬角色能實(shí)時(shí)響應(yīng)觀眾或用戶的輸入，展現(xiàn)高度自然的面部表情和肢體反應(yīng)。這類技術(shù)結(jié)合了語(yǔ)音合成與面部動(dòng)畫(huà)匹配[19]，從而提升了虛擬角色的即時(shí)互動(dòng)性和表現(xiàn)力。ACE技術(shù)在虛擬主播和在線客服等領(lǐng)域得到廣泛應(yīng)用，能根據(jù)用戶的語(yǔ)音內(nèi)容和情緒反饋生成動(dòng)態(tài)表現(xiàn)，為用戶提供即時(shí)且逼真的交互體驗(yàn)。這種高互動(dòng)性賦予了虛擬角色自主決策和情境適應(yīng)能力，使其在舞臺(tái)和影視表演中能靈活表現(xiàn)個(gè)性化情緒與動(dòng)作，極大拓展了其在娛樂(lè)和教育領(lǐng)域的應(yīng)用潛力。

類似的實(shí)驗(yàn)性探索在2023年8月的Smallville項(xiàng)目中得到進(jìn)一步開(kāi)拓。谷歌與斯坦福大學(xué)的研究者創(chuàng)建了一個(gè)虛擬小鎮(zhèn)，在其中模擬了25個(gè)由大語(yǔ)言模型（LLM）、ChatGPT API及其他自定義代碼生成驅(qū)動(dòng)的擬人智能體[20]。這些智能體不僅具備獨(dú)立行為意識(shí)，還能夠展示類人化的情緒反應(yīng)與社會(huì)交互，模擬了人類社會(huì)中常見(jiàn)的社交行為和日?；顒?dòng)。這種類人化交互不僅豐富了虛擬角色的表現(xiàn)空間，也讓人機(jī)交互變得更加生動(dòng)自然，為共創(chuàng)智能體服務(wù)于藝術(shù)創(chuàng)作提供了更大可能性[21]。

在此趨勢(shì)下，2023年12月的Humanoid Agents項(xiàng)目進(jìn)一步深化了智能體類人化交互的研究。該項(xiàng)目由華盛頓大學(xué)和香港大學(xué)的研究者主導(dǎo)，設(shè)計(jì)了一個(gè)平臺(tái)以模擬具有人類需求、情緒和社會(huì)關(guān)系的智能體行為。相比此前的生成型智能體，Humanoid Agents系統(tǒng)引入了更貼近人類的System 1思維模型，基于心理學(xué)雙系統(tǒng)理論，為智能體設(shè)定了基本需求（饑餓、健康、能量等）、情緒（開(kāi)心、憤怒、悲傷等）及社會(huì)關(guān)系親密度。智能體不僅會(huì)按照計(jì)劃行動(dòng)，還會(huì)基于內(nèi)部狀態(tài)（如情緒、需求滿足度）和外部社交關(guān)系即時(shí)調(diào)整行為。智能體通過(guò)這些因素動(dòng)態(tài)調(diào)節(jié)日?；顒?dòng)和對(duì)話內(nèi)容，使其行為更具真實(shí)性和自然性。

3 AI賦能的個(gè)性化交互與人機(jī)共創(chuàng)路徑

3.1 從再現(xiàn)到情感沉浸的智能體共創(chuàng)

隨著AI技術(shù)的持續(xù)進(jìn)步，智能體的共創(chuàng)能力逐漸超越了傳統(tǒng)的角色再現(xiàn)，開(kāi)始進(jìn)入情感深度交互階段。虛擬角色已不僅是靜態(tài)的內(nèi)容呈現(xiàn)者，而是通過(guò)與觀眾實(shí)時(shí)交互，實(shí)現(xiàn)了更加沉浸式的藝術(shù)體驗(yàn)。智能體在情感表達(dá)與情境適應(yīng)方面的進(jìn)步，使虛擬角色能在直播和影視作品中自然地與觀眾產(chǎn)生共鳴。例如，虛擬角色可通過(guò)AIGC的加持，在直播中根據(jù)觀眾反饋實(shí)時(shí)調(diào)整表情和動(dòng)作，從而為觀眾營(yíng)造出接近真人表演的沉浸體驗(yàn)。這種情感驅(qū)動(dòng)的交互背后依賴于情境感知和情緒模擬技術(shù)，通過(guò)情緒識(shí)別與強(qiáng)化學(xué)習(xí)，智能體能識(shí)別觀眾情緒并做出即時(shí)響應(yīng)，從而增強(qiáng)人機(jī)共創(chuàng)的交互深度。

此外，AI藝術(shù)的演進(jìn)為虛擬角色的創(chuàng)作帶來(lái)了新的可能性，尤其是在自主生成、多模態(tài)合成和情感交互等方面的技術(shù)創(chuàng)新。未來(lái)，虛擬角色將在影視作品和舞臺(tái)表演中展現(xiàn)出更細(xì)膩的情感表現(xiàn)、更精準(zhǔn)的唇音同步，并具備個(gè)性化情境適應(yīng)能力。這些技術(shù)的結(jié)合拓展了虛擬角色的應(yīng)用領(lǐng)域，從藝術(shù)創(chuàng)作、教育培訓(xùn)到健康護(hù)理等各類社會(huì)場(chǎng)景，為用戶帶來(lái)沉浸式情感體驗(yàn)。

3.2 虛擬角色的身份與倫理

虛擬角色的高度擬真性也帶來(lái)了倫理和安全風(fēng)險(xiǎn)。虛擬角色是否應(yīng)被視為具有“真實(shí)”身份的存在？其行為是否具有自主性？這些問(wèn)題不僅涉及AI角色的社會(huì)地位，還關(guān)系到人類對(duì)虛擬角色的情感認(rèn)同[22]。高度擬人化的虛擬角色常引發(fā)觀眾的情感依賴，在一定程度上模糊了現(xiàn)實(shí)與虛擬的界限。這種情感連接在拓展文化表達(dá)的同時(shí)，也帶來(lái)倫理挑戰(zhàn)。若未得到適當(dāng)監(jiān)管，高度仿真的虛擬角色可能會(huì)被濫用或誤導(dǎo)，甚至引發(fā)隱私問(wèn)題。例如，虛擬角色的所有權(quán)與行為責(zé)任歸屬問(wèn)題，一旦其行為產(chǎn)生不良影響，責(zé)任是否應(yīng)歸于創(chuàng)作者、平臺(tái)或虛擬角色本身？此外，在新聞、教育等領(lǐng)域，虛擬角色的內(nèi)容需保持真實(shí)性，防止誤導(dǎo)。因此，未來(lái)的技術(shù)開(kāi)發(fā)需謹(jǐn)慎考慮數(shù)據(jù)安全和使用邊界，以平衡創(chuàng)新的自由度與安全性。AI開(kāi)發(fā)者與平臺(tái)需對(duì)此進(jìn)行深思，確保虛擬角色信息傳遞和行為表達(dá)的透明性，避免其被用于誤導(dǎo)或欺騙。

3.3 AI虛擬角色的多維文化表達(dá)

AI藝術(shù)的快速發(fā)展賦予虛擬角色更為多元的文化表達(dá)和社會(huì)意義，使其從單一的技術(shù)成果逐漸轉(zhuǎn)變?yōu)榫哂猩詈裎幕瘍r(jià)值的藝術(shù)形式。數(shù)字虛擬角色不僅是視覺(jué)和技術(shù)的產(chǎn)物，更是連接不同文化和觀眾的重要媒介。通過(guò)類人化的交互、情感沉浸和跨文化表達(dá)，AI藝術(shù)正在塑造出更多新的虛擬角色，為藝術(shù)創(chuàng)作和社會(huì)交互帶來(lái)更多可能性。

虛擬角色有望超越語(yǔ)言、地域和文化的界限，將不同文化背景的觀眾連接在一起。文化傳播理論指出，文化符號(hào)的跨國(guó)傳播通常伴隨著本土化和再創(chuàng)造的過(guò)程。通過(guò)AI賦能，虛擬角色逐漸形成了跨文化傳播的文化符號(hào)。例如，日本虛擬歌手初音未來(lái)自2007年誕生以來(lái)，借助用戶生成內(nèi)容（UGC）力量，通過(guò)粉絲創(chuàng)作的歌曲、插畫(huà)等在全球范圍內(nèi)傳播，成為一項(xiàng)代表性的跨文化符號(hào)[23]。這種虛擬角色不僅在不同文化市場(chǎng)中獲得追隨者，還扮演著“文化大使”的角色，促進(jìn)了文化的跨界傳播和認(rèn)同感。AI虛擬角色不再僅僅是技術(shù)產(chǎn)物，而逐漸成為具有社會(huì)價(jià)值和象征意義的文化現(xiàn)象。

跨文化傳播的有效性依賴于多語(yǔ)言表達(dá)和文化適應(yīng)性。虛擬角色通過(guò)多語(yǔ)言支持、語(yǔ)音合成和情感識(shí)別技術(shù)，能實(shí)現(xiàn)跨文化的互動(dòng)與交流，AI驅(qū)動(dòng)的虛擬角色則恰好具有通過(guò)語(yǔ)言和文化的適配來(lái)實(shí)現(xiàn)這一目標(biāo)的優(yōu)勢(shì)。利用多語(yǔ)言轉(zhuǎn)換和情感表達(dá)功能，發(fā)揮文化溝通的橋梁作用，提升全球化傳播的影響力，促進(jìn)不同文化間的理解與交流。這種跨文化角色彰顯了AI虛擬角色作為文化“譯者”的身份，觀眾得以通過(guò)虛擬角色了解和體驗(yàn)不同的文化內(nèi)涵。

4 跨界融合與生成生態(tài)：AI藝術(shù)的協(xié)同創(chuàng)新

4.1 多場(chǎng)景應(yīng)用中的跨界協(xié)同創(chuàng)新

AI藝術(shù)的跨界融合賦予其更為廣泛的應(yīng)用前景。通過(guò)與影視、音樂(lè)、游戲和教育等領(lǐng)域的緊密結(jié)合，AI生成內(nèi)容能融入不同社會(huì)場(chǎng)景，提供多樣化的用戶體驗(yàn)。例如，在影視行業(yè)中，虛擬角色的情感生成與交互能力有助于提升觀眾的沉浸感，虛擬角色甚至可以在影片中承擔(dān)主要角色，從而為影視創(chuàng)作提供更豐富的表現(xiàn)形式。在音樂(lè)領(lǐng)域，AI生成音樂(lè)已成為一種創(chuàng)新創(chuàng)作模式，能自動(dòng)根據(jù)歌詞生成旋律，創(chuàng)作出符合多種文化和風(fēng)格的音樂(lè)作品，為用戶帶來(lái)跨文化的音樂(lè)體驗(yàn)。

AI虛擬角色的跨界協(xié)同也會(huì)帶來(lái)顯著的應(yīng)用價(jià)值。在教育領(lǐng)域，虛擬教師和學(xué)習(xí)助手可根據(jù)學(xué)生的個(gè)性化需求提供即時(shí)反饋，幫助提升學(xué)習(xí)效果；商業(yè)中，虛擬角色和虛擬代言人逐漸成為品牌與消費(fèi)者交互的重要橋梁，虛擬代言人不僅具有高辨識(shí)度的形象，還通過(guò)情感化交互增強(qiáng)消費(fèi)者的品牌認(rèn)同感。這一跨界協(xié)同創(chuàng)新趨勢(shì)表明，虛擬角色已突破單一領(lǐng)域的應(yīng)用限制，逐步構(gòu)建起多行業(yè)協(xié)作的生成生態(tài)，實(shí)現(xiàn)數(shù)據(jù)、技術(shù)與資源的互通，使藝術(shù)與技術(shù)的邊界愈加模糊。

4.2 面向未來(lái)的AI藝術(shù)：在創(chuàng)新與倫理間尋求平衡

AI藝術(shù)的發(fā)展?jié)摿薮螅淇缃鐓f(xié)同與生成生態(tài)的形成展示了其在多領(lǐng)域的技術(shù)創(chuàng)新與多樣化表達(dá)。然而，面對(duì)技術(shù)潛力與倫理風(fēng)險(xiǎn)，AI藝術(shù)的發(fā)展需要在創(chuàng)新與社會(huì)責(zé)任間取得平衡。在跨領(lǐng)域生成生態(tài)中，AI的應(yīng)用不可避免地涉及用戶數(shù)據(jù)的收集、分析與利用。因此，在推動(dòng)AI藝術(shù)創(chuàng)新的同時(shí)，必須注重用戶數(shù)據(jù)與隱私的保護(hù)，確保技術(shù)應(yīng)用的安全性與透明性。

未來(lái)，AI藝術(shù)在推動(dòng)文化與藝術(shù)發(fā)展的過(guò)程中，需在真實(shí)性、透明性和安全性方面持續(xù)優(yōu)化。一方面，在內(nèi)容生成中，尤其是涉及敏感信息的應(yīng)用場(chǎng)景，必須采取嚴(yán)格的數(shù)據(jù)安全措施，保證用戶的隱私不受侵害。另一方面，生成生態(tài)的可持續(xù)發(fā)展依賴于技術(shù)與倫理的平衡交互，確保生成內(nèi)容符合社會(huì)價(jià)值導(dǎo)向，滿足用戶對(duì)內(nèi)容真實(shí)性和信任的期待。合理的技術(shù)應(yīng)用與嚴(yán)格的倫理規(guī)范將使AI驅(qū)動(dòng)的藝術(shù)創(chuàng)作成為社會(huì)創(chuàng)新的重要推動(dòng)力，極大豐富了人類的文化表達(dá)和生活體驗(yàn)。

5 總結(jié)與討論

虛擬角色從早期的簡(jiǎn)單仿真逐漸進(jìn)化為具備多模態(tài)交互能力的智能體，標(biāo)志著AI技術(shù)從“工具”向“共創(chuàng)者”角色的轉(zhuǎn)型。這一轉(zhuǎn)變賦予虛擬角色以藝術(shù)主體的獨(dú)立表達(dá)能力，使其不再僅是技術(shù)展示的載體，而成為文化共創(chuàng)的重要參與者。通過(guò)人機(jī)共創(chuàng)模式，虛擬角色開(kāi)辟了新的文化表達(dá)空間，豐富了虛擬藝術(shù)的表現(xiàn)形式，為當(dāng)代藝術(shù)帶來(lái)了從靜態(tài)生產(chǎn)到動(dòng)態(tài)交互的多維創(chuàng)新可能。隨著AI技術(shù)的愈發(fā)成熟，AI不再只是支持藝術(shù)家創(chuàng)作的工具，而是具備獨(dú)立生成和表達(dá)能力的創(chuàng)作力量。數(shù)字虛擬角色在文化內(nèi)容生成中的作用將逐漸從輔助工具轉(zhuǎn)變?yōu)榫哂心軇?dòng)性的主體。這一角色定位使AI生成內(nèi)容有望在影視、舞臺(tái)演出、品牌推廣和教育等多個(gè)領(lǐng)域展現(xiàn)出獨(dú)特的創(chuàng)作潛力，通過(guò)情感、個(gè)性化和交互定制，為觀眾提供深層次的沉浸體驗(yàn)和情感共鳴。

未來(lái)，AI深度參與的虛擬藝術(shù)或?qū)⒊蔀槲幕a(chǎn)的核心推動(dòng)力，推動(dòng)虛擬角色與人類之間的共創(chuàng)模式進(jìn)一步成熟與多樣化。這一趨勢(shì)不僅提升了文化內(nèi)容的創(chuàng)作效率和表達(dá)力，也為人機(jī)協(xié)同的文化生產(chǎn)開(kāi)辟了廣闊的新空間。在AI的驅(qū)動(dòng)下，虛擬角色不僅具備類人化交互和情境適應(yīng)能力，還可通過(guò)情感表達(dá)和智能生成，使藝術(shù)表現(xiàn)更趨真實(shí)、自然。借助AI技術(shù)的多模態(tài)協(xié)同與跨界融合，文化生產(chǎn)走向以智能生成為核心的全新藝術(shù)生態(tài)，提升文化創(chuàng)作的效率與創(chuàng)造力。

隨著AI技術(shù)的持續(xù)演進(jìn)，其將持續(xù)在文化內(nèi)容生成中發(fā)揮關(guān)鍵作用，為人機(jī)共創(chuàng)開(kāi)辟新的可能性。未來(lái)，技術(shù)與藝術(shù)相互共振的人機(jī)共創(chuàng)藝術(shù)將呈現(xiàn)出更加沉浸、交互和個(gè)性化的文化生產(chǎn)新圖景。虛擬數(shù)字藝術(shù)與現(xiàn)實(shí)生活深度融合，邁向人機(jī)協(xié)同的共創(chuàng)美學(xué)，為文化藝術(shù)的未來(lái)注入新的活力。

參考文獻(xiàn)

（向下滑動(dòng)閱讀）

[1] 陸子惠. 數(shù)字表演與新型互動(dòng)：互聯(lián)網(wǎng)藝術(shù)、虛擬現(xiàn)實(shí)與人工智能[J]. 戲劇藝術(shù), 2024(5): 11?19,6.

[2] Liu J. Virtual presence, real connections: Exploring the role of parasocial relationships in virtual idol fan community participation[J]. Global Media and China, 2023（12）.

[3] Trattner C, Jannach D, Motta E, et al. Responsible media technology and AI: challenges and research directions[J]. AI and Ethics, 2022, 2(4): 585?594.

[4] Baltru?aitis T, Ahuja C, Morency L-P. Multimodal Machine Learning: A Survey and Taxonomy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, 41(2): 423?443.

[5] Li L. The influence of digital twins on the methods of film and television creation[J]. Computers and Electrical Engineering, 2022, 103: 108314.

[6] Rekik R, Wuhrer S, Hoyet L, et al. A Survey on Realistic Virtual Human Animations: Definitions, Features and Evaluations[J]. Computer Graphics Forum, 2024, 43(2): e15064.

[7] Wang J, Jia M, Yang X, et al. 3D Modeling in Virtual Simulation Technology[C]//Frontier Computing. Singapore:Springer Nature,2023: 788?795.

[8] Matthews J, Nairn A. Holographic ABBA: Examining Fan Responses to ABBA’s Virtual “Live” Concert[J]. Popular Music and Society, 2023, 46(3): 282?303.

[9] Kakkar P, Ragothaman H. The evolution of volumetric video: A survey of smart transcoding and compression approaches[J]. International Journal of Computer Graphics & Animation, 2024, 14(1/2/3/4): 01?11.

[10] 李天. AIGC介入影視藝術(shù)——從“生成”概念談起[J]. 電影新作, 2024(3): 20?27.

[11] Liu Y, Zhang K, Li Y, et al. Sora: A Review on Background, Technology,Limitations, and Opportunities of Large Vision Models[EB/OL].(2024?03?18)[2024?11?03].https://blog.csdn.net/qq_41200212/article/details/136811930.

[12] 高永杰. 智能轉(zhuǎn)描、算法映射與多模態(tài)創(chuàng)作——生成式AI重塑電影創(chuàng)作之思[J]. 當(dāng)代電影, 2024(12): 91?98.

[13] Chen Y, Wang Y, Yu T, et al. The Effect of AI on Animation Production Efficiency: An Empirical Investigation Through the Network Data Envelopment Analysis[J]. Electronics, 2024, 13(24): 5001.

[14] Daně?ek R, Chhatre K, Tripathi S, et al. Emotional Speech?Driven Animation with Content?Emotion Disentanglement[C]//SIGGRAPH Asia 2023 Conference Papers, 2023：1?3.

[15] 騰訊網(wǎng). 全球首個(gè)AI女團(tuán)首秀倒計(jì)時(shí) - Sorai.ai出道計(jì)劃獨(dú)家揭秘_騰訊新聞[EB/OL]. (2024?04?17)[2024?12?24]. https://news.qq.com/rain/a/undefined.

[16] 陳焱松, 周雯. 人工智能影像敘事的涌現(xiàn)化生成[J]. 當(dāng)代電影, 2024(5): 14?20.

[17] Nass C, Moon Y. Machines and mindlessness: Social responses to computers[J]. Journal of Social Issues, 2000, 56(1): 81?103.

[18] 吳宋若瑤, 沈寒暑, 陳銘威, 等. 情感驅(qū)動(dòng)的智能藝術(shù)研究綜述[J]. 包裝工程, 2024, 45(12): 1?12.

[19] Ham J, Li S, Looi J, et al. Virtual humans as social actors: Investigating user perceptions of virtual humans’ emotional expression on social media[J]. Computers in Human Behavior, 2024, 155: 108161.

[20] Park J S, O’Brien J, Cai C J, et al. Generative Agents: Interactive Simulacra of Human Behavior[C]//Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology. San Francisco CA USA:ACM,2023: 1?22.

[21] 楊揚(yáng). 身體、意識(shí)和自我認(rèn)識(shí)——AI技術(shù)與電影表演中的身體表現(xiàn)[J]. 當(dāng)代電影, 2024(12): 82?90.

[22] 李想. 具身人工智能的著作權(quán)主體思考[J]. 科技與法律(中英文), 2024(5): 90?99.

[23] Yin Y. Vocaloid in China: Cosmopolitan music, cultural expression, and multilayer identity[J]. Global Media and China, 2018, 3(1): 51?66.

【基金項(xiàng)目】國(guó)家社科基金藝術(shù)學(xué)重大項(xiàng)目“重大主題影視創(chuàng)作增強(qiáng)中華民族現(xiàn)代文明傳播力影響力研究”（24ZD06）。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.