本文刊發(fā)于《現(xiàn)代電影技術(shù)》2025年第1期
專家點(diǎn)評(píng)
隨著人工智能(AI)技術(shù)的不斷進(jìn)化,藝術(shù)創(chuàng)作領(lǐng)域正經(jīng)歷一場(chǎng)由新技術(shù)驅(qū)動(dòng)的虛擬與現(xiàn)實(shí)融合的變革。在AI技術(shù)的加持下,虛擬角色經(jīng)過(guò)不斷演化已步入到AI賦能的人機(jī)共創(chuàng)階段。在戲劇與影視領(lǐng)域,這一變革在推動(dòng)戲劇呈現(xiàn)方式、影像生產(chǎn)邏輯更迭的同時(shí),也催生了藝術(shù)審美的重構(gòu)。在AI技術(shù)持續(xù)更新及藝術(shù)與生活關(guān)系遵循的雙重作用下,其藝術(shù)形象的再現(xiàn)生成路徑及由此引發(fā)的審美特征也在發(fā)生著不容忽視的變化,且有待進(jìn)行藝術(shù)品格及認(rèn)知倫理的重新辨識(shí)和定位。《基于AI技術(shù)的影視虛擬角色創(chuàng)制:從數(shù)字仿真到智能共創(chuàng)》一文密切關(guān)注最新技術(shù)前沿,聚焦AI技術(shù)在藝術(shù)創(chuàng)作特別是戲劇與影視領(lǐng)域虛擬角色創(chuàng)制方式及其應(yīng)用這一極具前瞻性的議題,契合當(dāng)下科技與藝術(shù)深度融合的發(fā)展趨勢(shì)。通過(guò)案例分析與理論闡述,深入剖析了從數(shù)字仿真到智能共創(chuàng)的技術(shù)應(yīng)用歷程及不同階段虛擬角色創(chuàng)制的特點(diǎn),著重提出了AI在虛擬角色構(gòu)建、藝術(shù)創(chuàng)制過(guò)程中人機(jī)共創(chuàng)的路徑及其在藝術(shù)創(chuàng)作內(nèi)容生成模式上的革新,AI技術(shù)正在從輔助工具向共創(chuàng)主體轉(zhuǎn)變。同時(shí)還敏銳地察覺(jué)到AI參與創(chuàng)制所引發(fā)的倫理與創(chuàng)作身份界定等復(fù)雜問(wèn)題,對(duì)AI虛擬角色在跨文化交流中的作用以及未來(lái)藝術(shù)創(chuàng)作方向進(jìn)行了有說(shuō)服力的設(shè)想與展望。
——高雄杰
教授、博士生導(dǎo)師
中央戲劇學(xué)院學(xué)術(shù)委員會(huì)副主任、電影電視系主任
作 者 簡(jiǎn) 介
周 雯
北京師范大學(xué)藝術(shù)與傳媒學(xué)院教授、博士生導(dǎo)師,主要研究方向:數(shù)字影像藝術(shù)、虛擬現(xiàn)實(shí)影像藝術(shù)。
北京師范大學(xué)藝術(shù)與傳媒學(xué)院數(shù)字媒體藝術(shù)專業(yè)大學(xué)本科在讀,主要研究方向:數(shù)字媒體藝術(shù)。
趙 恬
摘要
為深入探究藝術(shù)創(chuàng)作領(lǐng)域從計(jì)算機(jī)合成虛擬角色到人工智能(AI)深度參與的人機(jī)共創(chuàng)模式的演變歷程、作用機(jī)制及其深遠(yuǎn)影響,本文通過(guò)梳理 AI 技術(shù)在影視與舞臺(tái)藝術(shù)中的應(yīng)用歷程,利用案例分析和理論闡述,提出 AI 正從輔助工具向共創(chuàng)主體轉(zhuǎn)變的論點(diǎn)。通過(guò)對(duì) AI 在虛擬角色構(gòu)建、人工智能生成內(nèi)容(AIGC)驅(qū)動(dòng)的藝術(shù)創(chuàng)作過(guò)程以及人機(jī)共創(chuàng)路徑等方面的詳盡剖析,發(fā)現(xiàn)AI 技術(shù)的持續(xù)演進(jìn)顯著增強(qiáng)了虛擬角色的表現(xiàn)力,革新了藝術(shù)創(chuàng)作內(nèi)容的生成模式,為藝術(shù)創(chuàng)作注入諸多創(chuàng)新元素,帶來(lái)沉浸式體驗(yàn);然而,這一進(jìn)程也引發(fā)了倫理與身份界定等復(fù)雜問(wèn)題,如虛擬角色行為責(zé)任歸屬不明、引發(fā)觀眾情感依賴等。未來(lái),AI虛擬角色可能在跨文化交流中發(fā)揮重要橋梁作用,AI的深度參與有望推動(dòng)藝術(shù)創(chuàng)作朝著虛擬與現(xiàn)實(shí)深度融合、多元文化體驗(yàn)拓展的方向持續(xù)發(fā)展。
關(guān)鍵詞
人工智能;虛擬角色;AIGC;人機(jī)共創(chuàng);數(shù)字仿真
1 引言
近年來(lái),人工智能(AI)的迅速發(fā)展正在藝術(shù)創(chuàng)作領(lǐng)域引發(fā)革命性變化。AI技術(shù)不僅提供了更豐富的視覺(jué)呈現(xiàn)和聽(tīng)覺(jué)體驗(yàn),還通過(guò)多模態(tài)生成、實(shí)時(shí)響應(yīng)和個(gè)性化交互等方式,推動(dòng)了藝術(shù)表達(dá)的創(chuàng)新。這些技術(shù)變革讓舞臺(tái)表演與影視作品中的數(shù)字內(nèi)容具備了更加高度逼真的表現(xiàn)力和靈活的互動(dòng)性,從而逐漸突破傳統(tǒng)的藝術(shù)生成邊界[1]。在技術(shù)與藝術(shù)交織的進(jìn)程中,虛擬角色、智能生成角色和數(shù)字化舞臺(tái)效果等應(yīng)用形式成為新的藝術(shù)表現(xiàn)手段,使觀眾能在沉浸式環(huán)境中體驗(yàn)動(dòng)態(tài)、個(gè)性化的藝術(shù)互動(dòng)[2]。這一演變不僅重塑了文化內(nèi)容的生成方式,也為藝術(shù)創(chuàng)作帶來(lái)了廣泛的社會(huì)影響。
在舞臺(tái)表演與影視藝術(shù)中,AI技術(shù)逐步從技術(shù)輔助工具發(fā)展成為藝術(shù)表現(xiàn)的核心支撐。早期藝術(shù)內(nèi)容創(chuàng)作多通過(guò)動(dòng)作捕捉和三維建模等數(shù)字技術(shù)完成,而隨著生成式對(duì)抗網(wǎng)絡(luò)(GAN)、大語(yǔ)言模型(LLM)等技術(shù)的發(fā)展,藝術(shù)內(nèi)容的生成從單一仿真向智能化與自適應(yīng)轉(zhuǎn)變[3]。AI不僅能在創(chuàng)作過(guò)程中生成多模態(tài)的動(dòng)態(tài)效果,還能識(shí)別并回應(yīng)場(chǎng)景變化和觀眾情緒,形成靈活的交互。從底層邏輯上看,這些技術(shù)融合了深度學(xué)習(xí)與實(shí)時(shí)數(shù)據(jù)處理,使數(shù)字內(nèi)容能通過(guò)自我學(xué)習(xí)和優(yōu)化來(lái)調(diào)整表現(xiàn)方式,從而帶來(lái)類人化和高度個(gè)性化的表達(dá)[4]。舞臺(tái)表演和影視作品借助AI促進(jìn)沉浸式藝術(shù)體驗(yàn)的發(fā)展,為當(dāng)代藝術(shù)生成方式開(kāi)辟了新的理論框架和研究路徑。
本文通過(guò)梳理AI技術(shù)在舞臺(tái)與影視藝術(shù)中的應(yīng)用演變,對(duì)其技術(shù)發(fā)展路徑進(jìn)行階段性分析,探討從數(shù)字仿真到智能生成再到智能體(Agent)共創(chuàng),AI如何逐步成為文化藝術(shù)表達(dá)的重要構(gòu)建要素,并探析未來(lái)AI協(xié)同藝術(shù)創(chuàng)作的發(fā)展路徑。
2 虛擬角色的演進(jìn)之路:AI技術(shù)參與的三重階段
2.1 數(shù)字仿真:AI前時(shí)代的虛擬映射
2.1.1 虛擬角色的被動(dòng)再現(xiàn)與技術(shù)框架
在 AI 技術(shù)尚未深度滲透藝術(shù)創(chuàng)作的早期,虛擬角色的生成主要依賴于計(jì)算機(jī)視覺(jué)(CV)、三維建模等傳統(tǒng)數(shù)字仿真技術(shù)。動(dòng)作捕捉通過(guò)傳感器捕捉真人的運(yùn)動(dòng)軌跡,獲取面部表情和身體細(xì)節(jié)的動(dòng)態(tài)數(shù)據(jù),再通過(guò)算法轉(zhuǎn)化為數(shù)字形象。這一過(guò)程通常需要高分辨率的攝影機(jī)、傳感器和復(fù)雜的數(shù)據(jù)處理系統(tǒng)以確保真實(shí)感。三維建模則結(jié)合物理模擬與光影渲染技術(shù),利用捕捉數(shù)據(jù)實(shí)現(xiàn)高度逼真的數(shù)字人物建模與場(chǎng)景再現(xiàn)。這種精細(xì)化的數(shù)字仿真雖尚未具備自主生成能力,但通過(guò)視覺(jué)上為觀眾帶來(lái)“回春”效果,強(qiáng)化了數(shù)字形象的表現(xiàn)力和情感感染力。
動(dòng)作捕捉、實(shí)時(shí)渲染和物理模擬技術(shù)共同構(gòu)成了這一階段的技術(shù)主干。虛擬角色生成的主要目的便在于實(shí)現(xiàn)對(duì)現(xiàn)實(shí)世界的“高度還原”,并通過(guò)細(xì)致的視覺(jué)表現(xiàn)為觀眾帶來(lái)具備高保真畫(huà)質(zhì)的沉浸體驗(yàn)。盡管技術(shù)在視覺(jué)逼真度和物理模擬方面取得了顯著進(jìn)展,但往往缺乏情感生成和互動(dòng)能力[5],仍然屬于“工具性”的表現(xiàn)。因此,虛擬角色在這一階段的表現(xiàn)形式主要限于舞臺(tái)演出和影視藝術(shù)的數(shù)字還原。
2.1.2 虛擬演唱會(huì)與數(shù)字仿真呈現(xiàn)
數(shù)字仿真技術(shù)的基礎(chǔ)在于數(shù)字視覺(jué)處理與物理模擬間的深度交互。數(shù)字視覺(jué)處理通過(guò)傳感器和攝影機(jī)等設(shè)備采集高精度數(shù)據(jù),并通過(guò)算法分析和重建,最終實(shí)現(xiàn)逼真的視覺(jué)呈現(xiàn);物理模擬則專注于光線、材質(zhì)和運(yùn)動(dòng)的真實(shí)再現(xiàn),以彌補(bǔ)計(jì)算機(jī)生成圖像(CGI)在現(xiàn)實(shí)感上的不足[6,7]。2018年11月,《英雄聯(lián)盟》游戲推出的虛擬角色女團(tuán)K/DA首次亮相,成為虛擬角色早期方法的代表。K/DA的成員由計(jì)算機(jī)圖形學(xué)(CG)建模生成,結(jié)合動(dòng)作捕捉技術(shù)呈現(xiàn)出逼真的舞臺(tái)表演效果,配音及后期也基于真人錄制,體現(xiàn)了虛擬角色作為靜態(tài)、被動(dòng)表現(xiàn)主體的特性。
從2022年起,瑞典ABBA樂(lè)隊(duì)的虛擬演唱會(huì)則可被稱為動(dòng)作捕捉和三維建模技術(shù)應(yīng)用的頂尖實(shí)例。4位ABBA成員平均年齡75歲,他們身著動(dòng)作捕捉服,在200臺(tái)攝影機(jī)的多角度捕捉下進(jìn)行了為期5周的表演。特效公司工業(yè)光魔(ILM)通過(guò)專有捕捉工具,將這些表演轉(zhuǎn)化為虛擬角色的動(dòng)態(tài)表現(xiàn)[8]。此外,通過(guò)對(duì)演唱會(huì)每件道具和服裝進(jìn)行掃描處理,確保了色溫、材質(zhì)和運(yùn)動(dòng)狀態(tài)在不同光線條件下的真實(shí)還原[8]。物理數(shù)據(jù)的獲取使這些元素在數(shù)字世界中得以精確重現(xiàn),從而在整個(gè)舞臺(tái)空間中呈現(xiàn)出接近真實(shí)物理效果的光影體驗(yàn)。
此外,該虛擬演唱會(huì)還引入了體積視頻技術(shù),通過(guò)多角度攝影機(jī)捕捉場(chǎng)景,以保留人物的神態(tài)和動(dòng)作細(xì)節(jié),再利用算法重組這些數(shù)據(jù),生成包含深度信息的三維模型[9]。傳統(tǒng)視頻以每秒30幀的靜態(tài)圖像構(gòu)成,而體積視頻則包含每秒30個(gè)三維靜態(tài)模型,可高度還原人物的表情和動(dòng)作。演唱會(huì)現(xiàn)場(chǎng)設(shè)置了左右各6塊9.52米滑軌可移動(dòng)立面屏、12塊滑軌可移動(dòng)屏以及中間1塊9.5米×25米的主屏,配以6500萬(wàn)像素高清屏幕和霓虹光效,為觀眾帶來(lái)了全方位的逼真視覺(jué)體驗(yàn)。高度逼真的裸眼3D效果有效模糊了虛擬與現(xiàn)實(shí)的邊界,觀眾幾乎無(wú)法察覺(jué)這4位成員是虛擬角色,從而避免了虛擬角色常見(jiàn)的恐怖谷效應(yīng)。
這一案例不僅展示了數(shù)字仿真技術(shù)在高保真影像呈現(xiàn)上的卓越能力,更在一定程度上代表了在AI深度介入舞臺(tái)藝術(shù)創(chuàng)作前,數(shù)字藝術(shù)制作的最高水準(zhǔn)。然而,這一實(shí)例也揭示了傳統(tǒng)數(shù)字仿真技術(shù)在虛擬角色生成上的局限性,即其仍需依賴真人表演才能達(dá)到高度的真實(shí)感。
2.2 內(nèi)容生成:AIGC驅(qū)動(dòng)下的多模態(tài)藝術(shù)表達(dá)
2.2.1 多模態(tài)應(yīng)用平臺(tái)的崛起:從圖像、音頻到視頻的全面覆蓋
生成式藝術(shù)的歷史可追溯至20世紀(jì)50年代和60年代,當(dāng)時(shí)的藝術(shù)家開(kāi)始使用數(shù)學(xué)和邏輯規(guī)則來(lái)創(chuàng)作藝術(shù)品。這種藝術(shù)形式的核心在于使用預(yù)定義的算法或規(guī)則來(lái)驅(qū)動(dòng)藝術(shù)的創(chuàng)作過(guò)程。隨著計(jì)算機(jī)技術(shù)的發(fā)展,生成式藝術(shù)在數(shù)字藝術(shù)領(lǐng)域獲得了更廣泛的應(yīng)用[10]。近年來(lái),生成式人工智能(GAI)的迅猛崛起,使虛擬角色生成從早期的簡(jiǎn)單仿真邁向了多模態(tài)、自主生成的智能化階段。2023年1月,Metaverse娛樂(lè)公司與Kakao娛樂(lè)公司合作推出了AI偶像團(tuán)體MAVE。MAVE不僅利用深度學(xué)習(xí)(DL)和深度偽造(Deepfake)等技術(shù)生成逼真的虛擬角色,還結(jié)合了動(dòng)作捕捉與AI算法,使虛擬角色具備自然的外觀和多語(yǔ)言交互能力。這一階段代表了虛擬角色的生成方式開(kāi)始趨向于多模態(tài)融合的自主生成。
在圖像、音頻、視頻等多方面,AI已催生了如Midjourney、Stable Diffusion、Runway、Sora、Suno等現(xiàn)象級(jí)多模態(tài)生成式技術(shù)應(yīng)用平臺(tái)[11]。2023年12月,AI虛擬歌手Anna Indiana在個(gè)人YouTube頻道發(fā)布了首個(gè)AI生成音樂(lè)演唱視頻。此后,她每月更新1~3條新歌視頻,至今已發(fā)布15條。其創(chuàng)作涉及AI智能編曲、AI人聲模擬、虛擬角色生成、唇音同步等技術(shù),充分展示了AI在音樂(lè)創(chuàng)作中提升創(chuàng)作效率與創(chuàng)新表達(dá)的潛力。隨著AI工具的功能整合,這類創(chuàng)作流程持續(xù)簡(jiǎn)化,呈現(xiàn)出從音樂(lè)到表演視頻的全自動(dòng)化生成過(guò)程,降低了音樂(lè)創(chuàng)作的門檻,并為更廣泛的用戶群體提供了參與可能[12]。
基于多模態(tài)生成技術(shù),虛擬角色不再局限于單一的視覺(jué)呈現(xiàn),而發(fā)展為能同時(shí)生成表情、聲音和情感等多種要素,實(shí)現(xiàn)協(xié)調(diào)自然的互動(dòng)效果。例如,虛擬角色可根據(jù)臺(tái)詞或指令生成相應(yīng)的面部表情或語(yǔ)音情緒,從而帶來(lái)更生動(dòng)的表演體驗(yàn)。多模態(tài)生成技術(shù)的應(yīng)用不僅增強(qiáng)了虛擬角色的表現(xiàn)力,使其在舞臺(tái)與屏幕上栩栩如生,具備“類人化”特征,也為虛擬內(nèi)容的多樣化和適應(yīng)性開(kāi)創(chuàng)了新的可能性,不僅有助于提高藝術(shù)內(nèi)容的生成效率,也為觀眾提供了更沉浸、更具個(gè)性化的體驗(yàn)效果,逐步推動(dòng)虛擬角色在影視和舞臺(tái)藝術(shù)中的自適應(yīng)表現(xiàn)。
2.2.2 動(dòng)態(tài)表演與人物置換:AI推動(dòng)影視領(lǐng)域創(chuàng)制的多元應(yīng)用
此前,AI視頻生成始終無(wú)法真正走向電影領(lǐng)域的重要障礙在于:AI視頻中的人物形象難以實(shí)現(xiàn)自然的唇音同步和復(fù)雜的大幅度動(dòng)作表演。如今,隨著AI在動(dòng)態(tài)表演和人物置換技術(shù)上的突破,影視制作和內(nèi)容創(chuàng)作的可能性被進(jìn)一步拓展[13]。2024年3月,Viggle AI推出2.0模型,通過(guò)對(duì)視頻剪輯中的運(yùn)動(dòng)模式進(jìn)行分析,并將其與圖像融合,能快速生成具有精細(xì)表情和動(dòng)態(tài)動(dòng)作的虛擬人物動(dòng)畫(huà)。用戶僅需上傳一張照片,并結(jié)合視頻或特定動(dòng)作指令,即可生成高度逼真的虛擬角色影像,從而輕松實(shí)現(xiàn)高質(zhì)量的虛擬內(nèi)容制作,在電影視效、廣告、社交媒體等領(lǐng)域均有廣泛的應(yīng)用前景。
D?ID Studio是基于音頻生成唇音同步視頻的應(yīng)用軟件。用戶可將語(yǔ)音或文字輸入D?ID系統(tǒng),生成具備自然表情的虛擬人物形象,從而為不同情境的呈現(xiàn)帶來(lái)更高的真實(shí)感。該軟件通過(guò)將靜態(tài)圖像與語(yǔ)音輸入結(jié)合,生成同步的口型和動(dòng)態(tài)表情,使虛擬角色能夠逼真地展示面部動(dòng)作和情緒[14]。2024年9月,字節(jié)跳動(dòng)旗下的新項(xiàng)目Loopy在即夢(mèng)平臺(tái)上線,進(jìn)一步提升了中文語(yǔ)境下的唇音同步表現(xiàn)。一個(gè)月后,快手旗下的可靈AI也開(kāi)放了對(duì)口型功能的API服務(wù),面向所有用戶提供支持。與此同時(shí),AI生成音樂(lè)領(lǐng)域的代表公司Suno的Bark語(yǔ)音模型,通過(guò)文本轉(zhuǎn)音頻技術(shù)實(shí)現(xiàn)富有情感的語(yǔ)音生成,減少了虛擬角色對(duì)真人配音的依賴。這類技術(shù)不僅提升了內(nèi)容創(chuàng)作的效率,也賦予用戶創(chuàng)作、還原或置換角色的能力,為虛擬內(nèi)容的多樣化表現(xiàn)奠定了技術(shù)基礎(chǔ)。
在生成式對(duì)抗網(wǎng)絡(luò)(GAN)和深度學(xué)習(xí)(DL)的支撐下,AIGC的多模態(tài)生成能力不僅增強(qiáng)了虛擬角色的表現(xiàn)力,還為舞臺(tái)和影視藝術(shù)中的內(nèi)容生成提供了智能化解決方案。2024年4月,全球首個(gè)全AI女團(tuán)Sorai.ai正式出道。與此前依賴真人部分參與的虛擬角色不同,Sorai.ai的形象設(shè)計(jì)、歌詞創(chuàng)作、編曲和演唱全部由AI獨(dú)立完成,標(biāo)志著虛擬角色生成進(jìn)入完全由AI驅(qū)動(dòng)的階段[15]。這一階段AI在藝術(shù)創(chuàng)作中的主導(dǎo)性正開(kāi)始顯現(xiàn),虛擬角色不再依賴真人數(shù)據(jù),而具備了自主創(chuàng)作和表演的能力。
虛擬角色通過(guò)這種智能生成方式,能在視覺(jué)、聽(tīng)覺(jué)和情境多重層面上實(shí)現(xiàn)高度自適應(yīng)的表現(xiàn),為藝術(shù)內(nèi)容的表現(xiàn)形式提供新的可能。多樣的AIGC工具為人類創(chuàng)意工作帶來(lái)了極大便利,大幅降低了大眾進(jìn)行藝術(shù)創(chuàng)作的門檻。這些生成模型在特定內(nèi)容生成上可能達(dá)到了媲美人類設(shè)計(jì)師的水平,但在應(yīng)對(duì)復(fù)雜的藝術(shù)創(chuàng)作流程和內(nèi)容時(shí),仍需精通專業(yè)領(lǐng)域知識(shí)的人員通過(guò)大量工具和模型的設(shè)計(jì)與整合來(lái)完成完整工作流,無(wú)法實(shí)現(xiàn)創(chuàng)作全流程的自動(dòng)化以及以用戶為中心的創(chuàng)作知識(shí)自動(dòng)化,難以真正廣泛服務(wù)于普通人群。
2.3 類人智能:AI后時(shí)代的共創(chuàng)智能體
伴隨AI的進(jìn)一步發(fā)展,虛擬角色的生成已不再局限于靜態(tài)表現(xiàn)或簡(jiǎn)單響應(yīng),正邁向類人化交互階段,虛擬角色不再是單向的被動(dòng)表演者,而逐漸成為能夠理解和回應(yīng)情境的主動(dòng)互動(dòng)體,即具備類人智能和自主交互能力的“共創(chuàng)智能體”。在AI影像敘事中,人物的概念已超越了傳統(tǒng)的真人演員與動(dòng)畫(huà)角色,甚至涵蓋到虛擬數(shù)字人。在AIGC技術(shù)的加持下,呈現(xiàn)出更大的自動(dòng)化程度,使電影中的虛擬數(shù)字人可以不再是被規(guī)定的狀態(tài)[16]。這些智能體能在藝術(shù)場(chǎng)景中實(shí)現(xiàn)多維度的情感反饋與動(dòng)態(tài)適應(yīng),模擬人類的情緒、行為和情境反應(yīng),為觀眾帶來(lái)沉浸式體驗(yàn),并將推動(dòng)人機(jī)共創(chuàng)的藝術(shù)表現(xiàn)新模式。這種轉(zhuǎn)變不僅改變了虛擬角色的表現(xiàn)方式,也推動(dòng)了人機(jī)共創(chuàng)的新型藝術(shù)模式。根據(jù)類人化交互理論[17],虛擬智能體的設(shè)計(jì)應(yīng)盡可能模擬人類的情感和行為,從而實(shí)現(xiàn)對(duì)觀眾更強(qiáng)的情感共鳴[18]。AIGC技術(shù)的加持,使虛擬智能體能通過(guò)自動(dòng)化生成情感化的反應(yīng),從而在電影、舞臺(tái)藝術(shù)和交互應(yīng)用中提供沉浸式體驗(yàn)。
2023年5月,英偉達(dá)(NVIDIA)推出的Avatar Cloud Engine(ACE)即為這一技術(shù)趨勢(shì)的代表性應(yīng)用。ACE通過(guò)結(jié)合語(yǔ)音生成、情感驅(qū)動(dòng)和面部動(dòng)畫(huà)技術(shù),使虛擬角色能實(shí)時(shí)響應(yīng)觀眾或用戶的輸入,展現(xiàn)高度自然的面部表情和肢體反應(yīng)。這類技術(shù)結(jié)合了語(yǔ)音合成與面部動(dòng)畫(huà)匹配[19],從而提升了虛擬角色的即時(shí)互動(dòng)性和表現(xiàn)力。ACE技術(shù)在虛擬主播和在線客服等領(lǐng)域得到廣泛應(yīng)用,能根據(jù)用戶的語(yǔ)音內(nèi)容和情緒反饋生成動(dòng)態(tài)表現(xiàn),為用戶提供即時(shí)且逼真的交互體驗(yàn)。這種高互動(dòng)性賦予了虛擬角色自主決策和情境適應(yīng)能力,使其在舞臺(tái)和影視表演中能靈活表現(xiàn)個(gè)性化情緒與動(dòng)作,極大拓展了其在娛樂(lè)和教育領(lǐng)域的應(yīng)用潛力。
類似的實(shí)驗(yàn)性探索在2023年8月的Smallville項(xiàng)目中得到進(jìn)一步開(kāi)拓。谷歌與斯坦福大學(xué)的研究者創(chuàng)建了一個(gè)虛擬小鎮(zhèn),在其中模擬了25個(gè)由大語(yǔ)言模型(LLM)、ChatGPT API及其他自定義代碼生成驅(qū)動(dòng)的擬人智能體[20]。這些智能體不僅具備獨(dú)立行為意識(shí),還能夠展示類人化的情緒反應(yīng)與社會(huì)交互,模擬了人類社會(huì)中常見(jiàn)的社交行為和日?;顒?dòng)。這種類人化交互不僅豐富了虛擬角色的表現(xiàn)空間,也讓人機(jī)交互變得更加生動(dòng)自然,為共創(chuàng)智能體服務(wù)于藝術(shù)創(chuàng)作提供了更大可能性[21]。
在此趨勢(shì)下,2023年12月的Humanoid Agents項(xiàng)目進(jìn)一步深化了智能體類人化交互的研究。該項(xiàng)目由華盛頓大學(xué)和香港大學(xué)的研究者主導(dǎo),設(shè)計(jì)了一個(gè)平臺(tái)以模擬具有人類需求、情緒和社會(huì)關(guān)系的智能體行為。相比此前的生成型智能體,Humanoid Agents系統(tǒng)引入了更貼近人類的System 1思維模型,基于心理學(xué)雙系統(tǒng)理論,為智能體設(shè)定了基本需求(饑餓、健康、能量等)、情緒(開(kāi)心、憤怒、悲傷等)及社會(huì)關(guān)系親密度。智能體不僅會(huì)按照計(jì)劃行動(dòng),還會(huì)基于內(nèi)部狀態(tài)(如情緒、需求滿足度)和外部社交關(guān)系即時(shí)調(diào)整行為。智能體通過(guò)這些因素動(dòng)態(tài)調(diào)節(jié)日?;顒?dòng)和對(duì)話內(nèi)容,使其行為更具真實(shí)性和自然性。
3 AI賦能的個(gè)性化交互與人機(jī)共創(chuàng)路徑
3.1 從再現(xiàn)到情感沉浸的智能體共創(chuàng)
隨著AI技術(shù)的持續(xù)進(jìn)步,智能體的共創(chuàng)能力逐漸超越了傳統(tǒng)的角色再現(xiàn),開(kāi)始進(jìn)入情感深度交互階段。虛擬角色已不僅是靜態(tài)的內(nèi)容呈現(xiàn)者,而是通過(guò)與觀眾實(shí)時(shí)交互,實(shí)現(xiàn)了更加沉浸式的藝術(shù)體驗(yàn)。智能體在情感表達(dá)與情境適應(yīng)方面的進(jìn)步,使虛擬角色能在直播和影視作品中自然地與觀眾產(chǎn)生共鳴。例如,虛擬角色可通過(guò)AIGC的加持,在直播中根據(jù)觀眾反饋實(shí)時(shí)調(diào)整表情和動(dòng)作,從而為觀眾營(yíng)造出接近真人表演的沉浸體驗(yàn)。這種情感驅(qū)動(dòng)的交互背后依賴于情境感知和情緒模擬技術(shù),通過(guò)情緒識(shí)別與強(qiáng)化學(xué)習(xí),智能體能識(shí)別觀眾情緒并做出即時(shí)響應(yīng),從而增強(qiáng)人機(jī)共創(chuàng)的交互深度。
此外,AI藝術(shù)的演進(jìn)為虛擬角色的創(chuàng)作帶來(lái)了新的可能性,尤其是在自主生成、多模態(tài)合成和情感交互等方面的技術(shù)創(chuàng)新。未來(lái),虛擬角色將在影視作品和舞臺(tái)表演中展現(xiàn)出更細(xì)膩的情感表現(xiàn)、更精準(zhǔn)的唇音同步,并具備個(gè)性化情境適應(yīng)能力。這些技術(shù)的結(jié)合拓展了虛擬角色的應(yīng)用領(lǐng)域,從藝術(shù)創(chuàng)作、教育培訓(xùn)到健康護(hù)理等各類社會(huì)場(chǎng)景,為用戶帶來(lái)沉浸式情感體驗(yàn)。
3.2 虛擬角色的身份與倫理
虛擬角色的高度擬真性也帶來(lái)了倫理和安全風(fēng)險(xiǎn)。虛擬角色是否應(yīng)被視為具有“真實(shí)”身份的存在?其行為是否具有自主性?這些問(wèn)題不僅涉及AI角色的社會(huì)地位,還關(guān)系到人類對(duì)虛擬角色的情感認(rèn)同[22]。高度擬人化的虛擬角色常引發(fā)觀眾的情感依賴,在一定程度上模糊了現(xiàn)實(shí)與虛擬的界限。這種情感連接在拓展文化表達(dá)的同時(shí),也帶來(lái)倫理挑戰(zhàn)。若未得到適當(dāng)監(jiān)管,高度仿真的虛擬角色可能會(huì)被濫用或誤導(dǎo),甚至引發(fā)隱私問(wèn)題。例如,虛擬角色的所有權(quán)與行為責(zé)任歸屬問(wèn)題,一旦其行為產(chǎn)生不良影響,責(zé)任是否應(yīng)歸于創(chuàng)作者、平臺(tái)或虛擬角色本身?此外,在新聞、教育等領(lǐng)域,虛擬角色的內(nèi)容需保持真實(shí)性,防止誤導(dǎo)。因此,未來(lái)的技術(shù)開(kāi)發(fā)需謹(jǐn)慎考慮數(shù)據(jù)安全和使用邊界,以平衡創(chuàng)新的自由度與安全性。AI開(kāi)發(fā)者與平臺(tái)需對(duì)此進(jìn)行深思,確保虛擬角色信息傳遞和行為表達(dá)的透明性,避免其被用于誤導(dǎo)或欺騙。
3.3 AI虛擬角色的多維文化表達(dá)
AI藝術(shù)的快速發(fā)展賦予虛擬角色更為多元的文化表達(dá)和社會(huì)意義,使其從單一的技術(shù)成果逐漸轉(zhuǎn)變?yōu)榫哂猩詈裎幕瘍r(jià)值的藝術(shù)形式。數(shù)字虛擬角色不僅是視覺(jué)和技術(shù)的產(chǎn)物,更是連接不同文化和觀眾的重要媒介。通過(guò)類人化的交互、情感沉浸和跨文化表達(dá),AI藝術(shù)正在塑造出更多新的虛擬角色,為藝術(shù)創(chuàng)作和社會(huì)交互帶來(lái)更多可能性。
虛擬角色有望超越語(yǔ)言、地域和文化的界限,將不同文化背景的觀眾連接在一起。文化傳播理論指出,文化符號(hào)的跨國(guó)傳播通常伴隨著本土化和再創(chuàng)造的過(guò)程。通過(guò)AI賦能,虛擬角色逐漸形成了跨文化傳播的文化符號(hào)。例如,日本虛擬歌手初音未來(lái)自2007年誕生以來(lái),借助用戶生成內(nèi)容(UGC)力量,通過(guò)粉絲創(chuàng)作的歌曲、插畫(huà)等在全球范圍內(nèi)傳播,成為一項(xiàng)代表性的跨文化符號(hào)[23]。這種虛擬角色不僅在不同文化市場(chǎng)中獲得追隨者,還扮演著“文化大使”的角色,促進(jìn)了文化的跨界傳播和認(rèn)同感。AI虛擬角色不再僅僅是技術(shù)產(chǎn)物,而逐漸成為具有社會(huì)價(jià)值和象征意義的文化現(xiàn)象。
跨文化傳播的有效性依賴于多語(yǔ)言表達(dá)和文化適應(yīng)性。虛擬角色通過(guò)多語(yǔ)言支持、語(yǔ)音合成和情感識(shí)別技術(shù),能實(shí)現(xiàn)跨文化的互動(dòng)與交流,AI驅(qū)動(dòng)的虛擬角色則恰好具有通過(guò)語(yǔ)言和文化的適配來(lái)實(shí)現(xiàn)這一目標(biāo)的優(yōu)勢(shì)。利用多語(yǔ)言轉(zhuǎn)換和情感表達(dá)功能,發(fā)揮文化溝通的橋梁作用,提升全球化傳播的影響力,促進(jìn)不同文化間的理解與交流。這種跨文化角色彰顯了AI虛擬角色作為文化“譯者”的身份,觀眾得以通過(guò)虛擬角色了解和體驗(yàn)不同的文化內(nèi)涵。
4 跨界融合與生成生態(tài):AI藝術(shù)的協(xié)同創(chuàng)新
4.1 多場(chǎng)景應(yīng)用中的跨界協(xié)同創(chuàng)新
AI藝術(shù)的跨界融合賦予其更為廣泛的應(yīng)用前景。通過(guò)與影視、音樂(lè)、游戲和教育等領(lǐng)域的緊密結(jié)合,AI生成內(nèi)容能融入不同社會(huì)場(chǎng)景,提供多樣化的用戶體驗(yàn)。例如,在影視行業(yè)中,虛擬角色的情感生成與交互能力有助于提升觀眾的沉浸感,虛擬角色甚至可以在影片中承擔(dān)主要角色,從而為影視創(chuàng)作提供更豐富的表現(xiàn)形式。在音樂(lè)領(lǐng)域,AI生成音樂(lè)已成為一種創(chuàng)新創(chuàng)作模式,能自動(dòng)根據(jù)歌詞生成旋律,創(chuàng)作出符合多種文化和風(fēng)格的音樂(lè)作品,為用戶帶來(lái)跨文化的音樂(lè)體驗(yàn)。
AI虛擬角色的跨界協(xié)同也會(huì)帶來(lái)顯著的應(yīng)用價(jià)值。在教育領(lǐng)域,虛擬教師和學(xué)習(xí)助手可根據(jù)學(xué)生的個(gè)性化需求提供即時(shí)反饋,幫助提升學(xué)習(xí)效果;商業(yè)中,虛擬角色和虛擬代言人逐漸成為品牌與消費(fèi)者交互的重要橋梁,虛擬代言人不僅具有高辨識(shí)度的形象,還通過(guò)情感化交互增強(qiáng)消費(fèi)者的品牌認(rèn)同感。這一跨界協(xié)同創(chuàng)新趨勢(shì)表明,虛擬角色已突破單一領(lǐng)域的應(yīng)用限制,逐步構(gòu)建起多行業(yè)協(xié)作的生成生態(tài),實(shí)現(xiàn)數(shù)據(jù)、技術(shù)與資源的互通,使藝術(shù)與技術(shù)的邊界愈加模糊。
4.2 面向未來(lái)的AI藝術(shù):在創(chuàng)新與倫理間尋求平衡
AI藝術(shù)的發(fā)展?jié)摿薮螅淇缃鐓f(xié)同與生成生態(tài)的形成展示了其在多領(lǐng)域的技術(shù)創(chuàng)新與多樣化表達(dá)。然而,面對(duì)技術(shù)潛力與倫理風(fēng)險(xiǎn),AI藝術(shù)的發(fā)展需要在創(chuàng)新與社會(huì)責(zé)任間取得平衡。在跨領(lǐng)域生成生態(tài)中,AI的應(yīng)用不可避免地涉及用戶數(shù)據(jù)的收集、分析與利用。因此,在推動(dòng)AI藝術(shù)創(chuàng)新的同時(shí),必須注重用戶數(shù)據(jù)與隱私的保護(hù),確保技術(shù)應(yīng)用的安全性與透明性。
未來(lái),AI藝術(shù)在推動(dòng)文化與藝術(shù)發(fā)展的過(guò)程中,需在真實(shí)性、透明性和安全性方面持續(xù)優(yōu)化。一方面,在內(nèi)容生成中,尤其是涉及敏感信息的應(yīng)用場(chǎng)景,必須采取嚴(yán)格的數(shù)據(jù)安全措施,保證用戶的隱私不受侵害。另一方面,生成生態(tài)的可持續(xù)發(fā)展依賴于技術(shù)與倫理的平衡交互,確保生成內(nèi)容符合社會(huì)價(jià)值導(dǎo)向,滿足用戶對(duì)內(nèi)容真實(shí)性和信任的期待。合理的技術(shù)應(yīng)用與嚴(yán)格的倫理規(guī)范將使AI驅(qū)動(dòng)的藝術(shù)創(chuàng)作成為社會(huì)創(chuàng)新的重要推動(dòng)力,極大豐富了人類的文化表達(dá)和生活體驗(yàn)。
5 總結(jié)與討論
虛擬角色從早期的簡(jiǎn)單仿真逐漸進(jìn)化為具備多模態(tài)交互能力的智能體,標(biāo)志著AI技術(shù)從“工具”向“共創(chuàng)者”角色的轉(zhuǎn)型。這一轉(zhuǎn)變賦予虛擬角色以藝術(shù)主體的獨(dú)立表達(dá)能力,使其不再僅是技術(shù)展示的載體,而成為文化共創(chuàng)的重要參與者。通過(guò)人機(jī)共創(chuàng)模式,虛擬角色開(kāi)辟了新的文化表達(dá)空間,豐富了虛擬藝術(shù)的表現(xiàn)形式,為當(dāng)代藝術(shù)帶來(lái)了從靜態(tài)生產(chǎn)到動(dòng)態(tài)交互的多維創(chuàng)新可能。隨著AI技術(shù)的愈發(fā)成熟,AI不再只是支持藝術(shù)家創(chuàng)作的工具,而是具備獨(dú)立生成和表達(dá)能力的創(chuàng)作力量。數(shù)字虛擬角色在文化內(nèi)容生成中的作用將逐漸從輔助工具轉(zhuǎn)變?yōu)榫哂心軇?dòng)性的主體。這一角色定位使AI生成內(nèi)容有望在影視、舞臺(tái)演出、品牌推廣和教育等多個(gè)領(lǐng)域展現(xiàn)出獨(dú)特的創(chuàng)作潛力,通過(guò)情感、個(gè)性化和交互定制,為觀眾提供深層次的沉浸體驗(yàn)和情感共鳴。
未來(lái),AI深度參與的虛擬藝術(shù)或?qū)⒊蔀槲幕a(chǎn)的核心推動(dòng)力,推動(dòng)虛擬角色與人類之間的共創(chuàng)模式進(jìn)一步成熟與多樣化。這一趨勢(shì)不僅提升了文化內(nèi)容的創(chuàng)作效率和表達(dá)力,也為人機(jī)協(xié)同的文化生產(chǎn)開(kāi)辟了廣闊的新空間。在AI的驅(qū)動(dòng)下,虛擬角色不僅具備類人化交互和情境適應(yīng)能力,還可通過(guò)情感表達(dá)和智能生成,使藝術(shù)表現(xiàn)更趨真實(shí)、自然。借助AI技術(shù)的多模態(tài)協(xié)同與跨界融合,文化生產(chǎn)走向以智能生成為核心的全新藝術(shù)生態(tài),提升文化創(chuàng)作的效率與創(chuàng)造力。
隨著AI技術(shù)的持續(xù)演進(jìn),其將持續(xù)在文化內(nèi)容生成中發(fā)揮關(guān)鍵作用,為人機(jī)共創(chuàng)開(kāi)辟新的可能性。未來(lái),技術(shù)與藝術(shù)相互共振的人機(jī)共創(chuàng)藝術(shù)將呈現(xiàn)出更加沉浸、交互和個(gè)性化的文化生產(chǎn)新圖景。虛擬數(shù)字藝術(shù)與現(xiàn)實(shí)生活深度融合,邁向人機(jī)協(xié)同的共創(chuàng)美學(xué),為文化藝術(shù)的未來(lái)注入新的活力。
參考文獻(xiàn)
(向下滑動(dòng)閱讀)
[1] 陸子惠. 數(shù)字表演與新型互動(dòng):互聯(lián)網(wǎng)藝術(shù)、虛擬現(xiàn)實(shí)與人工智能[J]. 戲劇藝術(shù), 2024(5): 11?19,6.
[2] Liu J. Virtual presence, real connections: Exploring the role of parasocial relationships in virtual idol fan community participation[J]. Global Media and China, 2023(12).
[3] Trattner C, Jannach D, Motta E, et al. Responsible media technology and AI: challenges and research directions[J]. AI and Ethics, 2022, 2(4): 585?594.
[4] Baltru?aitis T, Ahuja C, Morency L-P. Multimodal Machine Learning: A Survey and Taxonomy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, 41(2): 423?443.
[5] Li L. The influence of digital twins on the methods of film and television creation[J]. Computers and Electrical Engineering, 2022, 103: 108314.
[6] Rekik R, Wuhrer S, Hoyet L, et al. A Survey on Realistic Virtual Human Animations: Definitions, Features and Evaluations[J]. Computer Graphics Forum, 2024, 43(2): e15064.
[7] Wang J, Jia M, Yang X, et al. 3D Modeling in Virtual Simulation Technology[C]//Frontier Computing. Singapore:Springer Nature,2023: 788?795.
[8] Matthews J, Nairn A. Holographic ABBA: Examining Fan Responses to ABBA’s Virtual “Live” Concert[J]. Popular Music and Society, 2023, 46(3): 282?303.
[9] Kakkar P, Ragothaman H. The evolution of volumetric video: A survey of smart transcoding and compression approaches[J]. International Journal of Computer Graphics & Animation, 2024, 14(1/2/3/4): 01?11.
[10] 李天. AIGC介入影視藝術(shù)——從“生成”概念談起[J]. 電影新作, 2024(3): 20?27.
[11] Liu Y, Zhang K, Li Y, et al. Sora: A Review on Background, Technology,Limitations, and Opportunities of Large Vision Models[EB/OL].(2024?03?18)[2024?11?03].https://blog.csdn.net/qq_41200212/article/details/136811930.
[12] 高永杰. 智能轉(zhuǎn)描、算法映射與多模態(tài)創(chuàng)作——生成式AI重塑電影創(chuàng)作之思[J]. 當(dāng)代電影, 2024(12): 91?98.
[13] Chen Y, Wang Y, Yu T, et al. The Effect of AI on Animation Production Efficiency: An Empirical Investigation Through the Network Data Envelopment Analysis[J]. Electronics, 2024, 13(24): 5001.
[14] Daně?ek R, Chhatre K, Tripathi S, et al. Emotional Speech?Driven Animation with Content?Emotion Disentanglement[C]//SIGGRAPH Asia 2023 Conference Papers, 2023:1?3.
[15] 騰訊網(wǎng). 全球首個(gè)AI女團(tuán)首秀倒計(jì)時(shí) - Sorai.ai出道計(jì)劃獨(dú)家揭秘_騰訊新聞[EB/OL]. (2024?04?17)[2024?12?24]. https://news.qq.com/rain/a/undefined.
[16] 陳焱松, 周雯. 人工智能影像敘事的涌現(xiàn)化生成[J]. 當(dāng)代電影, 2024(5): 14?20.
[17] Nass C, Moon Y. Machines and mindlessness: Social responses to computers[J]. Journal of Social Issues, 2000, 56(1): 81?103.
[18] 吳宋若瑤, 沈寒暑, 陳銘威, 等. 情感驅(qū)動(dòng)的智能藝術(shù)研究綜述[J]. 包裝工程, 2024, 45(12): 1?12.
[19] Ham J, Li S, Looi J, et al. Virtual humans as social actors: Investigating user perceptions of virtual humans’ emotional expression on social media[J]. Computers in Human Behavior, 2024, 155: 108161.
[20] Park J S, O’Brien J, Cai C J, et al. Generative Agents: Interactive Simulacra of Human Behavior[C]//Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology. San Francisco CA USA:ACM,2023: 1?22.
[21] 楊揚(yáng). 身體、意識(shí)和自我認(rèn)識(shí)——AI技術(shù)與電影表演中的身體表現(xiàn)[J]. 當(dāng)代電影, 2024(12): 82?90.
[22] 李想. 具身人工智能的著作權(quán)主體思考[J]. 科技與法律(中英文), 2024(5): 90?99.
[23] Yin Y. Vocaloid in China: Cosmopolitan music, cultural expression, and multilayer identity[J]. Global Media and China, 2018, 3(1): 51?66.
【基金項(xiàng)目】國(guó)家社科基金藝術(shù)學(xué)重大項(xiàng)目“重大主題影視創(chuàng)作增強(qiáng)中華民族現(xiàn)代文明傳播力影響力研究”(24ZD06)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.