作者:王思超
“畫皮”是形,“畫神”是意。AIGC(人工智能生成內容)的發展,從對表象的模仿開始,如今已邁向對人類意圖、邏輯與情感的深度表達,這是一場從“畫皮”到“畫神”的蛻變。從“商兔奔月”到“商兔藝龍”的項目歷程,是這一變革的縮影。在這個故事中,主人公“桑朶”不僅擁有精致的視覺形象,更承載了智能生成的敘事邏輯與文化意蘊,成為AIGC“畫神”的鮮活案例。
畫皮:圖像生成的藝術起步
回溯人工智能圖像生成的歷程,“畫皮”是它的第一個目標。以 GAN(生成對抗網絡)為代表的技術,通過對大量圖像數據的訓練,生成逼真而美麗的視覺內容。從 StyleGAN 的高保真肖像,到 DALL-E、Midjourny 根據文字提示生成多樣化的畫面,AIGC 讓機器學會了“畫皮”之術。
在一年前的“商兔奔月”項目中,我們驚喜地發現角色“桑朶”的形象通過 AIGC 技術得以栩栩如生。然而,驚喜之后我們便覺得AI無法取代人類,因為我們并沒有辦法控制AI完全限定好“桑朶”的形象,這些圖像生成的美感僅限于表象——他可以是任何兔子,但成為不了獨一無二的“桑朶”。
這一階段的瓶頸顯而易見:雖然技術可以復刻形態,卻難以捕捉形態背后的情感與意圖。這種“形有余而神不足”的局限,正是人工智能向更高層次進化的動力。
畫神:語義大模型開啟的新紀元
“傳神者,形不盡而意在焉。”古人對藝術的期望,在人工智能中得到了新的注解。當語義大模型(如ChatGPT)出現后,人工智能從“會畫”邁向了“會思”。這種躍遷不僅讓機器具備了語言的理解能力,也為圖像生成賦予了靈魂。
在“商兔藝龍”中,語義大模型為“桑朶”注入了“神”。我們將每一集的劇本傳遞給ChatGPT,讓其先理解整個故事背景以及影片結構,從而建構出“桑朶”的基本特征,生成諸多樣本后,經過我們的挑選,確定出“桑朶”的大致形象:“一只來自商周時期的兔子,圓圓的腦袋,身穿漢服,兩個耳朵可以耷拉或豎起來。”得益于ChatGPT-4o強大的文本分析能力以及聯動生態,我們無需特地“煉制”Lora即可維持“桑朶”的形象。并且隨著對每一集劇本的疊加理解,“桑朶”逐漸擁有了清晰的行為動機和鮮明的個性,她的每一句話、每一個行為,都是語義大模型對故事邏輯的精準推演。我們讓“桑朶”在不同時刻展現不同情感:穿越時空的驚訝、面對未知的好奇、追求夢想的堅定。這些情感與故事情節相輔相成,使他從一個形象躍升為一個“有神”的角色。
聲音:畫神的另一維度
除了圖像和邏輯的“神”,聲音大模型在“商兔藝龍”項目中扮演了同樣重要的角色。語音不僅是角色的表達方式,更是其情感與文化的傳遞者。通過聲音大模型,我們將項目組成員的聲音模型進行融合,形成了專屬于“桑朶”的音色。“桑朶”不僅能夠說話,還能根據情境調動情感的高低起伏,進一步強化其“神”的表達。
“畫皮”是技藝,“畫神”是智慧。從圖像生成到語義建模,再到聲音的調動,人工智能正逐步邁向智性表達的全新階段。“商兔”系列項目是這一歷程的縮影,它證明了智能不僅可以創造形象,還可以塑造靈魂。未來,人工智能的目標不僅是“畫皮”更精細,而是“畫神”更動人。在這一進程中,人類與機器將共同探尋創造的邊界,用技術與文化續寫智慧的篇章。
第七集:景行
“商兔藝龍—中華優秀高古文化的新譯與再造”項目包含展覽、視頻、文創等內容,承接商兔奔月。
系列短片將通過講述兔子桑朵“種龍”故事,結合AIGC技術,以中華文明不同時代的“龍”為線索,回溯中華文明中璀璨的文化珍寶。
視頻截圖
視頻截圖
視頻截圖
視頻截圖
視頻截圖
藝術總監:李小山
總策劃:林書傳 徐軒露
創意:湯淳
策劃團隊:高雅、王子皓、沈寧、劉婷、張迅、曾密、王韻、唐玲、倪清蓉
制作團隊:劉昭漫、王思超、楊思琪、安雨辰
項目助理:沈俊杰、羅俊豪、丁鑫、葛欣慧
主辦單位:南京藝術學院美術館
支持單位:南藝傳媒學院漫畫專業、南藝高職21級動畫方向
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.