本期導(dǎo)讀
編者按
當(dāng)前,媒體融合進(jìn)程持續(xù)深化,視聽文化發(fā)展格局重構(gòu)優(yōu)化,高品質(zhì)、智能化、沉浸式、多元化、融合化已成為影視技術(shù)發(fā)展的共性特征。智能經(jīng)濟(jì)與智能社會(huì)是經(jīng)濟(jì)與社會(huì)發(fā)展演進(jìn)的基本趨勢和必然要求,伴隨大語言模型、多模態(tài)模型、深度學(xué)習(xí)、具身智能等現(xiàn)代智能科技的發(fā)展演進(jìn)及廣泛應(yīng)用,人類社會(huì)加快步入智能計(jì)算時(shí)代。適應(yīng)媒體深度融合趨勢和智能計(jì)算時(shí)代特征,電影產(chǎn)業(yè)應(yīng)積極融合應(yīng)用新一代信息通信技術(shù)、現(xiàn)代智能科技和新興視聽技術(shù),將全產(chǎn)業(yè)鏈信息化云化智能化升級作為戰(zhàn)略支撐,創(chuàng)新升級電影攝制手段和播映方式,大力推進(jìn)電影科技自主創(chuàng)新和自立自強(qiáng),為觀眾提供更具高品質(zhì)、科技感和沉浸感的電影作品和觀影體驗(yàn),努力構(gòu)建新型視聽文化業(yè)態(tài)和產(chǎn)業(yè)發(fā)展新賽道,推動(dòng)電影全產(chǎn)業(yè)鏈全價(jià)值鏈提質(zhì)優(yōu)化升級。本期專欄特別刊登《智能計(jì)算時(shí)代深化電影科技創(chuàng)新和推進(jìn)電影強(qiáng)國建設(shè)的思考與啟示》一文,立足進(jìn)一步全面深化改革、推進(jìn)中國式現(xiàn)代化國家戰(zhàn)略,提出了兼具思想高度、理論深度和創(chuàng)新思維的思考啟示與發(fā)展建議;同時(shí)遴選有意義人類控制與AI影視創(chuàng)作、基于人工智能的音樂生成、數(shù)字人技術(shù)與大模型的融合創(chuàng)新、基于色彩遷移的數(shù)字調(diào)色方法、基于AI的影視版權(quán)保護(hù)等技術(shù)論文,從行業(yè)技術(shù)整體發(fā)展升級、音視頻智能制作、模型生成和數(shù)字調(diào)色、安全與版權(quán)保護(hù)等角度論述了當(dāng)前人工智能技術(shù)在電影行業(yè)的深度應(yīng)用要點(diǎn);另有縮微膠片技術(shù)、電影公益放映內(nèi)容“中央廚房”等科技論文探討了傳統(tǒng)技術(shù)與新興技術(shù)的融合發(fā)展,歡迎廣大讀者予以關(guān)注。
——本期責(zé)編
專家點(diǎn)評
當(dāng)前,我們正處于第三次技術(shù)革命浪潮中,人工智能應(yīng)用前景日趨清晰,人工智能應(yīng)用場景日益廣泛。特別是在電影文化領(lǐng)域,生成式人工智能更是具有大規(guī)模提高生產(chǎn)效率的潛能。在此背景下,中國電影科學(xué)技術(shù)研究所(中央宣傳部電影技術(shù)質(zhì)量檢測所)總工程師劉達(dá)率團(tuán)參加了人工智能領(lǐng)域國際頂級學(xué)術(shù)會(huì)議,并開展了技術(shù)調(diào)研和考察交流,在此基礎(chǔ)上撰寫完成《智能計(jì)算時(shí)代深化電影科技創(chuàng)新和推進(jìn)電影強(qiáng)國建設(shè)的思考與啟示》一文。文章在簡明扼要介紹歐洲高新技術(shù)格式電影制作播映發(fā)展與應(yīng)用最新成果的基礎(chǔ)上,針對電影產(chǎn)業(yè)、現(xiàn)代影院和沉浸式視聽技術(shù)的發(fā)展與應(yīng)用,提出把電影級主動(dòng)發(fā)光顯示技術(shù)和沉浸式視聽技術(shù)作為重要抓手,以有效提升影院視聽品質(zhì)和觀影體驗(yàn)。此外,適應(yīng)智能計(jì)算時(shí)代發(fā)展特征和生成式人工智能演進(jìn)趨勢,提出了電影行業(yè)要統(tǒng)籌推進(jìn)模型自主研發(fā)與行業(yè)定制改造的技術(shù)思路,同時(shí)探討了電影行業(yè)在積極探索人工智能應(yīng)用中強(qiáng)化人工智能安全治理和版權(quán)保護(hù)的方式。文中提出我國要加快構(gòu)建完善以“文生電影”為核心的電影智能化創(chuàng)作生產(chǎn)技術(shù)體系,發(fā)展完善以現(xiàn)代智能科技為核心支撐的電影新質(zhì)生產(chǎn)力,推進(jìn)電影攝制播映向高品質(zhì)沉浸式多元化升級,構(gòu)建發(fā)展新型視聽文化業(yè)態(tài),優(yōu)化升級視聽文化服務(wù),為新時(shí)代新征程推進(jìn)我國電影科技創(chuàng)新升級和高水平自立自強(qiáng)提供了富有前瞻性、建設(shè)性和可實(shí)施性的思考啟示與發(fā)展建議。
——徐進(jìn)
中央廣播電視總臺技術(shù)局局長
中國電影電視技術(shù)學(xué)會(huì)理事長
過去一年,生成式人工智能(Generative AI, GenAI)在音視頻領(lǐng)域的應(yīng)用呈現(xiàn)井噴發(fā)展態(tài)勢,特別是今年2月Sora的發(fā)布,讓人們對GenAI的表現(xiàn)有了極大的信心。當(dāng)影視人致力于將這一技術(shù)應(yīng)用于專業(yè)制作領(lǐng)域時(shí),卻發(fā)現(xiàn)還存在諸多問題,除了畫面細(xì)節(jié)少、連續(xù)性差、角色動(dòng)作受限等,最大的問題是生成的內(nèi)容可控性差。如何讓GenAI生成的結(jié)果能夠?yàn)閯?chuàng)作者所控制,能夠聽從人的指揮,是GenAI技術(shù)必須要解決的問題。《有意義人類控制(MHC)在AI 影視創(chuàng)作中的探索與應(yīng)用》通過總結(jié)團(tuán)隊(duì)AI視頻生成的經(jīng)驗(yàn),結(jié)合有意義人類控制(Meaningful Human Control, MHC)概念,對比了三種不同的自動(dòng)化工具設(shè)計(jì)思路,選擇了人在回路中(Human?in?the?Loop, HITL)的設(shè)計(jì)模式來解決可控性問題,總結(jié)了目前AI影視創(chuàng)作中模型微調(diào)、提示詞生成、生成要素控制等幾種控制方法,并預(yù)期未來會(huì)采取多模態(tài)控制技術(shù)對模型進(jìn)行精細(xì)控制。本文對當(dāng)前熱點(diǎn)的GenAI可控性問題進(jìn)行了理論分析,并在實(shí)踐基礎(chǔ)上提出了切實(shí)可行的解決方案,對于推動(dòng)AI技術(shù)在影視行業(yè)進(jìn)一步落地應(yīng)用具有很高的參考價(jià)值。
——陳軍
研究員
北京電影學(xué)院影視技術(shù)系主任
近年來,人工智能生成內(nèi)容(AIGC)技術(shù)迅猛發(fā)展,其主流模型框架以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),由早期的GAN、VAE向Transformer、Diffusion與DiT(Diffusion Transformer)發(fā)展演進(jìn)。其中,大語言模型(LLM)文本生成技術(shù)日漸成熟,引領(lǐng)推動(dòng)圖像與聲音生成技術(shù)的發(fā)展,并通過不斷增強(qiáng)可控性以滿足日益增長的個(gè)性化創(chuàng)作需求。音樂作為電影不可或缺的表達(dá)元素,順應(yīng)AIGC技術(shù)的發(fā)展與應(yīng)用,AI音樂生成正逐步成為電影配樂創(chuàng)作的革新力量,迄今已分化出符號生成與音頻生成兩種技術(shù)路線,但現(xiàn)有方法對音樂流派等控制條件關(guān)注不足,一定程度上影響了音樂生成質(zhì)量和多樣性的提升。《基于多粒度注意力Transformer的電影音樂生成研究》一文以編碼后的流派信息作為條件輸入從零生成符號音樂,結(jié)合音樂重復(fù)周期的結(jié)構(gòu)特點(diǎn),采用多粒度注意力機(jī)制Transformer架構(gòu)捕獲音樂結(jié)構(gòu)和上下文信息,并引入流派分類判別器,輸出流派分類概率用于識別判斷,為音樂生成提供風(fēng)格控制。本方法在流派控制效果、音樂質(zhì)量結(jié)構(gòu)等方面較同類方法有較大提升,但在實(shí)用性上仍有改進(jìn)空間,有待進(jìn)一步研究探索。
——王萃
正高級工程師
中國電影科學(xué)技術(shù)研究所(中央宣傳部電影技術(shù)質(zhì)量檢測所)高新技術(shù)研究處副處長
本期目錄
專欄:全面深化電影科技自主創(chuàng)新
積極推進(jìn)高水平科技自立自強(qiáng)
◎ 智能計(jì)算時(shí)代深化電影科技創(chuàng)新和推進(jìn)電影強(qiáng)國建設(shè)的思考與啟示
—— 劉 達(dá) 王 萃 高 峰
馬鴻悅 張海悅 王 健
前沿技術(shù)
◎ 有意義人類控制(MHC)在AI影視創(chuàng)作中的探索與應(yīng)用
——王 雷
研究與開發(fā)
◎ 基于多粒度注意力Transformer的電影音樂生成研究
——熊曉鈺 謝志峰 黃登云 朱永華
◎ 基于K近鄰色彩遷移算法的數(shù)字調(diào)色方法研究
—— 楊嵐彬 姚正安
視聽科技教研
◎ 數(shù)字人技術(shù)在電影與數(shù)字內(nèi)容領(lǐng)域的創(chuàng)新應(yīng)用
——?jiǎng)⑿ξⅰ⌒ゆ簽憽∷巍≌?/p>
◎ 全球化視域下數(shù)字媒體技術(shù)賦能中國神話IP電影創(chuàng)作
—— 國天依 孫立軍
版權(quán)保護(hù)
◎ 基于AI的影視版權(quán)保護(hù)技術(shù)研究
——龐勝楠 李建亮 馬國棟
技術(shù)應(yīng)用
◎ 電影公益放映內(nèi)容“中央廚房”設(shè)計(jì)與實(shí)現(xiàn)
——李聿為
◎ 縮微膠片技術(shù)在電影文圖檔案保存中的應(yīng)用綜述
——李 英 王 瑤
文章概要
智能計(jì)算時(shí)代深化電影科技創(chuàng)新和推進(jìn)電影強(qiáng)國建設(shè)的思考與啟示
【摘要】 人類社會(huì)正加快步入智能計(jì)算時(shí)代,現(xiàn)代智能科技對電影產(chǎn)業(yè)的影響持續(xù)深化和不斷泛化,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、人工智能生成內(nèi)容(AIGC)、大語言模型(LLM)、多模態(tài)模型等技術(shù)正在深刻影響和重構(gòu)優(yōu)化電影全產(chǎn)業(yè)鏈全價(jià)值鏈。伴隨電影科技創(chuàng)新進(jìn)入攻堅(jiān)期和深水區(qū),電影產(chǎn)業(yè)發(fā)展面臨新形勢新要求,我們要深化電影科技自主創(chuàng)新,積極推進(jìn)電影行業(yè)的智能化升級,推進(jìn)生成式人工智能、人工智能大模型、沉浸式視聽等技術(shù)在我國電影行業(yè)的定制設(shè)計(jì)、自主研制與科學(xué)應(yīng)用,有力支撐和服務(wù)社會(huì)主義電影強(qiáng)國建設(shè)。
有意義人類控制(MHC)在AI影視創(chuàng)作中的探索與應(yīng)用
【摘要】 當(dāng)前AI工具存在自動(dòng)化程度過高、人類控制不足造成生成結(jié)果可控性差的問題,成為其應(yīng)用于專業(yè)影視創(chuàng)作的主要壁壘。本文通過總結(jié)自主視頻生成流程“墨池”(Inkstone)設(shè)計(jì)與應(yīng)用中的經(jīng)驗(yàn),結(jié)合人工智能(AI)與自動(dòng)化領(lǐng)域的有意義人類控制(Meaningful Human Control, MHC)概念,對比了三種不同的自動(dòng)化工具設(shè)計(jì)思路,分析了基于MHC的AI影視創(chuàng)作流程和工具開發(fā)具體方式,以及目前加強(qiáng)人類控制的若干可行技術(shù)路徑。研究表明,加強(qiáng)AI訓(xùn)練和生成過程中的MHC,有望在發(fā)揮AI工具優(yōu)勢的前提下,對生成內(nèi)容進(jìn)行準(zhǔn)確控制,從而使創(chuàng)作能夠體現(xiàn)藝術(shù)家意圖,適應(yīng)專業(yè)影視創(chuàng)作需求。
基于多粒度注意力Transformer的電影音樂生成研究
【摘要】 電影音樂自動(dòng)生成是當(dāng)前人工智能領(lǐng)域的研究熱點(diǎn)之一,不少深度學(xué)習(xí)音樂生成算法可實(shí)現(xiàn)動(dòng)聽的電影配樂生成,但這些算法在生成過程中往往忽略了流派等風(fēng)格控制。針對這一情況,本文提出了一種基于多粒度注意力Transformer的電影音樂生成方法,可根據(jù)目標(biāo)流派從零生成音樂。本方法在引入多粒度注意力Transformer建模音樂結(jié)構(gòu)的基礎(chǔ)上,引入了對抗學(xué)習(xí)機(jī)制,通過具有流派分類損失和生成對抗損失的流派輔助分類判別器,加強(qiáng)模型對流派信息的控制。在所構(gòu)建的包含流派信息的符號音樂數(shù)據(jù)集上進(jìn)行的主客觀實(shí)驗(yàn)表明,本文方法在生成音樂質(zhì)量和流派控制方面均優(yōu)于以往方法,有助于基于目標(biāo)流派自動(dòng)生成電影配樂。
基于K近鄰色彩遷移算法的數(shù)字調(diào)色方法研究
【摘要】 色彩是電影中必不可少的元素,其能給予觀眾視覺沖擊力,是凸顯人物性格特征、表達(dá)電影主題、營造電影氛圍、增強(qiáng)電影故事感的重要手段。在數(shù)字電影時(shí)代,圖像色彩遷移技術(shù)為數(shù)字電影調(diào)色提供了更為便捷的方法。本文提出一種基于 K 近鄰(K?Nearest Neighbor, KNN)回歸模型的圖像色彩遷移算法KNN?1,同時(shí)基于目標(biāo)圖像的全局統(tǒng)計(jì)量特征與局部像素特征,提出了先采用該算法后采用經(jīng)典Reinhard色彩遷移算法的KNN?2算法與先采用Reinhard算法再采用該算法的KNN?3算法。結(jié)果表明,基于K近鄰回歸模型的色彩遷移算法所得到結(jié)果圖顏色與目標(biāo)圖像相似,但是整體顏色偏淺,亮度較亮。KNN?2、KNN?3算法得到的遷移結(jié)果圖的效果都較K 近鄰、Reinhard兩種算法單獨(dú)使用有明顯提升,遷移結(jié)果圖整體色彩基調(diào)與目標(biāo)圖像更為相似。
數(shù)字人技術(shù)在電影與數(shù)字內(nèi)容領(lǐng)域的創(chuàng)新應(yīng)用
【摘要】 為探討數(shù)字人技術(shù)在電影、數(shù)字內(nèi)容領(lǐng)域的創(chuàng)新應(yīng)用,本文通過對數(shù)字人技術(shù)的發(fā)展及應(yīng)用,利用涵蓋多學(xué)科領(lǐng)域技術(shù)的數(shù)字人技術(shù)以及人工智能(AI)為數(shù)字人創(chuàng)作提供的解決方案,提出未來數(shù)字人技術(shù)在電影產(chǎn)業(yè)及數(shù)字內(nèi)容領(lǐng)域的發(fā)展方向。數(shù)字人技術(shù)將基于原有技術(shù)底座,逐步接軌人工智能賦能各細(xì)分技術(shù)領(lǐng)域,通過大量混合路徑嘗試和多方位技術(shù)實(shí)踐完成“數(shù)字”到“數(shù)智”的創(chuàng)新之旅。本文還對數(shù)字人與大模型的關(guān)系進(jìn)行了深入研究,認(rèn)為數(shù)字人的獨(dú)特性對大模型提出了創(chuàng)新性需求,未來數(shù)字人技術(shù)與大模型能力高度融合,將真正完成在虛擬世界實(shí)現(xiàn)復(fù)刻的終極目標(biāo)。
全球化視域下數(shù)字媒體技術(shù)賦能中國神話IP電影創(chuàng)作
【摘要】 傳統(tǒng)文化IP創(chuàng)作是娛樂行業(yè)中的富礦與必爭之地。中國擁有悠久而深厚的燦爛文明,積累的數(shù)千年奇幻神話構(gòu)成了我國特有的東方浪漫。運(yùn)用數(shù)字媒體技術(shù)與設(shè)計(jì)思維結(jié)合中國優(yōu)秀傳統(tǒng)文化進(jìn)行創(chuàng)造性轉(zhuǎn)化,不僅對于樹立文化自信、提升中國文化軟實(shí)力意義重大,而且對于提升中國傳統(tǒng)文化和文化軟實(shí)力的認(rèn)同度也將起到不可忽視的作用。本文將以中國神話IP作為切入點(diǎn),重點(diǎn)闡述數(shù)字媒體及其相關(guān)衍生技術(shù)在助力中國神話IP視覺表現(xiàn),論述中國傳統(tǒng)文化“活化”過程中技術(shù)賦能的主要特征及具體實(shí)施路徑,提出“道”“術(shù)”兼修,利用技術(shù)手段表達(dá)想象力和創(chuàng)造力,書寫具有東方魅力的“中國故事”。
基于AI的影視版權(quán)保護(hù)技術(shù)研究
【摘要】 隨著技術(shù)革新,影視版權(quán)保護(hù)正面臨前所未有的挑戰(zhàn)。盜版泛濫嚴(yán)重沖擊影視產(chǎn)業(yè),影視侵權(quán)行為呈現(xiàn)多樣性、隱蔽性、跨境性等特征。本文基于對影視版權(quán)保護(hù)現(xiàn)狀的深入分析,探討AI技術(shù)在解決這些問題中的潛力和挑戰(zhàn)。通過引入AI技術(shù),期望降低版權(quán)保護(hù)成本、提高版權(quán)交易透明度、加強(qiáng)版權(quán)保護(hù)效率和準(zhǔn)確性。然而,AI技術(shù)的應(yīng)用也面臨數(shù)據(jù)隱私保護(hù)、技術(shù)更新等挑戰(zhàn)。本文旨在為影視版權(quán)保護(hù)提供新的思路和方法,推動(dòng)影視行業(yè)健康有序發(fā)展。
電影公益放映內(nèi)容“中央廚房”設(shè)計(jì)與實(shí)現(xiàn)
【摘要】 隨著電影公益放映觀影人群對于電影內(nèi)容需求的不斷增長,原有“庫房式”內(nèi)容供給模式已不能滿足發(fā)展需要,亟待轉(zhuǎn)型升級為以“一次采集、多種應(yīng)用”為核心技術(shù)特征的電影公益放映內(nèi)容“中央廚房”式供給模式。本文從電影公益放映內(nèi)容供給需求分析入手,詳細(xì)闡釋電影公益放映內(nèi)容“中央廚房”的總體設(shè)計(jì)技術(shù)架構(gòu)及其細(xì)分技術(shù)構(gòu)成要素,著重分析了電影公益放映內(nèi)容“中央廚房”構(gòu)建過程中的能力集群架構(gòu)設(shè)計(jì)、關(guān)鍵技術(shù)難點(diǎn)突破等核心要點(diǎn)環(huán)節(jié),提出一套模組模塊化能力集群架構(gòu)設(shè)計(jì)解決方案,經(jīng)初步試用,該方案已可實(shí)現(xiàn)為觀影群眾提供智能匹配、快速制作、精準(zhǔn)推送等定制化、廚房式的內(nèi)容供給服務(wù),充分發(fā)揮內(nèi)容庫核心價(jià)值,為行業(yè)內(nèi)相關(guān)單位媒體資源庫轉(zhuǎn)型升級提供參考與借鑒。
縮微膠片技術(shù)在電影文圖檔案保存中的應(yīng)用綜述
【摘要】 本文旨在研究縮微膠片技術(shù)在電影文圖檔案保存中的應(yīng)用現(xiàn)狀及面臨的挑戰(zhàn),尤其關(guān)注人工智能在縮微技術(shù)中的應(yīng)用方法。通過對縮微膠片技術(shù)的發(fā)展歷程、電影文圖檔案的保存需求以及縮微膠片三級保護(hù)體系實(shí)踐的梳理,對技術(shù)挑戰(zhàn)、管理和操作問題、政策和標(biāo)準(zhǔn)及未來發(fā)展等關(guān)鍵問題進(jìn)行探討,提供面向未來的檔案保存策略和理念建議,以促進(jìn)電影檔案保存的長期穩(wěn)定性和安全性,為保護(hù)和傳承電影文化遺產(chǎn)提供科學(xué)和系統(tǒng)的支持,特別是利用AI優(yōu)化縮微技術(shù)的應(yīng)用,增強(qiáng)檔案智能檢索和分析能力。
文章全文詳見《現(xiàn)代電影技術(shù)》期刊
2024年第9期
主管單位:國家電影局
主辦單位:電影技術(shù)質(zhì)量檢測所
標(biāo)準(zhǔn)國際刊號:ISSN 1673-3215
國內(nèi)統(tǒng)一刊號:CN 11-5336/TB
投稿系統(tǒng):ampt.crifst.ac.cn
官方網(wǎng)站:www.crifst.ac.cn
期刊發(fā)行:010-63245081
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.