本期導讀
編者按
當前,媒體融合進程持續深化,視聽文化發展格局重構優化,高品質、智能化、沉浸式、多元化、融合化已成為影視技術發展的共性特征。智能經濟與智能社會是經濟與社會發展演進的基本趨勢和必然要求,伴隨大語言模型、多模態模型、深度學習、具身智能等現代智能科技的發展演進及廣泛應用,人類社會加快步入智能計算時代。適應媒體深度融合趨勢和智能計算時代特征,電影產業應積極融合應用新一代信息通信技術、現代智能科技和新興視聽技術,將全產業鏈信息化云化智能化升級作為戰略支撐,創新升級電影攝制手段和播映方式,大力推進電影科技自主創新和自立自強,為觀眾提供更具高品質、科技感和沉浸感的電影作品和觀影體驗,努力構建新型視聽文化業態和產業發展新賽道,推動電影全產業鏈全價值鏈提質優化升級。本期專欄特別刊登《智能計算時代深化電影科技創新和推進電影強國建設的思考與啟示》一文,立足進一步全面深化改革、推進中國式現代化國家戰略,提出了兼具思想高度、理論深度和創新思維的思考啟示與發展建議;同時遴選有意義人類控制與AI影視創作、基于人工智能的音樂生成、數字人技術與大模型的融合創新、基于色彩遷移的數字調色方法、基于AI的影視版權保護等技術論文,從行業技術整體發展升級、音視頻智能制作、模型生成和數字調色、安全與版權保護等角度論述了當前人工智能技術在電影行業的深度應用要點;另有縮微膠片技術、電影公益放映內容“中央廚房”等科技論文探討了傳統技術與新興技術的融合發展,歡迎廣大讀者予以關注。
——本期責編
專家點評
當前,我們正處于第三次技術革命浪潮中,人工智能應用前景日趨清晰,人工智能應用場景日益廣泛。特別是在電影文化領域,生成式人工智能更是具有大規模提高生產效率的潛能。在此背景下,中國電影科學技術研究所(中央宣傳部電影技術質量檢測所)總工程師劉達率團參加了人工智能領域國際頂級學術會議,并開展了技術調研和考察交流,在此基礎上撰寫完成《智能計算時代深化電影科技創新和推進電影強國建設的思考與啟示》一文。文章在簡明扼要介紹歐洲高新技術格式電影制作播映發展與應用最新成果的基礎上,針對電影產業、現代影院和沉浸式視聽技術的發展與應用,提出把電影級主動發光顯示技術和沉浸式視聽技術作為重要抓手,以有效提升影院視聽品質和觀影體驗。此外,適應智能計算時代發展特征和生成式人工智能演進趨勢,提出了電影行業要統籌推進模型自主研發與行業定制改造的技術思路,同時探討了電影行業在積極探索人工智能應用中強化人工智能安全治理和版權保護的方式。文中提出我國要加快構建完善以“文生電影”為核心的電影智能化創作生產技術體系,發展完善以現代智能科技為核心支撐的電影新質生產力,推進電影攝制播映向高品質沉浸式多元化升級,構建發展新型視聽文化業態,優化升級視聽文化服務,為新時代新征程推進我國電影科技創新升級和高水平自立自強提供了富有前瞻性、建設性和可實施性的思考啟示與發展建議。
——徐進
中央廣播電視總臺技術局局長
中國電影電視技術學會理事長
過去一年,生成式人工智能(Generative AI, GenAI)在音視頻領域的應用呈現井噴發展態勢,特別是今年2月Sora的發布,讓人們對GenAI的表現有了極大的信心。當影視人致力于將這一技術應用于專業制作領域時,卻發現還存在諸多問題,除了畫面細節少、連續性差、角色動作受限等,最大的問題是生成的內容可控性差。如何讓GenAI生成的結果能夠為創作者所控制,能夠聽從人的指揮,是GenAI技術必須要解決的問題。《有意義人類控制(MHC)在AI 影視創作中的探索與應用》通過總結團隊AI視頻生成的經驗,結合有意義人類控制(Meaningful Human Control, MHC)概念,對比了三種不同的自動化工具設計思路,選擇了人在回路中(Human?in?the?Loop, HITL)的設計模式來解決可控性問題,總結了目前AI影視創作中模型微調、提示詞生成、生成要素控制等幾種控制方法,并預期未來會采取多模態控制技術對模型進行精細控制。本文對當前熱點的GenAI可控性問題進行了理論分析,并在實踐基礎上提出了切實可行的解決方案,對于推動AI技術在影視行業進一步落地應用具有很高的參考價值。
——陳軍
研究員
北京電影學院影視技術系主任
近年來,人工智能生成內容(AIGC)技術迅猛發展,其主流模型框架以深度神經網絡為基礎,由早期的GAN、VAE向Transformer、Diffusion與DiT(Diffusion Transformer)發展演進。其中,大語言模型(LLM)文本生成技術日漸成熟,引領推動圖像與聲音生成技術的發展,并通過不斷增強可控性以滿足日益增長的個性化創作需求。音樂作為電影不可或缺的表達元素,順應AIGC技術的發展與應用,AI音樂生成正逐步成為電影配樂創作的革新力量,迄今已分化出符號生成與音頻生成兩種技術路線,但現有方法對音樂流派等控制條件關注不足,一定程度上影響了音樂生成質量和多樣性的提升。《基于多粒度注意力Transformer的電影音樂生成研究》一文以編碼后的流派信息作為條件輸入從零生成符號音樂,結合音樂重復周期的結構特點,采用多粒度注意力機制Transformer架構捕獲音樂結構和上下文信息,并引入流派分類判別器,輸出流派分類概率用于識別判斷,為音樂生成提供風格控制。本方法在流派控制效果、音樂質量結構等方面較同類方法有較大提升,但在實用性上仍有改進空間,有待進一步研究探索。
——王萃
正高級工程師
中國電影科學技術研究所(中央宣傳部電影技術質量檢測所)高新技術研究處副處長
本期目錄
專欄:全面深化電影科技自主創新
積極推進高水平科技自立自強
◎ 智能計算時代深化電影科技創新和推進電影強國建設的思考與啟示
—— 劉 達 王 萃 高 峰
馬鴻悅 張海悅 王 健
前沿技術
◎ 有意義人類控制(MHC)在AI影視創作中的探索與應用
——王 雷
研究與開發
◎ 基于多粒度注意力Transformer的電影音樂生成研究
——熊曉鈺 謝志峰 黃登云 朱永華
◎ 基于K近鄰色彩遷移算法的數字調色方法研究
—— 楊嵐彬 姚正安
視聽科技教研
◎ 數字人技術在電影與數字內容領域的創新應用
——劉笑微 肖婧瀾 宋 震
◎ 全球化視域下數字媒體技術賦能中國神話IP電影創作
—— 國天依 孫立軍
版權保護
◎ 基于AI的影視版權保護技術研究
——龐勝楠 李建亮 馬國棟
技術應用
◎ 電影公益放映內容“中央廚房”設計與實現
——李聿為
◎ 縮微膠片技術在電影文圖檔案保存中的應用綜述
——李 英 王 瑤
文章概要
智能計算時代深化電影科技創新和推進電影強國建設的思考與啟示
【摘要】 人類社會正加快步入智能計算時代,現代智能科技對電影產業的影響持續深化和不斷泛化,機器學習、深度學習、人工智能生成內容(AIGC)、大語言模型(LLM)、多模態模型等技術正在深刻影響和重構優化電影全產業鏈全價值鏈。伴隨電影科技創新進入攻堅期和深水區,電影產業發展面臨新形勢新要求,我們要深化電影科技自主創新,積極推進電影行業的智能化升級,推進生成式人工智能、人工智能大模型、沉浸式視聽等技術在我國電影行業的定制設計、自主研制與科學應用,有力支撐和服務社會主義電影強國建設。
有意義人類控制(MHC)在AI影視創作中的探索與應用
【摘要】 當前AI工具存在自動化程度過高、人類控制不足造成生成結果可控性差的問題,成為其應用于專業影視創作的主要壁壘。本文通過總結自主視頻生成流程“墨池”(Inkstone)設計與應用中的經驗,結合人工智能(AI)與自動化領域的有意義人類控制(Meaningful Human Control, MHC)概念,對比了三種不同的自動化工具設計思路,分析了基于MHC的AI影視創作流程和工具開發具體方式,以及目前加強人類控制的若干可行技術路徑。研究表明,加強AI訓練和生成過程中的MHC,有望在發揮AI工具優勢的前提下,對生成內容進行準確控制,從而使創作能夠體現藝術家意圖,適應專業影視創作需求。
基于多粒度注意力Transformer的電影音樂生成研究
【摘要】 電影音樂自動生成是當前人工智能領域的研究熱點之一,不少深度學習音樂生成算法可實現動聽的電影配樂生成,但這些算法在生成過程中往往忽略了流派等風格控制。針對這一情況,本文提出了一種基于多粒度注意力Transformer的電影音樂生成方法,可根據目標流派從零生成音樂。本方法在引入多粒度注意力Transformer建模音樂結構的基礎上,引入了對抗學習機制,通過具有流派分類損失和生成對抗損失的流派輔助分類判別器,加強模型對流派信息的控制。在所構建的包含流派信息的符號音樂數據集上進行的主客觀實驗表明,本文方法在生成音樂質量和流派控制方面均優于以往方法,有助于基于目標流派自動生成電影配樂。
基于K近鄰色彩遷移算法的數字調色方法研究
【摘要】 色彩是電影中必不可少的元素,其能給予觀眾視覺沖擊力,是凸顯人物性格特征、表達電影主題、營造電影氛圍、增強電影故事感的重要手段。在數字電影時代,圖像色彩遷移技術為數字電影調色提供了更為便捷的方法。本文提出一種基于 K 近鄰(K?Nearest Neighbor, KNN)回歸模型的圖像色彩遷移算法KNN?1,同時基于目標圖像的全局統計量特征與局部像素特征,提出了先采用該算法后采用經典Reinhard色彩遷移算法的KNN?2算法與先采用Reinhard算法再采用該算法的KNN?3算法。結果表明,基于K近鄰回歸模型的色彩遷移算法所得到結果圖顏色與目標圖像相似,但是整體顏色偏淺,亮度較亮。KNN?2、KNN?3算法得到的遷移結果圖的效果都較K 近鄰、Reinhard兩種算法單獨使用有明顯提升,遷移結果圖整體色彩基調與目標圖像更為相似。
數字人技術在電影與數字內容領域的創新應用
【摘要】 為探討數字人技術在電影、數字內容領域的創新應用,本文通過對數字人技術的發展及應用,利用涵蓋多學科領域技術的數字人技術以及人工智能(AI)為數字人創作提供的解決方案,提出未來數字人技術在電影產業及數字內容領域的發展方向。數字人技術將基于原有技術底座,逐步接軌人工智能賦能各細分技術領域,通過大量混合路徑嘗試和多方位技術實踐完成“數字”到“數智”的創新之旅。本文還對數字人與大模型的關系進行了深入研究,認為數字人的獨特性對大模型提出了創新性需求,未來數字人技術與大模型能力高度融合,將真正完成在虛擬世界實現復刻的終極目標。
全球化視域下數字媒體技術賦能中國神話IP電影創作
【摘要】 傳統文化IP創作是娛樂行業中的富礦與必爭之地。中國擁有悠久而深厚的燦爛文明,積累的數千年奇幻神話構成了我國特有的東方浪漫。運用數字媒體技術與設計思維結合中國優秀傳統文化進行創造性轉化,不僅對于樹立文化自信、提升中國文化軟實力意義重大,而且對于提升中國傳統文化和文化軟實力的認同度也將起到不可忽視的作用。本文將以中國神話IP作為切入點,重點闡述數字媒體及其相關衍生技術在助力中國神話IP視覺表現,論述中國傳統文化“活化”過程中技術賦能的主要特征及具體實施路徑,提出“道”“術”兼修,利用技術手段表達想象力和創造力,書寫具有東方魅力的“中國故事”。
基于AI的影視版權保護技術研究
【摘要】 隨著技術革新,影視版權保護正面臨前所未有的挑戰。盜版泛濫嚴重沖擊影視產業,影視侵權行為呈現多樣性、隱蔽性、跨境性等特征。本文基于對影視版權保護現狀的深入分析,探討AI技術在解決這些問題中的潛力和挑戰。通過引入AI技術,期望降低版權保護成本、提高版權交易透明度、加強版權保護效率和準確性。然而,AI技術的應用也面臨數據隱私保護、技術更新等挑戰。本文旨在為影視版權保護提供新的思路和方法,推動影視行業健康有序發展。
電影公益放映內容“中央廚房”設計與實現
【摘要】 隨著電影公益放映觀影人群對于電影內容需求的不斷增長,原有“庫房式”內容供給模式已不能滿足發展需要,亟待轉型升級為以“一次采集、多種應用”為核心技術特征的電影公益放映內容“中央廚房”式供給模式。本文從電影公益放映內容供給需求分析入手,詳細闡釋電影公益放映內容“中央廚房”的總體設計技術架構及其細分技術構成要素,著重分析了電影公益放映內容“中央廚房”構建過程中的能力集群架構設計、關鍵技術難點突破等核心要點環節,提出一套模組模塊化能力集群架構設計解決方案,經初步試用,該方案已可實現為觀影群眾提供智能匹配、快速制作、精準推送等定制化、廚房式的內容供給服務,充分發揮內容庫核心價值,為行業內相關單位媒體資源庫轉型升級提供參考與借鑒。
縮微膠片技術在電影文圖檔案保存中的應用綜述
【摘要】 本文旨在研究縮微膠片技術在電影文圖檔案保存中的應用現狀及面臨的挑戰,尤其關注人工智能在縮微技術中的應用方法。通過對縮微膠片技術的發展歷程、電影文圖檔案的保存需求以及縮微膠片三級保護體系實踐的梳理,對技術挑戰、管理和操作問題、政策和標準及未來發展等關鍵問題進行探討,提供面向未來的檔案保存策略和理念建議,以促進電影檔案保存的長期穩定性和安全性,為保護和傳承電影文化遺產提供科學和系統的支持,特別是利用AI優化縮微技術的應用,增強檔案智能檢索和分析能力。
文章全文詳見《現代電影技術》期刊
2024年第9期
主管單位:國家電影局
主辦單位:電影技術質量檢測所
標準國際刊號:ISSN 1673-3215
國內統一刊號:CN 11-5336/TB
投稿系統:ampt.crifst.ac.cn
官方網站:www.crifst.ac.cn
期刊發行:010-63245081
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.