作者| 吳玖玖
編輯| 李尋歡
全球AI文生影像技術,再次迎來爆發式迭代。
OpenAI推出的GPT-4o,正以“吉卜力風格的照片”生成能力席卷全網,在全球范圍內掀起創作熱潮。從《泰坦尼克號》的經典鏡頭,到《讓子彈飛》的“敢殺我的馬”,從周潤發的美元點煙,到張敏的回眸一笑,沒有什么照片是不能吉卜力化的。
在這場技術浪潮中,中國AI生態圈并未缺席,甚至在吉卜力化這件事上,比OpenAI還要早。比如去年《你想活出怎樣的人生》大爆時,宮崎駿濾鏡就在抖音相當火爆。
從短視頻平臺的千萬級用戶培育,到微短劇的工業化生產,本土企業以“場景驅動”為核心,走出了一條差異化發展路徑。快手、字節、阿里云等頭部玩家通過深耕電商、影視、游戲等垂直領域,不僅縮短了與國際頂尖技術的代差,更讓AI從實驗室工具升級為產業變革的核心引擎。
隨著OpenAI Sora模型拉高文生視頻的技術門檻,國內頭部企業選擇“兩條腿走路”:一方面,通過算法優化逼近國際頂尖水平;另一方面,深耕本土化需求,技術的差異化價值逐漸顯現,商業化成果成為最佳注腳。
站在千億級市場的門檻上,中國文生影像生態正面臨新挑戰。狂飆突進的技術仍需回答關鍵問題:當算法能精準復刻藝術風格,如何在效率與原創性間找到平衡?當AI生成內容滲透至影視工業,傳統人力智慧的價值將如何重構?
GPT-4o變“祺貴人告發”為動畫名場面,技術平權還是版權暗戰?
近日,有網友借助OpenAI最新推出的GPT-4o多模態模型,將經典宮斗劇《甄嬛傳》進行“吉卜力風格”轉換,生成的動畫版視頻上線后,讓網友大呼“人類對《甄嬛傳》的開發進度不足1%”。
人物方面,GPT-4o 對甄嬛、皇后、葉瀾依等角色進行了細膩的風格化處理,在保留原特征的同時,放大了二次元審美元素——面部輪廓更柔和、眼睛更大且更具神采。
例如在“吉卜力版祺貴人告贏沒”視頻中,當動畫版的祺貴人做出那個經典的發誓動作告發甄嬛時,觀眾既能瞬間識別出原劇情節,又能享受到風格轉換帶來的新鮮視覺體驗。
在場景渲染上,AI 的調整更為顯著:原本肅穆的宮殿被賦予童話般的夢幻感,屋頂線條更流暢,色彩飽和度提升卻不刺眼,輔以雕欄畫棟、繁花、蝴蝶等細節,使整個畫面宛如直接從吉卜力工作室的動畫中截取而來。
在相關視頻評論區,"求AI做番外"的呼聲此起彼伏,甚至有網友腦洞大開地設想"甄嬛和安陵容騎著掃帚飛"的奇幻劇情。
《瘋狂的麥克斯》《西游記》《讓子彈飛》等經典影視作品也紛紛被網友用AI"吉卜力化",其中《泰坦尼克號》杰克與露絲在船頭相擁等經典鏡頭都獲得了數十萬的播放量,被網友戲稱為“GPT-4o殺死比賽”。
這場創作熱潮已從單純的影視改編擴展至全領域內容創作:從網紅表情包到名人惡搞,從經典名場面到普通用戶的生活照,全網都充斥著吉卜力風格的AI作品。
OpenAI首席執行官Sam Altman也親自下場參與,不僅將自己的社交賬號頭像更換為吉卜力風格的AI圖像,還在X發文分享使用體驗。
GPT-4o的圖片生成功能展現出了強大的性能,用戶只需在提示詞中包含“吉卜力”或其英文“ghibli”,該模型便能精準理解需求,生成唯美而富有故事感的畫面。
它不僅能精準還原吉卜力的色彩與筆觸,最多還能處理10-20個不同對象,且元素布局合理,連倒影效果都能呈現。如今,由于訪問量過大,OpenAI不得不對生圖速率進行限制,目前免費用戶每天可生成3次圖片。
GPT-4o掀起的"吉卜力熱"現象,推動了“視覺表達權”的普惠化——AI技術正重塑數字時代的創作邊界。通過算法對藝術風格的精準解構與再創造,普通用戶得以跨越專業門檻,以前所未有的自由度實現個性化視覺敘事,本質上是技術對創作主體性的再分配。
GPT-4o圖像生成功能推出的同時,也帶來了版權爭議。
因為該模型能夠“精準還原”吉卜力工作室的獨特風格,這引發了關于OpenAI是否在未經許可的情況下使用吉卜力作品進行訓練的質疑。目前,利用版權作品訓練AI模型是否屬于合理使用,以及從網絡爬取內容用于數據庫是否構成侵權,這些問題仍處于法律的灰色地帶,尚未有明確的法律定論。
此外,吉卜力工作室的聯合創辦人宮崎駿曾在2016年明確表示對AI生成內容的不滿,認為這種技術是對“生命本身的侮辱”,并強調不會將其融入自己的作品。
如今,他的擔憂正在變成現實:從分鏡繪制到場景設計,傳統動畫制作中的人力智慧正面臨算法的高效挑戰。技術便利與原創保護的矛盾,正在重塑整個行業的成本結構與發展邏輯。
“百模大戰”三年,AI文生影像更好了嗎?
當OpenAI的GPT-4o在2025年春季掀起圖像生成技術新浪潮時,中國AI生態圈同步上演“技術共振”——深度求索(DeepSeek)推出DeepSeek-V3-0324版本升級,阿里巴巴則開源參數規模達320億的Qwen2.5-Omni。
2022年8月,Stable Diffusion以開源模式向全球開放模型代碼,憑借其出色的成本效益、高質量的圖像輸出和強大的邏輯理解能力,迅速成為AI繪畫領域的標桿。受此技術浪潮影響,國內短視頻平臺抖音迅速跟進,推出“抖音AI繪畫(二次元)”功能,成功培育出國內首個規模突破千萬的AI繪畫用戶群體。
被視為大模型元年的2023年,也開啟了“百模大戰”的序幕。3月,百度率先發布“文心一言”,成為國內首個公開的生成式AI大模型。隨后,華為、阿里、360等國內科技巨頭紛紛跟進,相繼推出了各自的大模型產品,涉及文生圖、圖像編輯等功能。
國內文生影像模型初期以中文語義理解優化為主,在中文創作場景中展現出更強的適配性,尤其受到中小企業和內容創作者的青睞。不過,在生成質量層面,相較于Midjourney等國際頭部產品,國內模型在光影層次、細節精致度等藝術表現力上仍存在可見差距。
AI文生影像技術在2024年迎來質變突破。2月,OpenAI推出革命性的Sora模型,將文生視頻技術推向新高度——根據文本指令生成長達60秒的高清視頻,支持多鏡頭視角和復雜任務處理,重新定義了行業標準。
這階段,在國內AI文生影像的發展主要集中在場景化落地與技術追趕。一方面通過算法優化縮短核心能力差距;另一方面深耕本土化場景,將文生視頻技術快速接入短視頻創作、電商展示等實際應用。
2024年,中國AI文生影像領域迎來密集創新。字節跳動9月推出的PixelDance和Seaweed模型,精準切合短視頻生產需求——前者通過復雜運鏡和連貫動作生成,大幅提升內容創作效率;后者憑借60秒快速出片能力,成為短視頻創作者的效率工具。
阿里云通義則展現了商業化深度:通過歷史場景還原、多人物互動等功能的強化,配合免費額度策略,已深度嵌入電商平臺的商品素材生產全流程。而美圖"奇想大模型"另辟蹊徑,以國風元素訓練數據為基礎,打造出兼具文化特色與級質感的生成效果,成為MCN機構內容生產的重要工具。
在artificialanalaysis.ai的全球盲測中,快手可靈1.5 Pro版本與Google Veo 2并列前兩名,展現了中國視頻生成技術的國際競爭力。2024年6月面世以來,該軟件相繼開放了圖生視頻、視頻續寫等能力,還具備 AI 試衣等功能。商業化方面,截至2025年2月,快手可靈AI已實現超1億元營收,服務小米、亞馬遜云科技等數千家企業客戶,并開創性地推動了AI在影視制作領域的深度應用——國內首部全AIGC微短劇《山海奇鏡之劈波斬浪》的誕生。
當前國內AI生成技術已實現重要突破,正從單一模態向多模態協同創作演進。在電商產品展示、游戲素材制作等商業場景中,動態生成技術已實現深度應用,大幅提升內容生產效率。頭部產品在圖像細節處理與文本指令匹配精度上已逼近國際頂尖水平,技術代差顯著縮小。
但在創意表達的豐富性和藝術風格的多樣性方面,國內模型仍有提升空間,這或將成為下一階段技術攻關的重點方向。
文生影像,開始狂飆
如今,國內文生影像技術已進入商業化爆發期,頭部平臺的技術突破正在重塑內容生產生態,千億級市場規模加速形成。這一進程的核心首先在于技術能力從“基礎可用”向“專業好用”的跨越式發展。
例如,快手自研的"可靈"視頻大模型率先實現多項突破,不僅將單次生成時長提升至3分鐘、分辨率達1080P,并支持自由寬高比調整,物理規律模擬能力接近真實世界。用戶只需上傳一張照片,即可生成“AI舞王”等趣味動態視頻,技術門檻大幅降低。
專業化場景的深耕則代表下一階段方向。預計4月7日全量開放的字節即夢3.0模型選擇人像生成作為突破口,通過2K超清輸出與亞表皮級細節渲染,首次在數字生成領域實現了“以假亂真”的視覺效果。該模型展現出的構圖能力和光影處理水平已接近專業攝影師水準,特別是對中國元素的精準呈現,使其在中文內容創作領域建立起獨特優勢。
市場反饋進一步驗證了技術的成熟度。2024年Q4,快手AIGC短視頻素材日均消耗飆升至3000萬元,短劇營銷消耗同比激增300%以上。這一增長背后,是磁力引擎平臺通過DeepSeek-R1模型的深度整合,實現了從文案生成到數字人視頻制作的端到端AI化,使廣告制作成本從過去的“萬元級”降至“百元級”。
據報道,目前已有近2萬商家借助快手AI工具實現高效內容生產,AIGC技術已從實驗室走向規模化商業落地。此外,文生影像技術正在賦能和改編傳統影視工業。央視推出的AI全流程微短劇《中國神話》,從分鏡到配音均由AI完成,開創主流媒體應用先例。2024年末,快手“可靈AI”聯合李少紅、賈樟柯等9位導演推出AIGC電影短片,涵蓋奇幻、科幻等多元類型。
當前,國內文生影像發展已呈現出"平臺生態+垂直深耕"的雙輪驅動格局。頭部平臺通過大模型構建基礎設施,專業團隊在細分領域打磨差異化能力。從算法突破到產業落地,國內文生影像技術正以場景為錨點,構建起技術迭代與商業價值的正向循環。
快手、字節跳動、騰訊等平臺通過降低創作門檻、提升內容品質,已推動AIGC從“實驗性工具”升級為“生產力引擎”。
從行業整體來看,文生影像技術正在沿著兩個維度快速發展。
橫向拓展應用場景。從短視頻、直播延伸到電商、教育等領域。縱向深耕專業能力。在畫質、時長、交互性等方面持續突破。技術突破與商業變現已形成良性循環。
一方面,AIGC內容日均消耗的快速增長印證了市場認可度;另一方面,商業收益又反哺技術研發,推動產品迭代。
隨著多模態協同能力的深化,文生影像有望在影視工業化、教育可視化等領域釋放更大潛力,持續推動數字內容生態的進化與革新。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.