大家好我是歸藏(guizang),今天教大家制作現在最火的 AI 視頻品類。
無論你是否關注 AI 最近肯定在不同的社交媒體上刷到了這類視頻。
一個大猩猩或者其他動物對著鏡頭絮叨,要不就是各種虛構的歷史事件的采訪。
每一個點贊和播放都很高不管是在國內還是海外。
雖然很無聊但是刷到就看的停不下來,即使是我這種經常接觸 AI 內容的人都是如此。
這種品類甚至都滲透到了廣告和營銷的領域。
ins 上有個牙醫診所每天都發廣告,每個播放都只有幾千,但是換成“大腳男孩”之后他的廣告播放高達 56 萬次!
有了 Veo3 之后 AI 視頻的制作成本下降了非常多。
現在可能是你入門 AI 視頻制作非常好的機會,只需要兩次生成簡單的合并兩段視頻,你的作品就已經完成了。
你可能以為上面這些視頻的點子都是創作者自己想的,但我要告訴你,其實不是。
上面大部分爆火的 AI 視頻幾乎從構思到提示詞到生成全是 AI 為主,人類需要做的事情只有挑選點子,生成和復制提示詞而已。
所以這篇內容我不只會教你如何用視頻模型,我還會教你用各種工具分析視頻從而生成新的創意,給你提示詞模板,讓你從創意到生成全部自動化。
我這個流程其實接近工程化了,你甚至可以用來做視頻 Agent 產品,先要個贊不過分吧。
先來看兩個我用這流程做的這類 AI 視頻,首先是荒誕采訪形式的海盜財報會議。
之后是一個給巨龍看守地牢的倒霉哥布林牛馬的一天。
是不是很牛批!好了,從現在開始扔掉你的腦子,開搞?。?!
如何分析爆款視頻
首先我們要教的是如何分析視頻和拓展創意,這里我用的 NotebookLM。
你是不是只用 NotebookLM 來分析有口播的 youtube 視頻,但我要告訴你,Gemini 其實是能分析視頻畫面的,所以你可以讓 Noteboolm 幫你分析任何 Youtube 爆款視頻的創作形式。
你甚至可以往里面加入多個爆款視頻一起交叉分析。
你需要做的第一步是打開頁面,新建一個 NotebookLM 筆記本,在添加來源這里輸入你找到的 youtube 爆款視頻地址。
你可以在來源這里繼續添加,我最后一次性添加了找到的四個 Veo3 做的爆款 AI 視頻,兩個是第一人稱Vlog 形式的,兩個是采訪形式的。
然后就可以寫提示詞讓 NotebookLM 開始分析了,這里我放上我的提示詞改一下前面的部分可以套用到任何創意視頻上。
這四個視頻都是用谷歌新發布的 Veo 3 視頻模型生成編排的,在 Youtube 非常火爆,詳細分析每個視頻的每一個分鏡的臺詞和畫面內容,然后總結爆火的原因。
可以看到 NotebookLM 分析的非常詳細。
每個視頻的分鏡畫面以及臺詞內容都輸出了,同時對于這類視頻爆火的原因分析的也非常好。
我看完對這些視頻爆火的原因是有些感覺到,但是完全做不到 NotebookLM 分析的這么細致和完整。
Veo3 偽紀實爆款視頻的萬能公式:四大核心要素
核心引擎:巨大的“反差感” (Contrast Engine)
這是所有笑點的根本來源。視頻的成功在于將兩個完全不搭界的元素進行強行碰撞,從而產生荒誕的喜劇效果。
- 時代反差: 用最現代的形式(Vlog、街頭采訪)去呈現古老或虛構的內容(泰坦尼克號、維京人、大腳怪、暴風兵)。
- 身份反差: 讓本應神秘、嚴肅或邪惡的角色(大腳怪、維京人、暴風兵)表現出普通人(甚至“屌絲”)的一面,充滿生活氣息和人性弱點。
- 情境反差: 在極度危險或宏大的背景下,角色們關心的卻是微不足道的日?,嵤?。例如,在即將撞上冰山時,乘客關心的是明早的吐司;在炮火連天的戰場上,暴風兵在堆雪人。
視頻都采用了模擬真實記錄的拍攝手法,讓觀眾產生“這好像是真的”的錯覺,從而使反差感更加強烈。
- 偽采訪 (Pseudo-Interview): 如《泰坦尼克號》和《維京人》,采用一本正經的新聞采訪形式,讓荒謬的回答顯得更加滑稽。
- 第一人稱Vlog (First-Person Vlog): 如《大腳男孩》和《暴風兵》,使用自拍桿和主觀鏡頭,極大地增強了代入感,仿佛在看這些角色的“朋友圈”視頻。
這些視頻從不憑空創造世界觀,而是巧妙地站在“巨人”的肩膀上,利用了觀眾已有的知識儲備和刻板印象。
- 歷史事件: 觀眾都知道泰坦尼克號會沉、維京人好戰。
- 流行文化/IP: 觀眾都認識《星球大戰》的暴風兵和維達。
- 文化迷因: 觀眾都了解“大腳怪”的傳說或特定人群的刻板印象(如開斯巴魯的戶外愛好者)。 這極大地降低了觀眾的理解成本,笑點無需鋪墊,一點就通。
視頻最“扎心”也最搞笑的部分,是把所有宏大的敘事都拉回到普通人的抱怨和吐槽上。
- “打工人”的嘴替: 暴風兵把維達叫做“混蛋老板”,抱怨工作環境差、任務危險、同事不靠譜。這讓所有上班族都感同身受。
- 日常的煩惱: 泰坦尼克號的電梯工抱怨工作繁瑣,維京女人抱怨總在洗血衣服。這些充滿生活氣息的細節讓角色瞬間變得鮮活,也讓觀眾產生了強烈的共鳴。
如何拓展視頻創意
我們上面已經有了這類爆款視頻的創作邏輯和分鏡描述了,接下來我們需要讓 AI 根據這些上下文幫我們拓展創意。
你可以打開任何一個你用的慣的 AI 模型,我這里用的還是 Gemini。
將剛才 Notebooklm 分析的結果發給他,然后跟他說:
我會發給你幾個最近非?;鸨挠?AI 視頻模型生成的視頻內容和爆火的原因,你需要結合這些內容給我一些類似第一人稱 Vlog 形式的點子,詳細描寫每個分鏡(8 秒)對應的環境和角色以及說話內容和語氣,適當插入打破第四面墻的說話方式,比如要贊。
這里我們首先做的是第一人稱 Vlog 形式的視頻。
這里的文案可能和內容可能我們生成提示詞到時候并不會用,但是依然要讓他輸出是因為需要用詳細的分鏡內容和口播文案來判斷創意的質量,不能只依賴標題和簡單的描述。
之后你就可以根據他輸出的點子內容進行挑選,首選比較好實現和偏現實題材的,這樣生成的效果比較好。
這里我選了哥布林牛馬這個,感覺反差感很強,在《龍與地下城》這種宏大視覺觀的小角色視角。
在虛構采訪這里我選用了海盜年會和金融行業黑話這個點子,反差感也很足,也會讓打工人很有共鳴。
提示詞生成
如果你對某個分鏡感覺有需要修改的部分可以讓他重新修改,直到內容你就的沒問題。
這里我偷懶了,沒有改直接進入了下一步,開始生成提示詞。
這部分就比較簡單了,我會給你第一人稱 Vlog 和采訪兩個方案的提示詞模板。
讓 AI 基于剛才討論的結果和提示詞模板輸出每個分鏡的提示詞就行。
第一人稱 Vlog 風格視頻提示詞生成:
【地老哥布林清潔工】,這個點子很好,將每個分鏡的所有提示描述內容都放在一段話中,包括音頻相關內容,每個分鏡 8 秒,注意臺詞長度,不要超時。
參考這個模板生成提示詞:A cinematic, handheld selfie-style shot of [a detailed character description, e.g., a sci-fi explorer in a sleek silver spacesuit]. They hold the camera at arm's length, and their [specific arm/hand description, e.g., armored silver gauntlet] is clearly visible in the frame as they show a [specific emotional expression, e.g., look of pure awe]. The scene is a [detailed location and time of day, e.g., bioluminescent alien jungle at twilight], and behind them, [describe the key background element, e.g., massive, pulsating mushroom-like trees] cast a [specific lighting quality, e.g., vibrant purple and blue light] across the landscape. The character looks directly into the camera and speaks in a [specific tone of voice, e.g., breathless, excited whisper]: "[Your Dialogue Here]". (Optional: For extra control, add specs like Lens: wide-angle with shallow focus or describe a camera pan).
虛構采訪類型提示詞生成
【海盜會議】,這個點子很好,將每個分鏡的所有提示描述內容都放在一段話中,包括音頻相關內容,每個分鏡 8 秒,注意臺詞長度,不要超時。
參考這個模板生成提示詞:A cinematic, medium handheld interview shot featuring [a detailed character description, e.g., a fearsome pirate captain in a captain's coat with a Bluetooth earpiece]. They display a [specific emotional expression, e.g., look of confident authority] as they speak. The scene is set in [detailed location, e.g., a secluded alcove of a massive, torch-lit sea cave], with [key background elements, e.g., other pirates mingling near a makeshift bar] visible in the slightly out-of-focus background. The atmosphere is thick with [describe environmental sounds, e.g., the murmur of distant conversations and the clinking of tankards]. Flickering [specific lighting quality, e.g., torchlight] illuminates the character, casting dynamic shadows. Crucially, the character looks slightly off-camera, addressing an unseen interviewer. They speak in a [specific tone of voice, e.g., a fast-talking, confident finance-bro voice]: "[Your Dialogue Here]". (Optional: For extra control, specify lens details like 'shot on a 50mm lens with a shallow depth of field' or describe camera movement like 'a slow push-in during the dialogue').
到這一步,基本上我們的前期準備工作就結束了。
因為 Veo3 強大的提示詞遵循和穩定性以及音頻生成能力,我們可以直接跳過圖生視頻的圖片生成、語音生成、唇形同步、音效匹配這幾步。
如果以前要做類似的視頻你可以想象要多麻煩,上面跳過的每一步都有可能出問題導致增加好幾倍的工作量。
生成視頻
接下來我們就可以生成視頻了,如果你想簡單點搞定,我推薦你開個 Gemini Pro 會員,在 Gemini 里面生成。
直接進入到 Gemini APP 里面,選中輸入框下面的視頻按鈕,輸入提示詞然后回車就行。
如果你不怕麻煩的話可以用 FLOW (labs.google/fx/zh/tools/flow/)這個谷歌專門用來視頻生成的產品。
詳細的教程我之前寫過《》,這里就寫一下簡單的。
進來以后先創建項目,然后在輸入框設置這里把模型調整到 Veo3 Fast 模型,這個很便宜。
不要再因為沒切換模型,跑來問我為啥視頻沒聲音了!
如果你追求質量可以用Quality 模型,但很貴。然后輸入提示詞等待生成就行。
如果這里下載的時候可以選擇將生成的結果超分成 1080P,視頻會清晰一些。
到這里我們基本上全部都 OK 了。
視頻合并及后處理
最后就是把視頻合起來了,由于 Veo3 生成的視頻基本就是完整的,你只需要用剪映或者其他工具把多端視頻拼接然后導出就行,這應該都會做吧。
如果是英文的話可以點上面的字幕讓剪映幫你自動生成一個字幕。
如果你還需要增加一些沉浸感的話可以加一些裝飾,比如像我這個海盜年會一樣加了一些類似電視臺新聞直播都有的臺標和文字滾動新聞。
在一個月前我 Veo 3 的測評文章里面就說過,“每一次Agent的模型化即使每個部分的模型本身質量沒有升級也會帶來非常多的應用場景和新的產品機會”。
現在回看我這個預言是不是算成真了,最近幾乎每天都有基于 Veo3 制作的視頻爆款產生,而且不斷向不同的視頻品類擴散。
AI 視頻制作過程每少一步對于創作者基本盤的拓展就不止 10 倍這么簡單,很多人有很好的點子和流量嗅覺只是因為技術和對 AI 的了解不夠,所以沒辦法生產內容。
Veo3 生產成本已經很低了,如果出現視頻類 Agent 把視頻字幕之類的包裝工作搞定,AI 視頻生產者又何止百倍。
我們今年或許就能看到這一天的到來。
好了,到這里教程基本就結束了,謝謝各位的雙擊和大大的贊,孩子餓壞了,給點吧。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.