機器之心報道
編輯:楊文
太瘋狂了!AI生成的嘻哈歌手唱Rap以假亂真,網友直呼「看不出破綻」。
來來來,眼尖的朋友請告訴我,下面這個嘻哈歌手唱 rap 的視頻到底是真實的,還是 AI 生成的?
我可以 100% 肯定地說,此為 AI 的手筆。你猜對了嗎?
三天前,X 博主 @blizaine 使用 Google Flow Veo3 和 Suno 4.5 制作了這一視頻。畫面和開場聲音是 Veo3 生成的,歌曲和歌詞則用 了 Suno 4.5。
由于效果過于逼真,網友直呼「太瘋狂」,甚至還讓搖滾老炮回想起了當年的舞臺時光。
看樣子,Veo 3 剛揭開流量明星的遮羞布,這下子又要讓歌手瑟瑟發抖了。
循著這個方向在 X 上逛了一圈,發現不少網友熱衷于用 Veo 3 生成演唱會視頻,而且一個比一個自然。
比如這個另類搖滾迷幻樂隊在一家小酒吧的演出片段。主唱站在麥克風前,邊彈吉他邊演唱成名曲中的副歌部分,情緒飽滿但不激烈;貝斯手、吉他手和鼓手沉醉其中,身體隨節奏搖擺著,幾乎找不出什么 bug。
https://mp.weixin.qq.com/s/nMkcinq0gXTnHOrbkBkJhg
Prompt: Mid 90s footage of an alternative rock shoegaze band playing in a small dive bar. The band consists of a lead singer guitarist, a bassist, a drummer, and another guitarist. They are singing the soaring chorus of their biggest hit.
再比如,下面這個妝容怪誕的鋼琴家演奏動作自然流暢,手指與琴鍵接觸的力度、節奏與畫面中的旋律同步,口型也對得嚴絲合縫。身后交響樂團不同樂器組的演奏姿態各具特色,指揮家起伏的手勢也不機械重復。
更妙的是,Veo 3 還能找準時機切換鏡頭,細節之豐富幾可亂真。
https://mp.weixin.qq.com/s/nMkcinq0gXTnHOrbkBkJhg
Prompt: Early 2000s footage of an australian goth pianist making a whimsical song about God in front of an orchestra.
還有這個混亂的搖滾音樂會,三名樂隊成員完全失控:主唱揮舞著鼓槌沖著觀眾嘶吼,吉他手頭發凌亂猛撥琴弦,身后的鼓手則瘋狂擊打鼓面。唯一的瑕疵就是那莫名飛起的镲,說實話有點出戲。
https://mp.weixin.qq.com/s/nMkcinq0gXTnHOrbkBkJhg
Prompt:A chaotic grunge rock concert circa 1995 captured on an old VHS camcorder from someone in the audience. The band members are acting erratically, throwing guitars and smashing drums.
接下來,我們也來復刻一個,看看 AI 能否拯救猶如一潭死水的華語樂壇。
這第一步就是生成音樂。
前段時間一個名為「梁正尚能飯」的博主火了。他憑借「粵語 + 古詩 + 搖滾」的獨特風格,創作出《將進酒》《木蘭辭》《王維說》《春歸何處》等音樂作品,在各大平臺播放量超百萬。
https://mp.weixin.qq.com/s/nMkcinq0gXTnHOrbkBkJhg
視頻來自博主「梁正尚能飯」
我們就用 Suno3.5 和豆包嘗試一下。
Suno 算是資深的 AI 音樂生成模型,當初一問世就被外界稱為「音樂界的 ChatGPT」,經過一年多的技術迭代,Suno 已更新至 4.5 版本。
那么我們為何選擇 Suno3.5 而不是最新的 4.5 版本?原因只有一個:摳。4.5 版本要花錢升級會員,3.5 版本可免費體驗,只需點擊「Create」,上傳歌詞輸入風格,它就能秒出 2 首歌。
Suno 版的《木蘭辭》有嘻哈那個味了,不過咬字會在粵語和普通話之間來回橫跳,女聲吟唱部分還會摻雜明顯的電音,聽起來不是很自然。
https://mp.weixin.qq.com/s/nMkcinq0gXTnHOrbkBkJhg
與 Suno 的專精不同,豆包就像一個啥都能裝的菜籃子,涵蓋 AI 搜索、視頻生成、音樂生成、AI 編程等 15 項功能。它的音樂生成功能可直接套模版,或讓 AI 自動寫歌詞,或自己輸入歌詞,再選擇音樂風格、情緒、音色即可。
相比于 Suno,豆包的咬字更清晰,尤其是「鞍韉」、「轡頭」等生僻字,豆包都能讀準,但旋律相對來說比較單一。
https://mp.weixin.qq.com/s/nMkcinq0gXTnHOrbkBkJhg
豆包還有一個優勢,就是可以直接通過對話的方式,讓它潤色歌詞以更好地配合嘻哈音樂風格。
經過改編后的《木蘭辭》聽起來就順耳多了:
https://mp.weixin.qq.com/s/nMkcinq0gXTnHOrbkBkJhg
第二步就是用 Flow 中的 Veo3 生成畫面和開場白。
Flow 是谷歌打造的一站式 AI 電影制作平臺,用戶可以通過輸入文本提示或上傳圖像,讓 Flow 生成完整的電影場景或短片,同時它內置一整套視頻制作工具,包括攝像機控制、場景構建器和素材管理器等。
Flow 鏈接:https://labs.google/flow/about
要想生成以假亂真的演唱會效果,提示詞是關鍵。經過多次調試,我們搞了個像樣的:
A high-energy hip-hop concert scene. A stunningly handsome Chinese hip-hop artist, early 20s, wearing a stylish streetwear outfit — oversized jacket, graphic tee, chunky sneakers, silver chains, and a snapback cap. He has sharp facial features, confident expression, and a charismatic stage presence. The confident Chinese hip-hop artist stands center stage , holding a microphone. As the intro music plays, he looks directly into the camera and says, "What's up, everyone? Long time no see, haha." The camera then pans smoothly from the rapper to the excited audience — people are cheering, waving their hands, and jumping to the beat. Then the camera moves behind the rapper as he turns to face the crowd and begins his rap performance. The atmosphere is electric, with lights flashing and the crowd fully engaged.
來看看實際生成效果:
https://mp.weixin.qq.com/s/nMkcinq0gXTnHOrbkBkJhg
由于 flow 每次只能生成 8 秒視頻,要想延長時長,只需點擊「Add to scene」,選擇「Extending」,再輸入提示詞:The hip-hop artist is facing the audience while rapping, with their back to the camera, and the crowd is waving and dancing to the rhythm.
多次重復此操作,就能得到一段自然流暢的嘻哈歌手演唱會視頻。
最后,再用剪映將視頻和音樂片段拼合在一起,大功告成!
上最終視頻效果:
https://mp.weixin.qq.com/s/nMkcinq0gXTnHOrbkBkJhg
感興趣的朋友也去試試吧!
https://x.com/rpnickson/status/1925079953206608257
https://x.com/bitfalls/status/1925072790593405065
https://x.com/TheJasonRink/status/1925372569714090429
https://x.com/nearcyan/status/1924966995910631899
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.