99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

真碾壓Sora了!谷歌Veo 3首次實現音畫同步,視頻模型開口說話

0
分享至



還記得 2023 年 AI 視頻最出圈的片段嗎?威爾·史密斯吃面,動作鬼畜,畫面寂靜——



當時的視頻大模型,只會動,不會說話。
Sora 的發布讓視頻質量飛躍、物理規則建模進步巨大,也直接引爆了整條賽道。

Runway、Pika、Luma、Kling、Genmo、Higgsfield、Lightricks 等初創公司,以及 OpenAI、谷歌、阿里、字節等科技巨頭,紛紛入局。

但無論畫質如何進步,視頻還是「啞巴」——

你可以讓人物奔跑、翻轉,甚至做出慢動作,但如果想讓角色說話、聽到風聲、腳步聲,甚至感受到炒菜時鍋里的滋滋聲?

對不起,還得自己導音頻。

更麻煩的是,配完音還可能對不上節奏——口型和對白不同步,腳步踩不到點上,情緒氛圍總差一口氣。

直到今天,谷歌正式發布 Veo 3 AI 視頻,終于能「開口說話」了——



Veo 3 不僅能生成高質量視頻,還能理解視頻中的原始像素,自動生成與畫面同步的對話、多種音效。
翻譯成中文——


只用一個提示詞,你就能得到畫面+對白+唇動對齊+擬音音效一氣呵成的視頻。



提示語:90 年代酒吧里的情景喜劇場景,背景墻上的霓虹燈寫著 「fofr」。一對夫婦說了些什么,觀眾大笑起來。



對白生成、唇動對齊和情緒音效(觀眾笑聲),一氣呵成
提示語:一位游戲主播(streamer)只用他的鎬子(pickaxe)贏得了「Victory Royale」。



生成出的內容是完整直播風格視頻,還帶著夸張的歡呼與音效,畫面有聲有色
盡管凌晨才發布,Veo 3 已在社交網絡掀起熱潮,多個視頻動輒數十萬次播放,令人驚嘆不已。

雪地步伐清晰傳來咯吱聲,鴨子嘎嘎叫,烹飪滋滋作響,撒胡椒聲......

得益于模型對物理世界的深刻理解,所有聲音非后期拼接,而是與畫面實時同步生成。



Veo 3 還能精準捕捉畫面情緒,渲染氛圍音效。這個麥芬蛋糕在烤箱中尖叫,逼真到讓人有點毛骨悚然。



提示詞:a video with dialogue of two muffins while baking in an over, the first muffin says "I can't believe this Veo 3 thing can do dialogue now!", the second muffin says "AAAAH, a talking muffin!"
至于對口型,Veo 3 也表現突出:無論是脫口秀現場講笑話,還是說唱音樂視頻中的節奏口型,都能精準同步,真實感爆棚。



提示詞:a man doing stand up comedy in a small venue tells a joke (include the joke in the dialogue)



提示詞:a man in a music video raps to the camera about generating videos with Veo3

生成歌劇和音樂會視頻,成為檢驗 Veo 3 音畫同步水平的高頻場景。
這個視頻里,鼓手的每一次擊打動作都與鼓點節奏完美同步,與歌手表演同步,展現了模型在復雜多聲音動態場景下出色的音畫合成能力。支持多角色、多種風格的創作視頻,虛擬人物演技不比《演員請就位》強多了?





長提示詞理解與事件流生成方面,Veo 3 同樣出色。
以前視頻模型提示詞一長就容易崩。
但 Veo 3 能理解長句子,完成一個完整、時間有序、邏輯清晰的小片段。
來看這個視頻。

提示詞:黎明時分,一位男士在美麗的夏日公園里奔跑,他上氣不接下氣,然后放慢速度,看著鏡頭,氣喘吁吁地說:「用 API 運行 AI。使用 Replicate。」然后他繼續跑。最后,「Replicate」的字樣漸漸消失在視野中。

包含動作變化、對白插入、鏡頭切換、logo 漸隱……
多步驟連貫執行,事件流準確,效果不錯:



音畫同步生成,直接把視頻模型拉到了新時代 。而其中關鍵能力,離不開 DeepMind 過去就悄悄鋪下的一項底層技術:V2A( Video-to-Audio )
2023 年 6 月,DeepMind 就首次披露:

他們正開發一套 AI 系統,能從視頻像素 + 文本提示中,自動生成完整音軌。包括對白、動作音效、環境音、背景音樂……

它的原理是:將視頻視覺信息編碼為語義信號,與文本提示一同輸入擴散模型,生成匹配的音頻波形。
可以說,V2A 就是 Veo 3 的「耳朵」和「聲帶」。再配合谷歌的音視頻數據資源—— YouTube 很可能是訓練數據之一—— Veo 3 的音畫合成功能,已經遙遙領先。
一個小遺憾:視頻仍只有 8 秒。

另外,目前 Veo 3 僅面向美國 Ultra 訂閱用戶開放,定價為 249.99 美元/月。這是谷歌專為專業創作者、開發者推出的高階會員服務。



雖然門檻不低、時長有限,但 Veo 3 的初次亮相,已足夠震撼。
過去生成式 AI 是「語言+圖像」的時代,現在,正在進入「視聽一體」的新階段。
生成視頻從會動 → 能說 → 有氛圍,一步步突破不同模態的邊界。
如果說 Sora 是讓 AI 看懂物理世界,那 Veo 3,就是讓 AI 能「聽懂」,「會說」。
看來,音畫一體,將是下一輪視頻模型競賽的標配。

文中視頻鏈接:https://mp.weixin.qq.com/s/rJFwZ1lLiWzFLE7jd4jGyA

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美議員無理要求希爾頓等三大酒店停用“中國臺灣”表述,島內網友怒批:“管得太多!”

美議員無理要求希爾頓等三大酒店停用“中國臺灣”表述,島內網友怒批:“管得太多!”

環球網資訊
2025-05-22 13:20:49
被人遺忘的“吹哨人”去世,她曾被開除公職,卻拯救了上萬的生命

被人遺忘的“吹哨人”去世,她曾被開除公職,卻拯救了上萬的生命

景來律師
2023-10-04 00:02:59
離婚僅一年,60歲郭晉安被曝與23歲莊子璇“父女戀”,女方回應了

離婚僅一年,60歲郭晉安被曝與23歲莊子璇“父女戀”,女方回應了

電影偵探社
2025-05-22 16:08:28
雞蛋再次成為關注對象!醫生發現:吃雞蛋時,務必多留意這幾點

雞蛋再次成為關注對象!醫生發現:吃雞蛋時,務必多留意這幾點

DrX說
2025-05-21 12:47:30
毛主席 14 字狂草神作寫了啥?有人知道嗎?全認出必是神人

毛主席 14 字狂草神作寫了啥?有人知道嗎?全認出必是神人

茶韻浮生
2025-05-20 14:02:28
全網沸騰了!恒大被罰2000元,起因是沒有支付停工停產員工生活費

全網沸騰了!恒大被罰2000元,起因是沒有支付停工停產員工生活費

火山詩話
2025-05-22 11:54:03
廣州多所小學名校招不滿人?當地教育局回應

廣州多所小學名校招不滿人?當地教育局回應

三湘都市報
2025-05-22 23:02:58
官宣!“福耀科大”宣布將在這5省招生,其他省份家長卻坐不住了

官宣!“福耀科大”宣布將在這5省招生,其他省份家長卻坐不住了

凱旋學長
2025-05-22 21:35:59
剛剛,A50跳水!亞太股市,全線低開!

剛剛,A50跳水!亞太股市,全線低開!

證券時報e公司
2025-05-22 09:59:26
夫妻最不合的屬相,在一起爭吵不斷,互相不順眼

夫妻最不合的屬相,在一起爭吵不斷,互相不順眼

顧一宸
2025-04-11 21:58:59
男子生殖器被割斷,擔心妻子守活寡不要他,醫生卻夸贊妻子做得對

男子生殖器被割斷,擔心妻子守活寡不要他,醫生卻夸贊妻子做得對

肆時說
2025-05-22 19:57:22
“火箭軍女神”李莉:因多次預判美軍陰謀,被美國列入制裁黑名單

“火箭軍女神”李莉:因多次預判美軍陰謀,被美國列入制裁黑名單

跳跳歷史
2025-05-14 10:24:39
全球首發!華為新機官宣:6月6日,正式開售!

全球首發!華為新機官宣:6月6日,正式開售!

科技堡壘
2025-05-20 11:49:49
記者:阿莫林必須接受徹底審查!歐聯決賽失利證明曼聯需要大換血

記者:阿莫林必須接受徹底審查!歐聯決賽失利證明曼聯需要大換血

直播吧
2025-05-22 17:45:15
逼死強迫癥,利物浦上次奪冠獎杯上刻利物浦,這次刻利物浦FC

逼死強迫癥,利物浦上次奪冠獎杯上刻利物浦,這次刻利物浦FC

懂球帝
2025-05-22 14:13:10
李乃文的沉默是最得體的悲傷。他們的道德感還是迫使他發聲了。

李乃文的沉默是最得體的悲傷。他們的道德感還是迫使他發聲了。

夢史
2025-05-22 17:25:53
一根油條42元!豬肉婆高價菜引爭議,網友:上海順德預制菜天花板

一根油條42元!豬肉婆高價菜引爭議,網友:上海順德預制菜天花板

阿褲趣聞君
2025-05-22 10:23:58
4所學院將正式更名“大學”!錄取分數不高,今年是最后一次撿漏

4所學院將正式更名“大學”!錄取分數不高,今年是最后一次撿漏

教育導向分享
2025-05-22 21:36:55
世乒賽女單8強今日誕生!孫穎莎戰申裕斌,石洵瑤早田希娜爭晉級

世乒賽女單8強今日誕生!孫穎莎戰申裕斌,石洵瑤早田希娜爭晉級

肖語談
2025-05-22 07:37:24
感恩!胡金秋奪冠之夜發信息給李春江,分享喜悅 表達感恩之情

感恩!胡金秋奪冠之夜發信息給李春江,分享喜悅 表達感恩之情

體育哲人
2025-05-22 08:56:30
2025-05-23 00:39:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10515文章數 142318關注度
往期回顧 全部

科技要聞

小米YU7發布,雷軍:沒有30萬下不來

頭條要聞

雷軍發布3nm旗艦芯片 現場安檢空前嚴格連紙都要寄存

頭條要聞

雷軍發布3nm旗艦芯片 現場安檢空前嚴格連紙都要寄存

體育要聞

孫興慜的圓夢之夜 曼聯丟最后遮羞布

娛樂要聞

朱媛媛喪事一切從簡,親戚剛知她去世

財經要聞

美債、日債都要崩盤?

汽車要聞

吉利銀河M9登陸米蘭 重新定義AI科技大六座旗艦SUV

態度原創

家居
旅游
本地
數碼
公開課

家居要聞

木質極簡 居家與辦公的現實之境

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

巴黎沒有倍兒甜,但天津巧克力腦袋倍兒多

數碼要聞

AMD RX 9060 XT顯卡發布! 蘇媽給游戲黨帶來小驚喜?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 开远市| 白水县| 永定县| 嵩明县| 新野县| 土默特左旗| 修水县| 湛江市| 泽普县| 泗阳县| 苍山县| 马山县| 马边| 高邮市| 东海县| 武城县| 荔浦县| 温州市| 乡宁县| 通州区| SHOW| 黎城县| 临城县| 阿合奇县| 应用必备| 阳江市| 佛山市| 娄烦县| 曲周县| 策勒县| 南和县| 遂平县| 铁力市| 安国市| 台前县| 本溪市| 涿鹿县| 水富县| 南澳县| 明水县| 彭阳县|