5月15日消息,谷歌召開I/O 2024開發者大會,正式發布視頻生成模型Veo,將成為Sora新的勁敵。
Google發布了兩款重量級模型——Veo和Imagen 3,它們分別針對視頻生成和文本轉圖像領域,劍指競爭對手OpenAI的Sora和Dall-E 3,誓要在創意表達的戰場上掀起新的波瀾。
Veo:讓每個人都能成為電影大師
Veo,這款Google最新、最先進的視頻生成模型,以其深度理解自然語言和視覺語義的能力,讓用戶得以創作出超過1分鐘的高質量1080p視頻。它不僅支持用戶自定義視頻的光照、鏡頭語言及色彩風格,還能理解復雜的電影拍攝技術,如延時攝影等,創造出連貫且逼真的視覺敘事。正如與Google合作的藝人Donald Glover所言,“每個人都能成為導演,因為講述故事的核心就是相互理解。”Veo正逐步向創作者開放,并計劃整合進YouTube Shorts等平臺,為用戶提供前所未有的創意控制體驗。
Imagen 3:細節之王,圖像生成新高度
另一邊,Imagen 3作為Google迄今為止最優質的文本轉圖像模型,展現出了令人難以置信的細節水平,其生成的圖像生動逼真,幾乎消除了傳統模型常見的視覺偽影。這意味著從細膩的灰狼肖像到奇異的水母漂浮,每一個細節都被精心雕琢,仿佛出自專業攝影師之手。藝術家和設計師們將能夠通過Imagen 3輕松實現腦海中的幻想,無論是商業廣告還是個人創意作品,都將是質的飛躍。
Music AI Sandbox:音樂創作的新篇章
此外,Google還宣布了與音樂界的深度合作,共同探索AI在音樂創作中的潛力。Music AI Sandbox這一新工具套裝的推出,為音樂家、詞曲作者和制作人提供了一個全新的創作平臺,使他們能夠以全新方式構思旋律、編排樂器部分,甚至改變聲音質感。格萊美獲獎音樂家Wyclef Jean、提名歌曲作者Justin Tranter及電子音樂家Marc Rebillet等已率先使用這一工具發布新作品,展示了AI在音樂領域的無限可能。
責任與安全:技術進步的基石
在追求技術創新的同時,Google強調負責任地使用AI生成內容的重要性。通過SynthID等工具,Google在生成的視頻、圖像、音頻、文本中嵌入難以察覺的數字水印,確保內容的可追溯性和安全性。公司持續與創意社區合作,進行安全測試,確保技術的安全和負責任部署。
Google I/O 2024展示的不僅僅是技術上的突破,更是對未來創意表達方式的重新定義。Veo、Imagen 3及Music AI Sandbox的推出,預示著一個創意民主化的新時代即將到來,每個人都能更自由地表達自我,講述自己的故事。隨著這些工具的逐步普及,我們期待見證全球創作者如何運用這些新模型和工具,將奇思妙想變為令人驚嘆的現實。
▲ 滑動查看往期內容
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.