可靈AI 2.0的出現,從技術升級的角度進一步消除了制作層面門檻,但又從價格層面上抬高了門檻,理想中“創作門檻極度降低、一人劇組成為常態”的狀態,顯然還沒有到來。
讀娛 | yiqiduyu
文|零壹
4月15日,快手推出了可靈AI最新的2.0視頻生成模型與可圖2.0圖像生成模型,據介紹,可靈2.0模型在動態質量、語義響應、畫面美學等維度,保持全球領先;可圖2.0模型在指令遵循、電影質感及藝術風格表現等方面顯著提升。
同時,可靈AI正式推出多模態編輯功能,支持在一段視頻的基礎之上,通過輸入圖片或文字,對生成的視頻內容實現元素的增加、刪減、替換,幫助創作者們實現更加靈活的二次編輯和處理。
可靈2.0的發布,標志著快手在AIGC領域的技術護城河進一步拓寬。從技術性能到應用場景,其突破性升級為行業樹立了多維度的標桿,但同時,高昂的價格也在國內視頻大模型中“獨樹一幟”——使用可靈2.0生成一段5秒的視頻需要消耗100個“靈感值”,以充值價格換算也就是10元,這遠遠超過了即夢AI、vidu以及可靈1.6的價格。
技術新高與價格新高,在人工智能技術狂飆突進的2025年,可靈AI將行業推向了一個新的臨界點。
1
可靈AI視頻2.0有多強?
我們先看看可靈AI2.0具體升級到了怎樣的程度。
據快手高級副總裁、社區科學線負責人蓋坤介紹,兩款模型在團隊內部的多項勝負率評測中,均穩居業內第一。例如在文生視頻領域,可靈2.0對比谷歌Veo2的勝負比為205%,對比Sora的勝負比達367%,在文字相關性、畫面質量、動態質量等維度上顯著超越對手。也就是說,可靈AI在目前主流視頻生成模型中已經有了比較明顯的優勢。
在可靈AI的官方升級介紹文檔中,可靈 2.0視頻模型升級主要體現在三個方面:更強的語義響應、更優的動態質量、更美的畫面質感。
其中“語義響應大幅提升”是指:動作、表情、運鏡響應更佳,支持描述時序更復雜的鏡頭,助你輕松創作大片級畫面。官方案例中對比了可靈 2.0與1.6生成內容的對比視頻,第二個視頻尤為明顯,提示詞大意是女孩坐在公園長椅上的時間過度天空色彩變化,1.6視頻中直接切換了一個遠景鏡頭來體現“天空色彩”,而2.0則全程保持在原鏡頭范圍內進行了合理的色彩變化,這對于影視作品的敘事來說顯然提升了一定實用性。
其二是動態質量大幅提升。角色/主體的動作幅度更大,速度更流暢,復雜動作也更加細膩、更自然、更合理,讓你身臨其境,充分感受視頻畫面的靈動活力。
官方視頻舉例了“恐龍朝著鏡頭沖過來,運動模糊,鏡頭抖動”的生成鏡頭,這一組對比中可靈 2.0的效果的確十分驚艷,在讀娛印象中的確是目前主流視頻AI中做得最好的。
不僅如此,在目前網絡上發布的大量可靈2.0的視頻來看,其在騎馬飛馳、追逐這類運動性鏡頭中的優異表現絕非是偶然,這一項的“炸裂”級別表現,很可能是可靈AI 2.0給當下的影視產業帶來沖擊最大的部分。
特效制作向來是影視制作中的成本大頭,而可靈AI 2.0在這些短鏡頭中的表現,可以說已經超過了我們印象中不少網絡電影和院線電影。這至少意味著,在短片、廣告短片這些行業之中,可靈2.0已經能夠帶來革命性的改變。而如何將這樣的工具應用到電影、電視劇的實際項目操作,以怎樣的形式嵌入到創作流程之中,也一定會成為下階段影視制作行業中爭相嘗試的一環。
其三是畫面美感大幅提升。官方介紹是“角色更真,動作、表情堪比專業演員;畫面更細,文生視頻可響應影視級別的畫面描述,大片質感、纖毫畢現;風格更美,圖生視頻可以更好地保持原圖畫風,延續更多美感?!钡谧x娛看來這一點有些牽強,比不上動態質量提升那樣驚艷。
除了2.0模型外,可靈AI這次發布的另一個重磅升級是「視頻多模態編輯」功能。用戶可以上傳一段5秒內視頻,基于視頻+文字/圖片,對視頻替換元素、增加元素、刪除元素,靈活對視頻修改、再創作。
從實際應用來看,“視頻多模態編輯”功能相當驚艷。官方視頻中實現了將視頻中的男性替換成一只熊貓,在空禮盒里加上毛絨玩具,把視頻里飛行的鸚鵡直接毫無痕跡的刪去,完全實現了“PS視頻”的效果。
為了驗證實際效果,讀娛君在實操中將一段“貓咪做飯”動畫中的貓咪替換成了一只小悟空,最終生成效果是非常準確的,可見這種驚艷表現絕不只是官方精挑細選出來的案例視頻,而是非常實用的。
目前來看,可靈AI已經能夠在廣告創意、影視等專業領域展現出驚人潛力。模型生成的視頻片段開始具備真實攝影的光影層次與運鏡節奏,也具備了極為靈活的可編輯性。這種進化或將重新定義人機協作的創作模式,越來越多的行業將被AI視頻模型所滲透。
2
技術降低門檻,價格抬高門檻
對普通用戶而言,可靈2.0模型的使用成本進一步提升到了新邊界,新技術高度帶來了生產變革的前奏,但也是帶來了新的價格高度。這也很可能會導致當下興趣用戶、個人創作者、專業機構的AI應用能力拉開差距,其中也許蘊含著未來AI內容生產資源逐漸層級化。
2.0模型的價格多貴?此前可靈1.6生成一段5S視頻需要20靈感值,2.0則是100靈感值,也就是前者的五倍價格。
2.0的價格也遠遠超過了目前其他國產AI視頻模型。以個人創作者常用的低檔會員舉例,可靈AI黃金會員連續包月46元/月,每月獲得660靈感值,可以生成66個標準視頻,若用來生成可靈2.0視頻,則只能生成6個;
作為對比,國內創作者常用的即夢AI 69元/月的基礎會員每月積分1080個,約生成視頻360個;VIDU 59元/月的基礎會員每月積分800個,約生成200個視頻;sora目前目前只對ChatGPT的Plus和Pro會員開放;通義萬相和豆包的視頻生成目前還沒有公共付費套餐,只有每日限定免費試用。
總體來看,可靈2.0的價格至少是即夢AI、VIDU的十幾二十倍,也只有sora的價格門檻可以相提并論了。也難怪很多網友都認為,升級雖然可觀,但也完美詮釋了“一分錢一分貨”。
在發布會上,快手高級副總裁、社區科學線負責人蓋坤表示,“我們的初心,是讓每個人都能用AI講出好的故事,我們也真切地希望這一天更快到來”。
但可靈2.0的價格成本提升,顯然會形成門檻和阻礙,尤其是對還不具備成熟商業化能力的“個人創作者”而言。這幾天在不少AI交流群里討論可靈2.0,核心角度幾乎都是“確實牛,但也確實貴”。
比如以制作AI短劇來說,因為AI鏡頭一次出品就能用的概率是很低的,一般都需要一定數量的“抽卡”,即便按“抽卡3次”的較低頻率來計算,一集3分鐘的AI短劇需要108個5s鏡頭,如果用可靈2.0來制作的話,按靈感值計算成本可能要達到1000元以上。
不消說,這一成本已經超過“玩票”或者“興趣”的創作者所能承擔的了。所以可靈2.0帶來的技術升級,肯定是沒辦法“讓每個人都能用AI講出好的故事”,目前還是只有影視公司、商業化打通的專業團隊能夠負擔得起。
在一文中,讀娛提到“所謂創作自由的新高峰,其實就是目前制作層面門檻的進一步消除,而對個人創作者在提示詞、視聽審美、劇本情感等等層面的高層次考驗更進一步。”
對未來的判斷有:在專業影視制作領域,AI會在創作流程中融為一體,隨著AI作為技術噱頭的標簽被弱化,其存在感會越來越低,但應用場景則會越來越多;而當下定義的“AI短劇”,其爆發會來自大眾創作者的無窮智慧。隨著創作門檻被極度降低,“一人劇組”成為常態,普羅大眾創意所產生的量變,會推動AI短劇的“奇點”出現。
而可靈AI 2.0的出現,從技術升級的角度進一步消除了制作層面門檻,但又從價格層面上抬高了門檻,理想中“創作門檻極度降低、一人劇組成為常態”的狀態,顯然還沒有到來。
但對于AI創作者而言,可靈AI 2.0的出現必然是一個好消息。它的出現有力證明視頻AI模型的極大潛力和實用性,在未來的所有視頻領域里都將是一個無法回避的話題。個人繼續打磨自己的提示詞創意、鏡頭感等能力將變得越來越有價值,因為視頻AI模型的升級還遠未到終局——無論是技術水準還是未來的定價高低,都還遠沒到競爭出一個結果的時候,而“人”在其中起到最大作用不再是具體創作,而是作為創意舵手的把控力。
THE END
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.