克雷西 聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI
提質不加價,可靈新版視頻生成模型正式登場!
新版本依然是一石激起千層浪,不到24小時就有超過72萬次閱讀。
我們也帶來了新鮮實測!
沒有輔助提示詞的情況下,2.1版的圖生視頻相比于前一代1.6普通版,明顯內容更加合理了。
△上半部分為2.1新版生成,下半部分為1.6
這一波快手上線了可靈2.1的兩個版本,距離上次大更新過了一個多月:
- 2.1普通版:1080/720P,運動更好、細節更到位、更自然、畫面更流暢,且主打性價比;
- 2.1大師版:1080P,質量更高,大幅度運動表現更好(價格也更高)。
這也是快手戰略調整,成立可靈AI事業部之后,可靈大模型的第一次大更新。
有網友試用之后表示,這就是可靈對Veo3的回應。
模型一片叫好聲之余,可靈創造的業績數據也隨著快手最新一季財報新鮮出爐——
今年前三個月,快手靠可靈收入了1.5個億,超過了去年7月到今年2月可靈的收入總和。
實測可靈2.1
那我們就先來看看超高性價比的2.1普通版,具體又包括了標準的720P和高品質的1080P兩種模式。
目前普通版只支持圖生視頻,文生視頻將在之后上線(大師版已支持文生視頻)。
這樣的順序背后也有數據作為支持——此前可靈2.0上線時,快手副總裁、可靈AI負責人張迪曾介紹,在使用可靈生成視頻的用戶當中,有85%使用的是圖生視頻。
那我們就直接用可靈AI生成的圖片來嘗試一下。
一只黑白相間的貓追著蝴蝶
圖生視頻的配套提示詞則是這樣:
黑白相間的貓輕快地追逐蝴蝶,跑入盛開的花叢中,鏡頭跟隨其動作,花瓣被帶動輕輕揚起,陽光明媚的午后
來對比一下2.1普通版的高品質1080P(右)和1.6版本的高品質1080P(左)。
可以看到的是,兩個版本對于畫面理解的效果都不錯,但1.6版本中蝴蝶有兩秒像是飄在半空中。
2.1版本中貓的動作更輕快,而且視頻中蝴蝶的飛行更靈動,仔細看可以發現,當蝴蝶停在花瓣上時,由于重力的作用,花瓣飄動的幅度更大了,讓整個畫面有一種“物理真實感”。
看完小貓,再來看一組人物動作細節的對比,首幀圖是一個小男孩正在吃手里拿的面包。
這一次圖到視頻中間不加提示詞,直接讓模型自由發揮。
1.6版本(下)中,小男孩咬面包的位置和最終面包缺口不太一致,并且咀嚼動作顯得“更吃力”。
2.1版本(上)在這兩點上沒有太大缺點,咀嚼動作更自然。
最細節的是,它保留了小男孩臉上的“小痣”,而這一點被1.6版本(右)的前兩秒忽略了!
看完這個單人的細節鏡頭,再看一組多人物、大場景的例子,還是照例先生成圖像:
春節,爺爺奶奶,爸爸媽媽,1個男孩,5個人其樂融融的互相聊天,桌上的菜肴豐富
小男孩站在餐桌旁舉起紅包向家人展示,爺爺奶奶和爸爸媽媽圍坐在擺滿菜肴的餐桌前鼓掌微笑,紅色的春聯在暖黃燈光下微微飄動,五口之家其樂融融地聊天,窗外隱約可見綻放的煙花,固定鏡頭。
可以看出,“煙花”和“紅包”的元素直接被下面的1.6版給忽略了,而2.1則進行了正確復現。
另外在鼓掌的動作上,2.1版本生成的視頻看上去也更加真實。
另外,關于可靈2.1大師版,可靈官方也給出了可靈超級創作者的作品作為Demo。
在語義理解上,視頻能完整呈現提示詞信息,就連虛化的背景都能看出一種動態感。
面部細節更加真實,無論是皮膚狀態還是女人說話時面部肌肉的走向,都讓人感覺這是能在“真實物理世界”發生的事。
△作者:可靈AI超創@JH4TC
除了新模型的表現之外,價格也值得說道——
可靈這次上新的2.1模型的兩個版本,主打一個“提質不加價”,不管普通版還是大師版,都和原來的對應版本保持一致。
- 普通版標準模式(720P),5秒20靈感值,按照單獨購買靈感值計算,相當于人民幣兩塊;
- 普通版高品質模式(1080P),5秒35靈感值;
- 大師版(1080P),5秒100靈感值。
雖然數字上還是同樣的價格,但生成質量已經不是一個Level,算下來還是更便宜了。
另外在2.0時代,可靈只發了個大師版,也就是說5秒的1080P要花十塊錢,而現在標準版高品質模式直接把價格打了下來。
這樣算下來,生成高質量1080P視頻的成本也下降了。
可靈一季度創收1.5億
根據Quora(美版知乎)旗下大模型平臺Poe最新發布的模型使用趨勢報告,今年1-5月,在文生視頻領域,可靈系列模型總共占據的份額達到了30%。
并且上個月可靈2.0大師版上線后,榜一大哥Runway的份額幾乎腰斬,下降到了23.6%,降幅約四成。
除了獲得用戶的認可之外,可靈也切切實實地給快手帶來了資金收入。
快手剛剛發布的Q1財報顯示,今年第一季度可靈AI的收入,超過了人民幣1.5億元。
并且在財報的統計期間內,可靈2.0還未上線。
而據上一期(2024Q4)財報顯示,可靈AI自2024年7月啟動商業化變現以來,到今年2月的累計收入超1億元。
財報還透露,可靈AI已經廣泛應用于廣告營銷等領域,今年Q1 AIGC營銷素材的日均廣告消耗3000萬,與上一季基本持平。
可靈AI獲得的廣泛聲譽,加上財報上的優異表現,也促進了快手在AI上的進一步戰略調整。
上個月,快手成立了可靈AI事業部,成為一級業務部門,下設成立可靈AI產品部、運營部和技術部,負責可靈、可圖等系列大模型業務。
該部門負責人由快手高級副總裁蓋坤擔任,直接向程一笑匯報。
原先負責可靈大模型研發的社區科學線將繼續保留且仍然由蓋坤負責,但不再負責可靈視頻模型,而是在其之下成立基礎大模型與應用部,負責LLM大模型、多模態理解大模型以及應用技術研發。
這次結構調整,無疑凸顯了可靈AI在快手戰略中的關鍵地位。
參考鏈接:
[1]https://x.com/Kling_ai/status/1927972934112662004
[2]https://ir.kuaishou.com/system/files-encrypted/nasdaq_kms/assets/2025/05/27/4-47-29/HKEX-EPS_20250527_11687207_0.pdf
— 完 —
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.