作者 | 丸丸柚貝
郵箱 |wangxianxian @pingwest.com
1
1080P特效炸裂,全球第二的視頻模型有多強?
MiniMax憋了半年的Hailuo 02視頻大模型,昨天半夜終于上線了!
官方demo一放,有網友喊著“鈕祜祿·螺,起駕回宮”。
視頻效果說實話確實一點都不AI!但真實水平還是得測過才能評價,今天我們也拿到了內測名額,實測一下Hailuo 02究竟是不是回宮的那位!
1
先看模型實力:全新架構、榜單前排
Hailuo 02此次升級采用了NCR(Noise-aware Compute Redistribution)新架構,直接將訓練和推理效率提升了 2.5 倍,模型的總參數量相較于Hailuo 01擴大了3倍,數據量擴大了4倍,讓模型能夠理解更加復雜的指令和物理場景。
在全新架構的加持下Hailuo 02在 Artificial Analysis Video Arena 的 Image-to-Video 榜單位列全球第二,僅次于字節的 Seedance 1.0,已把 Google Veo 3、可靈 2.0 甩在身后。
1
實測:AI這下可以把牛頓的棺材板焊死了
官方給出的Hailuo 02模型的各種成績確實很亮眼,demo演示的效果也很驚艷,接下來咱們用幾個案例深度測評一下,看看Hailuo 02這全球第二的名頭虛不虛。
測試1:復雜物理場景理解
提示詞:“一位年輕女子的半身像,她有著淡淡的棕色眼睛和深色的眉毛,站在墻邊。一部電影正投射在她身上?!?/blockquote>提示詞:“雨夜,四十多歲的男人面容嚴肅,站在高樓樓頂,風衣下擺被風吹動,鏡頭拉近到他半張臉,雨水順著下巴滴落?!?/blockquote>Hailuo 02對于光影、雨、風等物理場景的理解可以做到1:1還原現實世界,無論是少女臉上的投影還是在男人隨風擺動的衣服,臉上滑落的雨水,生成的效果都非常真實。
測試2:復雜指令遵循
提示詞:“遠處廣場上人群涌動;鏡頭迅速下降至鐘樓上的狙擊點,瞄準鏡的十字線特寫鎖定在大樓窗口的男子身上?!?/blockquote>提示詞:“新聞直播畫面,電視屏幕特寫——通緝令照片與電視前男子的真實面容重疊;他脫下帽子,冷笑一聲,鏡頭拉遠,他消失在貧民窟的人群中,全景鏡頭?!?/blockquote>Hailuo 02能夠理解復雜變化的畫面場景,可以從廣場,鐘樓到狙擊點特寫一鏡到底,也可以從電視畫面絲滑轉場到新的場景,具有電影戲劇化的同時,也非常完整的理解了提示詞中的所有信息。
測試3:圖生視頻
提示詞:“唐僧行走于天宮之中,從玉皇大帝和諸神中走向鏡頭”提示詞:“泳池里的labubu游到岸邊,換上泳衣,躺在沙灘椅上,悠閑地喝著飲料。"Hailuo 02的圖生視頻可以讓人物保持高度一致的同時,還能按照原畫風生成后續內容,并且整體畫面非常穩定。
如果測試內容看的還不夠爽,那下面這個100%用Hailuo 02生成的《暗影追蹤》電影預告片,值得一看!
從 Hailuo 01 到 02,MiniMax 僅用半年把分辨率拉到 1080p、把復雜動作做到“雜技級”,并在全球榜單硬生生卷進前三。而在可落地的 API、可負擔的單價與社群氛圍的三重加成下,Hailuo 02 已不只是“國產之光”,更像一臺大眾化的“AI 攝影機”。
接下來,1080p10s、4K、分層編輯、長視頻一致性——相信都已寫在 MiniMax 的路線圖里。我們坐等下一次刷新認知的時刻。
點個愛心,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.