聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI
圖像生成界的“大魔王”Midjourney也來卷視頻生成了?!
上面展示的就是一個視頻效果。
可以看到跑步動作和人物、空間轉換非常絲滑。
下面這個挖蛋糕的場景不僅逼真,勺子上還有倒影,非常細節了。
一石激起千層浪,消息一出,Reddit點贊量直達2.5k。
還引發了網友們激烈討論。
有人說“這是第一次以為是人工拍攝的視頻”、“幾乎和現實無法區分”。
不僅視頻模型表現良好,Midjourney的圖像模型V7也在不斷更新中。
不僅效果驚人,價格還由你來定
再來看看更多的效果演示。
多人物動作和視角切換也非常絲滑。
小貓的動作和人手的動作都很有物理真實感。
小狗滑滑板來了~
汽車漂移也不在話下。
小貓美甲確實很精細,但更細節的是手部的紋路,手指上居然還有指紋(雖然有一部分指紋是缺失的)
不過,也正如上面那位網友所說,有些地方還是不太合理的。
比如,這個疊毯子的場景中,雖然考慮到了手部發力扯出的褶皺,給人一定的物理真實感,但是后面像是毯子自己縮回去了……
還有這個,怎么感覺是爬了一段無意義的樓梯,而且女人右手上的花突然飄到了左手上,就為了右手能搭上樓梯。
總體看下來,Midjourney的這個視頻生成模型在物理真實感紋路細節動作平滑程度上表現還是很不錯的。
但是,如果看過之前Veo 3的效果,你會不會覺得Midjourney這些視頻哪里有點問題——
沒有音頻功能
是的,網友們也發現了這一點。
于是,就有人提出質疑了,Midjourney這時候入局是不是有點晚了?
不過,就在前兩天,Midjourney公開進行了公司會議,展示了部分視頻生成的演示,并且提到了“動畫化圖片”,似乎是與其他視頻生成模型相區別的功能。
實際上,相比于寫實風格,動畫風才是Midjourney更擅長的。
目前,Midjourney的視頻模型還沒有正式發布,正在做最后的完善。
團隊呼吁大家積極參加視頻評分,以幫助模型學習人們在視頻中喜歡看到的動作和構圖組合。
并且,Midjourney還非常有誠意地表示,希望大家給些建議,讓定價能夠滿足每個人的需求。
不得不說,這波操作也是非常有誠意了。
Midjourney V7支持語音生圖
除了視頻模型,生圖模型Midjourney V7也在不斷更新中。
從今年3月份開始,Midjourney不斷呼吁用戶積極參加圖像評分,用來對V7進行最終完善。
在4月份, Midjourney發布了V7 alpha
有Relax和Turbo模式兩個版本。
下面是一些效果圖,可以看到,V7生成的手部紋理是非常逼真的。
V7的旗艦功能是“草稿模式”
在使用這個功能時,提示欄將更改為“對話模式”
比如,告訴它用貓換隼或讓它變成夜晚,它會自動操作提示并開始一項新工作。
點擊“草稿模式”然后點擊麥克風按鈕以啟用“語音模式”——你可以大聲思考,讓圖像如夢境一樣在生成區流動。
也就是說,通過說話就能生成圖像,并且可以生成多圖任君選擇~
草稿模式讓生成成本減半,渲染圖像速度提升了10倍。
目前,團隊也已經將“草稿模式”與“對話模式“區分開,你可以自由選擇如何單獨或者組合使用這些功能。
團隊還推出V7快速模式,也就是更新了加速的功能。
這意味著在快速模式下模型優化需40秒,在Turbo模式下將僅耗時18秒。
經過團隊不斷努力,目前,Midjourney V7圖像生成速度提升了約40%
快速模式作業渲染時間從36秒減少到22秒。
Turbo作業渲染時間從13秒減少到9秒。
圖像模型V7不斷更新,還即將推出視頻模型,Midjourney不愧是卷王!
[1]https://www.reddit.com/r/singularity/comments/1lbwaek/midjourneys_first_video_model/
[2]https://x.com/trbdrk/status/1933992009955455193
[3]https://x.com/midjourney/status/1932876980237877754
— 完 —
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.