99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

李飛飛團(tuán)隊(duì)提出世界模型基準(zhǔn):“世界生成”能力迎來(lái)統(tǒng)一評(píng)測(cè),3D/4D/視頻模型同臺(tái)PK

0
分享至


文章轉(zhuǎn)載于量子位(QbitAI)

作者:克雷西

世界模型領(lǐng)域最新進(jìn)展,要比拼“世界生成”了。

李飛飛吳佳俊團(tuán)隊(duì)提出了全面評(píng)測(cè)基準(zhǔn)WorldScore,涵蓋了三大類評(píng)估指標(biāo),動(dòng)態(tài)靜態(tài)都有涉及,其數(shù)據(jù)集中包含了3000個(gè)測(cè)試樣例。

并且,WorldScore將3D場(chǎng)景生成、4D場(chǎng)景生成和視頻生成三類模型的評(píng)估,統(tǒng)一到了一起


利用WorldScore基準(zhǔn),團(tuán)隊(duì)對(duì)一共19款模型進(jìn)行了全面評(píng)估。

評(píng)估的結(jié)果揭示了當(dāng)前世界生成技術(shù)面臨的相機(jī)控制能力不足、長(zhǎng)序列世界生成困難等主要挑戰(zhàn),為模型研究人員提供了重要參考。

正如網(wǎng)友所評(píng)價(jià),從單一場(chǎng)景到整體世界構(gòu)建的轉(zhuǎn)變,需要這樣的基準(zhǔn)來(lái)對(duì)研究做出指導(dǎo)。


1

3D/4D/視頻生成統(tǒng)一評(píng)測(cè)

研究團(tuán)隊(duì)認(rèn)為,之前的基準(zhǔn)測(cè)試(例如 VBench)僅能評(píng)估單個(gè)場(chǎng)景的生成能力,遠(yuǎn)未達(dá)到“世界”生成的層次。


并且以前的基準(zhǔn)測(cè)試僅考慮視頻模型,但世界生成模型還包括3D和4D方法,而WorldScore可以對(duì)所有這些模型進(jìn)行統(tǒng)一評(píng)估。

WorldScore將世界生成任務(wù)分解成一系列連續(xù)的下一場(chǎng)景生成任務(wù),每個(gè)任務(wù)由三個(gè)關(guān)鍵組成部分定義:

  • 當(dāng)前場(chǎng)景:包含一張場(chǎng)景圖像和對(duì)應(yīng)的文本描述;

  • 下一場(chǎng)景

  • 布局:一系列相機(jī)矩陣定義的相機(jī)軌跡,以及描述相機(jī)如何移動(dòng)的文本說(shuō)明。


數(shù)據(jù)集方面,WorldScore包含了3000個(gè)測(cè)試樣例,其中2000個(gè)用于評(píng)估靜態(tài)世界生成能力,1000個(gè)用于評(píng)估動(dòng)態(tài)世界生成能力。

靜態(tài)世界生成數(shù)據(jù)涵蓋了10個(gè)場(chǎng)景類別,包括5類室內(nèi)場(chǎng)景(餐飲空間、居住空間、通道、公共空間、工作空間)和5類室外場(chǎng)景(城市、郊區(qū)、水域景觀、陸地景觀、綠色景觀)。

動(dòng)態(tài)世界數(shù)據(jù)則包含了5種不同類型的運(yùn)動(dòng):關(guān)節(jié)運(yùn)動(dòng)、可變形運(yùn)動(dòng)、流體運(yùn)動(dòng)、剛體運(yùn)動(dòng)和多物體運(yùn)動(dòng)。

每個(gè)測(cè)試樣例都有兩個(gè)版本——真實(shí)風(fēng)格和藝術(shù)風(fēng)格,以評(píng)估模型在不同視覺(jué)域的表現(xiàn)。


所涉及的指標(biāo)則包括了可控性、質(zhì)量和動(dòng)態(tài)評(píng)估(靜態(tài)場(chǎng)景不涉及此項(xiàng))三個(gè)大類。

其中可控性評(píng)估,具體又包括了三項(xiàng)指標(biāo):

  • 相機(jī)控制能力:通過(guò)計(jì)算生成視頻中相機(jī)運(yùn)動(dòng)與指定軌跡的偏差來(lái)評(píng)估,具體計(jì)算尺度不變的旋轉(zhuǎn)誤差和平移誤差,然后取其幾何平均值;

  • 物體控制能力:使用開(kāi)放集物體檢測(cè)模型檢查指定物體是否出現(xiàn)在生成場(chǎng)景中,從文本提示中提取1-2個(gè)關(guān)鍵物體描述,計(jì)算檢測(cè)到這些物體的成功率;

  • 內(nèi)容一致性:使用CLIPScore評(píng)估生成場(chǎng)景與完整文本描述的語(yǔ)義匹配程度。

質(zhì)量評(píng)估,涵蓋了四項(xiàng)內(nèi)容:

  • 3D一致性:使用DROID-SLAM估計(jì)每幀的密集深度圖,計(jì)算連續(xù)幀之間可見(jiàn)像素的重投影誤差,評(píng)估場(chǎng)景幾何結(jié)構(gòu)的穩(wěn)定性;

  • 光度一致性:通過(guò)計(jì)算連續(xù)幀之間的光流來(lái)評(píng)估外觀和紋理的穩(wěn)定性,使用平均端點(diǎn)誤差(AEPE)來(lái)量化不穩(wěn)定的視覺(jué)表現(xiàn);

  • 風(fēng)格一致性:計(jì)算第一幀和最后一幀Gram矩陣之間的F范數(shù)差異,評(píng)估風(fēng)格保持程度;

  • 主觀質(zhì)量:結(jié)合CLIP-IQA+和CLIP Aesthetic兩個(gè)自動(dòng)評(píng)估指標(biāo)(該組合經(jīng)過(guò)200人的人類研究驗(yàn)證最接近人類感知)。

動(dòng)態(tài)評(píng)估則包含三個(gè)方面:

  • 運(yùn)動(dòng)準(zhǔn)確性:比較指定運(yùn)動(dòng)區(qū)域內(nèi)外的光流,評(píng)估運(yùn)動(dòng)是否出現(xiàn)在正確位置;

  • 運(yùn)動(dòng)幅度:通過(guò)估計(jì)連續(xù)幀之間的光流大小來(lái)評(píng)估生成大幅度運(yùn)動(dòng)的能力;

  • 運(yùn)動(dòng)平滑性:使用視頻幀插值模型生成平滑過(guò)渡作為參考,評(píng)估生成視頻的時(shí)間連續(xù)性。


最終,所有評(píng)估指標(biāo)都經(jīng)過(guò)線性歸一化處理到0-100區(qū)間,并通過(guò)計(jì)算控制和質(zhì)量維度各指標(biāo)的算術(shù)平均值得到WorldScore-Static得分。

在此基礎(chǔ)上,再加入動(dòng)態(tài)維度的三項(xiàng)指標(biāo)成績(jī),就得到了WorldScore-Dynamic評(píng)分。

1

3D模型更擅長(zhǎng)靜態(tài),視頻模型動(dòng)態(tài)效果更好

利用WorldScore,研究團(tuán)隊(duì)對(duì)19款不同類型模型的世界生成能力進(jìn)行了評(píng)測(cè),包括2款閉源模型和17款開(kāi)源模型。


評(píng)測(cè)結(jié)果顯示,在靜態(tài)世界生成方面,3D場(chǎng)景生成模型展現(xiàn)出明顯優(yōu)勢(shì)。其中WonderWorld和LucidDreamer分別以72.69分和70.40分位居榜首,遠(yuǎn)超表現(xiàn)最好的視頻模型CogVideoX-I2V的62.15分。

在動(dòng)態(tài)世界生成方面,則是視頻模型展現(xiàn)出了較強(qiáng)的實(shí)力,開(kāi)源模型CogVideoX-I2V以59.12分的成績(jī)領(lǐng)先。


在不同場(chǎng)景類型的測(cè)試中,視頻模型在室內(nèi)場(chǎng)景表現(xiàn)相對(duì)較好,但在室外場(chǎng)景生成時(shí)與3D模型的差距明顯擴(kuò)大。

同時(shí),序列長(zhǎng)度對(duì)模型性能有顯著影響——所有模型在短序列任務(wù)上表現(xiàn)尚可,但視頻模型在處理長(zhǎng)序列時(shí)性能顯著下降,而3D模型則相對(duì)穩(wěn)定。

此外,研究者還對(duì)比了T2V和I2V兩類視頻模型的特點(diǎn)。結(jié)果表明,T2V模型在控制性和動(dòng)態(tài)生成能力方面較強(qiáng),更容易實(shí)現(xiàn)大幅度的相機(jī)運(yùn)動(dòng)。

相比之下,I2V模型傾向于保持輸入圖像的視角,雖然生成質(zhì)量較高,但相機(jī)運(yùn)動(dòng)相對(duì)保守。

1

作者簡(jiǎn)介

本文的兩名共同一作均來(lái)自吳佳俊團(tuán)隊(duì),分別是碩士生段皞一(Haoyi Duan)和博士生俞洪興(Hong-Xing Koven Yu)。

段皞一是浙江大學(xué)2023屆優(yōu)秀畢業(yè)生,還獲得了竺院榮譽(yù)學(xué)位,本科期間在周釗教授的指導(dǎo)下研究多模態(tài)學(xué)習(xí)。


俞洪興本科和和碩士均就讀于中山大學(xué),碩士期間導(dǎo)師是鄭偉詩(shī)教授(現(xiàn)任中山大學(xué)計(jì)算機(jī)學(xué)院副院長(zhǎng))。

俞洪興的主要研究方向是物理場(chǎng)景理解、動(dòng)力學(xué)模型與仿真,以及3D/4D視覺(jué)生成。


目前,兩人正在進(jìn)行密切合作。

今年入選CVPR HighLight的單圖生成交互式3D場(chǎng)景模型WonderWorld,也是兩人共同一作。


除了兩名共同一作和吳佳俊以及李飛飛之外,斯坦福碩士生Sirui (Ariel) Chen也參與了WorldScore的工作。


論文地址:
https://arxiv.org/abs/2504.00983

點(diǎn)個(gè) “愛(ài)心”,再走吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
林彪去世40周年后,他的墓前出現(xiàn)了七個(gè)人,來(lái)看都是誰(shuí)?

林彪去世40周年后,他的墓前出現(xiàn)了七個(gè)人,來(lái)看都是誰(shuí)?

歷史1949
2025-01-19 22:21:37
好萊塢大片上映,日票房擊敗《哪吒2》,奪下第二!

好萊塢大片上映,日票房擊敗《哪吒2》,奪下第二!

熱薦電影
2025-04-30 23:36:46
受關(guān)稅沖擊影響,美科技巨頭發(fā)出悲觀聲音

受關(guān)稅沖擊影響,美科技巨頭發(fā)出悲觀聲音

參考消息
2025-05-03 17:17:08
美媒:馬斯克不再在白宮辦公后,特朗普最新演講出人意料“挖苦”他

美媒:馬斯克不再在白宮辦公后,特朗普最新演講出人意料“挖苦”他

環(huán)球網(wǎng)資訊
2025-05-02 15:54:48
現(xiàn)在手握大量現(xiàn)金的人,要偷笑了,原因有這兩點(diǎn)

現(xiàn)在手握大量現(xiàn)金的人,要偷笑了,原因有這兩點(diǎn)

娛樂(lè)八卦木木子
2025-04-30 01:50:43
日媒:日本隊(duì)不會(huì)主場(chǎng)放水印尼做掉中國(guó)隊(duì) 因?yàn)槟菢犹珌G人

日媒:日本隊(duì)不會(huì)主場(chǎng)放水印尼做掉中國(guó)隊(duì) 因?yàn)槟菢犹珌G人

kio魚(yú)
2025-05-03 09:22:36
特朗普愿意和解?中國(guó)商務(wù)部爆出內(nèi)幕!中美關(guān)稅戰(zhàn)或迎變局?

特朗普愿意和解?中國(guó)商務(wù)部爆出內(nèi)幕!中美關(guān)稅戰(zhàn)或迎變局?

不凍港來(lái)了
2025-05-02 21:40:58
朱珠在北京家中設(shè)宴,老公親自下廚,吃西餐喝紅酒,看起來(lái)好高雅

朱珠在北京家中設(shè)宴,老公親自下廚,吃西餐喝紅酒,看起來(lái)好高雅

顧蔡衛(wèi)
2025-05-02 14:58:57
妻子瞞著丈夫和男同事旅游,7天后回家,丈夫:他有艾滋你知道嗎

妻子瞞著丈夫和男同事旅游,7天后回家,丈夫:他有艾滋你知道嗎

蘭姐說(shuō)故事
2025-05-03 15:00:11
川普原地掉頭,通過(guò)波蘭轉(zhuǎn)運(yùn)F16

川普原地掉頭,通過(guò)波蘭轉(zhuǎn)運(yùn)F16

難得君
2025-05-03 15:45:36
奧沙利文:趙心童配得上勝利,我的狀態(tài)已經(jīng)糟糕一段時(shí)間了

奧沙利文:趙心童配得上勝利,我的狀態(tài)已經(jīng)糟糕一段時(shí)間了

懂球帝
2025-05-03 05:04:32
32個(gè)選秀權(quán)+新雷霆三少!普雷斯蒂封神:7年內(nèi)全聯(lián)盟都得看他臉色

32個(gè)選秀權(quán)+新雷霆三少!普雷斯蒂封神:7年內(nèi)全聯(lián)盟都得看他臉色

籃球小布丁
2025-05-03 09:51:21
烈火英雄!廣東干部掰車門(mén)救人,縣委書(shū)記登門(mén)慰問(wèn),央視專門(mén)報(bào)道

烈火英雄!廣東干部掰車門(mén)救人,縣委書(shū)記登門(mén)慰問(wèn),央視專門(mén)報(bào)道

特特農(nóng)村生活
2025-05-03 08:49:06
香港知名歌手緊急入住ICU,高燒多日不退,醫(yī)生稱已無(wú)藥可救

香港知名歌手緊急入住ICU,高燒多日不退,醫(yī)生稱已無(wú)藥可救

東方不敗然多多
2025-05-02 12:51:15
被班主任誣陷作弊,從此我天天考0分,高考結(jié)束后卻被清北錄取

被班主任誣陷作弊,從此我天天考0分,高考結(jié)束后卻被清北錄取

黃家湖的憂傷
2025-04-30 17:09:56
謝浩男缺席家庭聚會(huì),小妹一句話曝光大妹的現(xiàn)狀,進(jìn)退兩難

謝浩男缺席家庭聚會(huì),小妹一句話曝光大妹的現(xiàn)狀,進(jìn)退兩難

娛貝勒
2025-05-03 16:21:22
當(dāng)服務(wù)員、擺地?cái)偅∏癟VB女星在東莞打工求生:我是一個(gè)要贍養(yǎng)父母、交房租的普通人

當(dāng)服務(wù)員、擺地?cái)偅∏癟VB女星在東莞打工求生:我是一個(gè)要贍養(yǎng)父母、交房租的普通人

魯中晨報(bào)
2025-05-03 07:24:04
劉源夫人魏珍的罕見(jiàn)留影,五官端正長(zhǎng)相大氣,不輸年輕時(shí)的王光美

劉源夫人魏珍的罕見(jiàn)留影,五官端正長(zhǎng)相大氣,不輸年輕時(shí)的王光美

萬(wàn)物知識(shí)圈
2025-05-02 08:35:11
《妻子的浪漫旅行2025》加更,餐桌文化差異大,購(gòu)物習(xí)慣大不同

《妻子的浪漫旅行2025》加更,餐桌文化差異大,購(gòu)物習(xí)慣大不同

娛娛魚(yú)
2025-05-03 15:49:08
Shams:76歲波波維奇將不再擔(dān)任馬刺隊(duì)主教練,將全職擔(dān)任籃球運(yùn)營(yíng)總裁

Shams:76歲波波維奇將不再擔(dān)任馬刺隊(duì)主教練,將全職擔(dān)任籃球運(yùn)營(yíng)總裁

雷速體育
2025-05-03 00:02:34
2025-05-03 17:55:00
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來(lái)的基礎(chǔ),歡迎來(lái)到這個(gè)星球。
2156文章數(shù) 10335關(guān)注度
往期回顧 全部

科技要聞

特朗普下手,英偉達(dá)對(duì)華“特供版”要改

頭條要聞

五一黃金"跳水"引爆搶購(gòu)潮 有游客拖箱到水貝市場(chǎng)掃貨

頭條要聞

五一黃金"跳水"引爆搶購(gòu)潮 有游客拖箱到水貝市場(chǎng)掃貨

體育要聞

北京請(qǐng)神馬布里?許利民真有“玄學(xué)”!

娛樂(lè)要聞

趙又廷節(jié)目中高調(diào)撒糖 大贊高圓圓超好

財(cái)經(jīng)要聞

巴菲特年度盛會(huì),六大看點(diǎn)前曕!

汽車要聞

易三方科技體驗(yàn)日·北京站上演硬核駕控

態(tài)度原創(chuàng)

家居
健康
教育
房產(chǎn)
親子

家居要聞

意式輕奢 低飽和質(zhì)感美學(xué)

唇皰疹和口腔潰瘍是"同伙"嗎?

教育要聞

廣州五年級(jí)孩子都在看啥書(shū) 興趣才是最好的老師

房產(chǎn)要聞

最強(qiáng)書(shū)包官宣落位!海口這個(gè)片區(qū),將徹底引爆!

親子要聞

別把孩子養(yǎng)成小胖墩,長(zhǎng)大后減肥難上加難!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 获嘉县| 昌都县| 东乡| 星座| 九台市| 泗洪县| 阳朔县| 永善县| 股票| 侯马市| 五指山市| 康乐县| 张北县| 永定县| 黄梅县| 威远县| 昌宁县| 蓬莱市| 浦城县| 鄄城县| 安徽省| 霍邱县| 孙吴县| 乌拉特中旗| 吉安市| 台南县| 崇仁县| 北宁市| 灵川县| 彰武县| 敦煌市| 广州市| 枝江市| 永安市| 达拉特旗| 宝坻区| 芒康县| 荣成市| 巴林右旗| 民乐县| 会同县|