99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

楊立昆親自發布:Meta最強世界模型開源

0
分享至


智東西
編譯 云鵬
編輯 漠影

智東西6月12日消息,剛剛,Meta發布了最新的開源世界模型V-JEPA 2,稱其在物理世界中實現了最先進的視覺理解和預測,從而提高了AI agents的物理推理能力。


Meta副總裁、首席AI科學家楊立昆(Yann LeCun)在官方視頻中提到,在世界模型的幫助下,AI不再需要數百萬次的訓練才能掌握一項新的能力,世界模型直接告訴了AI世界是怎樣運行的,這可以極大提升效率。

比如AI會預測我們舀出一勺東西是要放入另一個容器中:


AI甚至可以理解運動員的復雜跳水動作,并進行動作拆解:


據Meta測試數據,V-JEPA 2在測試任務中每一步的規劃用時縮短至英偉達Cosmos模型的三十分之一,同時成功率還更高。據稱V-JEPA 2使用了一百多萬小時的視頻來進行自監督學習訓練。


在Meta看來,物理推理能力對于構建在現實世界中運作的AI agents、實現高級機器智能(AMI)非常重要,可以讓AI agents真正可以“三思而后行(Think Before Acts)”。


此外,Meta還發布了三個新的基準測試,用于評估現有模型從視頻中推理物理世界的能力。

昨天Meta剛剛曝出要成立新AI實驗室、招攬28歲華裔天才少年,并豪擲148億美元(約合人民幣1061億元)收購Scale AI 49%股份的消息,今天Meta發布新世界模型,并讓楊立昆出來大講Meta AI重點研究方向和愿景做法,頗有些要為招兵買馬“打廣告”的意味。

論文地址:
https://ai.meta.com/research/publications/v-jepa-2-self-supervised-video-models-enable-understanding-prediction-and-planning/

一、世界模型讓AI有“類人直覺”,強化AI agents理解、預測、規劃能力

理解世界物理規律聽起來并不復雜,但這是AI與人類差距非常大的一個方面。

比如你把球拋向空中時,知道重力會將其拉回地面;當你穿過一個陌生的擁擠區域時,你會一邊朝目的地移動,一邊避免撞到沿途的行人或障礙物;打曲棍球時,你會滑向冰球即將到達的位置,而非它當前的位置。


▲判斷籃球的運動軌跡

但AI很難掌握這種能力,很難構建這種理解物理世界的“心理模型”。


Meta的世界模型,主要會強化AI agents的理解、預測、規劃三項核心能力。

二、關鍵架構創新大幅提升學習效率,高性能同時兼顧準確率

Meta使用視頻來訓練 V-JEPA 2,幫助模型學習物理世界中的重要規律,包括人類如何與物體互動、物體在物理世界中的運動方式,以及物體之間的相互作用。

據稱V-JEPA 2通過自監督學習,訓練了超過1百萬小時的視頻。

V-JEPA 2是一種聯合嵌入預測架構(Joint Embedding Predictive Architecture)模型,這也是“JEPA”的名稱由來。


模型包括兩個主要組成部分:

一個編碼器,負責接收原始視頻,并輸出包含對于觀察世界狀態語義上有用的內容的嵌入(embeddings)。


一個預測器,負責接收視頻嵌入和關于要預測的額外內容,并輸出預測的嵌入。


V-JEPA 2跟傳統預測像素的生成式模型有很大性能差異,根據Meta測試數據,V-JEPA 2執行任務時每個步驟的規劃用時縮短至Cosmos模型的三十分之一,不僅用時短,V-JEPA 2的成功率還更高。

V-JEPA 2的能力對現實世界agents理解復雜運動和時間動態(temporal dynamics),以及根據上下文線索預測動作都非常關鍵。

基于這種預測能力,世界模型對于規劃給定目標的動作順序非常有用,比如從一個杯子在桌子上的狀態到杯子在桌子邊上的狀態,中間要經歷怎樣的動作。


如今大部分AI都需要專業的訓練去解決特定的任務,而V-JEPA這種自監督的方式,只需要為數不多的案例,就可以掌握新的能力,在不同的任務和領域中實現更高的性能表現。


模型可以部署在機械臂上,去執行物體操作類的任務,比如觸碰(Reach)、抓取(Grasp)、選擇和擺放物體(Pick-and-place),而不需要大量的機器人數據或者針對性的任務訓練。


根據測試數據,V-JEPA 2在執行這三類任務時的成功率分為別100%、45%和73%。

三、楊立昆展示世界模型應用場景,首發三個專項基準測試

世界模型可能會有哪些應用場景,楊立昆也給大家做了一些展示。

世界模型加持下的AI agents,可以幫助視障人群更好的認知世界;


MR頭顯中的AI agents可以給更復雜的任務提供指導,比如讓教育更加的個性化;


AI編程助手可以真正理解一行新的代碼會如何改變程序的狀態或變量;


世界模型對自動化系統同樣非常重要,比如自動駕駛汽車和機器人;


Meta認為世界模型會為機器人開啟一個新的時代,讓現實世界中的AI agents不需要學習天文數字的訓練數據就可以做家務或體力勞動。

除了發布V-JEPA 2,Meta還分享了三個新基準測試,用來幫助研究界評估現有模型通過視頻學習和推理世界的能力:

1、IntPhys 2:用于測試模型在復雜合成環境中的直觀物理理解能力(Benchmarking Intuitive Physics Understanding In Complex Synthetic Environments)。

2、一種基于最小視頻對的、感知捷徑的物理理解視頻問答基準測試(A Shortcut-aware Video-QA Benchmark for Physical Understanding via Minimal Video Pairs)。

3、CausalVQA:面向視頻模型的物理基礎因果推理基準測試(A Physically Grounded Causal Reasoning Benchmark for Video Models)。

基準測試地址:

IntPhys 2:
https://ai.meta.com/research/publications/intphys-2-benchmarking-intuitive-physics-understanding-in-complex-synthetic-environments/

CausalVQA :
https://ai.meta.com/research/publications/causalvqa-a-physically-grounded-causal-reasoning-benchmark-for-video-models/

Shortcut-aware Video-QA Benchmark:
https://ai.meta.com/research/publications/a-shortcut-aware-video-qa-benchmark-for-physical-understanding-via-minimal-video-pairs/

結語:AI認知世界提速,AI從數字世界加速走向物理世界

Meta二代世界模型的發布進一步優化了模型的性能和準確率,讓物理世界的AI agents可以更高效地執行任務,而不需要海量的數據訓練,這一方向可以說是目前AI圈關注的焦點賽道之一。

隨著數據瓶頸問題越來越凸顯,如何在底層技術層面實現突破顯得更為關鍵,Meta在模型架構層面的創新是其世界模型的核心優勢。

隨著如今越來越多的視頻模型發布,AI逐漸從文本、圖像走向動態的視頻,AI理解世界、認識世界的速度不斷加快,從英偉達、Meta、谷歌這樣巨頭到各路創企,都對打造世界模型饒有興致,世界模型之戰,或許將成為后續AI產業技術競爭的關鍵看點。

來源:Meta官網

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
兩架專機降北京,百年宿敵握手言和,中國這步棋贏在哪?

兩架專機降北京,百年宿敵握手言和,中國這步棋贏在哪?

野山歷史
2025-06-14 08:19:52
萬萬沒想到!酷似馬云的范小勤,在被資本拋棄后,如今活成了這樣

萬萬沒想到!酷似馬云的范小勤,在被資本拋棄后,如今活成了這樣

歸史
2025-06-14 11:14:30
羅帥宇的通報來了,真相終于大白

羅帥宇的通報來了,真相終于大白

大張的自留地
2025-06-14 08:39:21
南航“美女經理”:除了生理期就沒閑過,兩年半和上級開房410次

南航“美女經理”:除了生理期就沒閑過,兩年半和上級開房410次

就一點
2025-06-13 16:45:25
印度網民們怒了!負責墜機飛機維修的是國企,曾讓全女工程師團隊更換787發動機

印度網民們怒了!負責墜機飛機維修的是國企,曾讓全女工程師團隊更換787發動機

不掉線電波
2025-06-14 21:25:56
伊朗被清除的高官有多重要?一幅圖說明:第一排只剩拄拐棍的了

伊朗被清除的高官有多重要?一幅圖說明:第一排只剩拄拐棍的了

昨夜軍帖
2025-06-14 16:48:38
網傳“女生萬象城遭挾持”,杭州上城警方通報

網傳“女生萬象城遭挾持”,杭州上城警方通報

環球網資訊
2025-06-14 18:57:23
李連杰宣布跟41歲兒子父親節重聚,久別30年攬實眼濕濕

李連杰宣布跟41歲兒子父親節重聚,久別30年攬實眼濕濕

快樂的小青瓦
2025-06-14 15:03:39
國內首針!47歲京東副總裁蔡磊與漸凍癥抗爭6年后,終于迎來希望

國內首針!47歲京東副總裁蔡磊與漸凍癥抗爭6年后,終于迎來希望

小嵩
2025-06-14 08:49:51
徹底翻臉?拉杜卡努怒噴鄭欽文:她暫停了3次,我無能為力

徹底翻臉?拉杜卡努怒噴鄭欽文:她暫停了3次,我無能為力

體育就你秀
2025-06-14 18:20:07
中國專列,以最快速度駛進伊朗,伊朗總統也以最快速度訪問中國!

中國專列,以最快速度駛進伊朗,伊朗總統也以最快速度訪問中國!

大道無形我有型
2025-06-14 11:32:10
武漢通報:市政府原副秘書長周大鴻,罔顧中央八項規定精神,參與違規吃喝、違規打牌

武漢通報:市政府原副秘書長周大鴻,罔顧中央八項規定精神,參與違規吃喝、違規打牌

新京報政事兒
2025-06-14 20:54:49
18月齡幼童被飯店客人灌50毫升啤酒,面部浮腫、身體多處皮疹!律師回應

18月齡幼童被飯店客人灌50毫升啤酒,面部浮腫、身體多處皮疹!律師回應

極目新聞
2025-06-14 10:41:22
伊朗不打倒神棍政權,國家將永無希望

伊朗不打倒神棍政權,國家將永無希望

廖保平
2025-06-14 09:19:25
瞞不住了,美媒曝光特拉維夫慘狀!伊朗稱:下一次齊射2000枚導彈

瞞不住了,美媒曝光特拉維夫慘狀!伊朗稱:下一次齊射2000枚導彈

今墨緣
2025-06-14 18:35:08
員工早上到達公司停車場后死亡!法院判了:不算工傷,尚未下車,未步入工作崗位

員工早上到達公司停車場后死亡!法院判了:不算工傷,尚未下車,未步入工作崗位

瀟湘晨報
2025-06-13 17:53:11
伊朗革命衛隊聲稱擊落F-35并俘獲女飛行員,以色列諷刺虛假宣傳

伊朗革命衛隊聲稱擊落F-35并俘獲女飛行員,以色列諷刺虛假宣傳

明月聊史
2025-06-14 15:56:59
波音徹底脫責?黑匣子揭露飛行員“違章操作”,印度航空壓力山大

波音徹底脫責?黑匣子揭露飛行員“違章操作”,印度航空壓力山大

金哥說新能源車
2025-06-14 16:57:24
伊朗報復以色列最新戰況!伊朗發射5輪約200枚導彈,突防效率10%不到屬于什么水平?

伊朗報復以色列最新戰況!伊朗發射5輪約200枚導彈,突防效率10%不到屬于什么水平?

軍武速遞
2025-06-14 18:51:49
國防大學的教授也是一個水貨

國防大學的教授也是一個水貨

回旋鏢
2025-06-14 15:59:57
2025-06-14 22:36:49
智東西 incentive-icons
智東西
聚焦智能變革,服務產業升級。
10005文章數 116773關注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業陪葬?

頭條要聞

"蘇超"有球隊球員年齡差20歲:初三生踢完比賽隔天中考

頭條要聞

"蘇超"有球隊球員年齡差20歲:初三生踢完比賽隔天中考

體育要聞

32隊爭10億獎金,全新世俱杯來了!

娛樂要聞

陳小春演唱會賣力唱跳 57歲仍活力滿滿

財經要聞

樓市權威發聲

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

健康
藝術
房產
游戲
手機

呼吸科專家破解呼吸道九大謠言!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

恭喜AL!拿下LPL冠軍,3-1擊敗BLG!Tarzan火影劫全場狂秀

手機要聞

澎湃OS再次公布進展通報:六大痛點迎刃而解,四大問題加速解決

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 顺昌县| 彰化市| 湘潭县| 洪泽县| 宁明县| 青川县| 温州市| 谢通门县| 景泰县| 东乡县| 图木舒克市| 昌平区| 庄河市| 泗阳县| 萝北县| 白山市| 玉龙| 玉山县| 溧阳市| 旅游| 肇庆市| 鄂托克旗| 大田县| 图木舒克市| 沁阳市| 遵义县| 汤原县| 上林县| 哈尔滨市| 什邡市| 盘山县| 玉林市| 社会| 泰来县| 兴城市| 马鞍山市| 松滋市| 固始县| 五莲县| 南木林县| 大兴区|