99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

LeCun親自官宣!Meta世界模型V-JEPA 2登場!僅用62小時機器人數據,就能實現零樣本控制!

0
分享至


整理 | 夢依丹

出品丨AI 科技大本營(ID:rgznai100)

讓 AI 像人一樣理解世界并與環境互動。

Meta 重磅發布了 V-JEPA 2(Video Joint Embedding Predictive Architecture 2) 世界模型,并同時發布了三個全新的基準測試,用于評估現有模型通過視頻對物理世界進行推理的能力。

這次,Meta 首席 AI 科學家 Yann LeCun 親自出鏡,并介紹了世界模型與其他模型的不同之處。

V-JEPA 2 是一款基于視頻訓練的先進 AI 系統,旨在賦予機器更深層次的物理世界理解、預測及交互能力,向著構建更通用的AI智能體邁出關鍵一步。

一經發布,便在 X 上引發了眾多關注與討論。


目前 V-JEPA 2 在 Hugging Face 物理推理能力排行榜上排行第一,已超過 GPT-4o。



用百萬小時視頻打造「世界模型」只靠 62 小時機器人數據就能上手控制

Meta 團隊認為,未來 AI 的關鍵在于具備對現實世界進行計劃與推理的能力,而“世界模型(World Models)”正是實現這一目標的核心路徑。

此次,他們不僅開放了 V-JEPA 2 的模型代碼與權重檢查點,供研究與商業用途自由使用,也希望借此構建起更廣泛的開源社區生態,推動世界模型領域的持續進展,加速 AI 與物理世界交互方式的革新。

V-JEPA 2 相關鏈接:

論文地址:https://ai.meta.com/research/publications/v-jepa-2-self-supervised-video-models-enable-understanding-prediction-and-planning/ GitHub:https://github.com/facebookresearch/vjepa2 HuggingFace:https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6

V-JEPA 2 基于聯合嵌入預測架構(JEPA)構建,核心由兩大組件組成:

  • 編碼器(Encoder):接收原始視頻輸入,并輸出嵌入表示,捕捉所觀察世界狀態中的關鍵語義信息;

  • 預測器(Predictor):結合視頻嵌入與具體的預測任務上下文,生成對應的預測嵌入結果。

V-JEPA 2 的訓練過程分為兩個階段:

第一階段:無動作預訓練

Meta 使用了來自多個來源的超過 100 萬小時視頻和 100 萬張圖像,為模型構建了豐富的感知語義基礎。該階段的核心目標是學習物體、人與環境之間的交互邏輯,不涉及任何控制指令。

在完成這一階段后,V-JEPA 2 就已展現出出色的理解與預測能力:

  • 在 Something-Something v2 動作識別任務中,僅通過凍結編碼器特征并訓練輕量注意力讀出模型,V-JEPA 2 就取得了優異成績。該任務強調對運動和操作行為的理解。

  • 在 Epic-Kitchens-100 動作預測任務 中,通過凍結編碼器和預測器,再訓練注意力讀出模塊,V-JEPA 2 創造了新的 SOTA 紀錄。該任務需要模型從第一人稱視頻中預測接下來 1 秒可能的動作(包括名詞與動詞)。

  • 此外,將 V-JEPA 2 與語言模型結合,在視頻問答基準任務上(如 Perception Test 和 TempCompass)也實現了領先的性能。

第二階段:動作條件訓練

在掌握世界如何變化的通用模式后,V-JEPA 2 進入了更貼近真實 Agent 的訓練階段——結合動作信息進行規劃學習。


Meta 使用機器人數據(包括視頻觀察和控制動作)引導預測器進行有條件推理:模型在預測未來時,會考慮當前執行的動作,從而具備可控性。令人驚訝的是,這一階段僅使用了 62 小時的機器人數據,就能訓練出一個具備控制能力的模型

超 3000 人的「AI 產品及應用交流」社群,不錯過 AI 產品風云!誠邀所有 AI 產品及應用從業者、產品經理、開發者和創業者,掃碼加群:

進群后,您將有機會得到:


· 最新、最值得關注的 AI 產品資訊及大咖洞見

· 獨家視頻及文章解讀 AGI 時代的產品方法論及實戰經驗

· 不定期贈送熱門 AI 產品邀請碼

從理解到執行:零樣本機器人控制能力驗證

Meta 在實際環境中驗證了 V-JEPA 2 的遷移與泛化能力。團隊在開源 DROID 數據集上完成模型訓練后,直接部署到實驗室機器人,無需針對部署場景再進行微調。

在多個演示中,V-JEPA 2 展示了強大的零樣本任務規劃能力,尤其在此前從未見過的物體和環境中,完成了以下任務:

  • 短期任務(如物體 拾取與放置):以圖像形式設定目標,模型通過對當前狀態與目標狀態的嵌入,預測一系列動作后果,并實時重規劃,執行最優動作。

  • 長期任務(如將物體移動至指定位置):系統會設定一系列視覺子目標,機器人按順序完成各階段目標,類似人類的模仿學習過程。

  • 最終,在完全新環境中,V-JEPA 2 在 新物體的拾取與放置任務中達成 65%~80% 的成功率,展示了“世界模型”在實現通用機器人智能方面的廣闊潛力。


什么是世界模型?

與此同時,Meta 團隊還向大家詳細介紹了什么是世界模型。

人們對于物理世界的直觀理解根深蒂固。例如,人們普遍認知到,拋向空 中的網球會被重力拉回地面,若其懸停、驟然轉向或變為他物,則會令人感到詫異。這種物理直覺并非成年人教育的產物,而是幼兒在掌握語言之前,通過觀察周圍環境便已逐漸形成的本能認知。

預測世界對自身或他人行為的反應,是人類在日常生活中持續運用的一項核心能力,尤其在規劃行動路徑和應對陌生情境時至關重要。

正是這種內化的“世界模型”賦予了人類直覺,并如同一個內部模擬器,使人能夠預估假設行為的后果,從而選擇最能達成目標的行動方案。

在實際行動前,人類會運用其內在的世界模型來構想潛在結果。因此,在構建能夠“三思而后行”的AI智能體時,一個核心目標便是讓它們學習到同樣強大的世界模型。這樣的世界模型應具備以下關鍵能力:

  • 理解(Understanding):AI的世界模型需能透徹理解對客觀世界的觀察,包括但不限于識別視頻中的物體、行為及 運動模式。

  • 預測(Predicting):該模型應能準確預測世界的自然演化趨勢,以及在智能體采取特定行動后世界可能發生的變化。

  • 規劃(Planning):基于其預測能力,世界模型必須能夠有效地規劃出一系列連貫行動,以實現預設的目標。


三大物理理解基準測試

與此同時,Meta 還發布了三項全新的物理理解基準測試: IntPhys 2、MVPBench、CausalVQA, 來評估當前 AI 模型對物理世界理解的合理性、因果關系和反事實的理解能力。

雖然人類在這些任務中的準確率高達 85%~95%,但包括 V-JEPA 2 在內的領先模型仍與人類存在明顯差距,也為下一階段模型演進提供了清晰目標。

  • IntPhys 2:判斷“哪一段違反了物理規律”,專注于測試模型是否具備直覺物理常識。


  • MVPBench 識別“細微差異下的真實因果”:通過構造一對幾乎一致的視頻和問題,迫使模型跳脫表層線索,真正理解視頻中的物理因果關系。


  • CausalVQA:回答“如果、接下來、為了什么”,旨在測試視頻模型對物理世界因果關系的理解深度


V-JEPA 2 代表了 Meta 在實現高級機器智能(AMI)及構建能在物理世界中運行的實用 AI 智能體目標上的又一重要進展。


下一步

目前 V-JEPA 2 仍以單一時間尺度進行預測,而現實任務往往需要跨時間與空間的復雜規劃。

下一階段,Meta 團隊將重點探索分層式世界模型,讓 AI 能夠像人類一樣,將復雜任務拆解為多個步驟并進行推理與執行。

同時,還將推進多模態建模能力,融合視覺、聽覺、觸覺等多種感知信息,提升 AI 對世界的理解與預測水平。團隊也將持續開源成果,推動這一方向的發展。

參考鏈接:https://ai.meta.com/blog/v-jepa-2-world-model-benchmarks/

2025 全球產品經理大會

8 月 15–16 日

北京·威斯汀酒店

2025 全球產品經理大會將匯聚互聯網大廠、AI 創業公司、ToB/ToC 實戰一線的產品人,圍繞產品設計、用戶體驗、增長運營、智能落地等核心議題,展開 12 大專題分享,洞察趨勢、拆解路徑、對話未來。

更多詳情與報名,請掃碼下方二維碼。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
國內787機長分析印度墜機原因:不排除飛行員重大操作失誤的可能

國內787機長分析印度墜機原因:不排除飛行員重大操作失誤的可能

可達鴨面面觀
2025-06-13 18:05:27
美媒:以色列對伊朗發動襲擊前,五角大樓附近披薩店訂單激增

美媒:以色列對伊朗發動襲擊前,五角大樓附近披薩店訂單激增

環球網資訊
2025-06-14 12:22:15
新華社快訊:德黑蘭上空傳出巨大爆炸聲

新華社快訊:德黑蘭上空傳出巨大爆炸聲

新華社
2025-06-14 01:03:03
以色列暴擊伊朗,南宋路線再次破產

以色列暴擊伊朗,南宋路線再次破產

暢明談宏觀坤
2025-06-13 14:06:27
黃仁勛回應任正非最新講話

黃仁勛回應任正非最新講話

第一財經資訊
2025-06-13 22:47:36
社評:拆掉華為基站讓巴拿馬更安全了嗎

社評:拆掉華為基站讓巴拿馬更安全了嗎

環球網資訊
2025-06-14 00:16:25
鄭欽文:我不是故意要摔倒兩次的,只是我還不懂怎么在草地上奔跑

鄭欽文:我不是故意要摔倒兩次的,只是我還不懂怎么在草地上奔跑

懂球帝
2025-06-14 07:19:09
梁朝偉劉嘉玲在上海,兩人手牽手好恩愛,劉嘉玲臉變了撞臉蔡明

梁朝偉劉嘉玲在上海,兩人手牽手好恩愛,劉嘉玲臉變了撞臉蔡明

界史
2025-06-14 10:07:54
原重慶市市長黃奇帆:如果現在還有人認為房地產會反彈上漲,那他對經濟肯定是沒什么認知的

原重慶市市長黃奇帆:如果現在還有人認為房地產會反彈上漲,那他對經濟肯定是沒什么認知的

互聯網思維
2025-06-13 23:33:51
伊朗稱若再受到襲擊將會封鎖霍爾木茲海峽 外交部回應

伊朗稱若再受到襲擊將會封鎖霍爾木茲海峽 外交部回應

新京報
2025-06-13 16:30:27
中紀委怒批公務員也是人!正常生活不應問責處!

中紀委怒批公務員也是人!正常生活不應問責處!

霹靂炮
2025-06-13 23:49:27
一場丑陋的總決賽!雷霆扳成2-2,裁判嚴重搶戲,亞歷山大轟35分

一場丑陋的總決賽!雷霆扳成2-2,裁判嚴重搶戲,亞歷山大轟35分

老梁體育漫談
2025-06-14 11:31:53
開香檳?步行者名宿末節笑嘻嘻合照 最終卻被翻盤……

開香檳?步行者名宿末節笑嘻嘻合照 最終卻被翻盤……

直播吧
2025-06-14 11:40:20
以色列否認F-35戰機被伊朗擊落

以色列否認F-35戰機被伊朗擊落

財聯社
2025-06-14 12:37:12
中共中央批準:陳杰同志任上海市委常委

中共中央批準:陳杰同志任上海市委常委

新民晚報
2025-06-13 22:22:54
唏噓!71歲伊萬遭解雇后深夜乘機離開中國,無球迷送行+眼神落寞

唏噓!71歲伊萬遭解雇后深夜乘機離開中國,無球迷送行+眼神落寞

我愛英超
2025-06-14 00:38:32
上海航空突發!機艙內冒出濃煙!有人涉嫌違規…乘客礦泉水接力撲救,“劫后余生的感覺”

上海航空突發!機艙內冒出濃煙!有人涉嫌違規…乘客礦泉水接力撲救,“劫后余生的感覺”

上觀新聞
2025-06-14 11:57:34
伊萬凌晨離開中國飛往卡塔爾,足協已終止和他的合作

伊萬凌晨離開中國飛往卡塔爾,足協已終止和他的合作

魯中晨報
2025-06-14 07:54:08
南航“美女經理”:除了生理期就沒閑過,兩年半和上級開房410次

南航“美女經理”:除了生理期就沒閑過,兩年半和上級開房410次

就一點
2025-06-13 16:45:25
孫繼海接受《足球之夜》專訪,談到世預賽失利,就是實力不濟!

孫繼海接受《足球之夜》專訪,談到世預賽失利,就是實力不濟!

田先生籃球
2025-06-13 11:58:33
2025-06-14 13:12:49
AI科技大本營 incentive-icons
AI科技大本營
連接AI技術的創造者和使用者
2526文章數 7599關注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業陪葬?

頭條要聞

牛彈琴:中東大戰開啟 以色列遭受幾十年來最猛烈攻擊

頭條要聞

牛彈琴:中東大戰開啟 以色列遭受幾十年來最猛烈攻擊

體育要聞

32隊爭10億獎金,全新世俱杯來了!

娛樂要聞

鳳凰傳奇曾毅手表引爭議 含性暗示元素

財經要聞

樓市權威發聲

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

手機
健康
本地
旅游
房產

手機要聞

小米 Poco F7 手機渲染圖曝光:驍龍 8s Gen 4 芯片、7550mAh電池

呼吸科專家破解呼吸道九大謠言!

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 梨树县| 蒲城县| 中阳县| 文化| 衡阳县| 滦平县| 漳平市| 肇庆市| 盐津县| 长顺县| 翁牛特旗| 新巴尔虎左旗| 福贡县| 晋宁县| 临颍县| 佛冈县| 茶陵县| 象山县| 辽阳县| 栾城县| 玛多县| 博乐市| 临漳县| 平昌县| 安阳县| 静安区| 辽宁省| 深圳市| 穆棱市| 库尔勒市| 富民县| 丰县| 乌鲁木齐县| 木兰县| 霍城县| 黄山市| 阿坝| 西林县| 建湖县| 梅州市| 盐城市|