6月6日,智源研究院在“2025智源大會”上發布“悟界”系列大模型,宣告其從“悟道”時代邁入“具身智能”探索階段。
智源研究院院長王仲遠在接受《每日經濟新聞》記者在內的媒體采訪時表示,“AI(人工智能)正加速從數字世界走向物理世界”,這是推動其戰略升級的根本邏輯。
王仲遠 圖片來源:主辦方供圖
這一判斷背后,是AI技術與應用邊界的重構。當前,主流大模型大多聚焦在C端文本生成、語言對話等“數字智能”場景,而智源試圖將AI推向更具挑戰性也更具想象空間的“現實世界”——包括機器人、操作系統與世界模型的構建。在王仲遠看來:“這個世界不需要那么多‘博士’,更需要能執行任務、能落地的AI。”
“具身智能”正成為下一場AI競賽的起點。王仲遠判斷,具身智能的“小組賽”還沒結束,遠沒有到“淘汰賽”。但誰能在這一新賽道率先跑通技術路徑、突破數據瓶頸,誰或將定義人工智能的下一個十年。
從“悟道”到“悟界”,AI正邁入現實物理世界
“人工智能正加速從數字世界走向物理世界,這是我們對整個大的技術發展趨勢的判斷。”在采訪中,王仲遠以這句話點明了智源研究院由“悟道”大模型升級至“悟界”大模型背后的核心邏輯。人工智能技術正經歷從以語言理解和推理為核心的“數字智能”,邁入與現實環境互動的“具身智能”階段。
從早期的“悟道”系列到如今的“悟界”系列,智源研究院的戰略轉向并非突如其來,而是“水到渠成”。王仲遠坦言:“我們認為人工智能最終要造福人類社會,要幫助大家擺脫繁瑣的、重復的、簡單的勞動,使得大家能夠更多地享受生活,享受這個世界。”他進一步指出,大模型技術不應止步于文本生成、語言對話等C端應用,而應繼續向現實世界滲透,服務實際場景。
在技術路徑上,王仲遠強調,目前整個大模型的發展基本上都還處在數字世界,尤其是C端應用,比如聊天工具、對話模型。“但我們也堅定地認為,這個世界并不需要那么多‘博士’。”在他看來,AI不應僅用于提升智能“學術型”表現,更應拓展其實際執行力,服務現實世界需求。
此次“悟界”系列模型的發布,正是在此背景下的延伸嘗試。據介紹,“悟界”不僅繼續強化了模型的推理能力,也嘗試將AI從虛擬認知延伸至真實物理世界的感知與交互中。這一進程的核心技術支點,就是“世界模型”(World Model)的探索。
然而,目前“世界模型”尚無標準定義。王仲遠坦言:“在全世界范圍內,大家都還沒有非常明確的定義。有些叫空間智能,有些叫時空智能,也有其他不同叫法。”智源內部將其理解為一種原生多模態世界模型,本質上是通過單一模型捕捉世界規律的嘗試。這些規律不僅包括物理規則,也涵蓋人與世界交互的機制,例如類腦神經系統中的模塊化處理方式。
王仲遠特別強調,他并不試圖為世界模型下一個絕對定義,而是“代表我們對于使用人工智能探索世界的一種實踐路徑”。
具身智能賽道“小組賽”尚未結束,遠沒有到“淘汰賽”
在人工智能走出數字世界的過程中,如何構建“具身智能”成為研究核心。所謂具身智能,意指AI系統具備與現實物理世界交互的能力,能夠在復雜環境中感知、規劃、執行任務。
圍繞機器人形態的選擇,當前學界與業界依舊存在眾多分歧。例如,有觀點認為當下對人形機器人的熱衷或許走錯了方向,四足構型可能更實用。對此,王仲遠表示:“具身智能不代表一定是人形機器人。”他指出,智源開發的RoboOS操作系統已經能夠適配多種構型,包括機械臂、輪式、雙足、四足等。
不過,王仲遠并不否認人形機器人的長遠價值。他認為,人類社會的基礎設施是圍繞人類構型打造的,從長遠看,人形機器人更容易融入現有社會系統。此外,人形構型在數據訓練上也更具優勢。“我們做具身大腦模型時發現,人形構型更有利于利用現有視頻數據學習,而四足機器人所需的數據更稀缺,獲取難度更大。”
除了機器人形態,另一個具身智能的發展關鍵點是“大小腦協同框架”,即如何在AI系統中實現決策層與執行層的高效配合。王仲遠介紹,智源推出的RoboOS便是實現大小腦融合的一次嘗試。
不過,他同時指出,目前的技術仍遠未成熟。“我的一個堅定觀點是,具身智能的‘小組賽’還沒結束,遠沒有到‘淘汰賽’。”王仲遠認為,從長期趨勢看,大小腦融合的模型是有可能實現的,可能需要五到十年,但絕不是今天,原因很簡單,就是數據受限。當前的感知數據尚無法支撐統一模型的訓練和泛化,這也直接限制了人工智能在多任務場景中的能力擴展。
王仲遠認為,具身智能的最大挑戰,是如何從專用任務逐步過渡到具備一定泛化能力,再發展為真正能夠解決各種問題的通用系統。他指出,這正是AI從1.0(專用)邁向2.0(通用)的過程。
此外,王仲遠也談到具身智能研究的另一大困境——“數據難題”。他表示:“做具身模型,現在數據非常稀缺,我們采集和補充回來的也比較少。”這一問題不僅影響訓練,還限制了模型在感知層和決策層之間的協同能力。
“真實世界的數據肯定重要,但它是不是足以訓練出一個有價值的模型,這在學術界是有爭議的。”王仲遠表示,具身智能的突破路徑,或可借鑒當前大模型發展的技術演進邏輯,即在大規模已有數據的基礎上進行能力預訓練,隨后結合少量真實世界數據,通過強化學習不斷迭代模型能力。
他認為,這種“基礎模型+強化學習”的技術路線,有望在物理世界中同樣奏效。當前大模型的發展已經驗證,基礎能力達到一定水平后,借助強化學習可以進一步激發智能表現。“所以我們認為,具身智能或者物理世界的AI很可能也會有類似的技術路線。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.