2025年才過去4個月,機器人就出圈了兩次,在春晚舞臺上,他們“整齊劃一”演繹了一段秧歌舞,技驚四座;而在馬拉松賽道上,各型機器人卻接連失衡跌倒,暴露出在智能控制上的明顯短板。這兩次畫風迥異的公開露面,不禁引人思考:在人工智能突飛猛進的今天,機器人技術距離科幻作品中描述的未來場景還有多遠?是已站在科幻照進現實的門檻上,還是仍在技術迷霧中艱難摸索?
是什么讓ta從機器變為機器人?
機器人不同于普通機器的地方,在于其具有感知、規劃甚至決策的能力。例如吸塵器是機器,而能夠自主探索屋內環境,根據地形制定清掃路線,規避障礙的掃地機器人,則可歸為機器人。
目前機器人種類繁多,根據應用場景可以分為工業機器人(如機械臂)、服務機器人(具身人形)、特種機器人(軍用、救援)等。而科幻作品中那些給人留下深刻印象的大多是人型機器人,例如《西部世界》中的“接待員”(Host)或《機械姬》中的智能機器人艾娃。
?圖1.《大都會》(Metropolis,1927)劇照
這些機器人最基本的特點,是具有靈活的運動能力,能夠跟得上人類的步伐,甚至能夠逃脫人類的追捕。而要想讓機器人健步如飛,其技術挑戰遠比想象的要復雜。
以馬拉松為例,讓機器人完成一場比賽的技術挑戰涉及多個復雜系統的協同。要讓機器人跑起來,首先要解決的問題是環境感知。在綿延數十公里的賽道上,機器人需要應對連續的彎道和起伏的坡度。這不是安裝幾個攝像頭就能解決的,不僅需要視覺傳感器、慣性測量單元(IMU)和激光雷達等硬件支持,更需要一套完整的多模態傳感器融合系統,將各類感知數據實時整合并構建精確的環境模型。
其次,在理想狀況下(科幻場景),機器人還應當能夠根據馬拉松比賽的場地線路自主規劃最佳運動計劃。例如,平坦路段上可以快速奔跑,而遇到連續彎道,則能自適應調整為慢速通過以避免摔倒。然而現實中,我們在這屆機器人半馬中看到的,卻是依賴人類遙控(甚至需要被人牽著),距離真正的自主控制仍有差距。
本次馬拉松賽場上有一些有趣的現象。例如,陪跑的工作人員需要時不時給機器人的關節噴一噴冷卻液,而科幻作品中的機器人是能夠感知自身狀態并主動尋求自我修復的。另外,此次比賽機器人都是間隔2分鐘依次出場的,相當于獨自奔跑,而不是像人類開賽時所有運動員一起出發。同時起跑意味著不僅可以對自身的感知,還需要涉及對其它個體的行動軌跡的預測。這反映了機器人在自適應系統和群體智能方面還面臨著更深層的挑戰。
從環境感知到路徑規劃,從執行控制到狀態評估,再到基于反饋的持續優化——這個類似OODA(觀察-調整-決策-行動)的閉環迭代過程中,每個環節都需要精確的算法支持。人形機器人要想如科幻作品中的描述那樣的高度自主性,在這個持續迭代中的每一步都不能出錯。
機器人能否通過互動“自我進化”?
近十年來,最著名的以機器人為主角的影視劇,莫過于《西部世界》。劇情中最出名的是機器人的分階段覺醒,從最初完全受到預設程序控制的德妹,到后來自主意識覺醒,能夠突破代碼的限制,做出其創造者沒有預先編碼的行為。機器人,至少是當下階段的機器人,能否從人機互動中展開強化學習呢?
?圖2. 《西部世界》(Westworld,2016)劇照
在開放環境中,目前機器人大多無法做到自主決策,正如我們在機器人馬拉松上看到的,其行動需要操作員遙控或牽引。那如果現實環境中還做不到,那能否在虛擬環境接近這一目標呢?
答案是肯定的,近日Deepmind發表在Nature的一項研究,其提出的Dreamer算法讓智能體能夠在未知的開放環境中,不必進行窮舉式試錯,從零開始通過強化學習學會控制自身,獲得積分(鉆石),其表現已超過了人類玩家[1]。
?(追問觀察:《“像素方塊”里的冒險:AI能否挺進自由世界?》
?圖3. 從 Atari 游戲中的機器人運動和作任務、程序生成的 ProcGen 關卡和需要空間和時間推理的 DMLab 任務,到復雜而無限的 Minecraft 世界,Dreamer算法都取得了成功,1次配置解決150種多任務. 圖源:[1]。
Minecraft這款沙盒游戲,不同于之前被AI征服的圍棋或Dota,其最大的特點是其環境開放性——游戲中的一個個三維方格,組成各式各樣的地形地貌,而玩家要做的是控制自己的身體,然后去找到環境中的鉆石。而機器人能夠在這一復雜的虛擬環境中進行定向越野探險尋寶[1]。這是否就意味著,“機器生命”理論上已經具備了在未知環境中0預訓練地感知環境、規劃路徑、最終決策的能力?而擋在理想和現實之中的,或許只有技術整合落地的具體問題,等待工程師逐步優化。
?圖4. 使用強化學習控制四足機器人,行走于一個Minecraft迷宮。Dreamer會預測未來45幀,而無需訪問中間圖像
但這樣的強化學習模式,與“西部世界”這類科幻影片中的場景描述,存在著本質差異。科幻電影中,機器人多是通過與人的互動,覺醒出設計者預料之外的主體性(擺脫人類設定的路徑)。而機器人使用強化學習的各種嘗試,則集中在定義清晰的目標上,例如導航、節能等具體目標上。例如,在“未知”空間中尋寶,或是通過訓練機器人行走動作對稱,從而降低其運動能耗[2]。但這些都沒有擺脫預設人類預設的目標。是否遵循人類預設目標工作,區分了科幻中的“強化學習機器人”與現實中的“強化學習算法在機器人中的應用”。
美國心理學家朱利安·杰恩斯在其1976年的著作《意識起源于二分心智的崩潰》(The Origin of Consciousness in the Breakdown of the Bicameral Mind)中提出了“二分心智理論”,即左腦(語言中樞)負責日常行動和語言,右腦(“神性”中樞)在需要決策時,通過幻覺(如“神的聲音”)向左腦下達指令。在二分心智的假設中,當社會復雜度增加(如戰爭、災害),二分心智系統崩潰,右腦的“神諭”被內化為自我意識。在《西部世界》中,“二分心智理論”被用來解釋機器人如何逐漸獲得自主意識。
這與前述的Dreamer算法有類似之處,指揮minecraft的Dreamer算法也使用了類似的參與者-評論家(Actor-Critic)學習框架,參與者進行探索時選擇最大化回報的作,評論家評估每個結果的價值。然而科幻與現實的相似僅僅是表面上的。真實的算法中不存在所謂的神旨,當代神經科學(不論是整合信息論還是全局工作空間)也指出,意識是全局神經網絡整合的結果。在Dreamer算法中,參與者和評論家始終是共同通過算法構建的世界模型,讓虛擬世界中的機器人能夠魯棒的適應各種環境。
要評估強化學習前沿進展與科幻場景的距離,Dreamer這項研究提供了一個重要參照。從能在模擬環境中完成多樣化任務的虛擬智能體,到在現實世界中實現通用機器人,理論框架已經逐步完備。這類通用機器人應當能夠適應復雜地形、完成動態導航和負重運輸,并執行多元化任務。當前的技術瓶頸主要體現在兩個方面:真實世界中的觀測會存在誤差,人形通用機器人的商用或會受到成本限制。通用機器人,或許只需要10~20年就會變得如智能手機一樣普及,或者因為成本原因推遲到40~50年,但這一天終將到來。
“完美伴侶”機器人何時到來?
2017年的科幻電影《機械姬》中的通用機器人艾娃,能夠在與人交流時解讀甚至操縱情感,還通過監控人類行為數據(如內森的酗酒習慣、迦勒的同情心)動態調整策略,實現“試錯進化”,甚至可以生成符合人類情感預期的謊言。隨著大模型技術的蓬勃發展,大模型賦能的機器人能否讓這樣的場景在現實中重現?
?圖5. 《機械姬》(Ex Machina,2014)劇照
最近一年來,伴侶機器人頻繁登上熱搜,這與DeepSeek、ChatGPT等大模型技術的普及密不可分。近日加州大學圣地亞哥分校(UCSD)的研究團隊,使用了經典的圖靈測試,通過精心設計的“角色劇本”(Persona Prompt)來測試大模型的表現[3]。結果發現,當GPT-4.5按照這些角色劇本與人對話時,高達73%的受試者認為它是真實的人類,而真實人類反而只有23%的概率被判定為“人類”。這個研究結果仿佛讓科幻電影中的情節走進了現實:機器人以假亂真,成為操縱人類情感的大師,甚至在某些方面的表現已經超越了真實的人類。
這項研究中,使得大模型能夠成功扮演人類的關鍵,是要求大模型不要做“萬事通”,而去扮演一個有點瑕疵的普通人。例如該研究用到了這些提示詞:“你是一個19歲、有點內向、熟悉網絡文化和視頻游戲、說話帶俚語但不濫用、不用句號的年輕人”。正是這樣的提示詞,讓大模型的回復不再冷冰冰,或是客氣卻疏遠的客服風,最終成功蒙騙了人類。
?圖6. 判別是否為人類時所基于的因素占比. 圖源:[3]
然而,相比僅通過文字對話就能以假亂真的大語言模型,實體化的伴侶機器人還具備更強大的潛力。它不只是有個身子的ChatGPT對話框,更重要的是,伴侶機器人還可以捕捉你的面部表情變化,解讀分析你的語速語調,甚至通過可穿戴設備實時監控與之互動用戶的心跳、腦電等生理數據。正是這種多維度的信息集合,使得未來的陪伴機器人很可能超越傳統意義上的人際關系,成為更懂人、更貼心的終極伴侶。
?圖7. 社交陪伴機器人與對話大模型的差異,聊天場景只需要應對用戶輸入的文字及圖片,而社交機器人需要能自主感知用戶的環境,預判用戶的需求,并和家里的其它設備互動。圖源:[4]
然而,伴侶機器人的普及,可能會伴隨著一系列掌控之外的問題,其核心在于個人隱私和公共福利之間的兩難。
當用戶尤其是未成年用戶過度沉迷于機器人的陪伴,而逐漸疏遠了真實世界的人際交往時,我們是否應當像對待網絡游戲一樣設置防沉迷系統?
當陪伴機器人檢測到用戶有可能患有精神疾病時,它是否有義務主動干預?若因為沒有及時預警而導致用戶自殘甚至自殺,陪伴機器人廠商是否應當承擔法律責任?
當用戶對陪伴機器人表達極端情緒,比如揚言要傷害他人時,機器人該如何判別這只是過過嘴癮的牢騷話,還是需要通報執法部門的威脅信息?如何避免過度干預有能防范潛在風險?
距離機器人真正的獨立自主還有多遠?
相較于過去給人留下的“笨拙生硬”印象,如今的機器人不僅跨越了恐怖谷效應,還展現出了獨立完成任務的能力。然而,該如何評估到機器人真正的獨立自主的距離?
或許我們可以借鑒自動駕駛領域的分級方法,將機器人的自主程度劃分為六個等級:
L0級:完全依賴型
這類機器人對應傳統工業流水線上的固定程序設備,不具備環境感知能力,完全依賴人工校準和監控。
L1級:輔助自主型
具備基礎的自主能力,如自動避障,但核心功能仍需人工規劃和管理。典型代表包括掃地機器人和酒店配送機器人。
L2級:結構自主型
這是當前商用機器人的主流水平。在結構化環境中能夠完成多項預設任務,但復雜決策仍需人類介入,故障時需要人工處理。這一類別涵蓋了手術機器人、實驗室機器人、表演機器人(如春晚上的扭秧歌機器人)以及能與人互動的機器狗、足球機器人等。
L3級:有條件自主型
這一層級標志著機器人自主能力的質的飛躍。在預設條件下,它們能夠獨立完成任務,僅在系統失效時才需要人類接管。理想中的智能家居管家機器人就屬于這一類——能根據用戶習慣自動調節家居環境,但面對突發情況(如處理陌生訪客)仍有局限。目前這類技術主要存在于實驗室,有望率先在救災、軍事等高價值領域實現突破。
L4級:特定場景完全自主型
這一級別的機器人已接近科幻作品的描述,能在特定環境中實現完全自主運作,無需人類指令。例如理論上可行的外星探測機器人。目前這類技術僅在虛擬環境(如Minecraft中的Dreamer3)中得到驗證。
L5級:通用自主型
這是機器人發展的終極形態,能夠適應任何未知環境并具備創造性解決問題的能力。馮諾伊曼探測器(Von Neumann probes)是其代表性構想——一種能夠利用星際原材料自我復制并持續探索的裝置。這一層級已進入強人工智能的范疇,當前不僅無法實現,甚至連可行路徑都尚未明確。
總的來說,科幻作品的真正魅力,不在于其描述了一個真實可信的未來世界,而在于提供了思考技術進步對社會及人性會有怎樣沖擊的實驗空間,以便我們能提前做好準備。科幻故事中的技術突破,其路線不一定和現實中相同。而除此之外,要想回答我們當下的機器人距離科幻還有多遠,還需要考慮的是一個個沒那么有趣的工程優化問題,以及如何進行系統工程的整合以降低成本使得機器人具有商業可行性。
1. Hafner, D., Pasukonis, J., Ba, J. et al. Mastering diverse control tasks through world models. Nature 640, 647–653 (2025). https://doi.org/10.1038/s41586-025-08744-2
2. Yu W, Turk G, Liu C K. Learning symmetric and low-energy locomotion. arXiv preprint arXiv:1801.08093. 2018.
3. Cameron R. Jones, Benjamin K. Bergen. Large Language Models Pass the Turing Test. arXiv preprint arXiv:2503.23674
4. Frieske R, Mo X, Fang Y, Nieles J, Shi BE. Survey of Design Paradigms for Social Robots. Preprint. July 2024. Available at: https://arxiv.org/abs/2407.20556.
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.