新智元報道
編輯:定慧
【新智元導讀】MIT最新研究讓LLM直接操控宇宙飛船進行太空追逐挑戰(zhàn)賽:ChatGPT少量微調(diào)即獲第二,開源Llama更勝一籌,憑提示詞精準追蹤衛(wèi)星、節(jié)省燃料,更是0%失敗率,驗證AI小數(shù)據(jù)高效與自主航天可行,為未來的太空漫游鋪路。
剛剛,一項最新關(guān)于AI「駕駛」宇宙飛船的研究剛發(fā)布就火了!
在由Kerbal Space Program衍生的航天挑戰(zhàn)賽中,MIT等研究團隊讓ChatGPT作為「主控」智能體,竟然一舉奪得第二名。
這項比賽被視為太空探索自主化的重要實驗場,而AI的表現(xiàn),也預示著「AI開飛船」或許比我們想象的更近!
或許,太空漫游2027真的可以成為現(xiàn)實!圍繞地球的衛(wèi)星、太空垃圾未來都可能由AI自主運行和處理。
研究團隊并沒有重度訓練模型,而是巧妙地用提示詞工程+少量微調(diào),就讓ChatGPT成功駕馭復雜的太空任務:追擊衛(wèi)星、規(guī)避偵測……樣樣精通。
整個系統(tǒng)由文本狀態(tài)輸入→語言模型決策→代碼執(zhí)行三步組成,展現(xiàn)出LLM模型強大的泛化與適應能力。
MIT和馬德里理工大學這一研究論文已被《空間研究進展》(Journal of Advances in Space Research)接收,即將發(fā)表。
論文地址:https://arxiv.org/pdf/2505.19896
研究亮點速覽:
ChatGPT用文字指令完成飛船導航、控制決策,表現(xiàn)遠超預期;
研究無需大規(guī)模訓練,充分利用LLM已有知識與語言理解;
雖仍有「幻覺」等風險,但自主化航天已從幻想變?yōu)榭尚新肪€。
AI自主開飛船上太空
研究人員長期以來一直致力于開發(fā)用于衛(wèi)星控制和航天器導航的自主系統(tǒng)。
未來的衛(wèi)星數(shù)量實在太多,人類無法全部手動進行控制。
而對于深空探測來說,光速的限制意味著我們無法實時直接控制航天器。
如果我們真的想要在太空領(lǐng)域拓展,就必須讓機器人自己做決定。
為了鼓勵創(chuàng)新,近年來航空研究人員創(chuàng)建了《Kerbal Space Program》博弈挑戰(zhàn)賽。
這是一類基于廣受歡迎的《Kerbal Space Program》電子游戲的試驗場,讓研究社區(qū)在一個(某種程度上)真實的環(huán)境中設計、試驗和測試自主系統(tǒng)。
《Kerbal Space Program》(KSP)最早是由墨西哥工作室Squad開發(fā)的一款太空飛行模擬視頻游戲,于2015年發(fā)布。
盡管它是一款游戲,但通過添加模組(mod),它可以被用作模擬環(huán)境,這些模組可以增加諸如更真實的物理效果等新功能。
盡管KSP并未提供對現(xiàn)實的完美模擬,但其精確的軌道力學機制受到了贊譽,甚至與NASA建立了合作關(guān)系,使其地位超越了一款普通游戲。
該模擬環(huán)境被限制為一個二體問題,并且僅限于少量行星,最常見的情況是只有一個名為Kerbin的類地行星。
該挑戰(zhàn)賽包含多個場景,例如追蹤并攔截衛(wèi)星的任務以及規(guī)避探測的任務。
研究人員決定使用LLM,因為傳統(tǒng)的控制方法需要經(jīng)過多輪的訓練、反饋和改進。
但Kerbal挑戰(zhàn)的本質(zhì)是盡可能逼真,這意味著任務僅持續(xù)數(shù)小時。
因此,不斷改進模型將變得不切實際。
LLM之所以如此強大,是因為它們已經(jīng)接受了大量人類寫作文本的訓練。
因此在最佳情況下,它們只需要少量精心設計的提示工程和幾次嘗試,就能為特定情境獲取正確的上下文。
但這樣一個「對話」模型真的可以駕駛宇宙飛船嗎?
用GPT和Llama開飛船
首先介紹一下KSP挑戰(zhàn)中需要解決的問題,智能體通過推力發(fā)動機控制航天器在所有三個旋轉(zhuǎn)軸(偏航、俯仰和滾動)上的運動。
動作是在航天器的參考系下表達的,包括每個軸的推力大小以及施加推力的持續(xù)時間。
KSP挑戰(zhàn)包含以下三種場景:
追擊者-逃逸者:智能體控制追擊者。主要目標是使追擊者與逃逸者之間的距離最小化。
目標守衛(wèi):智能體控制劫匪航天器靠近航天器。
遮擋太陽:智能體旨在將航天器定位在逃逸者與太陽之間。
本研究的討論范圍只有「追擊者-逃逸者」范疇。
在追擊者-逃逸游戲的不同場景中,逃逸者的初始軌道在所有場景中保持不變,而追擊者的初始軌道則有所變化。
追擊者和逃逸者具有相同的飛行器參數(shù)。
評估指標包括追擊者與逃逸者之間的距離(米)、最近接近時的速度(米/秒)、追擊者燃料消耗量(千克)以及經(jīng)過的時間(秒)。
明確了任務,讓我們具體看看GPT和Llama是怎么開飛船的,該研究探索了兩種路線:
1. ChatGPT+微調(diào)
選用GPT是因其易于使用,重點使用微調(diào)模型策略。
2.Llama+提示詞工程
選用Llama則是由于其社區(qū)支持和開源靈活性,使用提示工程進行主要研究路線,并進行簡單微調(diào)。
研究人員開發(fā)了一種方法,用于將航天器的給定狀態(tài)及其目標以文本形式進行翻譯。
然后,他們將其傳遞給LLM,并要求LLM提供如何調(diào)整和操控航天器的建議。
研究人員隨后開發(fā)了一個翻譯層,將LLM基于文本的輸出轉(zhuǎn)換為可操作模擬飛行器的功能代碼。
研究通過生成多個軌道的示例,用于收集Llama訓練數(shù)據(jù)。
研究還給出了軌道數(shù)據(jù)生成的偽代碼。
通過一系列簡短的提示和一些微調(diào),研究人員讓ChatGPT完成了挑戰(zhàn)中的許多測試任務,并且它在最近的一場競賽中最終獲得了第二名。
Llama竟然打敗了GPT
有趣的是,OpenAI的微調(diào)API需要定制,但它提供的工具非常有限,尤其是與Llama相比。
因此,GPT訓練的效果在很大程度上取決于數(shù)據(jù)的數(shù)量和質(zhì)量,以及某些調(diào)整(特別是超參數(shù)),其中LRM的影響最為顯著。
思維鏈方法的應用顯著提高了飛船駕駛技術(shù)在追擊問題中的泛化能力,并成功引導模型實現(xiàn)了執(zhí)行過程中的0%失敗率。
Llama的結(jié)果遠超研究人員預期。
該模型不僅遵循了一條穩(wěn)定的順行軌道,而且在KSPDG挑戰(zhàn)中表現(xiàn)優(yōu)于幾乎所有其他方法。
需要強調(diào)的是,基礎(chǔ)的Llama模型比GPT模型取得了更好的結(jié)果。
然而,考慮到Llama-3是與GPT-4競爭的模型,而非研究中GPT方法中使用的GPT-3.5,這一結(jié)果是在預期之內(nèi)的。
(果然即使是研究人員也燒不起API的錢,開源這一點確實促進了生態(tài)的發(fā)展)
研究團隊表示,這次研究發(fā)現(xiàn)結(jié)果非常令人滿意。
軌道生成和智能體集成表明,使用AI構(gòu)建訓練場景可以作為一個出色且簡單的模擬引擎替代方案。
雖然這個研究還屬于早期,并且使用模型也不是目前最新的頂尖AI模型,但這個研究探索本身就很有啟發(fā)意義。
未來我們不僅要競爭地面資源,太空資源也成為了新時代的「兵家必爭之地」。
馬斯克的星鏈計劃已經(jīng)開始搶占地球的低空軌道資源。
根據(jù)目前的數(shù)據(jù)統(tǒng)計,截止2025年上半年,在軌的星鏈衛(wèi)星已經(jīng)突破了6500+。
這是一個非常龐大的數(shù)量,雖然現(xiàn)在星鏈的運行只是按照既定軌道,少量需要人類干預,未來呢?
單純靠人來控制這些衛(wèi)星完全不夠,也不現(xiàn)實。
所以這個研究如果真的能夠讓LLM來控制太空飛行器,那么將顛覆未來的太空競賽生態(tài)。
在美劇《太空部隊》中編劇設想了一個場景:
中國的空間站飛行到美國衛(wèi)星上方時,運用機械臂將美國衛(wèi)星的翅膀給剪了下來。
然后,美國的衛(wèi)星就變成了太空垃圾。
除了編劇的「惡趣味」以外,AI上太空開飛船的場景還有很多,比如《特種部隊2:全面反擊》中太空鎢棒武器。
或者是《火星救援》中的遠航小隊,如果有了足夠智能的AI,就不用冒險再返回拯救馬特達蒙,人類派出AI就夠了。
這些場景未來還有很多很多。
甚至,最近硅谷投資彼得·蒂爾透露馬斯克說要放棄殖民火星的夢想。還在采訪中說「2024年是埃隆不再相信火星的一年?!?br/>
馬斯克的轉(zhuǎn)變是受到他與谷歌DeepMind CEO Demis Hassabis的一次談話影響。
兩人討論了人工智能和星際旅行哪個會成為世界上最重要的技術(shù)進步。
據(jù)報道說,在Hassabis告訴他「你知道我的人工智能將能夠跟隨你去火星」后,Elon沉默了。
不管老馬因為什么原因?qū)鹦鞘バ判模侨绻鸄I真的能夠自主駕駛宇宙飛船,也許可以幫助他繼續(xù)殖民火星的夢想!
可以設想一下,未來進行這種太空攻防對抗、互助救援和殖民外星球的背后,不僅僅比拼人的水平,還有AI的能力——誰家的AI更聰明、更智能。
畢竟,在太空探索的背景下,人類的一生還是太過于短暫,也許只有AI能扛過時間的侵蝕了。
人類終將沉睡于時光的塵埃,而AI,或許是那唯一能在深空中繼續(xù)訴說文明故事的見證者。
——ChatGPT
參考資料:
https://arxiv.org/abs/2505.19896
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.