近日,2021 首屆全國空中智能博弈大賽總決賽成績正式揭曉,我司“淵亭天衍”戰隊一路過關斬將,最終以總分1307的成績獲得亞軍!本次大賽作為空中有無人協同多智能體決策領域的第一屆公開賽事,累計將近4個月的賽程,130余支隊伍,近20000場對戰,充分展現了軍事AI在未來戰爭主戰場的無限可能。
2021 首屆全國空中智能博弈大賽由中國指揮與控制學會主辦,中國航空工業集團沈陽飛機設計研究所等6家單位承辦。賽事以異構、全透明態勢空戰為想定,主要考驗 AI 在編隊行動、協同制導、目標打擊等方面的決策能力。
近年來,美國在AI決策認知領域同樣積極展開嘗試,典型的空中博弈比賽當屬2019年開始舉辦的“AlphaDogfight”,旨在演練執行可視范圍內的模擬空戰 AI 算法,促進人機協同作戰。值得一提的是,在2020年的總決賽中,蒼鷺系統公司的 AI 算法在虛擬空戰中以壓倒性優勢(5:0)擊敗了人類頂級飛行員,讓人們看見人機共生全新前景的同時,也極大地提高了作戰人員對自主作戰技術的信任度。
和“AlphaDogfight”的不同之處在于,“AlphaDogfight”是AI智能體和F-16飛行員在有戰爭迷霧的模擬環境中進行一對一的空中格斗;本次大賽則是以類“忠誠僚機”體系進行戰術小隊的對抗,即紅藍雙方各為”一架有人機帶四架無人機“。前者關注“裝備級”、“動作級”博弈智能,后者關注“編隊級”、“協作式”智能。
人機協作,謀略智勝
作為國內軍事智能領域內影響力最大的AI賽事之一,大賽匯集了來自軍工集團、研究院所、地方院校、軍事院校、企事業單位等130多支隊伍參加。經過初賽和復賽的激烈角逐,最終晉級復賽的16強囊括了國內人工智能領域頂尖院校和研究機構,而“淵亭天衍”是其中唯一一支來自民企的戰隊。
挑戰賽分為初賽、復賽和總決賽3個階段,全程歷時近4個月。在異常激烈的比賽中,“淵亭天衍”戰隊采用強化學習+部分策略規則融合的方式,利用AI智能作戰專業領域的知識,依托自研多智能體協同決策平臺Nash-Studio和多智能體強化學習框架Nash-Zero,在對戰模擬環境中進行高效推演訓練,探索并不斷調整現有作戰策略,輸出高質量的、最優的、可驗證的方案來輔助合理決策部署,成為制勝關鍵。
圖-nash平臺 新增對抗
“淵亭天衍”戰隊通過強化學習的自博弈、規則策略對抗、人機對抗等多種智能對抗博弈方式生成的大量回放數據,利用Nash-Studio平臺輔助復盤分析,充分挖掘潛在的策略,如在對飛機戰斗梯隊、火控雷達制導、火力協同打擊、導彈最優躲避等方面挖掘到了高質量的策略,并利用機器學習、深度強化學習等智能算法對策略進行整體融合。同時,針對敵方導彈的近距法向過載能力,使用深度強化學習算法針對導彈鎖定場景進行局部躲避訓練,利用智能體精準有效操作將躲避成功幾率提升至最大。
圖-模擬飛機航線巡邏
此外,在訓練智能體過程中,由于比賽時間間隔短,而空戰對抗復雜,盡管利用了Nash-Zero框架中的并行、分布式等方式訓練,還是很難在短時間內訓練出最優的智能體。然而戰隊探索發現,通過將機動決策和攻擊決策進行分層學習,可降低了強化學習的智能體學習難度,提升強化學習的收斂速度。多方發力,解決了作戰規則表達與指揮決策智能優化問題,最終在決賽中戰勝了其他參賽隊伍,獲得本屆全國大賽亞軍。
結語
此次從空中智能博弈大賽中脫穎而出,充分凸顯出淵亭科技在軍事智能特別是認知決策智能領域的專業實力和技術積累。在全面推進創新驅動國家戰略的號召和鼓勵下,淵亭科技作為中國智能防務領域的先行者和領導者,始終堅持走國產自主可控的創新發展道路,并在復雜戰場的多智能體博弈、自動化機器學習、深度強化學習等全生命周期技術和產品應用上具備著顯著的競爭力。
據悉,淵亭Nash團隊近期的研究重點除了決策智能平臺和算法的迭代優化外,還新增了“人機融合”(專家規則和AI算法的場景、時機自適配)及”自主可信度“(提供自主決策的可信度評估體系和模型)。
未來,淵亭將繼續服務于我國國防領域,憑借權威認證的領先智慧優勢,潛心鉆研、打磨未來戰場的制勝“重器”,不斷推動人工智能技術在軍事領域的創新研究和應用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.