衡宇 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
具身智能領(lǐng)域,是不是夠火爆了?
但市面上常見的,大多是四足機器狗、人形機器人,機械臂……都在地上作業(yè)。
現(xiàn)在,一種會飛的具身智能機器人,也進入了創(chuàng)業(yè)商用賽道:
巴掌大小,重量約200克,搭載計算芯片和視覺方案,可負載起飛。
在沒有GPS、沒有信號覆蓋的狹窄通道中,可以獨立完成自主建圖,全程無需人為干預(yù)。
且執(zhí)行任務(wù)過程中的所有決策及其行為,都來自于自己的大腦,并不依靠固定流程或地面遙控。
更重要的是,N個飛行機器人還能組團干活,進行擬人化的智能協(xié)同。
所有的操作都無需人為介入。
以上,就是具身智能創(chuàng)業(yè)公司微分智飛正在專注做的事情。
微分智飛由浙江大學(xué)控制科學(xué)與工程學(xué)院長聘副教授、博士生導(dǎo)師高飛于去年底創(chuàng)辦。兩年前,他帶隊研發(fā)的飛行機器人蜂群就登上了《Science Robotics》封面。
帶著十幾年的研究積淀,高飛想把飛行機器人推向市場。今年4月,公司連續(xù)完成了兩輪融資。
所以,具身智能飛行機器人和無人機,究竟有什么區(qū)別?
高飛教授向我們分享了他的思考和實踐。
不是傳統(tǒng)意義上的無人機
相信很多人都有這個疑問:飛行機器人和無人機,到底有什么區(qū)別?
高飛解釋道,傳統(tǒng)無人機本質(zhì)上是被遙控的飛行器(Aircraft),依賴人的操作,比如遙控器或者地面站指令。
即使是燈光秀或預(yù)設(shè)路徑配送外賣式的自動航線飛行,也是預(yù)先編程或依賴GPS等外部定位,缺乏實時自主決策。
與之相比,飛行機器人是具有自主決策能力的智能體(Agent),高度自主,能在斷網(wǎng)的無信號環(huán)境下獨立完成任務(wù)。
其靈魂是能「獨立感知環(huán)境-理解任務(wù)-做出決策-閉環(huán)執(zhí)行任務(wù)」,完全脫離人的實時控制。
如此說來,飛行機器人才是真正的“無人”機。
而且這套能力的核心,正是具身智能的理念:機器人必須通過與環(huán)境的互動來習(xí)得技能,才能真正具備適應(yīng)性。
但高飛在這個領(lǐng)域的深耕比“具身智能”概念火起來要早得多。
當(dāng)初在香港科技大學(xué)讀博期間,他就專注于解決單機自主飛行的核心挑戰(zhàn),即實現(xiàn)無人機從起點到終點的全程無人干預(yù)自主飛行。
高飛的博導(dǎo)給他布置了一個任務(wù):
- 做一臺飛行機器人,在實驗室門口一鍵起飛,全程無人干預(yù),自動飛到學(xué)校門口。
什么時候做出來什么時候畢業(yè)。
那時候還沒有大模型,更別提落實具身智能。
為了實現(xiàn)真正的自主飛行,高飛依賴的是一整套高度耦合的工程體系:多傳感器融合、精確建模、低功耗嵌入式算法……所有計算都得跑在資源極有限的硬件上,必須極致優(yōu)化,才能撐起整個系統(tǒng)閉環(huán)。
據(jù)高飛講述,那時候走的是一條更工程理性的路徑,需要依賴精確的數(shù)學(xué)模型、傳感器融合、系統(tǒng)控制理論,從而構(gòu)建穩(wěn)定可靠的功能性閉環(huán)。
但不變的是一種觀點——飛行機器人必須靠自身感知獲取環(huán)境信息、必須實時閉環(huán)決策(而不是靠遠程規(guī)劃)、必須在不確定性中適應(yīng)性執(zhí)行。
這些思想,與后來具身智能范式的底層邏輯不謀而合。
后來,具身智能興起,它強調(diào)通過身體交互獲得智能。高飛覺得這也是讓飛行機器人實現(xiàn)智能的一種途徑,于是也因此開始側(cè)重數(shù)據(jù)驅(qū)動的學(xué)習(xí)。
后期的飛行機器人集群研究中,高飛開始引入強化學(xué)習(xí)訓(xùn)練協(xié)同策略,在仿真環(huán)境中訓(xùn)練無人機完成任務(wù)策略。但相關(guān)的底層定位、控制等仍以傳統(tǒng)方法為主。
總而言之,現(xiàn)在仍然拋不開傳統(tǒng)方法——
很多人會以為,要實現(xiàn)這樣的智能必須依賴大模型。但高飛的看法是,大模型更多是在上層幫助理解復(fù)雜任務(wù),比如“幫我找一束花”“判斷哪塊區(qū)域有危險”。
而讓機器人能真的飛起來、飛得準(zhǔn)、飛得穩(wěn)的,依然靠的是底層的感知、算法和控制力。
這才是飛行機器人的基礎(chǔ)工程能力。
巴掌大的飛行機器人,是一種“炫技”
一般而言,飛行機器人具有以下幾個關(guān)鍵部件:
- 大腦:上位機,負責(zé)環(huán)境感知、自主定位、實時規(guī)劃、任務(wù)決策等
- 小腦:下位機,負責(zé)運動協(xié)調(diào)、姿態(tài)穩(wěn)定控制,執(zhí)行高頻、實時任務(wù)
- 肢體:螺旋槳
- 眼睛:攝像頭/雷達等傳感器
以此為硬件基礎(chǔ),高飛創(chuàng)業(yè)的微分智飛,有以下三大技術(shù)特色:
第一,極強的自主決策能力。這一點通過算法來實現(xiàn)。
無GPS、無信標(biāo)、無遙控,全靠傳感器融合定位、動態(tài)避障算法與運動規(guī)劃,高飛團隊在非結(jié)構(gòu)化場景(如礦山、林下、隧道)完成首創(chuàng)全自主飛行。
高飛介紹,下發(fā)任務(wù)指令后,全程無需實時信號(可斷連),飛行機器人能自行維護環(huán)境地圖、計算最短返航路徑,并能在電量臨界點前自動返航。
在此過程中,飛行機器人需要智能決策最優(yōu)路徑,譬如探索完一個房間再出去,避免反復(fù)進出。
飛行機器人返航后,可提取全部采樣數(shù)據(jù)。
第二,高效協(xié)同的集群技術(shù)。
早期在港科大解決單體自主導(dǎo)航的高飛,進入浙大后開始研究集群協(xié)同。
他的目標(biāo)是實現(xiàn)類似人類集群——如軍訓(xùn)走方陣——的分布式智能協(xié)同,而非無人機燈光秀式的集中控制。
這其中的主要難點,是集群中的每一個飛行機器人既需要個體需足夠自主智能,協(xié)同時又要高效溝通、分工,不能起沖突。
高飛團隊給出的解決辦法是“集中式學(xué)習(xí),分布式運行”。
在高保真仿真環(huán)境中,數(shù)萬乃至數(shù)十萬智能體圍繞同一全局目標(biāo)進行集中式學(xué)習(xí),以更高效地習(xí)得協(xié)同決策策略;與此同時,通過隨機擾動環(huán)境參數(shù)、感知噪聲和場景紋理,使模型的適應(yīng)性不斷增強。
在訓(xùn)練過程中,團隊預(yù)先設(shè)計了可變規(guī)模機制以適應(yīng)實際操作中集群規(guī)模的動態(tài)變化,并將強化學(xué)習(xí)與傳統(tǒng)控制相結(jié)合,最大限度縮小仿真與現(xiàn)實之間的遷移差距,從而顯著提升算法在復(fù)雜場景中的泛化能力與可靠性。
第三,小型化與硬件集成頗有積淀。
微分智飛的特色就是專注做小型飛行機器人,最小的那一款只有巴掌大小。
因為小,在很多人類不能進入的環(huán)境下,能夠靈活地飛行并完成任務(wù)。
也是因為小,飛行機器人傳感器變?nèi)酢⒂嬎阗Y源受限、續(xù)航變短,各方面載荷受限,對算法效率、模型輕量化、軟硬件集成度要求極高,有很高的技術(shù)門檻。這就離不開高飛在這個領(lǐng)域10余年的積累。
如果在這種條件下還能實現(xiàn)自主智能,那就是真正的把難題解決到極致。高飛表示:
- 它需要的不只是能飛,同時還要在成本、可靠性、安全性上具備產(chǎn)品化能力。
“不想再手搓了!”
目前,微分智飛共有兩條產(chǎn)品線,三款在研機型。
一條行業(yè)線,也是公司的產(chǎn)品線主力,主要用于自主探測建圖與巡檢。
主要落地場景瞄準(zhǔn)應(yīng)急、礦山、林場、綜合管廊、倉儲等場景,講究成本和可靠性,工業(yè)級要求高精度(厘米級甚至毫米級定位建圖)和高穩(wěn)定性。
計劃2025年年內(nèi)推出2款產(chǎn)品,軸距25-35公分左右,續(xù)航>40分鐘。
一條教育線,提供開放、標(biāo)準(zhǔn)可開發(fā)平臺,可二次開發(fā)。
主要目的是創(chuàng)建教育科研生態(tài),降低學(xué)生手搓門檻。
迄今為止,高校學(xué)生或科研人員還沒有這樣的生態(tài)環(huán)境可用,如有需要,只能手搓——而且是非標(biāo)準(zhǔn)化、高成本、強依賴個人技能的那種。
飛控主板、傳感器、動力系統(tǒng)、結(jié)構(gòu)件……沒有統(tǒng)一供應(yīng)鏈,學(xué)生需自行從不同渠道采購零件。
不僅來源零散,小批量加工成本還高,采購的零件要么無冗余要么過剩。用高飛的話來說,“100個起售,但買100個最后只用得上2個”。
除此外,軟件層面基本都基于開源飛控二次開發(fā),但開源代碼碎片化,調(diào)試耗時。
綜上所述,其實教育線產(chǎn)品的目標(biāo)很明確:
要把高校“人人手搓飛行機器人”的局面變成“標(biāo)準(zhǔn)平臺+自主開發(fā)”的常態(tài)。
其實,高飛做這件事也算是一種還愿——
他從小就是個航空愛好者,最大的夢想是開戰(zhàn)斗機。后來沒能飛上天,就轉(zhuǎn)而研究飛行機器人,把自己對飛行的執(zhí)念灌注進小小的機器中。
高飛回憶自己當(dāng)年在實驗室里手搓機器的日子:一個部件畫圖加工就要等一周,炸機一次成本幾千,還時常因為缺資料耽誤實驗。現(xiàn)在,他希望給后來的科研學(xué)生提供更好的起點。
但對高飛來說,僅僅搞科研、發(fā)論文是不夠的。
他清楚地知道實驗室成果如果不能走向市場,那就是差了一環(huán)。因此,他選擇創(chuàng)業(yè)。
不只是為了把技術(shù)落地,更是為了把飛行機器人這條技術(shù)鏈真正閉合走向落地。
現(xiàn)階段,微分智飛的主要策略是專注產(chǎn)品,不把自己變成服務(wù)型公司。
盡管To B場景里很多客戶更愿意為服務(wù)買單,但高飛堅持產(chǎn)品優(yōu)先、技術(shù)閉環(huán)的路徑。
雖有十多年的科研積累,但形容這段創(chuàng)業(yè)經(jīng)歷時,高飛用了個詞叫“進化”。
他說,科研人做公司,得找到互補的合伙人,同時從頭學(xué)產(chǎn)品、學(xué)市場、學(xué)成本控制,從算法理論到芯片選型,從論文邏輯到供應(yīng)鏈周期,每一步都得親手趟過去。
- 我和團隊都有短板。但只要清醒、愿意學(xué),就有機會把技術(shù)真正做成產(chǎn)品,把實驗室的極致推向真實市場。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.