作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com
在具身智能的浪潮將所有人推向臺前時,有一家公司選擇先在水下潛行。
“原來藏在水下,現在浮出水面。”地瓜機器人在成立一周年的節點上,如此形容自己的狀態。
這片賽道從不缺少喧囂。一邊是各類人形、四足機器人努力在聚光燈下做出更驚艷的動作,爭奪著資本和大眾的眼球;另一邊,則是地瓜機器人這樣的公司,選擇向后一步,去解決更基礎、也同樣棘手的“修路”問題。
它并非憑空出世。一年前,這個團隊正式從地平線機器人中分拆,帶著自動駕駛芯片設計與算法基因。在其成立一周年,并剛剛宣布完成一筆由高瓴、五源等知名機構參投的1億美元A輪融資之后,地瓜機器人用一場發布會,更清晰地展示了它的解題思路。
在發布現場上,地瓜機器人描繪了他們眼中的行業圖景:陪伴機器人等新興品類不斷涌現,未來將有成百上千家企業投身其中,市場競爭激烈且高度碎片化;與此同時,具身智能的技術路線尚未收斂,“分層決策”(大小腦)與“端到端”兩大流派將長期并存。
正是在這樣的背景下,地瓜再次明確了自己的位置:不做具體的機器人,而是成為機器人時代的“母生態”與“基礎設施提供商”,為所有開發者提供從芯片、操作系統、算法到云平臺的軟硬件基礎設施。地瓜機器人主打低功耗和高性價比的RDK X系列(如X3、X5)及核心的旭日?芯片,已為其生態打下基礎:芯片出貨量超過500萬片,并積累了近10萬名生態圈開發者。
這個藍圖的最新一塊拼圖,是這次發布的主角:RDK S100。
這并非地瓜的第一款RDK(Robotics Developer Kit),而S系列,代表“Superpower”,是地瓜面向具身智能領域提供的更大算力平臺。
它的核心,是“大小腦”的異構設計。在一顆SoC上,地瓜集成了三個核心計算單元,并從功能上將它們協同為“大腦”與“小腦”:
大腦:由6核CPU(負責復雜的邏輯調度)與最新一代自研“納什”架構BPU(負責AI推理)共同組成。這顆BPU專為CNN和Transformer優化,提供了80 TOPS(S100)和128 TOPS(S100P)兩種算力選項。
小腦:由4個Cortex-R52+核心組成的MCU,獨立負責高實時、高可靠性的運動控制。部分核心甚至可以運行在鎖步模式(Lock-Step)下,為機器人提供功能安全保障。
地瓜強調,這套方案在算法與芯片的聯合調優上效果顯著。例如,通過BPU對運動控制(Locomotion)算法的加速,相比純CPU推理提效超過100倍;而在前沿算法層面,其提出的高效Manipulation模型,通過對Diffusion Policy操作策略進行加速,也將推理效率提升了10倍以上。
硬件之外,軟件生態的配套是地瓜敘事的重點。官方的ModelZoo算法倉庫提供了超過110種優化好的模型;全新的工具鏈旨在簡化開發者自有算法的遷移與調優;而“閃連”Type-C接口和RDK Studio開發環境,則讓開發者“一根線就能搞定開發”,降低了上手門檻。
據介紹,這款新發布的RDK S100在正式亮相前,已經與超過20家具身智能領域頭部客戶建立了合作,并獲得了超過50家合作伙伴展開測評。
現場演示環節展示了RDK S100在不同機器人上的應用,地瓜機器人在宇樹G1人形機器人上,部署了ASAP框架以實現全身運動控制;在睿爾曼半人形雙臂機器人上,結合語音與視覺模型執行抓取及導航任務;在求之科技AIRBOT機械臂上,則以“大腦”進行環境感知,“小腦”控制抓取動作,完成了桌面自動收納。
最終,所有的技術和設計都指向了市場。RDK S100標準版(12GB內存+80TOPS算力)以2799元的市場價和2499元的首發優惠價入市。
這一價格幾乎只有英偉達同等算力水平方案的一半。地瓜表示,能做到這一點離不開脫胎于地平線帶來的內部資源復用,加上成熟的產業鏈經驗,使其能有效控制SoC成本。這一切連同來自逐際動力、VITA機器人等合作伙伴的站臺,共同構成了地瓜“浮出水面”后,向整個行業發出的信號。
在這次發布會之前,我們得到了一次與地瓜機器人開發者生態副總裁胡春旭交流的機會。在近一個小時的對話中,他詳細闡述了地瓜如何看待行業碎片化、技術路徑選擇以及生態構建的底層邏輯。
以下是經過編輯的實錄:
如何成為機器人時代的Wintel?
硅星人:機器人市場高度碎片化,地瓜機器人為何有信心做一個通用的底層平臺?
胡春旭:高度碎片化,確實是現在整個機器人行業很大的一個問題。從我們角度出發,我們在說機器人時代的Wintel也好,軟件開發里面的CUDA也好,核心都是底層的一套平臺。我們看重的是,未來五年、十年之后,機器人行業一定是有上千家,甚至上萬家的公司來做各種各樣不同的業務的。
雖然現在業務很碎片化,但是越往底層去挖,整個平臺化會越加標準化。這是在任何一個生態的大行業里都必然存在的現象,比如過去的手機時代、電腦時代,雖然手機的品類千差萬別,但里面的核心芯片無非就幾家。對機器人來講,我們認為未來也是一樣。
所以,在這個邏輯之上,對于地瓜機器人來講,問題在于怎么樣讓未來上千上萬家公司,首選地瓜機器人的芯片或者平臺來做他的機器人。越是早期,越是建立標準、建立生態核心壁壘的很重要的時間節點。我們讓所有的開發者腦海中第一個印象他要做機器人就一定要選地瓜機器人,不管是硬件、軟件還是我們的平臺,都是加速開發機器人的一個核心手段。
硅星人:很多開發者擔心被平臺“綁定”。地瓜如何平衡開放性與生態壁壘?
胡春旭:我們是這么來看待的,它一定存在兩面性。首先生態長期來看一定是一個企業的重要壁壘,如果五年、十年之后,地瓜機器人真的成為了奮斗目標的機器人母生態,那一定是我們最核心的一個壁壘。自然而然,開發者從我們的生態往外遷,一定會存在門檻,這是一個公司做生態的必然。
但從現階段來講,作為后來者,我們必須要去充分開放我們的生態,讓很多開發者快速地在里面把事情做起來。比如我們會讓平臺保持足夠的開源,讓平臺足夠好用。
另外一個很重要的點在于,之所以考慮要遷出生態,是因為這個生態可能存在很多問題,比如它已經很難支撐公司去做持續的盈利,或者很難帶來價值。所以如果一個生態能夠蓬勃發展,我認為這些開發者、企業,不會有遷出去的想法,因為這里可以帶來更多價值。我們想建的生態,就是讓大家一起持續成長、持續產生價值的生態。
硅星人:地瓜與高校的合作似乎非常深入,具體是如何做的?你們希望解決什么問題?
胡春旭:我們認為人才是中國機器人產業很重要的核心價值之一,所以地瓜對人才培養非常關注。我們看到的一個問題是,高校里計算機、自動化、機械專業很多,但專門的機器人專業很少,而且隨著技術發展,學校跟社會脫節的速度越來越快。我們希望把行業里的經驗,通過教材、內容、比賽的方式,讓學生能跟上行業發展的速度。
具體來說,我們和國內超過200家高校有實質性合作。比如和上海交通大學合作了三本機器人相關教材,都是基于我們的RDK去寫的;我們在全國有四到五項全國性的賽事,以賽促學;同時,我們和大概15家國內高校有聯合掛牌的機器人實驗室,提供設備和方案,讓學生能周期性地來做實驗。整個邏輯,就是希望培養出更多的復合型機器人人才,當他們成長起來,無論是去大公司還是自己創業,都會帶著我們生態的基因,這是我們人才培養的邏輯。
硅星人:有了我們的開發板之后,社區和高校的開發者們有沒有做出一些讓您印象深刻的項目?
胡春旭:這個太多了。比如去年我們發布RDK X5后組織了一個創客營,有一個組就基于RDK X5做了一臺自動駕駛自行車。這個項目之前稚暉君做過,我們的開發者把它復現了,還加入了基于我們雙目相機識別跑道邊界線的新功能,能完整地在學校400米操場上跑一圈,非常有創意。
還有一個開發者團隊,復現了國外一個叫OpenDuck的開源項目,做了一個像小鴨子一樣的雙足機器人,也是基于RDK X5。做完之后,他把所有東西,包括3D圖紙、代碼、物料鏈接,全部都開源分享出來了,這是一個很典型的、完整的開源項目。類似的還有很多,比如做自動化輪椅的、做導盲犬的。現在在B站上搜我們的產品關鍵詞,能找到幾百個視頻,絕大部分都是開發者做的;在GitHub上也有500多個相關的開源項目。
為什么是“大小腦”?
硅星人:為什么地瓜現階段主推“大小腦”架構?這和業界熱議的端到端模型是什么關系?
胡春旭:這回到了整個具身機器人行業發展的技術路徑。宏觀上來看,分成兩大類別,第一類是完全的端到端,第二類是分層的模型結合。端到端最大的優勢是泛化性最好,但它最大的挑戰在于數據。分層結構剛好相反,對數據要求沒那么多,但泛化性存在問題。
在我們看來,這不是非此即彼的選擇。如果類比自動駕駛,把機器人也分成L1到L5,我們大概也處于L2到L3之間過渡的期間。如果要實現L5,完全的AGI水平,那一定是一個端到端的效果。但是在從L2到L3過渡期間,大家更多會關注怎么樣快速把機器人落地。這時候,我們認為分層架構是更加合適短期內做落地的。
所以我們的大小腦平臺RDK S100,就是使用大小腦這種方式去配合分層的技術路徑,滿足機器人企業快速落地的需求。當然,我們認為未來一定不是只有這一款產品。未來一定會有更高的算力芯片,比如明年年初我們就會出500T以上算力的套件。當算力更大,數據問題有更多解決方案之后,端到端的路徑也一定會快速發展。所以我們未來的大算力套件就會支持端到端的方式。
這兩種技術路徑一定是并存的,一定不是替代關系。我們會通過不同產品的平臺來支撐不同技術路徑,從而支撐不同的業務場景落地。
硅星人:數據和算法是機器人開發的兩大難題,地瓜如何幫助開發者,尤其是小團隊解決這些問題?
胡春旭:大家都在面臨數據的問題,大概的解決辦法有兩大類。
第一大類是沒有數據,就去產生數據。我們內部會做一個云平臺,核心功能就是去產生數據。比如一個國內公司做海外業務,沒有海外的數據,沒問題,我們通過云平臺,基于大模型輸入一些prompt,就可以產生一千張、一萬張甚至更多的數據來支持他做訓練。我們也會有大模型的方式來做自動化標注。整個過程提供一套完整的工具鏈。
第二種方式,是通過盡量小的數據讓模型泛化程度更高。比如抓取,市面上主流的方式叫GraspNet,我們算法團隊會對這個模型做充分的優化、改造,做完之后能夠跑到非常高的效率,同時我們把結果通過開源的方式分享出去。這樣開發者就不用再從頭做訓練、數據采集了,只需要基于我們的模型,把它當成一個Foundation Model,結合他的業務場景做一些調優。我們在ModelZoo里面現在提供了100多種類似這樣的模型。
市場與未來
硅星人:在眾多機器人形態中,您判斷哪些會最先規模化落地?
胡春旭:我們會把市面上的機器人分成大概三大類別。第一類是比較傳統的,比如掃地機器人、工業機械臂,它們已經是體量最大的。第二類是“新形態機器人”,比如割草機器人、泳池機器人、家用娛樂機器人,它們在某些細分場景解決核心問題。第三類就是偏具身的,包括人形、四足等。
從我個人判斷,一定是“新形態機器人”的落地會更快。比如割草機器人,去年全球出貨量已經到了幾十萬的體量。相比之下,純雙足人形,它的目標是一個比較偏通用的機器人,技術迭代周期會長很多,我們認為至少是五到十年,甚至更長時間。在具身這個大的類別里面,我認為比較快能落地的是四足、機械臂(包括半人形)。機械臂本身是被傳統行業充分驗證過的形態,現在正從工業走向消費,比如做咖啡、做冰淇淋,更多是找到一個精準的業務場景。
硅星人:當算力不再是瓶頸時,一個機器人計算平臺的核心競爭力會是什么?
胡春旭:核心競爭力很多情況下一定不是一個單點,而是一個相對比較全面的。但在我看來,有幾個點很重要。
第一個是效率。我們很關注這一點。怎么樣在一定算力情況之下,充分地發揮它的功耗跟性能的綜合效果,這關乎到未來產品落地的成本和性能。同時,我們提供各種各樣的工具鏈,目的就是讓開發者“多、快、好、省”地把東西做出來。有開發者用我們的RDK X5去控制逐際動力的點足機器人,本來項目是用英偉達的平臺做的,遷移到我們RDK上只用了一個小時就完成了搭建,這就是效率。
除了效率,另一個就是生態。要快速做出一個產品,一定不是只有“腦子”就結束了,它需要全產業鏈的支持。在我們的生態里面,開發者可以快速找到合伙人、招聘到熟悉我們平臺的人才,也可以快速對接到方案商、服務商,甚至獲得資本的支持。這些都是我們的核心競爭力。
結語
RDK S100的發布背后是地瓜機器人的市場卡位,在整個行業向著宏大目標邁進時,它選擇優先成為那個“為淘金者提供鏟子和牛仔褲”的基礎設施供應商。
追求具身智能的道路漫長且昂貴,是選擇自上而下、重金投入,直指最終的端到端通用模型;還是選擇自下而上,通過提供極具性價比和開發效率的工具,先聚攏最廣泛的開發者,解決當下機器人商業化的實際問題,從而建立一個難以逾越的生態壁壘?地瓜機器人用一款2499元的算控一體開發套件,給出了自己的答案。這個關于機器人時代“Wintel”的故事能否走通,將是未來幾年機器人行業值得關注的一條主線。
點個愛心,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.