文|劉俊宏
編|王一粟
“之前機(jī)器人一直沒有翻越智能化的大山,大模型打破了這道門檻”。
兩年時(shí)間,機(jī)器人行業(yè)經(jīng)歷了智能硬件史上最大的反轉(zhuǎn)。從波士頓動(dòng)力被質(zhì)疑是騙局,到消費(fèi)電子、汽車產(chǎn)業(yè)鏈、云廠商、傳統(tǒng)玩具公司們集體熱捧,地瓜機(jī)器人開發(fā)者生態(tài)副總裁胡春旭一句話解釋了機(jī)器人賽道炙手可熱的秘密。
6月11日,在地瓜機(jī)器人算控一體化機(jī)器人開發(fā)套件RDK S100的發(fā)布會(huì)上,地瓜機(jī)器人CEO王叢發(fā)現(xiàn),機(jī)器人行業(yè)正在蓄勢待發(fā)。
“第一是機(jī)器人智能化的節(jié)奏開始加快,大量傳統(tǒng)機(jī)器人在變得智能。第二是每個(gè)月都有新形態(tài)機(jī)器人的創(chuàng)業(yè)公司出現(xiàn),并很快成為行業(yè)熱點(diǎn)。”王叢總結(jié)說。
趕在機(jī)器人大規(guī)模爆發(fā)前夕,地瓜機(jī)器人想要向行業(yè)兜售標(biāo)準(zhǔn)化的機(jī)器人“大腦”。
產(chǎn)品指標(biāo)上看,RDK S100是一顆集成了CPU、BPU和MCU的異構(gòu)SoC,能為機(jī)器人提供百TOPS級的算力支持。產(chǎn)品目前限時(shí)優(yōu)惠定價(jià)為2499元。在軟件層面上,RDK S100還提供了包括操作系統(tǒng)和集成開發(fā)環(huán)境在內(nèi)的一整套工具鏈,提供“開箱即用”的機(jī)器人開發(fā)體驗(yàn)。“只需10分鐘就能體驗(yàn)到所有核心AI功能”,胡春旭說。
為了展示算控一體化機(jī)器人開發(fā)套件的適配能力,我們在本次發(fā)布會(huì)見到了搭載RDK S100的宇樹G1、能自由跨過地形的機(jī)器狗、自動(dòng)分揀的機(jī)械臂。在當(dāng)下常見的機(jī)器人運(yùn)動(dòng)邏輯控制、視覺識(shí)別領(lǐng)域上,地瓜機(jī)器人初步證明了自己的能力。
為什么地瓜機(jī)器人要在當(dāng)下發(fā)布一款機(jī)器人開發(fā)平臺(tái)?
這是因?yàn)椋絹碓蕉嗟臋C(jī)器人開發(fā)者正在達(dá)成平臺(tái)化開發(fā)的共識(shí)。
比如人形機(jī)器人賽道,今年我們在機(jī)器人馬拉松和機(jī)器人格斗比賽上,都見到了宇樹G1的身影。胡春旭認(rèn)為,“宇樹的機(jī)器人是一個(gè)比較標(biāo)準(zhǔn)化的人形載體。有了標(biāo)準(zhǔn)化的載體之后,機(jī)器人廠商比較方便針對業(yè)務(wù)做不同的配置”。
使用統(tǒng)一的硬件載體,意味著機(jī)器人廠商可以在硬件成熟度還不夠高的時(shí)期,繞過靈巧手、減速器、絲杠等一系列機(jī)器人零部件“從零到一”的開發(fā),快速加入機(jī)器人生態(tài)。
而當(dāng)開發(fā)者有了標(biāo)準(zhǔn)的機(jī)器人智能開發(fā)平臺(tái)之后,造機(jī)器人的難度再次降低了一大截。成立機(jī)器人創(chuàng)業(yè)公司,可能不再需要一位天才當(dāng)CEO了。
“地瓜機(jī)器人考慮怎么以Infra的身份,讓開發(fā)者快速把機(jī)器人做出來”。
誠如胡春旭所言,為了讓行業(yè)涌入更多開發(fā)者,地瓜機(jī)器人打造了一套中小學(xué)生都能參與的機(jī)器人開發(fā)生態(tài)。面向?qū)I(yè)機(jī)器人開發(fā)者,地瓜機(jī)器人還給了代碼注釋、功能視頻介紹、一鍵跳轉(zhuǎn)代碼倉庫等便捷功能,主打一個(gè)“包教包會(huì)”。
當(dāng)越來越多的開發(fā)者在地瓜機(jī)器人的生態(tài)中“玩轉(zhuǎn)”機(jī)器人之后,胡春旭也道出了地瓜機(jī)器人的野心——
“地瓜機(jī)器人想做類似英偉達(dá) CUDA的機(jī)器人生態(tài)。”
就像是英偉達(dá)CUDA加速一切AI大模型開發(fā)一樣,地瓜機(jī)器人也想要成為機(jī)器人行業(yè)的加速者。
以下是光錐智能和地瓜機(jī)器人開發(fā)者、生態(tài)副總裁胡春旭的獨(dú)家對話實(shí)錄:
(為了方便閱讀,文字細(xì)節(jié)做了些許優(yōu)化。)
談產(chǎn)品,地瓜機(jī)器人想做最好的機(jī)器人平臺(tái)
Q:請簡單介紹一下這次發(fā)布的地瓜機(jī)器人RDK S100算控一體化機(jī)器人開發(fā)套件的規(guī)格,與行業(yè)內(nèi)其他的平臺(tái)有什么區(qū)別?
胡春旭:RDK的意思是Robotics Developer Kit,后面的數(shù)字代表SoC的名稱。RDK產(chǎn)品的定位是面向機(jī)器人的各類開發(fā)者,同時(shí)也是地瓜機(jī)器人面向機(jī)器人生態(tài)的底座。
關(guān)于產(chǎn)品規(guī)格,我們根據(jù)機(jī)器人使用場景分了四個(gè)算力段。第一是算力需求不太高的,例如掃地機(jī)、割草機(jī),這些算力需求在5TOPS到10TOPS的級別。到四足機(jī)器人、低速物流車、消費(fèi)級的機(jī)械臂的話,對應(yīng)100TOPS算力。在往上是300TOPS對應(yīng)半人形和用途相對復(fù)雜的物流車。通用人形機(jī)器人的話,是600TOPS算力。針對不同機(jī)器人的需求,RDK已經(jīng)推出了RDK X3、RDK X5,對應(yīng)算力分別為5TOPS到10TOPS。這次的RDKS100,對應(yīng)的是百TOPS級算力需求的機(jī)器人平臺(tái)。后期會(huì)有面向300和600TOPS算力段的產(chǎn)品。RDK S100的意義在于地瓜機(jī)器人在具身場景提供SoC,并能提供相對應(yīng)完整的開發(fā)套件平臺(tái)。
跟市面上其他產(chǎn)品的區(qū)別,就是我們根據(jù)機(jī)器人技術(shù)演進(jìn)路徑和需求來定義的SoC。目前市面上對機(jī)器人的理解,一般是大腦以算為主,小腦負(fù)責(zé)控制。在落地的過程中,目前技術(shù)主要分為兩大流派。
第一是端到端的方式,一站式解決所有問題。這種方式的泛化性雖然好,但它對數(shù)據(jù)要求比較高,這導(dǎo)致它落地比較慢。第二個(gè)流派是采用分層的模型架構(gòu),其中包含運(yùn)動(dòng)、感知、語言理解的模型,這些模型分層處理任務(wù)。目前第二種流派已經(jīng)被很多公司驗(yàn)證過,是目前最可能讓產(chǎn)品量產(chǎn)的架構(gòu)。所以RDK S100提供的就是大小腦分層架構(gòu)的平臺(tái)。
最后說下技術(shù)規(guī)格。RDK S100總體是異構(gòu)架構(gòu),有CPU、BPU、MCU三個(gè)核心單元支撐大小腦的“算”和“控”。“算”的部分是CPU和BPU實(shí)現(xiàn),“控”是BPU和MCU一起完成。BPU同時(shí)支撐大腦跟小腦的模型加速,CPU負(fù)責(zé)大腦側(cè)的多任務(wù)邏輯處理,MCU負(fù)責(zé)機(jī)器人的實(shí)時(shí)運(yùn)動(dòng)控制。我們認(rèn)為這樣的技術(shù)架構(gòu)是最適合現(xiàn)階段機(jī)器人的,尤其是具身機(jī)器人落地的平臺(tái)。
Q:為什么要在當(dāng)下時(shí)間點(diǎn)去推出針對具身智能的通用平臺(tái)?
胡春旭:我們從更宏觀一點(diǎn)的角度看。2023年ChatGPT一下子炸開了整個(gè)大模型圈子,我們看到了大模型讓機(jī)器人翻越智能化大山的希望。整個(gè)機(jī)器人行業(yè)都在隨著大模型的發(fā)展而快速變革。我們認(rèn)為,機(jī)器人行業(yè)是一個(gè)非常大的市場。機(jī)器人具有改變千行百業(yè)的能力,所以行業(yè)空間遠(yuǎn)遠(yuǎn)大于智能汽車或手機(jī)。當(dāng)前大量公司都在找具身機(jī)器人的業(yè)務(wù)切入點(diǎn)。為了幫助這些機(jī)器人快速落地,地瓜機(jī)器人選擇在當(dāng)下推出標(biāo)準(zhǔn)化的機(jī)器人平臺(tái),進(jìn)而在行業(yè)大變革之前實(shí)現(xiàn)關(guān)鍵卡位。
Q:能否談?wù)勎覀兣c英偉達(dá)機(jī)器人開發(fā)平臺(tái)和CUDA之間的區(qū)別?我們在哪些部分的設(shè)計(jì)考慮得更深?
胡春旭:地瓜機(jī)器人當(dāng)下做的事,其實(shí)很像英偉達(dá)早期做的AI生態(tài)。地瓜機(jī)器人想做類似英偉達(dá)CUDA的機(jī)器人生態(tài)。地瓜機(jī)器人希望機(jī)器人開發(fā)平臺(tái)能夠像CUDA加速AI模型一樣,也能加速機(jī)器人開發(fā)。
與英偉達(dá)機(jī)器人開發(fā)平臺(tái)的區(qū)別,主要是英偉達(dá)與地瓜機(jī)器人兩家公司的定位不同。英偉達(dá)的核心定位是算力,為模型提供算力支撐。現(xiàn)在各大機(jī)器人廠商離不開英偉達(dá)云平臺(tái),其中之一的原因是機(jī)器人數(shù)據(jù)、仿真、訓(xùn)練等環(huán)節(jié)需要大量算力支撐。
英偉達(dá)偏向于云,地瓜機(jī)器人的定位就偏向于端。地瓜機(jī)器人考慮的是,如何解決機(jī)器人大規(guī)模出現(xiàn)而產(chǎn)生的智能芯片需求。定位差異,使得地瓜機(jī)器人與英偉達(dá)選擇了不同的社區(qū)運(yùn)營策略。地瓜機(jī)器人會(huì)考慮怎樣幫開發(fā)者快速做一個(gè)機(jī)器人出來。開發(fā)者依然可以用英偉達(dá)的云平臺(tái)做仿真。但模型訓(xùn)練完后,地瓜機(jī)器人會(huì)提供端側(cè)驗(yàn)證的工具鏈,支持開發(fā)者把訓(xùn)練好的模型快速落地到芯片上。同時(shí)我們還會(huì)提供一系列技術(shù)、生態(tài)、產(chǎn)業(yè)鏈、人才等資源支持,幫助不同層面的開發(fā)者實(shí)現(xiàn)量產(chǎn)。如果使用英偉達(dá)方案的話,很多初創(chuàng)公司可能會(huì)顧忌成本、功耗等問題。這部分是地瓜機(jī)器人做得比較好的部分。
Q:地瓜機(jī)器人做了哪些培育機(jī)器人開發(fā)者生態(tài)的動(dòng)作?
胡春旭:對于開發(fā)者而言,地瓜機(jī)器人提供的遠(yuǎn)遠(yuǎn)不是一個(gè)硬件,而是一整套平臺(tái)。
這套架構(gòu)下層是RDK開發(fā)板,這是硬件的部分。中間層是OS(操作系統(tǒng)),地瓜機(jī)器人在其中加入了大量機(jī)器人中間件來幫助BPU充分運(yùn)行模型和算法。OS再往上是能幫開發(fā)者快速把硬件和軟件功能用出來的工具。這些工具能幫助開發(fā)者更好地面向不同場景進(jìn)行開發(fā)。例如有個(gè)工具叫RDK Studio,提供IDE(集成開發(fā))環(huán)境。在這個(gè)環(huán)境下,開發(fā)者只需要10分鐘就能體驗(yàn)到RDK所有核心AI功能。開發(fā)者只需要插一根Type-C線,就能通過圖形化實(shí)現(xiàn)快速功能落地。
簡單易用的工具,還能滿足不同能力開發(fā)者的需求。
針對入門開發(fā)者,中小學(xué)生都能用這種方式快速落地想要的功能。針對進(jìn)階開發(fā)者,我們提供NodeHub平臺(tái)幫助開發(fā)者寫代碼。在這個(gè)平臺(tái)里,我們不僅匯總了功能和相應(yīng)代碼,而且還對代碼做了詳細(xì)解釋并配備視頻介紹。所有代碼都支持Apache 2.0(一種開源協(xié)議)協(xié)議,還能快速跳轉(zhuǎn)到Github代碼倉庫。目前我們已經(jīng)有超過200個(gè)功能和開源代碼倉庫來支持開發(fā)者了。這些功能都是來源于地瓜機(jī)器人跟客戶商業(yè)合作的沉淀。面對科研級別的開發(fā)者,地瓜機(jī)器人有算法團(tuán)隊(duì),會(huì)對具身前沿方向算法進(jìn)行研究。這部分研究會(huì)以發(fā)論文或舉辦技術(shù)挑戰(zhàn)賽的方式,吸引開發(fā)者跟我們一起拓展。
總結(jié)下來,就是我們會(huì)圍繞開發(fā)者的不同層次去做運(yùn)營。
Q:很多開發(fā)者使用宇樹的機(jī)器人作為硬件載體,您是怎么看待這個(gè)現(xiàn)象的?是否可以理解地瓜機(jī)器人想要成為機(jī)器人智能開發(fā)的宇樹?
胡春旭:為什么很多人用宇樹的機(jī)器人作為硬件載體?我認(rèn)為這是生態(tài)發(fā)展的必然過程。從整個(gè)智能硬件發(fā)展的歷程中看,當(dāng)生態(tài)蓬勃發(fā)展的時(shí)候,行業(yè)會(huì)涌現(xiàn)非常多的業(yè)務(wù)方向,這時(shí)候就需要一個(gè)相對標(biāo)準(zhǔn)化的載體。對于機(jī)器人也是一樣,宇樹的機(jī)器人是一個(gè)比較標(biāo)準(zhǔn)化的人形載體。有了標(biāo)準(zhǔn)化的載體之后,機(jī)器人廠商比較方便針對業(yè)務(wù)做不同的配置。宇樹現(xiàn)在被認(rèn)為是一個(gè)平臺(tái)化的硬件提供商,還是蠻正常的。
地瓜機(jī)器人跟宇樹之間更多的是合作關(guān)系。我們也會(huì)用宇樹G1作為硬件平臺(tái),是因?yàn)槲覀冃枰?yàn)證RDK S100能在宇樹機(jī)器人實(shí)現(xiàn)進(jìn)一步機(jī)器人開發(fā)。地瓜機(jī)器人是提供機(jī)器人平臺(tái)化開發(fā)的基礎(chǔ)設(shè)施公司,人形機(jī)器人只是其中一個(gè)支持的機(jī)器人類型。
總體來看,我們將機(jī)器人大概分為三大類。第一是傳統(tǒng)機(jī)器人,例如傳統(tǒng)工業(yè)機(jī)器人、掃地機(jī)器人。這部分行業(yè)格局已經(jīng)形成,出貨量也比較穩(wěn)定。第二是新形態(tài)機(jī)器人,例如割草機(jī)、泳池機(jī)器人,這部分行業(yè)還在起量的過程中。第三部分就是現(xiàn)在的具身機(jī)器人,包括人形、四足、低速無人車等等。在具身領(lǐng)域里,RDK S100是一個(gè)切入口。后面還會(huì)有更高算力的芯片滿足其他具身類的機(jī)器人。
談技術(shù),機(jī)器人最大的困難是場景碎片化
Q:如何看待機(jī)器人行業(yè)目前缺訓(xùn)練數(shù)據(jù)的問題?地瓜機(jī)器人有哪些應(yīng)對方式?
胡春旭:目前行業(yè)內(nèi)主要通過兩種方式解決數(shù)據(jù)問題。第一類就是造數(shù)據(jù)。無論是仿真還是通過人類行為采樣,目標(biāo)都是數(shù)據(jù)生成之后喂給端到端模型。第二類方式是對算法和模型優(yōu)化,先實(shí)現(xiàn)小樣本達(dá)成比較好的效果,后續(xù)再持續(xù)學(xué)習(xí)增強(qiáng)模型效果,這種方式對數(shù)據(jù)需求相對較小。我們作為底層平臺(tái),兩種模式都要支持。
針對第一種,我們會(huì)更傾向于仿真。目前來看,Sim2Real(一種強(qiáng)化學(xué)習(xí),解決機(jī)器人在模擬與現(xiàn)實(shí)環(huán)境表現(xiàn)不同技術(shù))是機(jī)器人行業(yè)比較有效解決數(shù)據(jù)缺失的方案。但這條路線很依賴仿真環(huán)境中物理引擎的準(zhǔn)確性和真實(shí)性。目前地瓜機(jī)器人的解決方案是提供一個(gè)云平臺(tái),這個(gè)平臺(tái)能支持?jǐn)?shù)據(jù)仿真生成。我們會(huì)生成一些數(shù)據(jù)幫客戶做模型訓(xùn)練。
針對第二種方式,重點(diǎn)在于怎樣實(shí)現(xiàn)數(shù)據(jù)閉環(huán)。需要我們能夠有效抓到模型的bad case(模型與預(yù)期不符的案例),然后進(jìn)行針對訓(xùn)練。這就是解決前期數(shù)據(jù)不夠多,通過后續(xù)持續(xù)學(xué)習(xí)增強(qiáng)機(jī)器人智能的一種方式。我們目前在平臺(tái)里是在重點(diǎn)投入支持的。
Q:汽車智駕當(dāng)下最新的技術(shù)方案是世界模型,機(jī)器人這邊有沒有類似的技術(shù)?您如何看待世界模型技術(shù)在機(jī)器人領(lǐng)域的應(yīng)用?
胡春旭:地瓜機(jī)器人是從地平線孵化出來的團(tuán)隊(duì),所以繼承了很多汽車上的技術(shù)和Know-how。這些經(jīng)驗(yàn)放在機(jī)器人行業(yè)看,我覺得都是有效的。具身機(jī)器人的技術(shù)演變邏輯與智駕之間有很多相似之處,但區(qū)別在于汽車的驗(yàn)證進(jìn)度要比機(jī)器人要快。原因主要是汽車場景的數(shù)據(jù)獲取成本比機(jī)器人低得多。
機(jī)器人未來的演進(jìn)路徑,可能也會(huì)類似汽車智駕L1-L5等級。目前汽車大概是在L2-L3之間,機(jī)器人可能相對滯后一點(diǎn)。假設(shè)機(jī)器人L5是真正的AGI,那L5的機(jī)器人會(huì)替代其他機(jī)器人嗎?我們覺得不會(huì),L2-L5機(jī)器人之間應(yīng)該是并存的關(guān)系。可能區(qū)別是機(jī)器人的L4-L5是端到端、世界模型的方式驅(qū)動(dòng)智能,L2-L3還是分段式。
回到RDK S100上來,我們的定位肯定不是一步到位。畢竟100TOPS級的算力,做不到端到端大模型的算力支持。我們現(xiàn)在的定位,更多是為了解決機(jī)器人L2-L3分段式模型的技術(shù)路徑。
Q:參考汽車智駕分類體系,機(jī)器人不同等級應(yīng)該有什么樣的能力,分別對應(yīng)多少算力配置?
胡春旭:我個(gè)人判斷的話,類比汽車L2+需要400TOPS、L3需要1000TOPS算力,機(jī)器人需要的算力分級可能會(huì)比汽車的需求高50%-100%。類比汽車L2+,機(jī)器人可能需要600-800TOPS算力。這是因?yàn)闄C(jī)器人AI面臨的任務(wù)復(fù)雜度比汽車高得多。但算力也不是越大越好,因?yàn)樗惴ê湍P偷男室蚕喈?dāng)重要。所以并不能完全說800TOPS算力支持的模型效率就比400TOPS高一倍。整體看來,我認(rèn)為機(jī)器人L1-L5之間對應(yīng)的算力大概會(huì)有一個(gè)相對值,但具體是多少,現(xiàn)在其實(shí)沒有形成共識(shí)。
Q:如果要讓機(jī)器人去汽車工廠上班,這個(gè)場景需要配置多少算力?
胡春旭:面向一個(gè)具體場景,機(jī)器人需要多少算力,這與場景應(yīng)用需求相關(guān)。在汽車領(lǐng)域,人形機(jī)器人主要干的是檢測、裝配任務(wù)。這些任務(wù)需要機(jī)器人通過視覺感知來控制身體完成動(dòng)作。從技術(shù)層面看,需要的算力可能不會(huì)特別高。大概200-300TOPS就夠了。
Q:是什么原因?qū)е卢F(xiàn)在機(jī)器人在工廠的表現(xiàn)差強(qiáng)人意?
胡春旭:軟硬件的問題都有,這是一個(gè)綜合評估的問題。工廠應(yīng)用的核心要求是效率,很多機(jī)器人的感知和算法已經(jīng)比較ok了,但投入產(chǎn)出比還不夠高。舉個(gè)例子,人類員工每小時(shí)能產(chǎn)出1000個(gè)工件,每天工作8小時(shí)。機(jī)器人一小時(shí)可能只能產(chǎn)出200-300個(gè),就算24小時(shí)連軸轉(zhuǎn),全天也不過是600-900個(gè)。在此基礎(chǔ)上,工廠還要考慮機(jī)器人的購買成本。綜合算下來,機(jī)器人現(xiàn)在的效率達(dá)不到跟人類一致。這里面不只是感知、算法、模型的問題,很多情況下其實(shí)是軟件、硬件、業(yè)務(wù),甚至與產(chǎn)線環(huán)境都有關(guān)系。
Q:行業(yè)內(nèi)一直有一種說法,機(jī)器人和智駕技術(shù)的關(guān)聯(lián)性很高。當(dāng)下的智駕正在接近消費(fèi)者滿意的階段了,機(jī)器人跟智駕相比還差多遠(yuǎn)?地瓜機(jī)器人怎樣促進(jìn)消費(fèi)者對機(jī)器人技術(shù)滿意?
胡春旭:還是要從業(yè)務(wù)場景來看。汽車智駕是一個(gè)任務(wù)非常明確的場景,所有人都知道智駕應(yīng)該做什么。但機(jī)器人面對一個(gè)物體,很難說一定要去做什么,可能只有掃地機(jī)會(huì)有明確的任務(wù)。
跟汽車相比,機(jī)器人最大挑戰(zhàn)是場景碎片化。這不僅指的是任務(wù)場景種類的差別,產(chǎn)品形態(tài)上也是如此。機(jī)器人形態(tài)多種多樣,汽車大多是四個(gè)輪子的。消費(fèi)者逐漸開始接納智駕,是智駕技術(shù)和市場相對成熟的結(jié)果。但機(jī)器人這邊,技術(shù)、市場、社會(huì)接受度都相當(dāng)不成熟。如果人形機(jī)器人也能像智駕一樣大規(guī)模出現(xiàn)在市面上的話,可能需要十年或以上的時(shí)間。
所以地瓜機(jī)器人的生態(tài)建設(shè)目標(biāo)是支持整個(gè)機(jī)器人行業(yè)發(fā)展。不只是人形機(jī)器人,所有機(jī)器人方向都要支持。我們希望為更多開發(fā)者提供算力硬件和標(biāo)準(zhǔn)化的開發(fā)平臺(tái),實(shí)現(xiàn)各種類型的機(jī)器人創(chuàng)意。在社區(qū)持續(xù)迭代之后,可能地瓜機(jī)器人會(huì)有上百萬的開發(fā)者、上千萬的開源項(xiàng)目。那時(shí)候,不管做任何機(jī)器人都能從地瓜機(jī)器人生態(tài)里汲取營養(yǎng)。
Q:要想讓機(jī)器人跑馬拉松或者自動(dòng)格斗,大概需要多少算力?需要我們的技術(shù)平臺(tái)提供什么樣的支撐?
胡春旭:其實(shí)現(xiàn)在的馬拉松和格斗,背后都是人在遙控,不需要多大的算力。要變成全自動(dòng)化,馬拉松需要視覺感知路面情況,同時(shí)協(xié)調(diào)身體的運(yùn)動(dòng)部分來奔跑。格斗的話,就是快速抓住對方動(dòng)作,預(yù)判這些動(dòng)作的影響,然后再保護(hù)自己和出招。我覺得需要的算力會(huì)比工廠場景高一些,大概300-500TOPS應(yīng)該是夠的。
其中最消耗算力的部分在感知層面。從行業(yè)看,100TOPS算力跑的模型大概參數(shù)量是1.5到7B級別。有300TOPS算力的話,就能跑十幾B的模型,感知部分就算是差不多了。對應(yīng)馬拉松和格斗場景,我們認(rèn)為需要提供10-20B的感知模型能力。
談商業(yè),讓所有人知道做機(jī)器人就用地瓜機(jī)器人
Q:為什么具身智能一下子成了科技公司積極下注的賽道?汽車產(chǎn)業(yè)鏈公司、互聯(lián)網(wǎng)公司、消費(fèi)電子,還有專門做機(jī)器人的四類公司,都達(dá)成重投入的共識(shí)?地瓜機(jī)器人作為汽車產(chǎn)業(yè)鏈出身的玩家,汽車行業(yè)背景帶來哪些優(yōu)勢?
胡春旭:我覺得參與具身機(jī)器人發(fā)展的公司可能不止這四類。一些更傳統(tǒng)的行業(yè)玩家也在大規(guī)模投入做機(jī)器人。
行業(yè)的迅速發(fā)展,我認(rèn)為是大模型帶來的顛覆。之前機(jī)器人一直沒有翻越智能化的大山,但大模型打破了這道門檻。后面各種玩家發(fā)現(xiàn),可以從不同角度參與機(jī)器人產(chǎn)品。人形可能是通用的形態(tài),但一定不是唯一的形態(tài)。機(jī)器人是一個(gè)足夠大的產(chǎn)業(yè),它能容納不同產(chǎn)業(yè)背景的公司參與并找到自己的定位。
例如互聯(lián)網(wǎng)公司能與其他公司合作,充分發(fā)揮自己的云端和營銷優(yōu)勢。消費(fèi)電子類公司可以快速迭代硬件產(chǎn)品,甚至推出低成本產(chǎn)品出海。過去沒有任何一個(gè)產(chǎn)業(yè)鏈的體量能與具身產(chǎn)業(yè)鏈相比較。相比汽車、手機(jī),機(jī)器人可能是一個(gè)十倍、百倍,甚至千倍的大市場。
汽車產(chǎn)業(yè)鏈的公司做機(jī)器人,有優(yōu)勢,也有限制。優(yōu)勢的部分,是汽車產(chǎn)業(yè)鏈相對成熟。由于汽車領(lǐng)域的不少技術(shù)與機(jī)器人類似,它可以幫你決策產(chǎn)品和市場策略。例如地瓜機(jī)器人跟地平線的合作,BPU同時(shí)應(yīng)用于汽車和機(jī)器人大腦,節(jié)省了很多投入。限制就是從汽車到機(jī)器人,要經(jīng)歷技術(shù)升維過程。機(jī)器人的需求更復(fù)雜,這是地瓜機(jī)器人面臨最大的挑戰(zhàn)。
Q:面對不同行業(yè)背景的客戶,地瓜機(jī)器人怎么去滿足這些不同視角下的需求?
胡春旭:我們做RDKS100的時(shí)候,先找了大約50家不同形態(tài)機(jī)器人公司了解共性需求。這些反饋合并到一起,就是現(xiàn)在的大小腦和平臺(tái)化。
按照我們判斷,機(jī)器人在未來三年內(nèi)有機(jī)會(huì)在一些場景下突破。可能是四足、機(jī)械臂、輪足或者物流車。這些場景的算力需求不高,RDK S100的100TOPS級別足夠了。這是我們基于算力供給的卡位。另一方面,是我們發(fā)現(xiàn)市面上的平臺(tái)基本不能同時(shí)提供“算”和“控”的能力。我們把CPU、BPU、MCU集成到一個(gè)SoC中,就能很好解決技術(shù)架構(gòu)的需求。
我們通過調(diào)研還發(fā)現(xiàn),很多機(jī)器人公司是初創(chuàng)類的中小型公司。這些公司不僅缺技術(shù),還會(huì)缺資金、營銷、人才等各類資源,我們的生態(tài)就能及時(shí)提供支持。地瓜機(jī)器人會(huì)給企業(yè)定向推送人才、對接資本合作、提供產(chǎn)品優(yōu)惠等支持,幫助他們快速落地產(chǎn)品。
Q:地瓜機(jī)器人的商業(yè)化路徑會(huì)復(fù)制地平線嗎?
胡春旭:地瓜機(jī)器人與地平線的定位類似。地平線是做智駕底座,它有芯片也有自動(dòng)駕駛的方案,地瓜機(jī)器人也有SoC和開發(fā)平臺(tái)。地瓜機(jī)器人和地平線的區(qū)別在于兩個(gè)行業(yè)生態(tài)上。汽車更偏產(chǎn)業(yè)鏈,機(jī)器人更偏向于開發(fā)者。機(jī)器人的生態(tài)更開放,里面涵蓋了小學(xué)生到大學(xué)生。所以生態(tài)運(yùn)營策略層面上講,地瓜機(jī)器人跟地平線的差異非常大。
Q:地瓜機(jī)器人的商業(yè)化過程都碰上了哪些問題,又是怎么解決的?
胡春旭:其實(shí)還是機(jī)器人片化開發(fā)的問題。很多企業(yè)、學(xué)生想做機(jī)器人,但他們其實(shí)并不清楚機(jī)器人能做什么。地瓜機(jī)器人能做的就是做好Infra(基礎(chǔ)設(shè)施)的角色,支撐他們快速找到自己的方向。
在產(chǎn)品側(cè),我們根據(jù)不同機(jī)器人算力需求卡位了4-5款產(chǎn)品。運(yùn)營層面,我們對開發(fā)者做了一個(gè)金字塔畫像區(qū)分。針對人數(shù)最多的基礎(chǔ)開發(fā)者,我們重點(diǎn)培育認(rèn)知。中間部分是創(chuàng)客或KOL,我們會(huì)主張一些合作,釋放優(yōu)質(zhì)項(xiàng)目和內(nèi)容。再往上是初創(chuàng)公司,他們的目標(biāo)會(huì)相對明確。地瓜機(jī)器人會(huì)根據(jù)市場的判斷,為他們提供建議和資源。
總之地瓜機(jī)器人的運(yùn)營目標(biāo)非常明確,就是讓所有人知道,做機(jī)器人就用地瓜機(jī)器人。地瓜機(jī)器人除了不做整機(jī)以外,一切工具都有。
談地瓜機(jī)器人,“不變”應(yīng)對行業(yè)太多的“變”
Q:地瓜機(jī)器人一直態(tài)度明確地不做整機(jī),為什么會(huì)定下這樣的戰(zhàn)略方向?
胡春旭:因?yàn)閷C(jī)器人行業(yè)足夠相信和認(rèn)可。機(jī)器人是一個(gè)非常龐大的行業(yè),它可能有萬億甚至千萬億的體量。想做出面向千行百業(yè)的機(jī)器人,需要一個(gè)盡量標(biāo)準(zhǔn)化的底座。這部分的市場已經(jīng)足夠大了,足以誕生一個(gè)比英偉達(dá)更偉大的公司。所以我們當(dāng)下的戰(zhàn)略是擴(kuò)大合作,與行業(yè)一起把市場做大。地瓜機(jī)器人把整機(jī)以外的,底層SoC、開發(fā)套件、算法、云平臺(tái)等方向做好。
Q:地瓜機(jī)器人獨(dú)立運(yùn)營之后有哪些感觸?
胡春旭:之前地瓜機(jī)器人在地平線內(nèi)部是個(gè)做AIoT的事業(yè)部。當(dāng)時(shí)有很多業(yè)務(wù),現(xiàn)在聚焦在機(jī)器人。最大的感嘆是行業(yè)變革得實(shí)在太快了,焦慮感也比以前強(qiáng)。以前還會(huì)有人幫你托底,現(xiàn)在只能自己加速成長。我們團(tuán)隊(duì)一直在保持學(xué)習(xí),每天都在跟隨行業(yè)迭代新的技術(shù)和模型,從中判斷未來的技術(shù)是否符合我們的預(yù)期。我們需要打造一些不變的東西,來對應(yīng)這個(gè)行業(yè)大量的“變”。
Q:如果用地平線的成功路徑去看地瓜機(jī)器人,地瓜機(jī)器人當(dāng)前處在什么位置?您預(yù)計(jì)搭載地瓜機(jī)器人的爆款產(chǎn)品多久能出現(xiàn)?
胡春旭:按時(shí)期對比的話,地瓜機(jī)器人肯定不是在地平線與長安合作之前。地瓜機(jī)器人目前已經(jīng)積累很多產(chǎn)品和客戶了。起碼在傳統(tǒng)的掃地機(jī)這塊,地瓜機(jī)器人相對站得比較穩(wěn)了。很多最新的高端機(jī)型,都使用了地瓜機(jī)器人的芯片。在出現(xiàn)爆款之前,地瓜機(jī)器人要做的還是不斷深入探索。
爆款預(yù)測的話,我認(rèn)為可能是新形態(tài)機(jī)器人。具身的技術(shù)、市場和需求還不太成熟。而大部分新形態(tài)機(jī)器人已經(jīng)有了不少明確的落地場景。我們從生態(tài)中看到,已經(jīng)陸續(xù)有玩家在用我們的芯片做產(chǎn)品驗(yàn)證了。
Q:這地瓜機(jī)器人是否也會(huì)參與整合供應(yīng)鏈?
胡春旭:做生態(tài)的工作中,供應(yīng)鏈?zhǔn)呛苤匾囊画h(huán)。
地瓜機(jī)器人的生態(tài)里有很多角色。比如說做傳感器或執(zhí)行器等機(jī)器人零部件的合作伙伴,有ToB或者ToC的整機(jī)廠商,還有做解決方案的。當(dāng)?shù)毓蠙C(jī)器人發(fā)現(xiàn)一家初創(chuàng)公司的產(chǎn)品定義很好時(shí),就能根據(jù)生態(tài)提供支持。其中包括技術(shù)支持,例如幫助模型和語音交互調(diào)優(yōu),也會(huì)幫忙對接合作伙伴供應(yīng)硬件。
Q:您預(yù)計(jì)機(jī)器人行業(yè)多久爆發(fā)?對應(yīng)地瓜機(jī)器人產(chǎn)品的出貨量能達(dá)到多少?
胡春旭:三年之內(nèi),新形態(tài)機(jī)器人會(huì)在一些場景爆發(fā)。三到五年之間,可能會(huì)有一些具身機(jī)器人平穩(wěn)落地。5-10年內(nèi),具身機(jī)器人會(huì)從Demo階段走向真正的商業(yè)化。十年之后,人形通用機(jī)器人可能具備AGI水準(zhǔn),這些機(jī)器人可能會(huì)在未來10-15年之間出現(xiàn)。如果在這段時(shí)間再次出現(xiàn)“ChatGPT時(shí)刻”,那節(jié)奏還會(huì)加快。
地瓜RDK產(chǎn)品線明年預(yù)計(jì)出貨量至少會(huì)翻一倍。如果要定一個(gè)爆發(fā)指標(biāo)的話,應(yīng)該是某個(gè)場景做到一年50萬的出貨量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.