四位機(jī)器人領(lǐng)軍人物的商業(yè)化思考與實(shí)踐。
4月28日,由「甲子光年」主辦、上海馬橋人工智能創(chuàng)新試驗(yàn)區(qū)聯(lián)合承辦的「AI共潮生——2025甲子引力X科技產(chǎn)業(yè)新風(fēng)向」大會(huì)在上海工業(yè)智能中心成功舉辦。在大會(huì)的圓桌對(duì)話環(huán)節(jié),圍繞“大模型×機(jī)器人——具身智能的‘寒武紀(jì)大爆發(fā)’”這一主題,五位嘉賓分享了他們對(duì)具身智能發(fā)展的深刻見(jiàn)解。
當(dāng)前,AI大模型與機(jī)器人技術(shù)的深度融合正推動(dòng)具身智能迎來(lái)“寒武紀(jì)大爆發(fā)”式的革命。然而,行業(yè)仍處于從概念驗(yàn)證到早期商用的過(guò)渡期,如何實(shí)現(xiàn)商業(yè)化落地成為關(guān)鍵議題。
梅卡曼德機(jī)器人創(chuàng)始人兼CEO邵天蘭強(qiáng)調(diào),創(chuàng)業(yè)公司需要優(yōu)先找到商業(yè)閉環(huán),而非宏大敘事。梅卡曼德聚焦于機(jī)器人的“眼睛和大腦”,通過(guò)高精度傳感器和AI視覺(jué)技術(shù)實(shí)現(xiàn)L2級(jí)智能的規(guī)模化應(yīng)用,同時(shí)探索L3級(jí)技術(shù)。他提到,具身智能機(jī)器人面臨專(zhuān)業(yè)設(shè)備和人工的“夾擊”,需找到兼具技術(shù)可行性和經(jīng)濟(jì)性的場(chǎng)景。
節(jié)卡機(jī)器人CTO許雄認(rèn)為,具身智能的硬件形態(tài)尚未形成統(tǒng)一標(biāo)準(zhǔn),工業(yè)場(chǎng)景的機(jī)器人需具備更強(qiáng)的操作智能。節(jié)卡通過(guò)融入力覺(jué)和視覺(jué)感知提升機(jī)器人的車(chē)間級(jí)泛化能力,并推出復(fù)合機(jī)器人形態(tài)以適應(yīng)跨行業(yè)需求。他提出,降低中小企業(yè)應(yīng)用門(mén)檻需從生產(chǎn)、交付、部署到維護(hù)全鏈條優(yōu)化。
微億智造董事長(zhǎng)兼CEO張志琦從工業(yè)現(xiàn)場(chǎng)的實(shí)際需求出發(fā),指出具身智能需平衡柔性、效率和成本。微億通過(guò)AI與機(jī)器人結(jié)合,實(shí)現(xiàn)免示教、自適應(yīng)任務(wù),但工程化問(wèn)題仍需突破。他認(rèn)為,具身智能的規(guī)模化應(yīng)用需比傳統(tǒng)機(jī)器人更柔性、比人工更高效、比人形機(jī)器人更便宜。
非夕科技副總裁胡曉平分享了自適應(yīng)機(jī)器人在食品加工、理療和手術(shù)等非工業(yè)場(chǎng)景的應(yīng)用潛力。非夕通過(guò)力控技術(shù)與AI結(jié)合,解決操作對(duì)象不確定性問(wèn)題,未來(lái)將重點(diǎn)拓展服務(wù)大眾的領(lǐng)域。他呼吁行業(yè)以合理心態(tài)看待人形機(jī)器人發(fā)展,避免資源浪費(fèi)。
總體來(lái)看,具身智能的商業(yè)化路徑需聚焦核心場(chǎng)景、降低成本、強(qiáng)化技術(shù)可靠性。工業(yè)領(lǐng)域更關(guān)注實(shí)際問(wèn)題的解決與ROI,而非技術(shù)標(biāo)簽;非工業(yè)領(lǐng)域則需突破力控與AI的融合,拓展服務(wù)邊界。
無(wú)論是創(chuàng)業(yè)公司還是成熟企業(yè),務(wù)實(shí)創(chuàng)新與生態(tài)共建將是決勝未來(lái)的關(guān)鍵。
以下是本場(chǎng)圓桌的對(duì)話實(shí)錄,「甲子光年」整理:
邵天蘭:我是梅卡曼德機(jī)器人創(chuàng)始人邵天蘭,我們做的是機(jī)器人的“眼睛和大腦”,我們自己研發(fā)工業(yè)級(jí)高精度的3D相機(jī),還有很多人工智能算法的軟件,可以配合各種各樣的機(jī)器人。
當(dāng)前,我們已經(jīng)實(shí)現(xiàn)了L2級(jí)別智能規(guī)模化應(yīng)用,主要是在汽車(chē)、汽車(chē)零部件、家電3C、鋰電光伏、物流等領(lǐng)域,現(xiàn)在也在大量出口。我們看到包括像大模型、傳感、決策等很多技術(shù),也給機(jī)器人行業(yè)帶來(lái)更多的可能性,期待和各位探討。
許雄:各位好,我叫許雄,上海交大機(jī)器人研究所博士畢業(yè),現(xiàn)在是節(jié)卡機(jī)器人的CTO。節(jié)卡機(jī)器人成立于2014年,由一群教授和工程師共同創(chuàng)立。
節(jié)卡今年已經(jīng)是第11個(gè)年頭,過(guò)去11年聚焦于新一代智能協(xié)作機(jī)器人的產(chǎn)品化和場(chǎng)景落地。從產(chǎn)品形態(tài)來(lái)看,我們從最初的單臂六軸協(xié)作機(jī)器人,逐步融入力覺(jué)感知的JAKA S系列,以及JAKA All in one視覺(jué)感知系列。后續(xù)還推出了復(fù)合機(jī)器人形態(tài),包括AMR與協(xié)作臂結(jié)合,再搭配末端2D或3D視覺(jué)的復(fù)合機(jī)器人。近兩年,我們還針對(duì)特定場(chǎng)景,尤其是工業(yè)汽車(chē)行業(yè),推出了雙臂機(jī)器人和人形機(jī)器人形態(tài)的機(jī)器人。
從應(yīng)用場(chǎng)景來(lái)看,過(guò)去11年,節(jié)卡致力于將易于使用的機(jī)器人產(chǎn)品推廣到三大行業(yè):汽車(chē)新能源、3C半導(dǎo)體和通用工業(yè)。我們希望讓機(jī)器人更加智能、更加簡(jiǎn)單易用,普及到全球各行各業(yè)。
張志琦:我是張志琦,來(lái)自微億智造。微億智造是一家工業(yè)AI+機(jī)器人智能控制的企業(yè)。我們從產(chǎn)品外觀表面檢測(cè)的質(zhì)檢賽道切入,沉淀了一系列“眼手腦云”的技術(shù)能力,也就是把產(chǎn)線上質(zhì)檢工人用眼睛看、用手翻零件、用大腦判斷零件是否合格的能力,轉(zhuǎn)化為技術(shù)棧,并結(jié)合工業(yè)AI、工業(yè)視覺(jué)和機(jī)器人運(yùn)動(dòng)控制的能力,微億已經(jīng)發(fā)展成為一家不僅提供質(zhì)檢,還涵蓋打磨、裝配、上下料等柔性場(chǎng)景應(yīng)用的解決方案提供商。
我們致力于將工業(yè)人工智能與機(jī)器人相結(jié)合的具身應(yīng)用能力,使其適應(yīng)更多柔性化場(chǎng)景,突破傳統(tǒng)工業(yè)機(jī)器人只能通過(guò)編程提升效率的局限,真正實(shí)現(xiàn)柔性化與大規(guī)模高效生產(chǎn)的平衡。
胡曉平:大家下午好,我是來(lái)自非夕的胡曉平。非夕成立于2016年,目前已經(jīng)成長(zhǎng)為通用智能機(jī)器人賽道的獨(dú)角獸企業(yè)。
我從以下三個(gè)方面來(lái)介紹一下非夕:
第一,非夕是將高精度力控技術(shù)路線引入機(jī)器人的企業(yè)。盡管工業(yè)機(jī)器人發(fā)展多年,但因技術(shù)路線約束,導(dǎo)致在很多行業(yè)沒(méi)有辦法完成任務(wù)。人類(lèi)更多依賴(lài)手感和力覺(jué)完成任務(wù),非夕將這種能力賦予機(jī)器人。
第二,非夕極致創(chuàng)新了機(jī)器人的硬件。現(xiàn)有機(jī)器人系統(tǒng)及核心零部件無(wú)法滿(mǎn)足高精度力控規(guī)劃的需求,經(jīng)過(guò)多年技術(shù)迭代,非夕已實(shí)現(xiàn)硬件90%以上的自主研發(fā)。
第三,通過(guò)具身智能賦能機(jī)器人實(shí)現(xiàn)跨行業(yè)應(yīng)用。人工智能的最佳載體是機(jī)器人,已經(jīng)成為共識(shí)。非夕自2015、2016年起就開(kāi)始結(jié)合機(jī)器人與AI發(fā)展,并隨著具身智能的興起,分拆成立了穹徹智能,短時(shí)間內(nèi)完成了差不多五輪融資,切實(shí)感受到具身智能賽道的熱度。
1.具身智能的務(wù)實(shí)與前瞻:
四位創(chuàng)始人的戰(zhàn)略選擇
荊濤(主持):現(xiàn)在大家都明白了,這幾位留在最后是有原因的,他們都是特別有實(shí)力的企業(yè)家和創(chuàng)始人、創(chuàng)業(yè)者。我們下面準(zhǔn)備問(wèn)一些比較深入的問(wèn)題。
當(dāng)前實(shí)現(xiàn)具身智能似乎有很多選擇,比如可以做人形,基于大模型做通用智能體,也可以做更加適合特定場(chǎng)景的專(zhuān)用智能體,比如工業(yè)機(jī)械臂、物流機(jī)器人等等。我想請(qǐng)問(wèn)當(dāng)下各位的戰(zhàn)略選擇是什么?你要做什么、不做什么?
邵天蘭:對(duì)于創(chuàng)業(yè)公司來(lái)說(shuō),我們相比宏大敘事,找到自身的商業(yè)閉環(huán)、增長(zhǎng)點(diǎn)以及如何生存和發(fā)展是更重要的一件事。
之前開(kāi)場(chǎng)提到有投資人表示最近正在退出一些公司,而有行業(yè)創(chuàng)始人表示他們并非商人,而是在做一件事。但我認(rèn)為恰恰相反,我覺(jué)得作為公司創(chuàng)始人,我們首先是商人,必須首先保證公司的生存和發(fā)展,為投資人帶來(lái)回報(bào),在這個(gè)基礎(chǔ)上才能去做更大的事情。
梅卡曼德聚焦在非常具體的領(lǐng)域,我們做的是機(jī)器人的眼睛和大腦,最近也開(kāi)始涉足手的部分。我們?cè)诟呔葌鞲衅鳌⑷斯ぶ悄芤曈X(jué)和規(guī)劃方面已經(jīng)實(shí)現(xiàn)了L2級(jí)別的規(guī)模化應(yīng)用,目前正在探索L3級(jí)別技術(shù),已經(jīng)少量應(yīng)用,但技術(shù)上還會(huì)有許多需要突破的地方。
關(guān)于業(yè)務(wù)定位,我們專(zhuān)注于機(jī)器人的眼睛和大腦,不做機(jī)器臂,因?yàn)楹芏嗥髽I(yè)已經(jīng)做得很好;也不做移動(dòng),因?yàn)楹芏嗥髽I(yè)在這方面也都做得非常好;我們也不做整機(jī)和系統(tǒng)集成,因?yàn)槲覀兊脑S多客戶(hù)在這些領(lǐng)域比我們更專(zhuān)業(yè)。我們的選擇是做好機(jī)器人的眼睛和大腦,讓客戶(hù)能夠結(jié)合機(jī)器臂、移動(dòng)等技術(shù),深入到各個(gè)應(yīng)用場(chǎng)景中,提供多樣化的解決方案。
許雄:這兩年具身智能確實(shí)越來(lái)越熱,節(jié)卡也在不斷思考。節(jié)卡的產(chǎn)品設(shè)計(jì)理念是讓機(jī)器人變得易于使用,成為一個(gè)簡(jiǎn)單的工具。從最開(kāi)始的圖形化編程,實(shí)現(xiàn)簡(jiǎn)單操作、編程和部署,這兩年我們也在不斷思考如何更好地融入力覺(jué)感知和視覺(jué)感知,如何讓傳統(tǒng)六軸機(jī)械臂變得更智能。
目前,節(jié)卡的六軸機(jī)械臂已經(jīng)部署了幾萬(wàn)臺(tái)。針對(duì)行業(yè)特定場(chǎng)景的數(shù)據(jù)采集后,我們思考如何在車(chē)間層面集聚泛化能力,提升幾個(gè)工序之間的泛化能力。核心思想是運(yùn)用新技術(shù),包括具身智能技術(shù),讓機(jī)械臂在車(chē)間具備更好的泛化能力,適應(yīng)柔性生產(chǎn)方式,從而更智能、更簡(jiǎn)單易用。這是針對(duì)我們大量出貨、批量生產(chǎn)的六軸協(xié)作機(jī)械臂的改進(jìn)方向。
同時(shí),我們也思考跨車(chē)間級(jí)甚至跨子行業(yè)所需的通用智能體。節(jié)卡擅長(zhǎng)工業(yè)場(chǎng)景,80%的業(yè)務(wù)集中在汽車(chē)等大型工業(yè)客戶(hù)場(chǎng)景。針對(duì)工業(yè)場(chǎng)景的通用機(jī)器人,我們更傾向于推出復(fù)合機(jī)器人形態(tài),例如AGV+機(jī)械臂+視覺(jué)系統(tǒng),以及人形雙臂+輪式人形雙臂,配合節(jié)卡推出的行業(yè)大模型,解決汽車(chē)行業(yè)、跨子行業(yè)的泛化和智能化需求。
節(jié)卡主要從兩個(gè)方面推進(jìn):一是讓現(xiàn)有產(chǎn)品更好地融入視覺(jué)和力覺(jué)感知,解決車(chē)間級(jí)泛化能力;二是推出人形雙臂、輪式雙臂,以及接下來(lái)會(huì)發(fā)布帶腿的人形機(jī)器人,解決跨子行業(yè)的泛化操作能力。
張志琦:本質(zhì)上,我們和投資人或前沿行業(yè)分析師交流時(shí),會(huì)把自己定位為一家具身智能企業(yè)。但在工業(yè)現(xiàn)場(chǎng),客戶(hù)并不關(guān)心我們是具身智能企業(yè)還是自動(dòng)化公司。客戶(hù)唯一關(guān)心的是:今天能否幫他們解決現(xiàn)場(chǎng)問(wèn)題,并且在性?xún)r(jià)比(ROI)合理的情況下完成。如果設(shè)備雖然能替換一兩個(gè)工人,但售價(jià)高達(dá)一兩百萬(wàn),客戶(hù)是不會(huì)接受的。
這種矛盾揭示了工業(yè)現(xiàn)場(chǎng)的殘酷現(xiàn)實(shí)與技術(shù)前沿探討之間的差距。在這種矛盾下,我們唯一的選擇是:第一,確保我們的技術(shù)能夠在客戶(hù)現(xiàn)場(chǎng)真正解決問(wèn)題。比如我們最初從外觀檢測(cè)切入,解決的是如何在柔性化生產(chǎn)中快速適應(yīng)產(chǎn)線變化,滿(mǎn)足客戶(hù)需求。如今,我們?cè)谝惑w化大壓鑄件打磨處理等場(chǎng)景中,解決的是傳統(tǒng)打磨機(jī)器人無(wú)法像人一樣靈活處理問(wèn)題的痛點(diǎn)。
在工業(yè)現(xiàn)場(chǎng),我們希望具身智能機(jī)器人能夠像“師傅帶徒弟”一樣,通過(guò)示教讓機(jī)器人快速學(xué)習(xí)并完成任務(wù),從而降低產(chǎn)品導(dǎo)入成本,使其在性?xún)r(jià)比上更具吸引力。
我們的技術(shù)目標(biāo)是:將原本需要依靠人工主觀判斷的柔性化任務(wù),通過(guò)AI與機(jī)器人結(jié)合的方式實(shí)現(xiàn)自動(dòng)化,而不是像傳統(tǒng)自動(dòng)化那樣只能做到剛性高效。我們的技術(shù)路徑是將剛性、高效與柔性有效結(jié)合,這才是我們選擇的發(fā)展方向。
胡曉平:一個(gè)非常簡(jiǎn)單的邏輯是,對(duì)于一家企業(yè),核心肯定還是關(guān)注基于自身優(yōu)勢(shì)的領(lǐng)域,做有實(shí)際應(yīng)用價(jià)值的技術(shù)創(chuàng)新和產(chǎn)品,這是最底層的邏輯。
圍繞這個(gè)邏輯,非夕團(tuán)隊(duì)早期在斯坦福期間接觸過(guò)非常多像人形阿西莫這樣的項(xiàng)目,但當(dāng)時(shí)沒(méi)有往那個(gè)方向走。核心原因是,我們認(rèn)為當(dāng)前機(jī)器人在操作能力上的缺失是更需要補(bǔ)齊的,而不是在運(yùn)動(dòng)控制方面。因此,我們花了六七年時(shí)間,不斷迭代力控方向上的能力,從而讓它真正具備可落地性。
如今,非夕的機(jī)器人手臂既可以用于產(chǎn)線生產(chǎn),也可以用于切肉、炸雞排;既可以用于理療按摩,也可以用于手術(shù);既可以用于實(shí)驗(yàn)室自動(dòng)化,也可以用于疊衣服或家庭服務(wù)。這些應(yīng)用場(chǎng)景的實(shí)現(xiàn),正是通過(guò)核心技術(shù)的突破,賦予了機(jī)器人廣泛的操作能力提升。
對(duì)于未來(lái)的具身智能賽道,我們依然保留對(duì)星辰大海的追求。因此,我們專(zhuān)門(mén)成立了研究機(jī)器人大腦的企業(yè),致力于進(jìn)一步發(fā)展。我們的目標(biāo)是基于未來(lái)更廣泛意義上與人或服務(wù)行業(yè)接觸的領(lǐng)域,希望通過(guò)這些努力,真正實(shí)現(xiàn)機(jī)器人在千行百業(yè)和千家萬(wàn)戶(hù)的落地服務(wù)。
2.投資人撤退VS大廠入局:人形機(jī)器人的冰與火之歌
荊濤(主持):最近一些車(chē)企、大廠比如小鵬、華為開(kāi)始跨界布局人形機(jī)器人,而一些老牌機(jī)器人企業(yè)因?yàn)槿谫Y沒(méi)到位出現(xiàn)一些輿論,有投資人也提到正在批量退出人形機(jī)器人公司。類(lèi)比新能源汽車(chē)的話,各位認(rèn)為,當(dāng)前機(jī)器人發(fā)展處在哪個(gè)階段?面向市場(chǎng),機(jī)器人企業(yè)如何實(shí)現(xiàn)差異化競(jìng)爭(zhēng)?
邵天蘭:機(jī)器人是一個(gè)很綜合的技術(shù)。目前,不考慮無(wú)人機(jī),人形機(jī)器人或雙臂移動(dòng)機(jī)器人主要涉及三個(gè)技術(shù)方向:一是導(dǎo)航,一些公司在這一領(lǐng)域已經(jīng)做得比較好,掃地機(jī)器人和送餐機(jī)器人等產(chǎn)品已經(jīng)實(shí)現(xiàn)商業(yè)化,甚至有公司已經(jīng)上市或正在籌備上市;二是運(yùn)動(dòng)控制,一些公司通過(guò)強(qiáng)化學(xué)習(xí)和仿真等技術(shù)取得了很好的進(jìn)展,當(dāng)然從馬拉松也可以看出來(lái),這類(lèi)產(chǎn)品可靠性、硬件控制等方面,還有提升空間;三是操作能力,很多公司也在努力推進(jìn),但整體進(jìn)展相對(duì)較慢。
機(jī)器人是一個(gè)短板邏輯的系統(tǒng),導(dǎo)航、運(yùn)動(dòng)控制和操作能力中任何一塊存在明顯短板,都會(huì)限制機(jī)器人的整體性能和可用性。目前,行業(yè)內(nèi)對(duì)于機(jī)器人何時(shí)能夠達(dá)到高度可用性尚未形成共識(shí),有人認(rèn)為是明年,有人認(rèn)為是5年、10年甚至20年,時(shí)間跨度差異比較大。
創(chuàng)業(yè)公司的生存時(shí)間有限,需要在可見(jiàn)的時(shí)間內(nèi)實(shí)現(xiàn)一定規(guī)模的商業(yè)落地。目前,視覺(jué)、力控和導(dǎo)航等技術(shù)相對(duì)成熟,而其他技術(shù)仍在驗(yàn)證中。我們目前專(zhuān)注于做好機(jī)器人的“眼睛和大腦”,并探索手的技術(shù)。
許雄:針對(duì)電動(dòng)汽車(chē)、智能汽車(chē)和人形機(jī)器人的話題,很大程度上是受到特斯拉的引領(lǐng),因?yàn)樘厮估陔妱?dòng)汽車(chē)和智能汽車(chē)兩個(gè)領(lǐng)域都有產(chǎn)品。但從技術(shù)發(fā)展的角度來(lái)看,我是從硬件和軟件兩個(gè)層面來(lái)看的。
從硬件通用性來(lái)看,電動(dòng)汽車(chē)和智能汽車(chē)的發(fā)展是建立在傳統(tǒng)汽車(chē)的形態(tài)基礎(chǔ)之上的。
傳統(tǒng)汽車(chē)經(jīng)過(guò)多年發(fā)展,已經(jīng)形成了全球統(tǒng)一的標(biāo)準(zhǔn),即四個(gè)輪子加底盤(pán)。對(duì)于人類(lèi)來(lái)說(shuō),四個(gè)輪子的移動(dòng)平臺(tái)是最快速的移動(dòng)方式之一,這種形態(tài)已經(jīng)被廣泛接受。因此,在傳統(tǒng)汽車(chē)的四個(gè)輪子加底盤(pán)的技術(shù)形態(tài)下,快速切換到智能化和電動(dòng)化是相對(duì)容易的。
然而,對(duì)于機(jī)器人來(lái)說(shuō),什么是更通用的機(jī)器人的物理形態(tài),至少業(yè)界沒(méi)有形成一致,都是按照行業(yè)來(lái)切的。比如工廠中的六軸機(jī)器人、串聯(lián)機(jī)器人、移動(dòng)機(jī)器人(AGV)等,這些形態(tài)都是根據(jù)具體行業(yè)需求而發(fā)展起來(lái)的。
從硬件的通用性來(lái)說(shuō),人形的形態(tài)還是要打個(gè)問(wèn)號(hào)的。
從軟件層面來(lái)看,業(yè)界普遍認(rèn)為具身智能可以分為三個(gè)層面:交互智能、操作智能和運(yùn)動(dòng)智能。
智能汽車(chē)和人形機(jī)器人都需要具備良好的運(yùn)動(dòng)智能和交互智能。然而,對(duì)于人形機(jī)器人來(lái)說(shuō),操作智能的要求更高。人形機(jī)器人需要具備高度泛化和可靠的操作能力,例如在復(fù)雜環(huán)境中執(zhí)行各種任務(wù),如抓取、搬運(yùn)、操作工具等。這種操作智能的實(shí)現(xiàn)難度更大,因?yàn)樗枰獧C(jī)器人具備類(lèi)似人類(lèi)的靈活性和適應(yīng)性。
相比之下,智能汽車(chē)的操作智能要求較低,因?yàn)槠渲饕δ苁且苿?dòng),而不是進(jìn)行復(fù)雜的操作任務(wù)。
從具身智能的挑戰(zhàn)性來(lái)看,人形機(jī)器人需要同時(shí)具備強(qiáng)大的運(yùn)動(dòng)智能和高度泛化、可靠的操作智能,這使得其軟件層面的智能化難度更大。
張志琦:在討論具身智能時(shí),我們先明確一下它的定義。在我的理解中,具身智能一般具備四個(gè)能力:學(xué)習(xí)能力、感知能力、決策能力和執(zhí)行能力。只要這四個(gè)能力能夠結(jié)合在一起,并以數(shù)據(jù)為閉環(huán)驅(qū)動(dòng),通常就會(huì)被認(rèn)為屬于具身智能的范疇。
因此,具身智能可以分為通用型(比如人形機(jī)器人)和場(chǎng)景化(比如工業(yè)具身智能)兩種類(lèi)型。無(wú)論是哪種類(lèi)型,只要具備四個(gè)能力,都可以被視為具身智能的載體。
所以這個(gè)問(wèn)題特別好,因?yàn)橹邱{汽車(chē)也具備這四個(gè)能力,也是面向特定場(chǎng)景的具身智能體。同時(shí)這兩年大家在智駕汽車(chē)領(lǐng)域投入了大量資金和技術(shù),已經(jīng)發(fā)展到一定階段,這對(duì)機(jī)器人領(lǐng)域具有重要的借鑒意義。
首先,具身智能的本體是什么?智駕汽車(chē)的本體是一輛車(chē),車(chē)的形態(tài)是很穩(wěn)定的,到今天為止車(chē)的形態(tài)也沒(méi)有發(fā)生很大變化,還是四個(gè)輪子+驅(qū)動(dòng)機(jī)構(gòu)+方向盤(pán)。類(lèi)似地,在機(jī)器人領(lǐng)域,工業(yè)具身智能的本體也相對(duì)穩(wěn)定,比如都是工業(yè)機(jī)械臂和協(xié)作臂(四軸、六軸等)的形態(tài)。
第二,今天智駕汽車(chē)為什么發(fā)生很大變化,本質(zhì)上是AI技術(shù)的加持,特別是大腦和小腦能力的結(jié)合,改變了中間需要人去操作的部分。同樣,具身智能的爆發(fā)也是因?yàn)锳I技術(shù)的推動(dòng)。
第三,電動(dòng)車(chē)的整體架構(gòu)隨著AI能力的增強(qiáng)而發(fā)生了更大的變化。比如,在視覺(jué)感知和多模態(tài)融合能力方面,智駕汽車(chē)加入了更多的視覺(jué)、激光雷達(dá)和毫米波雷達(dá)等能力,這些能力在傳統(tǒng)汽車(chē)中并不需要,但為了滿(mǎn)足AI感知的需求,硬件本體也發(fā)生了進(jìn)一步的變化。所以也就形成了硬件需要為軟件服務(wù)。
在具身智能領(lǐng)域,我們目前的本體已經(jīng)相對(duì)穩(wěn)定,比如工業(yè)機(jī)器人已經(jīng)經(jīng)歷了幾十年迭代。接下來(lái)要做的是通過(guò)AI技術(shù)實(shí)現(xiàn)智能化,將更多技術(shù)融合進(jìn)去。目前,我們已經(jīng)看到許多基于工業(yè)機(jī)器人的場(chǎng)景中加入了視覺(jué)感知和AI技術(shù)能力,無(wú)論是人形還是非人形機(jī)器人,都在實(shí)現(xiàn)生活和工業(yè)場(chǎng)景中的應(yīng)用。
未來(lái),我們需要將更多能力融合到本體上,形成從邊端到云端的強(qiáng)集成環(huán)境,解決硬件和軟件的工程化問(wèn)題,突破技術(shù)瓶頸,從而讓機(jī)器人能夠更快速地實(shí)現(xiàn)開(kāi)箱即用。
就像今天的智駕汽車(chē)一樣,用戶(hù)拿到車(chē)后幾乎不需要太多指導(dǎo)就能使用,按一個(gè)按鈕,本身智能化的能力就可以體現(xiàn)。將來(lái)機(jī)器人也需要達(dá)到這種程度。
胡曉平:前面幾位嘉賓已經(jīng)分享了對(duì)機(jī)器人和具身智能的理解,我簡(jiǎn)單談?wù)勅诵螜C(jī)器人產(chǎn)業(yè)的個(gè)人看法。
從政府產(chǎn)業(yè)規(guī)劃角度看,人形機(jī)器人是一個(gè)非常好的產(chǎn)業(yè)。它技術(shù)集成度高、研發(fā)周期長(zhǎng)、未來(lái)市場(chǎng)空間和預(yù)期大。因此,如果從整體產(chǎn)業(yè)調(diào)度布局人形機(jī)器人,相信會(huì)像早期布局電動(dòng)車(chē)一樣重要。
但大家也需要認(rèn)識(shí)到,目前,人形機(jī)器人處于發(fā)展早期,更多是解決運(yùn)動(dòng)控制能力,很多場(chǎng)景還處于展示階段。但我們需要給予足夠的耐心和健康、持續(xù)的資金投入,去支持機(jī)器人長(zhǎng)期發(fā)展。
作為從業(yè)者,如果這個(gè)領(lǐng)域不是你的擅長(zhǎng)項(xiàng),也不要輕易介入,否則可能會(huì)對(duì)社會(huì)資源的有效分配造成一定影響。所以雙方都需要以一個(gè)合理的心態(tài)去看待人形機(jī)器人產(chǎn)業(yè)的發(fā)展,期待它能健康有序發(fā)展,讓人形或類(lèi)人形機(jī)器人更早地服務(wù)于人。
3.從概念到產(chǎn)線:具身智能機(jī)器人的商業(yè)化之路
荊濤(主持):我記得馬斯克曾經(jīng)說(shuō)過(guò),未來(lái)每一個(gè)自然人背后可能都會(huì)有三五個(gè)或者是更多的機(jī)器人為他服務(wù)。全世界就會(huì)有數(shù)百億臺(tái)機(jī)器人,據(jù)說(shuō)會(huì)給機(jī)器人加增養(yǎng)老保險(xiǎn),這些都是我們現(xiàn)在對(duì)于機(jī)器人的理解。
我們知道,微億智造去年首發(fā)了具身智能工業(yè)機(jī)器人,并且在工業(yè)場(chǎng)景中逐步落地,在“大模型+機(jī)器人”的具身智能趨勢(shì)下,您認(rèn)為當(dāng)前我們的技術(shù)距離真正的規(guī)模化產(chǎn)業(yè)應(yīng)用還存在哪些瓶頸?
張志琦:我先講兩個(gè)小故事,解釋為什么我們?nèi)ツ臧l(fā)布了具身智能工業(yè)機(jī)器人。
去年我們看到網(wǎng)上有很多視頻,比如機(jī)器人炒菜、燒飯、洗衣服、疊衣服等,實(shí)現(xiàn)技術(shù)的方式多種多樣,比如通過(guò)強(qiáng)化學(xué)習(xí)等等。為什么大家都愿意發(fā)布視頻?坦白來(lái)講(機(jī)器人能夠做到的)成功率不高,但通過(guò)剪輯視頻展示公司的技術(shù)能力,也能讓大家對(duì)未來(lái)充滿(mǎn)暢想。
我們?nèi)ツ臧l(fā)布的具身智能工業(yè)機(jī)器人,已經(jīng)在工業(yè)現(xiàn)場(chǎng)落地,依靠算法解決了以往需要人去判斷的能力。我們?cè)诠げ?huì)現(xiàn)場(chǎng)展示了一臺(tái)真實(shí)的設(shè)備,讓觀眾體驗(yàn)。
當(dāng)時(shí),我們搭建的場(chǎng)景是:桌面上有一堆工件,觀眾可以任意組合成一個(gè)產(chǎn)品,邊上還有一堆零散的工件隨機(jī)擺放。只要觀眾組合完成,設(shè)備會(huì)在20秒內(nèi),基于組合的產(chǎn)品形態(tài),從零散的工件中找到對(duì)應(yīng)的組件,再通過(guò)雙臂騰空拼搭的方式完成工作。完成后,兩臺(tái)協(xié)作臂將模型推給其他工業(yè)臂,無(wú)論是重構(gòu)還是異構(gòu),所有設(shè)備都能快速批量化復(fù)制。
這個(gè)場(chǎng)景主要解決的是免示教問(wèn)題,不需要通過(guò)工程師編程或拖動(dòng)等方式對(duì)傳統(tǒng)機(jī)器人進(jìn)行示教,也不需要前期做太多標(biāo)定,很多自動(dòng)化標(biāo)定工作會(huì)自動(dòng)生成。通過(guò)這種技術(shù),我們降低了機(jī)器人使用門(mén)檻,希望把機(jī)器人變成一個(gè)學(xué)徒,像師徒傳承一樣,讓機(jī)器人學(xué)會(huì)操作。
這個(gè)場(chǎng)景在工博會(huì)引起很大關(guān)注,四大機(jī)器人廠商都來(lái)到我們展臺(tái)。我們展示的設(shè)備在精度和算力上都達(dá)到了一定水平,感知能力上也沒(méi)有使用昂貴的3D點(diǎn)云相機(jī),而是通過(guò)高算力實(shí)現(xiàn)。
不過(guò),坦白來(lái)講,要實(shí)現(xiàn)真正的規(guī)模化應(yīng)用,還需要走一定的道路。解決工程化問(wèn)題。這不僅是一個(gè)技術(shù)突破,還需要在工程上解決很多實(shí)際問(wèn)題。
舉個(gè)最簡(jiǎn)單的例子,視覺(jué)系統(tǒng)通常不與機(jī)械臂出廠時(shí)集成,而我們希望將更強(qiáng)大的視覺(jué)系統(tǒng)內(nèi)嵌到本體上,但如何布線就是一個(gè)大問(wèn)題。協(xié)作臂內(nèi)部空間狹窄,讓線纜穿過(guò)是一個(gè)巨大挑戰(zhàn)。這些問(wèn)題會(huì)導(dǎo)致設(shè)備不穩(wěn)定,還需要對(duì)本體進(jìn)行更多優(yōu)化。
從去年到今天,我們一直在解決技術(shù)突破和工程化問(wèn)題,確保產(chǎn)品能夠在客戶(hù)現(xiàn)場(chǎng)有效規(guī)模化使用。我們始終認(rèn)為,具身智能要實(shí)現(xiàn)規(guī)模化應(yīng)用,必須具備三個(gè)特點(diǎn):一是比傳統(tǒng)工業(yè)機(jī)器人更柔性;二是比人工更高效;三是比人形機(jī)器人更便宜。只有做到這三點(diǎn),具身智能才能真正爆發(fā),這也是我們的努力方向和目標(biāo)。
4.業(yè)級(jí)具身智能的三大瓶頸:成本、可靠性與場(chǎng)景突破
荊濤(主持):梅卡曼德在工業(yè)機(jī)器人視覺(jué)引導(dǎo)領(lǐng)域積累了豐富了經(jīng)驗(yàn),在具身智能浪潮下,你認(rèn)為工業(yè)場(chǎng)景對(duì)大模型的需求和其他領(lǐng)域有何本質(zhì)不同,梅卡曼德將如何解決工業(yè)級(jí)具身智能面臨的挑戰(zhàn)?
邵天蘭:我們現(xiàn)在把大模型大量嘗試用在工業(yè)場(chǎng)景,已經(jīng)開(kāi)發(fā)了自己的AI客服。過(guò)去客戶(hù)有問(wèn)題會(huì)在論壇搜索文檔,或者給我們發(fā)文件、打電話,現(xiàn)在我們訓(xùn)練的AI客服已經(jīng)實(shí)際應(yīng)用,很多人也很喜歡。這是一個(gè)典型例子,當(dāng)結(jié)果要求不是100%可靠時(shí),還有兜底措施,對(duì)AI不滿(mǎn)意還是可以打電話。在這種情況下,大模型在工業(yè)領(lǐng)域已經(jīng)開(kāi)始應(yīng)用。
我們想把大模型與機(jī)器人結(jié)合,但目前看到還有幾個(gè)具體瓶頸需要突破。
第一個(gè)瓶頸是成本問(wèn)題。
現(xiàn)在部署大模型到百億參數(shù)級(jí)別,使用的算力和設(shè)備成本大概相當(dāng)于兩臺(tái)協(xié)作機(jī)器人。我可以做一個(gè)很好的展示,比如部署一個(gè)百億參數(shù)級(jí)別的模型可以做很多事情,但如果結(jié)合一臺(tái)協(xié)作機(jī)器人,就相當(dāng)于用了三臺(tái)協(xié)作機(jī)器人的成本,這就需要產(chǎn)生相應(yīng)的價(jià)值。
所以稍微大一些參數(shù)的模型真正部署起來(lái),成本還是比較高的。有時(shí)候大家會(huì)說(shuō)用了一個(gè)低成本的機(jī)械臂、低成本的相機(jī)、低成本的手等,但后面使用的機(jī)箱里的GPU價(jià)格遠(yuǎn)超這些設(shè)備之和。
舉一個(gè)例子,我看到討論說(shuō)某個(gè)模型一個(gè)H20就可以跑起來(lái),但一個(gè)H20比手+機(jī)械臂+視覺(jué)加起來(lái)還要貴得多。
第二個(gè)瓶頸是可靠性問(wèn)題。
我們上大模型是因?yàn)橐鎸?duì)復(fù)雜和變化的環(huán)境,客戶(hù)的期待很高。但如何在這種復(fù)雜和變化的環(huán)境中,把可靠性特別是底線可靠性做上去,目前仍然是沒(méi)有解決的問(wèn)題。
大家在網(wǎng)上會(huì)看到很多很炫酷的視頻,那是我們技術(shù)的上限,就像看集錦一樣。但客戶(hù)最終需要的不是視頻里表現(xiàn)出來(lái)的上限,而是在最壞情況下,產(chǎn)品是否仍然安全,是不是仍然不會(huì)造成不可逆的嚴(yán)重后果。這個(gè)事情怎么做,今天仍然沒(méi)有一個(gè)特別準(zhǔn)確的方式。剛才張總也提到,模型本身和工程化的努力都是需要的,具體怎么做還需要探索。
第三個(gè)瓶頸是優(yōu)勢(shì)場(chǎng)景問(wèn)題。
具身機(jī)器人面臨上下兩層的“夾擊”。如果把洗衣機(jī)、掃地機(jī)也當(dāng)作機(jī)器人,那么每個(gè)人有多臺(tái)機(jī)器人幫忙已經(jīng)實(shí)現(xiàn)了。
具身智能狹義上是指使用大模型、有自學(xué)習(xí)、泛化任務(wù)和物品處理的機(jī)器人。它往下會(huì)面臨專(zhuān)業(yè)設(shè)備的競(jìng)爭(zhēng),比如洗衣機(jī)、機(jī)械臂+傳感器,L1和L2級(jí)別的智能;往上則面臨人類(lèi)的競(jìng)爭(zhēng),人工操作其實(shí)在很多場(chǎng)景中并不是一個(gè)很貴的解決方案。
所以,具身智能機(jī)器人必須找到一個(gè)場(chǎng)景,相對(duì)于專(zhuān)業(yè)設(shè)備和人工都有優(yōu)勢(shì),但目前我還沒(méi)有看到一個(gè)特別有說(shuō)服力的例子。我總感覺(jué)也許專(zhuān)業(yè)設(shè)備會(huì)更好,也許雇個(gè)人會(huì)更好。
5.食品+醫(yī)療+服務(wù):機(jī)器人應(yīng)用新藍(lán)海
荊濤(主持):下面有請(qǐng)非夕科技CTO曉平回答一個(gè)問(wèn)題,非夕科技自適應(yīng)機(jī)器人已經(jīng)在工業(yè)領(lǐng)域取得應(yīng)用,在大模型加持下你認(rèn)為最具商業(yè)化潛力的新場(chǎng)景會(huì)是什么?
胡曉平:過(guò)去一兩年,非夕在實(shí)際場(chǎng)景中進(jìn)行了大量探索,積累了一些現(xiàn)實(shí)案例。非夕早期專(zhuān)注于制造業(yè),包括汽車(chē)、家電和3C領(lǐng)域,因?yàn)檫@些行業(yè)對(duì)機(jī)器人質(zhì)量要求較高,需要經(jīng)過(guò)一段時(shí)間打磨本體能力。
在此基礎(chǔ)上,非夕在過(guò)去一年多甚至更長(zhǎng)時(shí)間里,探索了許多非工業(yè)場(chǎng)景的應(yīng)用。
比如,在農(nóng)產(chǎn)品加工領(lǐng)域,非夕開(kāi)發(fā)了用于切肉、炸雞排、炸魚(yú)肉、小酥肉和魷魚(yú)處理等的應(yīng)用。這些領(lǐng)域過(guò)去機(jī)器人應(yīng)用較少,屬于勞動(dòng)密集型產(chǎn)業(yè),且操作對(duì)象往往不確定,非常適合結(jié)合具身智能和AI能力的機(jī)器人應(yīng)用。非夕的機(jī)器人具備力控能力,能夠有效適應(yīng)目標(biāo)對(duì)象的不確定性,是力控+AI應(yīng)用的典型場(chǎng)景,未來(lái)有廣闊的應(yīng)用前景。
食品安全是國(guó)家和政府非常關(guān)注的課題,如果將食品加工產(chǎn)業(yè)逐步迭代為智能制造,可以有效解決相關(guān)問(wèn)題。比如,預(yù)制菜的安全性可以通過(guò)機(jī)器人自動(dòng)化加工得到保障,這是一個(gè)非常有意義的方向。
除了食品加工,非夕還在理療方面進(jìn)行了探索。
上海第一人民醫(yī)院和北京玉泉醫(yī)院的推拿科醫(yī)生體驗(yàn)了非夕的機(jī)械臂,因?yàn)橛辛乜梢院芎玫貫槿朔?wù),他們的感受確實(shí)非常好。未來(lái),非夕也會(huì)重點(diǎn)推廣這樣的應(yīng)用,讓每個(gè)人都可以在按摩店體驗(yàn)到。
此外,非夕在手術(shù)機(jī)器人領(lǐng)域也有沉淀,尤其是支持遠(yuǎn)程操作的產(chǎn)品。非夕的力控機(jī)械臂能夠有效復(fù)現(xiàn)遠(yuǎn)程作業(yè)的手感,讓遠(yuǎn)端醫(yī)生以沉浸式的形式進(jìn)行手術(shù),就像他在病人面前做手術(shù)一樣。
這些是過(guò)去非夕積累的部分案例,但時(shí)間還較短,期待通過(guò)更多時(shí)間和更多人共同構(gòu)建產(chǎn)品生態(tài)。非夕將提供自動(dòng)化底層基座,結(jié)合各行業(yè)的專(zhuān)業(yè)知識(shí),生成各行業(yè)的自動(dòng)化解決方案。
6.中小企業(yè)智能化改造:
ROI驅(qū)動(dòng)的四維解法
荊濤(主持):本場(chǎng)最后一個(gè)問(wèn)題就交給雄哥,大模型+機(jī)器人被視為制造業(yè)智能化的重要推動(dòng)力,但很多中小企業(yè)仍面臨應(yīng)用門(mén)檻。作為協(xié)作機(jī)器人領(lǐng)域的代表企業(yè),節(jié)卡將如何降低技術(shù)使用成本,幫助更多中小企業(yè)實(shí)現(xiàn)“輕量化”的智能改造?
許雄:對(duì)很多中小企業(yè)來(lái)說(shuō),ROI(投資回報(bào)率)是很重要的。從節(jié)卡自身的經(jīng)驗(yàn)來(lái)看,主要從以下幾個(gè)方面幫助客戶(hù),尤其是廣大中小企業(yè),把整個(gè)改造成本做得更加精益化。
第一,本地化生產(chǎn)與高效交付。節(jié)卡一直秉承客戶(hù)在哪里,就把工廠建在哪里的理念。節(jié)卡的工廠變成機(jī)器人造機(jī)器人,節(jié)卡的機(jī)器人造自己的機(jī)器人。節(jié)卡在一體化關(guān)鍵生產(chǎn)制造環(huán)節(jié)能夠做到全球最低的噪聲、最高的精度、最低成本的一體化環(huán)節(jié),從而為中小企業(yè)提供更多的ROI。
第二,精益生產(chǎn)與質(zhì)量保障。節(jié)卡在生產(chǎn)過(guò)程中借鑒了日本的精益生產(chǎn)模式,工廠長(zhǎng)是從豐田聘請(qǐng)來(lái)的,他在豐田待了30年。質(zhì)量總經(jīng)理也是從豐田聘請(qǐng)的,這樣保證了整個(gè)機(jī)械臂的質(zhì)量,降低了客戶(hù)現(xiàn)場(chǎng)的部署和售后成本。
第三,快速部署與應(yīng)用包。節(jié)卡機(jī)器人專(zhuān)注于解決工業(yè)場(chǎng)景中的“最后一公里”問(wèn)題,通過(guò)打造面向不同行業(yè)場(chǎng)景的應(yīng)用包(比如加工上下料、智能焊接、智能碼垛等),幫助客戶(hù)快速將機(jī)器人部署到產(chǎn)線,形成生產(chǎn)力。這些應(yīng)用包基于簡(jiǎn)單編程,普通工人也能快速上手,節(jié)省了部署時(shí)間。
最后,節(jié)卡大量借鑒具身智能技術(shù),從客戶(hù)產(chǎn)線上采集操作數(shù)據(jù),監(jiān)控應(yīng)用并學(xué)習(xí),快速判斷每個(gè)關(guān)節(jié)的健康度,從而提升預(yù)測(cè)性維護(hù)能力,降低宕機(jī)時(shí)間。
通過(guò)以上四個(gè)環(huán)節(jié),節(jié)卡的應(yīng)用不僅在汽車(chē)行業(yè),還在3C電子行業(yè)等領(lǐng)域,幫助廣大中小企業(yè)更精益地實(shí)現(xiàn)機(jī)器人產(chǎn)線的智能化,讓機(jī)器人成為簡(jiǎn)單易用的生產(chǎn)力工具。
荊濤(主持):今天在四位硬漢身邊,感受到他們對(duì)于機(jī)器人,對(duì)于具身智能的拳拳報(bào)國(guó)之心,包括對(duì)于產(chǎn)業(yè)的信心,當(dāng)然也看到和感受到他們滿(mǎn)滿(mǎn)的情懷,非常的不容易。在他們當(dāng)中不久之后可能就會(huì)有數(shù)千億市值的公司出來(lái),具體是哪一位,我不說(shuō),你們自己體會(huì)一下。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.