作者 | 金旺
欄目 | 機器人新紀元
2023年12月,特斯拉Optimus一個公開演示視頻,讓人們再次對人形機器人熱血沸騰。
在這個視頻中,特斯拉展示的第二代人形機器人尤其手部靈巧操作能力驚艷出眾,特斯拉官方還將Optimus抓取雞蛋時手部實時的信號反饋在視頻中進行了展示。
而這樣實時的信號反饋源自于一項關鍵技術的引入,這項技術就是觸覺傳感器技術。
觸覺傳感器技術起步并不算早,但卻在近年來被視為機器人,尤其是人形機器人靈巧操作能力的一項關鍵技術。
他山科技就是這樣一支研究觸覺傳感器的團隊,在2022年研發出首款觸覺感知芯片后,如今他山科技的機器人指尖傳感器已經是國內市占率最高的觸覺傳感器。
在近日的第二屆中國人形機器人與具身智能產業大會上,我們與他山科技CEO馬揚進行了一場對話,一起聊了聊他山科技的成長經歷、觸覺傳感器的研發難題,以及人形機器人的商業化路徑。
01 執行任務的機器人,需要觸覺傳感器
2017年,時值國內早期機器人創業潮,當時的宇樹剛剛研發出第一款四足機器人Laikago,優必選、達闥作為國內第一批機器人創業團隊更是風頭正盛。
他山科技正是在這一年成立,不過,他山科技的成立還有另一個故事。
作為他山科技創始人,他山科技董事長孫滕諶很早就意識到了機器人在養老陪護方向的巨大潛力。
老年人在心智上與小孩類似,但同時又會有各種各樣的要求,家庭保姆往往很難滿足老年人各種近乎苛刻的要求。
更何況,隨著老齡化不斷加劇,越來越多老年人有了養老和看護的需求,既能任勞任怨地照顧老人、又能進行全天候看護的機器人在這一領域就有了巨大的應用潛力。
于是,同樣希望做機器人的他山科技在這一年正式成立。
有所不同的是,他山科技并未選擇整機研發這一路徑,而是選擇了機器人觸覺感知這一極具挑戰性,對機器人卻又至關重要的細分賽道,觸覺傳感器。
觸覺感知是機器人實現泛化能力的一項關鍵技術,不僅是技術難題,更是機器人實現廣泛應用的關鍵所在。
然而,在2017年前后,國外諸如波士頓動力這樣的人形機器人先驅,機器人產品還處于“跑跳”階段,國內機器人創業團隊更多聚焦于交互層面,還沒有哪個團隊機器人有用到觸覺傳感器。
不過,馬揚告訴我們,“機器人要真正能執行任務,代替人做各種工作,對靈巧手有著很高的要求,而靈巧手上最關鍵的就是能夠做任務執行的觸覺傳感器?!?/p>
他山科技的第一款觸覺感知芯片是在2019年作為北京市重點合作項目立項研發,對于他山科技而言,這是一個機會,也讓他們面臨著巨大挑戰。
隨后,經過三年技術攻關,他山科技在2022年點亮第一款觸覺感知芯片,這款觸覺感知芯片也被視為“全球首款數?;旌螦I觸覺感知芯片”。
在完成芯片研發后,第二年,他山科技又完成了執行端的研發,并與清華大學人工智能觸覺團隊聯合開發了視觸覺融合的自適應抓取靈巧手。
據馬揚透露,“當時這一代靈巧手是基于夾爪做的,做完之后我們非常興奮,因為我們做了一項行業中開創性的技術。”
“史無前例”帶來的是另一種壓力,當這款產品被他山科技團隊推向市場后,他們發現,這樣一款被他們視為劃時代的產品在市場上卻鮮有人問津,一年下來,只有一些做機器人技術研發的高校實驗室買了他們的產品。
這樣的局面一直持續到了2023年年底。
2023年,在人形機器人大潮洶涌來襲時,不少汽車廠商開始下場做人形機器人,汽車廠商本就是觸覺傳感器的早期用戶,對觸覺傳感器有著更深的理解。
更重要的是,作為這波人形機器人浪潮的引領者,特斯拉在2023年12月發布的第二代Optimus人形機器人上引入了觸覺傳感器,對外展示的演示視頻在全球范圍內得到了廣泛關注。
也是在這一年年底,一家正在研發人形機器人的汽車廠商找到他山科技,一次性下單了50個觸覺傳感器。
他山科技終于等到了機器人的新一波浪潮,等到了觸覺傳感器登上歷史舞臺的時刻。
02 將抓取任務成功率提升到90%
大模型,是推動觸覺傳感器走向商用的一大助力。
“如果模型能力沒有跟上,應用在靈巧手上的觸覺傳感器只有感知能力、沒有執行能力是不夠的,”談及觸覺傳感器的作用,馬揚解釋稱,“只有當擁有了具備一定泛化性的模型,才能支撐觸覺傳感器做任務執行。”
正是基于這樣的理解,他山科技在2019年成立的AI觸覺感知實驗室不僅研發了觸覺感知芯片和指尖觸覺傳感器,還一直在研發觸覺感知算法模型。
讓馬揚感觸頗深的是,大模型的技術突破,加速了這一進程。
馬揚告訴我們,“實際上,這波人形機器人的熱潮來臨與大模型技術發展不無關系,基于大模型技術訓練機器人底層通用模型,模型的迭代速度是六七年前不敢想象的?!?/p>
就觸覺感知算法模型而言,六七年前花費半年進行的研發工作,現在可能一兩天就能完成,他山科技的VTLA任務分解與協同執行模型就是在這樣的技術加速下完成的。
指尖觸覺傳感器中的模型該如何做?
他山科技團隊最初的想法是,盡可能讓能在手端解決的問題在手端解決,不用交由腦端。
如果不用到云端算力的話,機器人的腦端算力資源非常緊張,目前來看仍不夠用,所以最初在做模型設計時,他山科技團隊設計的手端模型架構分為兩步:
第一步,先將數據稀疏化。觸覺傳感器采集到的數據來自多個通道,他山科技團隊先將這些來自不同通道的原始數據轉化為物理變量,最終給到腦部的數據盡可能是高密度且有效的數據。
第二步,在手端完成動作執行。當機器人完成抓取動作后,物體的移動、遞交等動作執行放到手端來完成。
關于其中的玄機,馬揚解釋稱,“機器人執行抓取動作時,在將物體拿起來這個過程的動作是非常泛化的,即便是同樣一個水杯放在那里,由于涉及到材料老化等問題,每次抓取物體的反饋都不同,但一旦成功將物體抓起來、進入穩態后,再進行移動、遞交等動作時就變得非常收斂。”
正是基于這些考量,他山科技研發了VTLA(視覺-觸覺-語言-動作)任務分解與協同執行模型,基于這一模型,可以將一個動作執行的長任務進行分解:
在任務獲取時,根據視覺模型、語言模型做任務輸入;
在任務執行時,通過觸覺模型做任務執行,再輔以視覺模型做任務檢查,然后通過大模型做任務輸出。
據馬揚透露,“機器人在基于VTLA模型執行任務時,數據端算力使用可以降低一個數量級,任務執行成功率可以提升到90%以上?!?/p>
即便如此,觸覺感知技術仍然處于早期階段。
03 觸覺傳感器,缺少行業標準
關于觸覺感知技術的成熟度,馬揚給了我們一個更直觀的對比數據,“如果說視覺感知技術的成熟度能達到90分的話,樂觀估計,現在的觸覺傳感器只有60分。”
之所以有這樣的差距,是因為視覺感知技術自上個世紀八十年代研發至今,已經經過了近半個世紀的發展,無論是技術標準,還是軟硬件,都已經有了長足的發展。
尤其是隨著此前人工智能技術發展,諸如ImageNet全球競賽的開展,進一步將視覺技術提升到了一個新高度。
馬揚認為,“現在的視覺感知技術僅僅是在動態捕捉能力上與人類有一定差距,在靜態物體感知和計算上已經遠超人類。”
然而,回看觸覺感知技術發展,馬揚認為,依然需要大量數據來推動技術迭代。
材料技術是觸覺傳感器面臨的另一個技術卡點,此前的觸覺傳感器不少技術應用都是從其它場景遷移而來,視觸感知技術是從表面缺陷檢測技術遷移而來,壓阻、壓電相關技術是由可穿戴產品的觸屏材料技術遷移而來,下一代觸覺傳感器需要在容性、阻性、感性上有更好的單向敏感性的新材料。
觸覺感知技術相關標準制定是馬揚指出的另一個亟需解決的問題,馬揚告訴科技行者,“我們現在亟需將觸覺傳感器數據存儲的編解碼標準統一,將核心參數確定下來,這樣至少可以保證機器人廠商在進行靈巧手研發時無需再考慮數據兼容性問題。”
他山科技早在2023年2月就與門頭溝區人民政府、北京市標準化研究院正式簽約了《人工智能觸覺標準化合作協議》,旨在推進人工智能觸覺技術標準化戰略規劃,建立以人工智能觸覺傳感應用技術為核心的標準應用體系。
他山科技目前也在加強產業生態合作,據馬揚透露,“他山科技目前面向機器人在做的觸覺傳感器包括指尖、手掌、手臂、軀干在內的多種觸覺傳感器,除了指尖傳感器是由團隊完全獨立研發外,手掌、手臂、軀干在內的防撞或交互用途的觸覺傳感器,我們都在與產業鏈上下游一起合作?!?/p>
實際上,在過去兩年里,他山科技不僅參與了國地共建具身智能創新中心創新中心的創立,還參與了由上海市人智能行協協會起草的團體標準《人形機器人分級分類應用指南》和《具身智能智能化等級分級指南》。
在推動人形機器人、具身智能標準制定和產業落地上,他山科技都在切身參與其中。
04 大模型+機器人,2-3年商業落地
在特斯拉2024年Q4業績會上,馬斯克透露,“特斯拉人形機器人Optimus生產線月產能已經達到1000臺,明年(2026年)將建設的第二條生產線月產能將會達到10000臺。”
此外,馬斯克還提到,“預計今年Optimus將在特斯拉內部投入使用,負責完成工廠中最無聊、最討厭的一系列工作,明年下半年將會面向其他公司交付產品?!?/p>
在機器人廠商紛紛推進人形機器人量產,甚至進入產線測試應用時,2025年也被視為人形機器人商業落地元年,然而,也是在這時,投資人關于人形機器人的短期商業價值的質疑,讓人形機器人的商業化站在了一個十字路口。
馬揚告訴我們,“在談人形機器人商業化時,大家其實需要明確一個概念,如果是談真正具有泛化能力的大型人形機器人商業落地,毫無疑問需要再等5-10年,但如果是在一些具體細分場景做有限物體的抓取泛化,我們在未來2-3年就可以支持客戶商業化落地?!?/p>
一個具體應用案例是他山科技與云跡科技在酒店配送場景進行的合作,酒店配送機器人核心任務是物品運送,將一件或多件商品從A點運送到B點,當下酒店配送機器人是在A點由人將物品放到機器人箱體中后,在B點再由酒店客人取出。
當加入靈巧手和觸覺感知技術后,酒店配送機器人需要人介入的工作環節將進一步簡化,在A點配送機器人可以自主將相應物品抓取到箱體中,當到達房間后,配送機器人又可以自主將物品抓取放到房間門口或房間中。
馬揚告訴我們,“在這條工作鏈路中,配送機器人需要抓取的物品的種類是有限的,我們只需要將配送機器人需要識別的95%的物品在模型訓練階段實現,其它5%的物品通過端側具有泛化性的小模型來做自適應抓取,由此我們就可以將機器人的物品抓取成功率提升到99%以上。”
諸如此類場景在酒店、物流、工業柔性生產、清潔與輔助分類等領域有大量需求,馬揚向我們舉的另一個剛需應用場景是商務酒店洗衣房的洗衣場景。
國內商務酒店越來越多開始配備自助洗衣房,而在這些自助洗衣房中,通常配有3套左右洗衣機+烘干機,由于洗衣、烘干每個環節都需要1個小時左右時間,酒店客人一般都不會守在洗衣房中等待,這就導致洗衣機、烘干機的空占率很高。
如果酒店配備了上述機器人,同樣可以提升自助洗衣房洗衣機、烘干機的使用效率,降低空占率,從而提升酒店的入住體驗。
大型人形機器人面臨的普遍是大型泛化場景,這些場景涉及的泛化需求往往是充分泛化。
人形機器人在進行充分泛化時,執行物體抓取任務時,不僅會遇到物體形態的泛化,甚至還會涉及時間維度的泛化——在執行抓取任務過程中,每個時間點上的動作響應都會有所不同。
“要將這樣的大型泛化場景中遇到的泛化問題都學習完,這將是一個漫長的過程,”馬揚特別指出,“而且泛化到一定程度就需要持續做產品迭代、做數據飛輪。”
而當談到最初對于家庭保姆機器人的暢想,馬揚則表示,“早期你可以在家里引入5-10個機器人,一個給你做飯,一個給打掃衛生……,這或許是更快讓我們實現家庭保姆機器人自由的方法?!?/p>
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.