DeepSeek的優(yōu)化思路對具身智能大模型的開發(fā)和建立具有極大的參考意義。
文|張可
ID | BMR2004
在人工智能技術(shù)飛速發(fā)展的當(dāng)下,具身智能與機器人技術(shù)的結(jié)合被視為引爆下一個AI風(fēng)口的關(guān)鍵。中信書院讀書會近期邀請非夕科技副總裁胡曉平,深入探討了自適應(yīng)機器人的技術(shù)突破、行業(yè)格局,以及DeepSeek大模型對智能機器人領(lǐng)域的影響。
非夕科技于2016年成立,專注于研發(fā)、生產(chǎn)集高精度力控、計算機視覺和人工智能技術(shù)于一體的自適應(yīng)機器人產(chǎn)品。其創(chuàng)始團隊主要來自斯坦福機器人實驗室和人工智能實驗室。
非夕科技現(xiàn)已完成五輪融資,融資過程較為順利。胡曉平介紹,在天使輪階段,非夕的斯坦福基因背景是吸引投資的核心。此后,非夕的每個發(fā)展階段都在追求極致中穩(wěn)步前進,因此在A、B輪投資時,非夕也能夠以成熟的產(chǎn)品和具有潛力的應(yīng)用場景贏得投資者的信任。2022年至今,公司每年營收都會保持2-3倍增長,且產(chǎn)品的通用性可賦能多行業(yè)。
作為一家從斯坦福實驗室走出的獨角獸企業(yè),非夕科技憑借獨特的“力控+AI”技術(shù)路線,正推動機器人從工業(yè)場景邁向更開放的千行百業(yè)。
01
技術(shù)破局:自適應(yīng)機器人“仿人化操作”的探索
胡曉平介紹,傳統(tǒng)工業(yè)場景的機器人大多依賴固定的程序,追求高精度與位置控制,因此應(yīng)用場景存在局限性。為了解決機器人的通用能力,非夕科技按照“力控+AI”的路線,打造能在變化的場景中進行自主調(diào)節(jié)、自主決策的自適應(yīng)機器人,以自適應(yīng)機器人對外界環(huán)境的感知能力和操作能力拓寬更多場景的應(yīng)用,賦能千行百業(yè)。
“力控+AI”結(jié)合的方式能夠從兩個維度提升機器人對力的感知和控制。在硬件上,非夕自主研發(fā)了六維力傳感器,能確保機器人與環(huán)境的交互過程中有精細的感知能力,此傳感器在性能、成本上大大優(yōu)于目前行業(yè)里的大部分產(chǎn)品。基于硬件的感知能力,在軟件上,非夕擁有一套七軸機械臂的控制算法,傳承了斯坦福機器人實驗室在力控領(lǐng)域的理論成果。從硬件和軟件兩個維度的升級,讓機器人的跨行業(yè)應(yīng)用能力得到了本質(zhì)提升。
非夕的自適應(yīng)機器人憑借“仿人化”的特點,不僅拓寬了工業(yè)領(lǐng)域的應(yīng)用成果,在非工業(yè)領(lǐng)域也實現(xiàn)了典型的應(yīng)用場景。
在工業(yè)制造領(lǐng)域,傳統(tǒng)機器人難以勝任復(fù)雜度較高的任務(wù),導(dǎo)致工業(yè)機器人的利用率較低,而自適應(yīng)機械臂憑借其“仿人化”的能力填補了這一空白。非夕的機械臂已與特斯拉、理想、蔚來等新能源車企展開了深度合作,成功解決了裝配、打磨、拋光等復(fù)雜場景下的任務(wù)。此外,該機械臂還應(yīng)用于3C電子產(chǎn)品等領(lǐng)域。
在非工業(yè)領(lǐng)域中,非夕的機械臂積極拓展到人力密集型任務(wù)。在農(nóng)業(yè)自動化生產(chǎn)中,機械臂成功實現(xiàn)了自動化切割雞腿肉、炸酥肉、剝皮等復(fù)雜任務(wù)。過去,這些都需要特定手法才能完成相應(yīng)動作,而自適應(yīng)機器人通過力覺的精準(zhǔn)感知,能將這種手藝轉(zhuǎn)化為機器人可執(zhí)行的動作,從而高質(zhì)量完成任務(wù)。在醫(yī)療領(lǐng)域,機械臂能掌握對人體穴位的力道控制,提供個性化的理療服務(wù),避免了傳統(tǒng)按摩椅力道固定、適應(yīng)性差的問題。
胡曉平介紹,目前,非夕在新能源汽車制造領(lǐng)域的產(chǎn)品已經(jīng)非常成熟,大部分客戶也非常認可非夕的解決方案,產(chǎn)品復(fù)購率達到40%-50%,形成了客戶從試水到規(guī)模化采購的信任鏈,也可以看出非夕科技商業(yè)化路徑的成功。對食品加工、理療、康養(yǎng)等產(chǎn)業(yè)也已經(jīng)有相應(yīng)的標(biāo)準(zhǔn)化產(chǎn)品,但這些產(chǎn)品還需要一定的推廣周期。
02
行業(yè)格局:從動作精準(zhǔn)到操作智能的范式跨越難題
技術(shù)突破的背后,是智能機器人行業(yè)對價值標(biāo)準(zhǔn)的重構(gòu)——從追求“動作精準(zhǔn)”轉(zhuǎn)向“操作智能”。
隨著AI技術(shù)的發(fā)展,對于具身智能機器人的研究正如火如荼地進行。具身智能的實現(xiàn)需依賴三層協(xié)同架構(gòu):“大腦”負責(zé)環(huán)境感知與策略決策,“小腦”主導(dǎo)實時解析指令并生成動作序列,“軀體”則通過多模態(tài)傳感器與驅(qū)動裝置實現(xiàn)環(huán)境交互。
具身智能的發(fā)展形態(tài)豐富多樣。例如,一個普通的掃地機器人在裝配智能系統(tǒng)后也可納入具身智能的范疇。隨著技術(shù)的發(fā)展,具身智能的研究和應(yīng)用范圍不斷擴大,從工業(yè)生產(chǎn)到家庭服務(wù),從醫(yī)療護理到教育娛樂,展現(xiàn)出了廣闊的應(yīng)用前景。
目前,人形機器人是具身智能的最佳載體,其擁有類似人的軀干,這種形態(tài)對人類來說具有親和力。對于人形機器人,不同企業(yè)的研究側(cè)重點也不同。在2025年春晚亮相的宇樹科技機器人是人形機器人的代表,宇樹機器人更加注重移動能力,可完成跑、跳、翻跟頭等動作,移動性能突出。
當(dāng)機器人搭載大模型就相當(dāng)于為人形機器人裝配了“大腦”,使其能夠通過語音識別與理解處理復(fù)雜環(huán)境中的任務(wù),并能夠通過感知環(huán)境的變化,實時調(diào)整自己的決策和動作。關(guān)于“大腦”,非夕已孵化專注于具身智能的子公司“穹徹智能”。在2024年WAIC世界人工智能大會期間,穹徹智能的具身大腦在完全開放的環(huán)境中完美展示了疊衣服、削黃瓜等動作。
胡曉平介紹,在具身智能發(fā)展過程中,主要難點在于數(shù)據(jù)和操作兩方面。相較于大語言模型,具身智能在算法與算力上已有相對成熟的解決方案,但數(shù)據(jù)問題仍是核心瓶頸。因為機器人操作數(shù)據(jù)的維度極為復(fù)雜,涉及空間、時間、多模態(tài)環(huán)境交互等,并且采集難度高、規(guī)模有限,遠不及大語言模型的成熟數(shù)據(jù)生態(tài)。具身智能需要的數(shù)據(jù)核心挑戰(zhàn)并非單純“量”的積累,而是“質(zhì)”的科學(xué)化構(gòu)建,需要規(guī)范多維度數(shù)據(jù)的有效性,比如動作軌跡、物理反饋、環(huán)境映射,只有擁有足夠多有效的數(shù)據(jù)才能支撐具身智能模型的迭代與應(yīng)用落地。
在操作方面,人類在操作中的“下意識行為”本質(zhì)是多模態(tài)感官信息的實時融合與反饋,即人類通過各種感官感受信息,大腦基于信息給予反饋。而機器人難以復(fù)現(xiàn)此類能力,根源在于物理交互信息的缺失。非夕的解決思路是通過高精度力控、觸覺反饋、視覺融合等技術(shù),將人類操作中的“手感”轉(zhuǎn)化為機器可量化的多維度數(shù)據(jù),從而讓機器人形成反饋。因此,補齊信息缺口是解鎖機器人復(fù)雜操作能力的必經(jīng)之路。
胡曉平認為,機器人必須提升操作能力才能發(fā)揮真正的價值,因為我們對機器人的最終目標(biāo)是要它們付諸實踐。基于此,非夕科技制定了“從手到人”的漸進式路線:首先攻克機械臂的仿人化操作,提升機器人“小腦”的實時控制能力,隨后拓展至“大腦”的決策智能,最終結(jié)合人形機器人的軀體,整合為完整的具身智能體。
03
DeepSeek熱潮:信心提振與技術(shù)啟示
具身智能的核心挑戰(zhàn)在于操作數(shù)據(jù)的構(gòu)建與物理交互的突破,而以DeepSeek為代表的大語言模型的優(yōu)化思路和開源生態(tài),為這場革命注入了更多可能性——不僅是技術(shù)突破,更是對創(chuàng)新生態(tài)的信心重塑。
DeepSeek的優(yōu)化思路對具身智能大模型的開發(fā)和建立具有極大的參考意義。胡曉平指出,雖然大語言模型的數(shù)據(jù)與機器人的操作數(shù)據(jù)差異較大,具身智能的發(fā)展難以復(fù)用大語言模型的數(shù)據(jù)集,無法直接解決機器人操作層面的核心問題,但DeepSeek可以優(yōu)化人機之間的語言交互體驗,使機器人快速理解人類的指令并做出反饋。
因此,在具身智能發(fā)展的前期階段,大語言模型接入機器人能夠顯著提升機器人交互、語言識別和語義理解能力。同時,在降低算力成本與加速迭代方面,具身智能發(fā)展模型的技術(shù)路線和算法框架與大語言模型是相近的,不論是推理能力的優(yōu)化還是降低成本,同樣會在機器人或具身智能的訓(xùn)練中體現(xiàn)。
胡曉平認為,DeepSeek的出現(xiàn)帶來的信心影響更加顯著。過去,非夕在與政府、投資機構(gòu)和社會人士交流時,雖然強調(diào)自身技術(shù)路線和產(chǎn)品能力處于行業(yè)領(lǐng)先地位,但常常得不到充分認可。而DeepSeek的出現(xiàn)也讓國人認識到,我們確實有團隊、產(chǎn)品和技術(shù)能夠比肩全球領(lǐng)先水平,這給了國人極大的信心。這種信心有助于整個社會體系對自主技術(shù)創(chuàng)新的認可,會吸引更多社會資源的投入,從而改善中國的創(chuàng)新土壤和氛圍,加速技術(shù)創(chuàng)新。
目前,對智能機器人和DeepSeek可能結(jié)合的應(yīng)用方式相關(guān)研究同樣非常火熱。胡曉平認為,對未來的發(fā)展方向和模式還是要保持開放的態(tài)度,希望能夠有人可以把大模型與機器人產(chǎn)業(yè)做出深度結(jié)合的探索,我們也需要有人能夠邁出這關(guān)鍵的一步。
據(jù)胡曉平介紹,非夕明確規(guī)劃了未來商業(yè)化與產(chǎn)品發(fā)展的雙重目標(biāo)。營收層面,非夕計劃2025年實現(xiàn)較2024年增長200%,并通過工業(yè)制造、農(nóng)業(yè)生產(chǎn)、醫(yī)療及服務(wù)等領(lǐng)域的標(biāo)桿場景擴大市場滲透。在產(chǎn)品落地的基礎(chǔ)上,研發(fā)主要聚焦兩大方向,分別是提升機器人“手”的操作能力與“大腦”的智能決策水平,加速迭代通用型智能體。
目前,非夕搭建了家庭場景的樣板間,驗證自適應(yīng)機器人在開放環(huán)境中對清潔、護理等復(fù)雜服務(wù)的可行性。胡曉平認為,未來具身智能機器人的核心突破應(yīng)集中于服務(wù)領(lǐng)域,非夕科技也將通過技術(shù)儲備與場景驗證,推動具身智能機器人從概念走向規(guī)模化應(yīng)用,建立行業(yè)領(lǐng)先優(yōu)勢。(本文內(nèi)容根據(jù)由中信書院舉辦的“具身智能+機器人 如何引爆下個AI風(fēng)口”直播活動整理)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.