WAVES新浪潮2025邀你一起走向中國(guó)創(chuàng)投的「新紀(jì)元」。
這是屬于中國(guó)創(chuàng)投的新紀(jì)元。當(dāng)下的中國(guó)創(chuàng)投市場(chǎng),既是周期筑底的轉(zhuǎn)折點(diǎn),也是結(jié)構(gòu)性轉(zhuǎn)型的深化期。在政策主導(dǎo)、國(guó)資與資本高度集中的新生態(tài)下,唯有順應(yīng)趨勢(shì)、靈活調(diào)整,方能在不確定性中捕捉確定性機(jī)遇。 6月11-12日,杭州良渚文化藝術(shù)中心,36氪WAVES新浪潮2025大會(huì)以「新紀(jì)元」為主題,匯聚創(chuàng)投領(lǐng)域頂級(jí)投資人、新銳企業(yè)創(chuàng)始人,以及深耕科技、創(chuàng)新、商業(yè)的科學(xué)家、創(chuàng)作者與學(xué)者,共同探討AI技術(shù)革新、全球化浪潮與價(jià)值重估等前沿議題,拆解他們眼中的商業(yè)理想和未來(lái)世界,一起討論、尋找、走向中國(guó)創(chuàng)投「新紀(jì)元」。
6月12日下午,在創(chuàng)業(yè)者會(huì)場(chǎng)有鹿機(jī)器人陳俊波進(jìn)行了一場(chǎng)獨(dú)立演講,主題為「具身智能是中國(guó)產(chǎn)業(yè)革命的機(jī)遇」。以下為演講全文:
大家中午好!很高興和大家做一個(gè)交流。剛剛和具身智能相關(guān)的主題也有一些,大家可能有有些自己的理解,我們覺(jué)得具身智能坦白講是可能比大家想象的更加重要。這個(gè)重要性體現(xiàn)在哪里呢?大家想一下過(guò)去30年,中國(guó)最核心的能力提升是在制造業(yè),我們的制造業(yè)已經(jīng)占到了全球的30%以上的體量,雖然我們的制造業(yè)很優(yōu)秀,但一直在價(jià)值鏈最低端。具身智能是我們?nèi)ヌ嵘麄€(gè)制造業(yè)如何在價(jià)值鏈上往上攀升的特別好的技術(shù),甚至把它叫做國(guó)運(yùn)級(jí)的技術(shù)也不為過(guò)。
具體是什么意思呢?大家看一個(gè)案例,最左邊的設(shè)備是中國(guó)的一家公司叫明諾,生產(chǎn)設(shè)計(jì)的一臺(tái)傳統(tǒng)有輪胎的清潔設(shè)備的機(jī)器,這臺(tái)機(jī)器售價(jià)不到4萬(wàn)人民幣,全球最大的一家公司(圖中中間的產(chǎn)品),這個(gè)產(chǎn)品在海外售價(jià)超過(guò)8萬(wàn)甚至10萬(wàn)人民幣。大家會(huì)覺(jué)得是不是德國(guó)的質(zhì)量比較好,所以賣的比較貴,其實(shí)不是,它們的品質(zhì)一模一樣,為什么?因?yàn)榈聡?guó)的產(chǎn)品就是中國(guó)代工的,所以人家就是印一個(gè)logo就拿走了所有的利潤(rùn)。
今天我們做的事情是通過(guò)有鹿通用的機(jī)器人大腦,把它適配到一個(gè)傳統(tǒng)的設(shè)備上,升級(jí)成一個(gè)智能的機(jī)器人。今天這款智能機(jī)器人在海外的售價(jià)超過(guò)4萬(wàn)美金,而且供不應(yīng)求,原因很簡(jiǎn)單。你在歐美任意請(qǐng)一個(gè)人,一年的年薪都超過(guò)5萬(wàn)美金,而我們這樣一臺(tái)機(jī)器人,它設(shè)計(jì)的使用壽命是6年,所以它是一個(gè)極其優(yōu)秀的ROI。
通過(guò)這樣一個(gè)簡(jiǎn)單的例子,我們能看到,我們通過(guò)具身智能的技術(shù),把中國(guó)非常優(yōu)秀但特別傳統(tǒng)、在價(jià)值鏈最低端的產(chǎn)品,它的價(jià)值提升了7倍,接近一個(gè)數(shù)量級(jí),我覺(jué)得這是具身智能對(duì)于中國(guó)來(lái)說(shuō)最大的意義。
顯然,我們這個(gè)通用的大腦不僅僅可以放到一個(gè)清潔的設(shè)備上,我們真正在做的是“一腦多型”,就是怎么能夠把我們具身智能的大腦適配到各種各樣不同的傳統(tǒng)設(shè)備上,把它升級(jí)為一個(gè)機(jī)器人,這是我們真正應(yīng)該做的事情。
下面,介紹一下我們的模型。我們的模型本質(zhì)上是一個(gè)左右腦融合的通用機(jī)器人模型。在這個(gè)部分,目前我們是放了一個(gè)開(kāi)源的通義千問(wèn),它顯然有非常好的語(yǔ)言交互能力、推理能力,但就像人的大腦一樣,我們的語(yǔ)言腦是左腦,但是我們?nèi)匀恍枰粋€(gè)右腦,上面右腦的部分是有鹿真正投入最核心的時(shí)間精力開(kāi)發(fā)的。右腦最核心做什么事情呢?是做兩件事情:一件事情是空間的智能,一件事情是決策的智能。什么叫空間的智能?所有的傳感器的數(shù)據(jù)做輸入,都可以恢復(fù)出一個(gè)三維世界,并且三維世界的編碼和我們的語(yǔ)言模型特征做融合。什么是決策智能呢?通過(guò)預(yù)測(cè)未來(lái)來(lái)決定機(jī)器人接下來(lái)的行為序列應(yīng)該是什么樣子。
這是一個(gè)更加直觀的介紹,未來(lái)任何一個(gè)具身智能的通用大模型都會(huì)包含這三部分,左腦就是剛剛說(shuō)的語(yǔ)言腦,邏輯推理的能力,右腦就是空間智能,決策智能,以及小腦。今年宇樹特別火熱,本質(zhì)上宇樹真正的核心技術(shù)在小腦的部分。
這是一個(gè)特別直觀的介紹,上面是我們傳感器的輸入,下面會(huì)直接進(jìn)行一個(gè)翻譯,把這個(gè)特質(zhì)在一個(gè)三維空間里做展示,其實(shí)是一個(gè)四維的時(shí)空里,所有的特征和語(yǔ)言對(duì)齊,這有一個(gè)好處,它就能做各種各樣更復(fù)雜的交互任務(wù)。比如說(shuō),其中一個(gè)任務(wù),這是一個(gè)叫做VQA的任務(wù),當(dāng)有傳感器序列的輸入以后,人類就可以用語(yǔ)言的方式與模型交互。比如說(shuō),我們問(wèn)它的是,你直接介紹你看到的世界,下面所有的文本就是我們模型的輸出,它會(huì)詳細(xì)的介紹這是一個(gè)在車道線的環(huán)境,它的限速是什么樣,接下來(lái)是伸向的行為。
大家可能會(huì)問(wèn),我們能做VQA有什么用?本質(zhì)上這個(gè)問(wèn)題就好像我們問(wèn)DeepSeek和之前的大語(yǔ)言模型有什么不一樣,最核心的一點(diǎn)是DeepSeek有推理能力,而今天很多的情況下,僅僅靠上一代的小模型的模式識(shí)別的技術(shù)已經(jīng)不夠我們用了,我們必須讓我們的模型有推理的能力,才能真正完成具身智能的能力,而推理這件事情只有靠語(yǔ)言才能完成。即便是人類的大腦,我們不用語(yǔ)言也是不能做推理的。
我們通過(guò)這樣一個(gè)全新的技術(shù),有鹿成立大概兩年左右的時(shí)間,我們已經(jīng)獲得了10項(xiàng)全球的算法冠軍,而且和我們一起參加這些比賽的都是英偉達(dá)、Facebook、谷歌等全球AI巨頭。同時(shí),我們也獲得了很多的行業(yè)大獎(jiǎng)。
我們有兩類產(chǎn)品,一類是剛剛提到的大腦的模式,有點(diǎn)像機(jī)器人行業(yè)的Tier1的供應(yīng)商,而我們的目標(biāo)客戶就是現(xiàn)在在中國(guó)已經(jīng)非常成熟,占據(jù)了龐大市場(chǎng)的傳統(tǒng)的設(shè)備供應(yīng)商。我們的使命就是通過(guò)這樣一款具身智能的大腦,幫傳統(tǒng)的制造業(yè)去做智能化的升級(jí)。第二個(gè),有鹿也會(huì)圍繞一個(gè)場(chǎng)景去實(shí)現(xiàn)自己的或者提供自己完整的機(jī)器人產(chǎn)品的矩陣。這個(gè)場(chǎng)景是我們覺(jué)得世界上最大的市場(chǎng),就是家庭市場(chǎng)或者家庭周邊的市場(chǎng),圍繞這個(gè)場(chǎng)景,我們會(huì)去提供如清潔、物流、服務(wù)等各種各樣不同的機(jī)器人。
簡(jiǎn)單介紹一下進(jìn)展,這款清潔的機(jī)器人是我們2024年9月份發(fā)布,到現(xiàn)在大概9個(gè)月的時(shí)間,我們已經(jīng)簽署了超過(guò)4億人民幣的訂單,已經(jīng)成為這個(gè)行業(yè)的銷售冠軍。
中間是我們?cè)跇訖C(jī)階段的產(chǎn)品,這款產(chǎn)品最核心的想法是去實(shí)現(xiàn)一個(gè)外賣員能夠?qū)崿F(xiàn)的所有工作,端到端,包括跑到商家端、shoppingmall取外賣包裹,包括按電梯,能夠自動(dòng)上下樓,開(kāi)門,在開(kāi)放道路上跑三五公里,進(jìn)到小區(qū)、單元樓,并且把包裹放到家門口,這是它要完成的任務(wù)。當(dāng)然,它使用的場(chǎng)景非常廣泛,不僅像美團(tuán)、餓了么,盒馬、山姆、KFC等各種各樣的場(chǎng)景都需要。
人形機(jī)器人,我們也在投入,但是我們投入的方式和大部分人形機(jī)器人不太一樣,比如說(shuō)剛剛過(guò)去的亦莊人形機(jī)器人馬拉松,平均一個(gè)人形機(jī)器人后面跟了三個(gè)人,一個(gè)人拿遙控器,一個(gè)人防止它摔倒,另外一個(gè)人拿水澆它,防止它過(guò)熱。現(xiàn)在絕大部分做人形機(jī)器人的公司本質(zhì)上是在做小腦、運(yùn)控,我們的想法很簡(jiǎn)單,我們覺(jué)得一個(gè)人形機(jī)器人所看到的世界、要解決的智能性任務(wù),和一個(gè)輪式的機(jī)器人沒(méi)有太大的區(qū)別,所以我們希望用一個(gè)通用的大腦去服務(wù)好所有的機(jī)器人產(chǎn)品。這里面最核心的點(diǎn)是什么?就是這張圖,無(wú)論是右邊輪式機(jī)器人用到的模型,還是左邊人形機(jī)器人用到的模型,它的底層模型是同一個(gè)模型,輪式或輪+臂的機(jī)器人今天已經(jīng)開(kāi)始大規(guī)模出貨。不管是大語(yǔ)言模型,還是具身智能領(lǐng)域,有一個(gè)叫scaling law特別重要,我們搜集了足夠廣泛的數(shù)據(jù),才有可能讓我們的模型往前走一小步。我們最核心的想法是,今天既然我們輪式、輪+臂的機(jī)器人已經(jīng)大規(guī)模推向市場(chǎng),如果我們是用同一個(gè)底層模型去學(xué)習(xí)的時(shí)候,它不僅僅可以讓我們的輪式、輪+臂機(jī)器人變得越來(lái)越智能,也能夠讓我們的人形機(jī)器人變得越來(lái)越智能,所以這是我們最核心的觀點(diǎn)。我們最核心的想法是通過(guò)我們的大腦,可以讓各種各樣的設(shè)備都變得越來(lái)越智能。
這句話是孫正義講的,但是我們特別贊成,“未來(lái)機(jī)器人物種的數(shù)量會(huì)超過(guò)生物物種的數(shù)量”。為什么?因?yàn)槿祟愊M麢C(jī)器人在不同的場(chǎng)景去完成不同的任務(wù),而在那個(gè)場(chǎng)景、那個(gè)任務(wù)的前提條件下,它的本體收斂到最優(yōu)的形態(tài),一定長(zhǎng)的不一樣,但是我們覺(jué)得所有這些機(jī)器人都應(yīng)該擁有一個(gè)同樣高度智慧的通用大腦。
謝謝大家!以上是我今天的分享。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.