智元機器人創始人 彭志輝
作者 | 賀乾明
編輯 | 程曼祺
來源 | 晚點LatePost
我們下午 3 點見到彭志輝時,他還沒吃當天的第一頓飯。一日一餐是彭志輝的常年狀態,他覺得自己 “習慣了,不影響活著,吃飯比較浪費時間”。
2023 年 2 月,彭志輝參與創辦智元機器人,任 CTO,致力于做出商業化的人形機器人。在這之前,他更為人熟知的身份是 “天才少年” 和 B 站 “百大 UP 主”。
彭志輝 2017 年開始以 “稚暉君” 為網名發布各種硬核 DIY 視頻,現在他的 B 站賬號有 250 多萬粉絲,同體量的 UP 主通常是團隊運作,而他是一個人兼職做。不少人覺得 “全棧工程師” 難以概括他的能力,稱他為 “溢棧工程師”。
智元機器人成立后,彭志輝把一切重心放到了公司,他基本沒休過周末。B 站最后一次發布自制視頻是 2023 年 4 月。
極致地投入,是因為他想成就更大的事業。“我們的愿景是用智能機器創造無限的生產力?!?彭志輝說。
也因為人形機器人行業許多基礎問題尚未解決,就要面臨激烈競爭。去年至今,中國已出現不下 20 家人形機器人公司。想把機器人送進工廠的智元機器人,還要與 2016 年前后成立的上一波 “AI+ 機器人” 公司競爭,它們服務客戶更久、經驗更多;再往后,更大的威脅是對具身智能蠢蠢欲動的車企,它們能調動的資源遠超一般創業公司,而且有自己的工廠,這是現成的場景。
智元機器人認為,獲勝概率最高的方法是 “高舉高打”,用一種運營大公司、操大盤的方式創業。
多數同行專心研究一款產品時,智元機器人用一年半做出兩代人形機器人,并在今年 8 月一次發布了 5 款人形機器人,還給同行提供數據采集方案。今年初,智元機器人還發布過一款商用清潔機器人。
智元機器人 8 月 18 日發布的 5 款產品。
大部分人形機器人公司會先側重某個技術方向,有的主攻硬件,有的主攻軟件智能系統。形態上,有的重點放在上半身的操作能力,有的優先做下半身的運動能力。
智元機器人則 “全都要”:他們做完整的人形機器人,也根據不同場景開發分支形態;他們自研關節電機等核心零部件,也研發 “靈巧手”,還自己開發多模態大模型,同時研究強化學習、模仿學習、視覺模型等當前具身智能的主流技術。
今年 2 月,多數新公司仍在代工組裝機器人時,成立剛一年的智元機器人就開始建設上海臨港首期工廠,計劃年底投產。
“看不太懂”“不是常規的創業公司”,數位科技投資人如此評價,他們很少看到初創企業同時做這么多產品,下注這么多技術方向,如果管理和后續資金跟不上,很容易出問題。
彭志輝說,他們不是有意要如此,而是行業特點使他們必須這么做:“人形機器人的研發涉及硬件、軟件、算法、供應制造等一大堆問題,系統工程極其重要。在技術實現上,有的是工程問題,有的還是科學問題。這個行業空間大、門檻高、變化快,人才、資金和商業成果最后都會向頭部集中,如果只是小打小鬧,很難保持領先?!?/p>
最多資本投票向智元機器人。成立一年半,這家公司已至少融資 15 億元人民幣,估值達 70 億元人民幣,投資方有高瓴、紅杉、高榕、藍馳、比亞迪、上汽、三花智控、臨港新片區等 20 多家機構。智元還在今年初的股東會上給部分投資機構頒了獎。
紀錄片導演竹內亮曾在拍攝彭志輝時,驚訝他精通如此多的跨領域技能,問:“有沒有你不會的東西?” 彭志輝說:“不會生孩子”。這次我們又問了這個問題,他說:“不會停止學習”。
彭志輝擺在工位上的書,大都是《托馬斯微積分》《編譯原理》等教材,唯一的例外是《埃隆·馬斯克傳》。馬斯克是他的學習對象之一。
“在學校里學習更多是自底向上,先打好基礎然后做上層應用,出了校園之后更多是自頂向下,以項目導向,缺啥學啥?!?彭志輝說。聊到時間管理方法,他說是 “操作系統中的搶占式調度”,動態調整任務優先級,允許打斷,但是任何時間都專注于當前的任務。
他不喜歡 “天才少年” 的稱呼,他覺得教科書中那些能改變人類發展進程的科學家才是天才。
相比過去用幾個月就能獨自完成的小型項目,參與創辦一家公司開發成功的產品要難得多。他要從單兵作戰走向帶團隊協作,做出來的東西不能只是酷,還要能賺錢。這是一場新的、更復雜的學習。
以下是《晚點》與彭志輝的對話:
一
耐心地沖刺,留在牌桌上
《晚點》:回到起點,為什么 2023 年決定創業?
彭志輝:人形機器人本身不是新事物。我做人形(機器人)比較早,16 年還在學校時就創業做了原型機,那時 “具身智能” 還沒出現,主要做本體(機器人硬件部分),還拿過 500 萬投資。
這兩年具身智能跟人形機器人這么火,并不是本體有了什么黑科技,最主要的還是 AI、大模型的出現讓機器人可能在本體之外有更多應用價值。我在華為昇騰就做 AI 計算,這個趨勢看得比較清楚。這是我出來創業的一個原因。
《晚點》:如果你想在華為做,應該也會得到支持。為什么選擇創業?
彭志輝:風格問題。華為在技術方面主要是搞基建,比如操作系統、芯片、數據庫等非常底層的根技術。
而機器人是一個非常新的賽道,特別是 AI 機器人,更適合一些迭代比較快的團隊。創業不僅要有一個好點子或好技術,更重要的是在正確的時間點做正確的事。
《晚點》:現在創業做人形機器人是正確的時間嗎?它需要的硬件、材料、能源等技術還不成熟,有些還在科學探索階段。一位資深科技投資人就說,他對 5-10 年后才會發生的事沒興趣。
彭志輝:我們也沒想過短期就做成這件事。我們要求大家 “耐心地沖刺”,一方面迭代和創新速度要非常快,一方面要有耐心。
短期市場上會有各種正、負反饋,但對一家初創公司,最重要的是留在牌桌上。
《晚點》:留在牌桌很重要的一點是錢夠多。智元的融資速度和規模都領先同行。怎么做到的?
彭志輝:我覺得可以換位從投資人的角度看,他們為什么會選我們?
首先我們有非常硬核的創始團隊背景;又有全棧技術布局:不只做本體,也不只做具身 AI,我們是本體、具身、數據都有布局,能力相對友商可能更全面;其次我們對整個賽道的理解也非常務實,一直在積累量產的系統能力,團隊的執行力超強。
去年發布會(2023 年 8 月)時,我們整個人形研發團隊才不到 50 人,一年后的現在已經超過 300 人了。規模敢增長這么快,前提是我們想清楚了要做什么事情、各個階段的技術實現路徑,以及商業化的邏輯,這點也是投資人比較看重的。
《晚點》:智元長期想成為一家什么樣的公司?有什么對標對象?
彭志輝:比如貝爾,貝爾發明電話,改變了大家信息溝通的方式。人形機器人未來可能也會改變社會生產力。我們的公司愿景就是 “用智能機器去創造無限的生產力”。
二
智能最終決定機器人能做什么
《晚點》:創業一年多,人形機器人哪些方面比你預想的更難?
彭志輝:從 0 做到 40、50 分,甚至 60 分都不算太難,但再往上就非常難。
本體成熟度還不夠。比如大部分人都在卷兩條腿走路,而雙臂的靈活度,靈巧手這些都還處于初級狀態。然后是智能?,F在大家都往模仿學習方向嘗試,但它真的能在復雜開放環境中達到很好的效果嗎?還有觸覺,聲音跟視覺結合起來的多模態融合感知、操作等,做得也不是非常好。這里面有一部分是工程問題,還有一部分還處在科學問題階段,業內還沒有看到非常成熟的解決方案。
我們一邊落地一邊做預研,整個節奏要把握得比較穩,才能體現我們的競爭優勢。全棧也是我們的一個優勢,所以未來可能會走得更遠一些。
智元機器人研發的靈巧手,與人手還有差距。人手有 27 個自由度、行動靈活,遍布高敏感的觸覺神經,力控能力強大。要做好靈巧手,靈活、耐用、穩定且成本可控的硬件部件和材料只是基礎,人手還具備手、腦協同能力,比如人能接住移動的物體,是因為人腦對重力、加速度等物理規律有認知,因而能預判軌跡,身體又有運動能力,才能完成這個看似簡單的動作。
《晚點》:我們了解到,智元在機器人的智能上投入的人手更多。你們認為智能比本體更重要?
彭志輝:本體肯定是基礎,但我們一直覺得,(人形機器人)最核心的其實不是本體,而是它基于本體,能完成什么實際任務,產生什么有價值的應用。
所以本體的價值一定是通過具身來體現,你可以看到我們起名智元的初心:“智” 就是具身智能,“元” 就是人形機器人本體的兩條腿(象形)。
《晚點》:一個人形機器人能站起來到能走,再到能上臺階,是智能問題嗎?
彭志輝:它其實更多的是智能問題,而不只是硬件問題。高階的運動能力主要靠大腦體現,在很多運動項目中,正常人跟運動員的身體沒有本質區別,運動員更多是長期訓練中讓大小腦協同,對環境的感知、反饋達到了更好的狀態。
《晚點》:在獲取訓練數據的方法上,行業里也有分歧。比如有公司認為,遙控操作機器人采集數據算不過來賬,應該用大量仿真數據。智元為什么造上百臺機器人專門采集數據?
彭志輝:數據來源就那幾類:互聯網數據、仿真數據、真實采集的數據。如果只靠仿真和生成數據,會有可能出現用 ChatGPT 訓練大模型的情況,出現幻覺、Sim2Real Gap 等問題。所以真機數據必不可少,價值也最大,但它的量不會有仿真數據那么大,可能占 10%。
還要考慮采集成本,有些公司硬件能力沒么強。我們本體做得足夠好,所以才有條件在今年下半年有幾百臺機器人能采集數據。我們會找到一些場景,讓人遙控操作不能自主執行任務的機器人。讓客戶為這一部分的功能買單,降低硬件成本。
《晚點》:在你的設想里,通用人形機器人最終會是什么樣的?
彭志輝:就科幻電影里的那種。比如 I,Robot??苹秒娪袄吡舜蠹业念A期,但我們希望最終能做出來。
《晚點》:那是一種超人的狀態,而不是像人。
彭志輝:可能很難有中間態。一旦人形機器人達到正常人類的水平,那它很快就會遠遠超過人類。
《晚點》:那個未來距離現在還有多遠?
彭志輝:我比較樂觀,未來 10 年是有希望的。
三
人形機器人最早落地的場景是“PPT”
《晚點》:你們說今年是智元商業化元年。其實不少人覺得,人形機器人還處于早期階段,剛學會走路,沒必要這么快去上班。
彭志輝:我們是一家商業公司,商業化是檢驗成果最有效的方式,把產品賣出去,客戶給了積極反饋,才能吸引到更多人才。一個落地遙遙無期、不太有希望的團隊,大家也不會加入。
《晚點》:你們說人形機器人商業化路徑是先工廠、后家庭,現在處于工廠階段,他們能做什么場景?
彭志輝:目前最快落地的就是 “PPT”,Pick(抓?。lace(放置)和 Transfer(轉運)。
靈巧手更成熟后,還可以做各種裝配工作,因為靈巧手有觸覺、力覺等各種復雜感知能力。這個場景的量會更大,我們評估了一下,PPT 可能就只占整個制造行業場景的 20% 不到。
《晚點》:你們說今年就會賣出 300 臺機器人。200 臺有腿,100 臺靠輪子移動。更具體來說,他們會做什么工作?
彭志輝:賣的主要是遠征系列,靈犀系列不賣,都開源。
遠征系列里,雙足(人形機器人)的可靠性和自由度還要進一步迭代,現在更適合做一些體現人機交互能力的場景,主要是服務業。比如我們發布會上展示的汽車門店里的迎賓導覽。輪式的就是 A2-W,在工廠里做 “PPT” 那些工作。
智元的人形機器人遠征 A2 在汽車門店當導購。
《晚點》:行業里也有一些機器人公司,比如梅卡曼德、思靈等,給機械臂增加視覺、力控能力,用上大模型,在工廠里也能做 PPT,而且他們已在穩定性和成本上打磨了更久。你們新方案的優勢是什么?
彭志輝:它們的確是機械臂廠商中最貼近具身智能的公司。我們從單臂演化到了雙臂,然后還帶一個移動底盤,一些高層的雙臂規劃上,我們會有一些技術差異化。
比如典型的轉運場景中,用單臂搬一個托盤很難實現,雙臂做這個任務就更合理。從單臂到雙臂,聽起來很簡單,其實會涉及復雜的力控和雙臂配合、環境感知、動態避障、軌跡規劃等。更關鍵的是,以上這些能力我們要做成可以泛化的標準技能,降低機器人的部署成本。
智元機器人 A2-W 在工廠中搬托盤。
《晚點》:智元賣出去的 A2-W,已經能解決這些問題了?
彭志輝:能解決一部分,重點是找到客戶需求和我們已有技術的匹配點。我們的投資人也比較給力,確實提供了一些很有價值、能在短期落地的場景。
《晚點》:剛才你也提到,你們非常在意成本。去年你說人形機器人要降到 20 萬以內。這個數字是怎么算出來的?
彭志輝:要看客戶的期待是什么。一個工人的成本一年大概是 10 萬,機器人可以兩班倒。20 萬客戶差不多一年或一年半就能回本。我們也拆解了零部件成本,只要量足夠大,的確可以達到這個水平。
《晚點》:智元的產品距離 20 萬還有多遠?
彭志輝:不遠了。我們批量發貨的目標成本就是這個,要不然可能就是虧本了。
《晚點》:你們的競爭對手會是誰?
彭志輝:這個賽道足夠大,大家都還在做大蛋糕的階段,現在還沒有什么直接競爭對手。
有一些潛在的競爭對手還沒下場。比如新能源車廠,它們有動力做這件事,如果人形機器人在產線上體現出價值,它們肯定會投資源做。它們也有能力做這件事,你看機器人本體上用到的各種核心零部件,電機、電控、電池等技術,就是新能源汽車擅長的那一套。
《晚點》:你預想的人形機器人很硬核,但現在商業化的產品看上去似乎很無聊。你會感到矛盾嗎?
彭志輝:不沖突。我們是并行研發,都在做。我們有幾條線,一個是產品化、量產的線,一個是探索預研的線。我們經常在內部說,要吃著碗里的,看著鍋里的,還得想著田里的。
四
像運營大公司那樣去創業
《晚點》:你們 8 月一次發了 5 個人形機器人產品,還賣關節電機、夾具、提供數據采集方案。今年還發布了商業清潔機器人。你們的產品線是不是鋪得太開了?
彭志輝:這其實是一個主線落地加很多支線探索,我們覺得還是有必要做這些布局的。我們叫飽和式投入。一方面我們有這個條件,同時整個賽道也還不太明確。
當然我們也會控制支線的資源投入。比如我們這次發布了 X-Lab 實驗室做的兩款產品,全職參與的人其實不到 5 個,從全新的關節到結構軟硬件算法都是這幾個人做的,在 X-Lab 我比較追求人效。
商業清潔機器人則是一個相對成熟的產品,能為我們人形的量產提供前置幫助,比如渠道、制造、售后等。它又能復用人形的一些能力,比如給清潔機器人加機械臂,讓它做更多事。
《晚點》:技術布局上,不少人形機器人公司都不做全棧,比如硬件本體上,一些公司不研究靈巧手,就用夾具;還有一些公司認為腿沒必要,只做上半身。具身智能系統上,很多公司也會在強化學習、模仿學習中有側重。
彭志輝:你得看各家公司擅長什么或想做什么。我們想用智能機器去創造無限的生產力,就不得不關注全棧。這是從最終產品的競爭力出發的布局。
《晚點》:你們的計劃的開發節奏也很快:半年一代樣機,一年銷售一代產品。
彭志輝:所有的創新都要可持續,要考慮長期競爭力,并提前布局。創新的速度和創新一樣重要。
《晚點》:但人形機器人能做成什么樣都不明確。智元怎么確定每一代產品的迭代方向?
彭志輝:就是剛才講的,把事情想清楚,具體要做哪些場景,怎么做?需要什么核心零部件和核心技術?
我們調研了很多客戶的需求,制造業的、服務業的。我們的股東也提供了很多輸入。從不同場景出發,我們提煉出技術路徑,發現有的更偏傳統自動化,有的更偏未來 AGI ,還存在一些中間狀態。這就是我們在發布會上的 G1-G5 智能演進路線。
智元目前商業化的產品處于 G2 階段,正在研發 G3 階段的系統。
《晚點》:同時做這么多東西,又想做得快,這真的可能嗎?
彭志輝:其實我們成立半年就做出了第一代人形機器人。首先是靠人才,大家的戰斗力都很強。然后也有一些我的個人經驗積累,還有整個行業的發展,AI 技術大規模應用。
與前幾年相比,現在做這個事情的難度會降低一些。機器人的技術棧和新能源汽車很像,新能源汽車行業帶動了上游制造業。在國內做通用機器人會有一些額外優勢。
智元第一代人形機器人遠征 A1。彭志輝說,考慮到站在操作臺前工作的場景,下半身采用關節往后彎的 “鴕鳥腿”。
《晚點》:團隊戰斗力很強,怎么衡量?
彭志輝:就是工作效率,創新能力,還有投入程度。
《晚點》:很多公司的投入程度也高,也卷。這一點上你們怎么能比對手更強?
彭志輝:首先我們招人時,會盡量篩選志同道合的人。比如價值觀要跟公司匹配。我會問他的興趣點是么?比如 “如果你財務自由了,會不會繼續做現在崗位上做的事情?” 實際上我們公司的 Up 主濃度挺高的,他們都是因為熱愛主動投入的年輕人。
然后給足夠的信任,配足該配的資源;過程中鼓勵充分發揮主觀能動性,但是在驗收結果時,標準要提高;結果好的時候,給足夠多的激勵。
我們激勵方式比較多,年終獎之外也會給股權。我們未來的目標是跟華為一樣,優秀的同事都配股。
《晚點》:最近的發布會上你也提到,機器人是一個非常復雜的軟硬件協同系統。你們需要同時做好很多事,怎么讓各團隊高效協同?
彭志輝:系統架構設計,是我們非??粗氐哪芰?。我們認為,人員的規模增長一定要有對應的組織能力,否則可能就是災難。我們的組織架構非常扁平,層級很少,一線研發上面是各個技術模塊的研發經理,再上面就直接是我負責了。大家可以充分溝通交流,我們非常鼓勵及時反饋,暴露問題。
除了常規項目開發流程外,我們還會以項目攻關組的形式推進一些關鍵技術的突破。像核心零部件,我們會成立虛擬組織,成員承擔的職責更多,要求更高,但是做成之后的激勵也會更大。
《晚點》:智元除了自己招人開發,還跟北大合作建實驗室,甚至你們還收購了一個電機公司,早期公司很少這么做。
彭志輝:我們其實都是嘗試。比如說收購的電機團隊,其實只有兩個人,又比較出色,也給一些大品牌做過代工,反饋也不錯,我們就把他們吸納進來了。
《晚點》:多產品線、全棧技術布局、整合產業鏈,包括你們矩陣型的組織架構,感覺你們在用大公司的運作方式創業?
彭志輝:可以這么理解。但我們并不是為了表現得像大公司,而是因為當前的市場環境下,這種方式是最有效的。這是一個相對新興但迅速發展的領域,我們需要快速占領市場,展示我們的技術實力和產品愿景。
大行業、大賽道最終都會收斂到頭部企業,如果只是小打小鬧,很難在快速變化的市場中保持領先地位。
五
我不是天才
《晚點》:有人說你是 “全棧溢出工程師”,可以焊電路板,造機器人,還能寫代碼,訓練 AI 模型等。另外你也會彈吉他、剪視頻等。你有什么特別的學習方法嗎?
彭志輝:可能跟 AI 學習的方式有點像,早期靠一些過擬合,再用更多鍛煉,增加泛化性。多參考別人已有的經驗,先不要問為什么,哪怕死記硬背,先記下來,慢慢就會理解背后的原理,然后再積極創新??珙I域掌握多個技能后,就會發現它們之間有相關性,一個領域的事情可能會幫你解釋另一個領域。
還有時間管理要做得非常好。大家都說我是時間管理大師什么的。我喜歡用靠類似操作系統里面的概念,叫搶占式調度,對要做的事情做動態優先級分配,不是做完一件事再做另外一件事,如果有更重要的事出現了,就去做它,做完再切回到之前做的那個事。每次只做一件事,分時保持專注,可能時間利用效率會比較高。
《晚點》:你的方法比較系統。之前我問宇樹科技王興興類似的問題,他說 “24 小時不睡覺,我不信解決不了”。
彭志輝:我很多靈感也是睡覺前想起來的。日有所思,夜有所想。我也在夢里想到過一些問題的解決方案,挺神奇的。不過有些事情可能很難,像數學,不會就是不會。
《晚點》:你剛才提到時間管理,哪怕是天才,一天也就 24 個小時。你現在投入這么多精力創業,在其他方面犧牲會很多?
彭志輝:對,現在基本上很少有周末。從去年創業到現在還沒有請過假。我個人還有些小習慣,我不太睡午覺,一天只吃一頓晚飯。
《晚點》:為什么一天只吃一頓飯?能維持狀態嗎?
彭志輝:有的時候確實忙,不太有時間,我覺得吃飯比較費時間。餓了也可以吃點零食嘛,身體也沒有什么負面反饋,我覺得只要達到平衡就不算太壞的習慣。
《晚點》:創業一年多,給你印象最深的事是什么?
彭志輝:太多了。比如去年 8 月開第一次發布會時,各種意義上都非常極限。發布會前兩個多禮拜,我們研發的同學們基本就在會場打地鋪睡覺。
發布會我們選了最有挑戰的直播形式,當我已經上臺講了 20 分鐘后,才看到臺下小伙伴比的 OK 手勢,我們終于解決完了最后一些 bug。
《晚點》:為什么不能往后拖?
彭志輝:已經拖過了,這是延過兩次之后的時間。還是得逼自己一把。
《晚點》:你之前都是一個人做項目,現在你要帶一個團隊。你怎么學習管理?
彭志輝:一方面跟有經驗的前輩學習。另外就是在實戰中學,同時也有一些配合我做管理工作的伙伴幫忙。
《晚點》:那你還看書嗎?都看些什么書?
彭志輝:都在我辦公桌上,各種論文和書。長篇小說好像只看過《三體》,我喜歡硬科幻,是 big 劉的忠實粉絲,《三體》看了 10 多遍。
《晚點》:見到劉慈欣,你會跟他說什么?
彭志輝:給我簽個名。
《晚點》:現在應該有很多找你要簽名。遇到這種情況時,你在想啥?
彭志輝:早知道就好好練練字了。
《晚點》:你身上有很多標簽,比如 B 站知名 UP 主、天才少年、明星公司聯合創始人、野生鋼鐵俠、全棧溢出工程師。你更喜歡哪個標簽?
彭志輝:個人來說可能是工程師吧。我覺得搞技術還是很有意思的。假如我未來財務自由了,我不一定會去做視頻,但肯定會繼續做技術方面的事情。
《晚點》:你怎么看 “天才少年” 這個稱號?
彭志輝:我覺得我不是天才啊。大家也沒有必要這么稱呼。我只是興趣使然,愿意動手嘗試做一些東西出來,恰好遇上一個比較好的時代,和各種平臺、機遇,做出了一點成果,更多的是努力和幸運吧。
《晚點》:你覺得什么樣的人才能稱得上天才?
彭志輝:他們的存在對整個世界的發展軌跡能有很大影響,比如大家在課本上看到的科學家們。
《晚點》:造出了真正的人形機器人,才算天才?
彭志輝:我會把這個稱號讓給我們造出的機器人。
(全文完)
【邱處機簡介】
福建龍巖人,今年31歲,現在常駐北京。公眾號專注于撰寫商業牛人的成長經歷和認知升級,讓我們一起向他們學習,不斷成長,不斷進化。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.