幫特斯拉砍掉激光雷達的人,在美國造低價機器人。
文丨賀乾明
編輯丨程曼祺
2023 年 8 月,宇樹科技發布人形機器人 H1。時任 OpenAI 研究科學家、特斯拉前 AI 總監安德烈·卡帕蒂(Andrej Karpathy)對 9 萬美元的售價和機器人性能感到驚訝,在社交媒體上說想買一兩個,或者一些。
而曾在特斯拉幫助砍掉激光雷達的本·博特(Ben Bolte)覺得,在美國能做出更便宜的人形機器人。他說宇樹科走通了低價人形機器人這條路,給了他很大啟發。
他來中國拜訪過宇樹創始人王興興,他主要講英文,王興興說中文。“王興興很厲害,只說中文也沒關系。” 博特說。
今年 5 月 19 日,博特創辦的人形機器人公司 K-Scale Lab 開源人形機器人軟件套件,并開啟人形機器人預售:1.5 米高,成本 9000 美元(約 6.5 萬元人民幣),售價 16000 美元(約 11.5 萬元人民幣)——這考慮了關稅的影響。
K-Scale 的人形機器人 K-Bot。圖片來自 K-Scale。
“其實 9000 美元還有得賺。”K-Scale 聯合創始人、COO 徐睿說。徐睿曾在小米、字節、騰訊從事硬件產品工作,2024 年 10 月加入 K-Scale,負責技術、工程之外的所有工作。
產品發布之前,OpenAI、Google、英偉達等公司的工程師們經常去找他們交流,甚至幫忙寫代碼。K-Scale 也得到硅谷知名投資人奈特·弗里德曼(Nat Friedman)和 YC 、Fellows Fund 等風投的支持。
“只看價格,這是卷死大家的水平。” 一位機器人領域分析師說,她很難想象一家美國公司也能造出來如此便宜的人形機器人。國內類似的產品售價大概在 20 萬~30 萬元人民幣,宇樹最便宜的 G1 起售價也得 9.9 萬,比它矮 20 公分。
9000 美元是 K-Scale 高度簡化設計的結果,這款人形機器人沒有 x86 CPU,只搭載英偉達的芯片,也沒有昂貴的六維力傳感器、激光雷達等等。他們依賴中國大陸和臺灣地區的供應鏈,機器人中的大多數零部件都是原本用于手機、IoT 設備上的量產器件。
“如果只是用 AI 技術讓機器人學會執行任務,這樣就夠用了,跟其他更貴的硬件沒太大區別。” 徐睿說,他們剛開始預售時,頁面只有兩張圖片,甚至沒有介紹機器人參數、規格,就賣出不少。
他們希望用軟件彌補硬件上的不足。博特說,這是他在特斯拉工作時的常態,馬斯克要求特斯拉不能用激光雷達,只用攝像頭實現自動駕駛系統,他是關鍵執行者。后來他去 Meta 研究具身智能。
與許多把目標瞄準工廠、家庭的人形機器人創業者不同,博特認為,當前人形機器人的銷量主要在消費級市場,早期的殺手級應用是 “語音” 和 “視覺”;用戶更關注 “人形”、而不是 “機器人”。
“關鍵在于你怎么看待人形機器人,是工廠流水線里的機器?還是家里類似電冰箱的設備?或者是電腦、手機之后的計算平臺?” 博特說,K-Scale 相信人形機器人是計算平臺,未來硬件設計趨同,差異會在軟件系統、生態建設方面。他認為,宇樹錯過了在美國建立社區生態的機會。
他很欣賞智元聯合創始人稚暉君的全棧能力,“一些公司模型比我們好,一些公司的硬件比我們好,還有一些公司的軟件比我們好,我們把這些視為一個系統,把它做到最好。”
K-Scale 崇尚硅谷傳統的車庫創業、極客精神,把公司地點定在硅谷斯坦福大學后門處的一棟房子里,團隊一起生活、辦公,舉辦黑客松,希望挑戰特斯拉這樣的巨頭。
一位接觸過 K-Scale 的創業者說,K-Scale 的辦公區域掛有中國公司團隊的照片,提醒自己團隊 “中國硬件工程師迭代多快”。
K-Scale 認為徹底開源是提升人形機器人能力的方法,也可以讓他們在人手、資金有限的局面下做出盡可能好的產品。
“經常有一些大公司的程序員周末跑來幫我們寫代碼,大家一起吃兩天披薩。” 徐睿說,還有國內大廠的工程師會貢獻想法。他希望更多中國的工程師、供應商能加入 K-Scale 的社區,一起建設生態。
過去兩年,中國、美國的人形機器人行業都已經習慣了創業者起步就籌集大量資金、招攬盡可能多的人才,認為只有這樣才能做好人形機器人。當前 K-Scale 只有 9 名全職員工,天使輪融資 400 萬美元,與中國大多數人形機器人公司相比都算是匱乏。但他們認為已經夠用幾年了。
5 月底,K-Scale 創始人本·博特和聯合創始人徐睿接受我們訪談 ,分享了他們對人形機器人不一樣的思考。
K-Scale 創始人本·博特和聯合創始人徐睿。圖片來自 K-Scale。
硬件高度簡化,把人形機器人壓到 9000 美元
晚點:你們在美國做 1.5 米高的人形機器人只要 9000 美元(約合 6.5 萬人民幣),比國內大多數人形機器人都低。怎么做到的?
徐睿:我們面向 AI 開發產品。有了 AI,不需要昂貴的定制機器人組件,手機或者 IoT 設備上的量產貨就可以達到以前傳統控制的效果。
最近 Ben 跟美國的人形機器人公司工程師交流,聊到其中的一個零部件陀螺儀(IMU),對方說他們的陀螺儀就要 2000 美元,非常精準。然后我們發現,手機上 1 美元的 IMU 就能達到很好的效果。
我們現在用的是中國大陸和臺灣地區量產的商用電子元器件,然后用比較好的軟件補齊零部件能力的不足。
我們把人形機器人定義成一個真正意義上的系統,也就是下一代的計算平臺和跨系統運行的基礎設施。這就意味著,我們不會只是賣一臺機器就從這個循環里面跳出來了。我們在建整個平臺,整個的生態鏈。
我們的硬件利潤率留得很低,而且團隊又小,研發費用分攤不多。所以能做到現在這個狀態。
晚點:售價 1.6 萬美元(約合 11.5 萬人民幣),利潤率也不低了。
徐睿:9000 美元是 BoM(物料清單)成本定價,其實還有得賺。不過在美國賣東西很貴,可能還要給關稅留空間。
晚點:這也很便宜。現在國內的全尺寸人形機器人,價格在 20 萬~30 萬人民幣。
徐睿:國內大部分人形機器人帶兩套計算系統,一套 x86(CPU)、一套英偉達。我們直接把 x86 那套砍掉了,攝像也是百萬像素的 MIPI。電機都是從靈足科技買的,也沒用激光雷達。
從用戶的角度來講,做 RL(強化學習)實際上效果沒差太多。如果是做傳統的那種規控,我們的這套硬件可能就做不了。
晚點:其實是一個高度簡化,但能夠發揮作用的版本。如果給 2 萬美元的成本,你們會增強哪方面能力?
Ben Bolte:我們會把它投到提升軟件能力的硬件上。比如更好的芯片、更多的內存,更好的攝像頭。
晚點:之前你們提到現在的機器人已經不夠賣了。大概備了多少臺?
徐睿:是這樣的,我們之前發布軟件產品,想要號召更多的開發者和我們一起訓練模型,開發人形機器人。我們想讓大家知道我們對硬件是認真的,就把預售打開了。頁面基本上空的,只有兩張圖,規格也沒寫,一下子就賣出了不少,大大超出預期。
晚點:這是不是因為你們在美國?又賣得很便宜。2023 年宇樹發布 H1 的時候說 9 萬美元,安德烈·卡帕蒂(Andrej Karpathy)在社交媒體上說,他想買一兩個,或者一些。
徐睿:在美國是一方面,我們也很認真地在做這件事,極客們都很喜歡開源的東西,他們下單的時候,都沒有找我們要參數規格。
晚點:買你們人形機器人的都是哪些人?
徐睿:基本上三波人。第一波就是有錢的硅谷公司高管,他們想看看這些最新的機器人是什么樣子。第二波是學校、科研機構里面的研究者。第三波就是 AI 行業的工程師,他們也會買一些。
晚點:個人用戶偏多。Ben 預測人形機器人的殺手級應用是 “語音” 和 “視覺”;早期用戶更關注 “人形”、而不是 “機器人”。怎么得出這些結論的?
Ben Bolte:關鍵是你怎么看待人形機器人,把它當成一個產線上機器,還是認為它是家里的一個設備。我們把它看做一個平臺產品,所以它的第一個爆點,就不會在一個垂直領域,也不會在工廠。人形機器人跟視覺、語音技術關聯很重要。你看無論是手機還是電腦,爆發的時候都是交互體驗的進化。
徐睿:機器人跟人的交互,比跳舞、后空翻要更重要一些。你不會買一個機器人天天看它后空翻,你會希望它能聽懂你在說什么,跟你交流,幫你干活。
晚點:美國做人形機器人的公司,像特斯拉、Figure、1X 都是帶腿的機器人。國內就不一樣,就算是做人形的機器人,也會做不帶腿的版本出來,還有一些公司干脆不做帶腿的。
徐睿:腿很難做。但是我們覺得帶腿是終局。腿在人類世界的適應性比輪胎好很多。在工廠,環境可以改,不帶腿也沒事。但要是在家里、院子里或一些公共場合,移動還是需要腿的。
國內硬件資源充足,做中間形態也無所謂。但美國硬件資源比較少。讓我們賭一個形態的話,肯定會把資源放在終極的形態上。
把軟硬件模型視為整體,用開源提高機器人能力
晚點:你們一年時間做出來大大小小六款機器人。很多中國的人形機器人公司都沒這么快。
徐睿:開源社區的幫助很大。我們只有 9 個全職員工,但有很多開源社區的人來幫忙。我們遇到什么卡點,很快就能從斯坦福大學或者周邊懂機器人的人那里得到幫助。
經常有一些大公司的程序員周末跑來幫我們寫代碼,大家一起吃兩天披薩。還是挺神奇的。
晚點:所以 K-Sacle 創辦的時候,第一件事兒就是搬家到灣區?
徐睿:是的。我們是故意放在這的(笑),就在斯坦福的后門。
晚點:你們開發人形機器人的時候覺得硬件難,還是軟件難?
Ben Bolte:最難的還是在美國造廉價的硬件。美國有很多公司造昂貴的人形機器人,這比較容易。但你要采購便宜的或者商用的組件,去用軟件補上差距就不容易了。
這跟我在特斯拉做的事情類似。我們去掉了激光雷達,依賴攝像頭。這個過程很難,但它讓汽車變得很便宜,AI 讓系統效果更好。
晚點:開發過程中,你們做得最好的事情是什么?
Ben Bolte:端到端的研發能力。我很喜歡稚暉君,他在視頻中會討論固件、軟件、硬件、機器學習模型等等。每個部分都不是那么困難,但一個人精通這些非常困難。
我們的工程師都能做到這一點。很多公司的模型比我們好,或者硬件比我們好,或者軟件比我們好,但沒有哪家公司像我們這樣,擅長所有事情,尤其是在美國。
晚點:為什么你們覺得開源是提升人形機器人能力的必要方式?
Ben Bolte:最重要的是讓人形機器人迅速普及,閉源會阻礙這個過程。很多開發者想改進人形機器人,這需要我們更開放。
晚點:能舉個開源提高能力的例子嗎?
徐睿:我們最早開源的小機器人,是用 3D 打印做的。現在有 100 多個開發者打印出來,給了我們很多硬件和軟件上的反饋。
前兩天就有一個,我們的 Discord 里面有個國內大廠的工程師,給我們發消息說,把我們的小機器人打印了出來,有一些新的想法,跟我們分享。真的很新穎,最近他還在不斷更新自己的想法。
還有一個例子,我們產品開源后,Google 的一些工程師也覺得這東西很好,想要跟我們合作。如果我們都是閉源公司,接下來就是商務與商務聊了。但我們開源,工程師們就可以相互交流了。
晚點:你們開源用什么協議?
徐睿:MIT。我們還是希望更多人到我們這個平臺上來。
晚點:數據問題能夠用開源解決嗎?仿真、視頻數據行業內都會認為很難讓機器人理解物理世界,所以大家多少都在采集真機數據。
徐睿:這跟開源閉源沒太多關系。閉源的數據大部分都是買的,雇人采集數據,去訓練模型。開源的好處是,用戶會花錢買硬件,自己訓模型,很多人也會把數據貢獻出來。美國的開源社區有分享數據的文化。
晚點:行業里很多人形機器人公司也在開源,比如美國有 Physical Intelligence, 中國的宇樹、智元等。你們的開源跟他們有什么差別?
徐睿:開源的最重要的是你要維護一個社區。本質上還是剛才聊到的,你把人形機器人看成工廠里的機器,還是家里的電冰箱,或者是計算平臺。這會決定開源的底層邏輯。
我們想培養一些熟悉我們技術、愿意用我們產品,并在我們產品的基礎上做各種各樣商品,并愿意回饋給整個社區和平臺的人。
晚點:但這個市場還是存在競爭的。你們不擔心開源會讓對手變得更強嗎?
Ben Bolte:別人用我們的技術讓他們的產品更好,我會認為自己做得很棒。這其實是一種榮譽。至于競爭,我們只需要做得更好就可以了。現在重要的是建立最好的團隊,盡早找到客戶,速度最重要。
晚點:中國有很多人形機器人公司招募自動駕駛專家開發機器人模型。Ben 之前在特斯拉開發 Autopoilt。你覺得自動駕駛領域有哪些東西可以遷移到機器人領域,哪些不能?
Ben Bolte:自動駕駛是第一個把大規模 AI 系統放到現實世界的嘗試,做成功的是特斯拉的端到端系統。實際上有很多公司都沒有真正成功。那些沒有開發成功自動駕駛系統工程師,到了機器人領域就會復制原本失敗的經驗,問題還會持續。
所以我們會選擇開源,把技術提供給極客和開發者。比如 Stale Diffusion,這是一個很簡單的模型,很多人都可以嘗試,我們看到了很多有創造力的工作出來。
晚點:但開源 Stale Diffusion 的公司過得很差。
Ben Bolte:那是因為他們掙不到錢。K-Scale 可以賣硬件獲得收入,并且以硬件為錨點,通過軟件賺錢。
徐睿:我們所有的用戶都在用我們硬件,這給我們很多商業化的機會。我們也有應用商店。
晚點:你們也想做個 App Store?
徐睿:更偏向游戲主機的形式。軟件、應用是各種各樣的游戲。軟件的價值,會大大高于硬件的價值。
晚點:我們了解到,你們跟追覓前中國區執行總裁郭人杰創辦的樂享科技合作舉辦過黑客松。他說他看到了高中生市場的潛力。你們看到了什么?
徐睿:美國有很濃厚的極客精神。他們會喜歡花一個周末做個好玩的東西出來,很多有才華的工程師,創造新東西需求是沒有滿足的。每次我們辦黑客松,都會來上百人,把路邊全部停滿,鄰居經常會抱怨。每次做完黑客松,我們都很有收獲。
K-Scale 舉辦黑客松的場景。圖片來自 K-Scale。
人形機器人在美國不該那么貴,宇樹錯過建生態系統的機會
晚點:Ben 之前說,如果未來是閉源的、成本 5 萬美元以上的人形機器人不太對勁,所以出來創業。你為什么會覺得自己可以用開源的方式在美國做出來低價的人形機器人呢?
Ben Bolte:我做過嘗試,看到了可能性。而且中國公司也在做,證明實際上是可行的,基本上都是一些工程問題。其他公司成本甚至可以到 50 萬美元,完全是糟糕的工程案例。
晚點:宇樹的 G1 賣 9.9 萬人民幣,成本也很低。Ben 去過宇樹。你從宇樹身上得到什么啟發?
Ben Bolte:宇樹基本上是第一家成功銷售這種低價通用機器人的公司,給了我們很大的靈感。
但我認為,宇樹錯過了建立生態和社區的機會。在美國,宇樹的硬件有故障的時候很難修,大多美國人都沒有微信(WeChat)賬號,很難聯系到支持人員。我們希望對開發者更友好。
晚點:你們的目標是實現未來有數十億人形機器人的世界。這跟馬斯克的目標一樣。Ben 之前在特斯拉工作過。你們跟馬斯克有什么不同?
Ben Bolte:山姆·阿爾特曼有句形容埃隆的話我很喜歡:他希望世界得到拯救,但前提是,他是做這件事的人。對于我們來說,我們只希望世界是安全,誰實現的并不重要。
人形機器人超過千萬臺,如果是一家閉源公司控制,會對社會造成非常大的破壞,很多人就會失業,會有機器人軍隊等等。阻止這種事情發生的唯一可能性,就是把技術開源出來。
晚點:聽上去很像 OpenAI 剛成立時的樣子,但現在他們閉源了。
Ben Bolte:問題在于他們的業務模式,他們不會從開源中受益。對我們來說,最重要的是一開始就建立業務模式,與許多不同的公司合作,建立生態。比如 Facebook,他們開源了很多 AI 技術,也能從生態系統中受益。如果業務模式跑不通,開源就沒有意義,就是一個空洞的單詞。
晚點:K-Scale 剛成立的時候,就得到硅谷知名投資人奈特·弗里德曼(Nat Friedman)的支持。他最看重什么點?
Ben Bolte:他很喜歡 “殺死巨人” 的項目。他建議我應該去嘗試高風險、高回報的事情,現在是 “殺死巨人” 的時候了。我不想成為一個小人物。
晚點:你們眼中的巨人是誰?
Ben Bolte:特斯拉。
晚點:那徐睿呢?你在 2024 年 10 月加入了 K-Scale 前,在騰訊做 AR/VR 相關的事情,也在小米、字節做過硬件。你為什么選擇跨行做人形機器人,而且加入一家美國公司?
徐睿:我認為機器人不是像耳機、3D 打印機這樣的產品,而是類似個人電腦或智能手機的平臺型硬件。這樣的機會,可能一生只有一次。
更重要的是,這本質上是一個 AI 問題,而不是一個純粹的硬件問題。整個邏輯、節奏和發展方向,都必須遵循 AI 的演進路徑。所以在硅谷更好。
我覺得必須與那些在一線做過 Sim2Real、并且真正部署過物理層模型的人合作。我有意識地 “按圖索驥”,尋找具備這種能力的人。經朋友介紹認識了 Ben,挺幸運的。
晚點:徐睿加入 K-Scale 之后,帶來了什么改變?
Ben Bolte:我的性格偏向于史蒂夫·沃茲尼亞克(Steve Wozniak,蘋果聯合創始人)。但我們公司不只要有技術實力、靠著愿景建立生態系統,要有一個完整的有機體。在這個方面,徐睿比我更有經驗。
晚點:K-Scale 是 YC 孵化器畢業的公司。他們會要求應用創業公司盡可能迅速的增長。但人形機器人很難這樣。他們對你們會有什么新的要求嗎?
Ben Bolte:快速增長并不是 YC 的硬性要求,他們更關注創始人是不是有很強的信念,是不是有技術實力,愿不愿意為了這個目標高度奉獻。
我在 YC 的時候,他們還試圖 check 這一點,認真勸我改變創業想法,大概有三次。我都拒絕了,最后他們就不再問了。
晚點:現在你們只有 9 個人,天使輪只融 400 萬美元。這樣的資源算得上匱乏。是投資人不愿意投你們嗎?還是你們對融資和發展有自己的節奏?
Ben Bolte:我希望公司的管理層和團隊擁有公司的大部分股權,400 萬美元已經夠用了。
徐睿:融來的錢更像是債。現在我說一年能賣出去 500~1000 臺機器人,投資人會很開心。如果融了幾千萬美元、上億美元,你說 500 臺,他們可能會覺得公司有問題,我們只能講很夸張的故事,打亂研發節奏。
晚點:接下來你們會怎么擴張?
徐睿:會建立市場營銷團隊。我們現在沒有這類人。后面也會吸納一些做 AI 的人,把產品做得更好。
晚點:你們會怎么預測未來幾年人形機器人的發展?
Ben Bolte:大概兩年后,就會出現類似 iPhone 這樣的產品。在那之后,會出現一個龐大的生態系統,有 3 到 5 家公司有自己的 iPhone 相互競爭。
徐睿:應該會跑通 2~3 個人們生活中沒有標準化的場景。我們希望有更多中國的硬件供應商和開發者加入我們的生態,大家一起做得更好。
晚點:若干年后人形機器人沒有做成,會是哪里出了問題?
Ben Bolte:那我的工作就失敗了,我會覺得很慚愧。技術進步是個體行為,有技術、有能力的人有這樣的責任。中國和美國共同努力推動進步很重要。我認為世界由工程師管理會更好。
題圖來源:K-Scale
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.