機(jī)器之心報(bào)道
編輯:張倩
這家公司要把人類從體力勞動(dòng)中解放出來。
前段時(shí)間,「隱身」許久的 Ilya Sutskever 罕見露面,還在多倫多大學(xué)做了個(gè)演講。他在演講中提到,終有一天,AI 會(huì)完成人類能夠完成的所有工作。這將帶來人類有史以來最大的挑戰(zhàn),但也蘊(yùn)含著巨大的機(jī)遇。
這幾年,AI 的進(jìn)展有目共睹。不過,大家也常調(diào)侃說,「本來想讓 AI 去掃地、做飯、帶孩子,我去寫詩、唱歌、陶冶情操,結(jié)果現(xiàn)在反過來了」。這一調(diào)侃揭示了一個(gè)尷尬的現(xiàn)狀:AI 的「大腦」和「本體」進(jìn)步速度不同步,只解鎖了一些腦力勞動(dòng),體力勞動(dòng)涉足非常有限。
這兩年比較火的「具身智能」方向就是來解決這個(gè)問題的。不過,大家期待的具體智能界的「OpenAI」還沒出現(xiàn),也沒有一個(gè)類似 Transformer 的通用技術(shù)架構(gòu)。
最近,硅谷的一家新成立的名叫「Genesis AI」的公司吸引了我們的注意,他們在最近的種子輪融資中拿到了 1.05 億美元。據(jù)外媒 TechCrunch 報(bào)道,這輪融資由美國頂級風(fēng)投機(jī)構(gòu) Khosla Ventures、Eclipse 聯(lián)合領(lǐng)投。前者是 OpenAI 的最早的機(jī)構(gòu)投資者,后者是特斯拉產(chǎn)業(yè)背景團(tuán)隊(duì)機(jī)器人賽道的專業(yè)機(jī)構(gòu)。
這應(yīng)該是是硅谷具身智能賽道至今最大規(guī)模的種子輪融資,超過了此前該賽道明星創(chuàng)企 Physical Intelligence 的記錄。同時(shí)參與投資的還有谷歌前董事長 Eric Schmidt、歐洲科技大亨 Xavier Niel、法國中央銀行 BPI、紅杉中國等。
「Genesis」這個(gè)名字是不是聽起來有點(diǎn)耳熟?沒錯(cuò),它和知名具身智能項(xiàng)目、GitHub 25k star 量的 Genesis 一脈相承。「Genesis」是一個(gè)生成式物理引擎,由 CMU 聯(lián)合 20 多所研究實(shí)驗(yàn)室歷時(shí)兩年聯(lián)合開發(fā),能夠生成 4D 動(dòng)態(tài)世界、模擬廣泛的材料和物理現(xiàn)象,專為通用機(jī)器人、具身 AI 和物理 AI 應(yīng)用而設(shè)計(jì)。
該項(xiàng)目效果驚艷,當(dāng)時(shí)引發(fā)了不小的轟動(dòng),很多人從它身上看到了具身智能的未來(參見《歷時(shí) 2 年,華人團(tuán)隊(duì)力作,震撼開源生成式物理引擎 Genesis,可模擬世界萬物》)。與此同時(shí),它也成為了近幾年具身智能最受矚目的項(xiàng)目之一。而且 Genesis 社區(qū)也已成為機(jī)器人仿真領(lǐng)域最大的開源社區(qū)。
Genesis 生成的物理世界。提示:手持棍棒的迷你版悟空在桌面上飛奔 3 秒,然后跳到空中,落地時(shí)右臂向下擺動(dòng)。鏡頭從他的臉部特寫開始,然后穩(wěn)定地跟隨角色,同時(shí)逐漸縮小。當(dāng)悟空跳到空中時(shí),在跳躍的最高點(diǎn),動(dòng)作暫停幾秒鐘。鏡頭圍繞角色 360 度旋轉(zhuǎn),然后緩慢上升,然后繼續(xù)動(dòng)作。
項(xiàng)目核心成員此次集體投身創(chuàng)業(yè),自然引發(fā)了外界廣泛關(guān)注。在拿到如此充足的資金之后,這個(gè)團(tuán)隊(duì)具體打算做什么?以下是我們了解到的關(guān)于該公司的信息。
Genesis AI:刷新硅谷具身智能融資記錄的團(tuán)隊(duì)
Genesis AI 的創(chuàng)始團(tuán)隊(duì)由來自 Mistral AI、英偉達(dá)、谷歌、蘋果、CMU、MIT、斯坦福、哥倫比亞大學(xué)和馬里蘭大學(xué)的頂尖學(xué)術(shù)和工業(yè)界技術(shù)人才組成,在物理模擬、圖形學(xué)、機(jī)器人技術(shù)和大規(guī)模 AI 模型訓(xùn)練與部署方面擁有深厚積累。
與具身領(lǐng)域常見的由資深教授主導(dǎo)研發(fā)帶隊(duì)創(chuàng)業(yè)的模式不同,這是一支由剛畢業(yè)的年輕博士組成的全明星陣容。他們均來自不同的頂尖研究機(jī)構(gòu),是 AI 及機(jī)器人領(lǐng)域最活躍的科研新銳。
創(chuàng)始人及 CEO 周銜。周銜去年底剛從卡內(nèi)基梅隆大學(xué)畢業(yè)并獲得機(jī)器人學(xué)博士。他本科畢業(yè)于南洋理工大學(xué),主導(dǎo)了登上 Science Robotics 雜志的組裝宜家家居的機(jī)器人研究。他博士期間的研究方向涵蓋世界模型,模仿學(xué)習(xí),強(qiáng)化學(xué)習(xí)。他提出了生成式仿真的新范式,并在學(xué)界發(fā)起并領(lǐng)導(dǎo)了 Genesis 的開源項(xiàng)目。
聯(lián)合創(chuàng)始人 Théophile Gervet,博士畢業(yè)于 CMU,Mistral 早期創(chuàng)始團(tuán)隊(duì)成員和多模態(tài)模型負(fù)責(zé)人。他主導(dǎo)研發(fā)了 Mistral 第一個(gè)多模態(tài)大模型 Pixtral 12B,用 Llama-3.2 90B 七分之一的模型大小實(shí)現(xiàn) 7 倍性能的超越。他還主導(dǎo)了 Mixtral 8x7B 的開發(fā),成功實(shí)現(xiàn)了 GPT-3.5 及 Llama 2 70B 級別模型的性能,并顯著降低了推理速度和成本。此外,在加入 Mistral 之前,Theo 也是 Skild AI 的創(chuàng)始成員之一。
公司官網(wǎng)列舉出的聯(lián)創(chuàng)中,也有不少我們熟悉的華人面孔:
許臻佳,此前備受關(guān)注的斯坦福刷盤子機(jī)器人 UMI 項(xiàng)目還有目前最流行的機(jī)器人網(wǎng)絡(luò)架構(gòu) Diffusion Policy 的共同一作。他于 2024 年從哥倫比亞大學(xué) / 斯坦福大學(xué)博士畢業(yè),師從 Shuran Song。
他此前在英偉達(dá) GEAR(Generalist Embodied Agent Research)團(tuán)隊(duì)領(lǐng)導(dǎo) GR00T 項(xiàng)目的機(jī)器人數(shù)據(jù)收集和真機(jī)系統(tǒng)工作,并多次獲得 RSS、CoRL 等機(jī)器人頂會(huì)最佳論文及提名。
王尊玄,今年剛從 MIT CSAIL 博士畢業(yè),師從機(jī)器人領(lǐng)域大牛、麥克阿瑟「天才」獎(jiǎng)得主、MIT 人工智能實(shí)驗(yàn)室主任 Daniela Rus。他的研究領(lǐng)域橫跨數(shù)據(jù)、大腦和本體,這也是具身智能的幾個(gè)核心技術(shù)方向。在此之前,他曾在大模型公司 Liquid AI 負(fù)責(zé)基礎(chǔ)模型架構(gòu)的研發(fā)。
喬懌凌,馬里蘭大學(xué)博士,師從圖形學(xué)泰斗 Ming C.Lin 和機(jī)器人學(xué)泰斗 Dinesh Manocha。他是 Meta 獎(jiǎng)學(xué)金獲得者,在圖形學(xué)、可微物理仿真方向做出多項(xiàng)橫跨剛體 / 流體 / 柔性材料的開創(chuàng)性工作。
宋運(yùn)龍,無人機(jī)強(qiáng)化學(xué)習(xí)競速領(lǐng)域開拓者以及高性能仿真工具 Flightmare 的主要開發(fā)者,蘇黎世大學(xué)博士,師從機(jī)器?學(xué)泰? Davide Scaramuzza。
他曾通過強(qiáng)化學(xué)習(xí)算法戰(zhàn)勝人類世界冠軍,相關(guān)成果登上 Science Robotics 雜志封面。
李旻辰,卡內(nèi)基梅隆大學(xué)圖形學(xué)方向助理教授,賓夕法尼亞大學(xué)博士,曾獲 SIGGRAPH2021 年度杰出博士論文獎(jiǎng)。此外,他還是目前圖形學(xué)領(lǐng)域非常有影響力的求解復(fù)雜 contact 模型的算法 IPC 的發(fā)明人。
這支年輕團(tuán)隊(duì)的背后集結(jié)了過去幾年具身領(lǐng)域多項(xiàng)重要技術(shù)成果,橫跨真機(jī)數(shù)采、模仿學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和物理仿真,這也是華人主導(dǎo)的創(chuàng)業(yè)團(tuán)隊(duì)在硅谷歷史上完成的最大的種子輪融資。
除了學(xué)界新銳外,Genesis AI 披露的早期創(chuàng)始團(tuán)隊(duì)成員還包括多位工程界的大牛,包括 H Company 多模態(tài)模型負(fù)責(zé)人 Antoine d’Andigne、蘋果 Apple Intelligence 多模態(tài)模型負(fù)責(zé)人、谷歌工程總監(jiān) Rachid El Guerrab、英偉達(dá) GVDB 架構(gòu)師 Rama Hoetzlein、原版 Pytorch 和多個(gè)開源 GPU 編譯器框架(VeriGPU/DeepCL/Coriander)創(chuàng)作者 Hugh Perkins、以及 Roblox 首席工程師 Hongyi Yu 等。
拿到 1 億美元之后,Genesis AI 打算做什么?
拿到如此豐厚的融資之后,Genesis AI 打算做什么呢?據(jù)了解,他們的目標(biāo)是打造一個(gè)極高人才密度的創(chuàng)新組織,實(shí)現(xiàn)最強(qiáng)的物理智能,并在未來實(shí)現(xiàn)體力勞動(dòng)的自動(dòng)化。
要實(shí)現(xiàn)這一目標(biāo),Genesis 首先要解決的是物理智能領(lǐng)域普遍存在的「數(shù)據(jù)魔咒」問題。
為此,他們正在打造一個(gè)可擴(kuò)展的通用數(shù)據(jù)引擎,把高精度物理模擬、多模態(tài)生成式 AI 和大規(guī)模真實(shí)機(jī)器人數(shù)據(jù)整合在一起。
他們并不押注在任意一條單一的技術(shù)路線,而是希望在各個(gè)通向機(jī)器人基礎(chǔ)模型的技術(shù)模塊上都實(shí)現(xiàn)世界級的突破,并成為首個(gè)真正實(shí)現(xiàn)仿真與現(xiàn)實(shí)數(shù)據(jù)閉環(huán)(closed-loop)的團(tuán)隊(duì)。
他們的仿真系統(tǒng)完全自主研發(fā),能大規(guī)模生成高質(zhì)量的合成數(shù)據(jù),同時(shí)配合更高效、可擴(kuò)展的真實(shí)世界數(shù)據(jù)采集系統(tǒng)。這種「合成數(shù)據(jù) + 真實(shí)數(shù)據(jù)」的雙引擎模式,打破了傳統(tǒng)的數(shù)據(jù)壁壘,能夠收集大規(guī)模、多樣性的高質(zhì)量數(shù)據(jù),用于訓(xùn)練機(jī)器人基礎(chǔ)模型。
物理智能基礎(chǔ)模型是 AI 領(lǐng)域的 next big thing,最強(qiáng)物理智能對世界和產(chǎn)業(yè)的影響更加深遠(yuǎn)和顛覆性。
在 DeepSeek 之后,我們也期待能夠出現(xiàn)一家華人主導(dǎo)的年輕科學(xué)家團(tuán)隊(duì),成為物理智能領(lǐng)域的 OpenAI,有機(jī)會(huì)真正的做到世界級的「引領(lǐng)」。
不過,該公司目前的具體產(chǎn)品信息仍較少。我們了解到,他們的下一個(gè) milestone 可能將于今年年底發(fā)布。至于它是否足夠驚艷,我們拭目以待。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.