文 | 賽博汽車
OpenAI的CEO山姆·奧特曼和特斯拉CEO馬斯克的矛盾,已經是硅谷熱門的八卦。
兩人都是OpenAI的聯合創始人,但是奧特曼將OpenAI轉向商業化運營之后,馬斯克指責其背離初心,并起訴他違背創始協議。另外,馬斯克還成立xAI,和OpenAI直接競爭。
奧特曼也奮起反擊,公布郵件顯示,馬斯克試圖掌控OpenAI,遭到拒絕后才不斷阻撓。
奧特曼可能還醞釀了一個“以其之道還施彼身”的反擊舉措,那就是研發自動駕駛,和特斯拉FSD競爭。
最近,奧特曼在做客了自己兄弟杰克·奧特曼的脫口秀,不知是否和兄弟聊天說漏了嘴。
他說:
我想我們有一些新技術,可以為普通汽車提供自動駕駛,而且比當前技術要好得多。 I think we have some new technology that could just do self-driving for standard cars way better than any current approach has worked.
這里說比“當前技術”“好得多”,當然也包括馬斯克的FSD。
不過,奧特曼并沒有詳細介紹這一技術和推進的時間表。只是說:
如果我們的人工智能技術真能駕馭汽車,那還是很酷的。 If our AI techniques can like really go drive a car that's still pretty cool.
根據紐約時報旗下DealBook的消息,該技術尚處于早期階段,商業化也還要很遠。
據其分析,這一技術涉及 OpenAI的Sora視頻軟件及其機器人團隊,但OpenAI 發言人沒有置評。
此前,OpenAI并沒有直接探索自動駕駛業務,只是通過投資布局了一些自動駕駛、汽車智能化的公司。
當然,作為AI應用中最被看好的一個場景,自動駕駛擁有廣闊前景,也吸引了巨大關注。OpenAI如果真有絕招,是絕對不會放棄如此巨大的市場的。
如此看來,奧特曼和馬斯克以后大概率會吵得更兇。
什么絕招?
奧特曼上下嘴唇一碰,大家就要相信,OpenAI真有“好得多”的自動駕駛技術嗎?
畢竟當前自動駕駛也是強手如林,谷歌旗下Waymo、特斯拉、Moblieye、高通、博世、還有一大批來自中國的企業,都已經探索很久了。
OpenAI可能的技術路徑是什么呢?
大家可能都會回想起2024年初,OpenAI發布了Sora——文本生成視頻模型。
Sora生成的視頻
Sora可以根據用戶輸入的文本,快速制作長達一分鐘的高保真視頻,還能獲取現有的靜態圖像并從中生成視頻。
Sora生成的視頻一下子驚艷了世人,因為這一模型能夠理解復雜場景中不同元素之間的物理屬性及其關系,掌握物體在物理世界中的存在和運動方式,從而生成足以以假亂真的視頻。
幾乎在Sora一發布,自動駕駛、智能駕駛業界就討論說,可將Sora用于自動駕駛的模擬和訓練,生成合成視頻數據,尤其是一些極限場景Corner Case,以彌補現實數據不足或成本高的問題。
然而,也有專業人士迅速指出,Sora生成的畫面,并不完全符合物理原理,也可能難以捕捉駕駛動態,如剎車或轉彎的物理行為。因此,并不能用來作為智駕模型訓練的視頻數據。
不過,后來很多的研究者和從業者認為,符合物理原理的仿真,還是能夠為數據訓練提供數據的。或者,也可以用于強化訓練模型。
近來,自動駕駛業界熱衷于搭建“世界模型”來作為自動駕駛模型的基座模型。而OpenAI一開始,就將Sora定義為可以生成視頻的世界模型。
像蔚來、小鵬等開發的世界模型,邏輯是讓AI系統創建心理上的世界地圖,以理解世界的運作方式,就像人類對世界的理解一樣,然后在此基礎上去駕駛車輛。
Sora的部分理念與世界模型模擬真實世界的目標有一定的契合度。
另外,當前自動駕駛開發的主流理念,都是“大數據-大模型-大算力”打法。OpenAI沒有駕駛數據,要想給出更好的自動駕駛技術,大算力沒問題,大模型也可以有,大數據則是無源之水——如果能靠仿真生成,至少邏輯上說得通。但不少專家認為,依賴仿真數據存在巨大風險。
OpenAI的汽車智能化業務
OpenAI自己沒搞過自動駕駛,也沒有過做過智能座艙,但是通過其投資,也有所設計。
2023 年OpenAI 向Ghost Autonomy投資500萬美元。這家自動駕駛公司還同時獲得了微軟的算力支持,也曾嘗試將AI語言模型應用于自動駕駛。但是,它在2024年就倒閉了。
Ghost Autonomy的自動駕駛車輛
2025年6月10日,OpenAI和汽車智能化公司Applied Intuition達成合作。雙方合作聚焦于把最新AI技術發展成果融入現代汽車,使其轉型為智能伙伴。
官方通告說,通過將大語言模型驅動的語音助手和智能體引入車內,下一代汽車將成為具備深度個性化體驗的生產力工具。
通告還說,合作的核心目標之一是實現移動設備與私人車輛智能系統的無縫連接。此外,Applied Intuition 還將在多個部門部署 ChatGPT,助力員工提升工作效率、優化策略規劃,以更高效地實現公司目標。
從這些描述來看,合作更偏向于智能座艙的人機交互方面,而不是直接應用于自動駕駛。
從語言模型到多模態模型、世界模型
業界曾有觀點認為,依托大語言模型的快速進步,自動駕駛一類的空間智能可能很快實現。但是,如今的AI大牛們,都認為,光靠語言模型,是不夠的。
OpenAI雖然以大語言模型震驚世人,仍以大型語言模型(LLM)為核心,但已逐步向多模態模型和世界模型領域延伸。
奧特曼也曾經表示,世界模型需具備“理解物理因果關系、預測事件發展” 的能力,這與 LLM 的推理能力結合,可能推動AGI(通用人工智能)突破。
不僅僅是OpenAI這么判斷。包括人工智能教母李飛飛、Meta首席人工智能(AI)科學家Yann LeCun(楊立昆)都有類似觀點。
楊立昆就說,當前AI雖在多個領域展現驚人能力,其仍缺乏理解物理世界、持久記憶、邏輯推理與分層規劃四大人類智能核心特征。
而沒有這些能力的AI,是不可能駕駛汽車的。
解決方案,眾人所指,都是世界模型。
楊立昆在Meta開源世界模型V-JEPA 2是說,在世界模型的幫助下,AI不再需要數百萬次的訓練才能掌握一項新的能力,世界模型直接告訴了AI世界是怎樣運行的,這可以極大提升效率。
聽起來,有點奧特曼沒說出來的自動駕駛“大招”的影子。
實踐層面,AI時代“賣鏟子”的英偉達已經遞上新“鏟子”。
在CES 2025上,英偉達CEO黃仁勛說,“機器人的 ChatGPT 時刻即將到來。與大語言模型類似,世界基礎模型(World Model)對推動機器人和自動駕駛汽車的開發至關重要。”
英偉達發布的Cosmos 世界基礎模型,就是專為物理交互、工業環境和駕駛環境的高質量生成而構建,具備生成逼真視頻、創建合成訓練數據等能力,幫助機器人和汽車更好地理解物理世界。
英偉達Cosmos世界模型示意圖
意思是,Cosmos 世界基礎模型比起Sora來,是不是仿真,本來就是“真”。
對此,OpenAI肯定已經著手推進,將自己的AI版圖擴展到空間智能上。
其實,OpenAI很早就有機器人團隊,但2021 年解散了。2024年,機器人團隊重新組建,并在 2025 年進一步擴大,并招聘不少硬件機器人相關職位。
此外,OpenAI還與機器人初創公司 Figure 建立了合作關系,為其人形機器人提供 AI 模型支持。
人形機器人的基礎模型和自動駕駛非常接近。在探索世界模型的過程中,OpenAI如果有所突破,并將其應用于自動駕駛,是順理成章的。畢竟,自動駕駛市場是毫無疑問的萬億美元級市場。
奧特曼即便做不成自動駕駛,在馬斯克自以為傲的領域阻擊一下他,也算是報一箭之仇啊。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.