作者|Hayward
原創(chuàng)首發(fā)|藍字計劃
馬斯克最引以為豪的特斯拉智能座艙,在中國市場卻如路邊一條、無人問津,想必他心里一定不太好受。
就像《英雄本色》里小馬哥發(fā)狠地說出“我失去的一定要親手拿回來”一般,大洋彼岸的另一位“小馬哥”,似乎也在憋了半年之后,要讓自己的特斯拉重新拿回汽車智能化的王者地位。
上周四,在 Grok 大模型正式發(fā)布的隔天,馬斯克興奮地在 X 上宣布,Grok AI“最遲”將于下周(也就是這周)在特斯拉汽車上推出。
一旦實現(xiàn),意味著特斯拉在智能化上邁出極其重要的一步。因為這不僅是馬斯克首次為“Grok 上車”這個餅給出了準(zhǔn)確的時間表,而且要上車的 Grok,還是馬斯克口中的“地表最強 AI”:
比如,馬斯克早就聲稱 Grok 4 要 “重寫人類知識庫”;在發(fā)布會上,馬斯克再次強調(diào) Grok 4 是目前世界上最聰明的 AI。
這么厲害的 AI 要上車,國內(nèi)智能座艙的領(lǐng)頭羊——華為理想們,能招架嗎?
吹牛還是真實力?
一提到 Grok,更多人最先想起的可能是它的“口無遮攔”,無論是說“日本歷史上最大的煙花是原子彈爆炸”,還是支持希特勒的“反猶言論”都令人印象深刻。
而在 Grok 4 發(fā)布之后,大家的關(guān)注點又放到了它最高可達每年 3000 美元的“天價”訂閱費用上。所以當(dāng)馬斯克說 Grok 4 是「世界最聰明 AI」 的時候,更多人持有的是懷疑態(tài)度。
果然,在 Grok 4 在實際測試中馬就“翻車”了。
博主@ karminski-牙醫(yī) 發(fā)微博稱,經(jīng)過他的測試,在「20小球在七邊形里面彈跳」的經(jīng)典試題中,Grok 4 不僅在 3 次代碼生成中就有 2 次有語法錯誤,唯一一成功的,表現(xiàn)也和初版的 DeepSeek R1 有明顯差距。
在另一個難度更高的「煙囪爆破模擬」中,Grok 4 的表現(xiàn)也比較一般,不僅散落的粒子粗糙模糊,最離譜的是模擬出來的煙囪底部甚至不是圓柱體的…和旁邊的 DeepSeek R1 一比,簡直高下立判。
反正, Grok 4寫代碼根本沒有第一梯隊水平,更別說牛吹上天的「世界上最聰明 AI」 了。
不過,盡管馬斯克沒有確認即將上車的 Grok會在特斯拉的智能座艙中扮演什么角色,但國外媒體分析大概率會先在車機中擔(dān)任「語音助手」。
如果只是要做「語音助手」,那這項功能對 Grok 來說就是牛刀小試了。
特別是作為語音助手最需要的大模型能力:多學(xué)科推理、語義理解、上下文理解和 Agent 能力方面,Grok 4 在目前的大模型里的確算是數(shù)一數(shù)二的。
多學(xué)科推理這塊,在 HLE(Humanity’s Last Exam),一般中文翻譯為“人類終極考試”或“人類最后考試”的測試中,無工具輔助的情況下,Grok 4 的得分為 25.4%,大幅超越Gemini 2.5 Pro 的 21.6% 和 OpenAI o3的 21%;如果有工具輔助,則 Grok 4 的得分可以進一步上升到 38.6%,Grok 4 Heavy 的得分更是達到了 44%。
另外在ARC-AGI 測試中,Grok 4 甚至“創(chuàng)下新紀錄”。這項測試旨在評估 AI 模型的通用智能水平,題目主要是視覺推理類測試,Grok 4 的得分為 16.2%,在得分坐標(biāo)系中可以說是“遙遙領(lǐng)先”。
另外在上下文理解方面,Grok 4 支持256k token的上下文窗口,雖然比不上Gemini 2.5 Pro 變態(tài)級別的100萬個token,但也超越了Claude 4 Sonnet、Claude 4 Opus 、ChatGPT o3的200k token和 DeepSeek R1 0528 的 128k token,用來做語音助手是綽綽有余了。
而且馬斯克還說Grok 4 基礎(chǔ)模型的第七版將在本月完成,會擁有更出色的視頻理解能力和工具調(diào)用能力;接下來幾個月 xAI 還會推出代碼模型、多模型智能體以及視頻生成模型。
總而言之,哪怕是單智能體版本的 Grok 4,在車上調(diào)節(jié)個空調(diào)、雨刮、后視鏡什么的肯定夠用了。
有 Grok 加持,特斯拉的智能座艙堪稱是小米加步槍換巴特雷,試想在特斯拉原先就非常炸裂的銷量之上,還有了能用自然語言流暢對話、操控大面積的車用功能的語音助手,直接解決了一個消費者詬病許久的槽點。
只要特斯拉上的 Grok能達到國內(nèi)新能源車語音助手的平均水準(zhǔn),小米、理想、華為、小鵬等在發(fā)布會上“嘲笑”特斯拉的點又少了一個,宣發(fā)部門壓力又大了一點。
但「語音助手」就是 Grok 上車的全部意義嗎?顯然不是。
為 FSD 賦予靈魂
除了能補齊人機交互的短板之外,我們不妨腦洞更大些:如此強大的 Grok 4,有沒有可能甚至可以影響、控制 FSD?
這個腦洞并非毫無根據(jù)。在咱們國內(nèi),新能源車企們的智能輔助駕駛功能規(guī)劃里,早就把「自然語言指揮輔助駕駛」作為下一代輔助駕駛系統(tǒng)的必備功能了。
在 NVIDIA GTC2025 上,理想高管提到了在自家下一代自動駕駛技術(shù) MindVLA 中,要讓汽車的智駕系統(tǒng)變成聽得懂、看得見、找得到的專職司機。
在理想的描述中,用戶可以和汽車系統(tǒng)深度互動,比如在智駕的過程中一旦車子開快了,就可以用“開得太快了”的模糊語音指令來限制車速;車子已經(jīng)規(guī)劃好智駕路線后,車主也可以臨時改變主意,對著車機說“在下一個路口右轉(zhuǎn)”,智駕就會根據(jù)指令修改路線。
這個像“科幻片”一樣功能,目前還有華為、小鵬、極氪和小米等車企在規(guī)劃。
耐人尋味的是,Grok 4 所展現(xiàn)出來的能力,就像為「自然語言指揮輔助駕駛」量身定制一般。
「自然語言指揮輔助駕駛」里,AI 對自然語言的理解和對駕駛意圖的精準(zhǔn)映射是核心。這時Grok 4 支持256K 上下文窗口與多代理協(xié)作架構(gòu)(Grok 4 Heavy 專屬),有同時處理用戶語音指令、車輛狀態(tài)與環(huán)境數(shù)據(jù)的復(fù)雜關(guān)聯(lián)的潛力
當(dāng)用戶說“前面要堵車了,換條車少的路”時,Grok 就能解析出三重語義:環(huán)境感知(識別地圖上的擁堵狀態(tài))、用戶偏好(“車少”= 低流量路徑)和動作生成(觸發(fā)路徑重規(guī)劃),進而快速選擇一條新的行車路線。
另外,Grok 4 Heavy 的4-Agent 并行架構(gòu)從技術(shù)上為 FSD 提供“類人決策腦區(qū)”,這就和國內(nèi)車企在智駕系統(tǒng)中強調(diào)的“大小腦”架構(gòu)有點相似。
例如,Grok 4 Heavy 的4 個 Agent 可以分別是感知代理(融合數(shù)據(jù)構(gòu)建占據(jù)網(wǎng)絡(luò))、規(guī)劃代理(基于空間模擬能力的路線規(guī)劃)、交互代理(主要處理車內(nèi)語音交互和指令)和安全代理(實時監(jiān)控 Action Token 與交通規(guī)則的沖突)。
在打開 FSD 功能時,四個代理之間就能互相協(xié)作,在一個簡單的“向左超車”語音命令場景,交互代理感知用戶命令、感知代理識別左側(cè)的車道情況、安全代理判斷是否存在安全超車的窗口,最后規(guī)劃代理規(guī)劃具體的超車路線,由 FSD 實現(xiàn)超車。
如果功能可以上車,這種語音指令還能拓展到非常多的用車場景中,包括理想提出的“找車位”、“靈活的路線規(guī)劃”等等。
此外,結(jié)合馬斯克在自動駕駛無人車上的動作,Grok 的上車還可能是特斯拉打造全新的車載 AI 生態(tài)閉環(huán)、部署自動駕駛的關(guān)鍵一環(huán)。
說到底,智能駕駛的競爭,最終都是自動駕駛的競爭。6 月 22 日起,特斯拉在德州奧斯丁啟動首批 Robotaxi 服務(wù);相比 FSD,Robotaxi 或許更加需要聰明的“大腦”,或者說“靈魂”。
有了「語義層級指揮 FSD」,乘客可以在合規(guī)、安全的情況下控制Robotaxi 的駕駛節(jié)奏、風(fēng)格、路線,同時還能像正常詢問出租車司機一樣問車子“你剛剛為什么急剎?”
這時, Grok 就可以查詢車子的決策日志,把急剎的原因轉(zhuǎn)述為人能聽懂的語言,比如“剛才前面的車急減速”等。
不過相比理想預(yù)告 MindVLA 將在 2025 年下半年上車、華為類似效果的盤古大模型5.0 賦能ADS 將于2025 年 8 月開始陸續(xù)鋪開,特斯拉能不能真正實現(xiàn)「語義層級指揮 FSD」還是未知數(shù)。
同時,「自然語言指揮輔助駕駛」還面臨著監(jiān)管、權(quán)責(zé)、倫理道德和算力部署等一系列難題,對中國消費者來說最靈魂的問題是,Grok 能否進入國內(nèi)?
這一點影響的不止遙遠的「自然語言指揮輔助駕駛」,還有“這周上車”的「Grok 語音助手」,大概率又是北美用戶先嘗鮮,中國用戶望眼欲穿。
盡管“世界最強 AI 上車”充滿了未知,但不代表國產(chǎn)新能源廠商們能松一口氣。只要這事存在可能,國產(chǎn)汽車廠商們就得面臨巨大壓力。
國產(chǎn)車,壓力山大
只看當(dāng)前的技術(shù)和銷量,特斯拉都有從容的資本,更別說未來Grok 的加入,還有可能讓特斯拉的智能化程度進入一個新的臺階。
在剛過去的這個六月,雖然有號稱“終極 Model Y 殺手”的小米 YU7 發(fā)布,它也的確拿下了 1 小時近 30 萬訂單的空前戰(zhàn)績,但特斯拉 Model Y 依然賣出了恐怖的44848 輛(懂車帝數(shù)據(jù)),在一些機構(gòu)的統(tǒng)計中甚至達到了51253 輛(蓋世汽車),可謂他強任他強,清風(fēng)拂山崗。
甚至 Model 3 長續(xù)航版還敢漲價 1 萬元。
同樣堅挺的,還有特斯拉的技術(shù)。自 3 月在中國區(qū)上線的 FSD 一直被群嘲訂閱價格過高、不能識別中國的紅綠燈和公交車道,自然成了各家智駕的吊打?qū)ο蟆?/p>
但當(dāng)國內(nèi)車企才將「識別交警手勢」作為一個主要賣點時,就有不少網(wǎng)友早在幾個月前發(fā)現(xiàn) FSD 已經(jīng)悄悄“學(xué)會”了看交警的手勢,并且根據(jù)手勢開車。
網(wǎng)友@黃斯忑敢開FSD 早在 3 月 26 日就發(fā)布了一條視頻,說他的FSD 的確可以根據(jù)手勢來開車。
更別說,國外一輛特斯拉自行從工廠下線后直接開到用戶的家里。你可以說 FSD 在中國水土不服,但不能否認在智能駕駛這塊特斯拉一直都在玩一些很新的東西,是有兩把刷子的。
到了未來,有 Grok 加持的特斯拉智能座艙,沒有比“如虎添翼”更加合適的形容詞了。就算中國市場沒能第一時間迎來Grok上車,特斯拉還是有可能建立起“科技先鋒”的光環(huán),再吸引一批新的消費者。
哪怕同樣是「自然語言控制智駕」的畫餅階段,特斯拉也有大模型更強、訓(xùn)練量更大、自主性更強,甚至是算力也更加充沛的優(yōu)勢,沒準(zhǔn)真能“彎道超車”“力大磚飛”,先理想一步裝車。
今天你對我愛答不理,明天我讓你高攀不起——理想華為們別一不小心,被特斯拉在智駕這塊偷了家,丟了泉水了。
可能也就在智駕領(lǐng)域“遙遙落后”的蔚來、小米和合資企業(yè)們,能坐得住吧。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.