文/王新喜
馬斯克的人工智能初創(chuàng)公司xAI發(fā)布了更新版Grok 3大模型,馬斯克稱之為“地球上最聰明的人工智能”。
Grok 3是用20萬塊英偉達(dá)芯片練出來的,運(yùn)算能力是上代10倍。
xAI在當(dāng)天的直播中,馬斯克與該公司的三位工程師一起進(jìn)行了現(xiàn)場演示,Grok 3在數(shù)學(xué)、科學(xué)和編程基準(zhǔn)測試中,Grok 3擊敗了谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o。
據(jù)馬斯克此前介紹,Grok 3是在大量的合成數(shù)據(jù)上訓(xùn)練的。它會反復(fù)檢查數(shù)據(jù),試圖達(dá)到邏輯一致性。如果有錯誤的數(shù)據(jù),它會反思并刪除錯誤數(shù)據(jù)。
從目前測試看,Grok3在AIME'24數(shù)學(xué)能力測試、GPQA科學(xué)知識評估、LCB Oct - Feb編程能力測試等多項測試中成績均高于DeepSeek。擁有“思維鏈”推理機(jī)制,能像人類一樣逐步拆解復(fù)雜任務(wù)。參數(shù)量達(dá)1萬億級別。
Grok3 確實在不少任務(wù)上表現(xiàn)得很棒,例如在處理復(fù)雜邏輯和推理任務(wù)時,它的能力確實有東西。不過Grok3用海量GPU刷了榜單上的分?jǐn)?shù),數(shù)學(xué)、編程分高,其實也沒好多少,沒有拉開差距。而DeepSeek 的優(yōu)勢在于中文理解和多模態(tài)交互方面,它的表現(xiàn)一直很穩(wěn)定,在實際應(yīng)用場景中已經(jīng)得到了不少驗證。
最關(guān)鍵的問題在于,Grok3成本極其高,計算量是前代Grok 2的10倍,有說法是其訓(xùn)練成本就30億美元,根據(jù)相關(guān)工程師透露xAI旗下超算中心算力已經(jīng)翻倍。
去年4月,馬斯克認(rèn)為xAI若想成功打造出最佳AI,唯一途徑是自建數(shù)據(jù)中心。由于想盡快推出Grok 3,時間緊迫,于是決定在四個月內(nèi)建成數(shù)據(jù)中心。最終,團(tuán)隊耗時122天讓第一批10萬個GPU啟動并運(yùn)行,不過要構(gòu)建理想中的AI需將集群規(guī)模翻倍。發(fā)布會上透露,團(tuán)隊僅用92天就已經(jīng)實現(xiàn)了超算集群的算力翻倍,也就是GPU數(shù)量已達(dá)20萬塊。
20萬塊GPU多少錢?以英偉達(dá)H100為例,單卡價格約為2.5萬-3萬美元。20萬塊 × 3萬美元 = 60億美元(僅硬件采購成本)。這還只是GPU硬件成本,實際部署成本更高,還需考慮配套服務(wù)器、網(wǎng)絡(luò)設(shè)備、電力、冷卻設(shè)施等,總成本可能達(dá)百億美元量級,砍一半也高達(dá)50億美金。
Deepseek從訓(xùn)練成本來看僅有600萬美元,遠(yuǎn)低于GPT-4的7800萬美元。后續(xù)deepseek資金、人才、資源上去了,綜合能力肯定不比Grok3差。
Grok 3,印證了DeepSeek真的強(qiáng)
這說明了什么,說明了兩點(diǎn),其一,馬斯克花了那么多錢堆了比OpenAI還多的算力,最后搞出來個跟OpenAI差不多的產(chǎn)品。第二,這證明了DeepSeek真的強(qiáng)啊,馬斯克大把燒美金當(dāng)柴火搞煉丹,效果全靠堆硬件,而且從數(shù)據(jù)來看,和DeepSeek并沒有拉開多少差距,DeepSeek那邊走低成本路線都能差不多打平手,那只能更說明DeepSeek非常強(qiáng)。
因為這是兩條不同的路線,一個是力大拍磚大力出奇跡堅定地砸錢堆算力,一個是創(chuàng)新的工程設(shè)計與高效的訓(xùn)練方法,優(yōu)化節(jié)省資源追求極致性價比,是兩條完全不同的路線。
而堆算力的游戲,是讓AI成為美國人主導(dǎo)算力資源分配的游戲。美國可以通過控制GPU芯片出口,精確調(diào)控全球AI生產(chǎn)力水平。并且把全球獲取AI算力劃分為三個等級圈,由它來控制分配,這讓其他國家陷入絕望。
而且特朗普還投資5000億美元的“星際之門”,目的就是將AI領(lǐng)先牢牢鎖在美國本土,吸引把日韓、中東、歐洲等相關(guān)資金,把除中國外的其他實力國家牢牢綁在老美的AI戰(zhàn)車之上。
而DeepSeek則打破了這種主導(dǎo),給了其他所有國家看到了自主發(fā)展AI的希望,因為它在實現(xiàn)OpenAI模型的同等性能時,僅需要對方5%的算力,以低成本模式直接掀翻了美國一眾科技巨頭,這下所有的國家都覺得自己都能行了。因為,這意味著所有的國家都不需要依賴美國高算力GPU芯片資源了,而且還能把成本極大的降下來。
這是現(xiàn)在到處搞錢的特朗普特別看重的能力,DeepSeek的橫空出世,為啥不光是英偉達(dá)、AMD等企業(yè)很快接入,特朗普也一反常態(tài)的點(diǎn)贊——他們就一個意思:省成本,省社會總成本,可以給整個國家省下老鼻子錢了。
而且在AI 大模型發(fā)展到現(xiàn)在,其實模型能力已經(jīng)很難分出絕對的勝負(fù)了,在大指標(biāo)不斷趨同的背景下,開源才是大招,知名投資人朱嘯虎曾經(jīng)提出一個判斷,開源模型的基礎(chǔ)就是閉源模型的斬殺線,今后閉源模型必須要做到開源基礎(chǔ)的兩到三倍才有活下去的機(jī)會。否則十倍成本砸下去性能只提高20%,那即使是硅谷的投資人也不會接受這樣的結(jié)果。
而真用起來如何,也只有開源的才能比較充分測試。不開源,人家還交錢用,還沒什么特別領(lǐng)先的,商業(yè)模式就很難成立。
加上有Chatgpt和deepseek的巨大成功在前,grok1和grok2差不多無人問津,grok3單純砸錢堆算力實現(xiàn)大火上演反轉(zhuǎn)劇情的幾率并不大。
如果不開源,馬斯克巨大的投入無法變現(xiàn),或會自用到自己的機(jī)器人和 FSD。不過話說回來,目前特斯拉FSD用戶訂閱并不高,但是Grok-3還是能增強(qiáng)FSD的競爭力。
因為Grok 3 基于10萬塊英偉達(dá) H100 芯片訓(xùn)練,每秒可處理超過 1.5 萬億參數(shù),能實時解析車載攝像頭、雷達(dá)等傳感器數(shù)據(jù),比競品在識別暴雨天氣下道路積水深度的準(zhǔn)確率高 37%,可幫助自動駕駛系統(tǒng)更精準(zhǔn)地感知周邊環(huán)境。
此外是Grok 3 引入 “思維鏈” 技術(shù),可模擬人類逐步推理過程,在導(dǎo)航時能綜合分析實時交通數(shù)據(jù)、充電樁可用性和用戶日程推薦路線,在自動駕駛場景中,面對復(fù)雜路況和交通信號時能做出更合理、安全的決策。
如果特斯拉將其用到FSD,這意味著新能源車企的智駕競爭會更加激烈,對此中國的車企要有足夠的認(rèn)知與準(zhǔn)備。
相對于Grok3,deepseek的優(yōu)勢是創(chuàng)新的工程設(shè)計與算法優(yōu)化實現(xiàn)的超低成本、其次是開源模式的生態(tài)與技術(shù)優(yōu)化能力會讓未來包括美國在內(nèi)的很多科研人員只能在東大的AI模型上搞開發(fā)了!東大有望成為世界AI的開發(fā)中心。加上我們舉國之力支持,中國成百上千行業(yè)都在快速接入,促進(jìn)它不斷進(jìn)化,和千行百業(yè)結(jié)合實踐,產(chǎn)生生產(chǎn)力。未來發(fā)展?jié)摿?,可能不是Grok3能比的,我們拭目以待。
作者:王新喜 TMT資深評論人 本文未經(jīng)許可謝絕轉(zhuǎn)載
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.