馬斯克用20萬塊英偉達(dá)芯片練出Grok 3，印證了DeepSeek真的強(qiáng)

2025-02-26 16:33:08　來源: 王新喜

廣東舉報

分享至

文/王新喜

馬斯克的人工智能初創(chuàng)公司xAI發(fā)布了更新版Grok 3大模型，馬斯克稱之為“地球上最聰明的人工智能”。

Grok 3是用20萬塊英偉達(dá)芯片練出來的，運(yùn)算能力是上代10倍。

xAI在當(dāng)天的直播中，馬斯克與該公司的三位工程師一起進(jìn)行了現(xiàn)場演示，Grok 3在數(shù)學(xué)、科學(xué)和編程基準(zhǔn)測試中，Grok 3擊敗了谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o。

據(jù)馬斯克此前介紹，Grok 3是在大量的合成數(shù)據(jù)上訓(xùn)練的。它會反復(fù)檢查數(shù)據(jù)，試圖達(dá)到邏輯一致性。如果有錯誤的數(shù)據(jù)，它會反思并刪除錯誤數(shù)據(jù)。

從目前測試看，Grok3在AIME'24數(shù)學(xué)能力測試、GPQA科學(xué)知識評估、LCB Oct - Feb編程能力測試等多項測試中成績均高于DeepSeek。擁有“思維鏈”推理機(jī)制，能像人類一樣逐步拆解復(fù)雜任務(wù)。參數(shù)量達(dá)1萬億級別。

Grok3 確實在不少任務(wù)上表現(xiàn)得很棒，例如在處理復(fù)雜邏輯和推理任務(wù)時，它的能力確實有東西。不過Grok3用海量GPU刷了榜單上的分?jǐn)?shù)，數(shù)學(xué)、編程分高，其實也沒好多少，沒有拉開差距。而DeepSeek 的優(yōu)勢在于中文理解和多模態(tài)交互方面，它的表現(xiàn)一直很穩(wěn)定，在實際應(yīng)用場景中已經(jīng)得到了不少驗證。

最關(guān)鍵的問題在于，Grok3成本極其高，計算量是前代Grok 2的10倍，有說法是其訓(xùn)練成本就30億美元，根據(jù)相關(guān)工程師透露xAI旗下超算中心算力已經(jīng)翻倍。

去年4月，馬斯克認(rèn)為xAI若想成功打造出最佳AI，唯一途徑是自建數(shù)據(jù)中心。由于想盡快推出Grok 3，時間緊迫，于是決定在四個月內(nèi)建成數(shù)據(jù)中心。最終，團(tuán)隊耗時122天讓第一批10萬個GPU啟動并運(yùn)行，不過要構(gòu)建理想中的AI需將集群規(guī)模翻倍。發(fā)布會上透露，團(tuán)隊僅用92天就已經(jīng)實現(xiàn)了超算集群的算力翻倍，也就是GPU數(shù)量已達(dá)20萬塊。

20萬塊GPU多少錢？以英偉達(dá)H100為例，單卡價格約為2.5萬-3萬美元。20萬塊 × 3萬美元 = 60億美元（僅硬件采購成本）。這還只是GPU硬件成本，實際部署成本更高，還需考慮配套服務(wù)器、網(wǎng)絡(luò)設(shè)備、電力、冷卻設(shè)施等，總成本可能達(dá)百億美元量級，砍一半也高達(dá)50億美金。

Deepseek從訓(xùn)練成本來看僅有600萬美元，遠(yuǎn)低于GPT-4的7800萬美元。后續(xù)deepseek資金、人才、資源上去了，綜合能力肯定不比Grok3差。

Grok 3，印證了DeepSeek真的強(qiáng)

這說明了什么，說明了兩點(diǎn)，其一，馬斯克花了那么多錢堆了比OpenAI還多的算力，最后搞出來個跟OpenAI差不多的產(chǎn)品。第二，這證明了DeepSeek真的強(qiáng)啊，馬斯克大把燒美金當(dāng)柴火搞煉丹，效果全靠堆硬件，而且從數(shù)據(jù)來看，和DeepSeek并沒有拉開多少差距，DeepSeek那邊走低成本路線都能差不多打平手，那只能更說明DeepSeek非常強(qiáng)。

因為這是兩條不同的路線，一個是力大拍磚大力出奇跡堅定地砸錢堆算力，一個是創(chuàng)新的工程設(shè)計與高效的訓(xùn)練方法，優(yōu)化節(jié)省資源追求極致性價比，是兩條完全不同的路線。

而堆算力的游戲，是讓AI成為美國人主導(dǎo)算力資源分配的游戲。美國可以通過控制GPU芯片出口，精確調(diào)控全球AI生產(chǎn)力水平。并且把全球獲取AI算力劃分為三個等級圈，由它來控制分配，這讓其他國家陷入絕望。

而且特朗普還投資5000億美元的“星際之門”，目的就是將AI領(lǐng)先牢牢鎖在美國本土，吸引把日韓、中東、歐洲等相關(guān)資金，把除中國外的其他實力國家牢牢綁在老美的AI戰(zhàn)車之上。

而DeepSeek則打破了這種主導(dǎo)，給了其他所有國家看到了自主發(fā)展AI的希望，因為它在實現(xiàn)OpenAI模型的同等性能時，僅需要對方5%的算力，以低成本模式直接掀翻了美國一眾科技巨頭，這下所有的國家都覺得自己都能行了。因為，這意味著所有的國家都不需要依賴美國高算力GPU芯片資源了，而且還能把成本極大的降下來。

這是現(xiàn)在到處搞錢的特朗普特別看重的能力，DeepSeek的橫空出世，為啥不光是英偉達(dá)、AMD等企業(yè)很快接入，特朗普也一反常態(tài)的點(diǎn)贊——他們就一個意思：省成本，省社會總成本，可以給整個國家省下老鼻子錢了。

而且在AI 大模型發(fā)展到現(xiàn)在，其實模型能力已經(jīng)很難分出絕對的勝負(fù)了，在大指標(biāo)不斷趨同的背景下，開源才是大招，知名投資人朱嘯虎曾經(jīng)提出一個判斷，開源模型的基礎(chǔ)就是閉源模型的斬殺線，今后閉源模型必須要做到開源基礎(chǔ)的兩到三倍才有活下去的機(jī)會。否則十倍成本砸下去性能只提高20%，那即使是硅谷的投資人也不會接受這樣的結(jié)果。

而真用起來如何，也只有開源的才能比較充分測試。不開源，人家還交錢用，還沒什么特別領(lǐng)先的，商業(yè)模式就很難成立。

加上有Chatgpt和deepseek的巨大成功在前，grok1和grok2差不多無人問津，grok3單純砸錢堆算力實現(xiàn)大火上演反轉(zhuǎn)劇情的幾率并不大。

如果不開源，馬斯克巨大的投入無法變現(xiàn)，或會自用到自己的機(jī)器人和 FSD。不過話說回來，目前特斯拉FSD用戶訂閱并不高，但是Grok-3還是能增強(qiáng)FSD的競爭力。

因為Grok 3 基于10萬塊英偉達(dá) H100 芯片訓(xùn)練，每秒可處理超過 1.5 萬億參數(shù)，能實時解析車載攝像頭、雷達(dá)等傳感器數(shù)據(jù)，比競品在識別暴雨天氣下道路積水深度的準(zhǔn)確率高 37%，可幫助自動駕駛系統(tǒng)更精準(zhǔn)地感知周邊環(huán)境。

此外是Grok 3 引入 “思維鏈” 技術(shù)，可模擬人類逐步推理過程，在導(dǎo)航時能綜合分析實時交通數(shù)據(jù)、充電樁可用性和用戶日程推薦路線，在自動駕駛場景中，面對復(fù)雜路況和交通信號時能做出更合理、安全的決策。

如果特斯拉將其用到FSD，這意味著新能源車企的智駕競爭會更加激烈，對此中國的車企要有足夠的認(rèn)知與準(zhǔn)備。

相對于Grok3，deepseek的優(yōu)勢是創(chuàng)新的工程設(shè)計與算法優(yōu)化實現(xiàn)的超低成本、其次是開源模式的生態(tài)與技術(shù)優(yōu)化能力會讓未來包括美國在內(nèi)的很多科研人員只能在東大的AI模型上搞開發(fā)了！東大有望成為世界AI的開發(fā)中心。加上我們舉國之力支持，中國成百上千行業(yè)都在快速接入，促進(jìn)它不斷進(jìn)化，和千行百業(yè)結(jié)合實踐，產(chǎn)生生產(chǎn)力。未來發(fā)展?jié)摿?，可能不是Grok3能比的，我們拭目以待。

作者：王新喜 TMT資深評論人本文未經(jīng)許可謝絕轉(zhuǎn)載

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.