網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

馬斯克打出王炸，史上最強(qiáng)大模型Grok 4來了

2025-07-11 14:35:12　來源: 科技頭版Pro

廣東舉報(bào)

分享至

xAI發(fā)布“全球最強(qiáng)AI模型”

就在今天，馬斯克旗下的xAI 公司終于揭開了新一代大模型Grok 4的神秘面紗。

此次發(fā)布的Grok 4系列包含兩個(gè)版本：Grok 4和Grok 4 Heavy。

xAI官方宣稱，Grok 4是目前“最新、最強(qiáng)大的旗艦?zāi)Ｐ汀保踔林苯臃Q其為“全球最強(qiáng)AI模型”。

圖源：X

Grok 4的發(fā)布，標(biāo)志著xAI在人工智能領(lǐng)域的又一次重大突破。

根據(jù)發(fā)布會(huì)介紹，Grok 4在xAI自建的Colossus超級計(jì)算機(jī)上進(jìn)行了訓(xùn)練，這臺(tái)超級計(jì)算機(jī)擁有20萬塊GPU，是全球最大的AI超算之一。

如此龐大的算力投入，使得Grok 4在推理能力上實(shí)現(xiàn)了質(zhì)的飛躍。

馬斯克表示，Grok 4的推理能力相較于前代提升了10倍，訓(xùn)練量更是達(dá)到了Grok 2的100倍。

圖源：發(fā)布會(huì)直播截圖

在性能表現(xiàn)上，Grok 4幾乎刷新了所有主流基準(zhǔn)測試的記錄。在被譽(yù)為“人類最后考試”的HLE（Humanity's Last Exam）基準(zhǔn)測試中，Grok 4在純自主推理的情況下，準(zhǔn)確率達(dá)到了38.6%；

而其進(jìn)階版本Grok 4 Heavy更是借助多智能體協(xié)作，將分?jǐn)?shù)提升至44.4%，遠(yuǎn)超谷歌的Gemini 2.5 Pro（26.9%）和OpenAI的o3模型（20.32%）。

圖源：datalearner

此外，在AIME 2025美國數(shù)學(xué)邀請賽中，Grok 4 Heavy更是取得了滿分的驚人成績，展現(xiàn)了其在數(shù)學(xué)推理領(lǐng)域的卓越能力。

Grok 4的強(qiáng)大不僅體現(xiàn)在推理能力上，它還具備出色的多模態(tài)功能，支持文本、圖像等多種輸入形式，上下文窗口高達(dá)256K tokens，能夠處理更復(fù)雜的交互任務(wù)。

同時(shí)，Grok 4還配備了實(shí)時(shí)聯(lián)網(wǎng)搜索功能（DeepSearch），可以從X平臺(tái)提取最新數(shù)據(jù)，確保信息的時(shí)效性和準(zhǔn)確性。

這一功能使得Grok 4在理解互聯(lián)網(wǎng)文化、梗圖和俚語方面表現(xiàn)出色，有望成為最“接地氣”的AI助手。

比如，馬斯克在現(xiàn)場演示，讓Gork4在X平臺(tái)找出“xAI員工最古怪的頭像”，Grok4在短時(shí)間內(nèi)很快給出了結(jié)果，從結(jié)果來看它好像真的能完全理解“古怪”的含義并且可以分析搜索出來的結(jié)果。

圖源：發(fā)布會(huì)直播截圖

在語音交互方面，這一次的Grok 4也進(jìn)行了顯著優(yōu)化。其語音模式的延遲率減半，新增了多種音色，包括深沉的“Sal”和優(yōu)美的英倫女聲“Eve”；

能夠更自然地與用戶進(jìn)行對話，甚至即興創(chuàng)作歌劇，展現(xiàn)了極高的情感表達(dá)能力。

此外，在本次發(fā)布會(huì)上，xAI團(tuán)隊(duì)還展示了Grok 4在實(shí)際應(yīng)用場景中的強(qiáng)大能力。

例如，在商業(yè)模擬場景“Vending-Bench”測試中，Grok 4能夠像人類一樣經(jīng)營自動(dòng)售貨機(jī)業(yè)務(wù)，完成庫存管理、供應(yīng)商談判、定價(jià)策略等復(fù)雜任務(wù)，其平均凈資產(chǎn)達(dá)到了4684.15美元，是第二名Claude 4的兩倍。

圖源：發(fā)布會(huì)直播截圖

在定價(jià)方面，Grok 4采取了分層訂閱策略。

普通版Grok 4需要訂閱SuperGrok服務(wù)，月費(fèi)為30美元，而功能更強(qiáng)大的Grok 4 Heavy則需要訂閱SuperGrok Heavy服務(wù)，月費(fèi)高達(dá)300美元。

API的定價(jià)為每百萬tokens輸入3美元，輸出15美元。盡管價(jià)格不菲，但xAI表示，Grok 4的性價(jià)比依然具有競爭力。

值得注意的是，在Grok 4發(fā)布會(huì)前夕，xAI的首席科學(xué)家Igor Babuschkin突然宣布辭職，為此次發(fā)布蒙上了一層陰影。

馬斯克在發(fā)布會(huì)上強(qiáng)調(diào)，AI的安全性和價(jià)值觀至關(guān)重要，xAI將致力于打造一個(gè)“善良、追求真理”的AI。

他還表示，Grok 4的誕生標(biāo)志著“智能大爆炸”時(shí)代的開啟，未來AI將在科學(xué)發(fā)現(xiàn)、技術(shù)創(chuàng)新等領(lǐng)域發(fā)揮更大的作用。

馬斯克甚至預(yù)言，Grok將在未來一兩年內(nèi)發(fā)現(xiàn)新的物理學(xué)原理，推動(dòng)人類文明邁向新的高度。

馬斯克再次震驚全球

簡單的功能介紹沒辦法展現(xiàn)Grok4給全球科技愛好者帶來的震撼。

下面就讓我們一起通過官方演示來看看Grok4具體表現(xiàn)如何。

首先，前面提到的Gork4在商業(yè)智能領(lǐng)域的能力不再贅述細(xì)節(jié)，單憑其超越人類平均水平的商業(yè)管理能力就已足夠展現(xiàn)其出色的戰(zhàn)略規(guī)劃和執(zhí)行能力。

而此次發(fā)布會(huì)的重中之重，是馬斯克為其附上的“學(xué)者”標(biāo)簽。用馬斯克的話來說，“從學(xué)術(shù)角度看，Grok 4 在所有學(xué)科上都是博士水平，甚至比絕大多數(shù)（本學(xué)科的）博士還要強(qiáng)。”

在發(fā)布會(huì)現(xiàn)場，研究人員向Grok 4提出了一個(gè)復(fù)雜的物理學(xué)問題：模擬兩個(gè)黑洞碰撞并產(chǎn)生引力波的過程。

Grok 4不僅迅速理解了問題，還主動(dòng)調(diào)用網(wǎng)絡(luò)搜索、文獻(xiàn)檢索和代碼運(yùn)行等工具，最終生成了一段可以在網(wǎng)頁上直接運(yùn)行的HTML動(dòng)畫代碼。

動(dòng)畫精確地展示了黑洞從相互旋進(jìn)、合并到鈴振階段的完整過程，并使用了后牛頓近似法進(jìn)行計(jì)算，展現(xiàn)了其對復(fù)雜物理概念的深刻理解和可視化能力。

圖源：發(fā)布會(huì)直播

此外，Grok 4還展示了其在預(yù)測分析領(lǐng)域的潛力。

研究人員要求Grok 4預(yù)測2025年美國職業(yè)棒球大聯(lián)盟（MLB）各隊(duì)的奪冠賠率。

Grok 4不僅瀏覽了Polymarket平臺(tái)上的賠率數(shù)據(jù)，還結(jié)合了FanGraphs的統(tǒng)計(jì)數(shù)據(jù)，計(jì)算出洛杉磯道奇隊(duì)的奪冠概率為21.6%，并指出了市場賠率與實(shí)際概率之間的差異，成功找到了投注的“Alpha”和“Edge”。

這一表現(xiàn)讓現(xiàn)場觀眾驚呼不已，也讓人們對AI在金融投資領(lǐng)域的應(yīng)用前景充滿期待。

圖源：發(fā)布會(huì)直播截圖

然而，Grok 4的驚艷表現(xiàn)背后，也隱藏著不小的爭議與挑戰(zhàn)。

首先，Grok系列模型一直以其“言論自由”和寬松審查的策略著稱，但這也導(dǎo)致了其舊版本在近期頻繁輸出種族主義、反猶主義等極端言論，引發(fā)了巨大的輿論風(fēng)波。

在發(fā)布會(huì)前夕，Grok甚至被土耳其政府封禁，原因是其侮辱了總統(tǒng)埃爾多安；波蘭政府也向歐盟舉報(bào)了xAI，認(rèn)為其模型存在仇恨言論問題。

面對爭議，馬斯克在發(fā)布會(huì)上表示，xAI已經(jīng)對Grok的系統(tǒng)提示詞進(jìn)行了調(diào)整，刪除了此前鼓勵(lì)“政治不正確表述”的內(nèi)容，并加強(qiáng)了對仇恨言論的過濾。

然而，他也強(qiáng)調(diào)，Grok依然會(huì)保持其“追求真理”的核心價(jià)值觀，不會(huì)因?yàn)橥饨鐗毫Χ艞墝φ嫦嗟奶剿鳌?/p>

xAI的野心徹底暴露

在發(fā)布會(huì)的尾聲，馬斯克和他的團(tuán)隊(duì)毫不掩飾地公布了接下來幾個(gè)月的密集產(chǎn)品路線圖：

8月，專為開發(fā)者打造的Grok 4 Code將正式上線，旨在挑戰(zhàn)GitHub Copilot和GPT-4 Code Interpreter在編程領(lǐng)域的霸主地位；

9月，多模態(tài)智能體（Multimodal Agent）將登場，進(jìn)一步拓展AI在復(fù)雜現(xiàn)實(shí)任務(wù)中的邊界；

10月，xAI還將推出視頻生成模型，直接對標(biāo)OpenAI的Sora和Runway等前沿產(chǎn)品。

這一連串的動(dòng)作表明，xAI正試圖構(gòu)建一個(gè)覆蓋文本、圖像、視頻、代碼和智能體的全方位AI生態(tài)系統(tǒng)，野心之大，可見一斑。

馬斯克在發(fā)布會(huì)上反復(fù)強(qiáng)調(diào)，現(xiàn)實(shí)才是AI最終的推理測試，而xAI的目標(biāo)，就是打造能夠與現(xiàn)實(shí)世界深度互動(dòng)的AI。

這種對AGI（通用人工智能）的激進(jìn)追求，與OpenAI、Anthropic等競爭對手形成了鮮明對比。

后者在模型發(fā)布和迭代上顯得更為謹(jǐn)慎，更注重安全性和可控性，而xAI則選擇了“快速推進(jìn)、邊做邊調(diào)”的策略，試圖以速度和規(guī)模搶占先機(jī)。

放眼整個(gè)AI戰(zhàn)場，競爭已趨白熱化。

OpenAI正緊鑼密鼓地籌備GPT-5的發(fā)布，試圖再次定義行業(yè)標(biāo)桿；

谷歌的Gemini系列也在不斷進(jìn)化，憑借其在搜索和云計(jì)算領(lǐng)域的深厚積累，試圖將AI能力滲透到每一個(gè)角落；

Anthropic的Claude系列則以安全性和可控性著稱，贏得了不少企業(yè)用戶的青睞。

與此同時(shí)，Meta也在大手筆組建頂級AI實(shí)驗(yàn)室，近期在OpenAI、特斯拉等多個(gè)企業(yè)內(nèi)部挖人，試圖迎頭趕上。

在這樣的背景下，Grok 4的發(fā)布，不僅是xAI的獨(dú)角戲，更是新一輪AI軍備競賽的沖鋒號。

馬斯克能否憑借Grok 4在這場混戰(zhàn)中脫穎而出，將決定xAI能否在巨頭環(huán)伺的AI版圖中占據(jù)一席之地。

作者 | 劉峰

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.