xAI發(fā)布“全球最強(qiáng)AI模型”
就在今天,馬斯克旗下的xAI 公司終于揭開了新一代大模型Grok 4的神秘面紗。
此次發(fā)布的Grok 4系列包含兩個(gè)版本:Grok 4和Grok 4 Heavy。
xAI官方宣稱,Grok 4是目前“最新、最強(qiáng)大的旗艦?zāi)P汀保踔林苯臃Q其為“全球最強(qiáng)AI模型”。
圖源:X
Grok 4的發(fā)布,標(biāo)志著xAI在人工智能領(lǐng)域的又一次重大突破。
根據(jù)發(fā)布會(huì)介紹,Grok 4在xAI自建的Colossus超級計(jì)算機(jī)上進(jìn)行了訓(xùn)練,這臺(tái)超級計(jì)算機(jī)擁有20萬塊GPU,是全球最大的AI超算之一。
如此龐大的算力投入,使得Grok 4在推理能力上實(shí)現(xiàn)了質(zhì)的飛躍。
馬斯克表示,Grok 4的推理能力相較于前代提升了10倍,訓(xùn)練量更是達(dá)到了Grok 2的100倍。
圖源:發(fā)布會(huì)直播截圖
在性能表現(xiàn)上,Grok 4幾乎刷新了所有主流基準(zhǔn)測試的記錄。在被譽(yù)為“人類最后考試”的HLE(Humanity's Last Exam)基準(zhǔn)測試中,Grok 4在純自主推理的情況下,準(zhǔn)確率達(dá)到了38.6%;
而其進(jìn)階版本Grok 4 Heavy更是借助多智能體協(xié)作,將分?jǐn)?shù)提升至44.4%,遠(yuǎn)超谷歌的Gemini 2.5 Pro(26.9%)和OpenAI的o3模型(20.32%)。
圖源:datalearner
此外,在AIME 2025美國數(shù)學(xué)邀請賽中,Grok 4 Heavy更是取得了滿分的驚人成績,展現(xiàn)了其在數(shù)學(xué)推理領(lǐng)域的卓越能力。
Grok 4的強(qiáng)大不僅體現(xiàn)在推理能力上,它還具備出色的多模態(tài)功能,支持文本、圖像等多種輸入形式,上下文窗口高達(dá)256K tokens,能夠處理更復(fù)雜的交互任務(wù)。
同時(shí),Grok 4還配備了實(shí)時(shí)聯(lián)網(wǎng)搜索功能(DeepSearch),可以從X平臺(tái)提取最新數(shù)據(jù),確保信息的時(shí)效性和準(zhǔn)確性。
這一功能使得Grok 4在理解互聯(lián)網(wǎng)文化、梗圖和俚語方面表現(xiàn)出色,有望成為最“接地氣”的AI助手。
比如,馬斯克在現(xiàn)場演示,讓Gork4在X平臺(tái)找出“xAI員工最古怪的頭像”,Grok4在短時(shí)間內(nèi)很快給出了結(jié)果,從結(jié)果來看它好像真的能完全理解“古怪”的含義并且可以分析搜索出來的結(jié)果。
圖源:發(fā)布會(huì)直播截圖
在語音交互方面,這一次的Grok 4也進(jìn)行了顯著優(yōu)化。其語音模式的延遲率減半,新增了多種音色,包括深沉的“Sal”和優(yōu)美的英倫女聲“Eve”;
能夠更自然地與用戶進(jìn)行對話,甚至即興創(chuàng)作歌劇,展現(xiàn)了極高的情感表達(dá)能力。
此外,在本次發(fā)布會(huì)上,xAI團(tuán)隊(duì)還展示了Grok 4在實(shí)際應(yīng)用場景中的強(qiáng)大能力。
例如,在商業(yè)模擬場景“Vending-Bench”測試中,Grok 4能夠像人類一樣經(jīng)營自動(dòng)售貨機(jī)業(yè)務(wù),完成庫存管理、供應(yīng)商談判、定價(jià)策略等復(fù)雜任務(wù),其平均凈資產(chǎn)達(dá)到了4684.15美元,是第二名Claude 4的兩倍。
圖源:發(fā)布會(huì)直播截圖
在定價(jià)方面,Grok 4采取了分層訂閱策略。
普通版Grok 4需要訂閱SuperGrok服務(wù),月費(fèi)為30美元,而功能更強(qiáng)大的Grok 4 Heavy則需要訂閱SuperGrok Heavy服務(wù),月費(fèi)高達(dá)300美元。
API的定價(jià)為每百萬tokens輸入3美元,輸出15美元。盡管價(jià)格不菲,但xAI表示,Grok 4的性價(jià)比依然具有競爭力。
值得注意的是,在Grok 4發(fā)布會(huì)前夕,xAI的首席科學(xué)家Igor Babuschkin突然宣布辭職,為此次發(fā)布蒙上了一層陰影。
馬斯克在發(fā)布會(huì)上強(qiáng)調(diào),AI的安全性和價(jià)值觀至關(guān)重要,xAI將致力于打造一個(gè)“善良、追求真理”的AI。
他還表示,Grok 4的誕生標(biāo)志著“智能大爆炸”時(shí)代的開啟,未來AI將在科學(xué)發(fā)現(xiàn)、技術(shù)創(chuàng)新等領(lǐng)域發(fā)揮更大的作用。
馬斯克甚至預(yù)言,Grok將在未來一兩年內(nèi)發(fā)現(xiàn)新的物理學(xué)原理,推動(dòng)人類文明邁向新的高度。
馬斯克再次震驚全球
簡單的功能介紹沒辦法展現(xiàn)Grok4給全球科技愛好者帶來的震撼。
下面就讓我們一起通過官方演示來看看Grok4具體表現(xiàn)如何。
首先,前面提到的Gork4在商業(yè)智能領(lǐng)域的能力不再贅述細(xì)節(jié),單憑其超越人類平均水平的商業(yè)管理能力就已足夠展現(xiàn)其出色的戰(zhàn)略規(guī)劃和執(zhí)行能力。
而此次發(fā)布會(huì)的重中之重,是馬斯克為其附上的“學(xué)者”標(biāo)簽。用馬斯克的話來說,“從學(xué)術(shù)角度看,Grok 4 在所有學(xué)科上都是博士水平,甚至比絕大多數(shù)(本學(xué)科的)博士還要強(qiáng)。”
在發(fā)布會(huì)現(xiàn)場,研究人員向Grok 4提出了一個(gè)復(fù)雜的物理學(xué)問題:模擬兩個(gè)黑洞碰撞并產(chǎn)生引力波的過程。
Grok 4不僅迅速理解了問題,還主動(dòng)調(diào)用網(wǎng)絡(luò)搜索、文獻(xiàn)檢索和代碼運(yùn)行等工具,最終生成了一段可以在網(wǎng)頁上直接運(yùn)行的HTML動(dòng)畫代碼。
動(dòng)畫精確地展示了黑洞從相互旋進(jìn)、合并到鈴振階段的完整過程,并使用了后牛頓近似法進(jìn)行計(jì)算,展現(xiàn)了其對復(fù)雜物理概念的深刻理解和可視化能力。
圖源:發(fā)布會(huì)直播
此外,Grok 4還展示了其在預(yù)測分析領(lǐng)域的潛力。
研究人員要求Grok 4預(yù)測2025年美國職業(yè)棒球大聯(lián)盟(MLB)各隊(duì)的奪冠賠率。
Grok 4不僅瀏覽了Polymarket平臺(tái)上的賠率數(shù)據(jù),還結(jié)合了FanGraphs的統(tǒng)計(jì)數(shù)據(jù),計(jì)算出洛杉磯道奇隊(duì)的奪冠概率為21.6%,并指出了市場賠率與實(shí)際概率之間的差異,成功找到了投注的“Alpha”和“Edge”。
這一表現(xiàn)讓現(xiàn)場觀眾驚呼不已,也讓人們對AI在金融投資領(lǐng)域的應(yīng)用前景充滿期待。
圖源:發(fā)布會(huì)直播截圖
然而,Grok 4的驚艷表現(xiàn)背后,也隱藏著不小的爭議與挑戰(zhàn)。
首先,Grok系列模型一直以其“言論自由”和寬松審查的策略著稱,但這也導(dǎo)致了其舊版本在近期頻繁輸出種族主義、反猶主義等極端言論,引發(fā)了巨大的輿論風(fēng)波。
在發(fā)布會(huì)前夕,Grok甚至被土耳其政府封禁,原因是其侮辱了總統(tǒng)埃爾多安;波蘭政府也向歐盟舉報(bào)了xAI,認(rèn)為其模型存在仇恨言論問題。
面對爭議,馬斯克在發(fā)布會(huì)上表示,xAI已經(jīng)對Grok的系統(tǒng)提示詞進(jìn)行了調(diào)整,刪除了此前鼓勵(lì)“政治不正確表述”的內(nèi)容,并加強(qiáng)了對仇恨言論的過濾。
然而,他也強(qiáng)調(diào),Grok依然會(huì)保持其“追求真理”的核心價(jià)值觀,不會(huì)因?yàn)橥饨鐗毫Χ艞墝φ嫦嗟奶剿鳌?/p>
xAI的野心徹底暴露
在發(fā)布會(huì)的尾聲,馬斯克和他的團(tuán)隊(duì)毫不掩飾地公布了接下來幾個(gè)月的密集產(chǎn)品路線圖:
8月,專為開發(fā)者打造的Grok 4 Code將正式上線,旨在挑戰(zhàn)GitHub Copilot和GPT-4 Code Interpreter在編程領(lǐng)域的霸主地位;
9月,多模態(tài)智能體(Multimodal Agent)將登場,進(jìn)一步拓展AI在復(fù)雜現(xiàn)實(shí)任務(wù)中的邊界;
10月,xAI還將推出視頻生成模型,直接對標(biāo)OpenAI的Sora和Runway等前沿產(chǎn)品。
這一連串的動(dòng)作表明,xAI正試圖構(gòu)建一個(gè)覆蓋文本、圖像、視頻、代碼和智能體的全方位AI生態(tài)系統(tǒng),野心之大,可見一斑。
馬斯克在發(fā)布會(huì)上反復(fù)強(qiáng)調(diào),現(xiàn)實(shí)才是AI最終的推理測試,而xAI的目標(biāo),就是打造能夠與現(xiàn)實(shí)世界深度互動(dòng)的AI。
這種對AGI(通用人工智能)的激進(jìn)追求,與OpenAI、Anthropic等競爭對手形成了鮮明對比。
后者在模型發(fā)布和迭代上顯得更為謹(jǐn)慎,更注重安全性和可控性,而xAI則選擇了“快速推進(jìn)、邊做邊調(diào)”的策略,試圖以速度和規(guī)模搶占先機(jī)。
放眼整個(gè)AI戰(zhàn)場,競爭已趨白熱化。
OpenAI正緊鑼密鼓地籌備GPT-5的發(fā)布,試圖再次定義行業(yè)標(biāo)桿;
谷歌的Gemini系列也在不斷進(jìn)化,憑借其在搜索和云計(jì)算領(lǐng)域的深厚積累,試圖將AI能力滲透到每一個(gè)角落;
Anthropic的Claude系列則以安全性和可控性著稱,贏得了不少企業(yè)用戶的青睞。
與此同時(shí),Meta也在大手筆組建頂級AI實(shí)驗(yàn)室,近期在OpenAI、特斯拉等多個(gè)企業(yè)內(nèi)部挖人,試圖迎頭趕上。
在這樣的背景下,Grok 4的發(fā)布,不僅是xAI的獨(dú)角戲,更是新一輪AI軍備競賽的沖鋒號。
馬斯克能否憑借Grok 4在這場混戰(zhàn)中脫穎而出,將決定xAI能否在巨頭環(huán)伺的AI版圖中占據(jù)一席之地。
作者 | 劉峰
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.