大數據文摘出品
7月9日晚間, Elon Musk正式發布他迄今為止最強的人工智能模型:Grok 4。
這款模型由他領導的xAI團隊打造,被Musk本人形容為“大爆炸級別的智能進化”。
在推特上,官方賬號稱:Grok 4是“地表最強”(世界上最強大)的AI模型。顯然,這不是簡單升級,而是一次全方位能力的躍遷。
據悉,Grok 4具備自然語音對話功能,能像人類一樣順暢表達,打破以往AI對話割裂感。
它不僅能處理文本,還可支持圖像輸入,未來甚至可能加入視頻識別功能,大步邁入真正的多模態AI時代。
開發者還將獲得“Grok 4 Code”專屬版本,用于寫代碼、調試和解釋邏輯,直逼GitHub Copilot與GPT-4的水平。
據說,Grok 4不只是聰明,它甚至“會唱歌”,聲音自然,還能理解互聯網語言、俚語和段子,成為最懂網絡文化的AI之一。
目前,對于Gork-4,在官網付費用戶已經可以使用。
Grok 4的發布并非“情緒宣傳”,而是有硬核數據為背書。根據Artificial Analysis的完整基準測試,Grok 4以AI指數73分,首次登頂全球第一。
這一分數直接擊敗了OpenAI的O3(70分)、Google的Gemini 2.5 Pro(70分)和Anthropic的Claude 4 Opus(64分)。
更關鍵的是,Grok 4在數學、編碼和綜合推理測試中全面碾壓,成為“人類最后的考試”上表現最強的AI。
在LiveCodeBench和SciCode測試中,Grok 4取得編碼準確率88%,創造歷史最高紀錄。
圖片來源:https://x.com/apples_jimmy/status/1943167164359545137/photo/1
在GPQA Diamond測試中也拿下88%的高分,超過此前由Gemini 2.5 Pro保持的84%記錄。
“人類最后的考試”中,Grok 4 heavy版獲得50.7%的突破性成績,是目前唯一觸及這一高度的模型。
在AIME 2024和MMLU-Pro這兩項權威測試中,分別斬獲94%和87%的驚人得分。
據推特網友,對于這個模型的能力,Elon Musk說:“Grok 4可能在所有領域達到博士水平的模型。”
也有技術觀察者提醒:“那場考試的名字叫‘人類最后的考試’,但很可能不是AI的極限,而是人類理解力的終點。”
此外,雖然它的輸出速度(75 tokens/s)低于O3(188 tokens/s)和Gemini 2.5 Pro(142 tokens/s),但依舊優于Claude 4 Opus(66 tokens/s),性能穩居一線。
同時,Grok 4支持長達256k token的上下文處理,允許進行復雜文檔分析與記憶性任務處理。
它還能調用函數、生成結構化結果,整體架構更適合應用于科研、商業、教育等高負載任務場景。
定價方面仍與Grok 3持平:每百萬輸入token收取3美元,輸出為15美元,緩存輸入更低至0.75美元。
作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!
GPU 訓練特惠!
H100/H200 GPU算力按秒計費,平均節省開支30%以上!
掃碼了解詳情?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.