來源:大數據文摘
7月9日晚間, Elon Musk正式發布他迄今為止最強的人工智能模型:Grok 4。
這款模型由他領導的xAI團隊打造,被Musk本人形容為“大爆炸級別的智能進化”。
在推特上,官方賬號稱:Grok 4是“地表最強”(世界上最強大)的AI模型。顯然,這不是簡單升級,而是一次全方位能力的躍遷。
據悉,Grok 4具備自然語音對話功能,能像人類一樣順暢表達,打破以往AI對話割裂感。
它不僅能處理文本,還可支持圖像輸入,未來甚至可能加入視頻識別功能,大步邁入真正的多模態AI時代。
開發者還將獲得“Grok 4 Code”專屬版本,用于寫代碼、調試和解釋邏輯,直逼GitHub Copilot與GPT-4的水平。
據說,Grok 4不只是聰明,它甚至“會唱歌”,聲音自然,還能理解互聯網語言、俚語和段子,成為最懂網絡文化的AI之一。
目前,對于Gork-4,在官網付費用戶已經可以使用。
Grok 4的發布并非“情緒宣傳”,而是有硬核數據為背書。根據Artificial Analysis的完整基準測試,Grok 4以AI指數73分,首次登頂全球第一。
這一分數直接擊敗了OpenAI的O3(70分)、Google的Gemini 2.5 Pro(70分)和Anthropic的Claude 4 Opus(64分)。
更關鍵的是,Grok 4在數學、編碼和綜合推理測試中全面碾壓,成為“人類最后的考試”上表現最強的AI。
在LiveCodeBench和SciCode測試中,Grok 4取得編碼準確率88%,創造歷史最高紀錄。
圖片來源:
https://x.com/apples_jimmy/status/1943167164359545137/photo/1
在GPQA Diamond測試中也拿下88%的高分,超過此前由Gemini 2.5 Pro保持的84%記錄。
“人類最后的考試”中,Grok 4 heavy版獲得50.7%的突破性成績,是目前唯一觸及這一高度的模型。
在AIME 2024和MMLU-Pro這兩項權威測試中,分別斬獲94%和87%的驚人得分。
據推特網友,對于這個模型的能力,Elon Musk說:“Grok 4可能在所有領域達到博士水平的模型。”
也有技術觀察者提醒:“那場考試的名字叫‘人類最后的考試’,但很可能不是AI的極限,而是人類理解力的終點。”
此外,雖然它的輸出速度(75 tokens/s)低于O3(188 tokens/s)和Gemini 2.5 Pro(142 tokens/s),但依舊優于Claude 4 Opus(66 tokens/s),性能穩居一線。
同時,Grok 4支持長達256k token的上下文處理,允許進行復雜文檔分析與記憶性任務處理。
它還能調用函數、生成結構化結果,整體架構更適合應用于科研、商業、教育等高負載任務場景。
定價方面仍與Grok 3持平:每百萬輸入token收取3美元,輸出為15美元,緩存輸入更低至0.75美元。
閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”
https://wx.zsxq.com/group/454854145828
未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到3月31日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.