網易首頁 > 網易號 > 正文申請入駐

大消息！馬斯克宣布推出Grok 4，聲稱是全球最強AI模型，在處理這類問題上的表現已達到博士級別

2025-07-10 15:49:06　來源: 每日經濟新聞

四川舉報

分享至

7月10日，特斯拉首席執行官埃隆·馬斯克宣布推出Grok 4，聲稱是全球最強AI模型，在處理學術問題上的表現，已達到博士級別。

據證券時報，馬斯克表示，Grok 4的訂閱費為30美元/月，更強大的Grok 4 Heavy版本的費用為300美元/月，Grok 3維持免費開放。官方曾表示，Grok 4在自然語言、數學和推理上的性能無與倫比，是用戶的最佳選擇。

據悉，Grok 4將深度整合特斯拉AI超級計算機系統，為全自動駕駛（FSD）及Optimus人形機器人提供核心技術支持。Grok 4或將重點強化邏輯推理與空間模擬能力。

據界面新聞，Grok 4系列包含Grok 4和Grok 4 Heavy兩個版本，均為純推理模型。Grok 4是單代理版本，Grok 4 Heavy是多代理版本，支持四個代理同時工作，上下文窗口最高支持256k tokens。

根據xAI的內部基準測試結果，Grok 4在Humanity’s Last Exam（一個涵蓋數學、科學與語言等多學科、約2500道題目的權威考試）中，通過文本輸入達到了約25%的正確率。這一數字與OpenAI在今年2月公布的Deep Research工具約26%的正確率不相上下。但xAI方面強調，兩者測試方式并非完全相同。

xAI工程師介紹模型訓練情況（圖片來源：界面新聞）

此次Grok 4的一個看點是新增五種聲音模式，以及反應速度較早期幾乎縮短了一半。為方便開發者使用，Grok?4加入了專門的編程模型Grok?4?Code，能在代碼生成、調試等方面提供更專業的支持。xAI表示，這一變化將明顯提升開發者效率，以應對GPT?4系列和Meta Gemini在編碼領域的競爭。

在xAI的描述中，Grok?4不僅具備“邏輯推理更強、語言理解更準確”的優勢，還首次嘗試加入多模態信息處理，如圖像、視頻的潛力。這使其在社交媒體內容上的應用更具時效性和文化敏感性。

不過，Grok?4的推出伴隨著不小的爭議。直播前夕，舊版本Grok?3曾因傳播不當言論引發外界批評。有聲音認為，xAI若不能在未來幾周內提供更具結構性的模型安全機制，并公布更透明的訓練方式，Grok?4或很難擺脫“高性能之下的高風險”。

對此，馬斯克強調，Grok?4的更新目標是“成為盡可能追求真相的AI”。他還設想通過該模型與類人機器人結合，在今年年底或明年發現新技術，甚至新物理定律?！斑@讓人既興奮又緊張，我希望自己能活著見證它的誕生?！瘪R斯克說。

公開資料顯示，xAI成立于2023年7月，創始團隊成員除馬斯克外，還有來自谷歌DeepMind、OpenAI、谷歌研究院等機構的11名成員，其中有4名華人。他們曾參與過DeepMind的AlphaCode和OpenAI的GPT 3.5和GPT 4等項目。

圖片來源：視覺中國

今年2月，馬斯克領導的xAI團隊發布Grok 3，該大模型被馬斯克稱為“地球上最聰明的AI”。彼時，Grok-3在發布會上展現出了極其強大的推理能力、邏輯應變能力、理解極度復雜物理知識以及空間模擬能力，當時在數學、科學和編程基準測試中超越了包括Gemini與Claude、GPT-4o在內的所有大模型競品。

據了解，Grok 3的誕生，標志著AI計算能力的全新時代。Grok 3的訓練規?？胺Q史無前例，xAI公司動用了20萬塊英偉達GPU，構建了全球最大的超算集群Colossus。

這一訓練過程分為兩個階段：第一階段使用10萬塊GPU，耗時122天；第二階段擴展至20萬塊GPU，耗時92天。如此龐大的算力投入，使得Grok 3的訓練計算量達到前代Grok-2的10倍。

資料顯示，Grok 3的訓練數據集極其龐大，包括了合成數據、公共網絡數據以及專有數據，旨在增強模型的推理能力、解決復雜問題和理解人類語言的深度。馬斯克在直播中強調，Grok 3不僅是性能上的提升，更是一個在設計理念上的突破，它能夠在推理過程中進行“自我反思”，這意味著AI可以識別并糾正錯誤，從而減少“幻覺”（hallucinations）現象。

每日經濟新聞綜合界面新聞、證券時報

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.