7月10日,特斯拉首席執行官埃隆·馬斯克宣布推出Grok 4,聲稱是全球最強AI模型,在處理學術問題上的表現,已達到博士級別。
據證券時報,馬斯克表示,Grok 4的訂閱費為30美元/月,更強大的Grok 4 Heavy版本的費用為300美元/月,Grok 3維持免費開放。官方曾表示,Grok 4在自然語言、數學和推理上的性能無與倫比,是用戶的最佳選擇。
據悉,Grok 4將深度整合特斯拉AI超級計算機系統,為全自動駕駛(FSD)及Optimus人形機器人提供核心技術支持。Grok 4或將重點強化邏輯推理與空間模擬能力。
據界面新聞,Grok 4系列包含Grok 4和Grok 4 Heavy兩個版本,均為純推理模型。Grok 4是單代理版本,Grok 4 Heavy是多代理版本,支持四個代理同時工作,上下文窗口最高支持256k tokens。
根據xAI的內部基準測試結果,Grok 4在Humanity’s Last Exam(一個涵蓋數學、科學與語言等多學科、約2500道題目的權威考試)中,通過文本輸入達到了約25%的正確率。這一數字與OpenAI在今年2月公布的Deep Research工具約26%的正確率不相上下。但xAI方面強調,兩者測試方式并非完全相同。
xAI工程師介紹模型訓練情況 (圖片來源:界面新聞)
此次Grok 4的一個看點是新增五種聲音模式,以及反應速度較早期幾乎縮短了一半。為方便開發者使用,Grok?4加入了專門的編程模型Grok?4?Code,能在代碼生成、調試等方面提供更專業的支持。xAI表示,這一變化將明顯提升開發者效率,以應對GPT?4系列和Meta Gemini在編碼領域的競爭。
在xAI的描述中,Grok?4不僅具備“邏輯推理更強、語言理解更準確”的優勢,還首次嘗試加入多模態信息處理,如圖像、視頻的潛力。這使其在社交媒體內容上的應用更具時效性和文化敏感性。
不過,Grok?4的推出伴隨著不小的爭議。直播前夕,舊版本Grok?3曾因傳播不當言論引發外界批評。有聲音認為,xAI若不能在未來幾周內提供更具結構性的模型安全機制,并公布更透明的訓練方式,Grok?4或很難擺脫“高性能之下的高風險”。
對此,馬斯克強調,Grok?4的更新目標是“成為盡可能追求真相的AI”。 他還設想通過該模型與類人機器人結合,在今年年底或明年發現新技術,甚至新物理定律?!斑@讓人既興奮又緊張,我希望自己能活著見證它的誕生?!瘪R斯克說。
公開資料顯示,xAI成立于2023年7月,創始團隊成員除馬斯克外,還有來自谷歌DeepMind、OpenAI、谷歌研究院等機構的11名成員,其中有4名華人。他們曾參與過DeepMind的AlphaCode和OpenAI的GPT 3.5和GPT 4等項目。
圖片來源:視覺中國
今年2月,馬斯克領導的xAI團隊發布Grok 3,該大模型被馬斯克稱為“地球上最聰明的AI”。彼時,Grok-3在發布會上展現出了極其強大的推理能力、邏輯應變能力、理解極度復雜物理知識以及空間模擬能力,當時在數學、科學和編程基準測試中超越了包括Gemini與Claude、GPT-4o在內的所有大模型競品。
據了解,Grok 3的誕生,標志著AI計算能力的全新時代。Grok 3的訓練規??胺Q史無前例,xAI公司動用了20萬塊英偉達GPU,構建了全球最大的超算集群Colossus。
這一訓練過程分為兩個階段:第一階段使用10萬塊GPU,耗時122天;第二階段擴展至20萬塊GPU,耗時92天。如此龐大的算力投入,使得Grok 3的訓練計算量達到前代Grok-2的10倍。
資料顯示,Grok 3的訓練數據集極其龐大,包括了合成數據、公共網絡數據以及專有數據,旨在增強模型的推理能力、解決復雜問題和理解人類語言的深度。馬斯克在直播中強調,Grok 3不僅是性能上的提升,更是一個在設計理念上的突破,它能夠在推理過程中進行“自我反思”,這意味著AI可以識別并糾正錯誤,從而減少“幻覺”(hallucinations)現象。
每日經濟新聞綜合界面新聞、證券時報
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.