馬斯克今日發帖,宣布xAI新一代Grok 4大模型將于太平洋時間周三晚8點,即北京時間周四上午11點發布,屆時將在X上進行直播。
未證實的照片顯示,xAI辦公室的各個角落此前搭起數十頂帳篷,團隊成員們在這些臨時搭建的“工作艙”中夜以繼日地推進項目進展。
據悉,Grok 4 和 Grok 4 Code 的基準測試結果疑似已經泄露。
X上知名博主legit_api的帖子顯示,Grok 4 在 HLE(Humanities Last Exam,人類最后考試)上的標準得分是 35%,使用推理技術后提高到 45%。
有網友將其與 OpenAI o3 和 Claude Opus 4 等競爭模型進行了對比。
Grok 4 在 HLE 上的標準得分約為 35%,使用推理技術后提升至 45%,最強成績比 OpenAI o3 的公開得分高出一倍,是 Claude 4 Opus 的四倍多。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.