北京時間2月18日,xAI召開發(fā)布會宣布推出Grok-3模型,馬斯克進(jìn)行現(xiàn)場演示。據(jù)了解,發(fā)布會開始前,xAI直播間的觀看人數(shù)已超100萬人。
“我們非常高興能夠推出Grok-3。我們認(rèn)為,在很短時間內(nèi),它的功能比Grok-2強(qiáng)大一個數(shù)量級。這要?dú)w功于一支不可思議的團(tuán)隊的辛勤工作,我很榮幸能與這樣一支優(yōu)秀的團(tuán)隊合作。”馬斯克在發(fā)布會上表示。
“好”但是“貴”
馬斯克在發(fā)布會前曾直言:“Grok-3是地球上最聰明的AI。”事實上,發(fā)布會的內(nèi)容顯示,Grok-3模型確實很好,但是也非常昂貴。
具體來看,xAI團(tuán)隊在直播中表示,Grok-3和Grok-3 mini在各類測試上的測試得分都媲美甚至超過Gemini和ChatGPT等對手。
團(tuán)隊為了更進(jìn)一步展示Grok-3的數(shù)學(xué)和推理能力,向模型輸入了兩個問題:
第一個問題是,“航天器從地球發(fā)射到火星,并在下一個發(fā)射窗口返回地球”繪制3D動畫并生成其代碼;
第二個問題是,制作一個結(jié)合俄羅斯方塊和寶石迷陣玩法的混合游戲。
Grok-3對這兩個問題上均給出了完整答案,展現(xiàn)出了其較強(qiáng)的互聯(lián)網(wǎng)搜索能力、推理能力和創(chuàng)意能力。
那么,強(qiáng)大能力的代價是什么?答案就是數(shù)以萬計的GPU。
xAI團(tuán)隊表示,在訓(xùn)練Grok的過程中,團(tuán)隊搭建了大型算力集群,并克服了散熱、電力等問題所帶來的挑戰(zhàn),用了122天讓首批10萬張GPU投入使用并正常運(yùn)行,而現(xiàn)在他們將集群規(guī)模繼續(xù)擴(kuò)大一倍。
“思維鏈”成最大亮點(diǎn)
Grok-3最大的亮點(diǎn)在于,其像DeepSeek一樣引入了“思維鏈”推理機(jī)制。
業(yè)內(nèi)人士表示,Grok-3引入的“思維鏈”技術(shù),模擬人類逐步推理過程,處理復(fù)雜任務(wù)時邏輯連貫性顯著提升。例如,在解決數(shù)學(xué)難題、編寫代碼時,Grok-3能拆解步驟并自我驗證,最終輸出更精準(zhǔn)的答案。
馬斯克在發(fā)布會上表示,這種推理機(jī)制使得Grok-3在邏輯推理測試中的表現(xiàn)遠(yuǎn)超ChatGPT-5和谷歌的Gemini Ultra,能夠構(gòu)思出新穎的想法和解決方案。
“Grok-3具有極強(qiáng)的推理能力,在我們迄今為止所做的測試中,其表現(xiàn)優(yōu)于我們所知的任何已發(fā)布產(chǎn)品。”馬斯克表示,我們有信心Grok-3會比其他任何AI都強(qiáng),將成為AI領(lǐng)域真正的顛覆者。
據(jù)xAI工程師透露,大約一個月前,Grok-3的預(yù)訓(xùn)練就已完成。從那時起,團(tuán)隊一直在努力將推理能力整合到當(dāng)前的Grok-3模型中。但目前仍處于早期階段。
“今天展示的是Grok-3推理模型的一部分,Grok-3推理模型具有巨大潛力,因為它仍在訓(xùn)練中。”該工程師表示。
來源:上海證券報 作者:鄭維漢 竇世平
責(zé)編|賀夢璐
校檢|袁鋼
審核|姚彥如
聯(lián)系金妹兒:028-86968491
互聯(lián)網(wǎng)新聞信息服務(wù)許可證號:51120180008
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.