北京時(shí)間2月18日,xAI召開(kāi)發(fā)布會(huì)宣布推出Grok-3模型,馬斯克進(jìn)行現(xiàn)場(chǎng)演示。據(jù)了解,發(fā)布會(huì)開(kāi)始前,xAI直播間的觀看人數(shù)已超100萬(wàn)人。
“我們非常高興能夠推出Grok-3。我們認(rèn)為,在很短時(shí)間內(nèi),它的功能比Grok-2強(qiáng)大一個(gè)數(shù)量級(jí)。這要?dú)w功于一支不可思議的團(tuán)隊(duì)的辛勤工作,我很榮幸能與這樣一支優(yōu)秀的團(tuán)隊(duì)合作?!瘪R斯克在發(fā)布會(huì)上表示。
“好”但是“貴”
馬斯克在發(fā)布會(huì)前曾直言:“Grok-3是地球上最聰明的AI。”事實(shí)上,發(fā)布會(huì)的內(nèi)容顯示,Grok-3模型確實(shí)很好,但是也非常昂貴。
具體來(lái)看,xAI團(tuán)隊(duì)在直播中表示,Grok-3和Grok-3 mini在各類測(cè)試上的測(cè)試得分都媲美甚至超過(guò)Gemini和ChatGPT等對(duì)手。
團(tuán)隊(duì)為了更進(jìn)一步展示Grok-3的數(shù)學(xué)和推理能力,向模型輸入了兩個(gè)問(wèn)題:
第一個(gè)問(wèn)題是,“航天器從地球發(fā)射到火星,并在下一個(gè)發(fā)射窗口返回地球”繪制3D動(dòng)畫(huà)并生成其代碼;
第二個(gè)問(wèn)題是,制作一個(gè)結(jié)合俄羅斯方塊和寶石迷陣玩法的混合游戲。
Grok-3對(duì)這兩個(gè)問(wèn)題上均給出了完整答案,展現(xiàn)出了其較強(qiáng)的互聯(lián)網(wǎng)搜索能力、推理能力和創(chuàng)意能力。
那么,強(qiáng)大能力的代價(jià)是什么?答案就是數(shù)以萬(wàn)計(jì)的GPU。
xAI團(tuán)隊(duì)表示,在訓(xùn)練Grok的過(guò)程中,團(tuán)隊(duì)搭建了大型算力集群,并克服了散熱、電力等問(wèn)題所帶來(lái)的挑戰(zhàn),用了122天讓首批10萬(wàn)張GPU投入使用并正常運(yùn)行,而現(xiàn)在他們將集群規(guī)模繼續(xù)擴(kuò)大一倍。
“思維鏈”成最大亮點(diǎn)
Grok-3最大的亮點(diǎn)在于,其像DeepSeek一樣引入了“思維鏈”推理機(jī)制。
業(yè)內(nèi)人士表示,Grok-3引入的“思維鏈”技術(shù),模擬人類逐步推理過(guò)程,處理復(fù)雜任務(wù)時(shí)邏輯連貫性顯著提升。例如,在解決數(shù)學(xué)難題、編寫(xiě)代碼時(shí),Grok-3能拆解步驟并自我驗(yàn)證,最終輸出更精準(zhǔn)的答案。
馬斯克在發(fā)布會(huì)上表示,這種推理機(jī)制使得Grok-3在邏輯推理測(cè)試中的表現(xiàn)遠(yuǎn)超ChatGPT-5和谷歌的Gemini Ultra,能夠構(gòu)思出新穎的想法和解決方案。
“Grok-3具有極強(qiáng)的推理能力,在我們迄今為止所做的測(cè)試中,其表現(xiàn)優(yōu)于我們所知的任何已發(fā)布產(chǎn)品?!瘪R斯克表示,我們有信心Grok-3會(huì)比其他任何AI都強(qiáng),將成為AI領(lǐng)域真正的顛覆者。
據(jù)xAI工程師透露,大約一個(gè)月前,Grok-3的預(yù)訓(xùn)練就已完成。從那時(shí)起,團(tuán)隊(duì)一直在努力將推理能力整合到當(dāng)前的Grok-3模型中。但目前仍處于早期階段。
“今天展示的是Grok-3推理模型的一部分,Grok-3推理模型具有巨大潛力,因?yàn)樗栽谟?xùn)練中?!痹摴こ處煴硎尽?/p>
來(lái)源:上海證券報(bào) 作者:鄭維漢 竇世平
責(zé)編|賀夢(mèng)璐
校檢|袁鋼
審核|姚彥如
聯(lián)系金妹兒:028-86968491
互聯(lián)網(wǎng)新聞信息服務(wù)許可證號(hào):51120180008
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.