馬斯克發(fā)布Grok 3大模型
馬斯克的AI產(chǎn)品終于來了。
日前,全球科技界迎來了一場(chǎng)備受矚目的盛事,馬斯克旗下的人工智能公司xAI,正式發(fā)布了其最新一代大模型Grok 3。在發(fā)布會(huì)上,馬斯克毫不吝嗇地贊譽(yù)Grok 3為“地球上最聰明的人工智能”。
圖源:馬斯克Grok3模型新品發(fā)布會(huì)
Grok系列模型自2023年11月推出以來,便以其強(qiáng)大的性能和不斷迭代升級(jí)的能力,在人工智能領(lǐng)域嶄露頭角。此次發(fā)布的Grok 3,更是被視為xAI公司對(duì)全球AI市場(chǎng)的一次重大沖擊。
據(jù)馬斯克介紹,Grok 3的計(jì)算量比前代產(chǎn)品Grok 2高出10倍,其訓(xùn)練依托于xAI最新搭建的Colossus超級(jí)計(jì)算機(jī),該計(jì)算機(jī)搭載了10萬顆英偉達(dá)H100 GPU,提供了超過2億GPU小時(shí)的計(jì)算資源。
Grok 3最大的技術(shù)亮點(diǎn)在于其引入了“思維鏈”(Chain Of Thought)推理機(jī)制。這一機(jī)制允許Grok 3像人類一樣分步驟解決復(fù)雜問題,顯著提高了模型處理復(fù)雜查詢和提供更連貫、更有邏輯響應(yīng)的能力。
在一系列演示中,馬斯克和他的團(tuán)隊(duì)展示了Grok 3在解決物理題、創(chuàng)作游戲以及進(jìn)行圖像分析和3D動(dòng)畫生成等方面的卓越表現(xiàn)。
在Grok 3發(fā)布之前,全球AI市場(chǎng)已經(jīng)涌現(xiàn)出了一批優(yōu)秀的大模型,如OpenAI的GPT-4o、Anthropic的Claude 3.5 Sonnet以及中國(guó)AI初創(chuàng)公司杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司發(fā)布的DeepSeek-V3等。
xAI團(tuán)隊(duì)展示了Grok 3與部分大模型的比賽結(jié)果。其中,xAI稱,Grok 3在AIME、GPQA和LCB的基準(zhǔn)測(cè)試中勝過GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Pro等模型。
圖源:馬斯克Grok3模型新品發(fā)布會(huì)
使用更多測(cè)試時(shí)間計(jì)算時(shí),Grok 3 Reasoning和Grok 3 mini Reasoning的表現(xiàn)超過了高配版o3 mini、o1和DeepSeek-R1等其他模型。
對(duì)于馬斯克的Grok 3大模型,OpenAI聯(lián)合創(chuàng)始人、前特斯拉AI總監(jiān)、知名計(jì)算機(jī)科學(xué)家李飛飛的愛徒安德烈·卡帕西(Andrej Karpathy)評(píng)論:“Grok-3+Thinking感覺與OpenAI最強(qiáng)大的模型o1-pro相當(dāng),略好于DeepSeek-R1和Gemini 2.0 Flash Thinking。”
Grok 3大模型“翻車了”
馬斯克的“地表最強(qiáng)”模型翻車了。
盡管馬斯克對(duì)Grok 3充滿了信心,并贊譽(yù)其為“地球上最聰明的人工智能”,但在發(fā)布后不久,Grok 3就遭遇了一次尷尬的翻車事件。
有人測(cè)試了最新的Beta版Grok3,當(dāng)被問及經(jīng)典問題“9.11與9.9哪個(gè)大?”時(shí),Grok 3竟然無法給出正確的答案。
圖源:新浪網(wǎng)
對(duì)于馬斯克的Grok 3模型翻車,有網(wǎng)友表示,這暴露了Grok 3在基本理解能力方面的不足,也有網(wǎng)友稱,這可能是模型在訓(xùn)練過程中出現(xiàn)的偶然失誤,并不能完全代表Grok 3的真實(shí)水平。
據(jù)了解,9.11與9.9哪個(gè)大?這個(gè)問題曾難倒眾多大模型,“獨(dú)角獸”Scale AI公司的專家曾發(fā)文,他將(9.11 and 9.9 - which is bigger?)為Prompt輸入給各主流大模型。
結(jié)果ChatGPT 4o 的輸出是9.11 比 9.9 大;Gemini Advanced同樣翻車,輸出結(jié)果是9.11>9.9;Claude 3.5 Sonnet在該問題上同樣踩坑。
圖源:新浪網(wǎng)
對(duì)于這種現(xiàn)象,谷歌的工程師曾表示,數(shù)學(xué)奧林匹克競(jìng)賽對(duì)人工智能來說更容易,但常識(shí)仍然很難。
值得一提的是,對(duì)于同樣的問題,國(guó)產(chǎn)大模型則能夠輕松應(yīng)對(duì)。例如,詢問DeepSeek,立馬得出答案9.9大于9.11,百度文心一言同樣輕松解決。
圖源:DeepSeek模型
一些基礎(chǔ)性的常識(shí)問題看似簡(jiǎn)單,實(shí)則考驗(yàn)了模型對(duì)數(shù)字大小和比較的基本理解能力。對(duì)于人類來說,這是一個(gè)不言而喻的問題,但對(duì)于人工智能模型來說,卻可能成為一個(gè)難以逾越的障礙。
由此可見,人工智能技術(shù)的發(fā)展近年來雖然非常迅速,但仍然存在許多需要改進(jìn)和完善的地方。人工智能完全替代人腦,并不是一件容易事。
馬斯克是“天才”也是“瘋子”
馬斯克,是當(dāng)今世界最受矚目的科技明星。
他1971年6月出生于南非,自幼便對(duì)科學(xué)技術(shù)展現(xiàn)出了濃厚的興趣和非凡的天賦。從10歲開始學(xué)習(xí)編程,到13歲開發(fā)出自己的第一款游戲并賺到人生第一桶金,馬斯克的創(chuàng)業(yè)之路注定不平凡。
馬斯克年輕時(shí)照片 圖源:抖音
經(jīng)過幾十年的不懈奮斗,馬斯克已經(jīng)成功打造了一個(gè)龐大的商業(yè)帝國(guó)。
他是特斯拉公司的創(chuàng)始人,也是SpaceX首席執(zhí)行官兼首席技術(shù)官,SolarCity董事會(huì)主席、Twitter首席執(zhí)行官 ,Neuralink創(chuàng)始人 、OpenAI聯(lián)合創(chuàng)始人......
2021年3月2日,胡潤(rùn)研究院發(fā)布《2021胡潤(rùn)全球富豪榜》,馬斯克以1.28萬億元人民幣財(cái)富首次成為世界首富;10月,馬斯克成為歷史上首位身價(jià)破3000億美元的人,是福布斯統(tǒng)計(jì)史上最富有的人。
彭博億萬富翁指數(shù)顯示,截至去年12月中旬,馬斯克的個(gè)人凈資產(chǎn)已經(jīng)達(dá)到了4550億美元,是史上首個(gè)突破4000億美元大關(guān)的富豪。
坐擁億萬財(cái)富,馬斯克卻將所有心思用在實(shí)現(xiàn)“火星”夢(mèng)上。
馬斯克的太空運(yùn)輸公司SpaceX打造了大型可重復(fù)使用火箭“星艦”,該火箭被設(shè)計(jì)為能夠降落在任何具備著陸條件的地方,包括地球表面、月球表面甚至火星表面。
“星艦”的成功發(fā)射為SpaceX的未來商業(yè)航天計(jì)劃奠定了堅(jiān)實(shí)基礎(chǔ),也為人類探索太空提供了新的可能。
星艦發(fā)射 圖源抖音
去年年初,馬斯克曾公開表示:“你知道我想象中八年后會(huì)是什么樣子么?我希望我們能夠降落在火星上,我希望我們能夠?qū)⑷怂蜕显虑颍绻疫\(yùn)的話,我希望我們能夠在八年內(nèi)將人送上火星。”
馬斯克的設(shè)想是這樣的:“星艦來來往往,我們有一個(gè)美麗的火星城市,打造了一個(gè)繁榮的火星文明。我們最終會(huì)將火星改造成一顆類似于地球的行星,我們可以將地球上的生命帶到火星,讓地球生命在火星上延續(xù)。”
未來,馬斯克還會(huì)有怎樣的設(shè)想,我們拭目以待。
作者 | 李新
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.