網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

馬斯克翻車了

2025-02-20 14:23:05　來源: 新行情

廣東舉報(bào)

分享至

馬斯克發(fā)布Grok 3大模型

馬斯克的AI產(chǎn)品終于來了。

日前，全球科技界迎來了一場(chǎng)備受矚目的盛事，馬斯克旗下的人工智能公司xAI，正式發(fā)布了其最新一代大模型Grok 3。在發(fā)布會(huì)上，馬斯克毫不吝嗇地贊譽(yù)Grok 3為“地球上最聰明的人工智能”。

圖源：馬斯克Grok3模型新品發(fā)布會(huì)

Grok系列模型自2023年11月推出以來，便以其強(qiáng)大的性能和不斷迭代升級(jí)的能力，在人工智能領(lǐng)域嶄露頭角。此次發(fā)布的Grok 3，更是被視為xAI公司對(duì)全球AI市場(chǎng)的一次重大沖擊。

據(jù)馬斯克介紹，Grok 3的計(jì)算量比前代產(chǎn)品Grok 2高出10倍，其訓(xùn)練依托于xAI最新搭建的Colossus超級(jí)計(jì)算機(jī)，該計(jì)算機(jī)搭載了10萬顆英偉達(dá)H100 GPU，提供了超過2億GPU小時(shí)的計(jì)算資源。

Grok 3最大的技術(shù)亮點(diǎn)在于其引入了“思維鏈”（Chain Of Thought）推理機(jī)制。這一機(jī)制允許Grok 3像人類一樣分步驟解決復(fù)雜問題，顯著提高了模型處理復(fù)雜查詢和提供更連貫、更有邏輯響應(yīng)的能力。

在一系列演示中，馬斯克和他的團(tuán)隊(duì)展示了Grok 3在解決物理題、創(chuàng)作游戲以及進(jìn)行圖像分析和3D動(dòng)畫生成等方面的卓越表現(xiàn)。

在Grok 3發(fā)布之前，全球AI市場(chǎng)已經(jīng)涌現(xiàn)出了一批優(yōu)秀的大模型，如OpenAI的GPT-4o、Anthropic的Claude 3.5 Sonnet以及中國(guó)AI初創(chuàng)公司杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司發(fā)布的DeepSeek-V3等。

xAI團(tuán)隊(duì)展示了Grok 3與部分大模型的比賽結(jié)果。其中，xAI稱，Grok 3在AIME、GPQA和LCB的基準(zhǔn)測(cè)試中勝過GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Pro等模型。

圖源：馬斯克Grok3模型新品發(fā)布會(huì)

使用更多測(cè)試時(shí)間計(jì)算時(shí)，Grok 3 Reasoning和Grok 3 mini Reasoning的表現(xiàn)超過了高配版o3 mini、o1和DeepSeek-R1等其他模型。

對(duì)于馬斯克的Grok 3大模型，OpenAI聯(lián)合創(chuàng)始人、前特斯拉AI總監(jiān)、知名計(jì)算機(jī)科學(xué)家李飛飛的愛徒安德烈·卡帕西（Andrej Karpathy）評(píng)論：“Grok-3+Thinking感覺與OpenAI最強(qiáng)大的模型o1-pro相當(dāng)，略好于DeepSeek-R1和Gemini 2.0 Flash Thinking。”

Grok 3大模型“翻車了”

馬斯克的“地表最強(qiáng)”模型翻車了。

盡管馬斯克對(duì)Grok 3充滿了信心，并贊譽(yù)其為“地球上最聰明的人工智能”，但在發(fā)布后不久，Grok 3就遭遇了一次尷尬的翻車事件。

有人測(cè)試了最新的Beta版Grok3，當(dāng)被問及經(jīng)典問題“9.11與9.9哪個(gè)大？”時(shí)，Grok 3竟然無法給出正確的答案。

圖源：新浪網(wǎng)

對(duì)于馬斯克的Grok 3模型翻車，有網(wǎng)友表示，這暴露了Grok 3在基本理解能力方面的不足，也有網(wǎng)友稱，這可能是模型在訓(xùn)練過程中出現(xiàn)的偶然失誤，并不能完全代表Grok 3的真實(shí)水平。

據(jù)了解，9.11與9.9哪個(gè)大？這個(gè)問題曾難倒眾多大模型，“獨(dú)角獸”Scale AI公司的專家曾發(fā)文，他將（9.11 and 9.9 - which is bigger？）為Prompt輸入給各主流大模型。

結(jié)果ChatGPT 4o 的輸出是9.11 比 9.9 大；Gemini Advanced同樣翻車，輸出結(jié)果是9.11>9.9；Claude 3.5 Sonnet在該問題上同樣踩坑。

圖源：新浪網(wǎng)

對(duì)于這種現(xiàn)象，谷歌的工程師曾表示，數(shù)學(xué)奧林匹克競(jìng)賽對(duì)人工智能來說更容易，但常識(shí)仍然很難。

值得一提的是，對(duì)于同樣的問題，國(guó)產(chǎn)大模型則能夠輕松應(yīng)對(duì)。例如，詢問DeepSeek，立馬得出答案9.9大于9.11，百度文心一言同樣輕松解決。

圖源：DeepSeek模型

一些基礎(chǔ)性的常識(shí)問題看似簡(jiǎn)單，實(shí)則考驗(yàn)了模型對(duì)數(shù)字大小和比較的基本理解能力。對(duì)于人類來說，這是一個(gè)不言而喻的問題，但對(duì)于人工智能模型來說，卻可能成為一個(gè)難以逾越的障礙。

由此可見，人工智能技術(shù)的發(fā)展近年來雖然非常迅速，但仍然存在許多需要改進(jìn)和完善的地方。人工智能完全替代人腦，并不是一件容易事。

馬斯克是“天才”也是“瘋子”

馬斯克，是當(dāng)今世界最受矚目的科技明星。

他1971年6月出生于南非，自幼便對(duì)科學(xué)技術(shù)展現(xiàn)出了濃厚的興趣和非凡的天賦。從10歲開始學(xué)習(xí)編程，到13歲開發(fā)出自己的第一款游戲并賺到人生第一桶金，馬斯克的創(chuàng)業(yè)之路注定不平凡。

馬斯克年輕時(shí)照片圖源：抖音

經(jīng)過幾十年的不懈奮斗，馬斯克已經(jīng)成功打造了一個(gè)龐大的商業(yè)帝國(guó)。

他是特斯拉公司的創(chuàng)始人，也是SpaceX首席執(zhí)行官兼首席技術(shù)官，SolarCity董事會(huì)主席、Twitter首席執(zhí)行官，Neuralink創(chuàng)始人、OpenAI聯(lián)合創(chuàng)始人......

2021年3月2日，胡潤(rùn)研究院發(fā)布《2021胡潤(rùn)全球富豪榜》，馬斯克以1.28萬億元人民幣財(cái)富首次成為世界首富；10月，馬斯克成為歷史上首位身價(jià)破3000億美元的人，是福布斯統(tǒng)計(jì)史上最富有的人。

彭博億萬富翁指數(shù)顯示，截至去年12月中旬，馬斯克的個(gè)人凈資產(chǎn)已經(jīng)達(dá)到了4550億美元，是史上首個(gè)突破4000億美元大關(guān)的富豪。

坐擁億萬財(cái)富，馬斯克卻將所有心思用在實(shí)現(xiàn)“火星”夢(mèng)上。

馬斯克的太空運(yùn)輸公司SpaceX打造了大型可重復(fù)使用火箭“星艦”，該火箭被設(shè)計(jì)為能夠降落在任何具備著陸條件的地方，包括地球表面、月球表面甚至火星表面。

“星艦”的成功發(fā)射為SpaceX的未來商業(yè)航天計(jì)劃奠定了堅(jiān)實(shí)基礎(chǔ)，也為人類探索太空提供了新的可能。

星艦發(fā)射圖源抖音

去年年初，馬斯克曾公開表示：“你知道我想象中八年后會(huì)是什么樣子么？我希望我們能夠降落在火星上，我希望我們能夠?qū)⑷怂蜕显虑颍绻疫\(yùn)的話，我希望我們能夠在八年內(nèi)將人送上火星。”

馬斯克的設(shè)想是這樣的：“星艦來來往往，我們有一個(gè)美麗的火星城市，打造了一個(gè)繁榮的火星文明。我們最終會(huì)將火星改造成一顆類似于地球的行星，我們可以將地球上的生命帶到火星，讓地球生命在火星上延續(xù)。”

未來，馬斯克還會(huì)有怎樣的設(shè)想，我們拭目以待。

作者 | 李新

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.