99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

年費超 2 萬!馬斯克剛剛發(fā)布最貴 AI ,Grok 4 號稱所有領域碾壓博士

0
分享至

馬斯克憋了快半年,終于把 Grok 4 端上了臺面。

這一次,他的口氣依舊不小。早在發(fā)布會前就放出狠話,聲稱 Grok 4 要「重寫人類知識庫」。等到了發(fā)布會上,馬斯克再次強調 Grok 4 是目前世界上最聰明的 AI。


可以,熟悉的味道,熟悉的配方。

當然,馬斯克夸自家產(chǎn)品這事兒,大家早就見怪不怪,但正如網(wǎng)友所調侃的那樣,你可以嘲笑 xAI 員工在辦公室?guī)づ窭锼X或者周末工作到凌晨 4:20,但也得承認,他們的確是當下發(fā)展速度最快的 AI 實驗室之一。

至于 Grok 4 能不能配得上「最聰明 AI」的稱號,還得看后續(xù)的實際體驗。不過,有一點是跑不了的——它已經(jīng)成了市面上最貴的 AI,年訂閱價格最高可達到 3000 美元,定價策略可謂是相當不講武德。

世界上最聰明的 AI?世界上最貴的 AI!

Grok 的訓練路徑分為兩個核心階段:預訓練與強化學習。從 Grok 2 到 Grok 3,主要依賴預訓練方式;而從 Grok 3 升級到 Grok 4,則大幅引入了以推理能力為核心的強化學習訓練。

馬斯克說得輕描淡寫,但訓練的動靜卻不小。

相比 Grok 2,Grok 4 的訓練計算量提升了整整兩個數(shù)量級,相當于增長了 100 倍——而且還在持續(xù)擴張。


馬斯克表示,Grok 4 已在所有主要學科上超越博士水平。雖然它目前尚不具備發(fā)明新理論或提出原創(chuàng)技術的能力,但在他看來,這只是時間問題。

他甚至語言,今年底 Grok 可能就能發(fā)明新技術,明年幾乎可以確定將具備發(fā)現(xiàn)新物理規(guī)律的能力。

當然,讓 AI 接入現(xiàn)實世界,才是真正的關鍵。

他表示,Grok 與人形機器人 Optimus 的結合,將形成一個閉環(huán)推理系統(tǒng)——提出假設、驗證假設、探索現(xiàn)實。這將開啟一個智能大爆炸的時代,是人類歷史上最令人激動的節(jié)點。


在產(chǎn)品形態(tài)上,Grok 4 是單智能體模型,而 Grok 4 Heavy 則是多智能體版本。

前者比較好理解,而后者則支持多個智能體并行思考,在推理過程中橫向比對、縱向協(xié)同,調用更大規(guī)模的計算資源以完成更復雜、更精密的任務。

在現(xiàn)場演示中,Grok 4 Heavy 展示了多個場景能力。

比方說,讓 Grok 4 Heavy 去預測今年 MLB 世界大賽(World Series)的冠軍概率,它通過信息檢索、數(shù)據(jù)建模、概率計算,評估洛杉磯道奇隊的奪冠概率為 21.6%,并在 4.5 分鐘內完整輸出預測過程。


再比如,一個看似無厘頭的任務:找出 xAI 團隊里頭像最奇怪的那一個。依托 X 平臺的資料庫,模型自動抓取并分析頭像風格,最后鎖定了聯(lián)合創(chuàng)始人 Greg Yang。


有趣的是,雖然模型準確理解了「奇怪」這一主觀概念,并能在同類中做出相對判斷,但在一滑而過的演示中,我似乎看到了 Anthropic 員工 Jan Leike 的頭像,看來準確率也有待提高。

除了推理和搜索,Grok 還能生成內容時間軸。

比如,根據(jù) X 平臺上的公開發(fā)帖,它能梳理出多個 AI 模型的基準測試成績、廠商更新節(jié)奏以及社區(qū)反應。用戶可以一目了然地看到 OpenAI 的分數(shù)表現(xiàn)、Gemini 的更新迭代,甚至是模型之間的微妙競爭態(tài)勢。


換句話說,Grok 不是只會考試的書呆子,而是真正具備跨場景理解與執(zhí)行能力的 AI。

目前,Grok 最大的短板依然集中在多模態(tài)理解能力,尤其是在圖像理解和生成方面,能力仍有待加強。好消息是,下一階段的基礎模型訓練已經(jīng)在路上,預計幾周內完成。

演示過程中,在測試「兩個黑洞相撞過程」的可視化任務時,Grok 采用了簡化的計算方式——使用后牛頓近似(Post-Newtonian approximation)替代完整的廣義相對論框架。


盡管存在簡化,模型依然準確地呈現(xiàn)了黑洞并合的關鍵物理階段,包括「螺旋接近」、「合并」與「振鈴階段」,并能清晰說明所采用的近似方法。此外,它還調用了相關教材、公開搜索結果及實際物理常數(shù)進行推理支持,整體邏輯鏈條嚴謹、解釋清晰。

就紙面參數(shù)而言,Grok 4 也交出了亮眼答卷。

Humanity’s Last Exam(人類最后的考試,簡稱:HLE,)覆蓋了數(shù)學、物理、計算機、醫(yī)學、人文社科等超過 100 個學科,共 2500 道閉卷題,測試難度極高,能夠真實反映模型在通用知識和復雜推理上的綜合表現(xiàn)。


根據(jù) xAI 數(shù)據(jù),Grok 4 在不使用任何工具的情況下,得分為 25.4%,超過了 Google Gemini 2.5 Pro 的 21.6% 和 OpenAI o3(高配版)的 21%。

而在使用工具的情況下,Grok 4 Heavy 的得分達到 44.4%,遠高于使用工具后 Gemini 2.5 Pro 的 26.9%。從整體趨勢來看,Grok 4 在擴展訓練資源的同時,通過引入工具使用和鏈式思維,不僅提升了復雜任務的處理能力,也逐步縮小了模型智能與通用認知之間的差距。


非營利組織 Arc Prize 也指出,Grok 在其 ARC-AGI-2 測試中創(chuàng)下新紀錄。這是一項視覺推理類基準測試,AI 需識別圖像中的模式。Grok 的得分為 16.2%,幾乎是當前排名第二的 Claude Opus 4 的兩倍。


面對一些常規(guī)的基準測試中,Grok 4 Heavy 的分數(shù)幾乎也快「刷滿」分數(shù)。在博士級難度的問題集 GBQA 中,盡管整體難度略低于 HLE,Grok 4 Heavy 依然取得了滿分成績,展現(xiàn)出極強的推理與理解能力。


不僅如此,在多項編程相關測試中,Grok 4 Heavy 的表現(xiàn)同樣搶眼。無論是 Live Coding、HMMT(麻省理工數(shù)學競賽)還是 USAMO(美國數(shù)學奧林匹克),它都遠超當前排名第二的模型,技術優(yōu)勢相當明顯。

另外,知名分析機構 Artificial Analysis 通過對多款主流大模型在 7 個推理相關基準(MMLU-Pro、GPQA Diamond、Humanity’s Last Exam、LiveCodeBench、SciCode、AIME、MATH-500)上的綜合表現(xiàn)進行評估。

數(shù)據(jù)顯示,Grok 4 位列第一,得分為 73,是目前推理能力綜合得分最高的模型。緊隨其后的則是 o3-pro(估算值)71 分。

馬斯克也強調:

「未來 Grok 將幾乎在所有考試中答對每一個問題。而當它答不出某個問題時,它會指出題目的錯誤之處,或者指出問題含糊不清的地方,并給出不同情境下可能的答案。到那時,傳統(tǒng)考試將失去意義。AI 唯一的檢驗標準將是現(xiàn)實世界:它是否能發(fā)明有用的技術,是否能推動科學的突破。所以 HLE 這類測試題庫必須盡快更新,因為以當前的 AI 進展速度,它們很快就會過時?!?/p>

截至發(fā)稿前,Grok 4 和 Grok 4 Heavy 目前均已陸續(xù)上線。


目前,Grok 4 和 Grok 4 Heavy 已全面上線。用戶可以通過訂閱訪問,不過,訂閱價格就有點「不講武德」,最高可去到 3000 美元/年檔位,成了不少用戶吐槽的焦點。


這么一比,OpenAI 、Anthropic 以及 Perplexity 的 200 刀/月套餐都顯得實惠許多。


值得一提的是,發(fā)布后不久就有網(wǎng)友表示,Grok-4 與 Grok-4-Heavy 模型已經(jīng)被成功「越獄」。越獄后的能力極其危險,可繞過安全護欄,輸出敏感或非法信息,比如化學武器合成步驟、《星球大戰(zhàn)1》的完整劇本(涉嫌版權)、甚至勒索病毒(惡意代碼)等。


不只會說話,Grok Voice 還有了「靈魂」

除了更強的推理能力,更聰明,Grok 4 這次也在「更像人」這件事上,邁出了一大步。

跟我們熟悉的語音助手不同,xAI 全新語音助手「Eve」不只是能答話,它能表達情緒、有語調變化,甚至還能現(xiàn)場「唱歌」。


在直播現(xiàn)場的演示上,它用一口優(yōu)雅的英音,唱了一首即興創(chuàng)作的「Diet Coke 詠嘆調」,「O Diet Coke, thou elixir divine…」聽起來真的不像是 AI,像是倫敦劇場里的舞臺演員在表演。


這次語音模型一共上線了五種聲音,包括直播開場的「電影一般的預告男聲」Sal,以及支持低延遲、自然停頓、情緒起伏等能力的 Eve。

現(xiàn)場還安排了一段和 ChatGPT Voice 的對比演示,兩者輪流復述數(shù)字。ChatGPT 時不時「搶答」,有點像沒聽清就硬接話的同學。而 Grok 的表現(xiàn)更流暢、更貼近人類說話習慣,而且不會打斷用戶說話。

發(fā)布會上提到,自語音模型上線以來,Grok Voice 的端到端延遲縮短了兩倍,活躍用戶也增長了 10 倍。Grok Voice 正在迅速發(fā)展。

馬斯克:讓 Grok 去開一百萬個自動售貨機賺錢

幾個 Grok 4 API 的應用場景讓我印象非常深刻。

比如,在一項自動售貨機商業(yè)模擬 Vending-Bench中,Grok 被要求自主完成:供應商協(xié)商、庫存管理、定價策略,連續(xù)完成并長期保持盈利。


▲注:Vending-Bench 是一個專門設計用于測試基于 LLM 的代理,在管理一個簡單但長期運行的業(yè)務場景中的能力:運營一臺自動售貨機。

測試結果顯示,Grok 4 不僅登頂排行榜,而且它所獲得的凈資產(chǎn)是其他模型的兩倍。連馬斯克都開始調侃說:「以后買顯卡的錢,可以讓 Grok 去部署運營一百萬個自動售賣機賺回來」。


在科研領域,Grok 4 已被用于 CRISPR 基因研究和胸片 X 光分析。它能在幾秒鐘內讀完幾百萬條實驗記錄和日志,自動篩出最有可能成功的假設。


此外,像是金融領域、游戲開發(fā)等項目,都可以通過 xAI API 來使用 Grok 4 來實現(xiàn)。發(fā)布會上特別提到了一個游戲設計師,他在 xAI 發(fā)布了 Grok 4 預覽 API 后,就立刻參與測試。然后,他花了短短 4 小時就做出了一個第一人稱射擊游戲。

Grok 4 不是終點。發(fā)布會最后預告了接下來的路線圖,每一項都非常值得期待。


  • 代碼模型:這次竟然沒有發(fā)布 Grok Code,不過 xAI 提到正在訓練了,一個「又快又聰明」的代碼模型將會在幾周內上線。
  • 多模態(tài)能力:Grok 4 在圖像理解上表現(xiàn)依舊是有限,團隊也說正在以更大規(guī)模訓練下一個版本,預計會在圖像、視頻和音頻理解上迎來質變,到時 Grok 將能「像人類一樣看世界」。
  • 視頻生成:xAI 說將使用大規(guī)模的算力資源,進行視頻生成模型的訓練。他們的最終目標是做到圖生視頻,生成可交互的「無盡視頻流」,讓用戶能邊看邊參與劇情走向。

可能有不少朋友已經(jīng)發(fā)現(xiàn),這次發(fā)布會還有兩個熟悉的華人面孔。他們正是 xAI 的聯(lián)合創(chuàng)始人——吉米·巴(Jimmy Ba)和吳宇懷(Yuhuai Wu)。

其中,吳宇懷(Yuhuai Wu)本科以滿績點畢業(yè)于加拿大紐布倫斯威克大學,并在 2021 年獲得多倫多大學機器學習博士學位,期間曾師從「深度學習之父」杰弗里·辛頓。

博士階段,他還曾在 Google DeepMind 和 OpenAI 實習,畢業(yè)后在 Google 任職,并在斯坦福大學從事博士后研究。

吳宇懷的研究重點是打造具備強推理能力的人工智能系統(tǒng),先后主導或參與了自訓練推理模型 STAR、語言模型 Minerva 以及定理證明器 Alpha Geometry 等項目,并在《Nature》等頂刊上發(fā)表論文,推動 AI 在數(shù)學推理領域實現(xiàn)突破。


▲ 吳宇懷(左二)和吉米·巴(左三)

坐在他身旁的吉米·巴(Jimmy Ba)則是多倫多大學計算機科學系的助理教授,也是吳宇懷博士時期的導師之一。

他同樣出身于辛頓門下,是深度學習訓練優(yōu)化領域的關鍵人物。

最為人熟知的,是他與合作者共同提出了 Adam Optimizer(自適應矩估計優(yōu)化器)——如今幾乎成為深度神經(jīng)網(wǎng)絡訓練的默認算法。可以說,他的博士論文為現(xiàn)代 AI 訓練機制奠定了堅實理論基礎。

不得不說,Gork 4 的到來適逢其時。

前代 Grok 3 的熱度來得猛,退得也快。

根據(jù)知名市場分析機構 SimilarWeb 發(fā)布的截至 5 月 9 日的《2025年全球生成式AI行業(yè)趨勢報告》,Grok 從三月流量暴漲超 100 萬倍,到五月增幅跌回 5200%。

相比前代倉促上線、草草交卷的節(jié)奏,這次的 Grok 4 明顯放慢了腳步,在產(chǎn)品打磨上也更下功夫。歸根結底,馬斯克的光環(huán)可以幫 Grok 帶來第一波流量,但能不能留下用戶,還得靠模型本身的硬實力。

只不過,我沒記錯的話,馬斯克當初在 Grok 3 發(fā)布時,還信誓旦旦說要把 Grok 2 開源。眼看五個月過去了,這事兒卻毫無動靜,這次發(fā)布會上也沒再提半句。

老馬啊,可不能寬于律己,嚴以待人呀。

作者:張子豪、莫崇宇

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
他枯瘦如柴卻力大無窮,出手必傷人,一生比武無敗績,名字很耳熟

他枯瘦如柴卻力大無窮,出手必傷人,一生比武無敗績,名字很耳熟

近史談
2025-07-11 18:01:13
比亞迪涉嫌冒領補貼,或需退還違規(guī)補貼資金1.4億元

比亞迪涉嫌冒領補貼,或需退還違規(guī)補貼資金1.4億元

風向觀察
2025-07-12 10:31:09
很奇怪,天水鉛中毒事件為啥都是自媒體在盲猜,卻沒有記者去采訪

很奇怪,天水鉛中毒事件為啥都是自媒體在盲猜,卻沒有記者去采訪

筆桿論道
2025-07-12 11:26:29
巴基斯坦從中國買什么,我就從中國買什么,買回去一起打印度

巴基斯坦從中國買什么,我就從中國買什么,買回去一起打印度

書中自有顏如玉
2025-07-12 15:40:32
混雙頒獎禮:林鐘勛 申裕斌罕見嚴肅明顯不服,林詩棟成熟 蒯曼偷

混雙頒獎禮:林鐘勛 申裕斌罕見嚴肅明顯不服,林詩棟成熟 蒯曼偷

郝小小看體育
2025-07-12 14:18:57
廣東女生596分無緣廣東警官學院,滿足門檻分但沒選對專業(yè)組

廣東女生596分無緣廣東警官學院,滿足門檻分但沒選對專業(yè)組

小義了不休
2025-07-11 22:00:00
猛料:“沉沒前,西方艦隊告訴我們無船可派”

猛料:“沉沒前,西方艦隊告訴我們無船可派”

環(huán)球時報國際
2025-07-12 09:54:42
德云社吊唁楊少華,追悼會曝光,百元大鈔擺滿桌,楊議難掩笑容

德云社吊唁楊少華,追悼會曝光,百元大鈔擺滿桌,楊議難掩笑容

尋墨閣
2025-07-11 09:59:31
最新消息!川西6母女墜河司機被找到?是朋友客戶的兒子

最新消息!川西6母女墜河司機被找到?是朋友客戶的兒子

九方魚論
2025-07-12 14:42:01
宋春麗遺產(chǎn)大戰(zhàn)!親戚上門鬧事,德藝雙馨人設崩塌?

宋春麗遺產(chǎn)大戰(zhàn)!親戚上門鬧事,德藝雙馨人設崩塌?

靜水流深003
2025-07-12 15:38:18
娃哈哈宗慶后遺產(chǎn)再起風波:3名宗姓人士狀告宗馥莉,禁止處置匯豐賬戶18億美元余額

娃哈哈宗慶后遺產(chǎn)再起風波:3名宗姓人士狀告宗馥莉,禁止處置匯豐賬戶18億美元余額

WEALTH財富管理
2025-07-12 15:07:43
男子吹“日本一包裝技術”中國10年學不會,遭打臉:中國廠家產(chǎn)品

男子吹“日本一包裝技術”中國10年學不會,遭打臉:中國廠家產(chǎn)品

可達鴨面面觀
2025-07-12 16:07:19
天價學費嚇退家長,補錄 257人沒人報,成都外國語學校跌落神壇

天價學費嚇退家長,補錄 257人沒人報,成都外國語學校跌落神壇

特特農村生活
2025-07-11 10:17:28
中美外長吉隆坡之會,反映了什么情況?

中美外長吉隆坡之會,反映了什么情況?

新民周刊
2025-07-12 09:04:39
美歐臨時貿易協(xié)議或告吹,美媒披露原因:汽車與農產(chǎn)品關稅分歧突出,特朗普態(tài)度存變數(shù)

美歐臨時貿易協(xié)議或告吹,美媒披露原因:汽車與農產(chǎn)品關稅分歧突出,特朗普態(tài)度存變數(shù)

環(huán)球網(wǎng)資訊
2025-07-12 16:38:15
來財!靠知了猴一天凈賺2000元!上海人也盯上了夏日“頂流”

來財!靠知了猴一天凈賺2000元!上海人也盯上了夏日“頂流”

觀威海
2025-07-12 15:29:30
撈游客手機索要1500元未果又扔回水中,有啥法律后果?律師解讀

撈游客手機索要1500元未果又扔回水中,有啥法律后果?律師解讀

上觀新聞
2025-07-12 15:22:02
一問到底|高溫“桑拿天”將席卷超15省份:今年為何格外熱?如何防熱射病?

一問到底|高溫“桑拿天”將席卷超15省份:今年為何格外熱?如何防熱射?。?/a>

上游新聞
2025-07-12 15:15:05
決定烏克蘭命運的兩場大會召開,美國牽頭,60余國參加

決定烏克蘭命運的兩場大會召開,美國牽頭,60余國參加

史政先鋒
2025-07-11 20:46:07
已落馬領導干部制定的簡單粗暴政策仍在執(zhí)行?紀委出手

已落馬領導干部制定的簡單粗暴政策仍在執(zhí)行?紀委出手

澎湃新聞
2025-07-12 16:58:26
2025-07-12 18:11:00
愛范兒 incentive-icons
愛范兒
消費科技第一媒體
37513文章數(shù) 2599098關注度
往期回顧 全部

科技要聞

Kimi深夜整活,開源了首個萬億參數(shù)模型

頭條要聞

"715萬建牛郎織女雕塑"調查2年無結論 河南平頂山回應

頭條要聞

"715萬建牛郎織女雕塑"調查2年無結論 河南平頂山回應

體育要聞

夏聯(lián)-開拓者大勝勇士 楊瀚森首秀10+4+5+3帽

娛樂要聞

鹿晗賬號解禁后首曬自拍,漲粉超400萬

財經(jīng)要聞

中國超半數(shù)城市人口下滑,什么信號?

汽車要聞

小米YU7深度試駕:優(yōu)點很多缺點也很多

態(tài)度原創(chuàng)

房產(chǎn)
時尚
游戲
旅游
家居

房產(chǎn)要聞

8大新盤曝光!2025下半場,廣州主城開卷廝殺!

買包的盡頭是帆布包?她花幾十塊拿下女明星同款

《模擬人生4》角色突然集體懷孕!就連男性也無法幸免

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

家居要聞

生活憧憬 自由浪漫之境

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 长岭县| 夏邑县| 交城县| 平泉县| 清新县| 乌鲁木齐市| 公安县| 龙胜| 北宁市| 德安县| 南丹县| 喜德县| 洛川县| 丽江市| 万州区| 广饶县| 建湖县| 大石桥市| 嘉善县| 杭锦后旗| 雅安市| 沿河| 栾川县| 惠安县| 仪征市| 灯塔市| 东丰县| 镇赉县| 岳西县| 海盐县| 沿河| 八宿县| 孝昌县| 汤原县| 大城县| 攀枝花市| 晋宁县| 定陶县| 兴安盟| 饶平县| 财经|