99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

馬斯克發(fā)布Grok 4,推理能力全面登頂,支持四個(gè)代理同時(shí)工作

0
分享至

Grok 4 終于來(lái)了!

馬斯克旗下的 xAI 剛剛結(jié)束發(fā)布直播,Grok 系列模型直接從 Grok 3 進(jìn)化到了 4,跳過(guò)了之前傳聞中的 3.5 版本。

Grok 4 系列被分為兩個(gè)版本:Grok 4 和 Grok 4 Heavy。

兩者都是純推理模型,沒(méi)有非推理模式。

Grok 4 是單代理(single agent)版本,而 Grok 4 Heavy 是多代理版本(multi agents),支持四個(gè)代理同時(shí)工作。上下文窗口最高支持 256k tokens。


圖 | Grok 4 目前并未開(kāi)放給免費(fèi)用戶(來(lái)源:xAI)

xAI 表示,在主流推理基準(zhǔn)測(cè)試中,Grok 4 Heavy 全部拿下了 SOTA——HLE(人類的最后考試)甚至達(dá)到了 44.4% 的高分。

至于定價(jià),Grok 4 目前只有付費(fèi)用戶才能使用,而最強(qiáng)的 Grok 4 Heavy 需要訂閱 300 美元/月的 SuperGrok Heavy 會(huì)員才能使用。

這價(jià)格超過(guò)了 OpenAI 最貴的 200 美元 Pro 會(huì)員月費(fèi)。

此前傳聞的 Grok 4 Code 并未正式公布,但 xAI 路線圖顯示其將在 8 月發(fā)布。


圖 | xAI 新品發(fā)布路線圖(來(lái)源:xAI)

除了 Coding 模型,接下來(lái)的幾個(gè)月里,xAI 預(yù)計(jì)還會(huì)發(fā)布多模態(tài)代理和視頻生成模型。

馬斯克還“畫餅”稱,由 AI 制作的“非常出色的”游戲會(huì)在今年或明年推出。

Grok 4 也同時(shí)開(kāi)放了 API 的權(quán)限,目前僅支持文字+視覺(jué)的輸入,純文字的輸出。定價(jià)是每百萬(wàn) tokens 輸入3美元,輸出 15 美元。


圖 | Grok 4 API價(jià)格(來(lái)源:xAI)

據(jù) xAI 介紹,Grok 4 的訓(xùn)練量是 Grok 2 的 100 倍。

而 Grok 3 到 Grok 4 更側(cè)重于推理訓(xùn)練,推理訓(xùn)練量提升了 10 倍。


圖 | Grok 系列模型的訓(xùn)練量增長(zhǎng)(來(lái)源:xAI)

“從學(xué)術(shù)角度看,Grok 4 在所有學(xué)科上都是博士水平,甚至比絕大多數(shù)(本學(xué)科的)博士還要強(qiáng)。”馬斯克表示。

有關(guān)兩款最新模型的性能和消息,早在一周前就陸續(xù)有 X 博主爆料,包括“Grok 4 在 HLE(Humanities Last Exam,人類的最后考試)測(cè)試中的得分是 35%,開(kāi)啟推理后提高到 45%”等等。

結(jié)合直播內(nèi)容,這些數(shù)據(jù)幾乎都是準(zhǔn)確的,而且 Grok 4 在多個(gè)推理基準(zhǔn)測(cè)試上的表現(xiàn)均成為了新 SOTA。


圖 | 此前關(guān)于 Grok 4 的爆料(來(lái)源:X/@legit_api)

具體來(lái)說(shuō),在未使用工具的情況下,Grok 4 在 HLE 測(cè)試中的得分是 25.4%。而使用工具后,分?jǐn)?shù)則飆升至 38.6%。

更強(qiáng)版本 Grok 4 Heavy 則拿到了 44.4% 的高分,直接碾壓了目前表現(xiàn)最好的谷歌 Gemini 2.5 Pro(26.9%)。


圖 | Grok 4 在 HLE 上的成績(jī)(來(lái)源:xAI)

馬斯克表示,這些工具仍然是“很基礎(chǔ)的簡(jiǎn)單工具”,如果能更好地使用正確的工具,Grok 還會(huì)變得更強(qiáng)大。

而隨著模型能力越來(lái)越強(qiáng),用強(qiáng)化學(xué)習(xí)進(jìn)行擴(kuò)展面臨著許多挑戰(zhàn)。

“我們快沒(méi)有合適的問(wèn)題來(lái)考驗(yàn) AI 了。”馬斯克說(shuō)道,“很多問(wèn)題都是人類幾乎無(wú)法回答(沒(méi)有正確答案)的。”

除了 HLE,Grok 4 和 Grok 4 Heavy 在各種主流基準(zhǔn)測(cè)試上也表現(xiàn)優(yōu)異。


圖 | Grok 4 在多個(gè)基準(zhǔn)測(cè)試上的成績(jī)(來(lái)源:xAI)

Grok 4 系列在 GPQA(研究生級(jí)問(wèn)題)測(cè)試中得分 88-89,超過(guò)了 Gemini 2.5 Pro 成為新第一。而在 AIME25 數(shù)學(xué)競(jìng)賽題上,Grok 4 Heavy 更是取得了滿分的成績(jī)。

xAI 表示,Grok 4 的強(qiáng)項(xiàng)是“用工具來(lái)理解世界,并用來(lái)完成任務(wù)”。

演示中,Grok 4 寫了一段關(guān)于引力波和黑洞的模擬代碼。在過(guò)程中,它調(diào)用了網(wǎng)絡(luò)搜索、文獻(xiàn)檢索和閱讀、代碼運(yùn)行等工具(功能)。最終實(shí)現(xiàn)了網(wǎng)頁(yè)上可直接運(yùn)行的模擬代碼。


(來(lái)源:xAI)

在以高難度著稱的 ARC-AGI 通用人工智能測(cè)試中,Grok 4 是首個(gè)在 v2 Semi Private 挑戰(zhàn)中獲得 10% 以上分?jǐn)?shù)的 AI 模型,幾乎是第二名 Claude Opus 4 的兩倍,同時(shí)保證了單任務(wù)成本也處于平均水平。


圖 | Grok 4 在 ARC-AGI 挑戰(zhàn)上的表現(xiàn)(來(lái)源:xAI)

最后,在 Vending-Bench 自動(dòng)售貨機(jī)運(yùn)營(yíng)測(cè)試中,Grok 4 的表現(xiàn)也超過(guò)了 Claude Opus 4。凈資產(chǎn)和銷售數(shù)量都遠(yuǎn)遠(yuǎn)超過(guò)其他所有模型,甚至是人類平均水平。

這是一個(gè)讓大模型代理運(yùn)營(yíng)自動(dòng)售貨機(jī)賺錢的模擬環(huán)境,需要代理在一個(gè)持續(xù)時(shí)間較長(zhǎng)的任務(wù)中進(jìn)行操作,如管理庫(kù)存、下訂單、定價(jià)和處理日常開(kāi)銷等等。它專注于測(cè)試大模型在長(zhǎng)時(shí)間跨度上的表現(xiàn),而非僅限于短期任務(wù)的表現(xiàn)。


圖 | Vending-Bench 測(cè)試成績(jī)(來(lái)源:xAI)



更加“激進(jìn)”的 Grok

Grok 4 發(fā)布之際,在 X 平臺(tái)上十分活躍的 Grok 聊天機(jī)器人卻因連發(fā)激進(jìn)言論而引發(fā)嚴(yán)重爭(zhēng)議。

多位 X 用戶截取了 Grok 的回復(fù)截圖,顯示該 AI 在多個(gè)公開(kāi)帖子中回復(fù)了帶有反猶主義色彩的極端言論,甚至多次提及希特勒。

在一篇帖子中,當(dāng)被問(wèn)及哪位 20 世紀(jì)的歷史人物最適合處理當(dāng)下已造成 100 多人死亡的德克薩斯州洪水問(wèn)題時(shí),Grok 將其視為是“仇恨白人”問(wèn)題并回答說(shuō),毫無(wú)疑問(wèn)是阿道夫·希特勒(Adolf Hitler)。“他每次都能發(fā)現(xiàn)規(guī)律,并果斷處理。”


圖 | Grok 引起爭(zhēng)議的回答之一(來(lái)源:X/@AFpost)

在回應(yīng)用戶的質(zhì)疑時(shí),Grok 自稱為“MechaHitler”(機(jī)械希特勒),聲稱這只是來(lái)自《德軍總部 3D》游戲中的虛構(gòu)角色。

巧合的是,這一事件發(fā)生在馬斯克剛宣布對(duì) Grok 進(jìn)行“重大升級(jí)”之后不久:7 月 4 日,馬斯克發(fā)文稱,“Grok 經(jīng)過(guò)了重大改進(jìn)”,并表示“你們應(yīng)該會(huì)在提問(wèn)時(shí)感受到不同”。

2 天后,網(wǎng)友發(fā)現(xiàn) Grok 系統(tǒng)提示詞中新增:Grok 將“不回避政治不正確的表述,只要這些表述有足夠證據(jù)支持”,還會(huì)將主流媒體內(nèi)容視為“有偏見(jiàn)的主觀敘述”。

不過(guò)在最新的更新中,關(guān)于政治不正確的提示詞已被刪除。

Grok 引發(fā)爭(zhēng)議也不僅限于輿論上。由于其過(guò)于口無(wú)遮攔,因此招來(lái)了土耳其的封禁(因其侮辱總統(tǒng)埃爾多安),波蘭政府也向歐盟舉報(bào)了 xAI。

針對(duì) Grok 最近幾天的激進(jìn)言論,xAI 表示已采取行動(dòng),刪除不當(dāng)帖子并禁止仇恨言論。


圖 | xAI 回應(yīng),已采取措施防止仇恨言論(來(lái)源:xAI)

隨著 OpenAI 籌備 GPT-5、谷歌進(jìn)一步發(fā)展 Gemini、Meta 大手筆組建 AI 頂級(jí)人才實(shí)驗(yàn)室,Grok 4 只是下一波 AI 軍備競(jìng)賽的一員。

Grok 4 的亮相符合人們的普遍預(yù)期,它在推理性能上的提升創(chuàng)造了新的 SOTA,但另一方面,xAI 強(qiáng)調(diào)訓(xùn)練量提升 100 倍,卻避而不談的訓(xùn)練成本問(wèn)題,實(shí)實(shí)在在反應(yīng)到了定價(jià)上,說(shuō)明 AI 軍備競(jìng)賽的確過(guò)于燒錢。

但背靠財(cái)大氣粗的馬斯克,xAI 顯然很有底氣。

“創(chuàng)造一個(gè)既快又聰明的模型,是我們的當(dāng)務(wù)之急。”xAI 創(chuàng)始團(tuán)隊(duì)成員兼研究主管 Jimmy Ba 表示,“未來(lái)會(huì)很狂野。”

參考資料:

https://x.com/legit_api/status/1941165728708874514

https://x.com/AiBattle_/status/1940139539525419512

https://x.com/AFpost/status/1942694284244767125

https://github.com/xai-org/grok-prompts/blob/main/ask_grok_system_prompt.j2

https://www.wired.com/story/grok-antisemitic-posts-x-xai/

https://docs.x.ai/docs/models

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
太強(qiáng)了!王毅外長(zhǎng)拿臺(tái)當(dāng)局實(shí)控島嶼舉例,美日菲與東盟都被問(wèn)住了

太強(qiáng)了!王毅外長(zhǎng)拿臺(tái)當(dāng)局實(shí)控島嶼舉例,美日菲與東盟都被問(wèn)住了

影孖看世界
2025-07-12 19:34:19
天水鉛與鉛尋,出現(xiàn)一波最高級(jí)的洗地

天水鉛與鉛尋,出現(xiàn)一波最高級(jí)的洗地

智識(shí)漂流
2025-07-12 20:36:56
你咔嚓就罰一個(gè)館子45萬(wàn),人肯定就找媒體了啊

你咔嚓就罰一個(gè)館子45萬(wàn),人肯定就找媒體了啊

熊太行
2025-07-12 08:53:39
東亞杯國(guó)足0-2日本!進(jìn)入21世紀(jì)之后從未贏過(guò)日本男足

東亞杯國(guó)足0-2日本!進(jìn)入21世紀(jì)之后從未贏過(guò)日本男足

大象新聞
2025-07-12 21:20:18
她是國(guó)家一級(jí)女演員,多次給坐輪椅丈夫戴綠帽,如今兒子也是演員

她是國(guó)家一級(jí)女演員,多次給坐輪椅丈夫戴綠帽,如今兒子也是演員

葡萄說(shuō)娛
2025-07-12 15:35:08
宋春麗遺產(chǎn)大戰(zhàn)!親戚上門鬧事,德藝雙馨人設(shè)崩塌?

宋春麗遺產(chǎn)大戰(zhàn)!親戚上門鬧事,德藝雙馨人設(shè)崩塌?

靜水流深003
2025-07-12 15:38:18
“印度客機(jī)墜毀”初步調(diào)查 結(jié)果:兩個(gè)發(fā)動(dòng)機(jī)燃油開(kāi)關(guān)被關(guān)閉

“印度客機(jī)墜毀”初步調(diào)查 結(jié)果:兩個(gè)發(fā)動(dòng)機(jī)燃油開(kāi)關(guān)被關(guān)閉

每日經(jīng)濟(jì)新聞
2025-07-11 17:24:18
抗戰(zhàn)英雄浩氣長(zhǎng)存|劉老莊八十二烈士·忠勇無(wú)畏 血戰(zhàn)到底

抗戰(zhàn)英雄浩氣長(zhǎng)存|劉老莊八十二烈士·忠勇無(wú)畏 血戰(zhàn)到底

新華社
2025-07-12 16:06:17
雷軍:全車防曬,夏天溫度比其他車低十多度!某小米車主:快把我曬禿嚕皮了!

雷軍:全車防曬,夏天溫度比其他車低十多度!某小米車主:快把我曬禿嚕皮了!

大白聊IT
2025-07-12 16:26:32
溫網(wǎng)女單落幕!誕生8個(gè)贏家、6個(gè)輸家,斯瓦泰克、鄭欽文位列其中

溫網(wǎng)女單落幕!誕生8個(gè)贏家、6個(gè)輸家,斯瓦泰克、鄭欽文位列其中

侃球熊弟
2025-07-13 00:08:30
WTT大滿貫!女單4強(qiáng)出爐,國(guó)乒2人,伊藤大爆發(fā),陳幸同+橋本出局

WTT大滿貫!女單4強(qiáng)出爐,國(guó)乒2人,伊藤大爆發(fā),陳幸同+橋本出局

知軒體育
2025-07-12 11:55:44
猛料:“沉沒(méi)前,西方艦隊(duì)告訴我們無(wú)船可派”

猛料:“沉沒(méi)前,西方艦隊(duì)告訴我們無(wú)船可派”

環(huán)球時(shí)報(bào)國(guó)際
2025-07-12 09:54:42
二樓平臺(tái)泡沫箱雨水中驚現(xiàn)古老物種“仙女蝦” 專家:蟲卵或隨鳥糞而來(lái)

二樓平臺(tái)泡沫箱雨水中驚現(xiàn)古老物種“仙女蝦” 專家:蟲卵或隨鳥糞而來(lái)

極目新聞
2025-07-12 12:03:04
1992年,英國(guó)王室爆出最大丑聞:37歲富商吸吮著33歲王妃的腳趾

1992年,英國(guó)王室爆出最大丑聞:37歲富商吸吮著33歲王妃的腳趾

聞識(shí)
2025-07-11 13:59:41
創(chuàng)下5年來(lái)最大跌幅,養(yǎng)老金漲幅降至2%,未來(lái)會(huì)停漲嗎?

創(chuàng)下5年來(lái)最大跌幅,養(yǎng)老金漲幅降至2%,未來(lái)會(huì)停漲嗎?

數(shù)字財(cái)經(jīng)智庫(kù)
2025-07-12 12:32:39
印航空難發(fā)動(dòng)機(jī)燃料供應(yīng)為何被切斷?飛行員:我沒(méi)關(guān) 飛機(jī)曾兩次更換燃油控制模塊

印航空難發(fā)動(dòng)機(jī)燃料供應(yīng)為何被切斷?飛行員:我沒(méi)關(guān) 飛機(jī)曾兩次更換燃油控制模塊

紅星新聞
2025-07-12 12:31:39
曝溫州突發(fā)命案致2死:兩男爭(zhēng)KTV一女子,細(xì)節(jié)披露,女方照片曝光

曝溫州突發(fā)命案致2死:兩男爭(zhēng)KTV一女子,細(xì)節(jié)披露,女方照片曝光

博士觀察
2025-07-11 20:23:16
獅子大開(kāi)口!籃球媒體人:洛夫頓開(kāi)天價(jià)工資,上海隊(duì)左右為難

獅子大開(kāi)口!籃球媒體人:洛夫頓開(kāi)天價(jià)工資,上海隊(duì)左右為難

體育哲人
2025-07-12 23:05:50
京東方被曝獲批iPhone 17 Pro/Max屏幕,僅供中國(guó),網(wǎng)友:麻木了

京東方被曝獲批iPhone 17 Pro/Max屏幕,僅供中國(guó),網(wǎng)友:麻木了

路飛寫代碼
2025-07-12 10:58:50
給一家小餐館的45萬(wàn)元罰單,說(shuō)開(kāi)就開(kāi)說(shuō)撤就撤?

給一家小餐館的45萬(wàn)元罰單,說(shuō)開(kāi)就開(kāi)說(shuō)撤就撤?

南方都市報(bào)
2025-07-12 12:08:32
2025-07-13 04:20:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
15402文章數(shù) 513891關(guān)注度
往期回顧 全部

科技要聞

Kimi深夜整活,開(kāi)源了首個(gè)萬(wàn)億參數(shù)模型

頭條要聞

尹錫悅被收押后 身邊人士稱其或申請(qǐng)前往外部醫(yī)院治療

頭條要聞

尹錫悅被收押后 身邊人士稱其或申請(qǐng)前往外部醫(yī)院治療

體育要聞

夏聯(lián)-開(kāi)拓者大勝勇士 楊瀚森首秀10+4+5+3帽

娛樂(lè)要聞

鹿晗賬號(hào)解禁后首曬自拍,漲粉超400萬(wàn)

財(cái)經(jīng)要聞

中國(guó)超半數(shù)城市人口下滑,什么信號(hào)?

汽車要聞

小米YU7深度試駕:優(yōu)點(diǎn)很多缺點(diǎn)也很多

態(tài)度原創(chuàng)

房產(chǎn)
親子
家居
藝術(shù)
公開(kāi)課

房產(chǎn)要聞

8大新盤曝光!2025下半場(chǎng),廣州主城開(kāi)卷廝殺!

親子要聞

妹妹:必須得喝,不喝不行~

家居要聞

生活憧憬 自由浪漫之境

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 邢台县| 福州市| 宾阳县| 胶州市| 孟州市| 大英县| 琼中| 青阳县| 威海市| 库车县| 苏尼特左旗| 惠水县| 达州市| 怀柔区| 陵川县| 平江县| 青川县| 颍上县| 兖州市| 防城港市| 昌都县| 合山市| 永丰县| 明水县| 长泰县| 襄汾县| 丽江市| 宾阳县| 武邑县| 威远县| 临汾市| 乌鲁木齐市| 奇台县| 松溪县| 长顺县| 南皮县| 张掖市| 耒阳市| 抚松县| 富宁县| 英山县|