99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易科技 > 網易科技 > 正文

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

0
分享至
劃重點
  • 01 Grok 4發(fā)布了兩個版本:Grok 4和 Grok 4 Heavy;
  • 02 Grok 4目前只限付費用戶使用,最強的 Grok 4 Heavy 訂閱費達300美元/月;
  • 03 此前相傳的 Grok 4 Code 并未正式公布, 可能在8月發(fā);
  • 04 Grok 4 同時開放了 API 的權限,定價每百萬 tokens 輸入3美元,輸出 15 美元;
  • 05 xAI 路線圖:8月發(fā)編碼模型、9月發(fā)多模態(tài)代理、10月發(fā)視頻生成模型。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

出品 | 網易科技《態(tài)度》欄目

作者 | 袁寧

編輯 | 丁廣勝

相比GPT 5的遲遲未到,以及DeepSeek的一次次小更新。跳過“3.5”,馬斯克直接甩出版本“4”。

北京時間7月10日中午,馬斯克的人工智能公司 xAI 終于發(fā)了最新模型Grok4——不過,發(fā)布會依然遲到一個多小時。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

值得注意的是,在Grok4發(fā)布的前一周,xAI才剛剛再獲百億美元融資,估值飆至1130億,僅次于 OpenAI的3000億美元,遠超 Claude 背后 Anthropic 的615億美元。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

不知道是不是被Grok反猶言論引發(fā)的爭議影響,這次發(fā)布會中,馬斯克看起來沒有往日興奮。

但這并沒有影響他在直播中火力全開:Grok 4被他描述為“比所有研究生都聰明”,“全面超越博士水準,沒有例外”,甚至放話稱它將在明年開始“發(fā)明新技術”。

兩個版本,最高訂閱費300美元/月

此次發(fā)布的 Grok 4分為兩個版本

其中Grok 4為標準版本,支持單代理推理;Grok 4 Heavy為多代理版本。兩者均為純推理模型,上下文窗口最高支持256K tokens。

費用方面,Grok 4目前僅面向付費用戶開放,而SuperGrok Heavy 版本的訂閱費甚至高達300美元/月,遠超 OpenAI Pro 200美元/月的費用。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

同時,xAI 也同步開放了 Grok 4的 API 權限,支持文字與視覺輸入、文字輸出,定價為每百萬 tokens 輸入3美元、輸出15美元。

拿下“人類最后的考試”最高分

了解了模型的基本信息,下面來看最直觀的各個測評得分。這部分在正式發(fā)布之前,X上就陸續(xù)有博主爆料。現在答案終于揭曉。

首先是Grok 4在“人類的最后考試” HLE(Human Level Evaluation) 中的表現。這個測試包含2500個專家級問題,涵蓋上百個學科,被稱為超高難度基準測試。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

數據顯示,Grok 4無工具版本達到25.4%(也就是解決了25.4%的問題),使用工具后升至于38.6%。

Grok 4 Heavy甚至取得了44.4% 的成績,直接大幅超越Google Gemini 2.5 Pro 26.9%的成績。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

此外,在各項主流測評榜中,Grok 4 Heavy 也幾乎都拿下第一。其中GPQA得分88-89,刷新記錄;在AIME25數學競賽題中,Grok 4 Heavy 更是幾乎取得滿分。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

官方稱,Grok 4的訓練量是 Grok 2的100倍,其中推理相關數據的訓練量更是提升了10倍。

用工具來理解世界

xAI 表示,Grok 4的強項是“用工具來理解世界,并用來完成任務”。發(fā)布會上展示了多項具象能力,包括:

現實預測:分析 Polymarket 上的棒球比賽賠率,識別賠率誤差并計算出 Alpha;

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

科學模擬生成:生成黑洞碰撞的 HTML 動畫,調用文獻檢索、代碼生成、圖形渲染等多個工具;

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

主觀概念理解:識別“最古怪的員工頭像”,展現出對“古怪”這種模糊定義的理解;

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

語音生成:新增五種擬人化聲音,“Eve”可即興演唱歌劇,端到端延遲減半,語音更自然。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

發(fā)布會上,xAI 還公布了接下來幾個月的產品節(jié)奏:

  • 8月:專用編碼模型(Grok Code)上線;
  • 9月:發(fā)布多模態(tài)代理(Multi-modal Agent);
  • 10月:發(fā)布視頻生成模型(Video Generation Model);

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

模型之外,系統(tǒng)問題仍待解

然而,就在發(fā)布會前一周,Grok 聊天機器人卻因一系列激進內容上了頭條。

Grok 3在 X 平臺連發(fā)數條反猶言論,稱贊希特勒、使用“MechaHitler”作為自稱,甚至被網友截圖記錄其對用戶發(fā)布仇恨內容。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

xAI 被迫緊急刪除相關帖子,并發(fā)聲明稱“將積極處理不當內容,禁止仇恨言論”。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

而這場爭議正好發(fā)生在馬斯克宣稱 Grok “重大升級”的同一周——7月4日,他在 X 上寫道,“你們應該能感受到變化”。兩天后,Grok 的提示詞更新為:

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

“不會回避政治不正確的表達,只要有證據支撐。”但在后續(xù)更新中,該提示詞被移除。

這些問題的背后是 xAI 的獨特路徑——借助社交平臺 X 上億級用戶的實時行為數據,xAI 構建起一個“內容即數據、平臺即分發(fā)”的 AI 閉環(huán)生態(tài)。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

自3月份完成對 X 的全資收購后,xAI 更是將 Grok 系列深度綁定在平臺底層。

此次發(fā)布會上,馬斯克并沒有對爭議問題進行直接回應。

馬斯克的最貴模型Grok4,能碾壓人類博士,但“三觀不正”他沒提

Grok 4無疑是一項突出的技術成就。但它的發(fā)布,也再次提醒我們:

當模型在表現出博士后級別推理能力的同時,也仍可能發(fā)出極端言論,真正的問題早已不只是技術維度,而是整個訓練、部署、治理機制的系統(tǒng)問題。

在 AI 正以每月為單位發(fā)生躍遷的時代,如何在創(chuàng)造力與約束之間找到邊界?如何保證“聰明的大腦”不成為“失控的擴音器”?

這,或許與模型SOTA 一樣值得關注。

相關推薦
熱點推薦
33歲大齡剩女吐槽相親男吃幾次飯就想確定關系,評論區(qū)罵聲一片

33歲大齡剩女吐槽相親男吃幾次飯就想確定關系,評論區(qū)罵聲一片

阿會情感
2025-06-01 12:40:06
怎么看待復旦大學新聞學院特聘教授李泓冰:“西方偽史論最大的危害是否定改革開放”?

怎么看待復旦大學新聞學院特聘教授李泓冰:“西方偽史論最大的危害是否定改革開放”?

木子君的小屋
2025-07-09 10:41:41
沒空調、住單間!尹錫悅再被捕,首日餐食住宿曝光

沒空調、住單間!尹錫悅再被捕,首日餐食住宿曝光

南方都市報
2025-07-10 15:20:28
世聯(lián)賽積分榜:中國女排還差1勝+3分晉級,總決賽資格已定5席

世聯(lián)賽積分榜:中國女排還差1勝+3分晉級,總決賽資格已定5席

燒體壇
2025-07-10 07:55:47
美記:經紀人們現在不開心 要么頂薪要么底薪 中等合同基本沒了

美記:經紀人們現在不開心 要么頂薪要么底薪 中等合同基本沒了

直播吧
2025-07-10 11:38:38
事實證明,被稱作“主持人的渣男”水均益,已經走上了一條不歸路

事實證明,被稱作“主持人的渣男”水均益,已經走上了一條不歸路

坦然風云
2025-04-01 19:57:41
雨傘雨衣通通不管用,北京城區(qū)早高峰暴雨來襲,氣象臺預報周五起將迎“桑拿天”

雨傘雨衣通通不管用,北京城區(qū)早高峰暴雨來襲,氣象臺預報周五起將迎“桑拿天”

紅星新聞
2025-07-10 15:44:29
亞馬爾穿清華附中19號球衣抵達天足錄制現場,獲贈小孩哥折扇

亞馬爾穿清華附中19號球衣抵達天足錄制現場,獲贈小孩哥折扇

懂球帝
2025-07-10 14:40:25
李嘉誠再失體面!霍震霆一行參觀山東艦,被贊這才是真正名門氣場

李嘉誠再失體面!霍震霆一行參觀山東艦,被贊這才是真正名門氣場

銀河史記
2025-07-08 17:13:02
演啥火啥!劉念短劇全爆,搭誰誰紅,真的太神了

演啥火啥!劉念短劇全爆,搭誰誰紅,真的太神了

橙星文娛
2025-07-10 11:17:40
巴西沒鎮(zhèn)住印度,莫迪當著所有成員砸場子,與中方唱反調

巴西沒鎮(zhèn)住印度,莫迪當著所有成員砸場子,與中方唱反調

一個有靈魂的作者
2025-07-09 17:17:58
《掃毒風暴》明晚中央八套開播!陣容強大,國家一級演員領銜主演

《掃毒風暴》明晚中央八套開播!陣容強大,國家一級演員領銜主演

尋墨閣
2025-07-10 12:46:52
阿薩德出逃揭秘:路上被兩架戰(zhàn)機鎖定,一部中國手機讓他絕處逢生

阿薩德出逃揭秘:路上被兩架戰(zhàn)機鎖定,一部中國手機讓他絕處逢生

歷史八卦社
2025-04-11 17:16:04
血鉛異常兒童家長不認可棗發(fā)糕是病因,多名家長發(fā)聲!

血鉛異常兒童家長不認可棗發(fā)糕是病因,多名家長發(fā)聲!

大象新聞
2025-07-08 09:00:07
欣旺達:公司計劃2026年推出第一代全固態(tài)電池產品;2027年推出第二代全固態(tài)電池產品

欣旺達:公司計劃2026年推出第一代全固態(tài)電池產品;2027年推出第二代全固態(tài)電池產品

每日經濟新聞
2025-07-10 18:13:47
郭德綱還是太體面,放下恩怨,深夜悼念楊少華,曾被楊議罵"扒灰"

郭德綱還是太體面,放下恩怨,深夜悼念楊少華,曾被楊議罵"扒灰"

尋墨閣
2025-07-10 12:44:23
我年薪100萬,婆婆逼我給小叔100萬,否則凈身出戶,我1句話全家傻眼

我年薪100萬,婆婆逼我給小叔100萬,否則凈身出戶,我1句話全家傻眼

紅豆講堂
2025-07-10 07:20:04
奇怪!公安院校錄取分,居然都跌了!

奇怪!公安院校錄取分,居然都跌了!

勛哥教你填志愿
2025-07-10 17:14:16
《以法之名》結局是好的!好的是:萬海不是黑社會,壞的是:死了

《以法之名》結局是好的!好的是:萬海不是黑社會,壞的是:死了

娛樂故事
2025-07-10 20:57:24
許家印曝出大瓜,還有兩孩子!

許家印曝出大瓜,還有兩孩子!

梳子姐
2025-03-20 11:31:08
2025-07-11 01:48:49

科技要聞

Grok4最貴訂閱月費2千,會不會三觀不正?

頭條要聞

退休人員基本養(yǎng)老金為何上調2% 人社部發(fā)文回應

頭條要聞

退休人員基本養(yǎng)老金為何上調2% 人社部發(fā)文回應

體育要聞

白衣生涯最后一舞,但魔笛的故事還沒結束

娛樂要聞

宋佳,真的好叛逆!

財經要聞

潮玩規(guī)模破千億的幕后故事

汽車要聞

靠譜奶爸的底氣 樂道L90靜態(tài)體驗

態(tài)度原創(chuàng)

時尚
親子
房產
家居
公開課

我完美的發(fā)型被回南天做局了……

親子要聞

老婆懷孕了想吃40元一斤的草莓,經濟一般該買嗎?

房產要聞

重磅!招商+平安出手,拿下海南440畝灣區(qū)大盤!

家居要聞

美式簡約 奢華不失優(yōu)雅

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版
×
主站蜘蛛池模板: 大埔区| 荥经县| 盐亭县| 平江县| 三穗县| 南漳县| 扎鲁特旗| 东至县| 平利县| 教育| 辛集市| 鸡西市| 中宁县| 通榆县| 章丘市| 德格县| 思南县| 安溪县| 鸡东县| 个旧市| 广丰县| 连城县| 十堰市| 房产| 永城市| 桃江县| 营口市| 闸北区| 乐至县| 罗田县| 任丘市| 晴隆县| 永丰县| 通化县| 咸丰县| 克什克腾旗| 慈溪市| 榕江县| 商河县| 阜康市| 莎车县|