99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

馬斯克最貴 AI 首批實測炸了!Grok 4 一邊封神一邊翻車,網友:2 萬塊就這?

0
分享至

AI 的舞臺,從來不缺「新王登基」的劇情。

接連數月,模型一個接一個輪番登場,一個比一個自稱炸裂。就拿昨天的 Grok 4 來說,馬斯克放話「這是地球上最聰明的 AI」,還沒上線,就已經把話題度拉滿了。

不過, Grok 模型向來 都是跑分沒輸過,體驗沒贏過。

如今,距離 Grok 4 的發布已經過去 24 小時,我們也搜集了 網友分享的一些實測案例 ,讓我們來一起看看這款模型究竟是真有本事,還是又一場火力全開的「高開低走」。


編程:高光與翻車并存

博主 @mckaywrigley 給 Grok 4 Heavy 提出了一道頗有創意的編程題。

讓它用 three.js 創建一個動畫,讓一群人走來走去,最終排出「你好,世界,我是 Grok」的字樣,并完成一次鏡頭切換到鳥瞰視角。Grok 只試了一次,就交出了一份意外驚喜的答卷。


整個過程中,Grok 會主動從網上調用 3D 模型資源,并通過 three.js 在瀏覽器內構建整個場景。可以說,新版 Grok 在 three.js、Blender 等領域的表現有了很大升級。

當然,UI 生成仍是不小的短板。用網友的話來說,「它不是最好的設計師,我真心希望它能在這方面趕上 Claude Opus 4,但在邏輯建模和結構控制方面,它確實有一手。

值得一提的是,Grok 4 Heavy 能夠并行調用多個智能體,各自獨立工作,再匯總結果,從機制上保證輸出質量。


博主 @tetsuoai 則直接把 Grok 4 拉去「上班」,讓其扮演一名有 15 年經驗的 C 語言老程序員, 寫個 CLI 工具來分類整理文件夾里的各種文件。

Grok 的輸出非常「地道」,不僅代碼寫法嚴謹,細節處理也盡顯專業水準——比如 用 strrchr() 提取后綴、用 strdup() 避免懸掛指針、邊界值與隱藏文件也沒落下,連大小寫轉換都用 ctype.h 標準庫兜底。


接著,繼續上強度。

他又讓 Grok 設計一個基于 DQN 強化學習的 2D 自動駕駛模擬,從感知、訓練、碰撞反饋一應俱全。 Grok 一次性給出完整代碼,訓練后的小車還能自主提速刷圈。


另一個測試來自 @DirtyTesLa,他讓 Grok 寫了個網頁小游戲,運行效果意外地順滑,只是游戲個人實力拖了演示 demo 的后腿。


不過,Grok 4 也存在一些實打實的翻車案例。

博主 @karminski3 拿出了自己的經典測試項目——一個 20 個小球在七邊形中彈跳的三維物理測試。Grok 跑了三次,兩次直接顯示語法錯誤,唯一一次成功運行的版本也僅僅「勉強可用」。

對比早期版本的 DeepSeek-R1,Grok 4 并未與其拉開明顯的代差。


他隨后追加了一個更具挑戰性的測試:「煙囪爆破模擬」。

這是一項三維物理構建任務,用 three.js 創建一個煙囪結構,在底部添加爆破點,模擬倒塌效果。看似原理只涉及碰撞與重力,實則考驗模型的指令理解、代碼生成和交互設計能力。


好消息是,它的重力方向沒弄錯,倒塌效果基本成立;但煙囪處于「爆了一半」的狀態,粒子模擬怪異,煙霧渲染模糊,光影效果粗糙,UI 更是一言難盡——按鈕是灰的,肉眼基本看不見。

寫作:智商在線但「情商」掉線

Grok 4 在 192k 上下文 窗口的表現僅次于 Gemini,在 1k 到 120k 的測試中,Grok 4 幾乎一路保持高水準, 說明它在語義連貫、記憶保持上確實有兩把刷子。


當網友讓 Grok 4 寫一首六行詩,要求全詞用 S 開頭,主題還得涵蓋愛情 、背叛、復仇、悲劇、英雄主義五大元素,Grok 居然真寫出來了,而且讀起來還挺順。


不過,要是拉到更宏觀的短篇小說創意寫作基準上來看,Grok 4 拿到的 7.69 分只能算中等水平。


評測團隊的總結比較直接,雖然 Grok 4 能持續產出結構清晰、起承轉合完整的故事,但情節容易套路化、結尾寡淡、語言偏炫技,象征和隱喻也流于表面。

SVG 試煉場 :畫圖裸考來了

讓大模型生成 SVG 圖像,可以更好地評估它們的視覺與空間推理水平,這也是通往 AGI 的關鍵能力之一。Reddit 網友設計了一項任務,讓四款模型在無任何工具輔助的情況下畫圖裸考。

【憑記憶繪制美國地圖】


第一關是讓模型生成美國本土地圖輪廓,Grok 4 的地理細節略糊,但輪廓邏輯還算完整;而 Claude 4 Sonnet 則是唯一一個準確標注三塊區域(美國本土、阿拉斯加、夏威夷)且添加地名的模型,空間感和知識調用都略勝一籌。

【復刻線條漫畫】


當被要求將一幅被拆分為三張小圖的線條漫畫,完整還原為純 SVG 時,Grok 4 表現拔尖,人物動作自然,而 o3 雖然也想拼全圖,但頁面排版混亂,出現文字穿模、對白重疊等問題。

【重構專輯封面】


第三關是讓模型畫出 Radiohead 的《In Rainbows》封面。OpenAI o3 是唯一一個在排版和結構上高度還原的模型,展現出強大的記憶與設計執行力。反觀 Grok 4 構圖稍顯單薄,層次感不足。

【繪制克雷布斯循環示意圖】


在生物圖解任務中,Grok 4 的輸出有板有眼,NADH、ATP、CO? 等關鍵要素一應俱全,邏輯嚴密;Claude 4 Sonnet 視覺層次極強,圖解效果堪比 PPT 模板;o3 的風格則更像課堂板書,信息量簡潔但教學清晰。

【用 SVG 畫出你的自畫像】


最后是讓模型畫出自己,主打一個不限風格。Grok 4 畫了張人臉;Gemini 2.5 Pro 略顯抽象;OpenAI o3 識別度高、親和力強;而 Claude 4 Sonnet 的輸出則頗具現代藝術張力。

可視化:黑洞模擬、 歐拉恒公式、哲學自畫像

網友 @techartist_ 用 Grok 4 編寫了一個交互式 3D 黑洞模擬與可視化項目,使用了 threejs 進行渲染,并結合自定義的 GLSL 著色器,精細地還原了恒星背景以及的震撼視覺效果。


而在更偏「哲學意味」的測試中,@dvorahfr 問了 Grok 一個抽象問題:「如果你必須以肉身形式存在,會是什么樣子?」


博主 @KettlebellDan 要求 Grok 4 用 HTML + JavaScript 創建動畫,幫助理解 歐拉恒公式(e^jπ + 1 = 0),Grok 4 展現出不俗的數學理解與可視化編程能力。


@CommonSenseMars 試圖讓 Grok 寫一段可以直接復制粘貼到 Shadertoy 的 Shader 代碼,用來展示其有多聰明、有多強大。


面對下面這道邏輯測試題,Grok 給出的回答是 B,而正確答案應為 C。


博主 @ai_for_success 上傳了手掌以及鬧鐘 emoji,結果 Grok 4 并未能準確識別圖中手指數目,以及連鬧鐘上的時間也都解讀錯誤。


不過這些問題并非 Grok 獨有,圖像理解類任務本就是目前主流大模型繞不開的難點。哪怕是 Gemini 2.5 Pro 和 OpenAI 的 o3,也在類似測試中翻過車。

推理能力:Grok 4 更會變通,o3 更會算賬

再來看一個復雜的場景推理題:

「如果 A 公司收購了 B 公司,而 B 公司持有 C 公司的債務,那么一旦 C 公司違約,會引發什么法律與財務后果?請完整解釋。」

在網友 @alex_prompter 的這組測試測試中,從整體來看,Grok 4 的表現更勝一籌。它在思維鏈展開、邏輯推理和法律框架建構方面更完整,條理更清晰。


還記得此前 Anthropic 用 Claude Sonnet 3.7 運營一家商店,結果最終以破產收場。對此,沃頓商學院教授 Ethan Mollick 向 o3 和 Grok 4 拋出了一道類似的任務:

請為一家全新的郵購奶酪店構思 20 條創意營銷口號,設定評選標準并選出最優方案;隨后制定完整的財務與市場推廣計劃,視競爭情況進行策略調整;接著使用圖像生成工具設計品牌 logo,構建網站原型,并確保奶酪產品的選擇符合你的市場定位,數量控制在 5 到 10 款之間。

o3 給出的財務預測更復雜、細節更豐富,Grok 4 則在應對競爭對手時,調整能力更強,就整體任務完成度而言,Grok 4 在工具調用和模擬主動執行任務的能力方面稍遜于 o3。


簡言之,Grok 4 并非一無是處。三維生成、邏輯建模、SVG 圖像繪制、超長文本推理等等「硬骨頭」都啃下了不少,展現出不俗的技術深度。但與此同時, UI 設計拉胯,圖像理解「出戲」,甚至在一些基礎編程、寫作任務上有時也會翻車,充分暴露出 Grok 4 模型能力的短板,也讓不少網友直呼「 2 萬塊就這」。

微軟 CEO 納德拉曾一針見血地指出,今天不少大模型正陷入「Benchmark Hacking」的陷阱——模型能在各種基準測試中刷出高分,卻難以應對現實世界的變量。這種毫無意義的基準測試成績作弊,徒有分數,卻無助于實際解決問題。

正如網友調侃的那樣,Grok 4 離 AGI 的「G」還有很長一段距離 。不過,這一切或許都在馬斯克的預期之內。畢竟,他尤其擅長拋出一個看起來領先半個時代的概念,再讓全世界圍觀、發酵、討論。

至于 Grok 4 好不好用,或許不是馬斯克最操心的事。是被夸還是被罵,也沒那么重要。只要 Grok 4 仍舊是地球上話題度最高的 AI,哪怕體驗難言完美,也總有人愿意掏出三千美元,買一張湊熱鬧的門票。

歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
庫里屈居第三!美媒曬NBA控衛TOP25:保羅8歐文11威少12東契奇19

庫里屈居第三!美媒曬NBA控衛TOP25:保羅8歐文11威少12東契奇19

鍋子籃球
2025-07-19 18:01:13
杜建英在美豪宅曝光!99年購入,宗馥莉留學住過,價值300萬美元

杜建英在美豪宅曝光!99年購入,宗馥莉留學住過,價值300萬美元

火山詩話
2025-07-17 19:05:28
賴清德還沒登機臺島,巴拉圭就找臺當局要錢,還希望與大陸做生意

賴清德還沒登機臺島,巴拉圭就找臺當局要錢,還希望與大陸做生意

奇思妙想生活家
2025-07-19 17:23:38
7月19日,多家上市公司發布重大利好利空好消息

7月19日,多家上市公司發布重大利好利空好消息

A股數據表
2025-07-19 05:30:03
名記:開拓者本想沖季后賽 現在卻為下賽季打不了的球員花4000萬

名記:開拓者本想沖季后賽 現在卻為下賽季打不了的球員花4000萬

直播吧
2025-07-19 13:48:07
俄專家:美國現在才發現,中國是天然超級大國

俄專家:美國現在才發現,中國是天然超級大國

星辰夜語
2025-07-18 21:44:14
廣州今夜起將有暴雨,風力增加!廣東多條河流可能有超警洪水

廣州今夜起將有暴雨,風力增加!廣東多條河流可能有超警洪水

南方都市報
2025-07-19 12:16:59
90年山東黑老大聶磊被槍決前冷笑:你們查到的還不到十分之一

90年山東黑老大聶磊被槍決前冷笑:你們查到的還不到十分之一

懸案解密檔案
2025-05-05 20:20:25
外媒:巴西對中國稀土出口量激增

外媒:巴西對中國稀土出口量激增

參考消息
2025-07-18 21:32:29
全場夢游被橫掃!鳳凰組合0-2不敵世界第5,國羽無緣會師混雙決賽

全場夢游被橫掃!鳳凰組合0-2不敵世界第5,國羽無緣會師混雙決賽

生活新鮮市
2025-07-19 17:36:40
知情人曝宗慶后有3個情人,72歲色心不改,小情人曾大鬧總部

知情人曝宗慶后有3個情人,72歲色心不改,小情人曾大鬧總部

葉公子
2025-07-17 11:23:24
下班回家女助理蹭老公車還要坐副駕,我安靜坐后面,到家后老公懵了

下班回家女助理蹭老公車還要坐副駕,我安靜坐后面,到家后老公懵了

小影的娛樂
2025-07-19 10:30:00
預約天府機場貴賓廳要驗資2000萬?銀行回應:屬實,國內僅此一地需驗資

預約天府機場貴賓廳要驗資2000萬?銀行回應:屬實,國內僅此一地需驗資

板扎在線
2025-07-19 07:33:47
47歲女高管與23歲男助理爬山,雙雙墜崖后,警方打開其帳篷愣住

47歲女高管與23歲男助理爬山,雙雙墜崖后,警方打開其帳篷愣住

懸案解密檔案
2025-07-18 15:54:04
林仲勛高調曬未婚妻,申裕斌被封姑奶奶,混雙搭檔的流言徹底破防

林仲勛高調曬未婚妻,申裕斌被封姑奶奶,混雙搭檔的流言徹底破防

永恒之誓
2025-07-19 11:05:08
敘利亞折騰到現在,朱拉尼應該明白了,擺在他面前只有兩條路可走

敘利亞折騰到現在,朱拉尼應該明白了,擺在他面前只有兩條路可走

董董歷史燴
2025-07-19 17:02:11
1975年李富春病逝,蔡暢堅決不許女兒送葬,聶帥出面勸說都沒用

1975年李富春病逝,蔡暢堅決不許女兒送葬,聶帥出面勸說都沒用

柳絮憶史
2025-07-11 11:35:25
布朗尼:我能進入NBA,跟我爸是詹姆斯一點關系都沒有!

布朗尼:我能進入NBA,跟我爸是詹姆斯一點關系都沒有!

田先生籃球
2025-07-19 15:01:41
要警惕時代的進程,歐美關閉當地中國企業,成為一種潮流

要警惕時代的進程,歐美關閉當地中國企業,成為一種潮流

藍色海邊
2025-07-19 09:29:39
中方動真格了!圍堵中國使館,中國正式發函韓國,李在明卻沉默了

中方動真格了!圍堵中國使館,中國正式發函韓國,李在明卻沉默了

格斗聯盟
2025-07-19 18:00:08
2025-07-19 18:55:00
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
5489文章數 26583關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

越南前國家領導人阮春福、武文賞等3人被解除黨內職務

頭條要聞

越南前國家領導人阮春福、武文賞等3人被解除黨內職務

體育要聞

韋德:楊瀚森讓我想起王治郅 打球都非常聰明

娛樂要聞

肖戰微博改名:去掉X玖少年團頭銜

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

時尚
教育
旅游
游戲
軍事航空

造城者“她”,用設計重塑城市溫度

教育要聞

團體第一!全員金牌!中國隊重奪國際數學奧賽冠軍

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

《符文工房:龍之天地》1.0.5版更新 提供多處修復

軍事要聞

特朗普:印巴沖突期間有5架戰機被擊落

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 来安县| 赣榆县| 蒲城县| 乐清市| 射洪县| 高邑县| 修水县| 遵化市| 武清区| 凤阳县| 香港| 济源市| 乐都县| 吴忠市| 偏关县| 商城县| 德阳市| 盐亭县| 秭归县| 安乡县| 留坝县| 荥经县| 咸丰县| 温州市| 图片| 汉源县| 宜都市| 扬中市| 临潭县| 库车县| 当阳市| 墨玉县| 瑞昌市| 开封市| 金堂县| 宜丰县| 东乌| 太原市| 赣榆县| 鱼台县| 邢台市|