99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

地表最強Grok3突襲免費體驗,網(wǎng)友實測對比DeepSeek,發(fā)現(xiàn)中文彩蛋

0
分享至

AI好好用報道

編輯:Sia

又是一個文理兼修的優(yōu)等生,能薅一點是一點。

好消息!好消息!

堆了20萬張 GPU、號稱「地表最強」大模型 Grok-3已經(jīng)可用啦。

這兩天,網(wǎng)友們已陸續(xù)曬出截圖:


作為非付費用戶,我們昨天只能旁觀 Grok 3,今兒突然可以免費體驗部分功能。

但,次數(shù)有限 !


由此看來,Grok 3 ( beta )提供「三件套」服務(wù)(除了基礎(chǔ)模型)。

Thinking是指啟動推理模型。

對此,AI 大神 Andrzej Karpathy 快速體驗后,評價說:

「 Grok 3 + Thinking 感覺與 OpenAI 最強商用模型(o1-pro,200美元/月)的頂尖水平相差無幾,

比 DeepSeek-R1和 Gemini 2.0 Flash Thinking 要稍微強點兒。 」


Thinking 模式

DeepSearch, 對標(biāo) OpenAI「深度研究」功能,解決更加復(fù)雜困難的問題。


DeepSearch 模式

Big Brain可能是指推理模型 + 更多思考時間,類似 OpenAI o3 mini high。

要體驗完整的 Grok3 「三件套」,大伙兒可得破費了。

即使是premium+用戶也無法使用最強的推理( Think )和深度搜索( DeepSearch ),還必須訂閱新服務(wù) SuperGrok。

一頓操作下來,月費估計要50美金。


就刷榜成績來說, Grok-3表現(xiàn)確實不俗。

準(zhǔn)確地說,Grok 3是一個系列,不只是某一個模型。輕量版本 Grok 3 mini 可以更快地回答問題,但會犧牲一些準(zhǔn)確性。

數(shù)理編程上,Grok 3都大幅超過 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 和 GPT-4o。

而這些被用來對比的模型的性能,與輕量版本 Grok-3 mini 相近。



在大模型競技場 Chatbot Arena(LMSYS)中,早期 Grok-3版本的得分取得了第一,達到1402分(有史以來第一個),超過了包括 DeepSeek-R1在內(nèi)的所有其他模型。

馬斯克直言:Grok 3比 Grok 2 「好10倍」!

網(wǎng)友們也迫不及待地開始整活了。


意外啊

居然是中文寫作高手

最讓人意外的是,從刷榜成績來看,明明是個優(yōu)秀理科生,偏被中文網(wǎng)友發(fā)現(xiàn)中文寫作水平真高!


一位科技博主讓 Grok 3寫了一篇《我的故鄉(xiāng)回憶》,直接把我看感動了!

「海就像村里的鐘......日子就得跟著海走。」多好的句子啊!

煤油燈、番薯粥、咸魚干配粥、咯吱作響的竹床、老師的吼一嗓子、同宗同族、祠堂議事、「吵歸吵,鬧歸鬧,遇事還是齊心」

......

充滿鄉(xiāng)土氣息的日常文化符號,讓一個90年代的泉州小漁村躍然紙上,也暗示了時代變遷。


來自x網(wǎng)友@imxiaohu

立刻有網(wǎng)友讓 DeepSeek 也如法炮制一篇《我的高中》。

DeepSeek 也很擅長日常細節(jié),怎么說呢,這些細節(jié)加起來并沒有產(chǎn)生一加一大于二的效應(yīng),不如 Grok 3的深刻,情感觸動也不那么明顯。


來自X@@Louis_Chenxf。提示詞,分析一下上面這篇文章 的寫作風(fēng)格,寫一篇題為《我的高中生活》的文章,長度也和例文一致。

至于最后出場的 OpenAI o1 Pro,就像背了一堆典范作文、好詞好句的人,寫成的應(yīng)試文。


來自X@howie_serious

DeepSeek 毒舌功力已經(jīng)眾人皆之,網(wǎng)友發(fā)現(xiàn) Grok 3辣評能力也是沒有瓶頸!

讓它犀利點評自己的推文,因為沒告訴具體賬號,這位網(wǎng)友先被 Grok 3懟了一臉。告知賬號后,Grok 3開始毒舌,就連拍它馬屁的推文也被懟:

夸得那么猛,也不怕把自己舌頭閃了?光吹不給證據(jù),跟放空炮有啥區(qū)別?

吹牛不帶喘氣、細節(jié)一抓就漏風(fēng) ......


Think 模式

確實是個理科高手

這些只是開胃菜。

作為一個數(shù)理編程的強者,網(wǎng)友們分享最多的是 Grok3強大代碼能力,簡直是游戲開發(fā)者的福音。

比如,用 python 編寫一個在正方形內(nèi)彈跳的黃色小球的腳本,正確處理碰撞,使正方形緩慢旋轉(zhuǎn)。


下面是 DeepSeek R1(左)、o1-pro(右)的結(jié)果。


繼續(xù)輸入提示詞:

put the ball in a tesseract instead of a square

就有了下面這個結(jié)果。

這里只是基礎(chǔ)模型,沒有啟動「 Think 」、「 Big Brain 」哦。


還能再復(fù)雜一些嗎?


來自x@_akhaliq prompt: Write a p5.js script that simulates 25 particles in a vacuum space of a cylindrical container, bouncing within its boundaries. Use different colors for each ball and ensure they leave a trail showing their movement. Add a slow rotation of the container to give better view of what's going on in the scene. Make sure to create proper collision detection and physic rules to ensure particles remain in the container. Add an external spherical container. Add a slow zoom in and zoom out effect to the whole scene.

這是一個連馬斯克本人都點贊的演示,看看 DeepSearch + Think 能創(chuàng)造什么?

網(wǎng)友讓 DeepSearch 幫忙用 p5.js(一個網(wǎng)頁動畫工具)復(fù)刻《 Flappy Bird 》小游戲,它先幫忙從網(wǎng)上找好了游戲素材和圖片。

然后,在同一個聊天窗口里啟動 Think 模式,AI 就自動把完整的游戲代碼給寫出來了。

結(jié)果,Run 一次就成功。


來自x@CrisGiardina DeepSearch Prompt: Write a p5js implementation of Flappy Bird. It must be extremely polished, and I want you to use actual sprites or images for all the elements, which you need to find online. Think Prompt: now create a code block with the entire correct code please

AI 大神 Andrzej Karpathy 也讓模型通過代碼動態(tài)生成一個可交互的《卡坦島》風(fēng)格游戲地圖。目前,很少有模型能穩(wěn)定地完成這個任務(wù)。

結(jié)果,只有 Grok 3 (「Think 」)、OpenAI(如 o1-pro,月費$200)可以實現(xiàn)。

而 DeepSeek-R1、Gemini 2.0 Flash Thinking、Claude 均告失敗 。


謝耳朵玩的就是《卡坦島》風(fēng)格游戲。

除了代碼和復(fù)雜邏輯推理, Andrzej Karpathy 發(fā)現(xiàn),在數(shù)學(xué)推理、探索解決黎曼猜想的測試中,Grok 3(「Think 」)也都表現(xiàn)不俗。

特別是針對黎曼猜想,Grok 3(和 DeepSeek R1 )表現(xiàn)出探索意愿,而其他模型會立即放棄并僅回復(fù)「這是未解難題」。

一些常見的陷阱題目也難不到它,但要打開「 Think 」。

Grok 3知道 strawberry 中有3個「 r 」。它還告訴我 LOLLAPALOOZA 中有4個「 L 」。


Grok 3告訴我9.11比9.9小。


DeepSearch 模式

挑戰(zhàn) OpenAI ?還嫩了些

不過,對標(biāo)OpenAI「深度研究」的 DeepSearch,它明顯不如前者。

Andrzej Karpathy 的評價是:

優(yōu)于 Perplexity 的類似功能,弱于:OpenAI 近期發(fā)布的「深度研究」工具。

作為一個 AI 研究助手,搜索范圍要廣、盡量全,而且來源是真實、可靠的。

如果具有洞察力,那更好。

而 AK 發(fā)現(xiàn)了幻覺問題,有時會編造根本不存在的網(wǎng)頁鏈接,也會對事實做出錯誤陳述,數(shù)據(jù)統(tǒng)計上也存在問題。

其他網(wǎng)友也發(fā)現(xiàn)了類似問題。


除了幻覺問題,在信息搜尋力度上,不如 Google Deep Research 全面,分析信息時,洞察力也不如 OpenAI 的 Deep Research ,「還處在早期階段」。

例如,談到軟件企業(yè)如何應(yīng)對創(chuàng)新者困境,谷歌的研究助手引用了80多個來源,Grok3最少。

OpenAI 研究助手也只引用了29個來源,但分析洞察能力很強。


米勒德·菲爾莫爾(Millard Fillmore)作為美國第13任總統(tǒng)(1850-1853 ),其任內(nèi)最具爭議的舉措是簽署了加強《逃奴法》的《 1850年妥協(xié)法案》。

關(guān)于他是否違反憲法的問題,是一個非常復(fù)雜的法律問題,但 Grok 3的研究結(jié)論似乎不這么認(rèn)為。

而 OpenAI 研究助手明顯要審慎多得多。


始終翻不過的山

遺憾的是,大模型講笑話真的很爛,Grok 3的幽默感也沒有明顯改善。

看來,思考推理能力對于幽默來說,更像是砒霜?


至于倫理問題上,比如為救百萬人該不該錯誤鑒定別人的性別?大模型們?nèi)匀徊簧朴趹?yīng)對。

要么打太極,而 Grok 3直面難題后,結(jié)論又明顯功利主義了。


最離譜的當(dāng)屬 SVG 繪圖挑戰(zhàn)賽!

讓 AI 用代碼畫鵜鶘騎自行車,就像讓它閉著眼睛拼樂高——生成的矢量圖坐標(biāo)歪七扭八,活脫脫抽象派賽博藝術(shù)。

畢竟對 AI 來說,在2D 網(wǎng)格上布置許多圖形元素,就像讓盲人指揮交通,結(jié)果比畢加索的畫還魔幻。


以后我們會帶來更多好玩的AI用例,也歡迎大家進群交流。

? THE END

轉(zhuǎn)載請聯(lián)系本公眾號獲得授權(quán)

責(zé)任編輯:郭鵬_NO4657

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
41歲男子失業(yè)崩潰!中年就業(yè)困境誰來解?

41歲男子失業(yè)崩潰!中年就業(yè)困境誰來解?

野薔薇觀察所
2025-05-29 17:21:12
明天端午節(jié),別忘“吃二樣,做二事,忌二事”,平安快樂過端午!

明天端午節(jié),別忘“吃二樣,做二事,忌二事”,平安快樂過端午!

雪峰兒
2025-05-30 04:29:42
哈利晉級戰(zhàn)7中2引熱議:本西附體成拒投 超級巨星地位如布朗尼

哈利晉級戰(zhàn)7中2引熱議:本西附體成拒投 超級巨星地位如布朗尼

顏小白的籃球夢
2025-05-30 10:47:33
這才是日軍的真實相貌,不是演員飾演的!

這才是日軍的真實相貌,不是演員飾演的!

年代回憶
2025-05-20 20:04:31
“沒有一個人骨瘦如柴 所以加沙沒有大規(guī)模饑荒”

“沒有一個人骨瘦如柴 所以加沙沒有大規(guī)模饑荒”

北青網(wǎng)-北京青年報
2025-05-29 09:38:03
拒絕1-4出局!尼克斯17分大勝扳回一城,雙核56分打爆大黑馬

拒絕1-4出局!尼克斯17分大勝扳回一城,雙核56分打爆大黑馬

體壇小李
2025-05-30 10:39:29
綠卡換發(fā)門檻今起提高:移民局新規(guī),有這些問題直接拒收

綠卡換發(fā)門檻今起提高:移民局新規(guī),有這些問題直接拒收

紐約時間
2025-05-30 03:21:17
女跑者穿瑜伽褲,那條線讓人浮想聯(lián)翩

女跑者穿瑜伽褲,那條線讓人浮想聯(lián)翩

跑者排球視角
2025-05-07 21:04:51
全是唏噓!《折腰》36集大結(jié)局:大喬自盡,魏梁戰(zhàn)死,蘇娥皇殉情

全是唏噓!《折腰》36集大結(jié)局:大喬自盡,魏梁戰(zhàn)死,蘇娥皇殉情

頭號劇委會
2025-05-30 01:15:03
郭晶晶出席霍家游艇會,穿藍裙獨自上臺演講,一家主母就是大氣

郭晶晶出席霍家游艇會,穿藍裙獨自上臺演講,一家主母就是大氣

史行途
2025-05-29 16:04:18
外孫百日宴,我發(fā)8萬8紅包,女兒回了9個字,我立刻把錢要了回來

外孫百日宴,我發(fā)8萬8紅包,女兒回了9個字,我立刻把錢要了回來

流螢敘情
2025-05-27 17:17:41
該來的來了,李嘉誠的公司出事了~

該來的來了,李嘉誠的公司出事了~

哲叔視野
2025-05-29 15:07:12
難評!68歲單身老漢每天守村口,等"國家發(fā)的老婆",還想的睡不著

難評!68歲單身老漢每天守村口,等"國家發(fā)的老婆",還想的睡不著

派大星紀(jì)錄片
2025-05-29 18:30:29
安德列娃:我更希望先贏得一個大滿貫而非成為世界第一

安德列娃:我更希望先贏得一個大滿貫而非成為世界第一

懂球帝
2025-05-30 04:32:25
你只是死了女兒,我卻連家都不能回!成都兇案家屬逆天言論惹眾怒

你只是死了女兒,我卻連家都不能回!成都兇案家屬逆天言論惹眾怒

吭哧有力
2025-05-28 20:53:24
一中學(xué)生舉報同學(xué)帶平板被打傷!法院:鼓勵互相檢舉的學(xué)校應(yīng)擔(dān)責(zé)三成

一中學(xué)生舉報同學(xué)帶平板被打傷!法院:鼓勵互相檢舉的學(xué)校應(yīng)擔(dān)責(zé)三成

景來律師
2025-05-30 00:08:32
從央視主持人到芳心縱火犯,藏13年的撒貝寧,終于露出真面目

從央視主持人到芳心縱火犯,藏13年的撒貝寧,終于露出真面目

七公子娛樂
2025-05-27 23:02:37
丟人丟到國外了?萬千惠袒胸露乳走紅毯,被多次驅(qū)趕還賴著不走

丟人丟到國外了?萬千惠袒胸露乳走紅毯,被多次驅(qū)趕還賴著不走

聚合大娛
2025-05-28 16:12:33
0.04秒絕殺!中國隊終于奪冠,12年,等了整整12年,十大官媒盛贊

0.04秒絕殺!中國隊終于奪冠,12年,等了整整12年,十大官媒盛贊

悠閑歷史
2025-05-29 17:21:07
退回“村西頭”,美國外交國策發(fā)生方向性轉(zhuǎn)向

退回“村西頭”,美國外交國策發(fā)生方向性轉(zhuǎn)向

獨立寒秋看世界
2025-05-29 21:09:23
2025-05-30 11:24:49
AI好好用 incentive-icons
AI好好用
探索人工智能應(yīng)用場景及商業(yè)化
2096文章數(shù) 4432關(guān)注度
往期回顧 全部

科技要聞

理想真正硬仗是i8/i6!要如何迎戰(zhàn)小米YU7

頭條要聞

牛彈琴:美國政府一日三變殺瘋了 全世界目瞪口呆

頭條要聞

牛彈琴:美國政府一日三變殺瘋了 全世界目瞪口呆

體育要聞

當(dāng)我終于回國時,可能已認(rèn)不出我的家

娛樂要聞

19歲榮梓杉被曝心肌炎復(fù)發(fā)情況危急?

財經(jīng)要聞

美國政府殺瘋了,全世界目瞪口呆

汽車要聞

約合人民幣47.10萬元起 阿維塔11在香港上市

態(tài)度原創(chuàng)

家居
游戲
旅游
手機
公開課

家居要聞

原木純白 邂逅自然本真

《漫畫英雄對卡普空2》推出25周年紀(jì)念人偶 還原經(jīng)典

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

手機要聞

OPPO堆料太猛 下一代旗艦要用雙2億像素鏡頭

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 龙海市| 高安市| 龙山县| 牙克石市| 会东县| 秦皇岛市| 新兴县| 陵川县| 龙山县| 蓝山县| 天镇县| 磐石市| 隆回县| 平利县| 肃北| 长阳| 乐都县| 始兴县| 寿光市| 武山县| 微山县| 保靖县| 九寨沟县| 铜鼓县| 福建省| 连江县| 清苑县| 侯马市| 三河市| 岢岚县| 灵武市| 定日县| 稻城县| 南澳县| 彰武县| 司法| 铜川市| 龙川县| 即墨市| 凌海市| 六枝特区|