99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Grok3登上美區榜一!我們把它和DeepSeek對比了下:馬斯克沒瞎說

0
分享至

  AI好好用報道

  編輯:楊文

馬斯克在線玩梗。

  昨天,號稱「地表最強」的 Grok3 突然上線。

  我們第一時間沖到了「吃瓜前線」,體驗了一把它的「Think」模式,但僅問了兩個問題,它就「罷工」讓付費。

  就在我們充了會員后,就看到馬斯克這哥們在 X 上高調宣布:

  Grok3 免費,直到把服務器干崩!

  (編輯部內心 OS:不早說,白瞎了我們白花花的銀子。)

  

  當然了,付費用戶 X Premium + 和 SuperGrok 用戶將獲得更多 Grok 3 的訪問權限,此后還可以提前使用語音模式等高級功能。

  隨著馬斯克大手一揮,Grok3 的流量瞬間超過 ChatGPT,并登上了美區免費應用排行榜第一。

  

  

  經此一役,馬斯克腰桿也硬了,直接在 X 上玩起了梗,求奧特曼此刻的陰影面積。

  

  至于 Grok3 的實力,社交平臺眾說紛紜。

  有網友認為,Grok3 是最好的大模型,因為它比 GPT-4o 快得多,「Think」模式完美適配提示指南,更便宜,UI 更簡潔美觀。

  

  https://x.com/Yuchenj_UW/status/1892634804786757712

  還有網友質疑馬斯克投機取巧,設置 Prompt 讓人以為知識庫實時更新,實際上模型數據截止到 2024 年 7 月。

  

  https://x.com/dotey/status/1892602321500094683

  接下來,我們決定搞個一手實測,讓 Grok3 和 DeepSeek-R1 來個同臺競技。

  Think功能:Grok3確實有兩把刷子

  前幾天的發布會上,馬斯克把 Grok3 夸得天花亂墜,還。

  其中在編程、數學、創意寫作、指令遵循、長查詢、多輪對話等多個維度上,Grok3 都排第一。

  

  既然如此,我們就先來測測中美這倆最強大模型的「深度思考」功能。

  打開 Grok3 的「Think」按鈕,問出第一個問題:mississippi 有幾個 i?

  

  之前曾難倒一眾大模型的經典問題,Grok3 花了 8 秒就做對。

  它先是逐個檢查每個字母是不是 i,然后還用另一種方法驗證。

  

  DeepSeek-R1 雖用時久一點,但也回答正確。 它的思路和 Grok3 一致,也學會反復驗證。

  

  這一局,這倆大模型打了個平手。

  我們又從「弱智吧」中找了道題目:為什么朝九晚五大家能接受,反過來朝五晚九就不行?

  Grok3 一上來就抓住了重點。朝九晚五是 8 個小時,而朝五晚九是 16 個小時,工作時長明顯超出人體承受范圍。

  ?

  遺憾的是,DeepSeek-R1 洋洋灑灑說了一大堆,從生物鐘、通勤聊到文化、法律,就是沒點出工作時長這一根本性的矛盾。

  

  這一局,Grok3 勝!

  再來一道數學題:49 個同學要渡河,渡口有一只能乘上 7 人的空小船,他們要全部渡過河,至少要使用這只小船來回多少次?

  正確答案是 8 次。

  Grok3 這次腦子轉得沒那么快,花了 2 分多鐘才給出正確答案。

  不過它的解題過程倒是清晰,既識別出題目暗含「要有一人撐船」的坑,又逐步模擬了渡河的人數變化。

  甚至最后還推導出了關于渡河這類題目的公式:對于 N 人,容量 C,A 到 B 次數 =(N-1)/(C-1)。

  ?

  DeepSeek-R1 起初腦子很清醒,曉得每次來回的凈運送人數是 6 人,也明白最后一次的特殊情況,但就是在計算總次數時功敗垂成,把最后一次單程未計入來回,算成了 7 次。

  

  這一回,Grok3 贏!

  DeepSearch功能:可搜索X上的信息

  測完了「Think」模式,我們再來測測「DeepSearch」功能。

  最近馬斯克在社交媒體 X 上拋出「重磅炸彈」:美國社會保障系統疑似存在史上最大規模欺詐行為,超 3.94 億人領取社保。

  其中百歲以上老人竟超過 2000 萬,甚至有人年齡高達 360 歲。

  我們就讓這倆大模型介紹一下這事兒的來龍去脈,并上點難度,以表格的形式總結網友評價。

  Grok3 DeepSearch的路徑可以在頁面左側一覽無余。

  了解用戶請求后,開始搜索、瀏覽 Reddit 討論和帖子,然后搜索替代來源,為了信息的準確性,還要驗證用戶信息等。

  

  我們扒了一下它搜索的 52 個信源,涉及 ABC、NBC 等權威媒體以及 reddit 論壇,還有它的優勢所在:社交平臺 X 上的大量數據。

  在回答上,Grok3 給了兩個「版本」。

  一個是直接回答,內容相對簡單,主要是羅列關鍵要點,介紹下背景以及表格形式總結 X 網友評價。

  

  另一個則是「詳細報告」,將該事件的來龍去脈扒了個遍,在每個事實性描述的后面都附上了來源鏈接,以此對抗大模型的幻覺。

  

  DeepSeek 給出的結果更為簡潔清晰,把事情的起因、經過、結果梳理得很有條理。

  

  與 Grok3 一樣,DeepSeek 也給出了相應的參考鏈接,不過它參考的信源均是搜狐、騰訊等國內新聞網站。

  

  與 DeepSeek-R1 不同的是,Grok3 還具有多模態能力。它可以分析總結上傳文件、圖片等。

  不過,該功能與「Think」模式和「DeepSearch」模式不能同時使用。

  我們上傳一張倒置的、模糊的菜單,并讓它回答:不用優惠,菜單上每款點一個,總共需要多少港幣?

  

  該題目出自一個名為「ZeroBench」的視覺基準,20 多個知名模型,首次作答全部是零分。

  Grok3 忙活一大頓,最后算出來錯誤結果。

  因為從第一步單價識別它就「歇菜了」,明明菜單上第一道菜寫的是 88 元,它看成了 18 元,其他菜品的單價也是各有各的錯法。

  

  果然是「地表最難」新基準,「地表最強」的 Grok3 也敗下陣來。

  我們又上傳了一篇名為《LLM Pretraining with Continuous Concepts》的論文,讓它用最通俗易懂的語言介紹一下。

  Grok3 秒出回復,用 AI 小白完全能看懂的語言,把這一復雜高深的新方法解釋得清清楚楚。

  

  看來,AI 愛好者又多了一個讀論文的神器。

  工具鏈接:

  Grok3 鏈接: https://x.com/i/grok

  DeepSeek-R1 鏈接: https://chat.deepseek.com /

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
黃曉明新片官宣,增重30斤演智力障礙人士!

黃曉明新片官宣,增重30斤演智力障礙人士!

先鋒新聞
2025-05-29 07:05:36
小鵬又掀桌子!新款 MONA M03 起售價僅 11.98 萬元,但八成用戶都買頂配

小鵬又掀桌子!新款 MONA M03 起售價僅 11.98 萬元,但八成用戶都買頂配

愛范兒
2025-05-30 11:15:27
馬筱梅帶大S女兒逛公園,貼心幫她背包,小玥兒穿長裙變化大!

馬筱梅帶大S女兒逛公園,貼心幫她背包,小玥兒穿長裙變化大!

古希臘掌管月桂的神
2025-05-30 10:00:54
0.04秒絕殺!中國隊終于奪冠,12年,等了整整12年,十大官媒盛贊

0.04秒絕殺!中國隊終于奪冠,12年,等了整整12年,十大官媒盛贊

悠閑歷史
2025-05-29 17:21:07
臺灣女主持“柯基臀”太誘人,網友:我的菜!!

臺灣女主持“柯基臀”太誘人,網友:我的菜!!

健身迷
2025-05-29 11:12:25
兩條吃相難看的新聞,再一次擊穿底線

兩條吃相難看的新聞,再一次擊穿底線

末名先生
2025-05-28 14:52:12
今天17:00鄭欽文戰姆博科,賽前傳來1個壞消息,基本無緣冠軍了

今天17:00鄭欽文戰姆博科,賽前傳來1個壞消息,基本無緣冠軍了

清游說娛
2025-05-30 09:38:12
宣布了!手腕清創手術!這可是勇士的非賣品

宣布了!手腕清創手術!這可是勇士的非賣品

籃球實戰寶典
2025-05-29 19:54:09
“怎么會有人這樣做?”巴勒斯坦代表淚灑安理會

“怎么會有人這樣做?”巴勒斯坦代表淚灑安理會

看看新聞Knews
2025-05-29 07:51:57
放過“梟龍”,放過殲-10C吧,它們很難大賣的!

放過“梟龍”,放過殲-10C吧,它們很難大賣的!

真知灼健
2025-05-28 10:52:27
央視主持人朱迅在景區救人,黃金救援4小時:從朱迅急救看生存課

央視主持人朱迅在景區救人,黃金救援4小時:從朱迅急救看生存課

甜蜜的糖果島
2025-05-30 09:47:05
鄭州首店停工?胖東來方面回應

鄭州首店停工?胖東來方面回應

環球網資訊
2025-05-30 09:10:15
罕見!中國退居全球第三,25年來第一次,背后信號很不尋常

罕見!中國退居全球第三,25年來第一次,背后信號很不尋常

牛鍋巴小釩
2025-05-25 08:30:30
看病貴啊!深圳網友哭訴,父親持續發熱,僅僅檢查就花了5萬多了

看病貴啊!深圳網友哭訴,父親持續發熱,僅僅檢查就花了5萬多了

火山詩話
2025-05-29 08:08:27
被哄搶,莫蘭德下家3選1,曝遼寧從未聯系周琦,報酬并非600萬

被哄搶,莫蘭德下家3選1,曝遼寧從未聯系周琦,報酬并非600萬

東球弟
2025-05-30 08:56:43
“金牛座”算什么?德國要幫烏克蘭量產遠程巡航導彈:2500公里!

“金牛座”算什么?德國要幫烏克蘭量產遠程巡航導彈:2500公里!

鷹眼Defence
2025-05-29 17:19:04
蘇州女子莫名收到20多條驗證碼,隔天6萬元沒了

蘇州女子莫名收到20多條驗證碼,隔天6萬元沒了

瀟湘晨報
2025-05-30 09:08:08
美暫停中國赴美留學簽證,對學生進行“政審”,這兩類學生受影響

美暫停中國赴美留學簽證,對學生進行“政審”,這兩類學生受影響

一個有靈魂的作者
2025-05-29 11:49:33
突發!俄羅斯功勛指揮官在爆炸中身亡

突發!俄羅斯功勛指揮官在爆炸中身亡

魯中晨報
2025-05-30 08:57:06
檢察官說:公安部的規定不是法律,不用遵守。

檢察官說:公安部的規定不是法律,不用遵守。

程紀念律師
2025-05-29 21:09:07
2025-05-30 11:52:49
AI好好用 incentive-icons
AI好好用
探索人工智能應用場景及商業化
2096文章數 4432關注度
往期回顧 全部

科技要聞

榮耀新CEO放話:下半年重返前三,靠譜嗎?

頭條要聞

女廳官被"雙開":曾花4000萬買別墅 850萬裝修極盡奢華

頭條要聞

女廳官被"雙開":曾花4000萬買別墅 850萬裝修極盡奢華

體育要聞

當我終于回國時,可能已認不出我的家

娛樂要聞

央視主持人朱迅在景區救治高反游客

財經要聞

美國政府殺瘋了,全世界目瞪口呆

汽車要聞

約合人民幣47.10萬元起 阿維塔11在香港上市

態度原創

手機
親子
本地
時尚
公開課

手機要聞

2699元起!華為nova 14今日首銷:麒麟8000+鴻蒙5

親子要聞

孩子寫作業老是彎腰低頭?試試這款坐姿矯正器,養成坐姿好習慣!#坐姿器 #妙學舟 #妙學舟坐姿器 #坐...

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

和劉亦菲一起來場“時裝出逃”的旅行

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 江北区| 阿图什市| 中牟县| 冷水江市| 含山县| 高清| 普定县| 文登市| 讷河市| 石狮市| 澳门| 于都县| 洪江市| 武定县| 太谷县| 大安市| 衡山县| 石棉县| 正安县| 宁阳县| 太谷县| 六盘水市| 博客| 腾冲县| 喀喇沁旗| 安化县| 海淀区| 澄城县| 永修县| 沐川县| 什邡市| 沅江市| 平潭县| 抚顺市| 汽车| 罗甸县| 恩施市| 定远县| 沁源县| 临泽县| 遂平县|