網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

新版Gemini 2.5所有榜一，谷歌無(wú)敵了！一個(gè)月全面擊敗o3，編程反超Claude 4

2025-06-06 09:36:54　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：桃子犀牛

【新智元導(dǎo)讀】谷歌深夜攜全新Gemini 2.5 Pro強(qiáng)勢(shì)歸來(lái)，僅用一個(gè)月碾壓舊版Gemini 2.5。數(shù)學(xué)、編程、推理全面封神，穩(wěn)坐所有榜單第一。

凌晨，谷歌帶著全新的Gemini 2.5 Pro炸場(chǎng)了！

僅一個(gè)月的時(shí)間，Gemini 2.5 Pro（06-05）直接干趴了I/O大會(huì)放出的Gemini 2.5 Pro（05-06）。

果然，能打敗谷歌的，只有谷歌自己。

這次，Gemini 2.5 Pro（06-05）依舊是所有榜一。

在數(shù)學(xué)、編程、推理基準(zhǔn)測(cè)試中，新版模型全部刷新SOTA，完全碾壓o3、Claude 4、DeepSeek-R1。

相較于上一代，Gemini 2.5 Pro整體Elo提升了24分，尤其是在Web Arena上Elo提升了足足35分。

值得一提的是，更新后版本token依舊維持原價(jià)，性?xún)r(jià)比極高，輸出價(jià)格僅為o3的四分之一，Claude 4就更別提了。

而且，Gemini 2.5 Pro（06-05）還引入了「思考預(yù)算」，最高達(dá)32k，還改進(jìn)了函數(shù)調(diào)用等功能。

Gemini 2.5數(shù)學(xué)編碼再進(jìn)化，所有榜一

新版Gemini 2.5 Pro（06-05）和舊版Gemini 2.5 Pro（05-06），名字后面版本的時(shí)間，值得玩味。

很明顯，谷歌這次特意選擇在這個(gè)時(shí)間點(diǎn)放出新模型。

根據(jù)官博介紹，此次是Gemini 2.5 Pro的升級(jí)預(yù)覽版，這是谷歌迄今最智能的模型。

升級(jí)基于5月I/O大會(huì)展示的基礎(chǔ)上，這個(gè)模型將在幾周后成為普遍可用的穩(wěn)定版本，適合企業(yè)級(jí)應(yīng)用。

最新的2.5 Pro在LMArena排行榜上Elo分?jǐn)?shù)躍升24分，達(dá)到了1470，穩(wěn)居榜首。

更夸張的是，它在所有領(lǐng)域里都排名第一。

在WebDevArena上實(shí)現(xiàn)了35分的Elo評(píng)分飛躍，達(dá)到1443 分。

它在編程方面表現(xiàn)卓越，在Aider Polyglot等高難度編程基準(zhǔn)測(cè)試中名列前茅。

同時(shí)，它在GPQA和「人類(lèi)最后考試」（HLE）等極具挑戰(zhàn)性的基準(zhǔn)測(cè)試中也展現(xiàn)了頂尖性能，這些測(cè)試評(píng)估模型的數(shù)學(xué)、科學(xué)、知識(shí)和推理能力。

谷歌還針對(duì)之前2.5 Pro版本的反饋進(jìn)行了改進(jìn)，提升了其風(fēng)格和結(jié)構(gòu)——現(xiàn)在它能提供更有創(chuàng)意、格式更優(yōu)的回答。

開(kāi)發(fā)者可以通過(guò)Google AI Studio和Vertex AI中的Gemini API開(kāi)始使用更新的2.5 Pro進(jìn)行開(kāi)發(fā)，此次還新增了「思考預(yù)算」功能，能讓開(kāi)發(fā)者更好地控制成本和延遲。

它也在Gemini app中正式上線。

網(wǎng)友實(shí)測(cè)

Gemini 2.5 Pro（06-05）在真實(shí)任務(wù)中表現(xiàn)如何？

劈柴的一張圖，早已暗示了，Gemini就是獸中之王。

網(wǎng)友們?cè)缫涯θ琳疲_(kāi)始了一波實(shí)測(cè)。

編碼能力碾壓o3、Claude 4并不只是說(shuō)說(shuō)而已，現(xiàn)在，Gemini 2.5 Pro直接通過(guò)了六邊形物理模擬測(cè)試。

更驚艷的是，它還能通過(guò)Three.js創(chuàng)建出3D DNA模型，效果非常逼真。

數(shù)據(jù)科學(xué)家Diego測(cè)試Gemini 2.5 Pro 06-05編寫(xiě)一段Python代碼，可視化單行道中交通燈的工作原理，要求車(chē)輛以隨機(jī)速率進(jìn)入。

代碼運(yùn)行后的效果。

可以看出整體上動(dòng)畫(huà)還是比較精美的，沒(méi)有什么太大的問(wèn)題。

作為對(duì)比，下面是GPT 4.5生成代碼的效果。

不僅畫(huà)面粗糙，車(chē)子也不符合物理規(guī)律。

Diego之前還測(cè)試了Claude Sonnet 3.7和Grok 3，下面是這兩個(gè)模型的表現(xiàn)。

大家可以評(píng)判一下，到底哪個(gè)模型更強(qiáng)。

Claude Sonnet 3.7

Grok 3

參考資料：

https://x.com/sundarpichai/status/1930656033237823862

https://x.com/GoogleDeepMind/status/1930656243346976925

https://blog.google/products/gemini/gemini-2-5-pro-latest-preview/

https://x.com/lmarena_ai/status/1930658518560133435

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

華為Pura 80系列及全場(chǎng)景新品發(fā)布會(huì)盛大舉行，多款新品重磅亮相

新周刊 2025-06-12 15:14:32
63 跟貼 63
博主換電池致爆炸！手機(jī)“換電”是剛需，但“私換”不可取

雷科技 2025-03-12 15:33:25
30 跟貼 30

我，花300元鼓搗“賽博妹子”，二次元女友走進(jìn)現(xiàn)實(shí)了？

雷科技 2025-03-02 20:18:14
0 跟貼 0

每個(gè)人，都可以是故事獵人

新周刊 2025-06-11 23:01:36
3 跟貼 3
小扎豪擲143億美元賭新「王」！28歲華人億萬(wàn)富翁入職Meta，與谷歌決裂

新智元 2025-06-14 13:25:43
1 跟貼 1

AGI真方向?谷歌:智能體在自研世界模型，世界模型is all You Need

機(jī)器之心Pro 2025-06-13 10:51:33
1 跟貼 1

2025谷歌研究學(xué)者計(jì)劃名單：吳佳俊、Mamba作者Albert Gu等獲獎(jiǎng)

機(jī)器之心Pro 2025-06-13 19:36:28
1 跟貼 1
谷歌云服務(wù)嚴(yán)重宕機(jī) 致OpenAI、Spotify等多項(xiàng)服務(wù)中斷

財(cái)聯(lián)社 2025-06-13 09:09:13
14 跟貼 14

谷歌I/O大會(huì)放狠招，終極AI助手已來(lái)

機(jī)器之心Pro 2025-05-21 13:09:12
0 跟貼 0
很多家長(zhǎng)總以為學(xué)計(jì)算機(jī)就是在學(xué)編程

玉辭心 2025-06-14 06:04:28
5 跟貼 5
谷歌視頻模型Veo3正在顛覆好萊塢：星球大戰(zhàn)風(fēng)暴兵系列之訓(xùn)練新兵

鏈聞科技 2025-06-13 11:14:00
3 跟貼 3
程序員從此不再寫(xiě)代碼！紅杉專(zhuān)訪Codex團(tuán)隊(duì)，o3白菜價(jià)真相曝光

新智元 2025-06-13 09:09:50
38 跟貼 38
河南一高校硬核編程臺(tái)階走紅，網(wǎng)友：上個(gè)樓梯會(huì)“舉步艱難”

觀威海 2025-06-13 19:46:01
18 跟貼 18
一搜秒回、多模態(tài)輸出，百度AI搜索全面上線百度智能云千帆平臺(tái)

量子位 2025-06-13 18:34:21
0 跟貼 0
無(wú)底線榜一大哥：拿兒子用命換的60萬(wàn)，討女主歡心，錢(qián)沒(méi)了被拉黑

子芫伴你成長(zhǎng) 2025-06-13 22:02:00
22 跟貼 22
1小時(shí)熱度登頂榜一！全網(wǎng)0差評(píng)，連追4集我敢打包票：此劇必爆

星宿影視?shū)?2025-06-13 16:18:42
3 跟貼 3
埃及留學(xué)生“小明”的逐夢(mèng)之路：用中文“編程”未來(lái)

環(huán)球網(wǎng)資訊 2025-06-12 16:42:10
4 跟貼 4
一鍵提升科研效率，這幾款免費(fèi)瀏覽器插件讓你文獻(xiàn)下載閱讀快人一步

生物學(xué)霸 2025-02-05 18:36:08
0 跟貼 0
9個(gè)案例實(shí)測(cè)谷歌Gemini文生圖，設(shè)計(jì)行業(yè)“快變天了”

虎嗅APP 2025-03-14 05:44:32
316 跟貼 316
路面標(biāo)志原來(lái)這樣噴，不敢想象失誤怎么辦，據(jù)說(shuō)是光刻機(jī)原理！

發(fā)怒的福貓 2025-06-14 12:02:29
1 跟貼 1
口碑最好十大防曬霜！公主殿下快來(lái)看，榜一防曬提亮又養(yǎng)膚

幻妙意軒 2025-06-14 16:11:45
0 跟貼 0
伊朗首都德黑蘭大量市民在夜里高聲罵哈梅內(nèi)伊聲音此起彼伏

火煉樹(shù) 2025-06-14 07:18:34
26474 跟貼 26474
AI理解語(yǔ)言的終極密碼，千問(wèn)3向量模型開(kāi)源，性能超谷歌OpenAI

機(jī)器之心Pro 2025-06-11 19:17:56
0 跟貼 0
館長(zhǎng)稱(chēng)贊大陸導(dǎo)航讓綠媒破防，田鼠哥：我們臺(tái)灣也有谷歌導(dǎo)航

二月如栢 2025-06-14 15:59:05
62 跟貼 62
谷歌CEO：中國(guó)在AI前沿競(jìng)爭(zhēng)力不容忽視

財(cái)聯(lián)社 2025-05-19 17:56:27
0 跟貼 0
谷歌走在通往AGI的路上，哈薩比斯：一個(gè)艱難但正確的決定

機(jī)器之心Pro 2025-05-23 13:40:49
0 跟貼 0
一個(gè)有點(diǎn)浪漫的小實(shí)驗(yàn)，用水龍頭和勺子畫(huà)心，這是什么原理！

搞笑面包狗 2025-06-14 15:16:48
3 跟貼 3
王雙全，已任浙江省領(lǐng)導(dǎo)

新京報(bào)政事兒 2025-06-14 16:56:44
7 跟貼 7
模型飛機(jī)試飛，鏡頭一轉(zhuǎn)發(fā)現(xiàn)事不簡(jiǎn)單，美女膽子太大了

說(shuō)說(shuō)搞笑說(shuō) 2025-06-14 17:45:19
3 跟貼 3
紅魔電競(jìng)平板3 Pro還是iPad mini？小平板該怎么選？

泡泡網(wǎng) 2025-06-13 17:33:41
0 跟貼 0
當(dāng)院長(zhǎng)騎電驢摔傷住院醫(yī)護(hù)人員紛紛拍照

凌晨看看 2025-06-14 09:03:19
4606 跟貼 4606
所謂的漫畫(huà)胸，到底是什么樣的，真是長(zhǎng)知識(shí)了

勇笑搞笑 2025-06-14 15:02:24
3 跟貼 3
加濕器的工作原理，鐵片放在水里自動(dòng)噴霧，這玩意真暴力！

小姐姐愛(ài)搞笑 2025-06-10 16:34:56
6 跟貼 6
表格里數(shù)字3.10104E+17怎么改？多種方法，超簡(jiǎn)單！

小北數(shù)碼日記 2025-06-13 12:06:20
0 跟貼 0
一句話生成任務(wù)專(zhuān)屬LoRA！Transformer作者創(chuàng)業(yè)公司顛覆LLM微調(diào)

量子位 2025-06-13 17:23:47
0 跟貼 0
AI輔助編碼帶來(lái)思維方式轉(zhuǎn)變：從人寫(xiě)代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
全球首次，Transformer「混血」速度狂飆65倍！英偉達(dá)已下注

新智元 2025-06-14 13:25:54
1 跟貼 1
為什么日本出不來(lái)DeepSeek？

虎嗅APP 2025-04-24 21:34:12
5356 跟貼 5356
更適合AI開(kāi)發(fā)者的算力本出現(xiàn)了！

智東西 2025-04-09 20:39:59
0 跟貼 0
美國(guó)23日起將對(duì)鋼制家電加征關(guān)稅洗衣機(jī)冰箱在列

央視新聞客戶(hù)端 2025-06-13 07:29:48
2161 跟貼 2161

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

新版Gemini 2.5所有榜一，谷歌無(wú)敵了！一個(gè)月全面擊敗o3，編程反超Claude 4

消息稱(chēng) AMD 將推出 R7 9700F 無(wú)核顯處理器，目標(biāo)價(jià)位 250 美元

印航空難唯一幸存者：剛從機(jī)身裂口爬出就聽(tīng)到爆炸聲

印航空難唯一幸存者：剛從機(jī)身裂口爬出就聽(tīng)到爆炸聲

約戰(zhàn)天王山，步行者G4輸在了哪？

小S迎47歲生日，首個(gè)生日沒(méi)大S陪伴

樓市權(quán)威發(fā)聲

一輛新車(chē)比特斯拉FSD都便宜，全行業(yè)陪葬？

長(zhǎng)城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤(pán)大棋!

態(tài)度原創(chuàng)

呼吸科專(zhuān)家破解呼吸道九大謠言！

信息支援部隊(duì)工程大學(xué)2025招收高中生（生長(zhǎng)軍官本科學(xué)員）簡(jiǎn)章

榮耀 Magic7 系列手機(jī)獲 MagicOS 9.0.0.175 新版本升級(jí)

又一城購(gòu)房補(bǔ)貼！買(mǎi)房就發(fā)錢(qián)，正在海南樓市瘋狂擴(kuò)散！