99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌AI獲IMO“唯一金牌”,硅谷夾道祝賀,奧特曼丟人又丟人

0
分享至

  • 克雷西 發(fā)自 凹非寺
    量子位 | 公眾號(hào) QbitAI

谷歌Gemini拿下了IMO金牌,而且是官方認(rèn)證的那種。

經(jīng)過IMO官方裁判評(píng)分,Gemini新模型答對(duì)了6道題中的5道,以35分的成績斬獲金牌。



斬獲金牌的是Gemini的一個(gè)進(jìn)階版本,搭載了新的思考模式,后期會(huì)開放給Google AI Ultra訂閱用戶——也就月付1400元那種。

去年三天摘銀,今年4.5小時(shí)奪金,DeepMind的數(shù)學(xué)成績可以說是突飛猛進(jìn)。

除了DeepMind CEO哈薩比斯、谷歌CEO劈柴哥給團(tuán)隊(duì)發(fā)來賀電,馬斯克也發(fā)推表示了祝賀。



DeepMind這波可謂是被各界夾道祝賀,做得體面又周到。

但DeepMind被夸得越好,OpenAI就越發(fā)相形見絀,同樣是AI參賽IMO,秘密搞事情也就算了,還為了營銷跟人類青少年搶風(fēng)頭。

奧特曼治下的OpenAI,最近除了丟人就丟人了。

DeepMind官宣AI拿下IMO金牌

DeepMind公告顯示,Gemini新模型做對(duì)了今年IMO六道題中的五道,獲得了35分。

并且這一成績,也獲得了IMO主席Gregor Dolinar的親自認(rèn)證:

  • 我們可以確認(rèn),谷歌DeepMind已達(dá)到人們夢(mèng)寐以求的里程碑,獲得了35分(滿分42分)——堪稱金牌。
    他們的解決方案在很多方面都令人驚嘆。IMO評(píng)分員認(rèn)為這些解決方案清晰、精準(zhǔn),而且大多數(shù)都易于理解。



不僅評(píng)分遵循IMO未公開的規(guī)則,所用時(shí)間標(biāo)準(zhǔn)也和人類選手完全一致——4.5小時(shí)之內(nèi)答完交卷。

而去年DeepMind的銀牌成績,是用AlphaProof和AlphaGeometry一起做了三天才獲得的。

這次不僅用時(shí)更短,答題過程也是全程自然語言、端到端完成,不再像去年那樣專門修改題目格式。

DeepMind高級(jí)科學(xué)家兼IMO團(tuán)隊(duì)負(fù)責(zé)人Thang Luong表示,這與去年相比是一個(gè)范式轉(zhuǎn)變。



此外,DeepMind研究員、布朗大學(xué)教授Junehyuk Jung介紹,在今年的第三題中,很多人類選手使用了研究生水平的方案(IMO為高中競(jìng)賽),但Gemini僅使用了初等數(shù)論知識(shí)就給出了自洽的證明。



Jung還表示,Gemini沒答對(duì)的最后一題,是一開始方向就錯(cuò)了,不過人類選手中做對(duì)這道題的也只有五個(gè)人。



順便說一下,谷歌已經(jīng)將Gemini做對(duì)的五道題的答案完整公開(鏈接見文末),有興趣的話可以驗(yàn)證一下~



這次DeepMind用來參賽的,是一款暫未公開的全新模型,搭載了Deep Think推理模式。

DeepMind介紹,Gemini Deep Think是一種針對(duì)復(fù)雜問題的增強(qiáng)型推理模式,融合了其最新的一些研究技術(shù),包括并行思維。

這種模式使模型能夠同時(shí)探索并組合多種可能的解決方案,最終得出最終答案,而不是追求單一的線性思維鏈。

為了充分利用Deep Think的推理能力,DeepMind額外訓(xùn)練了 Gemini 的這一版本,使其能夠利用更多多步推理、問題求解和定理證明數(shù)據(jù)。

此外DeepMind還為Gemini提供了精選的高質(zhì)量數(shù)學(xué)題庫,并在其指令中添加了一些關(guān)于如何解答IMO題目的通用提示和技巧。

如哈薩比斯所說,該模型已經(jīng)提供給數(shù)學(xué)家等人群進(jìn)行小范圍測(cè)試,后續(xù)會(huì)開放給Google AI Ultra訂閱用戶使用。



當(dāng)然,DeepMind今天的官宣,也是獲得了各種稱贊。

DeepMind宣布成績,被硅谷夾道歡迎

包括來自友商的稱贊在內(nèi),DeepMind獲得了整個(gè)硅谷的夾道歡迎。

除了開頭馬斯克那句簡單的Congrats之外,還有Meta AI科學(xué)家稱贊Gemini給出了清晰、精準(zhǔn)、非常適合自學(xué)的解決方案。



受歡迎的原因,不僅是表現(xiàn)優(yōu)秀,也包括谷歌對(duì)IMO規(guī)則的尊重。

Gemini參加挑戰(zhàn)是受到了IMO官方邀請(qǐng),所有規(guī)則標(biāo)準(zhǔn)都和人類一致。

并且,DeepMind也遵守了IMO官方的要求,沒有急于宣布結(jié)果。



仔細(xì)研究哈薩比斯的推文,只字未提OpenAI,但又處處在針對(duì)OpenAI。

哈薩比斯的三條回復(fù),主要強(qiáng)調(diào)了這么幾點(diǎn):官宣是沒有搶跑的,成績是IMO認(rèn)證的,模型也是未來可用的。



這三點(diǎn),剛好和搶先宣布奪金結(jié)果被錘的OpenAI形成了鮮明對(duì)比。

IMO評(píng)審團(tuán)和協(xié)調(diào)員們普遍認(rèn)為,AI開發(fā)商在IMO期間(尤其是閉幕式之前)宣布成績是“粗魯且不恰當(dāng)?shù)摹薄?/p>



除了公告發(fā)布時(shí)間的問題,OpenAI到底得沒得金牌也有爭議。

領(lǐng)導(dǎo)DeepMind超級(jí)推理團(tuán)隊(duì)的Thang Luong補(bǔ)充,IMO內(nèi)部其實(shí)有一份官方評(píng)分指南,外部無法獲取。沒有基于該指南的評(píng)分就沒有資格獲得獎(jiǎng)牌。

這屆IMO共6道題,每題7分。金牌線35分,OpenAI自報(bào)的成績也剛剛過線,即使是解答過程中微小的扣分都可能讓OpenAI從金牌跌到銀牌。



有網(wǎng)友評(píng)價(jià):OpenAI一如既往的為了炒作什么都干得出來。沒有官方分?jǐn)?shù),沒有耐心,也沒有羞恥心。



此外,OpenAI參賽用的模型也是未公開版本,并且可能以后也不會(huì)公開。

總之是處處和谷歌對(duì)比鮮明。

OpenAI研究員回應(yīng)質(zhì)疑

針對(duì)以上這些質(zhì)疑,OpenAI研究員Noam在給谷歌送出祝福后,也順帶進(jìn)行了回應(yīng):



首先,Noam解釋OpenAI沒和IMO官方合作不是沒收到邀請(qǐng),而是OpenAI自己拒絕了。



其次是關(guān)于作答過程和評(píng)分的權(quán)威性,Noam表示沒有使用RAG或者任何工具,而打分是由3位IMO獲獎(jiǎng)?wù)呓o出的。

同時(shí)Noam還公開了OpenAI模型的回答,表示任何人都可以檢查。



最后是關(guān)于宣發(fā)時(shí)間,Noam表示公布成績之前和IMO董事會(huì)成員進(jìn)行過溝通,后者要求等到頒獎(jiǎng)儀式之后再發(fā)布,OpenAI表示接受。

而OpenAI官宣的時(shí)間是在太平洋時(shí)間凌晨1點(diǎn),彼時(shí)頒獎(jiǎng)已經(jīng)結(jié)束,OpenAI沒有被要求需要等到更晚的時(shí)間再發(fā)布。



雖然Noam的解釋獲得了部分網(wǎng)友的認(rèn)可,但說一千道一萬,網(wǎng)友還是表示傾向于站在谷歌這一邊。



總之最近的OpenAI,除了丟人還是丟人。

小扎磨刀霍霍,奧特曼人丟了。

谷歌同場(chǎng)競(jìng)技,奧特曼丟人了。

Gemini回答:
https://storage.googleapis.com/deepmind-media/gemini/IMO_2025.pdf
OpenAI回答:
https://github.com/aw31/openai-imo-2025-proofs/
[1]https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/
[2]https://arstechnica.com/ai/2025/07/google-deepmind-earns-gold-in-international-math-olympiad-with-new-gemini-ai/
[3]https://x.com/demishassabis/status/1947337615054671882
[4]https://x.com/polynoamial/status/1947398531259523481

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
宗慶后三弟宗澤后深夜發(fā)聲:宗馥莉把自己打造成一個(gè)忍辱負(fù)重復(fù)仇的女神,將娃哈哈業(yè)務(wù)轉(zhuǎn)向由她100%掌控的宏勝公司是否算“掏空娃哈哈公司”

宗慶后三弟宗澤后深夜發(fā)聲:宗馥莉把自己打造成一個(gè)忍辱負(fù)重復(fù)仇的女神,將娃哈哈業(yè)務(wù)轉(zhuǎn)向由她100%掌控的宏勝公司是否算“掏空娃哈哈公司”

金融界
2025-07-22 10:47:40
停不下來!利物浦超3億歐拿下4人,羅馬諾:1-10分你打幾分?

停不下來!利物浦超3億歐拿下4人,羅馬諾:1-10分你打幾分?

直播吧
2025-07-22 16:19:05
中朝邊界藏著心酸:天池割掉一半,圖們江被掐斷,鴨綠江出不了海

中朝邊界藏著心酸:天池割掉一半,圖們江被掐斷,鴨綠江出不了海

大道微言
2025-07-21 16:05:56
上海小伙專程逛3天胖東來!現(xiàn)實(shí)比網(wǎng)上說的更離譜,細(xì)節(jié)讓人震驚

上海小伙專程逛3天胖東來!現(xiàn)實(shí)比網(wǎng)上說的更離譜,細(xì)節(jié)讓人震驚

大笑江湖史
2025-07-21 15:04:57
江蘇杜賓犬飛撲幼童:警方開始排查,物業(yè)回應(yīng),網(wǎng)友:人仗狗勢(shì)

江蘇杜賓犬飛撲幼童:警方開始排查,物業(yè)回應(yīng),網(wǎng)友:人仗狗勢(shì)

好賢觀史記
2025-07-22 08:56:49
比盧普斯:利拉德會(huì)成為NBA史上薪水最高的助教,我會(huì)讓他每天都忙個(gè)不停

比盧普斯:利拉德會(huì)成為NBA史上薪水最高的助教,我會(huì)讓他每天都忙個(gè)不停

雷速體育
2025-07-22 09:12:19
官方:中國足協(xié)計(jì)劃組建中國國家電子競(jìng)技足球隊(duì)

官方:中國足協(xié)計(jì)劃組建中國國家電子競(jìng)技足球隊(duì)

懂球帝
2025-07-22 15:05:09
事發(fā)上海華山醫(yī)院!這一幕頻繁上演,“逼”得醫(yī)院憋出個(gè)大招

事發(fā)上海華山醫(yī)院!這一幕頻繁上演,“逼”得醫(yī)院憋出個(gè)大招

朗威游戲說
2025-07-22 14:52:21
后續(xù)!女兒質(zhì)問暴走團(tuán)成員媽媽:“為啥不給搶險(xiǎn)救命的車讓路?”

后續(xù)!女兒質(zhì)問暴走團(tuán)成員媽媽:“為啥不給搶險(xiǎn)救命的車讓路?”

小虎新車推薦員
2025-07-22 14:31:36
葉珂復(fù)播了,自曝產(chǎn)女后與黃曉明徹底分手,沒給黃曉明留一絲體面

葉珂復(fù)播了,自曝產(chǎn)女后與黃曉明徹底分手,沒給黃曉明留一絲體面

陳意小可愛
2025-07-22 15:09:53
暴走團(tuán)已屬于大型商業(yè)活動(dòng),接連違反各種法規(guī),相關(guān)部門為何不管?

暴走團(tuán)已屬于大型商業(yè)活動(dòng),接連違反各種法規(guī),相關(guān)部門為何不管?

可達(dá)鴨面面觀
2025-07-22 17:06:24
飛機(jī)上“求生請(qǐng)求”引爆爭議!他因嚴(yán)重過敏請(qǐng)全飛機(jī)禁吃堅(jiān)果,結(jié)果被網(wǎng)友群罵:太自私!

飛機(jī)上“求生請(qǐng)求”引爆爭議!他因嚴(yán)重過敏請(qǐng)全飛機(jī)禁吃堅(jiān)果,結(jié)果被網(wǎng)友群罵:太自私!

最英國
2025-07-22 08:21:27
14年4次異味,“互聯(lián)網(wǎng)之都”搞不定自來水?!

14年4次異味,“互聯(lián)網(wǎng)之都”搞不定自來水?!

酷溫coolwin
2025-07-21 20:01:23
16位中央巡視組組長,已全部確定

16位中央巡視組組長,已全部確定

新京報(bào)政事兒
2025-07-21 18:52:49
中國臺(tái)灣IP女子自曝與馬英九牽手照:待我好不一定是要當(dāng)夫人

中國臺(tái)灣IP女子自曝與馬英九牽手照:待我好不一定是要當(dāng)夫人

可達(dá)鴨面面觀
2025-07-22 09:47:48
王傳福八箭齊發(fā)!比亞迪這一次殺瘋了

王傳福八箭齊發(fā)!比亞迪這一次殺瘋了

象視汽車
2025-07-22 07:00:03
效果明顯!朝陽暴走團(tuán)消失了,民警在現(xiàn)場(chǎng)巡控,白衣哥怒罵立大功

效果明顯!朝陽暴走團(tuán)消失了,民警在現(xiàn)場(chǎng)巡控,白衣哥怒罵立大功

鋭娛之樂
2025-07-21 17:43:03
海航集團(tuán)原美籍高管、首席執(zhí)行官譚向東三罪并罰獲刑6年

海航集團(tuán)原美籍高管、首席執(zhí)行官譚向東三罪并罰獲刑6年

經(jīng)濟(jì)觀察報(bào)
2025-07-22 15:00:10
俄羅斯最新數(shù)據(jù)顯示,上半年對(duì)華石油供應(yīng)減少10.8%,銷售額大跌

俄羅斯最新數(shù)據(jù)顯示,上半年對(duì)華石油供應(yīng)減少10.8%,銷售額大跌

碳基生物關(guān)懷組織
2025-07-21 17:23:38
韋世豪妻子風(fēng)波后首度發(fā)布視頻,王大雷:我們的餃子是最棒的

韋世豪妻子風(fēng)波后首度發(fā)布視頻,王大雷:我們的餃子是最棒的

懂球帝
2025-07-22 10:36:33
2025-07-22 17:55:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
10905文章數(shù) 176192關(guān)注度
往期回顧 全部

科技要聞

李開復(fù)推企業(yè)級(jí)Agent,誓要打造"超級(jí)員工"

頭條要聞

克宮:普京將于9月訪華 俄方正為北京之行做籌備

頭條要聞

克宮:普京將于9月訪華 俄方正為北京之行做籌備

體育要聞

兩度身患癌癥,她完成了一次不可能的撲救

娛樂要聞

葉珂復(fù)播 自曝產(chǎn)女后與黃曉明徹底分手

財(cái)經(jīng)要聞

宗澤后喊話宗馥莉:不要逼弟妹無路可走

汽車要聞

看著像保時(shí)捷?賓利首款純電動(dòng)車諜照曝光

態(tài)度原創(chuàng)

健康
教育
房產(chǎn)
時(shí)尚
家居

呼吸科專家破解呼吸道九大謠言!

教育要聞

普通本科批 錄取已開始

房產(chǎn)要聞

保值王+名校書包!海口主城這個(gè)紅盤,驚現(xiàn)抄底窗口!

女人過了40歲穿衣要更加謹(jǐn)慎!用自然著裝,打造出高級(jí)的特征

家居要聞

其樂融融 重構(gòu)溫馨狀態(tài)

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 保靖县| 铜梁县| 台北县| 九龙城区| 阿鲁科尔沁旗| 舟山市| 澜沧| 萝北县| 洛宁县| 潼南县| 康定县| 平罗县| 门源| 万全县| 运城市| 苏尼特右旗| 东兰县| 德格县| 兴义市| 乌什县| 台湾省| 正安县| 遂溪县| 南漳县| 兴国县| 黑河市| 浮山县| 太保市| 来宾市| 沛县| 山阴县| 永宁县| 肃北| 博兴县| 伊金霍洛旗| 中阳县| 海南省| 娄烦县| 普兰县| 寿宁县| 余庆县|