99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

無(wú)人工干預(yù)取得35分,谷歌拿下首個(gè)屬于AI的IMO「真」金牌

0
分享至

AI 發(fā)展的速度比我們想象得更快。

就在上個(gè)月,我們?cè)鴪?bào)道頂尖的大語(yǔ)言模型們還在奧數(shù)級(jí)別的基準(zhǔn)測(cè)試中集體受挫,而僅僅一個(gè)月后,AI 便已能在真正的國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽中斬獲金牌。

當(dāng)?shù)貢r(shí)間 7 月 21 日,谷歌 DeepMind 宣布,其研發(fā)的人工智能系統(tǒng)在國(guó)際數(shù)學(xué)奧林匹克(IMO,International Mathematical Olympiad)中取得了歷史性的突破,正式獲得了“金牌”級(jí)別的成績(jī)。這標(biāo)志著人工智能首次在官方認(rèn)證的 IMO 競(jìng)賽中達(dá)到如此高的成就,同時(shí)也表明 AI 在復(fù)雜推理能力上邁出了關(guān)鍵一步。

在今年于澳大利亞舉行的第 66 屆國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽中,谷歌 DeepMind 參賽的 AI 模型“Gemini Deep Think”成功解答了全部六道題目中的五道,最終獲得了 35 分(滿分 42 分)的優(yōu)異成績(jī)。根據(jù) IMO 的評(píng)分標(biāo)準(zhǔn),這一分?jǐn)?shù)足以摘得金牌。IMO 主席 Prof. Dr. Gregor Dolinar 評(píng)價(jià)這些解答“在許多方面都令人震驚”,認(rèn)為它們“清晰、準(zhǔn)確,大部分都容易理解”。


圖丨本次 IMO 的題目之一(來(lái)源:DeepMind)

此次谷歌的勝利,不僅在于分?jǐn)?shù)的突破,更重要的是其實(shí)現(xiàn)方式也產(chǎn)生了巨大變革。去年,DeepMind 的兩個(gè)系統(tǒng) AlphaGeometry 和 AlphaProof 聯(lián)手獲得了銀牌,解決了六題中的四題。但當(dāng)時(shí)的系統(tǒng)需要人類專家先將自然語(yǔ)言描述的賽題手動(dòng)翻譯成名為“Lean”的形式化計(jì)算機(jī)語(yǔ)言,AI 才能進(jìn)行處理,整個(gè)過(guò)程耗時(shí)兩到三天。而今年的 Gemini Deep Think 則完全不同,它是一個(gè)能夠直接理解并處理自然語(yǔ)言問(wèn)題的“推理系統(tǒng)”,在與人類選手相同的 4.5 小時(shí)競(jìng)賽時(shí)限內(nèi),端到端地完成了從讀題到生成嚴(yán)謹(jǐn)數(shù)學(xué)證明的全過(guò)程,無(wú)需任何人工干預(yù)。


(來(lái)源:DeepMind)

Gemini Deep Think 的成功,得益于谷歌在 AI 推理技術(shù)上的最新研究成果。該模型采用了一種被稱為“并行思維”(parallel thinking)的先進(jìn)技術(shù),使其能夠同時(shí)探索和整合多個(gè)潛在的解題思路,而不是像傳統(tǒng) AI 模型那樣沿循單一的線性推理路徑,從而大大提升了解決復(fù)雜問(wèn)題的效率和創(chuàng)造性。此外,DeepMind 團(tuán)隊(duì)還運(yùn)用了新的強(qiáng)化學(xué)習(xí)技術(shù),通過(guò)一個(gè)包含高質(zhì)量數(shù)學(xué)解題方案的精選數(shù)據(jù)庫(kù)對(duì) Gemini 進(jìn)行專門訓(xùn)練,使其掌握了更高級(jí)的多步推理和定理證明能力。

有意思的是,在解決其中一道許多人類選手需要?jiǎng)佑醚芯可?jí)別數(shù)學(xué)知識(shí)的難題時(shí),Gemini Deep Think 卻另辟蹊徑,僅憑基礎(chǔ)的數(shù)論知識(shí)就給出了一個(gè)“絕妙的觀察”和自洽的證明,其解法比許多人類參賽者的更為簡(jiǎn)潔優(yōu)雅。這在某種程度上也表明,AI 在復(fù)雜問(wèn)題面前,已經(jīng)具備了超越常規(guī)思路、發(fā)現(xiàn)創(chuàng)新解法的潛力。

不過(guò),這次成就的發(fā)布過(guò)程頗具戲劇性。就在谷歌公布消息的兩天前,OpenAI 的一位研究員在社交媒體上搶先宣布,他們的一款實(shí)驗(yàn)性 AI 模型也在今年的 IMO 中取得了出色的“金牌”成績(jī)——同樣是解出五道題,獲得 35 分。

但區(qū)別在于,OpenAI 并未正式參與 IMO 的官方評(píng)估流程,而是他們組建了一個(gè)由三位前 IMO 獎(jiǎng)牌得主構(gòu)成的獨(dú)立小組來(lái)為自己的 AI 打分。而谷歌則是與 IMO 官方合作,由競(jìng)賽協(xié)調(diào)員根據(jù)學(xué)生評(píng)分標(biāo)準(zhǔn)正式評(píng)定成績(jī),也因此,只有谷歌的成績(jī)得到了 IMO 官方的認(rèn)證。

此外,據(jù)多方消息透露,IMO 官方曾請(qǐng)求所有參與測(cè)試的 AI 公司在閉幕式后等待一周再公布成績(jī),以便讓焦點(diǎn)首先集中在獲獎(jiǎng)的青少年學(xué)生身上。谷歌 DeepMind 遵守了這一約定,而 OpenAI 則在閉幕式當(dāng)天就迫不及待地公布了其“自評(píng)”的成績(jī),這種做法在 AI 社區(qū)引發(fā)了激烈爭(zhēng)議。DeepMind CEO Demis Hassabis 在社交媒體上含蓄地諷刺了一下友商:“順便說(shuō)一下,我們沒(méi)有在周五宣布,是因?yàn)槲覀冏鹬?IMO 委員會(huì)的原始要求,即所有 AI 實(shí)驗(yàn)室都應(yīng)該在官方結(jié)果得到獨(dú)立專家驗(yàn)證且學(xué)生們理應(yīng)獲得應(yīng)有的贊譽(yù)之后才分享他們的結(jié)果。”


圖丨相關(guān)推文(來(lái)源:X)

值得注意的是,無(wú)論是谷歌的 Gemini Deep Think 還是 OpenAI 的模型,都未能攻克本屆 IMO 難度最高的第六題。這道題目要求計(jì)算覆蓋一個(gè)給定空間所需的最少矩形數(shù)量,最終只有 5 名人類學(xué)生成功解出。據(jù)悉,Gemini 在解這道題時(shí),從一個(gè)錯(cuò)誤的假設(shè)出發(fā),最終未能找到正確路徑。這也從側(cè)面說(shuō)明,盡管 AI 在邏輯推理方面取得了長(zhǎng)足進(jìn)步,但在面對(duì)某些極具挑戰(zhàn)性和創(chuàng)造性的問(wèn)題時(shí),與頂尖的人類智慧相比,仍有其局限性,需要從這些年輕的數(shù)學(xué)天才身上學(xué)習(xí)。

著名數(shù)學(xué)家陶哲軒也在社交媒體上詳細(xì)分析了評(píng)估 AI 能力的復(fù)雜性,他表示,AI 系統(tǒng)的表現(xiàn)很大程度上取決于被給予的資源和輔助條件。他用人類參賽者的類比來(lái)說(shuō)明,如果改變競(jìng)賽格式(比如給學(xué)生幾天時(shí)間而不是 4.5 小時(shí),或者允許使用工具),那么成績(jī)和排名可能會(huì)發(fā)生巨大變化。因此,在不同規(guī)則下對(duì) AI 的能力進(jìn)行比較,需要格外謹(jǐn)慎。


圖丨相關(guān)推文(來(lái)源:X)

但無(wú)論如何,這次比賽對(duì)谷歌而言,都堪稱一次“雙贏”——由他們贏兩次,不僅證明其在與 OpenAI 等對(duì)手的“AI 競(jìng)賽”中占據(jù)了有利身位,還因?yàn)楦?jìng)爭(zhēng)對(duì)手本身的搶跑而獲得了好名聲。

基于這次的成功,谷歌方面也公布了后續(xù)的商業(yè)化路徑:計(jì)劃向一組由數(shù)學(xué)家組成的受信任測(cè)試者提供一個(gè)版本的 DeepMind 模型,之后會(huì)將其推廣給每月支付 250 美元的 Google AI Ultra 訂閱用戶。他們相信,這種結(jié)合了自然語(yǔ)言流暢性和嚴(yán)謹(jǐn)推理能力的 AI 系統(tǒng),將成為數(shù)學(xué)家、科學(xué)家和工程師的寶貴工具,最終推動(dòng)人類知識(shí)的邊界,加速 AGI 的到來(lái)。

參考資料:

1.https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/

2.https://x.com/demishassabis/status/1947337618787615175?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1947337618787615175%7Ctwgr%5Ee2bf7e56b25bf6a4597610749ec8ad1afdee0a50%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fventurebeat.com%2Fai%2Fgoogle-deepmind-makes-ai-history-with-gold-medal-win-at-worlds-toughest-math-competition%2F

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
A股:19287億成交,112股漲停,主力卻砸466億籌碼,周三怎么走?

A股:19287億成交,112股漲停,主力卻砸466億籌碼,周三怎么走?

木易滾雪球
2025-07-22 19:40:28
女子死前花巨款要冷凍遺體等復(fù)活?全球數(shù)百人躺冷罐盼續(xù)命,專家批:腦子都凍壞啦!

女子死前花巨款要冷凍遺體等復(fù)活?全球數(shù)百人躺冷罐盼續(xù)命,專家批:腦子都凍壞啦!

英國(guó)報(bào)姐
2025-07-22 21:55:26
分手傳聞僅3月,鹿晗在演唱會(huì)公開摘戒指,撕下關(guān)曉彤最后的體面

分手傳聞僅3月,鹿晗在演唱會(huì)公開摘戒指,撕下關(guān)曉彤最后的體面

小丸子的娛樂(lè)圈
2025-07-21 20:54:23
哪套更強(qiáng)??外媒列拉什福德加盟后巴薩前場(chǎng)首發(fā)組合

哪套更強(qiáng)??外媒列拉什福德加盟后巴薩前場(chǎng)首發(fā)組合

直播吧
2025-07-22 21:04:12
2025上半年央視口碑最好的10部國(guó)產(chǎn)劇:《掃毒風(fēng)暴》上榜,第1名毫無(wú)爭(zhēng)議

2025上半年央視口碑最好的10部國(guó)產(chǎn)劇:《掃毒風(fēng)暴》上榜,第1名毫無(wú)爭(zhēng)議

陳意小可愛
2025-07-19 08:52:22
比分娩還痛!男子誤用“全球最毒植物”擦屁屁,疼到舉槍自盡!如今竟被英國(guó)當(dāng)寶貝供奉…

比分娩還痛!男子誤用“全球最毒植物”擦屁屁,疼到舉槍自盡!如今竟被英國(guó)當(dāng)寶貝供奉…

最英國(guó)
2025-07-15 08:43:46
掃毒風(fēng)暴:林強(qiáng)峰再臥底!劉青坐牢真相,是盧少驊帶吳燕萍走原因

掃毒風(fēng)暴:林強(qiáng)峰再臥底!劉青坐牢真相,是盧少驊帶吳燕萍走原因

阿腩講娛樂(lè)
2025-07-22 13:25:06
一路走好!TVB資深演員設(shè)靈!古天樂(lè)楊千嬅黃宗澤送花牌!90歲TVB女星現(xiàn)身一度哽咽!

一路走好!TVB資深演員設(shè)靈!古天樂(lè)楊千嬅黃宗澤送花牌!90歲TVB女星現(xiàn)身一度哽咽!

我愛追港劇
2025-07-23 00:03:29
突發(fā):俄羅斯地震

突發(fā):俄羅斯地震

魯中晨報(bào)
2025-07-22 13:36:50
比整個(gè)中國(guó)還大的西伯利亞,為什么只屬于俄羅斯?

比整個(gè)中國(guó)還大的西伯利亞,為什么只屬于俄羅斯?

娛樂(lè)喵喵說(shuō)
2025-07-21 17:46:06
罕見,聯(lián)合國(guó)公開譴責(zé)菲律賓,觸目驚心令人發(fā)指,老杜當(dāng)年做對(duì)了

罕見,聯(lián)合國(guó)公開譴責(zé)菲律賓,觸目驚心令人發(fā)指,老杜當(dāng)年做對(duì)了

比利
2025-07-23 00:22:43
足球小將1-2被逆轉(zhuǎn)!董路暴怒:我感覺在馬德里 我為裁判感到羞恥

足球小將1-2被逆轉(zhuǎn)!董路暴怒:我感覺在馬德里 我為裁判感到羞恥

風(fēng)過(guò)鄉(xiāng)
2025-07-22 21:29:58
復(fù)讀市場(chǎng)的天塌了!網(wǎng)傳毛坦廠中學(xué)只招不到100個(gè)班,同比銳減50%

復(fù)讀市場(chǎng)的天塌了!網(wǎng)傳毛坦廠中學(xué)只招不到100個(gè)班,同比銳減50%

火山詩(shī)話
2025-07-20 10:25:27
香港吃飯很貴?真實(shí)香港情況讓你大吃一驚: 銅鑼灣一天消費(fèi)多少?

香港吃飯很貴?真實(shí)香港情況讓你大吃一驚: 銅鑼灣一天消費(fèi)多少?

朗威談星座
2025-07-16 08:33:49
“賣水的可掙錢了,我老公結(jié)婚4次5個(gè)小孩”!潤(rùn)田創(chuàng)始人之妻自曝家丑?真相:上市公司早與她無(wú)關(guān),其丈夫負(fù)債纏身

“賣水的可掙錢了,我老公結(jié)婚4次5個(gè)小孩”!潤(rùn)田創(chuàng)始人之妻自曝家丑?真相:上市公司早與她無(wú)關(guān),其丈夫負(fù)債纏身

每日經(jīng)濟(jì)新聞
2025-07-22 12:47:25
劉星海,被查

劉星海,被查

魯中晨報(bào)
2025-07-22 17:45:39
丈夫2年前就結(jié)扎了,如今妻子卻懷孕,親子鑒定后男人傻眼了

丈夫2年前就結(jié)扎了,如今妻子卻懷孕,親子鑒定后男人傻眼了

戶外釣魚哥阿勇
2025-07-23 01:04:33
步入60歲之后才明白,只有女兒的家庭,晚年通常會(huì)面臨這五大難題

步入60歲之后才明白,只有女兒的家庭,晚年通常會(huì)面臨這五大難題

十指說(shuō)情
2025-07-21 17:33:44
全球最小的發(fā)達(dá)國(guó)家,快被中國(guó)人“買”下了,中國(guó)移民占比87%

全球最小的發(fā)達(dá)國(guó)家,快被中國(guó)人“買”下了,中國(guó)移民占比87%

慎獨(dú)贏
2025-06-05 15:41:01
蔣介石唯一女兒有多美?先后嫁給他的“死敵”,晚年繼承天價(jià)遺產(chǎn)

蔣介石唯一女兒有多美?先后嫁給他的“死敵”,晚年繼承天價(jià)遺產(chǎn)

萬(wàn)物知識(shí)圈
2025-07-22 09:15:53
2025-07-23 02:23:01
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
15438文章數(shù) 513917關(guān)注度
往期回顧 全部

科技要聞

李開復(fù)推企業(yè)級(jí)Agent,誓要打造"超級(jí)員工"

頭條要聞

廣東確診已超2000例 傳染源是什么 如何控制

頭條要聞

廣東確診已超2000例 傳染源是什么 如何控制

體育要聞

哈利:受傷時(shí)想自己走下場(chǎng)但發(fā)現(xiàn)走不了 科比竟然還能去罰球

娛樂(lè)要聞

葉珂復(fù)播 自曝產(chǎn)女后與黃曉明徹底分手

財(cái)經(jīng)要聞

宗馥莉掌控離岸公司 遺產(chǎn)爭(zhēng)奪或早有布局

汽車要聞

看著像保時(shí)捷?賓利首款純電動(dòng)車諜照曝光

態(tài)度原創(chuàng)

本地
親子
房產(chǎn)
手機(jī)
健康

本地新聞

換個(gè)城市過(guò)夏天 | 躲進(jìn)18℃的綠野仙蹤

親子要聞

拒絕毒友誼,給孩子講這個(gè)故事

房產(chǎn)要聞

新增2500個(gè)學(xué)位!海口又一超級(jí)學(xué)校來(lái)了!

手機(jī)要聞

一加15與一加Ace 6系列:或雙機(jī)齊發(fā),且配置規(guī)格也懸念不大了

呼吸科專家破解呼吸道九大謠言!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 辽源市| 元氏县| 类乌齐县| 托里县| 扎赉特旗| 德清县| 胶州市| 和田县| 永定县| 昌都县| 乌兰浩特市| 东莞市| 贵德县| 南投市| 满城县| 丰台区| 吉林市| 静乐县| 巴林左旗| 张家港市| 德化县| 临颍县| 达州市| 河源市| 浠水县| 漳平市| 额敏县| 沐川县| 滨州市| 瑞安市| 皮山县| 山东省| 若羌县| 双牌县| 双鸭山市| 襄汾县| 从化市| 虹口区| 大足县| 祁门县| 延吉市|