99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易科技 > 網易科技 > 正文

人類頂級的智力高地失守!谷歌獲官方認證奧數金牌

0
分享至

7月22日消息,AI霸權之爭已達到新的頂峰,Google DeepMindOpenAI現在都聲稱,其模型可以征服國際數學奧林匹克競賽(IMO),這堪稱人類最艱難的智力挑戰之一。

美國時間周一,谷歌宣布其Gemini Deep Think AI在2025年IMO比賽中獲得了官方認證的金牌。而在幾天前,其競爭對手OpenAI也宣布,其模型在同樣的比賽中獲得了相同的頂級分數,但OpenAI的成績尚未經過正式認證。

這一突破標志著AI推理能力的一次巨大飛躍,證明了通用型AI模型能夠在解決復雜數學問題時達到人類頂尖水平。與此同時,這一進展也進一步加劇了兩大AI巨頭之間的競爭。

AI挑戰人類智力巔峰

國際數學奧林匹克(IMO)是全球最具聲望的青少年數學競賽,始于1959年,每年舉辦一次。每個參賽國派出六名頂尖中學生數學選手,他們需解答六個在代數、組合學、幾何學和數論等領域極其復雜的問題。其中,約8%的參賽者將獲得一枚聲望卓著的金牌。

近年來,IMO逐漸成為了AI系統的一個重要挑戰平臺,用以測試AI在數學問題解決和推理能力上的最新進展。去年,Google DeepMind的AlphaProof和AlphaGeometry 2聯合系統曾達到銀牌水平,解決了四個問題并獲得28分。這一突破依賴于專門的形式化語言,展示了AI在接近人類頂級數學推理能力方面的進展。

今年,Google DeepMind的Gemini模型提交的結果首次經過IMO協調員的官方評分和認證,評分標準與學生選手一致。在肯定今年學生選手所取得的顯著成就之余,谷歌也分享了Gemini在此次比賽中的突破性表現。

從銀牌到金牌:AI推理的飛躍

Gemini Deep Think的高級版本在2025年IMO中表現出色,完美解決了六個極難問題中的五個,獲得了總分35分,達到了金牌水平。這些解決方案已經在線公開,任何人都可以在線查看并驗證其正確性。

IMO主席格雷戈爾·多利納爾(Gregor Dolinar)教授表示:“我們可以確認,Google DeepMind已經達到了人們非常期待的里程碑,在滿分42分中獲得了35分——這是一個金牌分數。他們的解決方案在許多方面都令人驚嘆。IMO的評分員發現它們清晰、精確,且大多數都易于理解。”

與去年的成績相比,谷歌今年的成就具有里程碑意義。2024年,谷歌的AlphaGeometry和AlphaProof系統雖然達到了銀牌標準,但當時它們依賴于專家首先將問題從自然語言轉化為專用的領域語言(如Lean),而證明過程則需要反向操作,整個過程也需要兩到三天的計算時間。

今年,Gemini模型的一個關鍵創新是能夠全程使用自然語言進行操作,直接從官方的題目描述中生成嚴謹的數學證明。這一切都在嚴格的4.5小時比賽時間限制內完成。

“批量制造”真正的AI數學家?

OpenAI與谷歌都將最近在IMO上取得的成就視為通用AI的重要勝利。OpenAI研究員諾姆·布朗(Noam Brown)在社交媒體上表示:“恭喜Google DeepMind團隊在IMO上取得的成績!我認為他們的成功再次突顯了AI進步的速度。雖然他們的方法與我們有所不同,但這正顯示了AI研究領域可以探索的多樣化方向。這不僅是一個針對IMO的專門模型,而是一個融合了新型實驗性通用技術的推理型大語言模型。”

布朗的觀點得到了OpenAI同事們的認可。這表明,谷歌和OpenAI的基礎模型不僅僅是針對數學問題的狹義專家,更具備廣泛的能力,能夠應對多種復雜任務。

OpenAI選擇自行公布成績,凸顯了在“公司內部面臨挑戰的背景下,急于展現領導力”的巨大壓力。OpenAI首席執行官山姆·奧特曼(Sam Altman)也提到了這一成就的重要性:“當我們剛開始OpenAI時,這(指在IMO奪金)一直是一個夢想,但那個時候我們并不覺得它能夠實現。”此次成功有力地反擊了關于OpenAI正失去競爭力的言論。

而谷歌的系統則依賴于其新推出的Gemini Deep Think架構,這是一種增強型推理模式,專門用于處理復雜問題。它融合了谷歌最新的研究技術,包括“并行思維”,這種設置使模型能夠在給出最終答案之前,同時探索并結合多種可能的解決方案,而不是追求單一的、線性的思維鏈。

為了最大限度地發揮Deep Think的推理能力,谷歌還引入了最新的強化學習技術,使其能利用更多的多步驟推理、問題解決和定理證明的數據來進行學習。此外,谷歌為Gemini提供了一個經過精心篩選的高質量數學問題解決方案語料庫,并在其指令中添加了如何高效解決IMO問題的通用提示和技巧。

谷歌計劃將這一版本的Deep Think模型提供給一批受信任的測試人員,包括數學家,之后再向Google AI Ultra訂閱者推出。

AI與數學的未來

盡管取得了突破,但AI推理技術目前仍處于實驗階段。OpenAI研究員亞歷山大·韋(Alexander Wei)表示:“這一成就攻克了AI領域長期以來的一個重大挑戰,我很高興地分享OpenAI最新的實驗性推理型大語言模型已經在全球最具聲望的數學競賽中達到了金牌水平。”

Google DeepMind的高級研究科學家Thang Luong對未來充滿信心:“我們非常有信心,很快就能把模型交到我們所信任的測試人員手中,尤其是數學家,幫助他們解決更復雜的問題,之后再推出給更廣泛的用戶群體。”

Google DeepMind與數學界的合作正在持續進行,但AI為數學貢獻的潛力仍處于起步階段。通過讓AI系統能夠進行更加靈活和直觀的推理,谷歌正在一步步接近構建能解決更復雜和高級數學問題的AI。

盡管今年的工作完全基于自然語言的Gemini,谷歌仍在持續推進其他AI系統,包括AlphaGeometry和AlphaProof。

谷歌相信,那些結合了自然語言流暢性與嚴格推理的智能體,包括在形式化語言中經過驗證的推理,將成為數學家、科學家、工程師和研究人員不可或缺的工具,幫助推動人類知識的進步,并為通用人工智能(AGI)奠定基礎。(小小)

延伸閱讀
相關推薦
熱點推薦
上海郊區小鎮,全面崩盤

上海郊區小鎮,全面崩盤

魔都財觀
2025-07-23 07:41:49
法國航母承認:在南海直面山東艦,被40艘中國海軍艦艇“圍觀”

法國航母承認:在南海直面山東艦,被40艘中國海軍艦艇“圍觀”

空天力量
2025-07-23 10:12:46
甘肅一景區收取300元“天價過路費”?當地文旅局:實際為深度游產品費用

甘肅一景區收取300元“天價過路費”?當地文旅局:實際為深度游產品費用

三湘都市報
2025-07-23 21:53:47
董路:蘇超球隊能贏南通支云,我給10萬!能贏國足,我給500萬

董路:蘇超球隊能贏南通支云,我給10萬!能贏國足,我給500萬

念洲
2025-07-23 18:38:25
收受“亞洲鋁王”賄賂,公安廳副廳長落馬

收受“亞洲鋁王”賄賂,公安廳副廳長落馬

中國新聞周刊
2025-07-23 20:32:52
梁朝偉和湯唯在《色戒》里“假戲真做”?網友爆出截圖:一目了然

梁朝偉和湯唯在《色戒》里“假戲真做”?網友爆出截圖:一目了然

姜糖先生
2025-06-08 19:31:00
大熱天把空調開成30度制熱,愣是把蹭涼的大爺大媽全“蒸”跑了

大熱天把空調開成30度制熱,愣是把蹭涼的大爺大媽全“蒸”跑了

西樓知趣雜談
2025-07-23 21:11:28
特朗普陷入巨大危機,美國即將爆出驚天秘密

特朗普陷入巨大危機,美國即將爆出驚天秘密

一個壞土豆
2025-07-22 22:48:43
這對被全世界圍觀的“社死情侶”,被人玩成了世界梗

這對被全世界圍觀的“社死情侶”,被人玩成了世界梗

大道微言
2025-07-23 18:21:57
社評:印度對華簽證的門檻還是太高了

社評:印度對華簽證的門檻還是太高了

環球網資訊
2025-07-24 00:15:43
巴西前鋒羅德里戈女友布魯娜因獨特個性,再次引發球迷和媒體關注

巴西前鋒羅德里戈女友布魯娜因獨特個性,再次引發球迷和媒體關注

星耀國際足壇
2025-07-23 22:19:54
東北大學溺亡者同學發聲:去過事發選礦廠,墜入浮選槽難動彈

東北大學溺亡者同學發聲:去過事發選礦廠,墜入浮選槽難動彈

南方都市報
2025-07-24 00:39:30
福耀科技大學錄取通知書曝光!寫著:你們是這個大學形態的創建者

福耀科技大學錄取通知書曝光!寫著:你們是這個大學形態的創建者

火山詩話
2025-07-23 17:08:00
上海3元面館按杯賣茅臺,老板:是飛天,一杯10毫升48元,還有五糧液劍南春

上海3元面館按杯賣茅臺,老板:是飛天,一杯10毫升48元,還有五糧液劍南春

紅星資本局
2025-07-23 18:13:22
曝“樹拍易購”暴雷或涉600億,有人投8萬每月拿14000收益

曝“樹拍易購”暴雷或涉600億,有人投8萬每月拿14000收益

恪守原則和底線
2025-07-23 17:36:31
咸魚一條狗賣26000:特會配,一次四十分鐘,男生勿擾

咸魚一條狗賣26000:特會配,一次四十分鐘,男生勿擾

丫頭舫
2025-07-23 10:27:36
體檢是一場巨大的“人間騙局”!

體檢是一場巨大的“人間騙局”!

功夫財經
2025-07-23 08:37:29
12月18日起,海南正式封關,和普通人有什么關系?

12月18日起,海南正式封關,和普通人有什么關系?

財話連篇
2025-07-23 14:55:28
曝中南大學譚健兵教授嫖娼,一次交易5000元,事后向女方索要嫖資

曝中南大學譚健兵教授嫖娼,一次交易5000元,事后向女方索要嫖資

180視角
2025-07-23 09:39:55
茅晨月被限制出境后,華爾街集體取消中國行程,都不來中國了?

茅晨月被限制出境后,華爾街集體取消中國行程,都不來中國了?

別人都叫我阿腈
2025-07-23 06:57:55
2025-07-24 06:47:00

科技要聞

別自嗨了!XREAL徐馳:AI眼鏡只有5歲智商

頭條要聞

特朗普:將對大部分國家征收15%至50%的簡單關稅

頭條要聞

特朗普:將對大部分國家征收15%至50%的簡單關稅

體育要聞

英格蘭最紅球星 也是加勒比島國驕傲

娛樂要聞

汪峰森林北同游日本 各帶各娃互不耽誤

財經要聞

律師解析娃哈哈遺產案:遺囑是最大變數

汽車要聞

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

家居
本地
藝術
公開課
軍事航空

家居要聞

晨曦生活 明媚而放松

本地新聞

這雙丑鞋“泰”辣眼,跪求內娛不要抄作業

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國核彈頭重回英國牽動全球神經

無障礙瀏覽 進入關懷版
×
主站蜘蛛池模板: 沈阳市| 永福县| 工布江达县| 游戏| 大化| 大石桥市| 阿拉尔市| 莱州市| 买车| 阳新县| 秭归县| 景泰县| 明水县| 玉山县| 铜鼓县| 南靖县| 宝应县| 建德市| 鞍山市| 玛多县| 天峻县| 龙山县| 兴宁市| 高唐县| 吴江市| 武乡县| 且末县| 镇坪县| 贞丰县| 清远市| 永泰县| 乌拉特中旗| 克东县| 历史| 宜城市| 冀州市| 海原县| 泸州市| 虞城县| 唐海县| 剑川县|