網易首頁 > 網易號 > 正文申請入駐

OpenAI模型斬獲國際數學奧賽金牌！6題解出5題，超越人類頂尖選手

2025-07-21 18:24:40　來源: 老費話家常

北京舉報

分享至

AI里程碑事件！OpenAI最新實驗性推理模型在國際數學奧林匹克競賽（IMO）中解出5道題，獲得金牌級成績，成為首個達到人類頂尖選手水平的AI系統，CEO山姆·奧特曼（Sam Altman）稱這是"通用人工智能的重要標志"。

6題解出5題，打破陶哲軒預言
在與人類相同的考試條件下，OpenAI模型在2025年IMO中完成5道難題，包括需要復雜證明的幾何和數論題。這一成績遠超學界預期——菲爾茲獎得主陶哲軒（Terence Tao）6月剛預測"AI短期內無法在IMO取得高分"，建議從低級別競賽起步。

"IMO題目要求持續的創造性思維，與以往基準測試完全不同，"研究團隊成員諾姆·布朗（Noam Brown）解釋，"這個模型能進行長時間推理，展現出前所未有的耐力。"該模型在無特殊數學模塊加持下完成解題，證明通用LLM也能掌握高級數學推理。

通用AI vs 專用系統的較量
這一突破與DeepMind的AlphaGeometry形成鮮明對比：OpenAI模型基于通用強化學習的LLM，無專用數學模塊，AlphaGeometry專為數學證明設計，依賴形式化邏輯系統。

"這不是專用數學系統，而是我們邁向通用智能的核心進展，"奧特曼強調。模型通過"思維鏈推理"和"自我批判"機制，能像人類數學家一樣嘗試多種解法，最終選擇最優路徑。

專家激辯：是革命還是噱頭？
AI界對此反應兩極，支持者認為這標志著AI從"模式識別"邁向"真正推理"，可能加速數學研究，質疑者如AI評論家加里·馬庫斯（Gary Marcus）指出"IMO未獨立驗證結果"，并質疑"高成本單次解題的實用價值"。

值得注意的是，該模型解題過程耗時遠超人類——平均每道題需思考2-3小時，且尚未公開完整證明過程。奧特曼透露，具備此能力的模型"數月內不會對公眾開放"。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

無人工干預取得35分，谷歌拿下首個屬于AI的IMO「真」金牌

DeepTech深科技 2025-07-22 18:37:36
6 跟貼 6
這才是IMO奧賽戰神：滿分，5戰3金，剛被MIT錄取

機器之心Pro 2025-07-23 18:47:55
0 跟貼 0

一場對抗OpenAI們的“危險游戲”

虎嗅APP 2025-07-23 18:10:49
0 跟貼 0

ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動執行各種任務

量子位 2025-07-18 18:08:35
0 跟貼 0
DeepMind剛拿完IMO金牌，科學家就被Meta挖走了，都是華人大牛

機器之心Pro 2025-07-23 10:21:08
6 跟貼 6

宇樹機器人復雜環境穩定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
199 跟貼 199

一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
下個萬億美元市場！老黃：人形機器人要落地

量子位 2025-05-19 20:06:49
13 跟貼 13

AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
人機編程大戰，人類苦戰三天險勝OpenAI

機器之心Pro 2025-07-18 18:21:43
0 跟貼 0
AI的母語是什么？人類進化花了200萬年，AI只需一個晚上

量子位 2025-05-23 19:24:56
0 跟貼 0
用AI找回面子，成功把大侄子看得目瞪口呆

量子位 2025-07-01 14:31:29
0 跟貼 0
網友實測Veo3視頻旋風：模擬車展、上課、ASMR

量子位 2025-05-25 09:14:22
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
0 跟貼 0
超算互聯網上線開源AI社區！模型+數據+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
AI的母語是什么？不是英語，不是漢語

量子位 2025-05-23 17:58:54
0 跟貼 0
4o生圖前端效果騙了太多人，網友扒出逐行生成的演示當不得真

量子位 2025-04-02 21:22:14
0 跟貼 0
可靈ReCamMaster在海外爆火，帶你從全新角度看好萊塢大片

機器之心Pro 2025-07-23 19:04:22
0 跟貼 0
AI音頻生成重要突破！超10秒精準可控免訓練，清華×生數科技最新研究被ACM頂會收錄

智東西 2025-07-23 20:13:42
0 跟貼 0
OpenAI反挖四位特斯拉、xAI、Meta高級工程師

機器之心Pro 2025-07-09 17:14:35
0 跟貼 0
多個AI測試語文高考作文穩拿高分，卻敗在了數學壓軸題上

量子位 2025-06-10 20:24:14
0 跟貼 0
上海中學接回2026年第67屆IMO承辦會旗！

魔都小升初 2025-07-22 18:32:54
1 跟貼 1
烈犬撲幼童后續：被撲全家遭威脅，狗主身份被扒，背后產業鏈曝光

鋭娛之樂 2025-07-22 20:33:27
8332 跟貼 8332
自貢發布新型消防滅火無人機系統

封面新聞 2025-07-22 21:26:49
519 跟貼 519
剛剛，OpenAI星際之門要建5GW數據中心，馬斯克祭出AI基建5年計劃

機器之心Pro 2025-07-23 10:29:14
4 跟貼 4
有高人預測，不出意外的話，10年后的中國可能是這樣！

皮皮怪搞笑 2025-07-22 08:58:40
1 跟貼 1
被大侄子用一道初中題難住？我靠AI找回了面子

量子位 2025-07-01 14:23:05
0 跟貼 0
初中數學解根式方程，不需要平方也能解題！

三樂大掌柜 2025-07-22 07:48:58
1 跟貼 1
河北邯鄲數學化簡題，分子的1怎么換掉？.mp4

三樂大掌柜 2025-07-19 12:32:07
1 跟貼 1
若f(x-1)f(x+1)=x2+4x+3,且f(1)=1,求f(9)的值.mp4

三樂大掌柜 2025-07-19 12:32:40
1 跟貼 1
喜報！常州葉朱灝澤，被清華大學錄取！

中吳網 2025-07-23 11:48:15
4 跟貼 4
小學數學題經典題目雞兔同籠，這道題難倒了許多小朋友

公考客棧店小二 2025-07-21 21:54:27
0 跟貼 0
若f(x)為偶函數,對任意x都有xf(x+1)=(1+x)f(x),求函數的值

三樂大掌柜 2025-07-23 08:36:28
1 跟貼 1
最不會做的就是找規律的題目了，我根本就不知道從哪里開始入手

公考客棧店小二 2025-07-19 21:51:29
0 跟貼 0
AI刪庫跑路！硅谷CEO控訴Replit引熱議

量子位 2025-07-22 18:54:56
0 跟貼 0
“奧巴馬被逮捕”AI視頻傳遍！一切都在他的掌握之中

關山快訊 2025-07-23 17:09:56
2 跟貼 2
經濟分析可借助例子推理

澎湃新聞 2025-07-22 20:18:15
0 跟貼 0
杭州市余杭區部分小區供水異常調查情況通報

界面新聞 2025-07-23 17:44:30
7210 跟貼 7210
最近大火的雕塑家李沐之古希臘雕像全假論的邏輯事實荒誕（三）

王小東 2025-07-21 17:16:54
12 跟貼 12
初中三年淘汰順序揭秘：英語、數學與物理為何成為關鍵？

明天去看太陽 2025-07-22 02:38:43
0 跟貼 0

手機 / 數碼

房產 / 家居

OpenAI模型斬獲國際數學奧賽金牌！6題解出5題，超越人類頂尖選手

別自嗨了！XREAL徐馳：AI眼鏡只有5歲智商

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

英格蘭最紅球星 也是加勒比島國驕傲

汪峰森林北同游日本 各帶各娃互不耽誤

律師解析娃哈哈遺產案:遺囑是最大變數

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

呼吸科專家破解呼吸道九大謠言！

LPL第三階段：TES零封FPX，要想改變口碑，還需要成績說話

新年吃什么爸爸說交給孩子們自己決定，又是有趣的一餐

美國核彈頭重回英國牽動全球神經

印度、孟加拉關切雅魯藏布江下游水電站工程中方回應

印度、孟加拉關切雅魯藏布江下游水電站工程中方回應

英格蘭最紅球星也是加勒比島國驕傲

汪峰森林北同游日本各帶各娃互不耽誤

德系大招放盡場地極限測試全新奧迪A5L