撰文丨王聰
編輯丨王多魚
排版丨水成文
近日,國際頂尖學術期刊Nature在其官網頭條報道了人工智能(AI)取得一項新成就——大語言模型首次在國際數學奧林匹克競賽中達到金牌水平。
曾經被認為需要“人類頂級智慧”才能駕馭的國際數學奧林匹克競賽(IMO),如今迎來了強大的AI 挑戰者。Google DeepMind 和 OpenAI 的最新大模型,首次在這項頂級數學競賽中展現了與人類金牌選手比肩的實力!
國際數學奧林匹克競賽,是全球頂尖中學生智力角逐的最高殿堂,其題目之難,往往令普通人望而卻步。然而,人工智能(AI)正在這個領域創造歷史。
2025 年 7 月 21 日,Google 旗下公司 DeepMind 宣布了一個震撼科技界的消息: 其開發的大型語言模型(LLM),成功解答一組與國際數學奧林匹克競賽難度相當的題目,并且達到了人類金牌得主的水平!
具體來說,DeepMind 的大語言模型在今年的評估中,其表現在人類選手評分標準中,已跨越了金牌得主的得分門檻(6 道題,滿分 42 分,35 分為金牌,28 分為銀牌)。這標志著 AI 在解決復雜數學問題能力上的一個重大飛躍。
為什么說這是一個重大飛躍?
質的跨越: 就在去年(2024年),DeepMind 的大語言模型在同類評估中,表現還僅處于銀牌得主的上限區間。從“銀牌頂尖”躍升至“金牌門檻”,這遠非微小的進步,而是 AI 在高級數學推理和問題解決能力上的一次實質性突破。
頂級對標: 國際數學奧林匹克競賽金牌代表著全球高中生在數學領域所能達到的巔峰水平。AI 能在這個層次上取得分數,意味著它在理解復雜概念、進行創造性推理和發現精妙解法方面,已經達到了令人驚嘆的高度。
這不僅僅是 DeepMind 的成就,據報道,OpenAI 的模型也在這一領域展現了同等級別的卓越能力。兩大 AI 巨頭在解決數學難題上的突破,共同宣告了 AI 在高級認知能力方面的巨大進步。
需要特別指出的是,DeepMind 今年取得的成績背后隱藏著一個重大范式轉變,因為該公司此前在數學領域的成績依賴于兩種專門設計的 AI 工具——AlphaGeometry 和 AlphaProof,這需要人類專家首先將考題陳述翻譯成類似于編程語言的內容,然后再將 AI 的解答翻譯回英語。而今年則是在 Gemeni 系統開發的大語言模型——DeepThink,全部圍繞自然語言,不再需要翻譯過程。
此外,這項突破的深遠意義遠超競賽本身:
1、AI 能力的證明: 它有力地證明了大語言模型(LLM)能夠處理極其復雜、需要深度邏輯思維和抽象推理的任務,而不僅僅是文本生成或模式識別。
2、教育與研究的新工具: 此類 AI 可以作為強大的助手,幫助學生學習高等數學、啟發解題思路,甚至協助數學研究人員探索新的猜想和定理。
3、通往 AGI 之路的里程碑: 解決奧林匹克數學競賽金牌級別的數學問題,需要多方面的認知能力組合,這無疑是通往通用人工智能(AGI)之路的重要一步。
從在圍棋領域擊敗人類世界冠軍,到如今在代表人類“純粹智力”巔峰的國際數學奧林匹克中達到金牌水平,AI 一次又一次地刷新著我們對機器能力的認知。DeepMind 和 OpenAI 的這次突破,不僅將 AI 推向了數學推理的新高度,也預示著它們未來在科學探索、技術研發等更廣闊領域釋放巨大潛力的可能。人類智慧與機器智能相互啟迪、共同前行的時代,正加速到來。
https://www.nature.com/articles/d41586-025-02343-x
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.