AI里程碑事件!OpenAI最新實驗性推理模型在國際數學奧林匹克競賽(IMO)中解出5道題,獲得金牌級成績,成為首個達到人類頂尖選手水平的AI系統,CEO山姆·奧特曼(Sam Altman)稱這是"通用人工智能的重要標志"。
6題解出5題,打破陶哲軒預言
在與人類相同的考試條件下,OpenAI模型在2025年IMO中完成5道難題,包括需要復雜證明的幾何和數論題。這一成績遠超學界預期——菲爾茲獎得主陶哲軒(Terence Tao)6月剛預測"AI短期內無法在IMO取得高分",建議從低級別競賽起步。
"IMO題目要求持續的創造性思維,與以往基準測試完全不同,"研究團隊成員諾姆·布朗(Noam Brown)解釋,"這個模型能進行長時間推理,展現出前所未有的耐力。"該模型在無特殊數學模塊加持下完成解題,證明通用LLM也能掌握高級數學推理。
通用AI vs 專用系統的較量
這一突破與DeepMind的AlphaGeometry形成鮮明對比:OpenAI模型基于通用強化學習的LLM,無專用數學模塊,AlphaGeometry專為數學證明設計,依賴形式化邏輯系統。
"這不是專用數學系統,而是我們邁向通用智能的核心進展,"奧特曼強調。模型通過"思維鏈推理"和"自我批判"機制,能像人類數學家一樣嘗試多種解法,最終選擇最優路徑。
專家激辯:是革命還是噱頭?
AI界對此反應兩極,支持者認為這標志著AI從"模式識別"邁向"真正推理",可能加速數學研究,質疑者如AI評論家加里·馬庫斯(Gary Marcus)指出"IMO未獨立驗證結果",并質疑"高成本單次解題的實用價值"。
值得注意的是,該模型解題過程耗時遠超人類——平均每道題需思考2-3小時,且尚未公開完整證明過程。奧特曼透露,具備此能力的模型"數月內不會對公眾開放"。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.