OpenAI被曝IMO金牌「造假」，陶哲軒怒揭內(nèi)幕！

2025-07-21 10:28:52　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：桃子好困

【新智元導(dǎo)讀】OpenAI高調(diào)摘下數(shù)學(xué)金牌，竟是自嗨！組委會(huì)內(nèi)部人士透露，OpenAI不僅未與IMO官方合作，甚至無視賽事規(guī)則，在閉幕派對(duì)未結(jié)束前搶先官宣。全網(wǎng)怒批其不尊重人類選手，炒作過頭。

，最新大瓜又來了。

昨日，因內(nèi)部審核流程，。

原來，事情并非那么簡單。

一位IMO內(nèi)部人士透露，實(shí)際上OpenAI并沒有和組委會(huì)合作，拿下AI金牌不一定真實(shí)有效。

最關(guān)鍵的是，他們違背了IMO規(guī)定的「公布時(shí)間」規(guī)則。

為了避免AI公司們搶奪人類學(xué)生的風(fēng)頭，IMO評(píng)審團(tuán)要求：在閉幕式結(jié)束一周后再公布結(jié)果。

然而，OpenAI卻在閉幕Party還未結(jié)束前，就發(fā)布了結(jié)果。

對(duì)此，谷歌DeepMind負(fù)責(zé)人Thang Luong表態(tài)，「是的，IMO組委會(huì)有一份不對(duì)外公開的官方評(píng)分標(biāo)準(zhǔn)」。

若未依據(jù)該標(biāo)準(zhǔn)進(jìn)行評(píng)估，任何獎(jiǎng)牌聲明均無效。

扣除1分后應(yīng)為銀牌，而非金牌。

這么說來，OpenAI聲稱拿下IMO金牌，只是自嗨？！

OpenAI真面目被戳穿

搶奪學(xué)生風(fēng)頭

就在昨天，菲爾茲獎(jiǎng)得主陶哲軒在一口氣連發(fā)三條評(píng)論，暗指的就是OpenAI。

他表示，「自己不會(huì)評(píng)論任何未預(yù)先公開測試方法的AI競賽成績報(bào)告。在缺乏受控測試環(huán)境的情況下，AI的數(shù)學(xué)能力難以準(zhǔn)確評(píng)估」。

另外，IMO組委會(huì)一位成員Joseph Myers透露，OpenAI并非是IMO合作測試模型的AI公司之一。

而且，陽光海岸的91位協(xié)調(diào)員（Coordinator）也無人參與結(jié)果評(píng)估。

P6題協(xié)調(diào)員表示，「IMO評(píng)審團(tuán)和協(xié)調(diào)員一致認(rèn)為，OpenAI此舉顯得失禮且不妥當(dāng)」。

根據(jù)IMO規(guī)定，借助AI模型參賽的公司，需要在7月28日之后公布結(jié)果。

一家專注于數(shù)學(xué)AI初創(chuàng)公司Harmonic官方發(fā)文，從側(cè)面印證了這一規(guī)定存在的準(zhǔn)確性。

最新回應(yīng)引熱議

OpenAI研究科學(xué)家，德?lián)渲窷oam Brown下場回應(yīng)，給出了兩點(diǎn)證明：

首先，團(tuán)隊(duì)是在閉幕式「之后」公開結(jié)果。閉幕式有直播記錄，這一點(diǎn)很容易核實(shí)。

其次，他確認(rèn)了OpenAI并未與IMO進(jìn)行協(xié)調(diào)，只是在發(fā)帖前與一位組織者告知了此事。出于對(duì)參賽學(xué)生的尊重，要求OpenAI等到閉幕式結(jié)束后再發(fā)布——「我們也照做了」。

對(duì)此，有人還精細(xì)計(jì)算了閉幕式和公開結(jié)果的時(shí)間差。

IMO閉幕式的時(shí)間在7月19日（當(dāng)?shù)貢r(shí)間）下午4點(diǎn)舉行閉幕式，直播時(shí)間1小時(shí)43分鐘，結(jié)束時(shí)間不晚于5點(diǎn)43分。

再來看負(fù)責(zé)人Alexander Wei的發(fā)文時(shí)間，7月19日下午3:50（東八區(qū)），也就是當(dāng)?shù)貢r(shí)間的5點(diǎn)50分。

從時(shí)間來看，確實(shí)是OpenAI在IMO閉幕式結(jié)束7分鐘后，才發(fā)布了公告。

即便如此，網(wǎng)友們?nèi)耘f看不慣OpenAI炒作風(fēng)暴，而且根本沒有給獲獎(jiǎng)學(xué)生留有余地。

而且，可以確定的是，OpenAI公布的結(jié)果，并沒有得到IMO官方認(rèn)證。

未來幾天，谷歌DeepMind會(huì)正式發(fā)布AI奪下IMO 2025細(xì)節(jié)。

馬庫斯憤怒抨擊，太符合品牌調(diào)性了。

UCLA數(shù)學(xué)教授

LLM短期內(nèi)不會(huì)取代人類

針對(duì)LLM拿下IMO金牌事件，來自UCLA應(yīng)用數(shù)學(xué)教授Ernest Ryu發(fā)表了自己的看法。

1. OpenAI IMO P1-P5的解答目測是正確的。

2. 第6題是一個(gè)明顯新穎且難度更高的問題。可以說第1-5題仍在「標(biāo)準(zhǔn)」IMO解題技巧范圍內(nèi)，但第6題需要?jiǎng)?chuàng)造性思維。

他表示，根據(jù)自己使用LLM進(jìn)行數(shù)學(xué)研究的經(jīng)驗(yàn)，Gemini的表現(xiàn)優(yōu)于ChatGPT。

但OpenAI搶先在周六宣布了結(jié)果，而谷歌DeepMind「慢科研」學(xué)術(shù)作風(fēng)，讓他們輸?shù)袅诉@場公關(guān)戰(zhàn)。

不過，Ernest Ryu認(rèn)為，在短期內(nèi)，大模型不會(huì)取代數(shù)學(xué)家。

因?yàn)閿?shù)學(xué)研究是，解決那些目前「沒有人」知道如何解決的問題（訓(xùn)練數(shù)據(jù)分布之外），即類似IMO P6題。這需要極大的創(chuàng)造力，OpenAI的模型在IMO解題中恰恰缺乏這種能力。

然而，對(duì)于那些人類已有能力解決的問題（訓(xùn)練數(shù)據(jù)分布之內(nèi)），LLM只會(huì)變得愈加強(qiáng)大。

在數(shù)學(xué)研究中，人們會(huì)將現(xiàn)有技術(shù)與新創(chuàng)意相結(jié)合，LLM將顯著加速前一部分工作的實(shí)現(xiàn)。

Ernest Ryu還預(yù)測，在接下來十年里，越來越多的數(shù)學(xué)家將借助LLM來搜索證明框架中的已知部分，從而提升研究效率。

老一輩數(shù)學(xué)家或許會(huì)對(duì)此唏噓不已，但年輕一代只會(huì)繼續(xù)產(chǎn)出優(yōu)秀成果。

參考資料：

https://x.com/ns123abc/status/1947016206768046452 https://x.com/lmthang/status/1946960256439058844 https://x.com/Mihonarium/status/1947027989608190065

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.