99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

金牌模型三位核心華人光速離職!谷歌IMO奪金24h即遭小扎閃電抄家

0
分享至


新智元報道

編輯:桃子

【新智元導讀】谷歌DeepMind剛拿下金牌后,3位Gemini核心研究員光速離職了。沒錯,這一次又是小扎干的好事。

前腳剛奪下IMO金牌,后腳就被小扎抄家了。

剛剛,Information爆料稱,Meta從谷歌DeepMind金牌模型團隊中,再次挖走了三位華人學者。


這三人分別是Tianhe Yu、Cosmo Du和Weiyue Wang,一同參與了Gemini開發。

而且,就在谷歌慶祝IMO奪金的第二天,三位研究員「閃電」離職,轉投入Meta超級智能實驗室。


就在昨天,GDM的官宣博文中,詳細列出了所有參與Gemini模型開發的研究人員。

這些研究人員的含金量,不言而喻。


諷刺的是,今早,微軟也被爆出從谷歌DeepMind挖走了20多位頂尖研究人員。


2016年,AlphaGO在圍棋領域擊敗李世石;如今不到10年的時間,Gemini再次攻克奧數難題斬獲金牌。

不容置疑的是,這場AI軍備賽,正向ASI階段全面邁進,頂尖人才爭奪戰也變得愈發激烈。


官宣第二天,Gemini老將離職

被挖走IMO金牌模型團隊三位研究員,都有怎樣的背景呢?

Tianhe Yu


Tianhe Yu現任谷歌DeepMind研究科學家。

在GDM期間,Tianhe Yu曾參與了Gemini 2.5、初代Gemini、Gemini 1.5等全家桶的研發,甚至包括千億參數大模型PaLM-E的開發。

值得一提是,他還在谷歌RT-1、RT-2機器人模型上做出了貢獻。


他曾獲得了坦福大學計算機科學博士學位,師從Chelsea Finn教授。本科畢業于加州大學伯克利分校,以最高榮譽同時獲得計算機科學、應用數學與統計學三個學位。


昨天,GDM公布IMO金牌結果后,Tianhe Yu本人也發文稱,參與了Gemini Deep Think模型后訓練、思維研發。

他激動表示,「離ASI越來越近了」!


Cosmo Du(杜宇)


杜宇在2017年便加入谷歌,任谷歌DeepMind首席科學家兼總監,專注于Gemini的后訓練、思維與代碼生成。

他同樣是Gemini 1、1.5、2和2.5的核心貢獻者,并開發了Gemini-0801——谷歌首個在LMSYS排行榜上位列第一的模型。

此前,他還主導了Bard/LaMDA的后訓練工作,并開發了Bard首個內部版本。


更早之前,他專注于任務型對話系統,幫助Duplex實現了10倍Scaling。

他曾獲得了浙江大學計算機科學博士學位,本科畢業于華東理工大學計算機科學專業。


Weiyue Wang


Weiyue Wang任谷歌DeepMind研究工程師,在加入谷歌之前,她曾在Waymo擔任軟件工程師。

她曾獲得了南加州大學博士學位,導師是Ulrich Neumann教授;獲得了俄亥俄州立大學電子和計算機工程碩士學位;上交大EEE學士學位。


她本人的研究專注于計算機視覺領域,特別是3D場景理解與重建。

以下是所有參與谷歌IMO 2025系統的研究人員。


我們讓ChatGPT將核心負責人,以及Gemini Deep Think團隊列出。


有網友對此表示,GDM列出所有人名單有些太不明智了。


Gemini 2.5 Pro也能奪金

其實,不用Gemini Deep Think,Gemini 2.5 Pro也能拿下IMO金牌。


來自加州大學洛杉磯分校副教授Lin Yang和Yichen Huang(黃溢辰)一起做了這個實驗,并將結果發表在arXiv上。


論文地址:https://arxiv.org/pdf/2507.15855

他們通過精心設計的流程和提示工程,讓Gemini 2.5 Pro也能攻克5道奧數難題。這究竟是如何做到的?

研究人員的流程設計,一共分為了以下六步:

·初始解答生成:通過第3.1節的提示詞生成初始解;

·自我改進:對初始解進行優化;

·驗證:進入步驟4或步驟;

·驗證檢查:判斷解的合理性;

·糾正:若驗證失敗,返回步驟3;

·接受或拒絕:最終決定是否采納該解。

在初始階段,需要多次運行Gemini 2.5 Pro以獲取問題的若干初始解樣本。

這一采樣過程類似于探索性嘗試,希望至少有一個樣本能部分接近正確解法。隨后,再通過迭代優化這些解,最終篩選出高質量結果。

具體而言,首先讓Gemini 2.5 Pro嘗試通過提示詞解決問題,第二步中,模型被要求自我審查并改進其解答。

盡管Gemini 2.5 Pro擅長數學推理,但作為通用LLM,它并非專為解決極高難度數學問題而設計。一個關鍵限制是思維預算:即使證明一個簡單事實也可能消耗數千token,而Gemini 2.5 Pro的最大上下文token為32768,這通常不足以完整解決一道IMO試題。

研究人員觀察到,在第一步中模型幾乎總會耗盡全部預算,導致無法完成完整求解。

因此,他們將解題過程分解為多步驟,第二步的核心目標是通過額外分配32768 token的預算,讓模型能夠復查并延續其工作。實際監測顯示,第二步的輸出質量顯著提升。

接下來,驗證器將參與迭代優化并決定是否接受改進后的解。

詳細指令參考,覆蓋了核心要求、輸出格式、自我糾正的指令,具體可參見下圖。



比如,讓Gemini 2.5 Pro去解決P1題,再向模型發送問題陳述后,又追加了一句話「讓我們嘗試用歸納法來解決這個問題」。

別小瞧了這句話,可以為模型提供一個強大的方向性引導。而且,就題目組合問題而言,確實也可以通過數學歸納法解決。

設想一個旨在解決復雜問題的多智能體系統:這類任務通常需要大量探索——需要讓不同智能體嘗試不同方法,以期其中某個能找到可行路徑。

在此情境下,對于任何適用于正整數的命題,數學歸納法都是標準且常用的有效方法。

其余題目的提示,以及解題過程,可參考論文中的細節。

順便提一句,字節也在今年IMO上,憑借Seed Prover取得了銀牌分數。


具體來說,Seed Prover完整破解了6題中的4題,最終獲取了30分。另外,在賽后嘗試后,AI一共證明了5道題,也算是拿下了金牌。


如今,OpenAI和GDM先后憑借AI,攻克了前5題,拿下了IMO金牌。

IMO的人類陣地,就僅剩下P6題了。

參考資料:

https://x.com/theinformation/status/1947755575808262417 https://arxiv.org/abs/2507.15855

https://x.com/lyang36/status/1947466281990738339


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中美俄幡然醒悟!原來真正吸血的是歐洲人,如今他們終于要還債了

中美俄幡然醒悟!原來真正吸血的是歐洲人,如今他們終于要還債了

通文知史
2025-07-22 21:55:02
越深愛,越別扭,這三大星座太難懂

越深愛,越別扭,這三大星座太難懂

星座不求人
2025-07-23 21:10:11
國家隊暫停托市!7月24日,今日三大重要消息沖擊市場

國家隊暫停托市!7月24日,今日三大重要消息沖擊市場

風口招財豬
2025-07-24 01:13:10
“大尺度”女星的瓜!

“大尺度”女星的瓜!

文刀萬
2025-05-23 06:05:02
170萬觀眾打出9.7分,沒上映票房破6200萬,大鵬的冠軍保不住了?

170萬觀眾打出9.7分,沒上映票房破6200萬,大鵬的冠軍保不住了?

靠譜電影君
2025-07-22 23:32:19
工齡40年11個月,個人賬戶21.67萬,上海大爺拿了多少養老金呢?

工齡40年11個月,個人賬戶21.67萬,上海大爺拿了多少養老金呢?

養老規劃羅姐說
2025-07-22 19:03:14
最傷害 “陰道” 的 4 個行為,還在經常做的,看完要注意了

最傷害 “陰道” 的 4 個行為,還在經常做的,看完要注意了

伊人河畔
2025-07-12 10:13:49
福建廳干游祖煙履新

福建廳干游祖煙履新

魯中晨報
2025-07-22 07:52:08
48歲陶紅因病去世,9歲女兒一路跪拜祈福,與樂嘉婚姻僅維系3年……

48歲陶紅因病去世,9歲女兒一路跪拜祈福,與樂嘉婚姻僅維系3年……

不二大叔
2025-07-15 21:45:47
為驗證祖先是中國人,6名南島語族后人駕獨木舟,航行116天來中國

為驗證祖先是中國人,6名南島語族后人駕獨木舟,航行116天來中國

博覽歷史
2025-07-22 15:20:03
谷歌母公司二季度業績超預期,提高全年資本支出至850億美元,盤后一度漲3.4% | 財報見聞

谷歌母公司二季度業績超預期,提高全年資本支出至850億美元,盤后一度漲3.4% | 財報見聞

華爾街見聞官方
2025-07-24 05:42:19
女籃眾將發文告別!4朝元老有意宣退,王思雨晚上發文不甘心

女籃眾將發文告別!4朝元老有意宣退,王思雨晚上發文不甘心

凡知
2025-07-23 16:09:34
發現一個悲哀的現象:特別長壽的老人,幾乎都是子女用生命在托舉

發現一個悲哀的現象:特別長壽的老人,幾乎都是子女用生命在托舉

婉秋聊育兒
2025-04-26 05:24:04
記者:劉誠宇可能不具備踢點球的大心臟,鎮定、決斷都還有待提高

記者:劉誠宇可能不具備踢點球的大心臟,鎮定、決斷都還有待提高

直播吧
2025-07-23 22:29:22
南京德基廣場偶遇鹿晗,本人個子不高好瘦小,白皮紅發漫畫感十足

南京德基廣場偶遇鹿晗,本人個子不高好瘦小,白皮紅發漫畫感十足

喜歡歷史的阿繁
2025-07-23 18:08:41
3年1.6億,恭喜湖人,交易非常成功,詹姆斯該開心了

3年1.6億,恭喜湖人,交易非常成功,詹姆斯該開心了

青山隱隱啊
2025-07-23 10:33:05
云南高校在云南遇冷:農大缺額152人、師大缺72人、昆工缺69人!

云南高校在云南遇冷:農大缺額152人、師大缺72人、昆工缺69人!

凱旋學長
2025-07-23 21:52:37
女籃逆襲殺進世大運決賽!李筍南完爆宮魯鳴:中國隊主帥該試試他

女籃逆襲殺進世大運決賽!李筍南完爆宮魯鳴:中國隊主帥該試試他

籃球快餐車
2025-07-24 05:16:28
高喊“打倒民營經濟”的是他,高喊“支持民營經濟”的還是他

高喊“打倒民營經濟”的是他,高喊“支持民營經濟”的還是他

深度報
2025-07-12 23:26:48
巴西巨星太瀟灑,約三女海邊度假,與皇馬續約談判已宣告破裂!

巴西巨星太瀟灑,約三女海邊度假,與皇馬續約談判已宣告破裂!

綠茵舞著
2025-07-24 00:14:40
2025-07-24 06:31:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
13121文章數 66103關注度
往期回顧 全部

科技要聞

別自嗨了!XREAL徐馳:AI眼鏡只有5歲智商

頭條要聞

宗馥莉被質疑讀的是“野雞大學” 校方回應

頭條要聞

宗馥莉被質疑讀的是“野雞大學” 校方回應

體育要聞

英格蘭最紅球星 也是加勒比島國驕傲

娛樂要聞

汪峰森林北同游日本 各帶各娃互不耽誤

財經要聞

律師解析娃哈哈遺產案:遺囑是最大變數

汽車要聞

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

家居
游戲
房產
數碼
軍事航空

家居要聞

晨曦生活 明媚而放松

《光環無限》美術組曾用辭職"逼宮":要求用虛幻引擎

房產要聞

海南自由貿易港全島封關,2025年12月18日正式啟動!

數碼要聞

AppleCare+ 為 iPad 和 Apple Watch 帶來防盜和丟失選項

軍事要聞

美國核彈頭重回英國牽動全球神經

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 盖州市| 澄城县| 长寿区| 陵川县| 古丈县| 肥东县| 巢湖市| 天柱县| 兴山县| 华亭县| 施甸县| 武乡县| 新余市| 盐亭县| 德格县| 洛川县| 永嘉县| 斗六市| 福建省| 禹州市| 永寿县| 沁水县| 洛宁县| 遂平县| 明水县| 宝坻区| 松潘县| 宿州市| 和顺县| 宝丰县| 桐庐县| 丰顺县| 九江市| 左贡县| 融水| 汝城县| 凌海市| 永和县| 边坝县| 临夏县| 涿州市|