99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

金牌模型三位核心華人光速離職!谷歌IMO奪金24h即遭小扎閃電抄家

0
分享至


新智元報道

編輯:桃子

【新智元導(dǎo)讀】谷歌DeepMind剛拿下金牌后,3位Gemini核心研究員光速離職了。沒錯,這一次又是小扎干的好事。

前腳剛奪下IMO金牌,后腳就被小扎抄家了。

剛剛,Information爆料稱,Meta從谷歌DeepMind金牌模型團隊中,再次挖走了三位華人學(xué)者。


這三人分別是Tianhe Yu、Cosmo Du和Weiyue Wang,一同參與了Gemini開發(fā)。

而且,就在谷歌慶祝IMO奪金的第二天,三位研究員「閃電」離職,轉(zhuǎn)投入Meta超級智能實驗室。


就在昨天,GDM的官宣博文中,詳細(xì)列出了所有參與Gemini模型開發(fā)的研究人員。

這些研究人員的含金量,不言而喻。


諷刺的是,今早,微軟也被爆出從谷歌DeepMind挖走了20多位頂尖研究人員。


2016年,AlphaGO在圍棋領(lǐng)域擊敗李世石;如今不到10年的時間,Gemini再次攻克奧數(shù)難題斬獲金牌。

不容置疑的是,這場AI軍備賽,正向ASI階段全面邁進,頂尖人才爭奪戰(zhàn)也變得愈發(fā)激烈。


官宣第二天,Gemini老將離職

被挖走IMO金牌模型團隊三位研究員,都有怎樣的背景呢?

Tianhe Yu


Tianhe Yu現(xiàn)任谷歌DeepMind研究科學(xué)家。

在GDM期間,Tianhe Yu曾參與了Gemini 2.5、初代Gemini、Gemini 1.5等全家桶的研發(fā),甚至包括千億參數(shù)大模型PaLM-E的開發(fā)。

值得一提是,他還在谷歌RT-1、RT-2機器人模型上做出了貢獻。


他曾獲得了坦福大學(xué)計算機科學(xué)博士學(xué)位,師從Chelsea Finn教授。本科畢業(yè)于加州大學(xué)伯克利分校,以最高榮譽同時獲得計算機科學(xué)、應(yīng)用數(shù)學(xué)與統(tǒng)計學(xué)三個學(xué)位。


昨天,GDM公布IMO金牌結(jié)果后,Tianhe Yu本人也發(fā)文稱,參與了Gemini Deep Think模型后訓(xùn)練、思維研發(fā)。

他激動表示,「離ASI越來越近了」!


Cosmo Du(杜宇)


杜宇在2017年便加入谷歌,任谷歌DeepMind首席科學(xué)家兼總監(jiān),專注于Gemini的后訓(xùn)練、思維與代碼生成。

他同樣是Gemini 1、1.5、2和2.5的核心貢獻者,并開發(fā)了Gemini-0801——谷歌首個在LMSYS排行榜上位列第一的模型。

此前,他還主導(dǎo)了Bard/LaMDA的后訓(xùn)練工作,并開發(fā)了Bard首個內(nèi)部版本。


更早之前,他專注于任務(wù)型對話系統(tǒng),幫助Duplex實現(xiàn)了10倍Scaling。

他曾獲得了浙江大學(xué)計算機科學(xué)博士學(xué)位,本科畢業(yè)于華東理工大學(xué)計算機科學(xué)專業(yè)。


Weiyue Wang


Weiyue Wang任谷歌DeepMind研究工程師,在加入谷歌之前,她曾在Waymo擔(dān)任軟件工程師。

她曾獲得了南加州大學(xué)博士學(xué)位,導(dǎo)師是Ulrich Neumann教授;獲得了俄亥俄州立大學(xué)電子和計算機工程碩士學(xué)位;上交大EEE學(xué)士學(xué)位。


她本人的研究專注于計算機視覺領(lǐng)域,特別是3D場景理解與重建。

以下是所有參與谷歌IMO 2025系統(tǒng)的研究人員。


我們讓ChatGPT將核心負(fù)責(zé)人,以及Gemini Deep Think團隊列出。


有網(wǎng)友對此表示,GDM列出所有人名單有些太不明智了。


Gemini 2.5 Pro也能奪金

其實,不用Gemini Deep Think,Gemini 2.5 Pro也能拿下IMO金牌。


來自加州大學(xué)洛杉磯分校副教授Lin Yang和Yichen Huang(黃溢辰)一起做了這個實驗,并將結(jié)果發(fā)表在arXiv上。


論文地址:https://arxiv.org/pdf/2507.15855

他們通過精心設(shè)計的流程和提示工程,讓Gemini 2.5 Pro也能攻克5道奧數(shù)難題。這究竟是如何做到的?

研究人員的流程設(shè)計,一共分為了以下六步:

·初始解答生成:通過第3.1節(jié)的提示詞生成初始解;

·自我改進:對初始解進行優(yōu)化;

·驗證:進入步驟4或步驟;

·驗證檢查:判斷解的合理性;

·糾正:若驗證失敗,返回步驟3;

·接受或拒絕:最終決定是否采納該解。

在初始階段,需要多次運行Gemini 2.5 Pro以獲取問題的若干初始解樣本。

這一采樣過程類似于探索性嘗試,希望至少有一個樣本能部分接近正確解法。隨后,再通過迭代優(yōu)化這些解,最終篩選出高質(zhì)量結(jié)果。

具體而言,首先讓Gemini 2.5 Pro嘗試通過提示詞解決問題,第二步中,模型被要求自我審查并改進其解答。

盡管Gemini 2.5 Pro擅長數(shù)學(xué)推理,但作為通用LLM,它并非專為解決極高難度數(shù)學(xué)問題而設(shè)計。一個關(guān)鍵限制是思維預(yù)算:即使證明一個簡單事實也可能消耗數(shù)千token,而Gemini 2.5 Pro的最大上下文token為32768,這通常不足以完整解決一道IMO試題。

研究人員觀察到,在第一步中模型幾乎總會耗盡全部預(yù)算,導(dǎo)致無法完成完整求解。

因此,他們將解題過程分解為多步驟,第二步的核心目標(biāo)是通過額外分配32768 token的預(yù)算,讓模型能夠復(fù)查并延續(xù)其工作。實際監(jiān)測顯示,第二步的輸出質(zhì)量顯著提升。

接下來,驗證器將參與迭代優(yōu)化并決定是否接受改進后的解。

詳細(xì)指令參考,覆蓋了核心要求、輸出格式、自我糾正的指令,具體可參見下圖。



比如,讓Gemini 2.5 Pro去解決P1題,再向模型發(fā)送問題陳述后,又追加了一句話「讓我們嘗試用歸納法來解決這個問題」。

別小瞧了這句話,可以為模型提供一個強大的方向性引導(dǎo)。而且,就題目組合問題而言,確實也可以通過數(shù)學(xué)歸納法解決。

設(shè)想一個旨在解決復(fù)雜問題的多智能體系統(tǒng):這類任務(wù)通常需要大量探索——需要讓不同智能體嘗試不同方法,以期其中某個能找到可行路徑。

在此情境下,對于任何適用于正整數(shù)的命題,數(shù)學(xué)歸納法都是標(biāo)準(zhǔn)且常用的有效方法。

其余題目的提示,以及解題過程,可參考論文中的細(xì)節(jié)。

順便提一句,字節(jié)也在今年IMO上,憑借Seed Prover取得了銀牌分?jǐn)?shù)。


具體來說,Seed Prover完整破解了6題中的4題,最終獲取了30分。另外,在賽后嘗試后,AI一共證明了5道題,也算是拿下了金牌。


如今,OpenAI和GDM先后憑借AI,攻克了前5題,拿下了IMO金牌。

IMO的人類陣地,就僅剩下P6題了。

參考資料:

https://x.com/theinformation/status/1947755575808262417 https://arxiv.org/abs/2507.15855

https://x.com/lyang36/status/1947466281990738339


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
為雷蘭曦復(fù)仇!王正行2-0完爆法國名將,男單四強國羽占半壁江山

為雷蘭曦復(fù)仇!王正行2-0完爆法國名將,男單四強國羽占半壁江山

釘釘陌上花開
2025-07-25 18:36:23
馬筱梅直播被黑粉攻擊:不會下蛋的雞,高情商回懟:下了你記得隨禮

馬筱梅直播被黑粉攻擊:不會下蛋的雞,高情商回懟:下了你記得隨禮

小娛樂悠悠
2025-07-25 12:45:54
7月24日俄烏最新:驚心動魄的一天一夜

7月24日俄烏最新:驚心動魄的一天一夜

西樓飲月
2025-07-24 18:13:23
發(fā)現(xiàn)一種新型養(yǎng)老:不請住家保姆,不去養(yǎng)老院,有人來照顧還省錢

發(fā)現(xiàn)一種新型養(yǎng)老:不請住家保姆,不去養(yǎng)老院,有人來照顧還省錢

明月讀書吧
2025-07-21 17:20:03
美網(wǎng)紅:楊瀚森不會英語就不配來這撈金 尊重都是相互的

美網(wǎng)紅:楊瀚森不會英語就不配來這撈金 尊重都是相互的

直播吧
2025-07-25 09:50:08
星二代逆襲!王驍新片預(yù)售破8000萬打臉全網(wǎng)張譯當(dāng)年力挺終成預(yù)言

星二代逆襲!王驍新片預(yù)售破8000萬打臉全網(wǎng)張譯當(dāng)年力挺終成預(yù)言

界史
2025-07-25 15:24:08
事實證明,無妻無子、身價過億、做了51年老好人的何炅,才最涼薄

事實證明,無妻無子、身價過億、做了51年老好人的何炅,才最涼薄

坊聞本尊
2025-06-14 13:14:54
最新反轉(zhuǎn)!娃哈哈百億家產(chǎn)爭奪戰(zhàn),宗馥莉被逼到崩潰!

最新反轉(zhuǎn)!娃哈哈百億家產(chǎn)爭奪戰(zhàn),宗馥莉被逼到崩潰!

邱處機
2025-07-24 19:06:38
80歲張春橋保外就醫(yī)細(xì)節(jié):每天兩菜一湯,最怕聽到孩子笑聲!

80歲張春橋保外就醫(yī)細(xì)節(jié):每天兩菜一湯,最怕聽到孩子笑聲!

星宇共鳴
2025-07-24 17:34:26
逆轉(zhuǎn)!石宇奇2-1李詩灃,晉級中國公開賽男單半決賽&將戰(zhàn)周天成

逆轉(zhuǎn)!石宇奇2-1李詩灃,晉級中國公開賽男單半決賽&將戰(zhàn)周天成

直播吧
2025-07-25 13:54:25
德國和江蘇同為8000多萬人,德國創(chuàng)造4.66萬億GDP,江蘇令人意外

德國和江蘇同為8000多萬人,德國創(chuàng)造4.66萬億GDP,江蘇令人意外

南宗歷史
2025-07-25 14:37:02
默克爾預(yù)測對了!俄烏沖突最大輸家已經(jīng)出現(xiàn),不是俄羅斯不是美國

默克爾預(yù)測對了!俄烏沖突最大輸家已經(jīng)出現(xiàn),不是俄羅斯不是美國

通文知史
2025-07-24 18:24:41
闞清子官宣懷孕后,紀(jì)凌塵卻扒出沒刪跟闞清子的合照,評論區(qū)笑瘋

闞清子官宣懷孕后,紀(jì)凌塵卻扒出沒刪跟闞清子的合照,評論區(qū)笑瘋

小徐講八卦
2025-07-25 15:35:21
泰柬交火了!泰方剛找過中國,柬埔寨1700萬人正為洪森的囂張買單

泰柬交火了!泰方剛找過中國,柬埔寨1700萬人正為洪森的囂張買單

通文知史
2025-07-24 18:25:17
上海市浦東新區(qū)三林鎮(zhèn)一干部被調(diào)查

上海市浦東新區(qū)三林鎮(zhèn)一干部被調(diào)查

上觀新聞
2025-07-25 15:37:33
不到一天!雅魯藏布江工程剛動工,印主持人:派飛機炸中國工地

不到一天!雅魯藏布江工程剛動工,印主持人:派飛機炸中國工地

界史
2025-07-24 11:21:28
“我都退休了憑啥不能補課?”老教師家中補課被舉報,教育部門回應(yīng)

“我都退休了憑啥不能補課?”老教師家中補課被舉報,教育部門回應(yīng)

譚老師地理工作室
2025-07-25 14:25:28
“沒忍住、射里面”報警,尷尬了誰?

“沒忍住、射里面”報警,尷尬了誰?

深度報
2025-07-24 10:49:25
河南一超市外立面坍塌,有孩子被砸?太康縣應(yīng)急局:是否有傷亡“暫不對外透露”

河南一超市外立面坍塌,有孩子被砸?太康縣應(yīng)急局:是否有傷亡“暫不對外透露”

大風(fēng)新聞
2025-07-25 18:41:55
知名湘菜品牌被曝拖欠千萬元貨款!品牌方獨家回應(yīng)

知名湘菜品牌被曝拖欠千萬元貨款!品牌方獨家回應(yīng)

藍鯨新聞
2025-07-25 16:03:22
2025-07-25 19:47:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13133文章數(shù) 66105關(guān)注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

馬斯克轉(zhuǎn)發(fā)讓懂車帝輔助駕駛測試"火"了 鴻蒙智行回應(yīng)

頭條要聞

馬斯克轉(zhuǎn)發(fā)讓懂車帝輔助駕駛測試"火"了 鴻蒙智行回應(yīng)

體育要聞

39歲的落選秀,被稱為NBA最完美的人

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權(quán)

財經(jīng)要聞

劉煜輝:當(dāng)下重要不是找確定性而是轉(zhuǎn)折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態(tài)度原創(chuàng)

房產(chǎn)
藝術(shù)
教育
旅游
本地

房產(chǎn)要聞

分?jǐn)?shù)線集體飆漲!海中867分!2025海南中招格局大變!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

2025高考慘痛教訓(xùn)!安徽600+考生投檔民辦!貴州高分考生被誤錄取

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

換個城市過夏天|風(fēng)拂鹽湖,躲進格爾木的盛夏清涼

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 化德县| 和平县| 德庆县| 龙南县| 滁州市| 营山县| 衡南县| 大埔区| 南陵县| 嘉荫县| 青神县| 石阡县| 广宗县| 张家口市| 阳新县| 双流县| 民权县| 毕节市| 共和县| 卢湾区| 波密县| 苗栗县| 高尔夫| 遵义市| 桃源县| 津市市| 兴文县| 富民县| 临清市| 高淳县| 基隆市| 盈江县| 彭阳县| 礼泉县| 郸城县| 建湖县| 德州市| 高密市| 凤城市| 威宁| 措勤县|