99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

思維鏈開山作者Jason Wei加入Meta,機器之心獨家證實:Slack沒了

0
分享至



機器之心報道

機器之心編輯部

Meta 針對 OpenAI 的挖人竟然還在繼續!

這或許是目前為止,扎克伯格挖走的最強技術人才。

就在剛剛,外媒 Wired 的一位資深 AI 領域記者爆料稱,「多個消息源證實,OpenAI 知名研究員 Jason Wei 和另一位研究科學家 Hyung Won Chung 將雙雙離職,投奔 Meta。」

并且,他們二人的 Slack 賬號已經被停用。機器之心也從 OpenAI 相關人士證實了該消息,「(Jason Wei)Slack 沒了」,但是否是加入 Meta 還有待進一步證實。





Jason Wei 是 OpenAI 的知名科學家,目前 AI 大模型領域里重要技術思維鏈(CoT)的主要作者,Hyung Won Chung 也是 o1 的核心貢獻者之一。



Jason Wei 是 CoT 論文的第一作者,該論文的引用量已超過 1.7 萬

如果你對他們的印象還不夠深,還記得去年 12 月 OpenAI 連續兩周的新產品發布會嗎?坐在奧特曼旁邊的就是 Hyung Won Chung,最右邊的是 Jason Wei。他倆都畢業于 MIT,曾在谷歌工作,現在可能一起去了 Meta。



爆料消息出來不久,Jason Wei 并沒有正面回應,而是發了一篇推特,介紹其長博客,探討了驗證非對稱性以及「驗證者」法則。



但評論區看熱鬧的大家伙似乎已經不關注他寫了什么,都在恭喜他跳槽到 Meta。



在發了這篇技術博客沒多長時間,Jason Wei 又發了一篇推特。



以下是原推內容翻譯:

過去一年成為一名強化學習(RL)狂熱愛好者,并且清醒時大部分時間都在思考 RL,這無意中教會了我一個關于如何過好自己生活的重要道理。

RL 中的一個核心概念是,你總是希望處于「同策略(on-policy)」狀態:與其模仿別人成功的軌跡,不如采取自己的行動,并從環境給予的獎勵中學習。顯然,模仿學習(imitation learning)在最初引導模型達到非零通過率時很有用,但一旦模型能走出合理的軌跡,我們通常就會避免模仿學習,因為要充分發揮模型自身(與人類不同)優勢的最佳方式是只從它自己的軌跡中學習。一個被廣泛接受的實例是:在訓練語言模型解決數學應用題方面,強化學習比簡單地用人類編寫的思維鏈進行監督微調效果更好。

人生也是如此。我們最初通過模仿學習(學校教育)來引導自己,這非常合理。但即使在我畢業后,仍有一個習慣:研究別人如何取得成功并試圖模仿他們。有時會奏效,但最終我意識到,我永遠無法完全超越他人,因為他們是在發揮他們的優勢,而這些優勢我可能并不具備。這可能是某位研究人員比我更成功地進行大膽嘗試(運行 yolo),因為他們親自搭建了代碼庫而我沒有;或者一個非 AI 的例子:一位足球運動員利用我不具備的力量優勢保持控球權。

進行同策略 RL 帶來的啟示是:要超越前輩(beat the teacher),必須走自己的路,承擔風險并從環境中獲取回報。例如,比起一般的研究人員,我更喜歡做兩件事:(1) 大量審閱數據,(2) 進行消融研究以理解系統中各個組件的作用。有一次在收集數據集時,我花了幾天時間審閱數據并給每位人類標注員提供個性化反饋,之后數據質量變得極佳,并且我對要解決的任務獲得了寶貴的見解。今年早些時候,我花了一個月時間回溯并逐一消融研究之前在做深度研究時嘗試做的每個決策。這花費了相當多的時間,但通過這些實驗,我學到了關于哪種類型的 RL 效果好的獨特經驗。發揮自己的熱情讓我更有滿足感,而且我現在感覺自己正走在為自己和自己的研究開辟一片更強大天地的道路上。

簡而言之,模仿是好的,你必須在初始階段這樣做。但一旦你完成了足夠的引導,若想超越前輩,就必須進行「同策略」的強化學習,學會揚長避短。

接下來,我們來看這兩位研究員的履歷。

Jason Wei

Jason Wei 是思維鏈(Chain of Thought,CoT)概念開山之作 ——「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」的第一作者,本科畢業就加入了谷歌。在那里,他推廣了思維鏈提示概念,共同領導了指令調優的早期工作,并和 Yi Tay、Jeff Dean 等人合著了關于大模型涌現能力的論文。

2023 年 2 月,Jason Wei 加入 OpenAI,工作內容包括了推理模型 o1 和深度研究模型。



在 Google Scholar 主頁上,Jason Wei 的論文引用量已經超過了 77k,其中前兩位分別是 CoT 提示論文和 GPT-4 技術報告。



Hyung Won Chung

Hyung Won Chung 出生于韓國,OpenAI 研究科學家,專注于 LLM 的研究與應用。



他博士畢業于麻省理工學院,之后曾在谷歌從事了三年多的研究工作,期間參與了 PaLM(具有 5400 億參數的大語言模型)、 BLOOM( 1760 億參數的開放式多語言模型)、Flan-T5 等多個重要項目的研發。

離開谷歌后,Hyung Won Chung 于 2023 年加入 OpenAI。



在 OpenAI 工作期間,Hyung Won Chung 參與了多個重大項目的研究, 特別在以下項目中扮演了關鍵角色:o1-preview(2024 年 9 月),o1 正式版(2024 年 12 月)、Deep Research(2025 年 2 月),以及領導了 Codex mini 模型訓練。

在 OpenAI 一些重大發布會上,我們也經??吹?Hyung Won Chung 的身影。



Hyung Won Chung 參與過的 OpenAI 一些發布會

作為 o1 系統的奠基貢獻者,他在開發大語言模型的推理、搜索信息能力、以及使用強化學習策略方面發揮了重要作用。

Hyung Won Chung 還在多個重要場合分享洞見,包括斯坦福 CS25 講座廣受大家好評。



Hyung Won Chung 在 OpenAI 的研究工作中,他的貢獻不僅推動了 o1 系列模型成為具有思考能力的前沿工具,也在編碼智能體、系統評估和安全保障方面開辟了新路徑,形成了一個從理論到應用、從開發到普及的完整研究生態。

隨著 Jason Wei、Hyung Won Chung 兩位大佬級別的人員離開,OpenAI 真的要被挖麻了。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
確認了,即將影響浙江!提醒:這兩天多穿紅色衣服,16點前盡量少出門

確認了,即將影響浙江!提醒:這兩天多穿紅色衣服,16點前盡量少出門

FM93浙江交通之聲
2025-07-16 14:50:59
6號臺風“韋帕”或直沖廣東,大暴雨+10級大風在路上!

6號臺風“韋帕”或直沖廣東,大暴雨+10級大風在路上!

魯中晨報
2025-07-16 14:12:43
工行出軌女高管高清照曝光:有身材也有樣貌,情人承認被現場抓包

工行出軌女高管高清照曝光:有身材也有樣貌,情人承認被現場抓包

江山揮筆
2025-07-16 15:00:16
吉林一村民因與被告同名遭查封凍結600萬元近一年,法院稱庭后會處理

吉林一村民因與被告同名遭查封凍結600萬元近一年,法院稱庭后會處理

澎湃新聞
2025-07-16 13:02:28
宗馥莉和她媽的關系也很復雜,因為老宗去世后就開始算賬了…

宗馥莉和她媽的關系也很復雜,因為老宗去世后就開始算賬了…

史行途
2025-07-16 15:37:30
港媒:宗馥莉曾用美國護照在香港買房,被質疑持有雙國籍

港媒:宗馥莉曾用美國護照在香港買房,被質疑持有雙國籍

小撇說事
2025-07-16 09:36:53
上海官宣!事關工資!

上海官宣!事關工資!

上海閔行
2025-07-16 15:15:11
紫牛熱點∣華東理工大學統一收繳開具查收單,充電寶成了違章電器?

紫牛熱點∣華東理工大學統一收繳開具查收單,充電寶成了違章電器?

揚子晚報
2025-07-16 18:43:02
持有娃哈哈46%股權的杭州國資委,為何一直保持沉默?

持有娃哈哈46%股權的杭州國資委,為何一直保持沉默?

互聯網大觀
2025-07-16 18:05:45
西班牙驚現46℃極端高溫! 近兩個月,1180人因高溫死亡

西班牙驚現46℃極端高溫! 近兩個月,1180人因高溫死亡

每日經濟新聞
2025-07-16 10:55:47
美國貿易政策|假如美國退出WTO

美國貿易政策|假如美國退出WTO

澎湃新聞
2025-07-16 10:22:27
中國香港球員米高賽后謝場嘲諷國足球迷:下次我們打敗這些混蛋

中國香港球員米高賽后謝場嘲諷國足球迷:下次我們打敗這些混蛋

雷速體育
2025-07-16 15:20:12
跨省履新!長安大學迎70后新校長

跨省履新!長安大學迎70后新校長

上觀新聞
2025-07-16 14:53:11
深圳盧女士,完美演繹了什么叫精致的利己主義

深圳盧女士,完美演繹了什么叫精致的利己主義

近距離
2025-07-15 13:25:45
全紅嬋家建房最新情況:鄰居拒砍樹致施工停滯,法律專家支招解困

全紅嬋家建房最新情況:鄰居拒砍樹致施工停滯,法律專家支招解困

二瘋說球
2025-07-15 13:30:52
重慶紅衣女后續,派出所搖人耍橫,文旅重拳出擊,這下飯碗也丟了

重慶紅衣女后續,派出所搖人耍橫,文旅重拳出擊,這下飯碗也丟了

鋭娛之樂
2025-07-14 14:54:11
組織部發布:2025年起,事業編調任公務員放寬?3類人優先破局

組織部發布:2025年起,事業編調任公務員放寬?3類人優先破局

巢客HOME
2025-07-16 09:15:02
誰才是娃哈哈的主人?宗馥莉叔叔:她不夠厚道

誰才是娃哈哈的主人?宗馥莉叔叔:她不夠厚道

財經無忌
2025-07-15 19:39:08
微微一笑贏信任~楊瀚森稱做得不夠好 比盧普斯:哪里 做得很好

微微一笑贏信任~楊瀚森稱做得不夠好 比盧普斯:哪里 做得很好

直播吧
2025-07-16 13:47:16
DeepSeek使用率已驟降至3%

DeepSeek使用率已驟降至3%

黑噪音
2025-07-15 21:09:51
2025-07-16 19:24:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10881文章數 142381關注度
往期回顧 全部

科技要聞

黃仁勛:輕視華為和中國制造的人非常天真

頭條要聞

老人名下有房卻租房20年:小兒子剛搬走大兒子就住進去

頭條要聞

老人名下有房卻租房20年:小兒子剛搬走大兒子就住進去

體育要聞

不給楊瀚森傳球,他有自己的理由

娛樂要聞

都美竹將參加綜藝,單身媽媽發文抵制

財經要聞

探究萬億市場的休閑零食

汽車要聞

理想i8內飾官圖公布 李想回應"被打臉"

態度原創

手機
健康
親子
游戲
藝術

手機要聞

消息稱蘋果 iPhone 17 Air 手機 12GB 內存速度不及 Pro 版

呼吸科專家破解呼吸道九大謠言!

親子要聞

如何幫孩子安然度過黃梅天

《EA Sports FC 26》終極版封面確定“伊布”擔當

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 崇信县| 酒泉市| 文昌市| 清丰县| 堆龙德庆县| 玉田县| 榆中县| 潮州市| 平泉县| 萍乡市| 开原市| 浏阳市| 工布江达县| 南涧| 铁力市| 鲁山县| 怀化市| 酉阳| 突泉县| 都昌县| 洛宁县| 剑阁县| 太白县| 英超| 砀山县| 崇仁县| 伊川县| 武隆县| 三穗县| 贺兰县| 琼中| 陵水| 威远县| 旺苍县| 吉安县| 临邑县| 大余县| 额济纳旗| 宜兴市| 香河县| 广西|