網易首頁 > 網易號 > 正文申請入駐

Talk預告 | 上海交通大學孟繁青：MM-EUREKA - 多模態推理的關鍵因素是什么？

2025-04-15 08:24:36　來源: 將門創投

北京舉報

分享至

本期為TechBeat人工智能社區第677期線上Talk。

北京時間4月16日(周三)20:00，上海交通大學博士生孟繁青的Talk將準時在TechBeat人工智能社區開播！

他與大家分享的主題是:“MM-EUREKA - 多模態推理的關鍵因素是什么？”，屆時他將分享MM-EUREKA系列，探索如何在多模態推理場景下進行穩定訓練，并實現了7B模型在多個benchmark超過32B以及以上的優異表現。

Talk·信息

主題：MM-EUREKA - 多模態推理的關鍵因素是什么？

嘉賓：上海交通大學 · 博士生 - 孟繁青

時間：北京時間4月16日(周三)20:00

地點：TechBeat人工智能社區

http://www.techbeat.net/

Talk·介紹

當前DeepSeek-R1，O1等在LLM的推理領域具有卓越表現，社區對于LLM的推理研究也逐漸火熱。但是在多模態推理場景下，缺乏一個可以穩定訓練的基線。在這里我們開發了MM-EUREKA系列，探索如何在多模態推理場景下進行穩定訓練，實現了7B模型在多個benchmark超過32B以及以上的優異表現。

Talk大綱

1. R1的簡單介紹

2. 多模態RL穩定訓練的幾個秘訣

3. RL的卓越的數據效率以及泛化性

Talk·預習資料

論文鏈接： https://arxiv.org/abs/2503.07365 項目主頁： https://github.com/ModalMinds/MM-EUREKA

Talk·提問交流

在Talk界面下的【交流區】參與互動！留下你的打call和問題，和更多小伙伴們共同討論，被講者直接翻牌解答！

你的每一次貢獻，我們都會給予你相應的i豆積分，還會有驚喜獎勵哦！

Talk·嘉賓介紹

孟繁青???????????

上海交通大學 · 博士生???

孟繁青，上海交通大學二年級直博生。研究方向包括多模態大模型的預訓練，后訓練以及評測等方面，以第一作者 / 共一作者在ICML，ICLR，NIPS，ACL等頂級會議或者期刊發表5片文章，相關研究成果在HuggingFace上共計獲得10k+下載，在github上共計獲得1k+ star，被Qwen，InternVL，Deepmind團隊等引用或者使用。目前的研究方向聚焦在多模態大模型的推理。

個人主頁: https://www.techbeat.net/grzytrkj?id=44418????

-The End-

如果你也想成為講者

自薦 / 推薦

單人Talk | 團隊專場 | 錄播or直播 | 閉門交流

多種方式任你選擇！

推薦講者成功也有獎勵哦~

關于TechBeat人工智能社區

TechBeat(www.techbeat.net)隸屬于將門創投，是一個薈聚全球華人AI精英的成長社區。

我們希望為AI人才打造更專業的服務和體驗，加速并陪伴其學習成長。

期待這里可以成為你學習AI前沿知識的高地，分享自己最新工作的沃土，在AI進階之路上的升級打怪的根據地！

更多詳細介紹>>

預約本期Talk

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.