本期為TechBeat人工智能社區第677期線上Talk。
北京時間4月16日(周三)20:00,上海交通大學博士生孟繁青的Talk將準時在TechBeat人工智能社區開播!
他與大家分享的主題是:“MM-EUREKA - 多模態推理的關鍵因素是什么?”,屆時他將分享MM-EUREKA系列,探索如何在多模態推理場景下進行穩定訓練,并實現了7B模型在多個benchmark超過32B以及以上的優異表現。
Talk·信息
主題:MM-EUREKA - 多模態推理的關鍵因素是什么?
嘉賓:上海交通大學 · 博士生 - 孟繁青
時間:北京時間4月16日(周三)20:00
地點:TechBeat人工智能社區
http://www.techbeat.net/
Talk·介紹
當前DeepSeek-R1,O1等在LLM的推理領域具有卓越表現,社區對于LLM的推理研究也逐漸火熱。但是在多模態推理場景下,缺乏一個可以穩定訓練的基線。在這里我們開發了MM-EUREKA系列,探索如何在多模態推理場景下進行穩定訓練,實現了7B模型在多個benchmark超過32B以及以上的優異表現。
Talk大綱
1. R1的簡單介紹
2. 多模態RL穩定訓練的幾個秘訣
3. RL的卓越的數據效率以及泛化性
Talk·預習資料
論文鏈接: https://arxiv.org/abs/2503.07365 項目主頁: https://github.com/ModalMinds/MM-EUREKA
Talk·提問交流
在Talk界面下的【交流區】參與互動!留下你的打call和問題,和更多小伙伴們共同討論,被講者直接翻牌解答!
你的每一次貢獻,我們都會給予你相應的i豆積分,還會有驚喜獎勵哦!
Talk·嘉賓介紹
孟繁青???????????
上海交通大學 · 博士生???
孟繁青,上海交通大學二年級直博生。研究方向包括多模態大模型的預訓練,后訓練以及評測等方面,以第一作者 / 共一作者在ICML,ICLR,NIPS,ACL等頂級會議或者期刊發表5片文章,相關研究成果在HuggingFace上共計獲得10k+下載,在github上共計獲得1k+ star,被Qwen,InternVL,Deepmind團隊等引用或者使用。目前的研究方向聚焦在多模態大模型的推理。
個人主頁: https://www.techbeat.net/grzytrkj?id=44418????
-The End-
如果你也想成為講者
自薦 / 推薦
單人Talk | 團隊專場 | 錄播or直播 | 閉門交流
多種方式任你選擇!
推薦講者成功也有獎勵哦~
關于TechBeat人工智能社區
TechBeat(www.techbeat.net)隸屬于將門創投,是一個薈聚全球華人AI精英的成長社區。
我們希望為AI人才打造更專業的服務和體驗,加速并陪伴其學習成長。
期待這里可以成為你學習AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據地!
更多詳細介紹>>
預約本期Talk
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.