網易首頁 > 網易號 > 正文申請入駐

Talk預告 | 中國科學院計算所張紹磊：LLaVA - Mini - “一個視覺標記”的高效多模態大模型

2025-05-28 08:26:15　來源: 將門創投

北京舉報

分享至

本期為TechBeat人工智能社區第688期線上Talk。

北京時間5月29日(周四)20:00，中國科學院計算所博士生張紹磊的Talk將準時在TechBeat人工智能社區開播！

他與大家分享的主題是:“LLaVA - Mini - “一個視覺標記”的高效多模態大模型”，屆時他將分析一些關于大模型內部視覺信息流動的有趣觀察，以及提升多模態大模型效率的解決方案。

Talk·信息

主題：LLaVA - Mini - “一個視覺標記”的高效多模態大模型

嘉賓：中國科學院計算所 · 博士生 - 張紹磊

時間：北京時間5月29日(周四)20:00

地點：TechBeat人工智能社區

http://www.techbeat.net/

Talk·介紹

多模態大模型將每張圖像編碼成數百個vision tokens輸入至LLM，造成大量的計算開銷。為提升多模態大模型效率，是否能在確保視覺理解能力的同時減少輸入到LLM的vision tokens數量？Talk會分析一些關于大模型內部視覺信息流動的有趣觀察，以及提升多模態大模型效率的解決方案。

Talk大綱

1. 背景：多模態大模型的效率問題

2. 方法：LLaVA-Mini介紹

3. 實驗：LLaVA-Mini的視覺理解能力和效率評估

4. 總結：一些takeaways

Talk·預習資料

論文鏈接： https://arxiv.org/abs/2501.03895 代碼鏈接： https://github.com/ictnlp/LLaVA-Mini

Talk·提問交流

在Talk界面下的【交流區】參與互動！留下你的打call和問題，和更多小伙伴們共同討論，被講者直接翻牌解答！

你的每一次貢獻，我們都會給予你相應的i豆積分，還會有驚喜獎勵哦！

Talk·嘉賓介紹

張紹磊???????????

中國科學院計算所 · 博士生???

張紹磊，中國科學院計算技術研究所博士生五年級，導師為馮洋研究員。主要研究方向為自然語言處理、實時模型、大語言模型。以第一作者在ACL、NeurIPS、ICLR等國際會議中發表論文10余篇，曾獲國際同聲傳譯測評比賽（AutoSimTrans 2021）流式輸入賽道冠軍。曾擔任中文信息學會青年工作委員會學生執委會主任、ACL ARR Area Chair。

個人主頁: https://www.techbeat.net/grzytrkj?id=44895 ????

-The End-

如果你也想成為講者

自薦 / 推薦

單人Talk | 團隊專場 | 錄播or直播 | 閉門交流

多種方式任你選擇！

推薦講者成功也有獎勵哦~

關于TechBeat人工智能社區

TechBeat(www.techbeat.net)隸屬于將門創投，是一個薈聚全球華人AI精英的成長社區。

我們希望為AI人才打造更專業的服務和體驗，加速并陪伴其學習成長。

期待這里可以成為你學習AI前沿知識的高地，分享自己最新工作的沃土，在AI進階之路上的升級打怪的根據地！

更多詳細介紹>>

預約本期Talk

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.