本期為TechBeat人工智能社區第667期線上Talk。
北京時間3月12日(周三)20:00,杜克大學博士后郭聰的Talk將準時在TechBeat人工智能社區開播!
他與大家分享的主題是:“面向高效大模型的軟硬件協同設計”,屆時他將分享對大語言模型特有特性與約束條件而設計的軟硬件協同優化方法。
Talk·信息
主題:面向高效大模型的軟硬件協同設計
嘉賓:杜克大學 · 博士后 - 郭聰
時間:北京時間3月12日(周三)20:00
地點:TechBeat人工智能社區
http://www.techbeat.net/
Talk·介紹
隨著大語言模型(LLMs)的快速發展,人工智能領域正經歷深刻變革。這些模型在自然語言處理方面展現出卓越能力,并正逐步向多模態功能擴展,越來越多地融入各類應用,影響著科研與產業。然而,其發展與部署也帶來了巨大的挑戰,包括對海量計算資源的需求、高能耗以及復雜的軟件優化問題。與傳統深度學習系統不同,大語言模型在訓練和推理過程中需要采用獨特的優化策略,強調系統層面的高效性。
本次Talk關注對大語言模型特有特性與約束條件而設計的軟硬件協同優化方法。分析了大語言模型對硬件和算法研究帶來的挑戰與影響,從算法優化、硬件設計到系統層面創新等多個角度探討了關鍵問題,旨在為大語言模型計算系統中提綜合的解決方案。
Talk大綱
1. 硬件友好的結構化稀疏設計
2. 新型量化架構設計
3. 稀疏-量化協同優化設計
4. 面向大模型的緩存壓縮架構設計
Talk·預習資料
論文鏈接: https://arxiv.org/abs/2410.07265v1
Talk·提問交流
在Talk界面下的【交流區】參與互動!留下你的打call和問題,和更多小伙伴們共同討論,被講者直接翻牌解答!
你的每一次貢獻,我們都會給予你相應的i豆積分,還會有驚喜獎勵哦!
Talk·嘉賓介紹
郭聰???????????
杜克大學 · 博士后???
郭聰,杜克大學博士后,合作導師為陳怡然教授。2023年在上海交通大學獲得計算機科學博士學位,并榮獲2023 年上海交通大學優秀博士論文獎。他的研究興趣集中在計算機體系結構和高性能計算領域,重點在于軟件與硬件協同優化,以加速高效的人工智能應用。包括為神經網絡設計基于稀疏和量化的體系結構和系統。在過去的五年中,他在 ISCA、MICRO、HPCA 和 ASPLOS 等頂級會議上發表了 10 余篇論文,其工作在 2022 年 IEEE Micro Top Picks 中獲得了榮譽提名。
個人主頁: https://www.techbeat.net/grzytrkj?id=43978????
-The End-
如果你也想成為講者
自薦 / 推薦
單人Talk | 團隊專場 | 錄播or直播 | 閉門交流
多種方式任你選擇!
推薦講者成功也有獎勵哦~
關于TechBeat人工智能社區
TechBeat(www.techbeat.net)隸屬于將門創投,是一個薈聚全球華人AI精英的成長社區。
我們希望為AI人才打造更專業的服務和體驗,加速并陪伴其學習成長。
期待這里可以成為你學習AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據地!
更多詳細介紹>>
預約本期Talk
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.