本期為TechBeat人工智能社區第666期線上Talk。
北京時間3月6日(周四)20:00,卡內基梅隆大學博士后研究員岳翔& 清華大學本科生童雨軒的Talk將準時在TechBeat人工智能社區開播!
他們與大家分享的主題是:“解密大模型長鏈推理”,屆時他們將介紹團隊在理解和提升大語言模型推理能力方面的最新研究進展。
Talk·信息
主題:解密大模型長鏈推理
嘉賓:卡內基梅隆大學 · 博士后研究員 - 岳翔 & 清華大學 · 本科生 - 童雨軒
時間:北京時間3月6日(周四)20:00
地點:TechBeat人工智能社區
http://www.techbeat.net/
Talk·介紹
大語言模型(LLMs)近年來取得了顯著進展,但在解決復雜任務的推理能力方面仍面臨諸多挑戰。在本次報告中,我們將介紹我們在理解和提升大語言模型推理能力方面的最新研究進展。首先,我們將探討我們對長鏈式思維(Chain-of-Thought, CoT)推理復雜性的深入研究,并分析監督微調(Supervised Fine-Tuning, SFT)和強化學習(Reinforcement Learning, RL)中影響LLM推理能力的關鍵因素。我們還將討論LLM推理在未來仍需面對的挑戰。
Talk大綱
1. 影響大模型長鏈式思維復雜推理的因素到底有哪些?
2. 強化學習當中哪些設置起到了關鍵作用?
3. 僅依靠監督微調是否能夠起到提升推理的效果?
4. 未來的大模型復雜推理又面臨什么樣的挑戰?
Talk·預習資料
論文鏈接: https://arxiv.org/abs/2502.03373
Talk·提問交流
在Talk界面下的【交流區】參與互動!留下你的打call和問題,和更多小伙伴們共同討論,被講者直接翻牌解答!
你的每一次貢獻,我們都會給予你相應的i豆積分,還會有驚喜獎勵哦!
Talk·嘉賓介紹
岳翔???????????
卡內基梅隆大學 · 博士后研究員???
岳翔是卡內基梅隆大學(CMU)的博士后研究員。他于2023年在俄亥俄州立大學 (OSU)獲得博士學位。其研究重點是理解和增強大語言模型(LLMs)的推理能力,并在該領域做出了諸如 MMMU和 MAmmoTH 等貢獻。他的研究成果曾獲得CVPR 2024 和 ACL 2023 的最佳論文提名。
個人主頁: https://www.techbeat.net/grzytrkj?id=43981????
童雨軒
清華大學 · 本科生
大四本科生,曾于清華大學知識工程實驗室(THUKEG),香港科技大學自然語言處理實驗室(HKUST-NLP),卡耐基梅隆大學語言技術研究所(CMU-LTI)等機構實習,致力于構建能夠處理長上下文復雜推理的人工智能系統。曾于 NeurIPS 發表論文 2 篇,其中第一作者 1 篇,谷歌學術引用量達 440。
個人主頁: https://www.techbeat.net/grzytrkj?id=43991
-The End-
如果你也想成為講者
自薦 / 推薦
單人Talk | 團隊專場 | 錄播or直播 | 閉門交流
多種方式任你選擇!
推薦講者成功也有獎勵哦~
關于TechBeat人工智能社區
TechBeat(www.techbeat.net)隸屬于將門創投,是一個薈聚全球華人AI精英的成長社區。
我們希望為AI人才打造更專業的服務和體驗,加速并陪伴其學習成長。
期待這里可以成為你學習AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據地!
更多詳細介紹>>
預約本期Talk
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.