本期為TechBeat人工智能社區第678期線上Talk。
北京時間4月17日(周四)20:00,加州大學圣克魯茲分校博士生范越的Talk將準時在TechBeat人工智能社區開播!
他與大家分享的主題是:“圖形用戶界面智能體的任務規劃與語意視覺定位”,屆時他將介紹在設計一個能夠高效、穩定地執行復雜任務的GUI智能體的過程中面臨的兩個核心問題——任務規劃(Planning)和語義視覺定位(Grounding)。
Talk·信息
主題:圖形用戶界面智能體的任務規劃與語意視覺定位
嘉賓:加州大學圣克魯茲分校 · 博士生 - 范越
時間:北京時間4月17日(周四)20:00
地點:TechBeat人工智能社區
http://www.techbeat.net/
Talk·介紹
在現代人機交互中,圖形用戶界面(GUI)智能體正逐步從簡單的自動化工具發展為具備自主決策和環境適應能力的智能系統。然而,設計一個能夠高效、穩定地執行復雜任務的GUI智能體仍然面臨諸多挑戰,其中任務規劃(Planning)和語義視覺定位(Grounding)是兩個核心問題。
Talk大綱
本本次講座將圍繞這兩個關鍵問題展開討論,并介紹我們實驗室在該領域的兩個相關研究項目:
1.Agent S:旨在構建一個通用的智能體框架,使其能夠像人類一樣積累經驗并自主規劃操作用戶界面
2.GUI-Bee:探索如何通過收集數據,讓智能體在陌生的GUI環境中精準執行語意定位
Talk·預習資料
論文鏈接: https://arxiv.org/pdf/2410.08164
論文鏈接: https://arxiv.org/pdf/2501.13896
Talk·提問交流
在Talk界面下的【交流區】參與互動!留下你的打call和問題,和更多小伙伴們共同討論,被講者直接翻牌解答!
你的每一次貢獻,我們都會給予你相應的i豆積分,還會有驚喜獎勵哦!
Talk·嘉賓介紹
范越???????????
加州大學圣克魯茲分校 · 博士生???
范越是加州大學圣克魯茲分校(UC Santa Cruz)計算機科學與工程(CSE)系的博士研究生,由 Prof. Xin Eric Wang 指導。他的主要研究方向包括多模態大語言模型(MLLM)、圖形用戶界面智能體(UI Agents)和具身智能(Embodied AI)。 他本科畢業于山東大學(自動化專業),隨后在約翰霍普金斯大學(Johns Hopkins University)獲得機器人學碩士學位。他的研究成果已發表在ACL、EMNLP等頂級會議。他曾參與了亞馬遜Alexa Prize SocialBot Grand Challenge和Simbot Challenge,團隊均取得了前三名的優異成績。他曾在Adobe Research實習,專注于圖形界面智能體的相關領域的研究。
個人主頁: https://www.techbeat.net/grzytrkj?id=44376
-The End-
如果你也想成為講者
自薦 / 推薦
單人Talk | 團隊專場 | 錄播or直播 | 閉門交流
多種方式任你選擇!
推薦講者成功也有獎勵哦~
關于TechBeat人工智能社區
TechBeat(www.techbeat.net)隸屬于將門創投,是一個薈聚全球華人AI精英的成長社區。
我們希望為AI人才打造更專業的服務和體驗,加速并陪伴其學習成長。
期待這里可以成為你學習AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據地!
更多詳細介紹>>
預約本期Talk
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.