前幾天,谷歌在 I/O 2025 大會(huì)上正式發(fā)布了其最新一代 AI 視頻生成模型 Veo 3,在生成高質(zhì)量視頻的同時(shí)首次實(shí)現(xiàn)了音畫同步。對(duì)于 Veo 3 的震撼效果,有人高度評(píng)價(jià)稱,「它會(huì)是不亞于 OpenAI Sora 的跨時(shí)代產(chǎn)品」,標(biāo)志著 AI 視頻進(jìn)入到了真正的「有聲時(shí)代」。
從中可以發(fā)現(xiàn),雖然當(dāng)前 AI 社區(qū)已有的大模型已經(jīng)足夠驚艷,但得益于架構(gòu)的創(chuàng)新、算力集群的投入,仍然會(huì)「卷」出一些新東西來。比如視頻生成領(lǐng)域,從最初的無聲進(jìn)化到如今的有聲,提升明顯;再比如多模態(tài)領(lǐng)域,逐漸朝著理解與生成大一統(tǒng)的方向演進(jìn)。
因此,為讓從業(yè)者全面了解 AI 社區(qū)涌現(xiàn)的最新創(chuàng)新成果和發(fā)展趨勢(shì),機(jī)器之心計(jì)劃 6 月 8 日在北京舉辦「CVPR 2025 論文分享會(huì)」,圍繞著多模態(tài)、視頻生成等熱門主題邀請(qǐng)頂級(jí)專家、論文作者與現(xiàn)場參會(huì)觀眾共同交流。
作為計(jì)算機(jī)視覺領(lǐng)域中最重要的國際會(huì)議之一,CVPR 具有極高的含金量,每年都會(huì)吸引大量研究機(jī)構(gòu)和高校參會(huì)。今年,CVPR 2025 共收到 13008 份論文投稿,最終接收 2878 篇論文,整體接收率為 22.1%。
作為一場為國內(nèi) AI 人才打造的盛會(huì),本次論文分享會(huì)設(shè)置了 Keynote、論文分享、圓桌對(duì)話、Poster 交流及企業(yè)展位交流等豐富環(huán)節(jié)。今天,論文分享會(huì)的全日程、Keynote 分享嘉賓及演講主題正式公布,感興趣的讀者可以繼續(xù)掃描文中二維碼報(bào)名
Keynote 嘉賓及演講主題
【上午 Keynote】高林 基于混合表達(dá)與生成模型的可視媒體合成與編輯方法
分享人介紹:高林,中國科學(xué)院計(jì)算技術(shù)研究所研究員、中國科學(xué)院大學(xué)崗位教授。研究方向?yàn)橛?jì)算機(jī)圖形學(xué)、三維計(jì)算機(jī)視覺。在 SIGGRAPH、TPAMI、TVCG 等期刊會(huì)議發(fā)表論文 100 余篇。現(xiàn)任或者曾任亞洲圖形學(xué)學(xué)會(huì)秘書長,作為項(xiàng)目負(fù)責(zé)人承擔(dān)國家重點(diǎn)研發(fā)計(jì)劃、基金委優(yōu)青等項(xiàng)目,曾獲得亞洲圖形學(xué)會(huì)青年學(xué)者獎(jiǎng)等獎(jiǎng)勵(lì)。
分享摘要:在本次報(bào)告中,我們將分析最近幾何表征發(fā)展的特點(diǎn),分析內(nèi)在的規(guī)律,介紹幾何表征的挑戰(zhàn)和相關(guān)應(yīng)用。介紹高斯?jié)姙R的最新進(jìn)展,包括如何對(duì)高斯?jié)姙R進(jìn)行大尺度變形、解耦和重光照,以及如何對(duì)基于高斯?jié)姙R表征的數(shù)字人進(jìn)行實(shí)時(shí)重光照。 同時(shí),生成模型不僅在影響三維重建的方法,還給渲染帶來了新的求解思路。其中,視頻生成模型給生成式渲染帶來了全新的思路。我們將介紹基于生成模型的視頻編輯與合成方法,將介紹基于線稿交互的視頻編輯方法,和基于點(diǎn)云幾何先驗(yàn)的大視角視頻編輯與合成方法。
【下午 Keynote】黃雷 從表征和學(xué)習(xí)視角議多模態(tài)大模型的統(tǒng)一之路
分享人介紹:黃雷,北京航空航天大學(xué)人工智能學(xué)院副教授。本科和博士均畢業(yè)于北京航空航天大學(xué),曾在美國密歇根大學(xué)訪學(xué)和阿聯(lián)酋 IIAI 工作。研究主要集中在深度神經(jīng)網(wǎng)絡(luò)架構(gòu)、訓(xùn)練技術(shù)及理論分析,出版首部關(guān)于 DNNs 中 Normalization 技術(shù)的英文專著,主導(dǎo)訓(xùn)練發(fā)布 TinyLLaVA 系列模型及 TinyLLaVA Factory 開源項(xiàng)目,曾以一作兼通訊作者身份獲 CVPR 2020 最佳論文提名獎(jiǎng)。
分享摘要:大語言模型以離散化詞匯表示和上下文建模學(xué)習(xí)統(tǒng)一了各類自然語言理解和生成任務(wù)。過去幾年,這類統(tǒng)一建模思想也蔓延至視覺、語音以及其它非結(jié)構(gòu)化類數(shù)據(jù),促進(jìn)了「統(tǒng)一」的多模態(tài)大模型發(fā)展。本報(bào)告首先從表征和學(xué)習(xí)視角,以抽象的形式探討了條件概率模型在建模任意問題的可行性,然后以統(tǒng)一建模為指導(dǎo)思想,概述了近年來語言和多模態(tài)建模的主要發(fā)展路線,最后介紹了報(bào)告人課題組在針對(duì)該議題研究中一些基礎(chǔ)問題的研究進(jìn)展和相關(guān)展望。
Poster
在本次論文分享會(huì)中,將會(huì)有一批論文作者進(jìn)行論文分享與 Poster 展示,感興趣的讀者可以通過下圖了解具體信息:
此次論文分享會(huì)也將在機(jī)器之心視頻號(hào)以及黃大年茶思屋科技網(wǎng)站兩個(gè)平臺(tái)進(jìn)行直播,歡迎大家關(guān)注、預(yù)約。
合作伙伴介紹
黃大年茶思屋科技網(wǎng)站
黃大年茶思屋科技網(wǎng)站是致力于推動(dòng)科學(xué)與技術(shù)交流的開放平臺(tái)。我們匯聚全球科學(xué)家、研究人員和技術(shù)專家,共同探討最前沿的學(xué)術(shù)話題,分享最新的科研成果,激發(fā)創(chuàng)新思維的火花。在這里,您可以看到學(xué)術(shù)熱點(diǎn)、精選論文、學(xué)術(shù)峰會(huì)、技術(shù)難題、專利、開源和科技賽事等內(nèi)容。茶思屋科技網(wǎng)站,匯聚全球科研智慧,推動(dòng)科技創(chuàng)新,讓科技百花園更加繁榮。
網(wǎng)址:https://www.chaspark.com
騰訊青云計(jì)劃
騰訊青云計(jì)劃聚焦 AI 大模型等十大技術(shù)領(lǐng)域,面向全球招募頂尖實(shí)習(xí)生和畢業(yè)生,提供上不封頂?shù)穆毤?jí)薪酬、全面定制化的培養(yǎng)方案,并開放核心業(yè)務(wù)工作機(jī)會(huì)、解鎖前瞻性技術(shù)課題培養(yǎng)中國未來的科技人才。
今年騰訊將繼續(xù)深度參與多場全球頂級(jí)學(xué)術(shù)會(huì)議,并組織群星未來之夜系列活動(dòng)。關(guān)注「騰訊招聘」公眾號(hào)了解相關(guān)報(bào)名信息。
加入青云計(jì)劃,不負(fù)少年意氣!
青云官網(wǎng):https://join.qq.com/qingyun.html
京東 TGT 計(jì)劃
TGT (Tech Genius Team)是由京東發(fā)起的「頂尖青年技術(shù)天才計(jì)劃」,面向全球高校本碩博在校生、應(yīng)屆生及畢業(yè)兩年內(nèi)的技術(shù)人才開放招募。
TGT 計(jì)劃聚焦技術(shù)突破和有社會(huì)價(jià)值的前沿課題,依托京東在零售、物流、科技、健康、工業(yè)、產(chǎn)發(fā)等領(lǐng)域豐富的產(chǎn)業(yè)布局,研究涵蓋包括多模態(tài)大模型與應(yīng)用、機(jī)器學(xué)習(xí)、搜索推薦廣告、空間與具身智能、高性能與云計(jì)算、大數(shù)據(jù)、AI Infra、安全等方向。
除了不設(shè)上限的薪資以外,京東還將提供完備的福利體系、充足的算力資源保障、「技術(shù)導(dǎo)師 + 業(yè)務(wù)導(dǎo)師 + 成長導(dǎo)師」三導(dǎo)師的培養(yǎng)機(jī)制,保障 TGT 能夠心無旁騖投身技術(shù)突破并迅速成長為領(lǐng)軍人物。
TGT 網(wǎng)址:https://campus.jd.com/home#/talentProject?tabKey=3
機(jī)器之心聯(lián)合多個(gè)合作伙伴,成功舉辦云帆?ICLR 2025 AI Talent Meetup、CVPR 2024 論文分享會(huì)、NeurIPS 2024 論文分享會(huì)、ACL 2024 AI Talent 晚宴等多場活動(dòng),助力合作伙伴吸納人才,提升品牌影響力。
如您 / 您所在的企業(yè)對(duì)參與「機(jī)器之心 2025 學(xué)術(shù)頂會(huì)活動(dòng)」感興趣,歡迎參與合作及共建,具體合作方式歡迎聯(lián)系:
- 陳女士
- 182 0621 8056
- chenyinyi@jiqizhixin.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.