機器之心報道
機器之心編輯部
當今計算機視覺領域最熱門的三個方向。
當今計算機視覺領域最熱門的話題有哪些?
剛剛,CVPR 官方給出了最新統計,他們根據論文提交情況,總結出三大方向:
- 基于多視角與傳感器的 3D 技術;
- 圖像與視頻合成;
- 多模態學習,視覺、語言和推理。
這份統計是基于全球 4 萬多名作者 13008 份投稿結果產生的。相比往年,今年的投稿數量增長了 13%,最終有 2878 篇論文被接收,整體接收率為 22.1%。
「我們已經處于這種指數級增長態勢一段時間了,」CVPR 2025 聯合主席 Phillip Isola 解釋道。「AI 領域舉足輕重,正是因為如此,學生們攻讀相關學位的人數在增多。因此,這個研究群體正變得越來越龐大。」
但除了這一總體趨勢之外,深入研究該頂會還會發現,社區關注的領域很局限。特定領域的進展已經讓位于新的研究重點,吸引了更多關于新主題的論文。
具體來說,有三個領域正在成為 2025 年的熱門方向:
多視角與傳感器 3D 技術
多視角和傳感器 3D 技術為 CVPR 帶來了大量的投稿,其原因很簡單:基于圖像的研究已經從探索單幅圖像或 2D 渲染發展到更復雜的 3D 評估領域。2020 年 NeRF 的推出,開辟了新的研究方向。
「自 2020 年 NeRF 論文首次發表以來,利用深度網絡進行 3D 重建已成為趨勢。如今高斯潑濺(Gaussian splatting)技術進一步推動了這一發展,」CVPR 2025 程序聯合主席、美國俄勒岡州立大學副教授 Fuxin Li 分享道,「本質上,計算機視覺與圖形學正在融合。神經渲染研究的興起,顯著推動了 3D 相關論文數量的增長。」
圖像與視頻合成
隨著研究的不斷發展,學界現在能夠通過視頻和圖像形式更精確地呈現環境信息。對該領域的探索已成為 CVPR 2025 論文的焦點,圖像和視頻合成成為今年大會上最大的類別之一。
「今年商業聊天機器人的一大趨勢是它們已經實現了多模態化;它們現在不僅能分析和生成文本,還能分析和生成圖像,有時還能生成視頻,」Isola 解釋道。「即將出現的能力是生成完整的交互式世界。CVPR 上展示的圖像、視頻和世界合成方法正在為這類技術鋪平道路。」
AI 生成的威爾史密斯吃意面
多模態學習,視覺、語言和推理
雖然在征文通知中,這兩個主題被列為兩個獨立的研究主題,但合并起來,它們構成了提交論文數量最多的類別之一。這些領域的個人研究數量或許預示著今年會議值得關注的新趨勢。
鑒于論文接受率徘徊在極低的 22%,因而每一篇入選 CVPR 的論文都堪稱經典。盡管投稿內容反映了學界對特定領域的研究熱情,但大會主席強調,CVPR 是該領域偉大的平衡杠桿,它關注值得認可的研究,而非那些聲勢最大的團隊。
「CVPR 在擴大領域聲音方面發揮著非常重要的作用,而不僅僅是來自大型機構的聲音,」Fuxin Li 總結道。「在 CVPR,每篇論文都有同等的權利。如果是 poster,那就是 poster。如果是 oral,那就是 oral。你是誰并不重要。這一點對計算機視覺領域的生態系統至關重要。」
在 AI 領域飛速發展的今天, 研究熱點瞬息萬變。大家一股腦的押注最熱門方向, 外加投稿數量逐年增多,只能說,想中一篇頂會真是太難了。
CVPR 2025 即將召開,值此盛會,機器之心將在北京舉辦一場 CVPR 2025 論文分享會,歡迎大家報名參與。
報名鏈接:https://wj.qq.com/s2/22041284/tjnc/
參考鏈接:https://cvpr.thecvf.com/Conferences/2025/News/Paper_Trends
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.