白交 發自 凹非寺
量子位 | 公眾號 QbitAI
CVPR 2025落下帷幕,這次關注度和社交參與感,非常深度了。
比如隨手抓住一只何愷明,直接變成追星現場。
在以谷歌/Meta等國際巨頭為主導的展區里,中國企業規模創紀錄,像騰訊、字節等大展區里面人從眾。
展臺面前排隊體驗的技術Demo,妥妥都是技術風向標~
總結下來,有這樣幾個有意思的發現。
首先,多模態、3D生成是此次論文接收和現場研討的熱門方向,尤其像3D生成是亮點,背后高斯潑濺技術成為此次論文標題出現次數最多的前五關鍵詞之一。
其次,對于基礎模型的討論遠比以往更加深入,并且延伸到了產業落地。具身智能、機器人AI在Workshop議程設置中獨立出來一個大的板塊。
最后,中國企業今年參與得很深度,不過目前還是聚焦在已經成熟商業化的大公司。
除此之外還有哪些亮點,現在就帶大家一網打盡。
探展CVPR 2025
CVPR含金量提升
CVPR,視覺領域妥妥的頂會,甚至與其他兩位并稱的頂會ICCV和ECCV相比,名氣還要高那么一點。
每一年被CVPR接收的論文大家都會關注,因為它們一定代表著最最前沿的技術風向。尤其是獲得了最佳論文獎項的成果,那就得好好拜讀一下。
如果你的論文能被CVPR接收,相當于受到非常大的認可。因此相關從業者一有機會都想沖一波,萬一就被錄用了呢。
所以這幾年CVPR的接收數量逐年遞增。今年CVPR共收到13008份有效論文,2878篇論文被接收,最終錄用率為22.1%,錄用率已經下降不少了,這樣導致接收難度陡增。
所以,每一篇CVPR 2025論文含金量都在上升。
多模態成為接收論文標題中的高頻詞,3D發展速度快、成果亮眼。
有熱心網友整理了2878篇論文標題,得出了以下高頻詞。
多模態這個詞位列第一。
此外,3D生成是亮點,背后高斯潑濺技術繞過了一眾任務、技術詞匯第四高頻的關鍵詞。
美國俄勒岡州立大學副教授Fuxin Li曾表示:
自2020年NeRF論文首次發表以來,利用深度網絡進行3D重建已成為趨勢。如今高斯潑濺技術進一步推動了這一發展。
本質上,計算機視覺與圖形學正在融合。神經渲染研究的興起,顯著推動了3D相關論文數量的增長。
這一點在國內也能感知到,尤其在這段時間技術躍遷很快。
像頗受學界關注的Hunyuan 3D,在此次發布會上進行了版本升級以及全面開源。
2.1版本主打的是幾何與紋理的雙重優化,特別在紋理貼面上有比較大的優化,可達到當前開源3D模型中的SOTA。它的訓練代碼、模型權重、數據處理流程全部開源,支持一鍵部署,開發者還可以自主精調。
據騰訊介紹,這是首個全鏈路開源的工業級3D生成大模型,并且達到了閉源級水平,同時還可適配消費級顯卡。
企業參與力度大,探討主題從技術難題探索拓展至產業應用
如果說論文展示(海報/口頭報告)是頂會的一大亮點,那么研討會(Workshop)則是另外值得關注的部分,來自全球頂尖機構的研究者在此圍繞特定主題進行深度碰撞。
今年尤為值得注意的是:主題設計既延續技術縱深探索,又拓展行業生態建設,形成雙輪驅動的學術范式。
一方面,去年就在關注的技術領域,今年討論的話題更加深入。
比如視覺概念研討會。當前多模態、世界模型討論正酣,也許按照第一性原理探討視覺是什么?或許就是解決技術挑戰的關鍵。
另一方面,產業應用中的現實難題,也在這些研討會中得到討論。
像3D視覺與理解,從基礎的單目深度估計到更復雜的3D場景理解和組合式3D視覺。今年還新增了3D捕獲與重建軌道,以及城市建模、數字孿生等更具體的方向,這些都是應對真實世界三維信息獲取和建模的需求。
再來看看這次展會,每年都有各種機構來到這里展示他們最新的技術成果。
值得注意的是,這次展臺面前人從眾的更多都是來自中國玩家的展商。細細扒了一下發現,原來他們的參與度要深度得多。
中國企業深度參與
首先最直接的就是論文接收數,從目前公開的信息來看,企業的接收數都不少,方向也很多元。
今年騰訊表現出眾,他們有40+篇被接收論文。其中數十篇論文來自混元團隊,覆蓋多模態模型長思維鏈推理、3D生成、圖片/視頻生成多個領域。優圖實驗室這邊有22篇論文入選,有DeepFake的視頻檢測、自回歸視覺生成、多模態等研究方向。
本次會議的贊助商,其實也有點意思,能夠看到企業/機構對于這次會議的支持和重視程度。
從地區分布來看,41家企業或研究機構中,來自美國的共有28家,中國隊緊隨其后,共有6家。其他國家和地區分布寥寥,各自僅有一家。
尤其在白金贊助這一欄,在一眾科技巨頭,包括亞馬遜、谷歌、蘋果等企業之中。中國的騰訊、字節躋身在列,其實足以可見他們對于這次頂會的投入。
這當中,騰訊在今年頂會上的投入比往年都大,不管是從贊助商等級,還是Workshop。
光是業務團隊就來了小20個人,這當中還包括了混元、ARC Lab、AI Lab、騰訊視頻等業務的技術負責人,在會場近距離分享相關領域的最新技術突破。
比如你可以遇到騰訊混元大模型團隊現場Demo展示,用數位板畫圖,現場屏幕即可完成3D生圖。
然后還能遇到ARC Lab高級研究員胡文博,跟你聊聊生成式AI與3D視覺相關。
除此之外,還安排了午餐會、晚宴等活動。
之前啊,就聽到那些中國學生說,參加頂會可以蹭到騰訊的郵輪飯、米其林飯,真香啊,這下看來是真的了!
當然騰訊自然帶有自己的目的,如果業務團隊在現場與學生交談甚歡,沒準直接就完成了boss直聘,畢業之后就直接去騰訊上班。
△騰訊CVPR2025群星未來之夜現場照片
以騰訊為代表的中國企業深度參與頂會的原因,其實也不難看出——
一方面全球加速大模型發展的大環境下,中國企業作為核心參與者,在全球舞臺上展示技術實力,體現的是他們技術投入的決心。
以騰訊舉例,其投入就非常多。2024年全年,騰訊研發開支約超過706.86億元,從2018年至今研發投入已達3403億元。并且還在不斷加大AI投資,截至2024年12月,騰訊在全球主要國家和地區專利申請公開總數超過8.5萬件,專利授權數量超過4.5萬件,全年資本開支為人民幣768億元,同比增加221%,創歷史新高。
現場遇到一位高校教授表示,中國公司在大模型領域的發展很快,對于他們帶著優秀的成果到現場感到驕傲,騰訊在這個領域的進步讓人欣喜。
這一次在學生們心中印象最深的,除了騰訊展臺演示的Demo,還有一走進會場就遇到的巨型海報,不知道的還以為進入到國內某個行業峰會。
另一方面,通過在各種頂會的亮相吸引人才,以此轉變為企業核心競爭力,形成正向循環。
而對于頂尖技術人才來說,他們擇業首要標準可能不在于薪資,而在于技術認同。就拿OpenAI那群人來說,當初聚成火,現在滿天星,背后也是這一原因所在。
這就與企業本身的技術特色和獨特優勢有關。
騰訊一直以來的優勢,就在于應用場景,具備健康的生態矩陣,像微信、游戲這種業務有著過億用戶體量,覆蓋了ToB、ToC,社交、游戲、產業等多重業務矩陣。
這龐大的數據量、應用場景,帶來了巨大資源支持,資源代表了投入耐性,這些年一閃而過的技術公司很多,能活下來的都是能落地的。
而且更重要的是,立足于自身的獨特應用和場景優勢,國內企業已經呈現出商業反哺技術的良性循環,足以支撐技術生生不息地發展。這樣人才可以不用擔心公司未來,可以安心在里面搞技術。
今年一季度,騰訊高質量收入保持堅實的增長態勢。AI能力已經對效果廣告與長青游戲等業務產生實質性的貢獻,因此也加大對元寶應用與微信內的AI等新AI機遇的投入。
技術的終極意義是服務于人,只有有應用場景才能彰顯技術的價值,保證企業擁有數據和資源,持續反哺技術研究,探索技術的上限。
One More Thing
騰訊在All in AI的策略指導下,對技術人才的投入力度空前。
數據顯示,截至2025年3月,騰訊科技類人才占比已達73%,其中直接從事技術研發的員工超2.7萬人。
今年騰訊的頂尖人才招聘計劃-青云計劃就打出薪酬上不封頂、職級升級等吸引技術人才加入。還有頂尖科學家導師培養、線下活動交流等等資源。
所以如果你快畢業,正在看工作機會,可以看看騰訊青云計劃。
CVPR雖然落幕了,騰訊今年還提供大量的線下接觸的機會,不僅推出全新升級的校企課題合作模式,讓同學們在校期間提前感受研究與落地的技術碰撞,還參加國內外學術頂尖會議,并舉辦多城市豐富的青云線下活動,為大家提供見面交流的機會,大家也可以繼續關注官號發布。
據交流獲知,為了更集中資源培養,今年的青云計劃的名額有所減少,更加稀缺了,甄選也更加嚴格,感興趣抓緊去看看。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.