機器之心報道
機器之心編輯部
恭喜谷歌。
剛剛,有網友爆料,自己在公司收到了「歡迎何愷明加入」的郵件,何愷明疑似加入谷歌。
在搜索何愷明個人主頁后,我們可以確認,他確實加入了谷歌,不過是以兼職的形式,職位是谷歌 DeepMind 杰出科學家 (Distinguished Scientist)。
個人主頁:https://people.csail.mit.edu/kaiming/
關于何愷明在谷歌的具體研究方向,目前還搜不到詳細信息。
不過,我們可以根據他最近發表的研究推測一下。前段時間,他所在的團隊發布了一篇題為「Mean Flows for One-step Generative Modeling」的論文(參見《何愷明團隊又發新作: MeanFlow 單步圖像生成 SOTA,提升達 50%》)。在最近的 CVPR workshop 上,他也重點介紹了這一論文所代表的方向。
在分享中,他指出,在 AlexNet 之前,逐層訓練更為流行,如深度信念網絡(DBN)和去噪自編碼器(DAE)。但 AlexNet 之后,識別模型普遍實現了端到端訓練,大大簡化了模型設計和訓練的復雜性。 不過,有趣的是,今天的生成模型在概念上更像是逐層訓練:Diffusion 模型通過 T 個去噪步驟逐步生成,自回歸模型通過 T 個 token 逐步生成。這讓我們不禁思考:歷史能否在生成模型領域重演?即,生成建模有沒有可能也走向端到端?
何愷明的個人主頁上傳了這次演講的 PPT(參見《何愷明 CVPR 最新講座 PPT 上線:走向端到端生成建模》),感興趣的可以去看一下。
從高考狀元到被引量超 71 萬的 AI 學者
2003 年,何愷明以標準分 900 分獲得廣東省高考總分第一,被清華大學物理系基礎科學班錄取。在清華物理系基礎科學班畢業后,他進入香港中文大學多媒體實驗室攻讀博士學位,師從湯曉鷗。何愷明曾于 2007 年進入微軟亞洲研究院視覺計算組實習,實習導師為孫劍博士。
2011 年博士畢業后,何愷明加入微軟亞洲研究院工作任研究員。2016 年,何愷明加入 Facebook 人工智能實驗室,任研究科學家。2024 年,何愷明加入 MIT,成為該校一名副教授。
何愷明的研究曾數次得獎。2009 年,當時博士研究生在讀的何愷明參與的論文《基于暗原色的單一圖像去霧技術》拿到了國際計算機視覺頂會 CVPR 的最佳論文獎。
2016 年,何愷明憑借 ResNet 再獲 CVPR 最佳論文獎,此外,他還有一篇論文進入了 CVPR 2021 最佳論文的候選。何愷明還因為 Mask R-CNN 獲得過 ICCV 2017 的最佳論文(Marr Prize),同時也參與了當年最佳學生論文的研究。
根據 Google Scholar 的統計,截至今天,何愷明的研究引用次數超過 71 萬次。
此外,加入 MIT 后,何愷明開設的課程廣受學生歡迎,可參考:
- 「教授何愷明在 MIT 的第一堂課」
- 「教授何愷明在 MIT 的第二門課 ——《深度生成模型》,講座 PPT 陸續已出」
那些年,愷明發表過的「神作」
說起愷明大神的作品,最有名的就是 ResNet 了。這篇論文發表于 2016 年,迄今引用已經超過 28 萬多。根據 《自然》 雜志的一篇文章,這是二十一世紀被引用次數最多的論文。
《Deep Residual Learning for Image Recognition》在 2016 年拿下了計算機視覺頂級會議 CVPR 的最佳論文獎。
同樣是大神級別的學者李沐曾經說過,假設你在使用卷積神經網絡,有一半的可能性就是在使用 ResNet 或它的變種。
何愷明有關殘差網絡(ResNet)的論文解決了深度網絡的梯度傳遞問題。這篇論文是 2019 年、2020 年和 2021 年 Google Scholar Metrics 中所有研究領域被引用次數最多的論文,并建立了現代深度學習模型的基本組成部分(例如在 Transformers、AlphaGo Zero、AlphaFold 中) )。
如今大模型都在使用的 transformer 的編碼器和解碼器,里面都有源自 ResNet 的殘差鏈接。
2021 年 11 月,何愷明以一作身份發表論文《Masked Autoencoders Are Scalable Vision Learners》,提出了一種泛化性能良好的計算機視覺識別模型,同樣是剛剛發表就成為了計算機視覺圈的熱門話題。
一個初入 AI 領域的新人,在探索的過程中看到很多重要研究主要作者都是何愷明,經常會不由得感到驚訝。何愷明雖然長期身處業界,但科研態度一直被視為標桿 —— 他每年只產出少量一作文章,但一定會是重量級的,幾乎沒有例外。
我們也經常贊嘆于何愷明工作的風格:即使是具有開創性的論文,其內容經常也是簡明易讀的,他會使用最直觀的方式解釋自己「簡單」的想法,不使用 trick,也沒有不必要的證明。這或許也將成為他在教學領域獨特的優勢。
最后,恭喜谷歌,也期待大神何愷明在谷歌可以做出更多開創性工作。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.