就在剛剛,計算機視覺領域代表人物何愷明最新官宣,已加入谷歌DeepMind,擔任杰出科學家(Distinguished Scientist)。
他在個人主頁上表示,自己在 DeepMind 的工作是兼職,還將繼續保留 MIT 終身副教授的身份。
圖 | 何愷明更新個人主頁(來源:何愷明)
何愷明是殘差網絡(ResNet)的主要發明人,而這項技術成為了深度學習及后續人工智能進步的基礎。我們今天看到的 ChatGPT、AlphaGo、AlphaFold 都離不開它的影響。
根據《自然》雜志的統計,2016 年發表的 ResNet 論文是 21 世紀迄今為止引用量最高的論文——就連《注意力就是你所需要的一切》(Attention is all you need)這樣的 Transformer 經典之作都不是它的對手。
圖 |《自然》統計的 21 世紀論文引用量排名(來源:《自然》)
據了解,何愷明出生于 1984 年。2003 年,他獲得了保送清華大學的資格,但依舊參加了高考并以 900 分滿分成為了廣東省高考狀元。他本科就讀于清華大學物理系基礎科學班,之后前往香港中文大學攻讀博士學位,并于 2011 年取得信息工程博士學位,師從湯曉鷗。
他在學術初期就展現出非凡的研究才能。早在 2009 年,他提出的“暗通道先驗”(Dark Channel Prior)用于圖像去霧,就已在國際頂級計算機視覺會議 CVPR 上獲得最佳論文獎(第一位獲得該獎項的華人),被認為是圖像增強領域的重要突破。
圖 | 何愷明獲得的獎項(來源:何愷明)
博士畢業后,何愷明加入微軟亞洲研究院(Microsoft Research Asia),在 2011 年至 2016 年期間擔任計算機視覺研究員。也就是在微軟的這段時間,他帶領團隊完成了日后被載入人工智能發展史的重要成果——殘差網絡 ResNet。
2015 年,何愷明及其團隊提出了 ResNet 架構。這一架構通過引入“殘差連接”概念,解決了神經網絡隨著層數增加而訓練困難的問題,使得訓練上百層的深度神經網絡成為可能。
(論文鏈接:https://arxiv.org/pdf/1512.03385)
傳統神經網絡在變深之后常常會出現梯度消失,導致準確率下降,而ResNet 通過“跳躍式”連接,巧妙規避了這一瓶頸。
ResNet 橫空出世后立即在各大視覺競賽中大放異彩:152 層的 ResNet 模型在 2015 年的 ImageNet 挑戰賽中包攬了圖像分類、定位、檢測三項冠軍;同年還贏得了 COCO 圖像識別與分割挑戰的第一名。
微軟 AI 官方博客稱,這一架構成功攻克了超深網絡訓練不穩定的難題,堪稱 AI 發展的“分水嶺”。
ResNet 的影響遠遠超出計算機視覺。如今幾乎所有深度學習模型都在不同程度上借鑒了 ResNet 的殘差結構。
也正因如此,2023 年,何愷明及其團隊獲得了未來科學大獎(數學與計算機科學獎項),以表彰其在“深度殘差學習”方面的開創性貢獻。
2016 年,何愷明加入 Facebook AI Research(FAIR,現為 Meta AI),繼續在計算機視覺領域深耕細作。2017 年,他又一項標志性成果誕生:Mask R-CNN。
這是在 Faster R-CNN 目標檢測架構基礎上的一次重要升級。Mask R-CNN 不僅能準確識別圖像中的各類物體,還能為每個對象生成像素級別的精確輪廓。
(論文鏈接:https://arxiv.org/pdf/1703.06870)
這種實例分割(Instance Segmentation)能力對于自動駕駛、圖像編輯、AR 等場景至關重要。該模型一經推出就迅速在 COCO 標準測試集上刷新多個指標,成為該領域的“黃金標準”。
除了檢測與分割,何愷明在 Meta 還致力于推動“自監督學習”的研究。他與團隊相繼提出了MoCo(Momentum Contrast)和 MAE(Masked Autoencoder)等框架,顯著提升了無監督視覺表征的質量。
這類技術如今已被廣泛應用于數據稀缺場景,拓寬了 AI 模型的訓練方式。
2024 年初,何愷明受聘為麻省理工學院(MIT)電子工程與計算機科學系終身副教授。
圖 | 何愷明近年的講座和開設課程(來源:何愷明)
入職 MIT 后,他開設了關于生成式模型與視覺學習的前沿課程,同時繼續活躍于一線科研。
就在今年 2 月,何愷明帶領三位大一新生提出了擴散模型新思路:擴散模型基礎架構中的噪聲調節,被廣泛認為不可或缺的,但他們挑戰了這一假設,并證明了去除噪聲調節不僅可行,而且還能提升性。
目前他的論文總引用次數已超過 70 萬次,在全球 AI 學術圈內影響深遠。
顯而易見,在加入 DeepMind 之后,我們一定會看到這位“學術+行業”的雙料 AI 大牛帶來影響更深遠的成果。
參考資料:
https://people.csail.mit.edu/kaiming/
https://ieeexplore.ieee.org/author/37085360867
https://www.nature.com/articles/d41586-025-01125-9
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.