何愷明 MIT 最新演講:未來工作將聚焦 AI for science

ai科技評論 發佈 2024-03-26T06:43:25.655024+00:00

據現場網友所述,即便自己提前半小時去到現場,但仍擠不進會場,僅排隊就拐了幾個彎,MIT CSAIL 還臨時開了隔壁會議室投屏,許多人是擠在小角落裡聽完全程的。

CV 人的大型追星現場來了。

作者 | 黃楠

編輯 | 陳彩嫻

又一名 AI 大神有了新動向!

當地時間3月13日下午3點,何愷明在MIT做學術演講。據現場網友所述,即便自己提前半小時去到現場,但仍擠不進會場,僅排隊就拐了幾個彎,MIT CSAIL 還臨時開了隔壁會議室投屏,許多人是擠在小角落裡聽完全程的。

據 MIT CSAIL 實驗室此前發布公告顯示,本次何愷明的演講主題是 "In Pursuit of Visual Intelligence"(追求視覺智能)。

在現場演講中,何愷明按時間線順序回顧其之前的幾篇工作,主要包括了 ResNet、Faster R-CNN、Mask R-CNN、MoCo 和 MAE。據何愷明所言,「在 ResNet 出現以前,Deep learning 的大廈上空漂浮著一朵烏雲,而 ResNet 去掉了這朵烏雲。」

此外,何愷明也在現場透露了接下來的研究方向會是 AI for science,將聚焦視覺和 NLP 大一統做 self-supervised X+AI。

會議室爆滿(圖源:知乎)

MIT CSAIL 隔壁會議室滿座(圖源:知乎@睡不醒的芋泥)

圖源:知乎@睡不醒的芋泥)

1 何愷明將回歸學術界?

何愷明是 CV 領域的翹楚,其谷歌學術被引用次數已經突破40萬次,在2022年人工智慧全球最具影響力學者榜單中,何愷明獲得第一名。

自3月9日何愷明將在 MIT 進行 Job talks(求職演講)的消息傳出後,很快引起 AI 圈的關注。Job talks 是學術界的一個傳統,多集中在每年的三四月份進行,申請博士或教職的學者會到高校內做學術報告,演講內容多為自己的研究成果。

隨後杜克大學教授陳怡然也在微博上發聲,表示「一直聽說何愷明在Market上,靴子終於落了地。」

值得一提的是,如果何愷明確認加入 MIT,那他將會成為全校被引用次數最高的學者。目前 MIT 全校被引用量最高的是化學與生物醫學工程系的 Robert Langer,總引用量超過38萬次。

有網友表示,何愷明能夠進入到 MIT 的 Job talks 階段,說明他已通過簡歷篩選,其研究成果和能力上得到 MIT 的認可,但這並不意味著何愷明最終會選擇加入 MIT。

2 從高考狀元到 CV 大神

何愷明是廣東人,從小在廣州長大,在廣州執信中學讀書時曾獲得全國物理競賽和省化學競賽的一等獎。2003年5月,何愷明獲得保送清華的資格,同年他以滿分900分的成績,成為當年廣東省9位滿分狀元之一。進入清華大學以後,何愷明放棄保送的機械工程及其自動化專業轉向基礎科學班。

2007年,還未畢業的何愷明進入微軟亞洲研究院實習,出於對計算機圖形圖像課程的興趣,他選擇加入了視覺計算組。頭兩年裡,何愷明嘗試做過不少各種各樣的課題,但一直發不了論文,這對此前頭頂著高考滿分狀元光環的他來說,無疑是個不小的打擊。

何愷明花了更多時間在問題研究上,甚至在電腦遊戲裡找靈感。不鳴則已,一鳴驚人。2009 年,湯曉鷗、何愷明以及孫劍憑藉論文「Single Image Haze Removal Using Dark Channel Prior 」,獲得該年度 CVPR 的最佳論文獎,這也是該會議 30 年以來第一次(也是唯一一次)頒發給亞洲研究學者。

湯曉鷗(左)和何愷明(右)

2011年,何愷明從香港中文大學多媒體實驗室(MMLab)博士畢業,後加入微軟亞洲研究院工作;2016年8月,他離開微軟亞洲研究院,轉而加入 Facebook AI 研究院(FAIR)。

2015年,由何愷明提出的深度殘差網絡 ResNet ,在 ILSVRC 2015 分類任務競賽中,首次超越人類水平,斬獲競賽第一名,該工作還拿到了 2016 年 CVPR 最佳論文。

ResNets 也成為計算機視覺領域的流行架構,並被用於機器翻譯、語音合成、語音識別和 AlphaGo 的研發上。目前,何愷明谷歌學術被引用量已經超過40萬次,其中引用量最高的,也是這篇工作,單篇引用量在2021年底突破10萬次,目前已漲至15萬次。

在 FAIR 期間,何愷明和團隊在計算機視覺領域取得了不少亮眼的成績,包括 Faster R-CNN、Mask R-CNN 等系列研究。其中,Mask R-CNN 解決了圖片中的實例級對象分割問題,不僅能將照片中的人、動物等對象單一檢測,還可為其每個對象實例生成一個高質量分隔遮罩,該工作獲得了 ICCV 2017 的最佳論文獎。

而在去年火熱的 AIGC 領域,何愷明團隊在原有的 CLIP 架構基礎上,使用掩碼方法,不僅實現新模型速度3.7倍的提升,模型性能也得到了一定程度的優化。

3 離開大廠的 AI 大牛再添一員

事實上,早在去年 Meta 第一波裁員時,就有消息傳出何愷明也在被裁名單中,但彼時阿里巴巴副總裁賈揚清在相關知乎問題下對這一消息進行了否認。

何愷明所在的 Facebook AI Research 自去年以來,已經發生過幾次重大調整。

其中,圖靈獎得主楊立昆(Yann LeCun)負責基礎研究,Jerome Pesenti 負責管理整理 AI 部門的技術、產品賦能、運營等工作。但自2022年6月開始,FAIR 被併入至元宇宙部門Reality Labs,楊立昆轉向該部門的首席科學家 Andrew Bosworth 匯報。

後續的調整也是圍繞「去中心化組織結構」進行,重點在削減對基礎研究的投入。

可以看到,即便如 Facebook 這樣的巨頭在整體預算整體收縮之際,AI 研究院率先面臨了被邊緣化的困局。

預算縮減、人心渙散,直接導致了優秀人才的離職頻發。這些離開的 AI 大牛有兩條發展路徑:一是從工業界回到學術界,二是從大廠離開、自己創業,擔任CEO或CTO等要職,並持續從風險投資人處成功獲得融資。

就在半月前,亞馬遜機器學習部門原傑出科學家/VP Alex Smola 與首席科學家李沐師徒二人離職,進軍大模型方向創業,此次何愷明前往 MIT 面試教職的消息,也再次引發外界對大廠 AI 實驗室和 AI 人員的討論和思考。

參考連結:

1.https://www.csail.mit.edu/event/eecs-special-seminar-kaiming-he-pursuit-visual-intelligence

2.https://www.zhihu.com/question/588205714

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

公眾號轉載請先在「AI科技評論」後台留言取得授權,轉載時需標註來源並插入本公眾號名片。

關鍵字: