楠木軒

朱松純將回國加入清華,曾對李飛飛創建ImageNet有啓示

由 宮繼梅 發佈於 科技

小編獲悉,UCLA教授朱松純將回國,加入清華大學自動化系。

根據清華大學人力資源開發辦公室發佈的公示,朱松純擬進入自動化系工作,職務為教研系列教授。

朱松純是全球著名計算機視覺專家、統計與應用數學家、人工智能專家。現任美國加州大學洛杉磯分校(UCLA)統計學系與計算機系教授,UCLA計算機視覺、認知、學習與自主機器人中心(VCLA)主任,並曾兩度擔任CVPR大會主席(2012年和2019年)。

朱松純於1996年獲哈佛大學計算機博士學位,師從國際數學大師大衞·曼福德教授,在國際頂級期刊和會議上發表論文300餘篇,並三次問鼎計算機視覺領域國際最高獎項——馬爾獎。

Google Scholar顯示,他目前的論文引用量有24702,並且近五年引用量高達12815。

他長期致力於構建計算機視覺、認知科學、乃至人工智能科學的統一數理框架,其中包括作為統一表示形式的時空、時間和因果圖(STC-AOG)以及用於推理和學習的眾多蒙特卡洛方法 。

他的研究成果集中在以下四個時期和領域:

1、視覺的統計建模與計算理論 —— 為馬爾的視覺理論建立統一的數理模型;

2、實現圖像與場景的解譯(parsing)計算框架 —— 擴展了模式識別創始人傅京孫先生的句法模式識別理論;

3、提出人工智能的“暗物質” —— 研究視覺與認知的物理與社會常識;

4、探索邁向通用人工智能的新的研究路徑 ——“小數據、大任務”範式。

朱松純對李飛飛創建ImageNet的啓示

朱松純教授除了在以上領域做出研究成果之外也曾和ImageNet有些或多或少的關聯。

李飛飛以及ImageNet在深度學習領域的貢獻毋庸多説,而ImageNet概念的起源,則要從2005年説起。

2005年,朱松純在其故鄉湖北鄂州創辦蓮花山研究院,籌建了世界上最早的大數據標註團隊,發佈了精細化程度最高、語義信息最豐富的大規模數據庫 LHI Dataset。此前在2003年,朱松純因為在做圖像解譯方面的突破拿到了計算機視覺的最高榮譽馬爾獎,風頭正勁的他牽頭舉辦了首屆“蓮花山計算機視覺與模式識別國際研討會”,參會人員包括Berkeley 圖像分割數據庫原創者 David Martin(一排左 4),MIT 教授、LabelMe 數據庫的原創者 Antonio Torralba(二排右 3)。此時李飛飛剛從加州理工博士畢業,作為受邀人員也參加了這次研討會。

蓮花山計算機視覺研究院研討會合照,李飛飛在第三排右五

在這次研討會之後,李飛飛認識到基於統計的算法極度依賴數據集的規模和代表性,大多數研究人員都只是在儘可能地尋找更好的算法,但他們訓練模型所基於的數據卻並不能反映真實的世界,這樣即使再好的算法也不會訓練出有用的結果。因此她決定構建一個足夠大的能夠反映真實世界的開放數據集。

2007年初,李飛飛回到普林斯頓任教,同時啓動了ImageNet項目。當她談到ImageNet 的想法時,幾乎無人問津。最後還是她的老師李凱同意作為合作者加入她的課題,並將自己的博士生鄧嘉分配給李飛飛。

通過眾包平台,李飛飛有效避開了此前朱松純的 LHI Dataset遇到過的資金和時間上的瓶頸,到2009年,ImageNet已經完成了320萬張(後來增加到1500萬張)圖片的標註......

而後來ImageNet大規模視覺識別挑戰賽(ILSVRC)的成功大家都有目共睹了。

清華自動化系

到2020年,清華大學自動化系已建系50年。

自動化系的一級學科為“控制科學與工程”,1998年,自動化係獲國家首批一級學科博士學位授予權,2007年被評為國家首批一級重點學科,學科綜合實力強、交叉創新多、發展前景廣。在2016年全國一級學科評估中, “控制科學與工程”學科被評為A+全國最高水準。

自動化系擁有高水平的師資力量,截止2020年,自動化系現有教師89人,其中教授、研究員40人,副教授、副研究員40人,助理教授、助理研究員9人。中國科學院院士2人,中國工程院院士2人,國家教學名師獲得者2人,教育部長江特聘教授3人,國家傑出青年基金獲得者12人,國家優秀青年基金獲得者12人。戴瓊海、張長水、魯繼文、黃高等大牛均屬清華自動化系。

朱松純的加盟,又給清華自動化系添加一員大將。

“朱松純老師對視覺領域大方向有着一流的直覺,對數學(尤其概率統計)一絲不苟,善於拿大資金”,微軟亞洲研究院視覺組研究員代季峯這樣評價朱松純,他曾經在朱松純UCLA的VCLA實驗室訪學一年多,“他對學生是刀子嘴豆腐心,實驗室裏的學生私下都叫他老朱。”

1 一流的直覺

朱松純的實驗室有很多學生。美國的實驗室不像中國,因為研究生工資低,可以隨便帶很多學生。要在美國的實驗室帶那麼多學生,得有雄厚的資金支撐。朱松純最近幾年應該都是美國大學視覺界裏研究資金最多的教授之一。

“能夠拿到大資金,是因為他對視覺領域的大方向有着領先和準確的把握。”代季峯分享了一件很觸動他的事情,“2012年下半年,老朱主持的一個MURI項目在UCLA開會,來了視覺界裏各路大佬。老朱上台,説視覺和語言的結合會是一個重要的問題,比如看到一張圖片,系統應該輸出一段話描述它。我當時和UCLA的室友坐在下面偷偷笑。老朱又在説天書了。沒想到過一兩年,就出現了紅極一時的VQA任務,不過是用Deep Network實現的。”

從2011年起,朱老師的實驗室拿到的美國聯邦政府資助超過4000萬美元,其主要原因就是其研究思維超前,這些擁有大量資金的項目都是立足於不同與當前熱點的更前沿的想法。

能夠提前感知到未來的大方向,這是頂級的研究直覺感覺。朱松純上世紀九十年代開始把概率模型引入視覺問題,二十一世紀初就開始做圖像識別,後來又很早就開始做圖像識別的數據集構建工作(LHI dataset,標註詳細,不過收費閉源),並在SVM非常流行的時候堅持探索層級表徵(走的是層次概率圖模型的路線)。朱松純提過的大方向,不一定都成為現實,但是正確的概率很高。

據説,朱松純的項目UCLA跟統計系、計算機系以及傳播學系的很多老師都有合作,很多學生也都是在合作指導。美國學術界重視多學科的交叉研究,朱松純的實驗是在這方面也是走在前頭的。

當然,不同科研者習慣的在技術浪潮中的身位不一樣,代季峯説道:“按照某老師的説法,如果把一個技術浪潮比作高斯函數的話,老朱走在6 Sigma,遠在數據集和技術都不完備的情況下就想衝上去做;有些研究者走在1 Sigma,提出標準化數據集或者第一個實現的技術;有些研究者走在0 Sigma,研究state of the art或者improvement。”

實際上,目前很多流行的算法,比如風格遷移和圖像分割等,朱松純在研究中都早有涉獵。現在很多研究人員只跟最新的arXiv論文,可能還覺得風格遷移這個問題是深度學習出來之後才解決的。其實朱松純早在十幾年前就利用統計紋理分析,在風格遷移上就做出過很好的應用。此外,朱松純在1995年做的Region Competition的工作對圖像分割做出了有里程碑意義的貢獻。

2 一絲不苟

“還記得跟老朱討論的時候,他經常會説這樣的話:這個算法不對,數學上是錯的,這個CV領域最近火的技術在統計上是不對的。”代季峯迴憶道。“在學術上,朱老師從來沒有中庸之道,如果覺得你的觀點不對,他是會和你辯出黑白來的。”微軟首席研究員華剛也有着類似的印象。

華剛認為,面對真理探索道路上巨大的不確定性,學會捍衞自己的學術觀點對於學者而言也是必要的,“如果你説你在做研究,但甚至都不願或者不能通過辯論來捍衞自己的學術觀點,那説明你可能要好好想想你是不是適合做研究。”

大部分研究者,概率模型火就用概率模型,SVM火就用SVM,Deep Network火就用Deep Network,“而老朱是有信仰的。”

朱松純曾經在SVM之前引領了視覺領域的概率模型潮流,對於自己辛苦鑽研出來的東西,不會輕易捨棄,這是朱松純的信仰。當然,誰知道統計學模型會不會捲土重來呢?

代季峯説道,他從中學到了寶貴的東西,“要保持模型的簡單和漂亮,以及在一個領域踏實的耕耘。還記得老朱説,做研究像下圍棋,不能東下一顆西下一顆,地盤全被別人佔了。”

但朱松純也絕對不是那種不能被説服的人。舉個例子,朱松純研究了很多年生成模型,對GAN這類模型有自己獨到的看法。

在2017年 CVPR的領域主席會議期間,華剛和朱松純有一些爭論,但最後我跟他説:“GAN本質上是學到了對一個數據分佈採樣的採樣器,並沒有對數據的概率產生完整的描述。這是因為,給定一個樣本,你並不能計算它的概率密度函數的值。” 朱松純對華剛的看法表示了贊同。

3 刀子嘴豆腐心

代季峯想起之前在朱松純的實驗室訪學的經歷,“是的,這是老朱爭議最大的地方。剛去他實驗室的前三個月,很不適應他的批評,但你慢慢了解他,就好了。”

代季峯表示,實際上,朱松純對學生的長遠發展和重要利益很看重,他會嚴格要求學生,必要時嚴厲批評,但過後不記仇。

“其實學術圈的老闆,脾氣大一些、對學生嚴格要求的非常多,算是學者的通病吧。”

朱松純的做法,一方面出於科研進度,一方面更是出於從他的認知為了學生好,在找工作方面對學生也非常支持。

華剛也表示,根據他多年的觀察和經驗,有老師嚴格要求的學生, 成才的概率比沒有的要大。

4 正本清源

朱松純曾經在一篇名為《正本清源》的文章重嚴厲批評了深度學習被過度追捧的現象,他認為深度學習方法缺乏可解釋性,把模型(表達)、算法和實現三層結構混合在一起,相關論文一般都無法清楚解釋研究成果的主要貢獻來源。

“當它性能不好的時候,到底是因為表達不對,還是算法不對,還是實現不對?這個不好分析了,目前的神經網絡,或者是機器學習,深度學習,它的本源存在這個問題。”朱松純這樣評價深度學習方法。

“以前我們審稿的時候,會追問論文貢獻是提出了一個新的模型?還是一個新的算法?在哪一個層級上你有貢獻,必須説得清清楚楚。”現在,深度學習向論文審稿人提出了一個大難題。

2012年,朱松純作為CVPR的大會主席,收到神經網絡和機器學習學派領軍人物、2018年圖靈獎獲得者Yann LeCun的抱怨信。Yann LeCun的論文報告了很好的實驗結果, 但是審稿的三個人都認為論文説不清楚到底為什麼有這個結果,於是拒稿。Yann LeCun一氣之下就説再也不給CVPR投稿了,把審稿意見掛在網上以示抗議。

上海交通大學副教授張拳石對朱松純的觀點表示贊同,“學術的發展,固然要考慮到提升定義良好任務的處理精度,但是更要在更高的層面認清阻礙現在流行技術繼續發展的瓶頸,知道哪些問題是可以用現有方法建模的,哪些問題雖然尚未有辦法有效處理但卻是領域的重要瓶頸。研究者的認知不能被既有算法所侷限,不然就會被侷限在一個小圈子裏面,失去很多發現‘大問題’的機會。

朱老師説“正本清源”,就是告誡我們,想想真正目前學術發展的瓶頸都是哪些問題,而不是單純的發文章。雖然很多"大問題"很難清楚的定義或找到好的解法,但是這恰恰需要我們一代一代人努力去做。”

Facebook人工智能研究院研究員田淵棟也認為朱松純的説法是正確的,不過他還指出,這種現象有其合理根源。

“做理論需要的基礎知識多,困難,週期長,沒有直接經濟效益,還只能一兩個人單打獨鬥且無法使用大量計算資源,每個因素都和現在的主流發展方向(強調團隊合作,強調速度和新聞性,代碼開源,大數據,大量計算資源)背道而馳。”

而且,理論研究論文大多艱深、晦澀難懂,結論依賴不現實的假設,難免令人望而卻步乃至失望。相比之下,實驗研究效果立竿見影,傳播快。

所以,田淵棟認為,理論研究要讓少數的、有情懷的人去做,遠離市場噪雜和競爭,慢慢地鑽研。“一萬個碩士博士裏有一個懷着這個理想,那遲早有一天會做出來的,大部分人不用費這個力氣的。”