清華姚班校友馬騰宇:十年磨一劍,遙摘萬里星

編者按

2011年1月,清華大學交叉信息研究院成立,由計算機科學最高獎“圖靈獎”得主、中國科學院院士、美國科學院外籍院士姚期智先生領導,是國內首個致力於交叉信息科學研究的教學科研單位。

桃李春風恰十載。姚先生曾言“人生是為一場大事而來”,而清華大學交叉信息院在成立之初就本着“為國家培養人才”,引領“中國圖靈之路”這般大事而來。

十年間,清華大學交叉信息學院始終以為建設世界一流的交叉信息研究機構,培養具有國際競爭力的拔尖創新人才為目標。其中,創立於2005年的清華學堂計算機科學實驗班(姚班)和創立於2019年的清華學堂人工智能班(智班),已建成計算機科學和人工智能領域的人才培養高地;創建於2011年的清華大學量子信息中心,已成為量子計算機和量子網絡的重要前沿研究基地。

十年蹤跡十年心。十年間,清華大學交叉信息院培養了大批優秀學子,他們從清華出發走向世界,為學科的發展貢獻自己的一份力量。今天為大家介紹的,是2012屆姚班校友馬騰宇。

清華姚班校友馬騰宇:十年磨一劍,遙摘萬里星
馬騰宇

2012屆姚班校友,於普林斯頓大學獲得博士學位,現為斯坦福大學計算機科學與統計學的助理教授。研究興趣包括機器學習和深度學習,深度強化學習和高維統計。曾獲得NIPS'16最佳學生論文獎,COLT'18最佳論文獎、ACM博士論文獎榮譽獎和2021斯隆研究獎。

“茶園”故事:憶清春歲月

在茶園(清華大學交叉信息研究院的別稱)學習的課程,是馬騰宇在清華印象最深刻的記憶之一。他特別提到了姚期智先生的《計算機應用數學》這門課:“當時姚先生給出了一個拜占庭將軍問題,我們大家都想了很久也沒有給出一個很好的解法。即使後來我們有一些進展,但也都是比較局部的解決。”另外,孫曉明老師開設的《理論計算機Iⅈ》等其它專業課程也讓馬騰宇受益匪淺:“在茶園所學到的知識和技巧,對我後來的學習和科研都起到了很大的幫助。”

姚班的同學,擁有着各種不同的學習背景。但在馬騰宇看來,之前的學習背景並不是關鍵,大家也不可能只靠以前的背景就能獲得成功。“雖然剛開始也許會有些許影響,比如我自己的數學競賽背景會讓我在大一的數學課上不那麼吃力。”馬騰宇説,“但是從長遠來説,這種影響並不是最關鍵的。我想大學教育的過程,其實也是讓學生把之前不會的東西一點一點學會的過程。”

馬騰宇記得,大一初入學時自己還不太會編程和算法,而同學楊弋是IOI的金牌,“所以我有很多不會的問題,經常會去問他;他也很熱心地幫助我,同時推薦我去看《算法導論》,讓我收穫很大。”

馬騰宇和同獲“斯隆獎”的鬲融(2004年從河北省保送至清華大學計算機系,後進入“清華姚班”)也保持着很良好的關係。“我和鬲融學長還有更近的一層關係。我們博士是同一個導師,所以對我而言,他更多的是一個師兄或者説是一個mentor。我博士一年級的時候,鬲融學長是博士五年級,給了我很多幫助,也教了我很多技術。”馬騰宇覺得與鬲融的交流合作十分愉快,“他是一個非常好的一個mentor,我在與他的交流合作中學到了很多東西。我們也一直保持長期合作的關係,關心的問題也比較也比較相像。”此外,馬騰宇和姚班許多同學在畢業後依舊保持着練習。而在姚班所結識的聰明又勤奮的同學,也是他一生的財富。

科研之路:上士問道,勤而行之

談及本科期間的科研經歷,馬騰宇回憶,自己主要和俞華程同學一起,在孫曉明老師的指導下做了兩篇關於組合數學的論文。後來在 MSRA(微軟亞研院)研究學習時,在陳衞和王亞軍老師的組裏做了一些關於matroid algorithms的研究。

而馬騰宇本人,也並不是在一開始就決心走學術的道路。“剛開始的時候,我只是想把自己的科研做好、把博士讀好。到了博士四五年級的時候,我才開始考慮是要去業界工作,還是找教職。”馬騰宇説,“最終還是綜合考慮了自己的興趣和實際情況,決定繼續在學術的道路上走下去。”

現在,馬騰宇主要做理論深度學習方面的研究。“理論深度學習的問題有很多,不只是有監督學習,也包含神經網絡在無監督學習和強化學習中的使用,還有神經網絡的魯棒性等問題。”馬騰宇組裏的每個學生的研究也都多少有些不同,“但是大家的主線都是用在研究深度學習,或者説神經網絡在不同的領域裏的使用”。

對於深度學習理論與實踐之間的差距,馬騰宇覺得是正常的,而且這種差距也正是發展深度學習理論有趣和有意義的地方。“深度學習實踐的發展速度非常快,理論如果想要很快理解所有實踐中的問題,也確實有一些難度。因為我們的理論工具、數學工具可能並不完善。”馬騰宇説,“但理論和實踐一定程度上也是相輔相成的,在實踐很成功的時候,理論可能更多地在提供解釋和支撐。但是當實踐遇到瓶頸時,理論反過來可能會給實踐一些靈感。雖然並不是每一個理論都能有這樣的效果,但是有一些理論我相信是能對實踐有幫助,這也是我希望能夠發展的理論。”

而馬騰宇在自己的研究中,也注重理論與實踐之間的關聯性:“我90%的論文都有一些實驗,用來證明理論是有實際的相關性的,而不是單純的‘紙上談兵’。理論啓發了新的方法,我們就用實驗去測試這個方法的實際效果和潛力。我希望、並且也相信也這樣的理論會越來越多。”

馬騰宇的博士導師 Sanjeev Arora和姚期智先生都是非常重要的計算機科學家,兩位對他產生了很大的影響。在馬騰宇看來,兩位導師的共同點是對科研非常執着和熱情。“姚先生最近還有很多單一作者的工作,我想他肯定非常忙碌,但他還在科研方面如此活躍,我十分敬佩。”有時候馬騰宇回到叉院做講座,能夠看到姚先生前來,這讓他感到“非常榮幸”。“我跟姚先生交流的時候,會討論一些科研問題,可以説他對所有的前沿問題都非常關心,而且對細節也很瞭解,我覺得這是一種對於科研的執着。”馬騰與説,“Sanjeev也是這種風格。他對關心的問題會執着地追求,當我們很難在一個研究方向上走下去的時候,他還會一直想新的思路,然後把問題做下去。”

在工作中,馬騰宇會去追求一種長期效應(long term effect)。“關注long term impact主要是希望每個工作都能關注一些比較長期問題,有質量地完成,而不是簡單地寫寫論文、發表就大功告成了。”即使論文關注的是一些比較技術性的問題,馬騰宇也希望這些技術有比較廣的應用。從做科研的方法上來講也類似,“比如説在讀博士的時候,多學一些技巧,多關注一些不一定直接用在科研項目上的技術。我在讀博士的時候也做過挺多方向,有很多東西當時學了之後,也沒有直接發論文的。但是慢慢地,在後來的研究中,這些技術還是會用到的。當然,不一定説做的每件事情都能有長期的影響力,但至少這是一個值得努力的方向。”馬騰宇説。

現在的馬騰宇,不僅是一個學者,也是一位“師者”。馬騰宇覺得,執教的經歷與科研的體驗“區別還是很大的”:“科研的話,目標是探索發現。教學的重點,是要讓學生去理解已知的知識。已知的知識,也分熟知的結論和最新剛剛理解的新發現。教學,就是要把知識以一個最簡單,或者説最符合邏輯的方法教給學生。”馬騰宇當前正在執教CS229,這是非常著名的人工智能課程,“尤其CS229的學生是非常多樣的,來自不同的院系,他們對於知識的理解和掌握程度也是不一樣的。所以教學的體驗,其實跟科研還是有很大區別的。”

祝福母校,祝福“茶園”

馬騰宇感受到,過去5年到10年間,茶園的學生變得越來越強了。“我當時的簡歷申請放到現在,感覺可能要比很多學生差很多。所以説,我覺得清華整體上的學生實力一直在進步,這是個很好的事情。”馬騰宇説,“我現在也帶了很多清華的學生。沒記錯的話,張皓辰和董克凡都來自姚班,他們的科研也都做得很好。有一些暑期實習生,也來自姚班,做得都很不錯。“

馬騰宇希望學弟學妹們能夠努力學習、珍惜機會,他説:“姚先生建立了這麼好的一個環境,提供了這麼多優質的課程,這個機會是很特殊的。姚班的聲望在國際上也很高,比如我們在錄取學生的時候,提起姚班,大部分的教授都是瞭如指掌的。”在科研和學習方面,馬騰宇建議大家可以儘量把問題研究清楚,不要太急功近利:“儘管剛開始的時候,這樣效率可能會低很多,但是把問題搞清楚了之後,很多事情就變簡單了。”

“我非常感謝母校和茶園的培養。我已經看到清華的學生,包括科研在內所有的方面都在非常快速地進步,這是讓我非常開心的一件事情。”馬騰宇高興地説,“希望清華越來越好!希望茶園越來越好!”

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 3398 字。

轉載請註明: 清華姚班校友馬騰宇:十年磨一劍,遙摘萬里星 - 楠木軒