對話南科大沈平:在人工智能開源中,高校能扮演什麼角色?
作者 | 陳彩嫺
採訪整理 | 劉冰一
2020年被稱為深度學習框架開源的元年。
那一年,繼百度飛槳之後,曠視開源天元(MegEngine),華為推出MindSpore,清華大學計算機系的圖形學實驗室也發佈了自主研發的深度學習框架——計圖(Jittor)。
與其他深度學習框架相比,清華的計圖基於統一計算圖,無需手動切換就能將計算圖動態地拆分成可以優化的子靜態圖,在保持動態圖靈活性的同時,發揮出靜態圖的運算性能。出色的特性使得計圖在Github上一發布,就受到了廣大深度學習開發者的好評。
然而,在目前國內的開源工作中,計圖所代表的高校開源是一個少數。與企業相比,國內高校老師與學生對開源的認知仍比較薄弱,參與度也較低。
但事實上,作為教書育人的搖籃,高校能夠在開源中扮演關鍵角色,宣傳積極的開源精神(如靈活性、創新性、合作性、低成本等),培養優秀的開源人才。
相較而言,國外高校參與開源文化建設的歷史更早。其中,最具代表性的便是Google在2005年發起的全球性編程實習生項目——“谷歌編程之夏”(Google Summer of Code),自設立以來,吸引了超過16,000名學生與13,000名導師參與開源,為715個開源組織生成了超過3800萬行代碼。
除了校企合作,國外高校內部對開源政策制定與平台建設的重視也更早。比如,2013年,德克薩斯大學為開源制定了正式的政策:
2019年,為了“吸引對技術自由與開源感到振奮的大學生”,美國的密歇根理工學院便推出了虛擬的一站式開源平台shangopensource.mtu.edu,為學生提供免費的數據、開源課程、軟件與硬件,以及交流合作的開源俱樂部:
隨着開源對技術發展的重要性越發突顯,國內一些高校也開始重視對學生開源能力的影響。
比如,中國科學院軟件所與openEuler Community共同舉辦面向高校學生的暑期開源項目開發活動——開源之夏;北京大學軟件與微電子學院開設面向研究生的選修課《開源軟件開發基礎及實踐課程討論》,推動高校教材、教學與實驗器材等方面的開源。
舉辦比賽與教師教學是一種“自上而下”的推廣形式。當開源逐漸成為國內技術發展的主流方向之一,南方科技大學還希望採取“自下而上”的發展方式,通過“夥伴對夥伴”(P2P)的形式吸引對開源感興趣的學生。
於是,4月9日,南方科技大學在深圳“開源科技節”中宣佈正式成立中國首個高等院校開源俱樂部——南方科技大學開源俱樂部(OSS CLUB)。
圖注:南方科技大學開源俱樂部啓動儀式
OSS CLUB由南方科技大學學工部就業指導中心、電子與電氣工程系統指導,LinuxFoundation、騰訊、華為、開源科技OSTech等企業和開源組織聯合支持發起。
根據OSS CLUB創始人王雲天(南科大電子工程系大三學生)的介紹,成立開源俱樂部的想法來源於一次課堂作業:“我們平時有些課程需要用到開源的代碼,比如輸電實驗與模電實驗,我們小組做了一個手控的無人機,其中用到的一些芯片就是開源的。我就覺得開源非常重要。”
這一想法獲得了南方科技大學講席教授、電子與電氣工程系副系主任沈平的支持。沈平教授此前於2002年至2019年在新加坡南洋理工大學任教,是OSA Fellow, SPIE Fellow, IEEE 光電子學會全球副主席,曾培養出多位優秀學子。
圖注:南方科技大學沈平教授
在沈教授看來,高校參與開源有四大優勢,分別體現在豐富的人力、前沿的知識、抗風險能力與先進的設備。此外,大學生參與開源俱樂部,能夠培養學生在開源中的合作精神,讓學生在進入企業後參與開源項目時,不至於一無所知。
以下是AI 科技評論對沈平教授的採訪整理:
一、OSS成立背景
1、AI科技評論:南方科技大學為什麼要成立這個開源俱樂部?
沈平:過去20年,我在新加坡南洋理工大學任教。在南洋理工大學有一個開源社團,叫做Open Source Society,社團成立剛滿10年,成員以學生為主,也有部分高校導師、業界導師。這個社團辦得非常好。
來到南方科技大學後,剛好我的一位學生叫王雲天,他想成立一個開源社團,我覺得這個想法非常好,我很支持。
我們成立這個俱樂部的目的就是為了吸引更多對編程、開源或對計算機科學感興趣的學生加入。
2、AI科技評論:南科大的這個開源俱樂部包括哪些方向的開源?是集中在人工智能的開源,還是也有涵蓋其他方向?
沈平:開源是比較寬泛的,人工智能是裏面的一個部分。人工智能現在是一個比較火的領域,所以肯定是在我們俱樂部的研究範圍內的。我們今天講的人工智能基本上都是深度學習。除了人工智能,我們也希望把區塊鏈納入研究。
我們今天有很多軟件,包括工業的軟件,都離不開開源。就好像安卓的底層就是從Linux開源做起來的,鴻蒙也是。
開源有點像一顆種子,大家要一起澆水才可以種出一棵大樹。有一句話也可以拿來形容開源項目:“If you do it alone, you can do it fast. If you do it together, you can go far.” 就是説,你要是自己做,可以做的很快;但是你要是跟人家一起做,雖然你可能沒有那麼快,但是你可能走得很遠。
把一件事做起來要考慮很多因素。參與的人多了可能會很亂,需要有人去統籌或是總結,把每個人的貢獻放進來。這部分工作(“合心聚力”)其實包含蠻多技術含量的,我覺得南科大特別適合擔任這個推動者的角色,讓同學們在上學期間就有機會參與開源項目。
我們做不到大公司,像華為、騰訊那樣,有這麼多人力,還有業界的專家來推動開源,但是我們大學能進行基礎培養,這樣在學生們將來出社會工作時,他們在短時間內就可以上手做開源貢獻,也更懂得怎麼樣去跟人合作,而不是進入企業後才開始學習事情該怎麼做,在許多開源環境都犯一遍錯,或者察覺不到開源過程中的問題。
另外,年輕人也需要鍛鍊一種團隊精神,學會跟大家合作,而不是每件事情都以自我為中心。因為在實際工作中會發現自己單打獨鬥是不夠的,還要和其他人編寫的模塊放在一起才能推動項目進展。一個人其實是很侷限的。一個人可以做的很快,一起做可能沒有那麼快,但可以走得更遠。我覺得這是在高校推動開源能夠對學生起到的培養作用。
3、AI科技評論:我看到南科大官網上有一些學生參與開源的競賽,也取得一定成績。現在俱樂部剛成立,同學的反響如何呢?
沈平:我們現在有一個羣,已經有一些學生表示對開源俱樂部感興趣了。
圖注:南科大學生參加技術類比賽項目
我們以往參與比賽,基本上是老師帶領團隊的形式,老師做的某個領域可能就培養幾個學生。我們現在有這樣的想法:除了老師主競賽,我們希望學生之間也能形成團隊,就是學生和學生之間互相支持、幫助,有自己的研究方向和參賽目標。所以我們希望陸續會有一些學生導師出現。
這是我在新加坡看到的一個非常好的現象:學生社團中有學生導師。如果俱樂部裏有厲害的學生,比如寫APP厲害的、熟悉網絡安全的,這些某方面很厲害的學生可以開課教學弟學妹們,就是P2P(Partner-to-Partner,“夥伴對夥伴”)的模式,學生之間互相支持和教育。
二、OSS的角色:培養開源人才
4、AI科技評論:新加坡那邊的的高校參與開源的情況是怎樣的?
沈平:其實再怎麼成熟也很難跟企業比。大學階段,我們培養的是一種開源文化和學習能力。比如讓學生知道怎樣去做編程,熟悉上傳資料至某共享平台的方式。如果等到他們畢業、去了企業才開始瞭解的話,就有些太晚了,我們希望早一點培養他們的學習意識和能力。
5、AI科技評論:南方科技大學開源俱樂部有和企業建立合作的實踐項目嗎?
沈平:有的,我們後續會邀請更多的業界導師加入我們俱樂部。我們也會陸續地跟他們舉辦一些競賽類活動。我們所謂競賽類活動是包括訓練的,我們會和企業一起做一個訓練課程,把這些學生教會了再進行組隊參賽。參賽訓練其實是目標為本的,大家朝着一個目標,在規定期限裏看誰能做的最好,最能發揮創新能力,或者最能把問題解決到極致。
另外,我們也希望學生能自發地舉辦一些活動,這樣不僅可以鍛鍊到學生的組織能力、領導才能,還可以讓學生在這個過程中學到很多東西。我們更想給對開源感興趣的學生一個活動的場所,至少有一個地方把整個學校對開源感興趣的學生聚攏起來。就像我很喜歡踢毽球,如果學校有一個毽球協會,我不會踢、但是我很感興趣就可以加入,慢慢地,我可以發掘自己的潛力,而那些會踢的可以鞏固自己的天賦。
我之前在英國、新加坡、香港的不同大學都待過。其實大學裏面有很多人才,比如説校園黑客,可能他技術能力很強,但沒有一個讓給他施展自己能力的舞台,他就自己在上網去學,或者去一些小眾圈子交流。如果有一個俱樂部,那麼我們可以提供一個平台給他去結交更多朋友,讓他分享知識,也可以就一些專業領域給其他小夥伴作指導。
之前在新加坡有個電子系的學生,他在大二時參加新加坡全國網絡安全競賽拿到全國總冠軍,大三他又參加了,又拿了冠軍。他跟來自全國的職業選手比賽,居然拿了兩次總冠軍,所以大學裏邊還是卧虎藏龍的。
開源俱樂部就是聚合這批有天賦、有興趣的人的一個舞台。其實還有很多俱樂部可以成立,但這個是我們目前覺得很多人會感興趣的,所以我們今天就公佈給大家,我們要成立開源俱樂部。
6、AI科技評論:您有沒有了解清華大學他們也有一個高校主導的開源框架(Jittor)?南科大有沒有什麼類似的計劃和項目?
沈平:暫時還沒有。大學更多的責任是培養未來社會所需的人才,所以我們進行的更多工作也是在培養人才。
大學生永遠都那麼年輕,只有我們在變老。跟企業不一樣,企業做一個研究要持續七八年或者更長時間,但是大學4年就一個週期,四年後又是一批不同的年輕人。由一兩個老師主導,不斷地教新人,其實大部分時間都是在進行培養工作。
當然,我們也可以給企業一些支持,我們可以解決或者關注企業開源技術上的問題,我們可以以顧問的身份給出一些建議,而不是給企業推薦一個具體的系統、計劃。給出具體系統可能比較難,但也不是完全沒有可能,這需要有人主導。比如我們的畢業生做了一個很好的畢業設計或者完成了不錯的博士課題,他畢業後創業了,把創意再推向市場,這個是有可能的。以前在硅谷就有很多這種案例。
學生參與開源,最大的貢獻是注入一些活力,提供一些新鮮的想法。好像我在企業幾十年了,思想模式好像已經定型了,但是來個年輕人的話,他會問為什麼不能這樣做呢?可能他就顛覆了我的想法,或者整個開源項目的發展方向。一個已經用了很多年鴻蒙系統的人,其實是很難改變的,因為迎接新事物、學習新事物的時間太長了。但學生不一樣,他們是一張白紙,你給他學啥,他就直接去學,可能在很短時間裏做到極致,或者發現裏面所存在的問題。
我之前找過那位拿了兩年新加坡國家競賽獎的學生,我問他:“要不你看一看我們學校的教育系統安不安全?”我們有一個學生交作業的系統叫blackboard。挺神奇的,我們慣常使用的東西,學生就是有辦法看出問題,他知道在哪可以攻擊系統,在哪裏可以進入。他一下就找到了六個攻擊點,把他的報告送去學校圖書館,給管理員嚇一大跳,原來這系統這麼脆弱啊。
7、AI科技評論:據您瞭解,現在國內參與開源的高校多嗎?
沈平:我感覺已經能看到未來的上升趨勢。可能現階段開源的發展還是平穩的曲線,但未來上升趨勢是指數式。已經處於拐點階段了,往後就可能是火箭升空的軌跡。
8、AI科技評論:大學生參與開源,對他們個人的成長、學習生活、職業有什麼樣的意義呢?
沈平:拿我自己來説吧。我中學時參與了很多活動,多到你都難以相信。
我是全國第一屆電腦協會的主席,這個協會就是我創辦的。後來老師叫我做舞蹈協會的主席,我是不會跳舞的,但是我勇敢地答應了。我是主席,但不會跳舞,那豈不是很丟人?於是我就晚上報夜校,在夜校學多少,第二天就回協會教多少。其實做的也很成功,我還帶學生去表演戲劇。
我當時還在學校裏邊組織很多學生活動。我們學校大概分為四類社團,我代表其中的一個社團,在裏邊是學術顧問的角色。除此之外,我還是一名“童軍”指揮員,平時要帶他們拉練的。雖然當時忙得不行,但是後來我發覺那個時候的活動經歷讓我成長很多。
後來我在大學帶學生,他不需要告訴我具體什麼事情,我基本上都知道。在待人處事和了解學生的方面,參加活動對我非常有幫助。我大約知道TA要幹嘛,大約知道TA有什麼問題,是什麼心態。都不用説得很明白,我都大概知道怎麼幫助TA。這種感覺不是每個人都有的,我挺慶幸我在中學就鍛鍊了這種能力。所以我就覺得大學生還是有必要參與社團活動的,比如參與開源社團,不但能夠學習到開源或者編程能力,還可以學到待人處事,學習怎麼樣跟人一起合作。開源是必須要學會跟人合作的。
三、高校與企業合作開源
9、AI科技評論:相比企業,您認為高校做開源有優勢嗎?如果有,體現在哪些方面?
沈平:我們高校最大的優勢就是人力資源、知識、承擔風險的能力和設備。
大學的人力資源不僅包括專業老師,還有博士後、博士等科研人才。不管是區塊鏈、光學電子或者人工智能領域的問題,只要企業找到高校,找到領域裏相關的一個或幾個老師,都能給他一個解決方案。
但是企業拿回去之後要分析一下可行性,因為我們永遠都會有方案。但這個方案是不是性價比最高的呢?這就需要評估。企業要回去考量成本,看能不能落地。
在學校裏,我們每個領域都有非常專業的老師,他們在各自領域精耕很多年,擁有大量儲備知識。
圖注:南方科技大學教資實力
還有就是我們能承擔風險的能力。雷鋒網
假設去開公司,開公司要投資科研,科研是個無底洞,可能做了三五年都沒做完。在這個過程中,創業者不知道有沒有人要,賣不賣得出去,可能最後發覺根本沒有市場。但是我們大學就可以承擔這種風險。我們可以做一個東西也許未來50年都不會有產品。就像世界第一個激光是1953年做出來的。激光剛做出來的時候也是沒有人要的,因為它剛做出來的時候有三張沙發那麼大,並不是現在我們手裏拿的輕便小巧的一塊。誰會拿一個這麼巨大的東西去上課呢?並且它可能是一個百萬級、千萬級的項目,要耗費鉅額投資。但這也需要有機構去做。如果沒有人堅持做這項研究,今天激光不可能從三張沙發變成一支激光筆。
大學為什麼能承擔這種風險呢?一方面,大學的重點在於教育,我們的目的本來也不是做成一樣產品。學生從事學術研究、發表成果,然後畢業,這個過程中涉及一些研究課題,一代代學生共同完了成果轉化,造就了今天的激光筆,也將激光加工技術推進工業領域。企業跟大學合作,可以把一部分前期風險轉嫁給大學。假設一些企業想研究下一代半導體技術、區塊鏈技術,但不知道走哪條路才能賺錢,可能走了數百條路,只有一兩條路有可能走得通。雷鋒網
如果跟大學合作,大學提供智力支持,老師和學生組建的智囊團隊針對企業需求找出幾個可行的路徑,在這個過程中可以發專利,還可以產出中國製造的工藝品。如果成果符合相關規範的話,還有可能成為全球標準、行業標杆,這就是一個很大突破。這時候,公司就可以把它拿來產業化了。要是智囊團隊發現企業的想法在實際操作中實現不了,或者發現成果做出來沒什麼用,又或者最終成果太容易被攻破,那麼就可以及時止損。這樣其實是在幫助企業規避風險,避免後續量產時產生更大的悲劇。
最後一樣是設備。大學有很多過百萬、過千萬的設備。一般來説,開個公司,初期誰會去買一個千萬的冷凍電鏡呢?如果跟我們合作,通過高校的設備試驗這種設備對企業有沒有用,已經證明是有用了,企業可以再結合其他情況決定要不要採購。雷鋒網
10、AI科技評論:小公司設備成本預算不高,但像華為、騰訊這種大公司,給到的設備支持力度應該還可以?
沈平:其實大企業也差不多的。大企業的科研部也很大規模,人多,想做的東西也多。所以他們要衡量預算,評估部分科研實力、風險情況再決定設備投入。要是風險很高,但只有1%的成功率,那麼大企業也不一定願意給錢。這個時候,部門可以尋求和高校羣體合作,先用我們的設備做一個測試,結果效果不錯,再回公司説已經經過大學認證了,這樣就好申請一些。所以我覺得高校還是靠譜的。
11、AI科技評論:南方科技大學在開源這一塊有四大優勢。那麼,你們有什麼需要改善的地方嗎?
沈平:南科大的優點和缺點都是年紀輕。深圳的平均年齡是33歲,這個是很大的優勢。我們都遇到過頑固的人,一般來説,頑固的人可能年紀大的偏多。我個人對頑固的定義是停止學習,或者不願意學習。有些人是拒絕改變的。大家都覺得這個事他應該去學,或者應該往前走,但是他就很抗拒,頑固就形成了。
但是,有一個成語叫“三人成虎”。如果身邊的親戚朋友都跟他説要嘗試某件新事物,他可能就願意接受。他會想:既然大家都這樣説了,那我就試一試?那好,我試試裝個某寶,看是不是打折。
年輕的大學有什麼好處呢?就是什麼都是新的,大家會願意嘗試新的做法,有待改善的東西會不斷地出現,盡了力就是完美的。比如説,要求畫一條直線,用直尺可以畫得很規範,但要求徒手畫,在沒有輔助的情況下,盡了力去畫就是完美的。
我覺得學生也是各有優點,要是能發揮TA在編程上面的優點,TA就是個人才,但要是把TA放在不熟悉的其他領域,讓喜歡編程的去搞硬件,這樣就完全發揮不到個人優點。我們希望能儘量找到學生的興趣,讓每一位學生都能發揮特長。我們並不需要一個人什麼都懂,他要是能成為某個領域的專家就已經很成功了。我們希望未來能多培養一些專家,我覺得未來國內最缺乏的可能就是專門領域的人才。
現在年輕人生活壓力也大,可能為了生活在不斷地換工作,這可能完全改變他的方向。比如一些人原本做編程,轉行做光電,後來又去做石墨烯材料。到他三四十歲的時候,可能一看,履歷很精彩,但就是找不出一個專注點,要是他有一個專注點能咬緊牙關做下去,他可能已經是一個行業的CTO。