AlphaFold「奠基人」周耀旗:用37年的邊角料研究,找一座「精神烏托邦」
每次看到家中曇花盛開,周耀旗會想到自己的科研生活:長時間寂靜,一霎那綻放。這些年裏,他找到了一種打理自己的方式,就是把自己的經驗教訓寫進博客。他樂於將個人的故事與公眾分享,如同他總會接納外界的聲音。
當全世界都沉浸在進入新世紀的喜悦時,37歲的周耀旗在家中挑燈夜戰,他憋了一口氣,要寫出一份最好的申請書,拿到他獨立研究時的第一筆經費。
從2000年開始,每年的申請季,周耀旗就會陷入時刻琢磨申請書的狀態。但直到第三年,他才拿到首筆經費。
周耀旗的女兒曾在日記中寫道,“有幾次,爸爸剛放下懷裏的電腦,才夾了一筷子菜,突然想起什麼,衝向沙發,抓起電腦,乒乒乓乓一陣敲打。”
那是周耀旗的第一份教職,學校坐落在紐約州第二大城市布法羅。
彼時,那位剛從哈佛大學離開的博士後,師從諾貝爾獎獲得者Martin Karplus、直博就讀於楊振寧所執教的紐約州立大學石溪分校、八十年代中美化學研究生項目中的兩百餘人之一,在20世紀剛剛結束時,結束了他16年的求學歲月。
在外界看來,那些經歷本應是周耀旗最大的榮耀與敲門磚,但從他做獨立研究的那一刻,所有的光環彷彿消失了。
他困頓、焦慮、沮喪、又重振旗鼓,用新成果對抗失敗。
在那些漫長的探索中,有一條周耀旗始終堅持着的科研主線——蛋白質結構裏的二面角的預測。他自嘲,做的是科研中的“邊角料”工作,卻將那些不起眼的工作做到極致。
正是有那些積累,讓他第一個把深度學習方法應用到蛋白質主鏈結構預測中。早在谷歌大熱的AlphaFold出現之前,就與團隊發展了神經網絡迴歸預測蛋白質真實二面角,推斷出蛋白質結構的預測方法,是端對端的蛋白質結構預測在神經網絡外的實現。
在科研的另一面,周耀旗的經歷同樣吸引人。
他離家張家港,學至中科大,東征紐約直博,西至加州創業,輾轉重回紐約,博士後南下北卡,又北上哈佛,在布法羅、印地安納、澳洲,度過了二十年的教學歲月。
從周耀旗身上,我們能看到一個科研人如何延續學科中的最小分支,也能看到一個人的三十年,是如何創業折返、三換導師、四次跳槽,以及無數次經費被拒的經歷。
如今,在與祖國闊別了36年後,周耀旗來到代表中國40年發展奇蹟的城市,在深圳灣實驗室裏,開始新的故事。
一次被“抓壯丁”的出國機會“沒主見、不主動、不愛説話,只有學習好一點。”這是周耀旗的父親給他的評價。
1963年,周恩來在上海科學技術工作會議上,強調實現科學技術現代化時,周耀旗出生了。
六十年代,周耀旗的家鄉張家港依港而興,成為那個年代最早對外開放的窗口。那時的周耀旗不會想到,自己將從這個小港口出發,在大洋彼岸開始36年的異國生活。
周耀旗在國內讀書時有兩個重要經歷,一次是提前衝刺高考,一次是意外獲得出國機會。
1979年,讀高二的周耀旗作為畢業生參加高考,儘管高一時衝擊未果,但這一次,他順利考進了中國科學技術大學,並以化學高分的成績錄取到近代化學系。
至於為何學起了化學,周耀旗説道,79年的高考化學特別難,自己倒是發揮不錯,也就因為這個優勢,填了中科大的近代化學系。
後來,周耀旗才知道,那一年,全國有468萬學生走進考場,錄取約28萬,錄取率不足6%,而他就是當中幸運的一份子。
周耀旗在中科大校門口
第一次去外省上大學,16歲的周耀旗有些忐忑不安,但班裏同齡人不少,也就很久適應了。
他有一本小本子,上面記錄了很多靈光乍現的“民科”想法,比如人死後會不會投胎、太陽系、原子和夸克結構的關係,什麼樣的老師最受歡迎,其中一些小文章還登過中科大校刊。
在同學看來,周耀旗特別喜歡胡思亂想,還有點專攻旁門左道,好幾門課徘徊在及格線,外號“愛因斯坦”。
好在七、八十年代,學術氣氛高漲,李政道、楊振寧、丁肇中等華人接連獲得諾貝爾物理學獎,周耀旗那些稀奇古怪的想法算不上離經叛道,還暗中為他從事需要冥想的理論研究打下了基礎。
在中科大的五年(五年制本科)裏,周耀旗瘋狂讀書,彌補了少時無書可讀的窘迫。
轉眼到了1984年的夏天,大學生活就要結束時,周耀旗突然有了一股迷茫感,他也像大多數畢業生一樣,對走向社會手足無措,他不止一次想,“自己還這麼小,資歷尚淺,能到社會上做些什麼呢?”
大多數同學考研,周耀旗也跟風,幸運的是,他幾乎沒有備考,順利考上了本校的理論化學研究生。此時的他,也終於安穩下來,“或許我還能成為第一位國內培養的諾貝爾獲得者。”
此時的周耀旗還沒想到,就是這緊要的一步,改變了他一生的命運。
上世紀八十年代,鄧小平關於出國留學的指示促成了三大項目:CUSPEA(中美聯合物理研究生招生計劃)、CUSBEA(中美聯合生物研究生招生計劃)、以及CGP(Chemistry Graduate Program)——中美化學研究生項目。
在那段持續了五年的CGP項目中(1982-1986),共用242名化學系學生奔赴美國和加拿大,成為國內開啓基礎研究的關鍵。
1984年,周耀旗所在的中科大分到了6個出國統考名額。按照遴選標準,需要在有出國意向的應屆中國化學系研究生考生中統一考試,擇優錄取。
但考試結束,有幾個學生因為英語和政治沒過及格線,以數分之差落榜出國統考。
6個名額遲遲不滿,中科大近代化學系的系主任突然想到周耀旗——已經考上本校研究生,雖然沒有出國意向,去充個數也好。
出乎大家的意料,當年的CGP考試僅有3箇中科大學生通過了兩輪篩選,而出國排名的最末尾,就是周耀旗。
對冷不丁竄出來的周耀旗,老師和同學都大為震驚,稱他是系裏的一匹“黑馬”。
但在那時,周耀旗對出國沒有什麼概念,認為自己不過是趕巧被抓去“充了壯丁”。畢竟他在中科大的成績中等,也從沒得任何獎,無論如何也輪不到自己。
對於突如其來的出國機會,周耀旗興奮又發怵。從小學到高中,他去過最遠的地方就是鄰縣的親戚家,大學也只是去了鄰省,離家不過五百公里。而現在,要去往大洋彼岸,還要選擇一所美國學校,一切都太陌生了。
CGP成員在廣州留影,周耀旗(後排右五)
按規定,所有入選學生要在中山大學進行一年的英語集訓,期間周耀旗得知,一個同班同學王主倫去了紐約州立大學石溪分校就讀,他也趕緊寫上了這所學校。
周耀旗清楚記得,這是偶像楊振寧所執教的學校,1985年,正是楊振寧在石溪的第19個年頭,在他的率領下,該校的理論物理研究所多次獲得國際大獎。
此時的周耀旗,還仿如一張白紙,但他知道,自己也即將與這所學校結下情緣。
科研的“至暗時刻”、三個人的創業公司在歷經兩天的輪航中轉後,周耀旗終於踏上了美國的土地。他打量着這個新世界,不曾想,他直博的起點,卻是他科研生涯中的“至暗時刻”。
出國前,周耀旗就確定了心中的導師首選——石溪化學系主任Jerry Whitten,一位國際上負有盛名的量化計算理論研究學者。此前,周耀旗的本科畢業論文也是這一方向。
但當週耀旗到了石溪,Whitten的第一句話是,“你可以找任何一個教授做導師”。這讓初到英文環境中的周耀旗誤以為系主任對他不感興趣,只好重新找起了導師。
1986年春,周耀旗決定,去系裏“唯二”做理論研究的Harold L. Friedman教授那裏毛遂自薦。
他一門又一門地説出自己在石溪的成績時,Friedman看着眼前這個功課全A的中國學生,一股好感突然冒了出來,不到五分鐘,就把周耀旗收進了自己組裏。
就這樣,周耀旗“糊里糊塗”地跟着Friedman做起了液體統計力學理論——一門他在國內聽都沒聽過的學科。
Harold L. Friedman 教授
但這段博士生活並不輕鬆。根本問題是周耀旗並不適應Friedman的教研風格,往往因為Friedman給的方向太確定,沒有什麼可變的餘地,而不確定是否找到了喜歡的科研。
在不適合的方向上,周耀旗的成果幾乎為零。他曾在博客中寫下,“導師給的幾個題目,我做出來的結果總是和原來的設想相反,方法不僅沒有改進,還變得更糟糕,最後連導師都不知道該給我什麼題目了。”
而Friedman顯示出極大的耐心,他知道這位學生只是一時沒找對門路罷了,常常鼓勁兒似地問周耀旗:“Anything exciting?(有激動人心的結果了嗎?)”。
聽到導師這樣問,周耀旗心情更加複雜,“如果再做不出成果,豈不是壞了Friedman的名聲。”
經歷一年的痛苦磨合,1987年,原來化工系的George Stell教授轉到了周耀旗所在的化學系做全職教授。為了幫助周耀旗推動進展,Friedman馬上向Stell建議,一起帶帶這位“不出活”的學生。
George Stell 教授
於是,在石溪的第三年,周耀旗多了一個導師。
Stell的教育方法完全不一樣,他不給學生具體的課題,而是拿出一堆自己認為有題可做的論文,讓學生去分析。這給了周耀旗很大的“創作自由”,也似乎解開了周耀旗零成果的死循環。
不久後,周耀旗想到一個思路,如果把一個硬球的半徑變成無窮大,那麼液體統計裏的積分方程,就能跳出三維徑向硬球體系,轉而研究出硬球在一個硬平面附近的分佈。
順着這個思路,周耀旗舉一反三。他把一個硬球體系繼續變形,從常規球體變為球形孔穴、柱型孔穴、兩個硬麪、半透膜(球型,平面型,球內半透,球外半透),直到把所有硬球體系都做了一遍。延續這個方法,周耀旗又將球體推廣到離子體系,一口氣發表了6篇論文。
在找到研究的門路後,周耀旗顯示出了極高的研究熱情,論文也變得高產。
他複製此前的成功,在以前論文的基礎上,將兩個自由離子看作一個分子體系,得出了溶解自由能隨離子間距離的變化,從而推斷出電子轉移反應的溶劑效應。在這個方向上,周耀旗又發表了8篇論文。
在博士的最後三年裏,周耀旗一共在凝聚態理論方面發表了22篇論文。其中19篇是第一作者,還有多篇成為了液體統計理論上的開創性工作。
畢業前,周耀旗寫下一首打油詩,他以此記錄自己那五年中的混沌與覺醒。
“乘風駕雲把西征,面壁五年為求真。懸樑刺股秋風寒,冬天過了終於春。”
周耀旗(右一)與兩個導師以及表情各異的同學們合影
1990年3月,長島的寒冰剛剛破碴,周耀旗的科研生涯告一段落,第一次站在了人生的十字路口。
原來從來沒有想過留下來的他,由於當時國內外的社會氣氛,回國的念頭被打消,但也不知道找工作怎麼找,從哪裏開始。
這時,校友張永峯打來了電話。他曾在中科大做過老師,通過楊振寧特別項目在石溪讀了計算化學博士,畢業後去了加州理工做了諾貝爾獎獲得者Rudolph A. Marcus的博士後。
他邀請周耀旗加入應用物理化學實驗室(Applied Phys and Chem Lab,APCL),去從事量子化學方面的科研。
去了之後周耀旗才知道,這是一家3個人的初創公司,好在剛開始日常工作與周耀旗的博士研究相差不大,隨遇而安的他每天兢兢業業,動腦賣力,很快發表了一篇量子化學方面的論文。
但不久,公司發現搞科研沒有“錢”途,轉型成為營利公司,專做環境保護測試。周耀旗也跟着換了崗位,做起了實驗室信息系統管理、市場、推銷、客户服務、業務管理,不久成了全面負責的實驗室主任。
周耀旗(右一)與加州應用物理化學實驗室(APCL)同事合影,張永峯(左一)
這是他的第一份工作,但三年過去,創業新鮮感消失了,日常工作也變得重複瑣碎。雖然那時公司事業變得蒸蒸日上,團隊從幾個人到了二十多個,但周耀旗卻開始自我質疑,“人活着難道就是為了掙錢?這是做事業的感覺嗎? 如果錢賺得多一點,做管理就算有出息的話,這樣的出息有什麼勁?”
他特別懷念一門心思做科研的日子,那種生活雖然也非常辛苦,但自己享受那個過程。
“如果能做自己喜歡的科研,還能有口飯吃,豈不是更好?”
三十歲那年,周耀旗下定決心:回去做學問,賭一賭自己有沒有做教授的命。
周耀旗選了一個“嶄新”的日子:1994年1月1日,他辭掉了自己的第一份工作,回到石溪,在兩個博士導師那做起了博士後。
在周耀旗看來,這不是走回頭路,而是重新獲得了一段沉浸自己的時間。多年後,周耀旗這樣描述這段時光,“我是三十才立志,才知道自己該追求什麼。”
他在博客中一字一句寫下,“三十歲以前,我一直是隨波逐流,沒有自己的主見,別人替我做選擇。之後的日子,我要自己做決定,就算衣帶漸寬,幾經波折,從此浪跡天涯,也無怨無悔。”
三換博士後導師、連投三年簡歷事實證明,周耀旗賭對了,但過程也極其曲折:他曾三換博士後導師,博士後第二年才拜入哈佛大學Martin Karplus教授門下。兜兜轉轉中,他也找到了傾其一生的事業——計算生物學。
1994年初,周耀旗回到Friedman和Stell那裏。只做了兩個月,突然兩個導師被告知,“科研經費馬上要用完了,你要另找其他學校的博士後了。”
周耀旗馬上行動,在同事和導師的幫助下,海投了幾十份申請信。當時周耀旗覺得,只要跟理論計算相關的教授,不管有沒有發出招聘廣告,或許都是一線生機。
但因錯過最佳就業季,最後只有4人給了答覆。分別為伯克利大學的教授David Chandler、威斯康星大學麥迪遜分校新上任的助理教授Arun Yethiraj、MIT化工系做統計力學的副教授Jonathan Harris、以及哈佛大學的教授Martin Karplus。
前兩位都因為經費不足而婉拒,Karplus則告知自己不在哈佛,第二年再聯繫。只有MIT的Jonathan Harris給了周耀旗一個面試機會,卻在周耀旗做講座時睡着了一會兒。唯一的面試也以失敗告終。
與此同時,周耀旗也申請了多個助理教授的職位,均無回應。這一刻,周耀旗走投無路了。
幸運的是,老闆Stell親自出面,找到了他在北卡州立大學做正教授的前學生Carol Hall。
在最後一刻,周耀旗通過師門關係,在師姐那兒續上了博士後。周耀旗去了之後才知道,那並不是一個全職博士後,工資只有離開公司時候的四分之一,連健康保險都沒有。
1994年的8月,周耀旗在北卡開始了第二段博士後工作。
在Hall組裏,他第一次離開簡單分子,開始了高分子的統計力學理論的計算。此外,他學會了此後對他幫助重大的方勢阱液體模擬,為他日後用非連續動力學研究生物大分子打下了計算基礎。
周耀旗(左三)在Carol Hall (前排左二)組做博士後
次年,哈佛的Karplus在得知周耀旗去了北卡後,主動留下一句話:“如果你能申請到博士後獎學金,就到我這兒來。”
周耀旗查了查文獻,把自己在北卡的簡單高分子的工作往Karplus計算生物方向靠,決定把液體統計理論推廣到生物高分子蛋白質上,研究“不同簡單溶劑對蛋白質高分子穩定性的影響”。
他用這個設想投了兩個申請,一個NSF(美國國家科學基金會),一個NIH(美國國立科學研究院)。
申請結果出來前,原來加州公司的張永峯又找到周耀旗,邀請他去新開的製藥公司Amphastar Pharmaceuticals繼續一起創業。但周耀旗此時已經下定決心,要將學術這條“不歸路”走下去。
因為博士後的申請同時需要未來博士後導師的推薦信,Karplus給力的推薦信,幫助周耀旗一舉拿下了上述的兩筆經費。周耀旗也順利在1995年9月,正式開始了自己的第三個博士後。也正是從這一年,周耀旗開始了計算生物領域近三十年的研究歷程。
周耀旗與Marcy(左)和Martin Karplus夫婦
入組後,周耀旗得知Karplus有兩個組,一個在哈佛,一個在法國。海投簡歷的那一年,Karplus一直待在法國,傳説是更方便與提名諾貝爾獎的歐洲科學家打交道,而真正的原因是Karplus本人十分痴迷法國美食。
由此周耀旗被同事告知,“平常是見不到Karplus的。”但沒想到,周耀旗剛進組,Karplus經常詢問他的進展,比前幾個老闆還盯得緊。
周耀旗利用他的理論優勢寫了一篇《關於鹽對蛋白質滴定和結合相互作用的影響》的文章,Karplus看後,鼓勵周耀旗繼續做下去。
這是來自Karplus的第一次肯定,周耀旗自然十分重視,但他依然決定換個方向,改做計算機模擬,畢竟Karplus以蛋白質計算模擬成名的。
在此之前,周耀旗也曾與師姐Hall做過高分子理論研究,畢竟是在簡單液體理論之外的初次嘗試。當與計算生物背景的Karplus聯手,周耀旗嘗試使用計算機做蛋白質簡單模型的動力學模擬。
他把Hall那裏學來的方勢阱液體模擬的程序進行了改進,增加了幽靈粒子,準確模擬出了單鏈均聚物在不同温度下的熱力學性能。這讓周耀旗在分子動力學中的有了一個重要發現:單鏈在超過32個單體後,就開始在低温下有單分子液體到固體的相變,而且是有能量大幅度地接近一級相變的變化。
周耀旗將其稱之為“Surface-Molten Solid——表面融化的固體”。直到現在,周耀旗仍然覺得這是生物高分子中一個重要的概念,“相當於一個物質的兩態在同一個體系裏體現出來了”。
Karplus看到這個結果也很驚訝,兩人合寫了第一篇論文,發表在了影響因子8+的Physical Review Letters期刊(物理領域最頂級期刊)上。
與此同時,周耀旗把這個一級相變,和同樣是單分子鏈的蛋白質熱力學性能聯繫起來,構造了一個新蛋白質模型,用來模擬蛋白質的可能相圖。這項工作得出了“蛋白質單分子是表面融化的固體”這個結論,論文發表在了影響因子11+的PNAS期刊(世界四大名刊之一)上。
此時,周耀旗忽然發現,自己喜歡上了生物高分子中的物理問題。他表示,“做理論物理學的人都喜歡用簡單的概念看物理問題,而生物高分子的問題也是一個物理問題。”
他抱有一個想法,或許化學物理和生物有某種契合,會碰撞出新的發現。在與Karplus的合作中,他愈發堅定走生物計算這條路。
周耀旗也很直白地講,計算生物領域要比化學物理更容易獲得經費,化學物理只能申請美國國家科學基金會(NSF)的錢,比較少,很多研究持續不了。
在哈佛的工作穩定下來後,周耀旗忽然心血來潮,想去拜訪一下隔壁MIT拒絕過他的MIT教授Jonathan Harris。當週耀旗在網上搜索這位教授的近況時,他大吃一驚,這位教授居然在有錢、有論文的情況下,沒拿到終身教授的位子。1995年,在周耀旗到哈佛前夕,就徹底離開了學術界。
想當初,周耀旗因被拒無奈下去了北卡,過渡一年才去往了哈佛,最終找到喜歡的方向。此時的他,頗有一種“塞翁失馬,焉知禍福”的感覺。
轉眼到了1997年,三年多的博士後,周耀旗發表了10多篇論文,打算憑藉這些成果找教職。
但挫敗又一次來臨。他接連投了三年簡歷,直到1999年,才憑藉一篇Nature論文拿到布法羅大學的助理教授職位。
“決不誇張地説,凡是聽説過的有位置的學校,我都申請過。每年寄求職信的郵資就幾百塊美元。”
在這期間,周耀旗的第一個女兒出生,找到一份工作變得更加迫切,周耀旗第一次感受到,該養家餬口了。
1998年,他決定從非連續分子模型模擬蛋白的研究中跳出來,主動向Karplus老闆要來了分子力學模擬蛋白質分子動力學方面的題目。
接下來的一年時間裏,周耀旗一邊投簡歷一邊做科研,先後有三篇文章送審Nature。但結果都是被拒,最後一篇是Karplus親自打電話給編輯,指出審稿人自相矛盾,才成功把文章救活。
周耀旗坦言,“如果沒有Karplus的名聲,這種起死回生的事是不可能的。”
這篇論文也對結束周耀旗的多年博士後生涯起到了決定性的作用。1999年9月底,周耀旗的這篇Nature終於刊載,並在接下來獲取的六個大學教職機會里面,選擇了啓動經費最高的紐約州立大學布法羅分校,成為該校醫學院生理和生物物理系的助理教授。
回顧在美國找教職的那些日子,周耀旗稱,用一個字來描述的話,就是“累”——看不到前景的累,沒有希望的累。但熬過來之後,又覺得是一種磨練,刻骨銘心的磨,浴火重生的練。
這時候的他,也帶着新的人生理解,走入了新世紀。
從0到1的原創科研,二十年終現天光從周耀旗新世紀的研究裏,能看到他着力點的轉向。在此之前,他博士期間研究的是凝聚態物理和統計力學,博士後轉向了計算生物學的分子動力學和蛋白質摺疊。此時,在他獨立做教授後,又將結構生物信息學作為了研究主線。到了布法羅之後,周耀旗的精力分成了兩股,一邊做科研找經費、一邊利用餘下的時間招聘博士後。
周耀旗一家人,在布法羅附近的尼加拉瓜瀑布
他延續了博士後期間的貝類血紅蛋白項目,並以此寫下了布法羅的第一筆NIH基金申請書。
為了第一筆經費,周耀旗付出了很多心血,先從在MIT化學系做助理教授的Bruce Tidor師兄那裏要到了一份成功的申請樣本,用三個月的時間寫作、完善細節,完稿後又到處徵求意見。
他憋足了一口氣,拼命工作,每天回到家就像癱了一樣。博士後期間受到的Karplus一直摳細節,強調數據重要性的訓練,為寫出一份上佳的申請書發揮了極大作用。系裏的老教授和同事,都對他的申請書作出了極高評價。
然而,自從2000年6月提交申請後,直到第三個月才有了結果——沒進前50%,連評分也沒有。
周耀旗一點心理準備也沒有,這個結果對他就是一種晴天霹靂。
“反差太大了!我辛苦那麼長時間、業內朋友的評語那麼好,得到的卻是最差的結果。”
又經過了一個月的修改,周耀旗重新提交了修改版本,並轉投了NSF。過了半年,申請書退了回來。這樣來來回回一共退了兩次,每次都是舊問題解決了,新的審閲人又有了其他意見。
2003年,周耀旗徹底絕望了,他不可能打中一直在動的目標。
與此同時,和周耀旗同期入職的三個同事,都在兩年內拿到了第一筆NIH經費。系主任也多次提醒,“如果還拿不到經費,你必定不能通過2005年的終身教授考核。”
那兩年裏,周耀旗屢敗屢戰。但當他回到家與妻子聊起時,再也控制不住自己情緒,第一次當着妻子的面掉了眼淚。周耀旗感覺身體素質明顯下降,拿不到經費成了他心中的鬱結。好在妻子一直支持他,周耀旗終於明白,拿經費和終身教授教職是一場持久戰,心急不得。
終於,在多個項目同時不斷的申請中,2003年的2月,周耀旗憑藉“基於結構的蛋白質摺疊機制預測”,拿到了在布法羅的第一筆75萬美金的NIH經費。
周耀旗總結,這次的成功是他延續了之前的Nature研究,做出了把簡單蛋白質模型發展成全原子模型的創新。他也終於看清了, NIH和NSF對貝類血紅蛋白體系沒有興趣,才是第一個申請失敗的根本原因。
只過了一個月,周耀旗憑藉“統計勢函數的發展和應用”又拿下第二筆60萬美金的NIH經費。系主任馬上決定啓動並在2004年提前通過了他的終身副教授審核。
周耀旗明白,用自己的數理知識去衝擊新方向,更容易產生新火花。
這也反映在他招聘博士後時,非常喜歡招一些有數理基礎的其他科研背景的人。
2000年進組的博士後周宏毅,2004年入組的以色列博士後Ofer Dor,就是因此結緣。他們分別為高能核物理和計算科學背景。周耀旗在與他們的合作中,經常碰撞出新的思路。
其中一個讓周耀旗印象深刻的成果,是他與周宏毅發展出一個基於模板的蛋白質結構預測方法--SPARKS和SP3,並一舉拿下2004年CASP(國際蛋白質結構預測比賽)基於模板預測的第一名。
這次成功給了周耀旗極大鼓舞,在和Dor的不斷改進中,使用機器學習方法預測的主鏈二級結構達到了80%的準確度(當時最高)。
在周耀旗看來,或許他可以衝擊一個更難的問題:繞過粗略的三態二級結構,直接預測連續的二面角(psi角)。
這是結構生物信息學領域一個長期存在的問題,學術上既定的習慣是避開直接預測連續的角度。
周耀旗也吃了癟,因為無法處理好角度的週期性問題,導致預測出來的誤差過大。
多次碰壁下,2006年,Ofer回到了以色列創業,周宏毅完成博士後去Georgia Tech做專職研究員,周耀旗也離開了布法羅,以正教授的身份在印第安納大學開始了第二段教職。
周耀旗和他在印第安納的部分團隊:學生趙慧英(左一,現中山大學孫逸仙醫學院副研究員),李職秀(左二,澳大利亞昆士蘭技術大學研究員),德州學院訪問教授王吉華,博士後詹劍,楊躍東(右一)。背後就是用預測主鏈二面角構建蛋白質結構的論文招貼
雖然之前對psi角度預測不算成功,但周耀旗仍舊不死心,將這個課題交給了生物物理專業出身的博士後薛斌。
2007年,周耀旗和薛斌首次使用神經網絡預測蛋白質主鏈真實二面角,同時預測psi和phi,從而可以直接構建主鏈結構。在當時,這是世界上第一個同時預測psi和phi真實連續角度的方法,但誤差還是比較大(psi的誤差38°),僅僅發表在影響因子3左右的《蛋白質》期刊。
後來,楊躍東(現為中山大學計算機學院教授、國家超算廣州中心副總工程師)、Eshel Faraggi、詹劍(現深圳灣實驗室研究員)等人進組,通過團隊不斷地改進,2009年,他們成功將psi的角度誤差降到了33°。
2011年,周耀旗和團隊又有了重大發現:通過預測真實角度來建立、約束、和能量優化主鏈結構,完全不需要用蛋白質的已知結構,或者已知結構碎片來作為模塊。
周耀旗和團隊欣喜,他們多年來的工作,為蛋白質結構預測和重建,開闢了一條新路。通過不斷地改進,他們不僅證明了連續分佈的二面角可以準確預測,而且通過二面角可以直接構建準確的蛋白質結構、從而為若干年後的第一個端到端深度學習的預測方法,搭好了框架。
一場由AlphaFold掀起的革命性突破,也在此刻落下了時代的註腳。
2013年,帶着這些成果,周耀旗以正教授身份被引進澳大利亞格里菲斯大學,開始同時進行計算和實驗的研究。
周耀旗(右一),澳大利亞格里菲斯大學糖組學研究所的實驗室
周耀旗在計算方面也有了新的合作伙伴,格里菲斯大學的Kuldip Paliwal教授。Paliwal是國際著名的機器學習專家,曾第一個提出雙向循環神經網絡。在與Paliwal的合作中,周耀旗開始使用不同深度的深度學習方法,進一步改進蛋白質連續角度預測。
Kuldip Paliwal教授
經過一年的努力,2014年,在兩人合作的第一篇論文中,終於解開了困擾周耀旗八年的問題——如何解決角度的週期性。
他們將角度的直接預測,改成先預測SIN和COS,再通過計算ARCTAN來得到真實角度,從而避開了角度的週期性。
有了這個思路,周耀旗和Paliwal又用了五年時間,一點一點將psi角的誤差從33°降到30°、27°、最終降到23°,phi的誤差降到了16°。
2019年,周耀旗終於説出,“我們的二級結構的預測接近了理論的極限,準確度達到86%。”
同年,哈佛大學的Mohammed AlQuraishi研究員將周耀旗的無結構碎片結構預測的方法,全部搬到深度學習的神經網絡內,從而避開了沒有好的能量函數的這個難點。
周耀旗已經預料到,這個端到端的、從主鏈二面角到蛋白質三級結構的訓練和預測工具,將成為蛋白質結構預測中的一個重要的轉折點。
但他沒想到的是,這場生物信息學的革命來得如此之快。
2020年底,一個名為“AlphaFold 2”的AI工具席捲整個產學研領域。尤為注意的是,AlphaFold 2中的深度學習方法,明顯受到了AlQuraishi進行端到端結構預測的啓發,並創新為端到端的“支鏈二面角預測--主鏈結構構建--結構誤差反饋”的思路。
一個關鍵是,在第一步中,AlphaFold2也採用了周耀旗曾使用的避開角度週期法。
周耀旗第一次離科學革命如此之近。二十年來,他突然覺得,蛋白質的二面角預測,有了一種“被關注到”的感覺。
他説,“解決一個科研難題像是一場長跑接力賽,雖然不是最後一個到達終點的,但能成為遞送接力棒中的一員,也是一種無上的幸福。”
從世紀初到2020年,周耀旗二十年飲冰,終是窺見天光。
58歲回國,一場跨越36年的異國旅程那一切發生在周耀旗58歲之前。2021年3月,周耀旗做了一個大膽的決定,全職回國。
三十六年裏,他也不止一次地想要回來,直到他入職澳洲後,回國的機會才變得多了。
2013年,周耀旗來到妻子的故鄉山東,連續六年兼職擔任德州學院物理與電子學院的海外特聘教授。正是在這段時間裏,他看到了國內的生物技術的高速發展,以及生物學新藥在臨牀上的重大突破。他毫不猶豫地説出,這是一個生物科技製藥的時代。
此後多年,周耀旗一直尋找一個最合適的回國時機。終於,2021年3月,深圳灣實驗室的常務副主任吳雲東院士,邀請他入職了系統與物理生物學研究所。
巧合的是,在上世紀80年代,吳雲東是比周耀旗更早批參與到中美合作化學研究生項目(CGP)。
他長周耀旗六歲,同是江蘇子弟。在學術上,吳雲東堅持着“不退休”的思想,他看中了周耀旗還在不斷上升發展的趨勢,邀請周耀旗回國內,“再幹幾十年”。
回國後周耀旗開始快速招聘研究助理、博士後、助理研究員、副研究員。團隊成員從2021年7月的11個人擴充到25個人,其中不乏生物、物理、化學、人工智能計算和軟硬件等多學科背景的研究人員和工程師,現在還在繼續尋找各方面的優秀人才。
團隊在2022年元旦時留影
目前,周耀旗已和團隊確定了三個研究方向:
一是基礎研究,延續周耀旗在蛋白質/RNA結構預測上多年耕耘的專長,期望通過計算和高通量實驗的結合,在AlphaFold的成就上更上一步;
二是應用研究,利用AI、深度學習對生物、醫療大數據進行挖掘,希望設計出針對病毒和癌症的小分子藥、生物藥、納米抗體,加速新藥的發現和應用;
三是原創研發,目前正在設計製造新一代的免疫印跡成像儀和自動進化儀,目標是超越國際頂尖水平。
周耀旗稱,“這是投筆從戎,做一些能落地的事情。”
去年中秋,是周耀旗過去36年在國內過的第一個團圓節、他發了一個朋友圈,感慨國內科研環境生機勃勃,“每開一次會,出一次差,吃一次飯,微信朋友都長一圈。”
周耀旗愈發覺得,“回國的目的是圓夢,圓一個把事情做大的夢。”
此外,讓他興奮的是,回國的生活要比想象中更容易適應。當初自己還為了國內的蹲廁習慣提前練習了半年,回來才發現,國內的醫、食、住、行各方面很便利。周耀旗的學生們經常看到,老師總會揹着雙肩包,騎着一輛自行車上下班,像是一個剛畢業的同齡人。
周耀旗終於完成了一個心願,妻子在他回國大半年後也回來定居了。他笑着講,“畢竟築巢才能引鳳,安居會更樂業。”
這些年裏,因為他的工作調動,妻子和兩個女兒也經常換工作和學校,從美國轉戰各地再跟隨到澳洲。和周耀旗一樣的是,這種顛簸非但沒有讓她們覺得不適應,反而讓她們也在不同的環境裏,看到了不同的世界,沉澱出不同的人生。
妻子放棄了匯豐美國總部工作,重新考取教育碩士,改行中文老師,找到了自己最熱愛的漢語教學事業。兩個女兒則分別去了哈佛和MIT,一個成為了父親的校友,一個圓了父親的MIT夢。
周耀旗一家人在二女兒高中畢業時的合影
在人生的即將到來的60歲,周耀旗説起自己的倒黴處,時不時升高語調,眼睛笑成兩個扇形,對得失看得開闊。他總拿一句話與家人共勉,“Growing old along with me, the best is yet to be.”周耀旗將它翻譯為,好戲在後頭呢。
回頭看,如果不是32歲,轉行去做了生物計算,或許周耀旗還在研究液體統計理論。
如果不是30歲,下定決心從朋友的創業公司搬出來,或許周耀旗每天還是“稀裏糊塗做一些重複性的東西”。
如果不是21歲,大學最後一年被系裏拉去“充壯丁”考出國研究生,或許周耀旗畢生都在研究化學物理。
在周耀旗的博客裏,他幾乎把過往四十年的經歷都寫了出來,也經常在落筆後,回想“當年如果沒做那個決定,結果會不會又有點不一樣?”
三十多年的歲月裏,周耀旗的頓挫波折,總與生物信息學的跌宕起伏交織在一起。
正如在浪潮中,總會湧現出一批前仆後繼的學者。如,李明、潘毅、徐鷹、許東,他們八十年代求學海外,見證了生物信息學的從無到有,成為最早扛起學術大旗的一羣人。
新世紀前後,又有許錦波、韓敬東、彭健、唐建等一批計算、醫藥、AI背景的後輩,接過老一輩的接力棒,沿承着學科脈絡。
三十載裏,他們見證了生物信息學的大火、忽視、革新,坐過冷板凳、也站過聚光燈,但無論如何,他們推動了一個生物科技時代的到來。
這是他們人生中的三十年,也是一個時代和學科的三十年。
作者注:
1993年,中國參與人類基因組計劃,生物信息學科迎來大爆發。
在近三十年的時間裏,一大批生物、化學、物理、計算等專業的學者,前仆後繼加入到學科的產研建設,那是一個靈感迸發、情誼綿長的年代,也是一個走出質疑、迷茫的年代。
目前,雷峯網啓動《生物信息學的三十年往事》專題,將陸續推出徐鷹、潘毅、周耀旗、許東、唐建等新老學者的人物故事,記錄光輝歲月,以照後人之路。
關於生物信息學的更多故事,歡迎與本文作者吳彤交流,微信號:icedaguniang 雷峯網雷峯網