AI華人科學家張本宇解密螞蟻 “共享智慧”技術
網上搜索“張本宇”,你可以找到無數高大上的標籤,AI華人科學家中排名前十的大牛;曾就職谷歌、Facebook,後創立雲腦科技;深耕人工智慧領域20年,手握154項美國專利,在國際一流期刊及會議上發表的45篇論文已被引用超過1萬次。
螞蟻金服共享智慧實驗室首席科學家張本宇
甚至還有一張西裝革履,交叉握手於胸前,面朝鏡頭露出標準職業笑容的封面硬照。撕去標籤,離開網路,真實世界裡的張本宇,穿著隨意,就像身邊普通的程式設計師,看上去遠比78年出生的實際年齡小。
從1999年他在北大攻讀人工智慧碩士算起,正式踏上AI的征程。20年過去了,榮辱沉浮,恩怨俱散,他仍是最初那個追著資料跑的少年。
AI老兵的新戰場
我試圖讓張本宇描述下入職螞蟻金服後的高光時刻。他回憶一會,很遺憾地告訴我,沒有什麼高光時刻,但有一幕深深印在他腦海裡。
那是去年12月18日,聖誕節前一週,他從矽谷的家中出發,坐11小時飛機,抵達上海後換機場高速前往杭州,汽車駛進西溪路556號,一幢極具現代化氣息的“之”字形建築赫然出現,門口立著五個大字“螞蟻Z空間”。
很快,張本宇出現在一間名為“恆長錢莊”的辦公室,和20餘名同事一起等待CTO宣佈共享智慧事業部成立。
他回憶起上一次來杭州,專程來跟管理層對接“共享智慧”的相關事項,卻趕上上海雷暴,飛機迫降在韓國,“好事多磨”那是他驚魂未定時跳出的第一反應。
如今,他和20多張年輕朝氣的臉龐在鏡頭前微笑合影,用儀式記錄事業部成立,他又想到四個字“新的起點”。
這些新同事都是二三十歲的年輕人,他們來自人工智慧、大資料、資料技術等不同部門,Base在杭州、北京、上海的都有。他們的集合就像一次全科手術,匯聚方方面面的專家,給心肌梗塞的病人開刀,病因是資料不暢造成的血栓,“共享智慧”則成了手術刀。
什麼是共享智慧?對於這個問題,張本宇顯得非常興奮。他告訴筆者,共享智慧是一門新興的交叉學科,近些年獲得了學術界與工業界的廣泛關注。
當前,資料是極其重要的生產要素,也是各類大資料應用的基礎,資料的質量和數量也已經成為影響人工智慧模型效果最重要的因素之一。隨著AI模型能力和算力的提升,各種應用場景對各種異構、異源資料的使用效率也在飛速提升。然而,資料的廣泛使用在提升應用效果的同時也引發了公眾對於資料安全性的擔憂。這主要是歸結於資料自身的兩個很重要的特性:一個是可複製性,一個是可複用性。可複製是指,資料可以被完整的、極低成本的複製;可複用性是指,某份資料可以被多個不同領域的場景複用,也可以在相對長的一個時間軸上被複用。
所以如果不同應用之間直接共享資料,那麼可複製性和可複用性,一定會導致資料洩露的情況,也就是被留存二次使用,從而侵犯了商業利益。更為嚴重的是,如果是個人相關的資料,很多時候,資料的管理者和使用者並不是資料的所有者。一旦在資料共享的過程中,發生了資料洩露,被對方濫用,那資料的管理者不僅僅是商業利益受到侵犯,它很可能也沒有盡到資料管理的責任。從歐盟的GDPR開始,到美國CCPA,再到中國的資料安全法、網路安全法、個人資訊保護法都對這種資料管理失責和資料濫用,都有著嚴格的規範。所以各大資料方,出於保護商業利益、法律風險、輿論風險各方面考慮,都在收緊資料共享,從而形成了大資料孤島。
為了便於進一步理解,張本宇舉了個例子:有A,B,C三家企業,這三家企業各有利潤,都不想被披露出來。當行業協會找到他們,想要透過他們的資料計算出行業的平均利潤,以進一步指導行業發展。
此時,無論哪一家都不肯讓步,因為披露資料等於自亮家底,會直接反映各家的真實情況,不能讓競爭對手知道。但死抱著資料不開放,無異於把資料變成上岸票價昂貴的孤島,消亡於自由開放的資訊海洋。
而螞蟻金服提出的共享智慧,就是為解決資料協作需求與隱私洩露和資料濫用之間矛盾的技術解決方案。其目標是,在不直接共享資料的情況下,連通大資料孤島,實現多方資料可用不可得,也就是拿不走,看不見,但是用得好,讓資料這個生產要素能夠安全高效地發揮作用。
早在2016年,螞蟻金服就開始致力於共享智慧的技術研發,並一直在夯實四個基石性的研究方向,即多方安全計算、可信執行環境、差分隱私以及聯邦學習。多方安全計算和可信執行環境側重解決計算過程中的資料安全問題,差分隱私側重保護計算結果裡的隱私洩露,而聯邦學習擅長解決大資料孤島帶來的人工智慧演算法收斂性及效率問題。
張本宇強調,單獨的一個方向並不能解決多方資料可用不可得的問題,共享智慧的研究既包括推動這四個基礎方向的進步,又包括對這四個方向的融合創新,才能提供滿足不同實際需求的多種產品與服務。
目前,“共享智慧”技術已經在螞蟻金服內部及合作伙伴方的智慧信貸、智慧風控等業務領域中應用。這一次共享智慧以事業部的形式單獨成立,意味著新的號角吹響。
未來,張本宇將和他的這個團隊,在一座座資料孤島間奮力划槳,登岸建“高鐵”,連結起資料新世界。
41歲的張本宇就站在那裡,深情的目光望過去,都是自己21歲時的影子。
竹城少年初長成
1978年,張本宇出生在江西吉安,一座竹城。吉安文化發達,因而有“一門九進士”“五里三狀元”的美譽。張本宇一家就很會讀書,父母分別畢業於同濟和北大,對孩子的教育方式是散養。
幼年的張本宇,每月定期收到一筆來自父母的“購書資金”,他可以買任何他想看的書。在學習方面,張本宇不走尋常路,上語文課做英語作業,上英語課做化學作業,上化學課就看小說。他不愛刷題,崇尚高效不重複,不喜歡枯燥重複的勞動。
決定從事人工智慧相關的工作,結緣於一款名為“人工生命”的小遊戲。人工生命是一個在二維矩形世界模擬生命演化過程的遊戲,每個方格居住著一個活著的或死了的細胞,細胞的生死取決於相鄰八個方格中細胞的數量。
玩家作為這個世界的上帝,隨意設定某個方格細胞的死活,以觀察對生命的影響。在張本宇手裡,他透過編寫程式,讓這些細胞演化成一隻小鳥,沿著一定規則向前飛。
這款遊戲十分接近生命最真實的執行情況,可以看做一個以生命的運算方式執行的計算機,使用了人工智慧中的概念。這個概念讓少年張本宇著迷,在填報高考志願時,他義無反顧地選擇了北京大學的計算機專業。
1995年,張本宇如願進入北大。1999年,他在北大攻讀了人工智慧碩士,正式踏上AI的征程。
2002年,24歲的張本宇畢業後去了微軟亞洲研究院(MSRA)。在MSRA的6年裡共發表45篇論文,前三年致力於搜尋、廣告、推薦這幾個網際網路核心方向上的AI演算法,後三年參與負責大規模分散式儲存、計算與AI框架的研發。
從2008年開始,張本宇期望能將學術付諸實踐,走了普羅大眾看來“一路開掛”的事業路:在北京看完奧運會後先是跑到矽谷,就職於Google,從事搜尋廣告最佳化。
2年後,加入初具雛形的Facebook社交帝國,其大量可用於AI研究的社交資料深深吸引了他,並一路嘯聚群雄,攻城掠地,帶領團隊開發了Facebook中佔據利潤來源90%以上的資訊流廣告業務,感受一把準創業氛圍。
2013年,移動網際網路迅速崛起,Google成立新專案Google Now,試圖在手機中加入真正的智慧,張本宇又被挖回Google Now專案,負責推薦平臺與演算法。AI誕生於資料,縱觀張本宇的工作經歷,幾乎就是追著資料跑,哪裡的資料多,哪裡的資料有價值,他就去哪裡。
四年一覺創業夢
2015年,張本宇離開谷歌,毅然選擇回國創業,一手創立 “雲腦科技”,目標是建立解決大資料孤島的AI生態系統,並在通訊行業、金融科技、人才教育、能源製造四個領域展開一系列探索。遺憾的是,2018年公司沒有透過經濟形勢的考驗。
折戟沉沙的張本宇,在AI創業這條賽道上奔跑了,摔倒了,流血了,陷入了迷茫。他休息思考一段時間後,收到螞蟻金服的邀請,加入共享智慧的團隊,繼續AI的探索。
回首過去,他的創業初心和共享智慧的願景,都是解決資料孤島的難題。而螞蟻金服有大量的業務場景,這是一家科技創業公司從基因中就缺失的部分。4年的創業經歷讓他明白,純技術公司要去撬動商業場景有多麼艱難。
於是,張本宇欣然應邀,這一次他不僅有技術,還有資料和業務的同學,以及螞蟻金服的商業號召力,構建起一個互相支撐的生態。
白天,他和矽谷當地的同事,構思技術的邊界,一旦發現國際最新的技術動態,立刻鑽研拓闊知識儲備;到了晚上透過釘釘和國內的同學交流,國內的演算法團隊會反饋大量業務場景需求上來,他將迅速引入最新技術落地。
在創業時代,他把公司定位為“打造行業與人工智慧之間的橋樑”,但現在,他認為只是橋樑已經不夠了,他們要造就要造高鐵。他最想對共享智慧的同學說兩點:一是要從業務出發,讓業務為客戶創造更好的價值;二是要用技術上最合理的方法,來幫助實現第一條。
前幾天,張本宇無意中看到一則新聞,人工生命遊戲發明者,英國數學家約翰·康威,因新冠肺炎,於4 月 11日上午在普林斯頓逝世。
一時間他錯愕在螢幕前,這個引導他進入AI世界的前輩就這樣在2020年的春天悄然離去,他回憶起少年時第一次接觸到這款遊戲的心情,那隻編寫的小鳥似乎還在某個角落飛。他在iOS上專門尋找到這個遊戲,專門玩了一會,用這種方式悼念約翰·康威。
舊神已死,新神將至,人間終會迎來下一輪萬物生長,不管是技術,還是人。