AI華人科學家張本宇解密螞蟻“共享智能”技術
網上搜索“張本宇”,你可以找到無數高大上的標籤,AI華人科學家中排名前十的大牛;曾就職谷歌、Facebook,後創立雲腦科技;深耕人工智能領域20年,手握154項美國專利,在國際一流期刊及會議上發表的45篇論文已被引用超過1萬次。
螞蟻金服共享智能實驗室首席科學家張本宇
甚至還有一張西裝革履,交叉握手於胸前,面朝鏡頭露出標準職業笑容的封面硬照。撕去標籤,離開網絡,真實世界裏的張本宇,穿着隨意,就像身邊普通的程序員,看上去遠比78年出生的實際年齡小。
從1999年他在北大攻讀人工智能碩士算起,正式踏上AI的征程。20年過去了,榮辱沉浮,恩怨俱散,他仍是最初那個追着數據跑的少年。
AI老兵的新戰場
我試圖讓張本宇描述下入職螞蟻金服後的高光時刻。他回憶一會,很遺憾地告訴我,沒有什麼高光時刻,但有一幕深深印在他腦海裏。
那是去年12月18日,聖誕節前一週,他從硅谷的家中出發,坐11小時飛機,抵達上海後換機場高速前往杭州,汽車駛進西溪路556號,一幢極具現代化氣息的“之”字形建築赫然出現,門口立着五個大字“螞蟻Z空間”。
很快,張本宇出現在一間名為“恆長錢莊”的辦公室,和20餘名同事一起等待CTO宣佈共享智能事業部成立。
他回憶起上一次來杭州,專程來跟管理層對接“共享智能”的相關事項,卻趕上上海雷暴,飛機迫降在韓國,“好事多磨”那是他驚魂未定時跳出的第一反應。
如今,他和20多張年輕朝氣的臉龐在鏡頭前微笑合影,用儀式記錄事業部成立,他又想到四個字“新的起點”。
這些新同事都是二三十歲的年輕人,他們來自人工智能、大數據、數據技術等不同部門,Base在杭州、北京、上海的都有。他們的集合就像一次全科手術,匯聚方方面面的專家,給心肌梗塞的病人開刀,病因是數據不暢造成的血栓,“共享智能”則成了手術刀。
什麼是共享智能?對於這個問題,張本宇顯得非常興奮。他告訴筆者,共享智能是一門新興的交叉學科,近些年獲得了學術界與工業界的廣泛關注。
當前,數據是極其重要的生產要素,也是各類大數據應用的基礎,數據的質量和數量也已經成為影響人工智能模型效果最重要的因素之一。隨着AI模型能力和算力的提升,各種應用場景對各種異構、異源數據的使用效率也在飛速提升。然而,數據的廣泛使用在提升應用效果的同時也引發了公眾對於數據安全性的擔憂。這主要是歸結於數據自身的兩個很重要的特性:一個是可複製性,一個是可複用性。可複製是指,數據可以被完整的、極低成本的拷貝;可複用性是指,某份數據可以被多個不同領域的場景複用,也可以在相對長的一個時間軸上被複用。
所以如果不同應用之間直接共享數據,那麼可複製性和可複用性,一定會導致數據泄露的情況,也就是被留存二次使用,從而侵犯了商業利益。更為嚴重的是,如果是個人相關的數據,很多時候,數據的管理者和使用者並不是數據的所有者。一旦在數據共享的過程中,發生了數據泄露,被對方濫用,那數據的管理者不僅僅是商業利益受到侵犯,它很可能也沒有盡到數據管理的責任。從歐盟的GDPR開始,到美國CCPA,再到中國的數據安全法、網絡安全法、個人信息保護法都對這種數據管理失責和數據濫用,都有着嚴格的規範。所以各大數據方,出於保護商業利益、法律風險、輿論風險各方面考慮,都在收緊數據共享,從而形成了大數據孤島。
為了便於進一步理解,張本宇舉了個例子:有A,B,C三家企業,這三家企業各有利潤,都不想被披露出來。當行業協會找到他們,想要通過他們的數據計算出行業的平均利潤,以進一步指導行業發展。
此時,無論哪一家都不肯讓步,因為披露數據等於自亮家底,會直接反映各家的真實情況,不能讓競爭對手知道。但死抱着數據不開放,無異於把數據變成上岸票價昂貴的孤島,消亡於自由開放的信息海洋。
而螞蟻金服提出的共享智能,就是為解決數據協作需求與隱私泄露和數據濫用之間矛盾的技術解決方案。其目標是,在不直接共享數據的情況下,連通大數據孤島,實現多方數據可用不可得,也就是拿不走,看不見,但是用得好,讓數據這個生產要素能夠安全高效地發揮作用。
早在2016年,螞蟻金服就開始致力於共享智能的技術研發,並一直在夯實四個基石性的研究方向,即多方安全計算、可信執行環境、差分隱私以及聯邦學習。多方安全計算和可信執行環境側重解決計算過程中的數據安全問題,差分隱私側重保護計算結果裏的隱私泄露,而聯邦學習擅長解決大數據孤島帶來的人工智能算法收斂性及效率問題。
張本宇強調,單獨的一個方向並不能解決多方數據可用不可得的問題,共享智能的研究既包括推動這四個基礎方向的進步,又包括對這四個方向的融合創新,才能提供滿足不同實際需求的多種產品與服務。
目前,“共享智能”技術已經在螞蟻金服內部及合作伙伴方的智能信貸、智能風控等業務領域中應用。這一次共享智能以事業部的形式單獨成立,意味着新的號角吹響。
未來,張本宇將和他的這個團隊,在一座座數據孤島間奮力划槳,登岸建“高鐵”,鏈接起數據新世界。
41歲的張本宇就站在那裏,深情的目光望過去,都是自己21歲時的影子。
竹城少年初長成
1978年,張本宇出生在江西吉安,一座竹城。吉安文化發達,因而有“一門九進士”“五里三狀元”的美譽。張本宇一家就很會讀書,父母分別畢業於同濟和北大,對孩子的教育方式是散養。
幼年的張本宇,每月定期收到一筆來自父母的“購書資金”,他可以買任何他想看的書。在學習方面,張本宇不走尋常路,上語文課做英語作業,上英語課做化學作業,上化學課就看小説。他不愛刷題,崇尚高效不重複,不喜歡枯燥重複的勞動。
決定從事人工智能相關的工作,結緣於一款名為“人工生命”的小遊戲。人工生命是一個在二維矩形世界模擬生命演化過程的遊戲,每個方格居住着一個活着的或死了的細胞,細胞的生死取決於相鄰八個方格中細胞的數量。
玩家作為這個世界的上帝,隨意設定某個方格細胞的死活,以觀察對生命的影響。在張本宇手裏,他通過編寫程序,讓這些細胞演化成一隻小鳥,沿着一定規則向前飛。
這款遊戲十分接近生命最真實的運行情況,可以看做一個以生命的運算方式運行的計算機,使用了人工智能中的概念。這個概念讓少年張本宇着迷,在填報高考志願時,他義無反顧地選擇了北京大學的計算機專業。
1995年,張本宇如願進入北大。1999年,他在北大攻讀了人工智能碩士,正式踏上AI的征程。
2002年,24歲的張本宇畢業後去了微軟亞洲研究院(MSRA)。在MSRA的6年裏共發表45篇論文,前三年致力於搜索、廣告、推薦這幾個互聯網核心方向上的AI算法,後三年參與負責大規模分佈式存儲、計算與AI框架的研發。
從2008年開始,張本宇期望能將學術付諸實踐,走了普羅大眾看來“一路開掛”的事業路:在北京看完奧運會後先是跑到硅谷,就職於Google,從事搜索廣告優化。
2年後,加入初具雛形的Facebook社交帝國,其大量可用於AI研究的社交數據深深吸引了他,並一路嘯聚羣雄,攻城掠地,帶領團隊開發了Facebook中佔據利潤來源90%以上的信息流廣告業務,感受一把準創業氛圍。
2013年,移動互聯網迅速崛起,Google成立新項目Google Now,試圖在手機中加入真正的智能,張本宇又被挖回Google Now項目,負責推薦平台與算法。AI誕生於數據,縱觀張本宇的工作經歷,幾乎就是追着數據跑,哪裏的數據多,哪裏的數據有價值,他就去哪裏。
四年一覺創業夢
2015年,張本宇離開谷歌,毅然選擇回國創業,一手創立 “雲腦科技”,目標是建立解決大數據孤島的AI生態系統,並在通信行業、金融科技、人才教育、能源製造四個領域展開一系列探索。遺憾的是,2018年公司沒有通過經濟形勢的考驗。
折戟沉沙的張本宇,在AI創業這條賽道上奔跑了,摔倒了,流血了,陷入了迷茫。他休息思考一段時間後,收到螞蟻金服的邀請,加入共享智能的團隊,繼續AI的探索。
回首過去,他的創業初心和共享智能的願景,都是解決數據孤島的難題。而螞蟻金服有大量的業務場景,這是一家科技創業公司從基因中就缺失的部分。4年的創業經歷讓他明白,純技術公司要去撬動商業場景有多麼艱難。
於是,張本宇欣然應邀,這一次他不僅有技術,還有數據和業務的同學,以及螞蟻金服的商業號召力,構建起一個互相支撐的生態。
白天,他和硅谷當地的同事,構思技術的邊界,一旦發現國際最新的技術動態,立刻鑽研拓闊知識儲備;到了晚上通過釘釘和國內的同學交流,國內的算法團隊會反饋大量業務場景需求上來,他將迅速引入最新技術落地。
在創業時代,他把公司定位為“打造行業與人工智能之間的橋樑”,但現在,他認為只是橋樑已經不夠了,他們要造就要造高鐵。他最想對共享智能的同學説兩點:一是要從業務出發,讓業務為客户創造更好的價值;二是要用技術上最合理的方法,來幫助實現第一條。
前幾天,張本宇無意中看到一則新聞,人工生命遊戲發明者,英國數學家約翰·康威,因新冠肺炎,於4 月 11日上午在普林斯頓逝世。
一時間他錯愕在屏幕前,這個引導他進入AI世界的前輩就這樣在2020年的春天悄然離去,他回憶起少年時第一次接觸到這款遊戲的心情,那隻編寫的小鳥似乎還在某個角落飛。他在iOS上專門尋找到這個遊戲,專門玩了一會,用這種方式悼念約翰·康威。
舊神已死,新神將至,人間終會迎來下一輪萬物生長,不管是技術,還是人。