楠木軒

大數據時代,如何保證數據和隱私安全

由 濮陽南煙 發佈於 科技

10月17日~18日,由創業邦主辦,成都市科學技術局、成都市博覽局、成都市投資促進局、成都市新經濟發展委員會指導,四川天府新區成都管理委員會支持的2020DEMOCHINA創新中國總決賽暨秋季峯會在成都舉行,峯會聚焦“大健康、大消費、金融科技、企業服務、5G”五大賽道,分別設立專場DEMOSHOW和專業領域探討,希望通過聚集創新力量,開啓智慧經濟新時代的內在邏輯。

在開幕式上,鍩崴科技CEO王爽做了活動致辭,觀點如下:

1. 在數字化時代,5G、AI、雲計算等技術基礎都是數據,隱私計算的技術就是服務於數據價值的可信流動。

2. 通過鍩崴科技的操作平台,在上面搭載垂直的安全應用,可以實現數據的安全跨越的融合,打通數據價值之間的橋樑,通過隱私計算的平台實現大數據高效價值的轉化。

3. 數據時代,鍩崴科技基於大數據的隱私計算技術,助力全國打造一個非常先進的信息化標杆,基於更大的大數據加快研發速度,提高更安全的數據服務平台,旨在提供一個更高效也更安全的大數據應用。

以下為演講實錄,由創業邦整理(有刪減):

大家好,非常榮幸今天有機會在創業邦主持的會議上跟大家分享鍩崴科技在隱私計算方面的工作,什麼是隱私計算,5G、AI、雲計算他們的基礎都是數據,隱私計算解決的就是數據在交互的過程當中,如何合規的能夠更高效的更體現價值的一個扭轉,我們在做的隱私計算的技術就是服務於數據的價值的可信流動。

鍩崴科技的願景是使數據安全跨域的融合,在“可用不可見”的計算範式下,打造數據價值之間的橋樑,通過隱私計算的平台實現大數據高效價值的轉化。

我們在做隱私計算的工作已經有10餘年了,我們最早在2010年研發隱私計算在醫學大數據領域相關的應用,於2012年提交併在全球首次發表了醫療在線聯邦學習的論文,提出瞭解決隱私機密計算的基礎性框架,比Google在2016年提出的聯邦學習在移動互聯網上應用整整早了5年。鍩崴團隊曾發表過300多篇SCI的論文,作為發起人在2014年的時候創辦了全球的iDASH的隱私計算大賽,目前已經舉辦了7屆。每年大概有20個國家的一百多個Team參加我們這個比賽,比如國內的阿里、騰訊,國外的IBM、MIT等一些著名的機構都會參加。

在公司去年成立以後我們也做了很多相關的商業上的推廣,比如賦能中國醫療數據產業在隱私保護下的價值的轉換,同時也獲得了頂級風險資本數千萬的融資,並參與制定了國內外隱私計算相關的標準。鍩崴科技至今落地了50家商業計算應用的場景,跟螞蟻金服、騰訊也建立了合作。

隱私計算的本質是為數據合規使用賦能。法律法規層面上在歐洲有GDPR,美國有CCPA,很多時候使用數據不合規,造成數據的泄露,會產生嚴重的後果,比如鉅額罰款。在中國發布像2016年的網絡安全法,中國在隱私安全法正大踏步地趕上歐美,今年剛剛頒佈的數據安全法的草案和個人隱私安全保護法的草案明確規定了數據如果出現隱私泄露會產生非常嚴重的後果,如5千萬或者5%的營業額。通過隱私計算的技術使數據在使用的過程當中能夠合規的低風險地實現數據價值轉換。

我們都在講數據在進行要素化,如何實現數據要素化,這個數據重複要創造價值,傳統的數據的分享的模式的情況下,數據一旦給出去以後,數據可以進行任意的拷貝,沒有辦法分離數據的使用權、所有權和管理權,出現數據需要多方合作交流的時候就需要隱私計算這個基礎設施的解決方案來實現數據的真正的要素化的價值。

我們解決的是供需雙方的痛點,比如説數據需求方,首先是要有找到數據的訴求,很多情況下在找數據的時候查找的條件是非常敏感的,像藥廠做新藥研發的時候可能對於某些疾病的變異的點和疾病相關性想去找適應的人羣,通過隱私計算的技術可以在保護他的查詢條件的情況下,非常高效的找到相關的數據。

在找到數據以後,可以進行數據的分析,傳統上數據往往是進行一次性的買賣,通過隱私計算可以實現數據租賃的模式,可以實現多方數據虛擬的融合,合規地實現AI模型的構建,最後能夠在這個模型基礎上提取出相應的結果,也通過隱私計算的加持,保證真正的需求方程能看到相關的結果,對於數據提供方對系統進行數據的註冊,註冊後的數據只是這個註冊的數據的描述性信息,對外可見可搜索,原始數據還是留在數據源的本地,這樣可以實現按次按需進行數據價值轉換。

同時由於數據本身是沒有給出第三方的操作,所以説他們可以在任意時間進行數據的註銷,在合規的情況下完成數據的交易,而在傳統模式下需要數據的脱敏彙總。

鍩崴科技的核心底層架構可以服務不同跨域協作,包括政務、金融、醫療企業等,數據源的信息還有查詢的時候匹配的模型,以及隱私建模的過程,在查詢到相關數據以後要做數據分析的時候,通過隱私建模的平台實現多中心的跨越聯合的建模。建模完成以後,在使用過程中涉及到對模型的保護,通過隱私推理平台實現第三方AI公司在對數據方進行賦能。如何保護他們自己的這個模型的信息,通過鍩崴科技的底層平台技術來支撐數據的交易和管理平台。部署方式提供軟硬件一體機的模式、雲部署的模式、軟件包的模式,提供Saas和Paas的服務。在應用層目前可以服務於各行各業,如醫學研究,合保風控,精準營銷等等,在這些領域鍩崴的產品都有實際的落地應用。比如通過鍩崴科技的NovaVita平台,助力開展了腫瘤的分子機制的研究、腫瘤表觀遺傳學分析、腫瘤全基因組學關聯分析、腸道菌羣及腫瘤分子標誌物的鑑定。

還有服務金融聯合的風控的應用,比如説銀行它本身是有一些客户的壞賬的標籤的信息,但是他需要更廣緯度的其他的描述性信息,比如從互聯網公司拿到用户的一些行為習慣信息,通過這兩種數據源的一個多標籤的數據的合作,可以提高更廣緯度的風控或者是精準的營銷,但是傳統的模式下,互聯網公司不想把他的數據交給銀行,銀行也不能把他客户的信息交給互聯網公司,通過這個系統首先可以實現一個ID的碰撞,在碰撞的情況下找到銀行和互聯網公司重複的用户,整個這個碰撞的過程是在隱私保護的條件下進行的,雙方不用泄露對方客户的信息,可以找到相關重疊的用户,基於重疊的用户可以進行進一步的聯合的建模分析,實現用户精準的畫像。

鍩崴科技的願景是助力我國打造一個世界領先的隱私機密計算平台,基於“足不出户,可用不可見”的全新計算範式,加速數據的共享和應用落地。