導語:在各行各業都在談數字化轉型的當下,隱私計算從技術角度出發為跨機構之間的數據安全計算提供了可行的解決方案。基於隱私計算可以取得“數據孤島互聯”、“數據隱私保護”和“業務發展”三者間的平衡和共同發展。隱私計算能夠激活數據生產要素的合規流動與價值共享,其意義是非同尋常的。
隱私計算即 Privacy-PreservingComputation,也稱隱私保護計算,是在保護數據隱私的前提下,實現數據流通和價值挖掘的技術體系。
隱私計算是近幾年新興的事物,如何全面的理解隱私計算呢?筆者試圖從產品角度、時空角度和價值角度進行解讀,權且稱之為:隱私計算的產品觀、時空觀和價值觀。
01 隱私計算的產品觀如何從產品角度來認識隱私計算呢?
從產品定位來説,隱私計算本質上是一種工具型產品,是一種增強型的技術服務。
作為一種跨域數據融合與安全計算的工具,隱私計算承擔了“架橋修路”的責任,為數據“流動”架起了橋樑和管道。相信在不遠的將來,隱私計算將成為大數據與人工智能等領域不可或缺的基礎設施。
從目標用户的角度來看,隱私計算適是為行業客户服務的。這些行業客户一般來説都是離數據比較近、對外部數據引入的需求較旺盛,同時這些客户有大致分類兩類,一類是用隱私計算的方式來做基礎的查詢和分析的,另外一類就是做聯合建模用的。
隱私計算解決了客户的什麼問題呢?這個需要從數據源和業務需求方兩個方面來説。從數據源的角度來説,不脱敏的數據一般都不敢往外放,但是數據脱敏後的價值又會大打折扣,導致無人問津,所以數據源希望自己的數據能安安全全的賣個好價錢,而且每一次賣出後都不會帶來亂七八糟的“後遺症”。
從業務需求方來説,當然希望能借助外部的數據來解決自身業務上的一些問題,比如提升營銷的精準度或者降低賠付率等,這些指標可都是真金白銀,1%的增加或降低都可能帶來很高的營收變化。
隨着數據監管政策的嚴厲化和嚴格化,數據源在沒有拿到用户授權的情況下是不敢將涉及用户隱私的數據對外輸出的,同樣業務需求方對於來路不正的數據也不敢輕易採購。所以,安全的買賣數據或者基於數據的價值與結果是數據源和數據需求方的共同訴求。
將隱私計算做成產品時,隱私計算產品應該如何設計呢?
因為隱私計算涉及到加密算法、通信協議等,有較高的技術門檻,學習和解釋成本較高,從普適性和實用性角度來説,隱私計算產品在設計時應該將複雜隱藏起來,而最終提供給用户的是簡單易用,即所謂“複雜其內,簡單其外”。
所以,通過無代碼或低代碼的方式、可視化操作界面來突出易用性是對隱私計算產品的基本要求。
隱私計算產品的應用場景有哪些呢?
通常有三類:
- 第一是聯合查詢,即進行多方數據隱私求交與融合,對共有樣本補充標籤;
- 第二類是聯合計算,即多方隱私數據進行聯合計算,共同得到結算結果、做統計分析,支持加減乘除運算、支持統計運算和比較運算;
- 第三類就是聯合建模,即在多方數據都不出域的前提下,聯合進行機器學習和模型訓練,這就是通常所説的聯邦學習。不論是橫向聯邦、縱向聯邦還是混合聯邦,最終都是要做到“數據可用不可見、數據不動模型動”。
再來説説隱私計算的產品形態。目前,市面上比較多的是賣軟件產品,1個節點包含哪些功能,每賬户1年1個license需要付多少錢,這種情況下通常會把聯合查詢、聯合計算和聯合建模的功能都放進去,適合於賣給對隱私計算有高頻、剛需的頭部客户。
比如:持牌金融機構、電信運營商等,因為他們數據需求量大或者數據調用頻繁,面臨數據合規的嚴監管;隱私計算的另一種產品形態就是SaaS服務,適用於單次數據調用量少、數據調用頻次低的尾部客户,有這類需求的小微企業客户數量還是比較巨大的。
面向尾部客户的計費策略就比較靈活,可以按天、按周、按月等方式來收費。
02 隱私計算的時空觀首先亮出自己的觀點,之所以要從時空的角度來理解隱私計算,是為了證明隱私計算的應運而生是有其客觀規律的。
第一是全球性的個人隱私保護已成為趨勢,隱私計算的全球化已顯露端倪。通用數據保護條例(GDPR)於2018年5月生效,是歐盟對有關個人數據保護治理的更嚴格監管要求的回應。
不遵守GDPR的行為將導致嚴重的財務後果,最高可處以全球總年營業額的4%或2000萬歐元的罰款,以較高者為準。
GDPR在許多方面影響了這些新的法律框架和司法管轄區。例如,瑞士和阿根廷正在修訂其本地數據保護法律,以實施與GDPR緊密匹配的規則。
將本地隱私法律與GDPR匹配的根本原因是需要促進對本地企業的這兩項法規的遵守,並允許這些國家與歐盟之間的數據自由流通。我們還發現,尋求歐盟做出新的適當性決定的司法管轄區有所增加。
例如,歐盟和日本(這兩個地區的隱私保護方法截然不同)之間的協議允許個人數據在強大的保護保障基礎上在兩個經濟體之間自由流動。
正在實施新數據和隱私保護要求的其他區域包括:澳大利亞的《隱私修正案法》(應報告的數據泄露),印度的《個人資料保護條例草案》等等。總之,收緊個人數據、加強個人隱私保護是一種全球化的趨勢。
其次,國內隱私計算已出現南北之爭的態勢。南有微眾銀行的楊強教授,北有姚期智院士,兩位是隱私計算領域的領軍人物。
微眾銀行代表隱私計算的開源陣營FATE,華控清交代表着多方安全計算的MPC陣營。1982年在姚期智教授在《安全計算協議》(Protocols for SecureComputation)裏發表一篇文章裏提出“百萬富翁設想”,併發布了一個名為“多方安全計算”(SecureMulti-Party Computation,簡稱MPC)的理論框架。
而楊強教授則是FATE的代言人,楊強教授是微眾銀行首席人工智能官,國際人工智能學會理事長,香港科技大學教授,他是聯邦學習領域的國際領軍人物。其實,聯邦學習最早是有谷歌在2016年提出來的,後有楊強教授在中國發揚光大了。
不管是多方安全計算還是聯邦學習,最終都是為了實現跨機構之間的數據安全融合。所以,從全球化到本地化,從南方深圳到首都北京,從多方安全計算到FATE,隱私計算的不同技術流派都能解決同樣的問題。
第三,從時間維度來看,隱私計算將推動大數據與人工智能行業進入新一輪週期。權威機構Gartner在2019年技術成熟度曲線報告中首次將隱私計算(其稱為機密計算)列為處於啓動期的關鍵技術。世界經濟論壇2019年9月發佈的白皮書認為,隱私計算技術將成為釋放金融服務行業新價值的關鍵技術。
我國的隱私計算技術產業化也在近年來快速啓動。螞蟻金服、騰訊雲、百度在2019年紛紛推出了各自的MPC產品。
在大數據行業經歷過18-19年的低潮後,隱私計算為大數據行業帶來了新的希望,在隱私計算的推動下,新興的擁有隱私計算技術與能力的數據科技公司將脱穎而出,收復曾經失去的大數據市場,帶動大數據與人工智能行業進入下一輪增長的週期。
隱私計算在時間維度的另外一種理解就是,通過對數據以在線的方式進行安全計算、及時性計算,能及時應對市場的訊息萬變,用數據來輸出即時反應,為市場競爭贏得時間。
第四,數據的時空特性決定了隱私計算的時空屬性。數據作為新的生產要素,其時空特性為其賦予了流動性和外部性。數據跨越時間、跨越空間界限才能真正詮釋數據全球共享與連接的理念。隱私計算正是推動數據跨越時間和空間的有力武器。
通過隱私計算的技術,可以使得數據跨地域、跨行業、跨機構之間實現長期的、可持續性的安全融合計算。數據在時空隧道中川流不息,密文計算在虛擬世界中持續進行,現實世界與網絡世界相伴相生、攜手前行。
隱私計算與隱私泄露相生相剋,密文計算與明文計算相向而行,時間的積累產生了空間,數據、算法與算力共同生產出價值,隱私計算為增強數據在時間和空間上的流動性而生。
03 隱私計算的價值觀隱私計算的最大價值是什麼?是來自於隱私的價值、計算的價值,還是隱私計算的技術的價值?好像是,又好像都不是。以下從市場價值、應用價值等角度闡釋下隱私計算的價值。
先看看隱私計算的市場價值。根據情報和市場研究平台MarketsandMarkets最新報告中指出,2019年全球數字身份解決方案市場規模達到137億美元,2024年,該市場預計將增長至305億美元,2019-2024年預測期內的年複合增長率(CAGR)為17.3%。
再看看隱私計算的應用價值。目前多方安全計算在金融行業的主要應用場景包括普惠金融、智能風控、智能營銷、合規反洗錢和資產管理等。
比如在普惠金融方向,基於多方安全計算平台與政務數據融合,橫向打通的數據包括税務、交通出行數據、水電燃氣數據、公安數據、徵信數據等,可以賦能普惠小微金融。
筆者認為,隱私計算的最大價值在於讓數據連接更易實現。
做隱私計算就是要做跨機構之間的數據應用場景的撮合,隱私計算是潤滑劑、加速器,能讓跨機構的數據融合更易達成,隱私計算技術服務商唯一要做好的一個定位就是連接器,要成為對參與數據融合的所有機構都有好價值的橋樑和紐帶。
基於隱私計算技術,實現了數據所有權與使用權分離。數據的所有權不轉移(敏感信息仍需用户授權),而使用權做大了細分可控(對數據的採集、存儲、使用、轉讓、共享及公開披露區分管理)。
隱私計算驅動了數據價值的輸出,實現了數據可用不可見、數據不動模型動,不交易數據本身,只交易數據的計算結果。
因此,隱私計算對數據源的價值在於:可以合規的輸出更多維度、更多類型的數據價值;隱私計算對數據需求方的價值在於:可以合規的獲得更多想要的數據價值。
讓數據價值更易獲得!所以,隱私計算其實是數據連接的新進化,是一種新的數據連接形式,是打破數據壁壘的一種技術化的變通方式。
總而言之,不論從產品角度還是價值角度來看隱私計算,隱私計算都是一件了不起的事情。可以説,隱私計算是具有劃時代意義的,有了隱私計算這個強大的工具,以前做不了的事情現在都有很大可能性可以重新做起來、而且有可能做成!
也就説是大數據時代時代做不了的事情,到了隱私計算時代是很有可能可以做到的!再回頭看看,大數據時代所經歷過的種種震盪,不禁覺得豁然開朗。隱私計算將把能大數據平台、數據中台、人工智能、邊緣計算、物聯網等帶入到一個嶄新的高度!
#專欄作家#黃小剛,微信公眾號:大數據產品設計與運營,人人都是產品經理專欄作家。擁有超過10年的BI應用諮詢與解決方案實戰經驗、5年大數據產品設計與管理經驗。一個非主流的大數據應用專家,一個非著名的數據產品經理。
本文原創發佈於人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基於CC0協議