拿什麼保護我們的數據安全?
圖片來源@視覺中國
文丨腦極體
數據隱私到底有多重要?
以人臉識別為例,在人臉識別技術正在廣泛應用在支付轉賬、解鎖解密、交通案件、實名登記、開户銷户、門禁考勤等場景,每一項都影響到我們的財產、健康、隱私等安全。
就在央視新聞的一則晚間欄目的報道中,記者調查發現,在某一網絡交易平台,只要花2塊錢就可以買到上千張人臉照片,5000多張人臉照片不到10塊錢,單張人臉照片不到1分錢。而這些照片都來自真人在社交網絡所分享的真實生活照和自拍照。如果再疊加上用户的身份信息,其很有可能被用到精準詐騙、洗錢、涉黑等違法犯罪中。
我們到底把多少隱私信息留在了網上,留給了多少平台,恐怕多到連自己都記不清了。而我們對於這些數據最終的去向、用途和安全性幾乎一無所知。
近年來,我國在公民的個人數據和隱私保護上已經開始了相關立法,比如《網絡安全法》《民法典》,當中都有相關個人信息保護的法律規定。而《數據安全法》《個人信息保護法》也處於向全社會公開徵求意見的過程中。
相關法律的出台更多是事後維權的保障,而個人數據和隱私信息的保護仍然要從源頭抓起,那就是各個網絡平台從技術層面來實現對數據的全面保護和監管。
與此同時,數據交易和數據流通,又成為制約我國大數據產業發展的一個重要問題。如何通過合法、合規又安全高效的手段獲得可信、高質量的數據,又成為很多科技企業和平台亟待解決的難題。
一方面是用户大量數據隱私泄露的泛濫成災,一方面是相關企業平台難以獲得有效合規的數字資源,這一矛盾使得越來越多的企業呼喚一種新的數據治理和應用方案。
至此,一種用以保護數據不外泄為前提,但又能實現數據分析和計算的隱私計算(Privacy Computing)已經正式提上日程。
“百萬富翁”難題:隱私計算的緣起“假設有兩個百萬富翁相遇,他們都想知道誰更富有,但又不願意讓對方知道自己真正擁有多少財富。那麼如何在沒有第三方參與的情況下,讓對方知道誰更有錢?”
這是2000年圖靈獎得主姚期智院士在1982年提出的“百萬富翁”假設。這個燒腦的問題涉及這樣一個矛盾,如果想比較兩人誰更富有,兩人就必須公佈自己的真實財產數據,但是兩個人又不願讓對方知道自己的財富多少。那麼,在我們看來,這幾乎是一個無解的悖論。
這一看似難解的問題就涉及到了數據的所有權和使用權問題。富翁擁有的財富就是數據的所有權,富翁將財富數據公佈就是數據的使用權。
目前,主要的互聯網平台在為你提供服務的時候,基本上是既獲得了數據的使用權,也幾乎獲得了數據的實際所有權,儘管用户保留對數據的名義所有權,但是大多數人都會將數據保留在這些平台上面,同時也很少有人會去主張平台將數據銷燬。
而面對兩位“百萬富翁”的小心思,是否有一種技術,可以使得數據的所有權和使用權分離,能夠讓富翁向這個技術平台透露財富數據,但是經過一系列加密數據的計算,最終只給出相應的結果(誰更富有)。對於互聯網平台或需要用户數據的企業來説,他們獲得的不再是原始數據的所有權,而是經過率先加密的一套數據,來為數據需求方提供服務?
理解了這一假設,就可以理解隱私計算的大概思路。
在隱私計算裏,這是一個專業的加密學問題,可以準確表述為“一組互不信任的參與方之間,在保護隱私信息以及沒有可信第三方的前提下的協同計算問題”的《安全計算協議》。提出設想的同時,姚期智院士當時也提出了自己的解決方案“多方安全計算”(MPC)。
MPC在80年代初提出的時候,只能是作為一種亟待可行性驗證的技術理論。而隨着計算機算力的不斷提高和隱私數據越來越廣泛的應用和重要性提升,MPC技術也在逐步完善發展中得以應用。
現在,隱私計算除了在MPC技術上面的進展外,也已經呈現出更多新的技術特點和解決方案。那麼,隱私計算目前的技術準備和產業應用有哪些具體進展呢?
隱私計算醖釀期:大規模應用的前夜為什麼隱私計算現在變得越來越重要呢?不僅僅是開頭我們提到的公民個人隱私數據泄露已經到了亟待治理的階段,現在數據也已經成為企業平台最重要的核心資產,企業已經有動力要對平台數據進行充分的保護和合規的使用。
我們看到,今年,我國首次將數據定性為土地、勞動力、資本、技術之外的第五大生產要素。不久前,人代會審議的《個人信息保護法草案》規定:侵害個人信息權益的違法行為,情節嚴重的,沒收違法所得,並處5000萬元以下或者上一年度營業額5%以下罰款。而5%的額度甚至超過了“最嚴數據保護”之稱的歐盟GDPR。
無論是出於數據合規合法的考慮,還是出於數據應用的考慮,企業都正在加大對數據隱私保護的力度。根據國際調研機構Gartner最新的一份戰略科技趨勢預測,隱私計算成為2021年重點深挖的9項技術之一。Gartner還預測,到2025年,將有一半的大型企業機構使用隱私計算在不受信任的環境和多方數據分析用例中處理數據。
這些新趨勢的出現,為隱私計算提出了新的要求,也將提供廣闊的產業應用需求。
從技術端來説,隱私計算現在有兩種主流解決方案,一種是採用密碼學和分佈式系統的方案,一種是採用可信硬件的方案,實現接收多方隱私數據輸入輸出。
密碼學方案目前以MPC為代表,以秘密分隔、不經意傳輸、混淆電路、同態加密等專業技術來實現,近幾年其通用性和性能正在得到顯著提升,具有實際應用的價值。可信硬件技術當前主要以可信執行環境(TEE)為主,構建一個硬件安全區域,數據僅在該安全區域內進行計算,核心是將數據信任機制仍然交給像英特爾、AMD等硬件方,因其通用性高、開發難度低,在對數據保護並不嚴苛的場景下可以發揮重要價值。
另外,在人工智能大數據應用的大背景下,“聯邦學習”也是隱私計算領域主要推廣和應用的方法。
在以人工智能、大數據應用為代表的新技術週期中,隱私計算為互聯網平台和企業提出了更高的數據治理要求,即真正要做到以用户為中心,不必依賴企業自身或第三方公司控制的數據服務器進行安全保障,讓用户真正掌握自己的數據所有權,保護數據安全和隱私要求。
在產業端,隱私計算應用場景不斷擴展。
比如在金融行業。國內隱私計算產品目前主要應用於金融行業的風控和獲客,即多家金融相關機構在不泄露客户個人信息的前提下對客户進行聯合畫像和產品推薦,在多頭借貸等場景下能有效降低違約風險。
在醫療行業,通過隱私計算技術,醫療機構與保險公司之間可以在不共享原始數據的情況下分析投保者的健康信息。在政務行業,隱私計算可以提供政府數據與電信企業、互聯網企業等社會數據融合的解決方案。在一些地方政府的相關規劃裏,隱私計算有望成為下一個應用推廣的重點。
未來,隱私計算將廣泛應用於金融、保險、醫療、物流、汽車業等眾多擁有敏感隱私數據的領域,在解決數據隱私保護問題的時候,也幫助緩解行業內的數據孤島問題,為大量AI模型的訓練和技術落地提供一種合規的解決方案。
任重而道遠,數據隱私計算的困境和出路現在,隨着社會發展進入數據要素時代,移動互聯網進入下半場和國際局勢的變化莫測,數據要素問題變得更加複雜。在隱私計算領域,公民數據安全使用的法律定位、企業內和企業間的數據的分析應用以及全球性的數據跨境交易流通,都面臨着前所未有的挑戰,在各個環節也還都存在各自的問題。
首先從隱私計算關於公民數據安全使用的法律規定上,我國的法律尚未對隱私計算是否合法做出明確規定,在現有規定中“未經被收集者同意,網絡運營者不得向他人提供個人信息”,而隱私計算的目標就是基於多方數據的計算,原則上破壞了這一要求,但同時又適用於“經過處理無法識別特定個人且不能復原”的例外條款。這些成為制約隱私計算發展的首當其衝的法律瓶頸。
其次,隱私計算在企業內應用還存在一定的難度。比如大部分企業的數據規範性和數據質量難以支撐隱私計算對於參與方數據一致性的要求。隱私計算本身的複雜性和計算效率對於企業的大規模商用提出較高要求,試錯成本高。另外,隱私計算對於真正受益的用户而言,存在一定的“黑盒”效應,人們很難理解和信任隱私計算技術,普及接受成本較高。
另外,在全球的數據跨境交易和流動上,現在更是面臨重重困境。
比如,不久前美國政府對TikTok的發難,其中一條就在指責其收集美國公民數據,嚴防其將數據存放到中國的服務器當中。歐洲的愛爾蘭也要求Facebook下令,要求其暫停向美國傳輸其歐盟用户的數據。2016年,歐盟最早頒佈了全球最嚴格的數據保護方案GDPR,規定不遵守數據隱私法規的後果會受到嚴厲的制裁和鉅額的罰款。之前谷歌就拿到了法國數據保護監管機構開出的5000萬歐元的高額罰單,最近,瑞典H&M公司因為非法監控員工隱私,被罰款3500萬歐元。
在新數據監管趨嚴和複雜國際局勢下,從事數據跨境活動的企業需要重新考慮其底層架構設計。既要避免數據的跨區域切割處置,又要避免陷入到硬件巨頭的壟斷中,採取新的隱私計算解決方案就成為一些涉及跨境業務企業的重要任務。
這些隱私計算的應用困境,亟待多方面主體的共同解決,既有全球各地區和國家政府的積極推動,特別是法律法規對隱私計算的權責界定,也要有大數據相關企業對於企業數據治理力度的持續投入。
那麼對於推動隱私計算發展的相關技術公司,現在則有一系列新的發展趨勢出現。
首先是區塊鏈技術的出現,為隱私計算提供了新的解決方案。將隱私計算應用於區塊鏈上,既一定程度上增加了隱私計算結果的不可篡改性和可驗證性,也增加了區塊鏈上數據的保密能力,目前成為諸多廠商的技術融合方向。比如一種無許可性隱私計算服務正是利用遍佈全球的TEE可信計算節點來保證隱私計算的穩定性和安全性。
其次是軟硬件協同和平台整合,正在大幅提升隱私計算的性能和便利性。使得通過平台基礎設施對隱私計算的硬件加速和能力整理,可以實現從存儲計算到建模挖掘等全方位的能力提升。
另外,隱私計算也正在向大規模分佈式計算邁進,其實現方式也更加多樣化。一些項目通過低代碼甚至零代碼開發,可以大大節省開發效率,降低隱私計算產品開發門檻。
最終我們看到,在數據越來越有價值,數據安全越來越重要的“數權時代”,隱私計算將成為用户數據安全保護和企業發揮數據價值之間,最重要的那道把關者。
隱私計算企業要在其中扮演着數據管理方和服務方的角色,但是這一角色也不再是為“兩個富翁”查驗數據的簡單角色,而是能夠為其提供全方位的數據保護,又能為其進行數據“資產”的全面運營。
可以預見,隱私計算將在未來企業間、組織間的數據治理和數據協作,以及像人工智能、新基建等新興數字產業的商業應用中發揮出舉足輕重的作用。