楠木軒

PlatON首席技術官:數據監管法規仍然落後於技術升級 | 鏈得得話事人on Chain

由 回秀蘭 發佈於 科技

區塊鏈技術作為數字化時代的信任解決方案,其去中心化的透明性和現實所需要的隱私性之間存在一定的矛盾。鏈上數據的公開可驗證意味着交易等數據都是有跡可循並且不能被篡改,而當我們在真實世界和虛擬世界進行交互時,不可避免的會留下可以從交易等信息追蹤到真實身份信息的痕跡。

存儲在鏈上的所有數據都是公開可驗證的,這限制了區塊鏈及智能合約在許多場景的應用。因此,隱私保護成為區塊鏈技術亟待解決的重要問題。

當前隱私計算面臨什麼樣的機遇和挑戰?如何應對可能的政策風險?在隱私數據的生命週期當中應當包含銷燬數據的過程。在上鍊之後,又要如何對數據進行銷燬?

4月1日,鏈得得「話事人 on Chain」活動第3期特別邀請到 PlatON 首席技術官 曲俊傑,從技術與商業角度解讀隱私計算。

  • 「話事人 on Chain」是鏈得得重磅打造,是一檔圍繞區塊鏈行業熱點事件和優質項目,與全球加密產業、區塊鏈行業以及金融產業頂級認知與垂直賽道的精英的對話節目。欄目會以⽂字、視頻、音頻的形式在鏈得得官方社羣進行直播。社羣彙集行業內部優質資源,與對話嘉賓進行討論,暢所欲言。旨在促進優質項目間的合作與交流。
以下是嘉賓的分享實錄。由鏈得得編輯後發佈:

主持人:在全球各國都開始對數據隱私進行更加嚴厲的監管的背景下,數據提供方獲取數據、保存數據成本都會極大的提高,而保障數據的更正權和被遺忘權則需要更多的人工和時間成本。對於數據的利用方來説,使用範圍、使用方式都被限制在了很小的範圍內,更不論GDPR對其提出的匿名化、加密化的成本提升。這裏就出現了一個矛盾。明文大數據分析會導致隱私泄露,大規模數據密態化又影響分析效率。這個矛盾如何解決?

曲俊傑:明文數據可以被隨意複製、存儲、傳播、利用,因為隱私泄露造成的危害可能是長遠的,在此不再贅述。

數據的隱私計算雖然有多種多樣的形式,根據不同的算法實現,理論上計算複雜度和網絡通信複雜度的增加是必然的,從而也導致了分析效率的顯著降低。針對如何在保證數據可用不可見、甚至不可離開本地等不同的保護要求的前提下,我們通過算法研究團隊的攻堅優化、工程實現團隊的深度實現優化、再加上硬件加速等諸多手段,根據不同場景選擇適配的算法,場景解耦後在不同階段適配不同算法、以及在同一階段解耦可並行計算等來達到商用的水平。

另外,從大趨勢上,網絡傳輸速度和硬件計算能力的不斷提高也有助於隱私大數據AI的商用落地。

主持人:在隱私數據的生命週期當中應當包含銷燬數據的過程。區塊鏈作為去中心化的系統,上鍊數據無法修改和刪除。那麼利用區塊鏈的隱私計算系統當中,在數據上鍊之後,如何進行銷燬?

曲俊傑:歐洲的GDPR對數據權益做了相對嚴格的定義,裏面提到了"被遺忘權"。也就是數據的徹底銷燬。GDPR也正在修訂爭議之中。

首先明確一點,PlatON的隱私計算網絡在PlatON區塊鏈之上的,只把可驗證隱私計算結果上鍊,在鏈上做自動清結算。選擇什麼數據上鍊是區塊鏈生態系統生命攸關的問題,大量隱私數據上鍊可能導致區塊鏈存儲和效率問題,同時也不是基於MPC隱私計算的選項,因為數據離開了本地。

假設我們的確需要把少量隱私保護(非MPC類)數據做鏈上存儲,區塊鏈的特質是在數學算法保護下一旦上鍊保存就不可銷燬、不可篡改,的確和"被遺忘權"是相悖的。然而仔細分析下來,"被遺忘權"的真實含義是數據的內容永遠不可見、從而" 被遺忘" ,反而只有隱私保護的數據可以做到這一點,而明文數據是無法做到的。

換句話説,只要把該隱私數據的私鑰,通過可驗證的方式保證銷燬,那麼該隱私數據可以在理論上等同於" 被遺忘" 了。

那麼,做到對" 數據進行銷燬" 的前提就是,根據數據集合的顆粒度,每個被賦予獨立的" 被遺忘權" 的數據集合有各自獨立的私鑰,數據集合在隱私保護後上鏈,以及私鑰的可驗證銷燬機制。所以剛才我也強調了可驗證的銷燬,這需要非常靈活的解決方案,我們是希望技術社區貢獻各種各樣的場景,讓我們能夠去了解這些場景、真正的理解這個需求。

主持人:基於區塊鏈的隱私計算如何適應不同的隱私數據安全場景?如何保證對不同行業和企業提供個性化的隱私計算服務?

曲俊傑:大家現在對隱私計算的概念理解還是有區別的。這方面需要充分的溝通,所以個性化是個非常現實的問題。數據的隱私計算是個突飛猛進的新興行業,就像我們自己對數據的隱私需要逐步理解到提出需要一樣,重多行業對數據隱私還停留在需求階段。我們經過多年深度研究,儲備了各類不同的隱私算法,但是不同場景、數據量不同、數據格式不同、法律法規不同,根據場景分析,適配各種算法是我們的強項。

比如我們為銀行提供的隱私計算解決方案就是充分個性化的。

主持人:那麼您認為區塊鏈在隱私計算行業中的位置是什麼?

曲俊傑:區塊鏈和隱私計算是兩個不同維度的東西。他們的基礎屬性不同,區塊鏈是為了信任,隱私計算是為了隱私。需要保護的數據是正在形成的隱私計算行業的核心。如何做到可信的數據採集、歸集、整理、存儲、計算、等等是區塊鏈可以起到核心作用的地方,

以PlatON為例,PlatON是隱私計算網絡+分佈式經濟體基礎設施。這兩者其實保持了各自的相對獨立,但目前有很多將區塊鏈理解為隱私計算是不對的。

在隱私計算方向PlatON主要鎖定在為數據進行確權和定價這個核心需求,通過隱私AI來解決目前在金融、醫療、廣告等多個領域對於數據共享和協同計算存在着的強烈需求。

所以這兩個問題實際上是相輔相成的,不能只看重隱私,卻忽視了數據權益。只有區塊鏈卻沒有隱私又會限制技術的應用範圍。

主持人:您之前也提到了個性化服務是個現實的問題。在這些領域PlatON是怎麼做的?能分享一些案例嗎?

曲俊傑:我們在個性化服務方面,往往面對的是一個嶄新的領域,我們首先要坐下來分析客户的業務,分析法律法規對數據的要求:哪些是可以公開的數據,哪些是必須保護的數據,又要保護到什麼程度。對這些問題進行徹底的分析之後數據進行結構化處理,以適配我們的算法庫。

我們與銀行合作的案例包括信用、黑白名單,這種案例中的數據都非常有特色,所以我們應用了很多密碼學的算法,對數據進行充分的解構、打包、重新組合。

另外製藥這一類生命科學相關的數據就是另外一種數據,比如説DNA數據,採取不同的算法才能夠真正商用。

主持人:隱私計算目前面臨什麼樣的機遇和挑戰?如何應對可能的政策風險?

曲俊傑:隨着各個數據生產主體,包括個人的數據權益意識的覺醒,各個權力機構也隨之推出相應的隱私保護法律法規。只是這些法律法規仍然落後於當下技術的突飛猛進。

大數據,超級AI的出現和廣泛應用,加上我們已經被大量IoT智能設備包圍,隱私侵害問題已經是全世界廣泛面臨、越來越嚴重的問題。其背後是數據權益的梳理問題。映射到數字世界,這些數據對人類的數字生命做了精準描繪,大家會發現系統比自己瞭解自己,人的行為已經在不知不覺中被算法誘導,形成共生狀態。人類及其衍生的商業活動已經不得不面臨大數據AI用户畫像算法的挑戰,這也造就了活在系統中的人(比如前些日子的快遞員悲劇),比如315發佈的數據被盜用等社會問題。

虛假數據損害信譽,盜用生物特徵、比如人臉數據可以造成的侵害可能是毀滅性的。設想一下被盜的人臉等數據沒有保護地遊離在互聯網上,被反覆複製存儲,未來一旦和超級AI結合起來,物理世界的真尊的生存主權會被嚴重侵犯。每想到這裏我是毛骨悚然的。

隱私計算技術的核心是面向數據的流動,讓數據可用而不可見,大數據和AI是天然的載體,我們提供的解決方案已經涵蓋金融、醫療、零售、互聯網、等多個行業。當下是個歷史性的機遇。

那麼PlatON是如何做的呢?PlatON的隱私計算將通過對" 數據" 的保護,保護之後產生的數據權益的保護, 隱私計算保護之下數據孤島的鏈接,促進數據的流動、從而產生價值,以及價值的合理分配機制來改良現狀,促進社會進步。 Rosetta是我們開源的隱私AI框架,敬請大家批評指正。

挑戰也是多方面的,對數據場景的把控、分析,對隱私算法的商用級優化等等。還有法律法規對隱私計算複雜度考慮不足造成的法律法規缺位和錯位。這些建議通過沙盒來實現功能的同時,教育社區並把經驗分享給法律制定者。

主持人:既然提到了監管,那麼隱私計算是一門合規化的生意嗎?更高的監管壓力是否意味着更大的市場前景?

曲俊傑:隱私計算作為嶄新的行業,我談一些個人想法。

我基本上同意監管壓力與市場前景的正比關係。隱私計算是新生數據生意的護航技術,可以説沒有隱私計算很多數據生意無法合規落地。

隨着萬物互聯、各種行為和商業活動的進一步數據化,法律法規的一步一步跟進,基於隱私AI的新的數據市場的不斷衍生,數據市場的規模將遠大於現在傳統市場的規模,前景非常廣闊。我個人非常看好。

主持人:那麼您對我國未來的數據隱私監管有什麼樣的看法?是否會在近期收緊對隱私數據的監管?

曲俊傑:隱私數據的範疇需要給出一個貼切的定義。不太好回答,個人預計近期會加強基於《民法典》的隱私數據監管。

因為數據具有極強的可複製、可加工、可攜帶等各種特質,而隱私計算技術相對複雜,應用的不好會導致商務上不可用。所以整個監管也會在" 松" 和" 緊" 之間搖擺一段時間。

強力建議建立一些不同行業的" 沙盒" ,權衡發展與監管的矛盾,從實踐裏提煉出方案。

主持人:目前市場上其實有不少團隊在做隱私計算。在技術層面,PlatON相比競品的優勢是什麼?

曲俊傑:隱私計算基於密碼學,其技術也包括很多種,如ZK(零知識證明)、MPC、HE、TEE(可信硬件)等。相比於ZK和MPC,TEE更側重於安全技術,而且對技術實現和廠商的依賴程度比較高。相比之下,信任成本更低的是依託密碼學的ZK和MPC,而其中ZK更側重於進行" 驗證式" 的計算,是計算的終點;MPC則是解決數據計算的本身,是計算發起的起點。

PlatON在MPC和ZK兩方面都有持續投入,從實際業務角度出發,現階段更多的需求是來自於受限於數據隱私而無法達成計算,那麼MPC剛好可以解決這個痛點。ZK其實也是非常關重要的隱私計算技術,通常會用於解決計算正確性問題,屬於下一階段的關鍵技術。

其實PlatON並沒有侷限於MPC或者ZK,就像創世白皮書中寫的可驗證計算或者同態加密,都屬於隱私計算的大範疇,知識。

PlatON有一個業界領先的密碼學研發團隊,彙集了包括中科院、上海交通大學、武漢大學、美國馬里蘭大學、西北大學等國內外頂尖高校的著名密碼學教授和研究學者。

同時,PlatON長期專注於密碼學和隱私計算研究,大力支持密碼學相關的學術和技術賽事活動,是密碼學領域三大頂級會議Crypto/Eurocrypt/Asiacrypt,和安全領域頂級會議ACM CCS的持續贊助商,同時還作為主要贊助商與國內頂級高校和科研機構一起連續舉辦了兩屆密碼學冬令營(Crypto Innovation School),分別針對安全多方計算和格密碼展開了主題培訓。此外,PlatON還獨立舉辦了CISC 2019 密碼學年度賽事,旨在鼓勵和推廣全球密碼學方面的創造性的密碼學技術作品。

從我們通過以太坊grants,貢獻的MPC技術可見一斑。

主持人:最近PlatON有一些大動作,能和大家説説具體情況嗎?之後的路線圖和長期規劃能否透露?

曲俊傑:是的,我們最近的大動作是主網和隱私計算網絡上線。

PlatON的長期的戰略是一直堅定不變的,從最開始最早的白皮書就一直很有定力,一直在堅持做。中期路線圖,我們有各個委員會在定期地論證,有社區工作小組的積極參與,我們從社區收集反饋,在長期戰略不變的前提下調整戰術,不斷優化。

我個人認為,區塊鏈的發展,因為開源,你總是很容易地站在巨人的肩膀上繼續往前創新,所以它的迭代速度非同一般,感覺我在這兒呆了這幾年,相當於以前在傳統金融機構幹十年。

從長遠來講,我們的密碼學團隊是非常強的,從科研到工程落地都很有經驗,所以我們會持續推出各種層次的隱私計算的協議。

而這些協議的推出,也需要社區給我們一些反饋,無論批評或者是贊同。我們將持續從這些協議裏抽象出更基礎的協議,下沉到我們的PlatON隱私計算網絡,作為一個基礎設施做出來。

PlatON強大的隱私計算能力的跨鏈輸出也在我們的設計之中。具體來講,我們將在後續不斷深化隱私金融基礎設施建設,構建隱私DeFi和隱私計算網絡(基於MPC),在主網發佈上線後,會基於Grants計劃着力推動生態建設,不斷推出基於PlatON所獨有的應用模式,不斷豐富主網生態,不斷推動商務拓展工作的開展,接入各類型的區塊鏈相關業態,加大與合作伙伴的合作規模,持續深化品牌和社區建設,強化與媒體以及社區合作伙伴的關係,持續聯合舉辦各類型市場活動,在全球範圍內提升PlatON的滲透力和影響力。圍繞隱私合約構建生態系統支持工具,初步構建數據交易市場,發佈可驗證計算以及其支持的計算算力市場等等。

我們非常希望、熱切盼望大家加入論壇,或者在是其他的各種渠道上看看我們現在的路線圖,還有社區創作的生態圖譜,瞭解我們的側重點,和發展戰略。特別希望能夠在論壇,在各種渠道看到大家。

主持人:在過去的幾年當中,區塊鏈行業的風口不斷變換。DeFi、DEX、NFT等都是行業發展的熱點。公有鏈要如何不斷適應這些新的風口和熱點?換句話説,如何避免PlatON成為一個朝生暮死的空氣項目?

曲俊傑:源自於創始團隊針對" 數據" 成為數字時代生產要素的洞見。以及堅定不移的信念。PlatON健康發展至今。並沒有跟着風口搖擺。

隱私計算領域很大、難度非常高,需要持續不斷而且堅定的投入。PlatON也一直堅持用開放的態度,引領技術社區參與共建、一起發展,解決數字化時代所衍生的問題。我們進入隱私計算領域比較早,尤其在隱私計算安全多方計算方面。我們較早做了準備並推出了隱私相關的產品,甚至是框架。

而DeFi、DEX 和 NFT等是鏈上的生態應用。PlatON對此是完全開放的,我堅信隱私計算可以賦能各類應用,並助其" 蜕變" 成更復雜高級的應用。 以往以及目前的熱點也代表了最豐富的生態。DeFi、DEX、和NFT也是最複雜的生態應用。 PlatON必須提供各類生態的生長土壤。

核心團隊和社區也在完善各類基礎設施。並通過隱私計算賦能,進階到複雜的高級應用。

【本文原發佈於鏈得得,授權鈦媒體App發佈,作者:大文】