楠木軒

從“百萬富翁問題”説起 看華控清交如何打造數據生態閉環

由 頻長志 發佈於 科技

【環球網科技報道記者鄭湘琪】“兩個百萬富翁在街上偶遇,想比較誰更富有,但出於隱私考慮,如何在不透露財產數額的情況下實現比較?”這其實是中國科學院姚期智院士、國內唯一圖靈獎獲得者在1982年提出並解決的“百萬富翁問題”,當時他給出了“多方計算”這一答案。

30多年後的今天,基於多方計算理論,華控清交自主開發並推出了一系列技術和解決方案,使多個非互信數據庫在數據相互保密的前提下進行高效數據融合計算,並以此推動數據開放共享和交易流通。

隨着數字經濟的發展,數據作為數字經濟的關鍵生產要素,其經濟屬性和價值屬性不斷受到關注和重視,逐漸成為數字經濟時代的一種新型資產。近日,記者專訪了華控清交董事長、CEO張旭東,和他聊了聊華控清交的新數據觀。

明文數據體系下的數據孤島:數據難以有效跑起來

在張旭東看來,數字經濟時代下,數據對於經濟行為的優化、效率的提高,起到重要作用。而數據價值的實現是靠流通來驅動的,因此,數據在越來越多的行業場景下需要共享和流通。

但在明文數據體系下,數據流通的安全性卻難以得到保證。“明文數據,顧名思義就是‘看得見的數據’。數據一旦被人或者機器‘看見’,就可以被無限複製,而且這種複製的邊際成本幾乎為0,能實現大規模快速的傳播。在這一過程中,數據所有方對於數據的用途和用量是很難進行控制的。明文數據的流通容易導致數據的濫用”

另一方面,從信息學角度來看,數據的價值恰恰在於其所承載信息的不對稱性,其價值和它承載信息的稀缺性成正比。“如果大家均能獲取到某些數據,那麼它的價值也就喪失了。所以明文數據的傳遞和流通過程恰恰是它價值滅失的過程。”張旭東告訴記者。

出於對這些問題的擔憂,很大部分行業場景的數據便“不能流通、不敢流通”,從而造成了“數據孤島”,使得數據難以有效“跑起來”。

數據可用不可見,用途可控可計量

“數據被‘看見’就有安全隱患,那能不能做到看不見,但又可以用呢?”張旭東提出這一問題。事實上,問題的答案是肯定的,而一個重要解決途徑便是本文開頭談到的,可以“幫助兩位富翁比較財富”的多方計算。

記者瞭解到,根據姚期智的這一理論,凡是可以在數據明文上進行的計算,理論上都可以在數據密文上直接進行計算並得出與明文計算完全一致的密文結果。而其突出特徵就是數據在整個計算過程中無須解密,所以無法被“看見”。

把數據所有者和使用者代入到兩位富翁的情景,憑藉多方計算技術,數據流通的安全性也就得到了保障。張旭東表示,“以多方計算理論為基礎,華控清交首席科學家徐葳教授帶着清華‘姚班’的學生們從2014年開始進行研究,從‘0’到‘1’,實現了‘數據可用不可見,用途可控可計量’。”

在張旭東看來,數據流通的主體不是數據本身,而是數據的特定使用價值。他進而説道:“數據的流通並不是其特定使用價值的直接傳遞和轉手,而是一個通過對數據資源進行配置和整合,通過算力和帶寬加工,把計算結果交給結果獲得方的過程。”

基於此,運用多方計算技術可以把數據可見的具體信息和不用看見就可進行計算的使用價值區分開來,從而把數據的使用權從數據的所有權中獨立出來。

具體而言,華控清交研發團隊通過多方計算技術使多個非互信數據庫在數據相互保密的前提下進行高效數據融合計算,做到既分享數據,又保證被分享的數據不流失(數據可用不可見),且可以利用計算合約精確控制數據的具體用途和用量(用途可控可計量)。

“控制到什麼顆粒度?細到一個具體的算法當中一個具體的基礎運算符號。因此,規定了具體的用途和用量,也就從根本上解決了數據的濫用問題。”張旭東説道。

以生活中常見的場景為例,“數據流通並不是像在菜市場賣菜一樣,直接把西紅柿、雞蛋擺出來出售;而是更像在餐廳裏,售賣已經做好的‘西紅柿炒雞蛋’。這就避免了買家把西紅柿和雞蛋帶回家孵出小雞,種出西紅柿;這就相當於通過密文計算避免了信息的暴露、複製和濫用。”      

促進應用:降低計算成本,降低技術門檻

值得一提的是,張旭東指出,華控清交的多方計算技術不僅有利於解決數據的濫用問題,同時可以幫助使用方控制計算成本。“密文數據的計算成本(主要是包括電力成本和時間成本)往往遠高於明文數據,華控清交研發團隊便通過對密碼學、安全協議、分佈式計算、系統、數據庫、算法、編譯、芯片等的全方位優化,極大幅度地提高“可用不可見”的計算效率,有效地控制數據融合與流通的計算成本。”

同時,為降低技術應用的門檻,華控清交的研發團隊研發了一套整合了多方計算技術、其他密碼學技術和自創的明密文混合計算技術的應用開發平台體系,把底層的芯片、指令集,和上層的密文計算容器、密碼協議、安全協議,和再上層的算法、函數庫、編程語言解釋器和接口等一層層地解耦。“這樣的話,即使用户不懂密碼學、安全協議、編譯、算法,也不瞭解分佈式計算,但只要會 Python,SQL和Java等基礎編程語言,就可以像在明文環境中一樣開發應用,去開發‘可用不可見和可控可計量’的數據融合與流通應用。”

據張旭東介紹,現階段華控清交的多方計算技術已在不同場景得到應用。在金融領域,比如進行個人合格投資者認證時,華控清交技術可實現在保護申請者數據隱私的前提下,融合各機構客户金融資產、收入流水等數據,自動計算投資者的金融資產或收入狀況信息,實現高效合規的個人合格投資者認證;在政務領域,華控清交解決方案通過促進公共數據的開放共享,使數據資源更好地為實體經濟服務。

張旭東認為,醫療健康領域也是一個極有潛力,又富有挑戰的行業,華控清交也正在進入該領域。

推進基礎設施建設,形成數據生態閉環

為進一步打破數據壁壘,連接數據孤島,並形成有效的數據生態閉環,華控清交還在積極推進國家數據流通網的建設。據張旭東介紹,北京國際大數據交易所(北數所)就是未來國家流通網上的一個重要節點。

記者瞭解到,今年3月31日,北數所正式成立。作為中國首家基於“數據可用不可見,用途可控可計量”新型交易範式的數據交易所,北數所定位於打造國內領先的數據交易基礎設施和國際重要的數據跨境流通樞紐。而華控清交正是北數所的發起股東之一和主要技術提供方。

縱觀多方計算技術的發展歷程,張旭東坦言,“1982年該理論提出時,一沒數據,二沒應用,三沒算力,姚期智院士解決了一個密碼學問題題。隨着摩爾定律和其他計算機科技的發展,再加上科學家們和‘姚班’孩子們們對多種學科和技術進行交叉與綜合,在過去幾年間,多方計算終於步入了實用階段。”

對於華控清交來説,從將多方計算理論產業化開始,再到現在推進數據流通基礎設施的建設,每一步都是基於上一步取得的成果,不斷產生新的想法,進行新的嘗試。正如張旭東所説,“創新都是跟隨着意識的突破、認知的突破,在老的數據框架裏是很難做出這些新東西,所以我們提出了對於數據流通的‘新數據觀’。”

中國國家信息中心主任劉宇南曾指出,到2025年,中國數據總量預計將躍居世界第一,全球佔比有望達到27%以上。

“在未來的數據智能時代,華控清交將不斷優化和發展新數據觀,推進數據流通基礎設施的建設。我們不僅提供技術,還要把理念、設想、和組織與執行能力有效地結合起來。”張旭東這樣説道。