楠木軒

從“百萬富翁問題”說起 看華控清交如何打造資料生態閉環

由 頻長志 釋出於 科技

【環球網科技報道記者鄭湘琪】“兩個百萬富翁在街上偶遇,想比較誰更富有,但出於隱私考慮,如何在不透露財產數額的情況下實現比較?”這其實是中國科學院姚期智院士、國內唯一圖靈獎獲得者在1982年提出並解決的“百萬富翁問題”,當時他給出了“多方計算”這一答案。

30多年後的今天,基於多方計算理論,華控清交自主開發並推出了一系列技術和解決方案,使多個非互信資料庫在資料相互保密的前提下進行高效資料融合計算,並以此推動資料開放共享和交易流通。

隨著數字經濟的發展,資料作為數字經濟的關鍵生產要素,其經濟屬性和價值屬性不斷受到關注和重視,逐漸成為數字經濟時代的一種新型資產。近日,記者專訪了華控清交董事長、CEO張旭東,和他聊了聊華控清交的新資料觀。

明文資料體系下的資料孤島:資料難以有效跑起來

在張旭東看來,數字經濟時代下,資料對於經濟行為的最佳化、效率的提高,起到重要作用。而資料價值的實現是靠流通來驅動的,因此,資料在越來越多的行業場景下需要共享和流通。

但在明文資料體系下,資料流通的安全性卻難以得到保證。“明文資料,顧名思義就是‘看得見的資料’。資料一旦被人或者機器‘看見’,就可以被無限複製,而且這種複製的邊際成本幾乎為0,能實現大規模快速的傳播。在這一過程中,資料所有方對於資料的用途和用量是很難進行控制的。明文資料的流通容易導致資料的濫用”

另一方面,從資訊學角度來看,資料的價值恰恰在於其所承載資訊的不對稱性,其價值和它承載資訊的稀缺性成正比。“如果大家均能獲取到某些資料,那麼它的價值也就喪失了。所以明文資料的傳遞和流透過程恰恰是它價值滅失的過程。”張旭東告訴記者。

出於對這些問題的擔憂,很大部分行業場景的資料便“不能流通、不敢流通”,從而造成了“資料孤島”,使得資料難以有效“跑起來”。

資料可用不可見,用途可控可計量

“資料被‘看見’就有安全隱患,那能不能做到看不見,但又可以用呢?”張旭東提出這一問題。事實上,問題的答案是肯定的,而一個重要解決途徑便是本文開頭談到的,可以“幫助兩位富翁比較財富”的多方計算。

記者瞭解到,根據姚期智的這一理論,凡是可以在資料明文上進行的計算,理論上都可以在資料密文上直接進行計算並得出與明文計算完全一致的密文結果。而其突出特徵就是資料在整個計算過程中無須解密,所以無法被“看見”。

把資料所有者和使用者代入到兩位富翁的情景,憑藉多方計算技術,資料流通的安全性也就得到了保障。張旭東表示,“以多方計算理論為基礎,華控清交首席科學家徐葳教授帶著清華‘姚班’的學生們從2014年開始進行研究,從‘0’到‘1’,實現了‘資料可用不可見,用途可控可計量’。”

在張旭東看來,資料流通的主體不是資料本身,而是資料的特定使用價值。他進而說道:“資料的流通並不是其特定使用價值的直接傳遞和轉手,而是一個透過對資料資源進行配置和整合,透過算力和頻寬加工,把計算結果交給結果獲得方的過程。”

基於此,運用多方計算技術可以把資料可見的具體資訊和不用看見就可進行計算的使用價值區分開來,從而把資料的使用權從資料的所有權中獨立出來。

具體而言,華控清交研發團隊透過多方計算技術使多個非互信資料庫在資料相互保密的前提下進行高效資料融合計算,做到既分享資料,又保證被分享的資料不流失(資料可用不可見),且可以利用計算合約精確控制資料的具體用途和用量(用途可控可計量)。

“控制到什麼顆粒度?細到一個具體的演算法當中一個具體的基礎運算子號。因此,規定了具體的用途和用量,也就從根本上解決了資料的濫用問題。”張旭東說道。

以生活中常見的場景為例,“資料流通並不是像在菜市場賣菜一樣,直接把西紅柿、雞蛋擺出來出售;而是更像在餐廳裡,售賣已經做好的‘西紅柿炒雞蛋’。這就避免了買家把西紅柿和雞蛋帶回家孵出小雞,種出西紅柿;這就相當於透過密文計算避免了資訊的暴露、複製和濫用。”      

促進應用:降低計算成本,降低技術門檻

值得一提的是,張旭東指出,華控清交的多方計算技術不僅有利於解決資料的濫用問題,同時可以幫助使用方控制計算成本。“密文資料的計算成本(主要是包括電力成本和時間成本)往往遠高於明文資料,華控清交研發團隊便透過對密碼學、安全協議、分散式計算、系統、資料庫、演算法、編譯、晶片等的全方位最佳化,極大幅度地提高“可用不可見”的計算效率,有效地控制資料融合與流通的計算成本。”

同時,為降低技術應用的門檻,華控清交的研發團隊研發了一套整合了多方計算技術、其他密碼學技術和自創的明密文混合計算技術的應用開發平臺體系,把底層的晶片、指令集,和上層的密文計算容器、密碼協議、安全協議,和再上層的演算法、函式庫、程式語言直譯器和介面等一層層地解耦。“這樣的話,即使使用者不懂密碼學、安全協議、編譯、演算法,也不瞭解分散式計算,但只要會 Python,SQL和Java等基礎程式語言,就可以像在明文環境中一樣開發應用,去開發‘可用不可見和可控可計量’的資料融合與流通應用。”

據張旭東介紹,現階段華控清交的多方計算技術已在不同場景得到應用。在金融領域,比如進行個人合格投資者認證時,華控清交技術可實現在保護申請者資料隱私的前提下,融合各機構客戶金融資產、收入流水等資料,自動計算投資者的金融資產或收入狀況資訊,實現高效合規的個人合格投資者認證;在政務領域,華控清交解決方案透過促進公共資料的開放共享,使資料資源更好地為實體經濟服務。

張旭東認為,醫療健康領域也是一個極有潛力,又富有挑戰的行業,華控清交也正在進入該領域。

推進基礎設施建設,形成資料生態閉環

為進一步打破資料壁壘,連線資料孤島,並形成有效的資料生態閉環,華控清交還在積極推進國家資料流通網的建設。據張旭東介紹,北京國際大資料交易所(北數所)就是未來國家流通網上的一個重要節點。

記者瞭解到,今年3月31日,北數所正式成立。作為中國首家基於“資料可用不可見,用途可控可計量”新型交易正規化的資料交易所,北數所定位於打造國內領先的資料交易基礎設施和國際重要的資料跨境流通樞紐。而華控清交正是北數所的發起股東之一和主要技術提供方。

縱觀多方計算技術的發展歷程,張旭東坦言,“1982年該理論提出時,一沒資料,二沒應用,三沒算力,姚期智院士解決了一個密碼學問題題。隨著摩爾定律和其他計算機科技的發展,再加上科學家們和‘姚班’孩子們們對多種學科和技術進行交叉與綜合,在過去幾年間,多方計算終於步入了實用階段。”

對於華控清交來說,從將多方計算理論產業化開始,再到現在推進資料流通基礎設施的建設,每一步都是基於上一步取得的成果,不斷產生新的想法,進行新的嘗試。正如張旭東所說,“創新都是跟隨著意識的突破、認知的突破,在老的資料框架裡是很難做出這些新東西,所以我們提出了對於資料流通的‘新資料觀’。”

中國國家資訊中心主任劉宇南曾指出,到2025年,中國資料總量預計將躍居世界第一,全球佔比有望達到27%以上。

“在未來的資料智慧時代,華控清交將不斷最佳化和發展新資料觀,推進資料流通基礎設施的建設。我們不僅提供技術,還要把理念、設想、和組織與執行能力有效地結合起來。”張旭東這樣說道。