從《知識聯邦白皮書》看同盾數據可用不可見理念落地實踐
金融界網站訊 隨着數據成為關鍵生產要素,尋求數據隱私與共享的平衡點成為行業探索新方向。聯邦學習做為新興的技術範式,能夠在“數據不出本地”前提下,實現安全數據模型共建與AI協作,而成為各行各業最新研究趨勢。近年來,麻省理工學院、加州大學伯克利分校、卡內基梅隆大學、清華大學、浙江大學、谷歌、微軟、百度、阿里、騰訊等海內外知名研究機構與企業均進行了相關探索。
做為國內領先的智能分析決策服務商,同盾科技是較早涉足數據“可用不可見”領域探索的企業之一,並取得多重前沿性成果。同盾科技基於聯邦學習提出了“知識聯邦”的理論框架體系,支持從信息層、模型層、認知層和知識層四個層級進行聯邦,助力數據價值安全共享。近日,同盾知識聯邦白皮書重磅發佈,白皮書中對知識聯邦的背景、定義、平台、挑戰、場景應用以及未來發展前景進行了全方位、全景式剖析,為領域探索者提供行業有價值參照。
知識聯邦:實現“數據可用不可見”
聯邦學習是由Google在2016年最先提出,原本用於在用户手機終端構建模型和模型迭代問題,其目的是保障數據交換時的信息安全,保護個人數據隱私,同時利用手機終端的計算能力,進行多計算結點的高效機器學習。根據聯邦學習的數據分佈特點,將聯邦學習分為跨樣本聯邦、跨特徵聯邦和複合型聯邦。
而知識聯邦比聯邦學習的範疇更大。聯邦學習只是知識聯邦的一個子集,側重於安全的聯合建模。
據同盾知識聯邦白皮書介紹,知識聯邦是一個國產原創、自主可控、全球引領的技術體系,該體系在解決了數據割裂和隱私保護問題的同時,可以進一步開展跨源跨域的知識發現、表示、歸納、推理和演繹,關注的是安全的、數據到知識的“全生命週期”的知識創造、管理和使用及其監管,設計目標是面向生產環境的完整知識聯邦生態系統,致力於推動下一代人工智能。
知識聯邦通過將數據轉化成信息、模型、認知或知識,滿足數據不可見,再通過聯邦的方式實現數據可用。基於多方數據進行安全的知識共創、共享和推理,知識聯邦打造出安全的人工智能,實現了“數據的可用不可見”。
知識聯邦:開創數據安全共享技術潮流
知識聯邦白皮書對知識聯邦與相關技術進行了深入分析和解讀。技術層面,知識聯邦採用的是弱中心化的分佈式方法,這與傳統的強中心化和完全的去中心化有很大差別的。強中心化模式下,中心節點會聚集並保存所有參與方的數據,所有的計算和學習都是在中心節點完成,強中心化方式有數據安全隱患,隱私保護方面也很難合規。去中心化模式沒有中心節點,需要所有參與方互聯互通。去中心化當節點規模較大時,通信成本很高,達成共識效率低下。而弱中心化模式中原始數據是保留在本地,並且不會離開本地的,計算和學習仍然發生在本地,中心節點僅對參與方模型知識進行安全的聚集。弱中心化模式達成了效率和安全之間的平衡,是一種更切實可行的安全多方應用解決方案。這種模式尤其適合在強監管行業應用,有助於監管部門開展合規監管工作。
另外,知識聯邦是一個統一的安全多方應用框架,它支持安全多方查詢、安全多方計算、安全多方學習、安全多方推理等多種聯邦應用,與其它技術領域,如聯邦學習、區塊鏈、隱私計算、安全多方計算等,都有着緊密的關係,其在借鑑一些相關技術的同時,也具備一定的獨創性,尤其是在認知層和知識層聯邦都是自主創新的。
同盾知識聯邦具有兩大優勢:第一全樣本觸達。聯邦後機構間的數據是分而治之,各自為數據所有者控制,每個節點上的數據相對只是小數據,但是由於可以觸達更多的數據,其性能甚至會超越維度有限數據的中心化聚集方式。第二數據不動模型動。聯邦後的原始數據保留在本地,計算和學習也發生在本地,中心節點僅對參與方模型知識進行安全的聚集。弱中心化模式達成了效率和安全之間的平衡,這種模式尤其適合在強監管行業應用,有助於監管部門開展合規監管工作。
知識聯邦以獨特優勢,引流了數據安全共享的技術潮流。
知識聯邦:引流數據規則和標準規範
目前,從全國來看,數據領域尚未形成一個能夠統領政府所有部門的業務數據規則、數據標準和數據規範,而各家公司用不同的語言,不同的方式對這些數據自由編寫,產生出來的數據參差不齊、雜亂無章,給數據共享帶來諸多應用難點,例如數據異構問題、數據一致性問題、安全交換問題。基於此,行業亟需形成一套完整的聯邦數據安全交換的標準,讓參與方在選擇使用聯邦平台時有規範可依,可以不用擔心數據安全和用户隱私的合規問題。標準的建立也有益於推進聯邦在各行各業的應用落地。
近兩年,雖然在國內外學術界和工業界,聯邦學習熱潮高漲,但目前市場上真正的技術成果還比較少。
行業專家表示,聯邦學習首個團體標準的出台意味着聯邦學習這一技術將向着更加成熟化、標準化、產業化的方向發展,將為各界共建聯邦生態打下了基礎,成為行業探索者實踐指引,並引領數據規則和標準規範發展。
一項技術,如果沒有商業落地場景,其價值也將大打折扣。值得一提的是,同盾知識聯邦支持安全多方共享、安全多方計算、安全多方學習、安全多方預測、安全多方推理等多功能多場景應用,可以用於涉及到數據安全和隱私保護諸多領域。尤其是在金融、醫療或政務等行業中應用知識聯邦,可以加快智慧金融、智慧醫療、智慧政務、智慧城市等領域的建設發展,賦能行業升級。
對於知識聯邦的探索和成果,同盾科技人工智能研究院院長、佛羅里達大學終身教授李曉林曾表示,同盾正在致力於做一個連接器,承接連接和賦能的使命,通過AI、深度學習、強化學習和知識學習去賦能行業發展。並且同盾希望通過本次的拋磚引玉,讓知識聯邦技術能夠得到更多機構的支持、認同和應用,建立起強有力的社區聯盟,羣策羣力,共同推進知識聯邦的發展、推廣並形成行業標準。