金融界网站讯 随着数据成为关键生产要素,寻求数据隐私与共享的平衡点成为行业探索新方向。联邦学习做为新兴的技术范式,能够在“数据不出本地”前提下,实现安全数据模型共建与AI协作,而成为各行各业最新研究趋势。近年来,麻省理工学院、加州大学伯克利分校、卡内基梅隆大学、清华大学、浙江大学、谷歌、微软、百度、阿里、腾讯等海内外知名研究机构与企业均进行了相关探索。
做为国内领先的智能分析决策服务商,同盾科技是较早涉足数据“可用不可见”领域探索的企业之一,并取得多重前沿性成果。同盾科技基于联邦学习提出了“知识联邦”的理论框架体系,支持从信息层、模型层、认知层和知识层四个层级进行联邦,助力数据价值安全共享。近日,同盾知识联邦白皮书重磅发布,白皮书中对知识联邦的背景、定义、平台、挑战、场景应用以及未来发展前景进行了全方位、全景式剖析,为领域探索者提供行业有价值参照。
知识联邦:实现“数据可用不可见”
联邦学习是由Google在2016年最先提出,原本用于在用户手机终端构建模型和模型迭代问题,其目的是保障数据交换时的信息安全,保护个人数据隐私,同时利用手机终端的计算能力,进行多计算结点的高效机器学习。根据联邦学习的数据分布特点,将联邦学习分为跨样本联邦、跨特征联邦和复合型联邦。
而知识联邦比联邦学习的范畴更大。联邦学习只是知识联邦的一个子集,侧重于安全的联合建模。
据同盾知识联邦白皮书介绍,知识联邦是一个国产原创、自主可控、全球引领的技术体系,该体系在解决了数据割裂和隐私保护问题的同时,可以进一步开展跨源跨域的知识发现、表示、归纳、推理和演绎,关注的是安全的、数据到知识的“全生命周期”的知识创造、管理和使用及其监管,设计目标是面向生产环境的完整知识联邦生态系统,致力于推动下一代人工智能。
知识联邦通过将数据转化成信息、模型、认知或知识,满足数据不可见,再通过联邦的方式实现数据可用。基于多方数据进行安全的知识共创、共享和推理,知识联邦打造出安全的人工智能,实现了“数据的可用不可见”。
知识联邦:开创数据安全共享技术潮流
知识联邦白皮书对知识联邦与相关技术进行了深入分析和解读。技术层面,知识联邦采用的是弱中心化的分布式方法,这与传统的强中心化和完全的去中心化有很大差别的。强中心化模式下,中心节点会聚集并保存所有参与方的数据,所有的计算和学习都是在中心节点完成,强中心化方式有数据安全隐患,隐私保护方面也很难合规。去中心化模式没有中心节点,需要所有参与方互联互通。去中心化当节点规模较大时,通信成本很高,达成共识效率低下。而弱中心化模式中原始数据是保留在本地,并且不会离开本地的,计算和学习仍然发生在本地,中心节点仅对参与方模型知识进行安全的聚集。弱中心化模式达成了效率和安全之间的平衡,是一种更切实可行的安全多方应用解决方案。这种模式尤其适合在强监管行业应用,有助于监管部门开展合规监管工作。
另外,知识联邦是一个统一的安全多方应用框架,它支持安全多方查询、安全多方计算、安全多方学习、安全多方推理等多种联邦应用,与其它技术领域,如联邦学习、区块链、隐私计算、安全多方计算等,都有着紧密的关系,其在借鉴一些相关技术的同时,也具备一定的独创性,尤其是在认知层和知识层联邦都是自主创新的。
同盾知识联邦具有两大优势:第一全样本触达。联邦后机构间的数据是分而治之,各自为数据所有者控制,每个节点上的数据相对只是小数据,但是由于可以触达更多的数据,其性能甚至会超越维度有限数据的中心化聚集方式。第二数据不动模型动。联邦后的原始数据保留在本地,计算和学习也发生在本地,中心节点仅对参与方模型知识进行安全的聚集。弱中心化模式达成了效率和安全之间的平衡,这种模式尤其适合在强监管行业应用,有助于监管部门开展合规监管工作。
知识联邦以独特优势,引流了数据安全共享的技术潮流。
知识联邦:引流数据规则和标准规范
目前,从全国来看,数据领域尚未形成一个能够统领政府所有部门的业务数据规则、数据标准和数据规范,而各家公司用不同的语言,不同的方式对这些数据自由编写,产生出来的数据参差不齐、杂乱无章,给数据共享带来诸多应用难点,例如数据异构问题、数据一致性问题、安全交换问题。基于此,行业亟需形成一套完整的联邦数据安全交换的标准,让参与方在选择使用联邦平台时有规范可依,可以不用担心数据安全和用户隐私的合规问题。标准的建立也有益于推进联邦在各行各业的应用落地。
近两年,虽然在国内外学术界和工业界,联邦学习热潮高涨,但目前市场上真正的技术成果还比较少。
行业专家表示,联邦学习首个团体标准的出台意味着联邦学习这一技术将向着更加成熟化、标准化、产业化的方向发展,将为各界共建联邦生态打下了基础,成为行业探索者实践指引,并引领数据规则和标准规范发展。
一项技术,如果没有商业落地场景,其价值也将大打折扣。值得一提的是,同盾知识联邦支持安全多方共享、安全多方计算、安全多方学习、安全多方预测、安全多方推理等多功能多场景应用,可以用于涉及到数据安全和隐私保护诸多领域。尤其是在金融、医疗或政务等行业中应用知识联邦,可以加快智慧金融、智慧医疗、智慧政务、智慧城市等领域的建设发展,赋能行业升级。
对于知识联邦的探索和成果,同盾科技人工智能研究院院长、佛罗里达大学终身教授李晓林曾表示,同盾正在致力于做一个连接器,承接连接和赋能的使命,通过AI、深度学习、强化学习和知识学习去赋能行业发展。并且同盾希望通过本次的抛砖引玉,让知识联邦技术能够得到更多机构的支持、认同和应用,建立起强有力的社区联盟,群策群力,共同推进知识联邦的发展、推广并形成行业标准。