糖糖隐私计算技术的三大主流门派


一、隐私计算三大门派
在大数据时代中 , 海量的数据的交叉计算和人工智能的发展为各行各业提供了更好的支持 , 但这些被使用的数据往往包含用户的隐私数据 , 或企业/机构的内部数据 。 这些数据由于数据安全和隐私的考虑 , 往往是不对外开发 , 例如政府数据由于政策保密性完全不能对外公布 , 运营商、互联网公司收集到的客户数据 , 也不能透露给第三者 , 因此形成了一个个数据孤岛 , 数据之间不能互通 , 数据的价值无法体现 。 如何应用海量的数据 , 实现数据流动 , 同时能够保护数据隐私安全、防止敏感信息泄露是当前大数据应用中的重大挑战 。 隐私计算就是为了解决这些问题应运而生 。 隐私计算 , 广义上是指面向隐私保护的计算系统与技术 , 涵盖数据的生产、存储、计算、应用等信息流程全过程 。
隐私计算经过近几十年的发展 , 目前在产业互联网、人工智能、金融科技、医药保护共享数据等方面发挥重要的作用 。 目前在对数据隐私的保护方面 , 隐私计算技术的应用主要可以分为可信硬件,多方安全计算 , 联邦学习三个主要流派 。
糖糖隐私计算技术的三大主流门派
本文插图
图1 隐私计算的主要流派分类
1. 隐私计算之少林派
「少林派」:即安全多方计算技术流派 。 为什么呢?历史最悠久 , 提供大量底层的安全技术 , 其他的门派多少会用到安全多方计算的底层技术 。 多方安全计算(Secure Multi-Party Computation)是指在无可信第三方情况下 , 通过多方共同参与 , 安全地完成某种协同计算 。 即在一个分布式的网络中 , 每个参与者都各自持有秘密输入 , 希望共同完成对某个函数的计算 , 但要求每个参与者除计算结果外均不能得到其他参与实体的任何输入信息 。 也就是参与者各自完成运算的一部份 , 最后的计算结果由部分参与者掌握或公开共享 。 多方安全计算主要基于密码学的一些隐私技术 , 包括有同态加密(Homomorpgic Encryption) , 不经意传输(Oblivious Transfer) , 混淆电路(Garbled Circuit) , 秘密共享(Secret Sharing)等 。
2. 隐私计算之华山派
「华山派」:主要是基于可信硬件方面技术 , 即通过硬件技术来对数据进行隔离保护 。 通用的应用方法包括安全屋 , 可信执行计算环境等 。 安全屋主要依赖芯片制造工业和系统架构 , 山路凶险 , 易守难攻 , 对独立第三方来说 , 好处是不用深入研究算法和密码学 , 缺点是受限制较多 , 数据需要先集中后处理 。
3. 隐私计算之武当派
「武当派」:联邦学习是后起之秀 , 就像武当派从少林派得到很多启发一样 , 联邦学习结合密码学和分布式计算 , 实现了多方协作的机器学习 , 在人工智能领域开辟了新天地 。
除了以上三大门派外 , 还有差分隐私、K匿名算法、L多样性等隐私相关的技术 , 这些技术不是相互替代关系 , 而是可以相互结合 , 产生更强大的威力 。
二、隐私计算公司的分类
将隐私计算行业里比较有代表性的科技公司按三大门派在自研基础技术和集成开源应用两个维度进行分类 , 如下:
糖糖隐私计算技术的三大主流门派
本文插图
图2 隐私计算公司的分类
少林派主要是华控清交、富数科技、蚂蚁金服、数犊科技、矩阵元等 , 因为这几家都尚未开源 , 基于这些自研技术的上层集成开源应用也基本上没有出现 。 这些公司更多是直接给企业机构提供个性化的多方安全计算服务 , 解决业务实际的问题 , 很欣喜地发现少林派这几家公司完全自主研发 , 掌握多方安全计算的核心技术 。
武当派(联邦学习)主要有Google的TensorFlow Federated、微众的Fate、百度的PadleFL、富数科技Avatar , 蚂蚁Morse , 除了TensorFlow , 其他几个都算是自主知识产权 , 从联邦学习的专利所有权来看 , 大多数专利已被这几家收入囊中 。 其中TensorFlow Federated、Fate、PadleFL都是已开源项目 , 业内也有类似京东数科、平安科技等基于开源的内核搭建了上层应用平台 。