数据隐私保护时代下的营销新前沿:数据围墙专题2( 二 )


从产业角度而言 , 当前市场上主要分为两种产品落地形式 , 一种为通用技术平台 , 这方面已经出现了许多知名的行业标准级别的技术框架 , 其中包括Rosetta、摩斯、MesaTEE、FATE等 , 这些都是其中的佼佼者 。 另一种形式为自有数据和生态作为依托 , 对效果进行优化 , 其中应用较广的有百度观星盘 , 面向行业的解决方案有奥维互娱的FDMP 。
1、富数科技FMPC隐私查询 , 也称隐私信息检索 , 是指查询方隐藏被查询对象关键词或客户ID信息 , 数据服务方提供匹配的查询结果却无法获知具体对应哪个查询对象 。 富数科技的FMPC开放平台以不经意传输(obliviousTransfer)作为技术基础,以本地化SDK的形式部署 , 提供了性能较高的隐私查询服务 。 2、奥维互娱FDMPDMP是实现OTT精准广告投放的基础 。 在人群画像方面 , 电视机国产五大厂商(海信、创维、康佳、TCL、长虹)在移动端数据标签的建立上有着天然的难点 。 从建模角度而言 , 通过电视机的行为序列数据建模推导出移动端标签的建模难度很高 。 而从数据条件来看 , 各厂商置换的移动端数据也有不足 , 难以支撑复杂模型的落地 。 基于这些共性的难点和需求 , 奥维互娱的FDMP(federateddatamanagementplatform)采用了FATE作为标准框架 , 通过加密对齐的方式整合了自有以及各厂商的移动端数据进行训练 , 通过横向联邦学习建立了总体标签联合模型 , 相比于传统的单侧建模 , 联邦模型在AUC和KS指标上分别有6%和10%的提升 , 极大提高了各参与方的数据能力 。 3、百度观星盘在广告营销场景中 , 百度作为广告平台提供第二方数据 , 包括广告的曝光、点击等 。 广告主则拥有安装、激活、转换等更丰富的行为数据 。 百度通过纵向联邦学习整合了平台以及广告主数据 , 提供更精准的营销支持 , 目前这个功能已经在百度观星盘产品落地并得到了非常好的转化效果 。

数据隐私保护时代下的营销新前沿:数据围墙专题2
文章图片
3
挑战及未来展望
挑战:第三方数据公司与广告主共同解决落地困难
对于第三方数据公司:从技术角度而言 , 现有技术均是在数据效率与数据可用性中寻求一定的平衡 , 没有一种技术可以完美解决市场上所有潜在的问题 , 需要场景下的定制化开发 , 这就对开发研究人员提出了极高的能力需求 。
实际落地上除了高昂的研发成本以外 , 从市场角度而言 , 由于广告主和数据参与方目前对隐私计算的整体认知较浅 , 技术提供方和各合作方要有极高的沟通成本和互信基础 。 例如在互娱FDMP的联合模型产品研发期间 , 单单是说服数据合作方提供节点的部署就已经非常困难 。
对于广告主:在第三方数据公司解决隐私计算技术和成本投入困难的前提下 , 广告主需要在数据公司帮助下进一步提高自己的数据能力 , 让隐私计算真正落地 , 具体而言有如下几个方面:(1)数据质量:以往的数据集往往存在诸多问题 , 例如人工输入错误、缺少细化信息、难以清理与编排等 。 (2)技术滞后:老旧的核心系统不能支持持续的数据共享和分析所需的数据存取方式 , 例如:实时的应用程序接口 。 (3)数据结构碎片化:企业的数据分散在不同数据库中 , 难以整合形成洞察 。 (4)缺乏数据规范性:因为数据规范的差异造成数据质量打折扣 , 数据共享无法达到深层次 。 趋势展望:技术标准化 , 与其他技术结合走向成熟 , 解决可信问题 , 建模指导精准营销一个乐观的现象是 , 隐私计算的技术创新不断涌现 , 理论突破也是稳步向前 。 场景不断增加 , 技术门槛不断下降 , 例如我们已经看到市场上出现了如SOK、Rosetta这类不需要密码学基础也可以上手使用的框架 , 同时 , 隐私计算的产品及解决方案通过行业测评与认证也在逐步发展过程中 , 例如中国信通院大数据产品能力评测、SDK信息安全认证等都能提供厂商产品与技术的直接证明 。

数据隐私保护时代下的营销新前沿:数据围墙专题2
文章图片
数据隐私保护时代下的营销新前沿:数据围墙专题2】同时 , 自2020年以来 , 我们看到隐私计算也正在和其他技术进行结合 , 去解决自己在验证性和计算能力上的缺失 , 进一步走向成熟 , 其中值得注意的发展特点为:
(1)与区块链技术的结合区块链是一个分布式可验证的记账平台 , 将隐私计算应用于区块链上 , 一定程度上增加了隐私计算结果的不可篡改性和可验证性 , 解决参与方对计算过程以及结果的信任问题 , 降低了用户的接受成本 , 这成为了包括富数科技、蚂蚁摩斯在内诸多厂商采取的技术方案 。 (2)软硬协同 , 分布式计算平台的进步硬件加速在隐私计算性能提升方面正在发挥越来越关键的作用 , 特别是一些专用芯片的使用 , 明显提升了隐私计算的性能 。 同时分布式隐私计算的逐渐应用 , 也为解决隐私计算在计算量方面的瓶颈提供了可能性 。