安全|浙江大学求是讲席教授任奎:隐私计算的前沿进展( 三 )
文章插图
阿里巴巴也在 Datatrust隐私增强计算平台中部署落地差分隐私保护的联邦学习决策树训练。
差分隐私之所以受到关注,主要是它有严谨的理论模型,提供了可验证的量化隐私保护机制;提供了传统密码学无法提供的隐私保护手段,具有更轻量级的计算负载,提高了隐私保护效率。
但也存在理论和应用上的挑战。例如在理论层面,数据可用性较差:差分隐私在查询结果中加入随机化,导致数据可用性下降;数据类型有限:缺乏针对复杂数据类型的有效差分隐私保护方法。
在应用层面,差分隐私不适用于单一样本的确切信息查询;复杂应用场景下差分隐私得到的结果误差较大;并且,目前还缺乏测试算法(乃至自动测试算法)是否符合差分隐私的方法。
文章插图
如今,学术界针对差分隐私的机制优化有了一些进展。例如上图所示的最优机制设计、机制后处理、最优机制搜寻等工作。
文章插图
相应地,Shuffle机制、Subsample机制的提出增添了差分隐私放大机制的研究。
针对应用难题,学界也提出了差分隐私正确性测试方法,包括多轮采样与概率论技巧相结合的方法、程序分析的方法等等。
文章插图
根据是否脱离生产环境,数据脱敏可以分为动态数据脱敏和静态数据脱敏。前者对敏感数据的查询和调用结果进行实时脱敏。在访问敏感数据的同时实时进行脱敏处理,可以为不同角色、不同权限、不同数据类型执行不同的脱敏方案,从而确保可用而安全。
后者(静态数据脱敏)是指数据脱敏后分发至测试、开发、数据分析等场景。是数据的“搬移并仿真替换”。将数据脱敏处理后,下发给下游环节取用和读写。脱敏后数据与生产环境相隔离,满足业务需求的同时保障生产数据库的安全。
文章插图
如上图所示,数据脱敏有很多方式。例如数据一致性脱敏、遮蔽脱敏、保持数据格式脱敏、泛化脱敏、保持数据特征脱敏等等。
作为数据安全防护工作的重要一环,数据脱敏技术和产品已作为常规手段,而敏感信息依赖于实际业务场景和安全维度,识别和梳理具体业务场景的敏感字段迫在眉睫。同时,目前市场上的数据脱敏供给商可分为信息安全服务服务商、自研自用企业以及通用数据脱敏工具开发商三类。但在全球范围内尚未形成脱敏的具体标准。
文章插图
目前,浙江大学与阿里巴巴合作开发了DMS数据管理系统,包含了40万个实例、400万数据库、10亿张表,能够实现根据敏感数据自动分级分类、异常访问风险识别等等功能。
文章插图
数据脱敏的应用非常广泛,但也存在一些难点。例如如何确定数据脱敏的目标字段?当前选择脱敏数据目标字段主要依赖于人工标记,在准确性、安全性和高效性上仍有较大缺陷 。
如何保证数据脱敏过程的安全性? 当前主流算法的脱敏过程仍不完善,有泄露和被取击的风险。
如何评判数据脱敏结果的脱敏程度?目前市场上有许多种类的脱敏工具和算法技术,但是没有一种统一的标准来量化和衡量脱敏结果的好坏。
总结一下,数据市场依托隐私计算打破数据孤岛非常重要。从数据脱敏、数据溯源到数据融合,再到数据确权、数据定价,隐私计算已经发展出了非常有潜力的技术,它在未来数据要素化资产市场配置过程中也会起到底座作用。
综上所述,随着数据安全监管与合规要求的日益严格,隐私计算技术所面临的机遇与挑战、困难与希望并存,是未来迎接数字化转型的重要安全问题之一。
- 加州大学|马斯克脑机接口公司被指虐猴,参加实验的23只猴子死了15只
- 网络安全|新版网络安全审查办法明日施行
- 三星|三星官网曝光了! Galaxy A系列中端新机将获5年安全更新
- 云安全|营销大王马斯克干的好事!0广告投入的特斯拉,市值突破万亿美元
- 网络安全|历时2年多打磨!Redmi K50电竞版拍照出色
- 信长城|专注物联网安全,「信长城」完成千万元级B++轮融资
- iPhone|iphone终于能够在戴口罩的情况下解锁了,但安全性是否有所降低?
- ios15|苹果火速推出iOS15.3.1正式版,又发现安全漏洞,建议全部更新
- ios15|苹果发布iOS 15.3.1系统,修复安全和无障碍功能
- 数据库|大学时用的U盘早过时了,2022该换新了!优盘良心推荐不含广告