糖糖隐私计算技术的三大主流门派( 九 )
同质攻击: 如在上面的K-匿名医疗信息表中 , 第1-3条记录的敏感数据是一致的 , 因此这时候K-匿名就失效 。 观察者只要知道表中某一个用户的邮编是476*** , 年龄在20多岁 , 就可以确定他有心脏病 。
背景攻击: 如果观察者通过邮编和年龄确定用户王一在K-匿名医疗信息表的等价集3中 , 同时观察者知道王一患心脏病的可能很小 , 那么他就可以确定王一曾经骨折 。
补充数据攻击:当公开的数据有多种类型 , 如果他们的K-匿名方法不同 , 那么攻击者可以通过关联多种数据推测用户信息 。
4.3 L-多样性多样化
为了解决同质性攻击和背景知识攻击所带来的隐私泄露 , Machanavajjhala等人提出了L-多样性(l-diversity)模型 。 简单来说 , 就是在公开的数据中 , 每一个等价类里的敏感属性必须具有多样性 , 即L-多样性保证每一个等价类里 , 敏感属性至少有L个不同的取值 , 通过这样L-多样性使得攻击者最多只能以1/L的概率确认某个体的敏感信息 , 从而保证用户的隐私信息不能通过背景知识 , 同质知识等方法推断出来 。
本文插图
3-Diversity样例
如上图所示 , 在每一个等价集中 , 包含至少3个以上不同的属性值 , 那么这部分公开数据就满足3-diversity的属性 。
要实施L-多样性模型 , 除了上述的不可区分属性方式 , 通常还可以引入其他的统计方法来实现:
不可区分L-多样性(Distinction L-Diversity): 在同一个等价类中至少出现L个不同的敏感属性值 。
基于概率的L-多样性(Probabilistic L-Diversity):在一个类型中出现频率最高的值的概率不大于1/L;
基于熵的L-多样性(Entropy L-Diversity): 在一个等价类中敏感数据分布的熵至少是log(L);
递归(C,L)-多样性(Recursive (C,L)-Diversity): 通过递归的方式 , 保证等价类中最经常出现的值的出现频率不要太高 。
递归(C1, C2, L)-多样性(Recursive(C1,C2,L)-Diversity): 通过递归的方式 , 保证等价类中最经常出现的值的出现频率不要太高, 同时还保证了等价类中频率最低的敏感属性出现的频率不能太低 。
L-多样性也具有一定局限性:
敏感属性比例的严重不均衡导致L-多样性难以实现 , 例如某疾病检测报告 , 敏感属性只有“阳性”和“阴性” , 分别占比1%和99% , 阴性人群并不在乎被人知道结果 , 但阳性人群可能很敏感 。 如果在一个等价类中均为阴性 , 是没有必要实现可区分的2-Diversity 。
偏斜性攻击(Skewness Attack):如果在上面那个例子中 , 我们保证了阳性和阴性出现的概率相同 , 虽然保证了多样性 , 但是泄露隐私的可能性会变大 , 因为L-多样性并没有考虑敏感属性的总体分布 。
L-多样性没有考虑敏感属性的语义 , 而导致敏感信息的泄露 。 例如敏感属性是“工资” , 某一等价类中的取值全为2K-3K之间 , 那么观察者只要知道用户在这一等价类总就可以知道其工资处于较低水平 , 具体数值观察者并不关心 。
四、隐私计算未来发展的机会和挑战
1. 性能提升
隐私计算 , 尤其是安全多方计算和联邦学习都使用了分布式计算 , 通过密码学加密计算保证了隐私数据不泄露 , 也必然在计算性能方面产生巨大的消耗 。 随着加密计算技术的不断发展 , 联邦学习算法的优化和硬件算力的提升 , 隐私计算的性能一定会提升一个明显的台阶 , 达到商用产品化水准 。
2. 功能扩展
未来 , 隐私计算将会包含更多加密算法 , 也会结合行业适应更多的应用场景 。 目前 , 隐私计算和联邦学习技术可应用于金融、医疗、政务等行业 。 比如在金融领域 , 传统金融机构、互联网金融公司、金融科技公司通过隐私计算进行相互之间多场景的用户数据补充 , 来进行信用画像评分 , 提高用户风控能力 , 解决“联合风控”和”联合营销”问题 。 比如在医疗领域 , 患者的患病记录在不同区的不同医院可能是不同的 , 单个医院无法训练出对特定任务有良好性能的高质量模型 , 每个医院之间进行协作后 , 可以使用共有的患者数据协同训练机器学习模型 。
- IT之家|国产“天玥”计算机在沈阳成功下线:搭载麒麟操作系统
- 哈尔滨|哈工大计算学部正式揭牌:培养国之栋梁、打造国之重器
- 博科园量子计算机诞生,再连接光量子通信网络,就能实现量子互联网啦!
- 澎湃新闻|“拎走”王珞丹网寻的天价鸭,怎么计算盗窃案值?
- 澎湃新闻|“拎走”一只天价鸭,怎么计算盗窃案值?
- 快科技 14又摊事:新隐私功能遭欧洲16家广告协会反对,iOS
- 湖泊|工程师的计算失误,打歪36厘米直径钻孔,结果创造出一个咸水湖泊
- 科学黑洞|工程师的计算失误,打歪36厘米直径钻孔,结果创造出一个咸水湖泊
- 问董秘|导致无法计算铁牛2019年应补偿金额,后续需...,投资者提问:2019年报非标
- 澎湃新闻|马上评|“拎走”王珞丹网寻的天价鸭,怎么计算盗窃案值?