数据通常|好书·书摘丨“随意转发”成都女孩信息,你知道这到底错在哪

近日,成都市公布3例新冠肺炎新增确诊病例。其中,一名20岁女性赵某的个人信息却在新闻发布后于网络上广泛传播,其中包含了姓名、身份证号码、家庭住址、照片和行动轨迹等,引发了网友讨论。
实际上,疫情期间,有关行政机关公布病例行踪轨迹不应认定为侵犯隐私权,此举目的在于维护公共利益。但是,部分网友擅自传播其个人信息实属侵犯隐私。同时,对他人的生活方式随意进行评论,无疑是在信息的传播过程中产生了一定的“歧视”。在这次事件中,伴随着数据的高效传播,谣言随之滋生、扩散,谩骂甚至人肉当事人等行为不断发生,个体的权利受到明显地侵犯,隐私保护亟需受到重视,而究其根本,数据侵犯隐私等问题如何解决?更需法律界定数据的边界。
 数据通常|好书·书摘丨“随意转发”成都女孩信息,你知道这到底错在哪
文章插图
《数据的边界——隐私与个人数据保护》
[荷]玛农·奥斯特芬著
曹博译
上海人民出版社
大数据对个人可能产生的负面影响
01
隐私与数据保护
大数据始于数据的收集,包括有关个体的个人数据。因此,大数据有可能对隐私和数据保护的基本权利产生负面影响。
首当其冲的是,在收集个人数据时,数据保护的权利受到威胁。大数据的某些特征,比如强调积累尽可能多的个人数据,以便为含糊不清或未来的目标展开持续分析,这与个人数据保护的原则背道而驰。大数据固有的这些特征与旨在保护个人的数据保护原则相冲突,比如目的限制原则,该原则指出个人数据只能被用于预先确定的特定目的。此外,数据的收集可以揭示一个人生活的私密细节,在应用阶段所作的决定也会影响隐私权。总之,大数据有可能像其他任何数据收集开发或技术一样侵犯人们的隐私权和数据保护权。然而,大数据的一些特点使得它与隐私和数据保护息息相关。
大数据的第一个突出的、有问题的特征是收集和处理的数据体量。从大数据从业者的角度来看,收集更多的数据通常被认为是更好的选择,但收集的数据越多,对个人私生活的潜在侵扰就越严重。更多的数据通常会产生对个人更深入的了解。随着数据量的增加,通过数据安全和匿名化来保护人们的隐私和个人数据也变得更加困难。此外,这与数据保护法的最小范围原则相抵触,该原则要求个人数据必须“是充足的、相关的并限于数据处理目的最小必要范围”。有人质疑,当前实现最小范围原则的方式,在大数据的环境下是否能够成立。
 数据通常|好书·书摘丨“随意转发”成都女孩信息,你知道这到底错在哪
文章插图
大数据的不同还体现在多个不同来源的数据被整合到一个数据集合。数据集合本身并不是一种新的风险,但这种方式越来越普遍且结果难以预测。在整合数据的基础上,可以作出新的推断:数据的组合可以“创建”关于个人的新数据。这种结合对大数据产生新的隐私问题方面的第三个特征也很重要:它的预测能力。这是大数据应用阶段的关键。前文中描述的预测模型和自主学习算法可以在个人并未主动提供的情况下生成个人数据;这些数据可能准确预测某人未来生活的细节。这就产生了数据保护和隐私问题,因为个人与他人之间可能存在认知鸿沟,他人可能比本人更了解自己。个人有时并不愿意公开某些数据,例如涉及某些不治之症(患病几率增加)时。人们可能有不想知道的意愿,而其他拥有这种知识的人可能也会干扰这种意愿。在应用阶段,许多风险和负面影响不是来自个人数据处理本身,而是来自大数据(结果)对个人的应用。
02
歧视
人们普遍认为,大数据可能会产生歧视性影响,但歧视如何发生以及为什么会在大数据中发生是一个复杂的问题。它可能源于大数据处理的不同阶段,可能是有意为之,也可能是无心之失,可能是直接的,也可能是间接的,亦有可能是将现有的偏见和不平等转化到数字领域,甚或是在社会上造成新的歧视性分化。大数据能够对人们进行归并和详细分类,以及实现对个体的个性化对待。因此,它可能导致(有意或无意的)歧视。