『大数据』从健康码出发,聊聊大数据的利与弊


疫情期间 , 健康码的采用让使疫情防控更加高效、精准 。 这背后 , 是大数据技术在发挥作用 。 但是 , 大数据在为生活带来便利的同时 , 我们的隐私可能也会受到威胁 。 文章从大数据的概念出发 , 对其利弊进行了分析 , 并总结了它带来的机遇 。
『大数据』从健康码出发,聊聊大数据的利与弊
本文插图
2020年 , 疫情的爆发使健康码在各大城市相继使用 , 健康码是以真实数据为基准 , 识别人员是不是直接或间接接触过一些感染者 , 从而判断人员是否需要隔离排查 。
杭州市委副书记在接受新闻采访时表示 , 健康码的评判来源于三个维度:空间维度、时间维度和人际关系维度 。 这说明了健康码的生成充分利用了用户的数据 , 虽官方暂未公开数据使用的详情 , 但猜测健康码会结合用户的人际关系数据、GPS定位数据、电信运营商数据、消费记录数据、线下扫码位置数据等相关信息 , 进而判断人员是否出入高危场地 。
健康码的应用 , 属于大数据技术的典型案例 , 网络服务提供者利用收集到的用户数据 , 预测用户的健康情况 , 使疫情防控更加高效、精准 。
人们在享受大数据带来便利的同时 , 若网络服务提供者不按照规定使用用户数据 , 也将对用户造成骚扰 , 威胁到用户的隐私信息 。
一、到底什么是大数据“任何理论首先必须澄清杂乱的 , 或者说是混淆不清的概念和观念 。 只有对名称和概念有了共同的理解 , 才能清楚而顺利地研究问题” 。 ——克劳塞维茨《战争论》
李笑来曾经提及过 , 在写《韭菜的自我修养》这本书之前从来不会使用“韭菜”一词 , 因为没有弄清“韭菜”一词的定义 , 在没有弄清一个词的定义之前 , 不应该随便使用 。
自从大数据概念被提出 , 我们已经广泛使用了这么多年的“大数据” , 那么“大数据”的具体概念应该是什么?
现实世界中 , 有很多词汇是没有官方定义的 , 比如“人工智能” , 没有哪个机构说他们定义的就是正确的“人工智能”概念 。 在不同的时代里人们对人工智能的定义也是不同的 , 上个世纪60年代 , 人们认为可以下跳棋的计算机就是人工智能 , 但现在看来这个说法显然是无法被人们接受的 。
相同的 , 大数据的定义 , 也没有一个官方机构明确地说明什么就是“大数据” 。 早些年对于政府机构来说 , 数据汇集也叫做大数据 , 而后出现了一些数字办、大数据局等新成立的单位 , 把各地方、各单位的数据汇聚起来 , 以发挥后续政府数据的价值 。 对于金融机构来说 , 可以通过用户的行为进行用户画像就是大数据 , 通过用户的行为数据 , 判断用户的偿还能力及偿还意愿 , 识别用户贷款的风险 。
麦肯锡对大数据给出的定义是:“一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合 。 ”在《大数据时代》中 , 大数据指“不用随机分析法 , 而是采用所有数据进行分析处理 。 ”IBM提出 , “大数据是具备5V的特性数据 , 5V包括:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性) 。 ”在上述基础上 , 业内人士已将大数据拓展成了“十字特性” , 即:一“大” , 二“杂” , 三“全” , 四“多” , 五“快” , 六“久” , 七“活” , 八“简” , 九“稀” , 十“联” 。
大数据的定义如此之多 , 致使每个人心中都有对大数据的不同理解 。 如今多数情况下 , 人们提到大数据 , 都是在特指通过数据分析 , 可以得到数据中的价值 , 具体价值可以是协助人们进行决策判断 , 预测未来事情的变化 , 发现事务中的关联性等价值体现 。 本文所说的大数据 , 就是在遵循这样的描述 。
二、大数据的“利” 1. 预测 预测是自古人们都在向往的活动 , 生活中的预测无处不在 , 比如通过概率分析法预测彩票的中奖号码 , 通过价值分析法预测股价的走势 。