『大数据』从健康码出发,聊聊大数据的利与弊( 二 )


古代人们利用占卜进行预测 , 就是通过多年观察到的事务变化 , 结合历史数据总结出来规律 , 应用在后续的占卜活动中 。 占卜并没有科学依据 , 但实际上占卜就体验了人们的大数据思维 , 利用对过往数据的总结 , 不必非得知道现象背后的因果 , 只要知道相关性就可以预测未来 。
古代的中医从业者 , 并没有能力提炼出草药中的成分 , 哪种草药可以抑制哪种疾病 , 完全是在结合大量的实际案例 , 根据经验从数百种种草药中挑选出不同的组合 , 从而医治不同的疾病 。
预测从古代发展到近代 , 出现了利用数学模型预测的方法 , 比如利用过往数据和数学模型的结合 , 预测未来几年的人口增长情况 。
数学模型是用数学符号、公式、方程等对现实世界规律的抽象描述 。 如今的气象预报 , 还在应用数学模型的方法来预测未来的天气 , 气象局会根据气象图的变化趋势 , 结合温度 , 压力 , 湿度 , 风向 , 风速 , 阳光照射情况等 , 应用数学模型预测天气的变化趋势 。
当今的大数据分析 , 就是在结合了占卜和天气预报的方法 , 利用历史数据 , 结合数学模型 , 预测未来、预测结果 。 健康码应用 , 通过我们的电信运营商数据、交通出行数据、交易记录数据等信息 , 预测我们是否为高危感染人群 , 判断是否需要进行隔离观察 , 这就是在预测结果 。 搜索引擎 , 通过用户的搜索喜好 , 预测美国总统的未来人选 , 这就是在预测未来 。
预测是大数据最典型直观的价值体现 , 有时预测也被看作人工智能的范畴 。 在未来 , 利用大数据预测 , 将给人们带来更多的便利 。 利用数据预测可能的疾病 , 以便提早做出预防;利用数据预测学习的缺陷 , 以便精准教育及练习;利用数据预测用户的真实需求 , 从而不需要产品经理来瞎猜(估计到时候我也就下岗了)……
2. 发现相关性 2004年 , 沃尔玛从以往数据中发现 , 在季节性飓风来临之前 , 不仅仅飓风用品的销量会增加 , 而且蛋挞的销量也会大幅增加 。 因此每当季节性飓风来临之前 , 沃尔玛就会把蛋挞商品摆放到飓风用品旁边 , 以便让快速购买飓风用品的顾客留意到蛋挞 , 增加蛋挞商品的销售量 。 沃尔玛的人也并不知道为什么蛋挞就成了飓风来临时的畅销产品 , 但是他们只需要知道飓风来临时沃尔玛的蛋挞会畅销就可以了 , 找到了这个相关性之后即使不用找到背后的原因 , 也可以提升销量 。
大数据时代 , 我们不必非得知道现象背后的因果 , 只需要发现相关性 , 应用到后续的活动中 , 就可以创造巨大的经济或社会价值 。 利用大数据发现相关性 , 可以加快社会的进步 , 加快人们的决策 , 避免了找到“因” , 在想清“果”的繁琐过程 。
三、大数据的“弊” 1. 威胁用户隐私 在大数据时代 , 人们偶然间发现自己的隐私受到了威胁 , 我们的隐私被互联网服务提供商监视着 , 购物应用监视着我们购物习惯 , 搜索引擎监视着我们网页浏览习惯 , 社交软件监视着我们的社会关系 , 理财产品监视着我们的财富……
互联网服务提供商监控着我们的数据 , 利用我们的数据搞“大数据杀熟” , 形成“千人千价” , 从而提高自身的利润 , 受害的却是我们消费者 。 美国国家安全局2007年发起的棱镜计划 , 通过互联网服务器中的数据监听着我们每一个人的一举一动 , 在其面前我们没有隐私可言 , 拥有大量数据的机构 , 知道我们的每一个真实行为 , 有时甚至比我们自己都了解我们 。
互联网服务提供商不合规利用数据对我们造成的影响尚可原谅 , 一旦数据被泄露或非法交易 , 将造成不可预知的后果 。 当今泄露事件层出不穷 , 脸书把用户的点赞数据非法供给了剑桥分析公司 , 间接性对美国大选结果造成一定影响;雅虎2016年泄露15亿人次的用户信息 , 使广大互联网用户的生日 , 电话号码 , 账户密码在暗网流传 , 随时有可能流入不法分子之手 。