如何看待大数据时代的利与弊 论大数据时代的利与弊

要谈大数据时代的利与弊,首先要认清楚大数据的本质,只有统一了对大数据的认知,才能区分那些事大数据,那些是打着大数据的幌子在做事 。在此基础上,以下是我个人对大数据的认知 。
一、什么是大数据
大数据可以分为两类,一类是硬储存数据,用现实社会类比,这一类的数据可以理解为客观事实,他们是现实社会的高楼大厦、山水风光、浩然星空 。这些数据是互联网的基础,载体是数据库,这些数据可能是文字、图片、视频,也可能是一段代码一个游戏一个应用,软件网站app及其中的内容等共同构成了这个虚拟世界,随着这个网络世界不断膨胀,映射到现实社会的是硬性的要求:储存空间、传输速度及网络世界对现实世界的需求 。另一类是检索数据,对比了成为软数据,类比是现实中人在现实中的活动:在城市中穿行,体验一段经历,游览一处风景,简单说就是人的活动痕迹 。这些数据来源于我们对硬数据的需求:查找论文、阅览图书照片、看视频看电影、一次网上检索一次购物一次付费……这里体现的是我们对第一类硬数据的需求和运用,是我们在网络上的活动轨迹,这个数据是我们对硬数据的反馈,就像一个景区的游览人数、一个公司的客户购买记录、一次旅行的飞机票、一次在路上对陌生人的点头微笑,我们将这个称为需求或满足的过程,不同的是现实世界可能是人过留名雁过留声,网络世界里则可能是转化成硬数据记录,或最终被当做冗余数据删除 。这类数据在早期的网络上是没有存在价值的,但随着硬件的发展,数据处理能力的提升,当这些数据被当做内容来处理时,互联网发现了新的与现实接触点,也成了第三个大数据概念即将人们在于网络上的软数据当硬数据统计处理同时根据将第一类硬数据衔接到第二类数据前,即在满足需求上的引导需求超越需求,用现实类比的话就是销售员导购员、是广告是舆论,他们不断将我们关心的留意的推到人们身边眼前甚至占据我们整个世界,就像我们在购房处、在4s店、在保险公司等留下的电话号码,之后面对的是无穷尽的推广电话……这个大数据来源就是硬数据对软数据的统计共享,这个就是现在网络的样子 。而这三类数据的分类基础也代表着网络世界盈利模式的变迁:最早的数据储存盈利到流量为王再到现在的大数据导现,这是基础网络世界的变现方式 。
二大数据时代的利与弊
按照我上面对大数据的理解这个利弊主要就是第三类数据的讨论,即我们在网络上的浏览检索交流数据被利用的利与弊 。这里依旧分开来看,首先从利来说针对个人的数据统计推送让我们更容易满足需求:我想买的商品、关注的事物、焦点舆论、阅读的习惯、学习内容等;对企业用户而言更有针对性的产品开发、更形象的客户画像、更贴近的产品推广等;对社会来说更好的风险控制舆论导向甚至社会自我评价等 。从反面来说这些数据建立的基础是人们在网络上的购买记录、检索记录、交流记录……这些记录是我们每个人在网络这个环境中的画像,这是个体在网络上的映射,就像我们对周边人的评价贴的标签——这些在现实中可能只藏于我们脑海心底,但在大数据面前裸露无疑 。大数据最大的弊端就是隐私,因为大数据的对象是网络世界里的硬数据软数据分析处理 。另一个弊端是大数据引导带来的思维局限,定向推送会狭隘我们对全面客观信息的接触,即大数据会导致信息投其所好导致个体接受信息片面,这个可能会影响到人的个体意识成长 。
补充下现行大数据下个人隐私为什么得不到保护和大数据可能面临的立法规范 。
在实名网络下我们的cooking不受自己控制,就像走在路上我们不可避免被监控看到,就算拒绝网络也避免不了,当下和网络扯不上关系的活动不多 。维护个人隐私避免大数据过度侵犯私权利只能依赖两方面:


一、大数据行业建立职业道德规范,规范行业数据收集使用,健全行业私人数据保护体系 。大数据收集使用不能适用明确个人,即大数据收集只能适用在泛领域而不能对个人进行定向画像推送,这是最基本的一点 。


二、国家层面的立法保护个人私权利,严格管控大数据涉私方面的信息收集,在法律层次对个人网络隐私予以保护,明确处罚溯源责任,从根源谁收集谁泄露谁承担责任接受处罚 。


【如何看待大数据时代的利与弊 论大数据时代的利与弊】但是可以确定的是指望行业自觉保护私人隐私很难,只有立足法律层次规范大数据使用范围,即数据统计不下个体,不能将大数据明确到个体来应用,大数据只能承担统计、趋势、分析等方面的需要而不能成为定向供需的依据,才是大数据不侵犯个人隐私的原则基础,只有在这个基础得到国家认可和立法支持才能谈行业道德和个人隐私如何不受大数据侵犯以及之后的违法应用大数据的处罚 。现行司法空缺和大数据使用不规范是个人隐私被滥用的根本原因 。