Science经典回顾：计算社会科学宣言( 三 )

计算社会科学研究障碍
在研究范式上，现有的解释人类行为的理论和范式是在无法获取和处理几千万兆的人类交互信息数据的时候发展和建立起来的。比如说，基于几十个人某一时刻的数据而建构的社会网络理论如何能解释上百万人之间的相互关系呢？关于人们如何互动的大量新兴数据可以为研究人类的集体行为提供新的视角，但我们目前社会科学的研究范式并不一定会接受。
推进计算社会科学还存在着很多制度性障碍。计算社会科学与物理和生物学的研究问题不同，在观察与干预研究对象过程中也存在着不同的挑战。在物理学和生物学实验中，夸克和细胞不像人类一样，会因为别人的观察而不自觉或者刻意的掩盖自己的行为，它们乖乖的听从人类的干预而不会反抗。
就基础条件而言，从社会科学到计算社会科学所要解决的困难要比从生物学到计算生物学之间克服的困难大得多，究竟为什么会这样呢？主要是从社会科学到计算社会科学的发展需要解决分布式监控、数据使用许可权获取和加密等问题，在社会科学领域中这些资源都较为缺乏。
也许最令人头疼的问题还是数据的获取和保护，目前很多研究所需数据都涉及到个人隐私。以美国AOL公司事件为例[13] ，在2006年8月， AOL公司公布了2006年3月1号到5月31号这3个月用户的真实搜索记录，包括1900万搜索， 1080多万不一样的搜索词，还有65万8000个用户ID（美国AOL公司是一家在线信息服务公司，可提供电子邮件、新闻组、教育和娱乐服务，并支持对因特网访问， 2015年被威瑞森通信（Verizon Communications）收购）。
虽然用户的ID是匿名的，但如果你足够细心认真的话，还是可能从这8000多个用户中发现足够多的信息。有一位采访人员就从搜索的地址和姓名中快速找到了一位62岁的老太太，并且老太太证实了那些罗列出来的搜索词确实是她的。你还可以从搜索词中看到这样一些关键词（来源：https://www.seozac.com/other-se/aol-data/）
1. 怎样炸掉一栋楼
2. 怎样给别人下药
3. 怎样制造炮弹
4. 怎样攻入别人的电脑
5. 怎样杀死太太
6. 怎样杀人能够不留痕迹
.......
AOL公司做出的这件蠢事给社会带来了一场大混乱，虽然该网页几个小时之后就被撤下，但数据却被网友们在互联网上广泛传播，这也为私人公司擅自分享私人数据敲了警钟。

本文插图
设想现在，如果谷歌、百度、天猫、腾讯、京东等互联网巨头突然公布了所有人的搜索记录、聊天记录、购物记录等，更不幸的是，如果你浏览器的登录昵称是你的真实名字，同时你多次在浏览器中搜索你家附近的加油站、超市等信息，并且在天猫购物平台中多次输入你的地址，那么你可能很快就被定位。根据你的搜索记录，你将被贴上各种各样的标签， “房奴”“彩妆迷”以及“二次元”等。更可怕的是，你的电话可能会被各种销售公司打爆，生活将变得一塌糊涂。