陈根|从技术中立到法律边界，陈根：爬虫获罪几重路径( 二 ) 文/陈根数字经济时代

网络爬虫按授权情况又可分为合法爬虫和恶意网络爬虫。
合法爬虫指在遵守网站的机器人协议（robots.txt）前提下，对网页或网络公开接口进行爬取，其爬取行为不会影响网站的正常运行，对网站数据的爬取也不会侵犯网站用户的个人信息和网站的重要数据资源。恶意爬虫则会突破网站机器人协议的禁止爬取要求（规定在robots.txt文件的Disallow部分），爬取网站的核心数据资源，并可能极大地损耗被爬取网站服务器的性能。

文章图片
爬虫获罪具体路径
事实上，作为一项互联网技术，爬虫行为本身并不违法，甚至很多信息类网站的基础技术就是爬虫程序。然而，当技术中立受到商业偏好的影响时，非正当爬虫行为则对云空间中的各类数据形成安全性冲击，进一步更深地影响到包括个人权、知识产权在内的合法权益。
第一，从网络爬虫对个人信息权的侵犯来看，大数据时代，多数公民的个人信息都是以电子数据的形式存储于计算机信息系统或者网络之中，易被网络爬虫抓取。个人信息区别于普通数据的最大特征在于其与信息主体存在某种关联性、专属性，能识别特定个人，具有侵犯信息自决权的隐忧。根据我国刑法第二百五十三条之一第三款规定，窃取或者以其他方法非法获取公民个人信息的，构成侵犯公民个人信息罪。
此外，大数据时代下对个人数据的财产化旨在保障数据主体能从对自身数据的收集、利用中获益，并强化数据本身的经济驱动功能，以打破传统隐私权、信息权过度保护而阻碍数据流通的僵局。但财产权保护只能说明个人数据法律保护的必要性，却不能作为采取绝对权保护模式的依据，且当前我国司法实务中亦无判决认可个人数据的财产权属性，可见个人数据的财产权保护进路与现实生活经验、需求并不吻合。这导致以个人数据财产侵权来追究网络爬虫民事责任难以实现。
第二，对于企业来说，如果是被爬取方，则其依托相关数据而享有的知识产权等可能会因此受到侵害。在知识产权领域，企业数据的权利类型主要涉及著作权、专利权、商业秘密等。其中，著作权保护仅针对企业数据中具有“独创性”的作品部分，而不包括缺乏独创性的企业数据编排；专利权保护仅针对具有鲜明技术属性并能解决一定技术问题的大数据运算程序，但不包括缺乏新颖性、非显而易见性和实用性的企业数据编排；商业秘密保护仅针对具有价值性、新颖性和保密性的企业数据，而不包括缺乏新颖性、秘密性的企业原初数据。
上述技术特征导致实务中通过知识产权保护对网络爬虫提起诉讼存在较大障碍。对于企业数据的财产权保护，主要考虑数据经营者通过对数据的收集、加工、利用、交易等而形成了动态的使用、利益关系，获得了数据资产的经营权和资产权。这种财产权旨在安排一种鼓励企业数据经济化的私有结构，以体现企业数据的可支配性和排他占有性私益，却又面临相关财产权的控制、分享、救济难题。
对数据“权利化”的私法保护进路是通过对个人数据、企业数据的迭加式赋权来回应数据主体的利益诉求，却在权益层级方面（民事权利或利益）和权益属性方面（人格权、财产权）历经旷日持久的争论，这就导致网络爬虫的民法规制在权利确定、行为边界和权利救济上都相当困难。其根本原因在于，私法赋权忽略了数据本身的无形性、可分享性、公共性特点以及数据必须通过分享来实现自身价值的客观事实。因而，基于数据的流动性、共享性对数据的开放程度及其公共秩序建构成为规制网络爬虫的另一个重要手段。
第三，大数据背景下，网络爬虫的不正当使用或侵害的公平、自由的数据竞争秩序。从竞争法的角度而言，规制数据竞争的核心目标是维护数据要素市场的竞争秩序和竞争机制，这既需要兼顾数据控制方与数据使用方的利益诉求，也需要均衡数据资源的产出激励效率和配置使用效率。