数据|温昱:搜索引擎数据痕迹处理中权利义务关系之反思( 二 )


数据痕迹产生于网络用户的网络活动 , 指向同一特定用户的数据痕迹可能来自不同网络用户 。 根据数据痕迹的生产者区别 , 可进一步将数据痕迹区分为用户自身网络活动制造的数据痕迹(简称为“自生型数据痕迹”) , 与用户之外他者网络活动制造但与该用户相关的数据痕迹(简称为“他生型数据痕迹”) 。
(二)搜索引擎工作原理及其间权利义务关系的抽取
1.搜索引擎工作原理
搜索引擎是处理数据痕迹最常用的工具之一 。 按照百度给出的定义 , 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息 , 在对信息进行组织和处理后 , 为用户提供检索服务 , 将用户检索相关的信息展示给用户的系统 。 搜索引擎主要由四个部分组成 , 其工作流程主要有三个步骤 。 这四个部分分别是采集器、分析索引器、检索器和查询器 。 其工作过程的三个步骤分别是:
①爬取、搜集数据 。 搜索引擎派出能够自动收集网页链接的爬虫 , 自动访问一定IP地址内的互联网网页 , 沿着网页中的URL爬到其他网页 。 在重复这一过程中 , 爬虫会持续定期地抓取其爬过的网页 , 并将搜集到的数据存入搜索引擎数据库 , 以此周而复始 , 保证搜索引擎的时效性 。
②建立索引数据库 。 搜索引擎对收集到的原始网页数据进行分析 , 判断网页类型、权重、去重计算 , 把重复网页清洗掉 。 经过分析处理的网页数据不再是爬虫抓取的原始页面 , 而是浓缩成能反映特定主题内容的、以词为单位的文档 , 即搜索引擎索引系统根据一定的算法进行大量运算得到每一个网页针对页面内容及超链中每一个关键词或者某一个文本的相关度 , 然后利用这些文档建立索引数据库 。
③在索引数据库中搜索并排序 。 当用户在搜索引擎界面输入搜索关键词后 , 检索系统会在索引数据库中找出包含搜索词的相关网页 , 并根据事先设定好的算法对网页进行排序 。 在这个过程中 , 检索系统会根据搜索词计算数据库中网页对搜索词的相关度 , 按照相关度数据将相关网页降序排列 , 相关度越高排名越靠前 。 最后由页面生成系统将检索结果的链接地址和页面内容摘要等数据组织起来返回给用户 。
综上 , 搜索引擎工作流程及各部分负担职能 , 如图1所示:
数据|温昱:搜索引擎数据痕迹处理中权利义务关系之反思文章插图
2.搜索引擎工作过程中权利义务关系的提炼
搜素引擎数据痕迹处理的工作原理若仅采上述介绍 , 对于法律人无疑晦涩且难懂 , 所以需要将上述搜索引擎工作原理转化为法律语言表述 , 用“法律人彼此约定一种特定的语言使用方式” , 即以法律关系表达 。 一切法律关系皆可化约为权利与义务 。 所以 , 我们能够用搜索引擎与相对方的权利义务关系表达其工作过程 。 根据搜索引擎的工作流程 , 步骤①、③属于搜索引擎与外界的关联 , 必然引发搜索引擎与不同主体之间的权利义务关系 。 步骤②发生于搜索引擎的内部 , 不涉及搜索引擎之外的其他主体 , 自然也不存在搜索引擎与其他主体之间的权利义务关系 。 搜索引擎数据痕迹处理过程 , 实质上形成了以搜索引擎为中心的三主体、两阶段的权利义务关系:第一 , 被搜集数据痕迹的制造者与搜索引擎之间的权利义务关系;第二 , 搜索引擎与用户之间的权利义务关系 。 如图2如下:
数据|温昱:搜索引擎数据痕迹处理中权利义务关系之反思文章插图
(三)权利义务关系的类型化处理
结合搜索引擎工作过程权利义务关系的上述抽象 , 以及“自生型数据痕迹”与“他生型数据痕迹”的区分可知 , 搜索引擎数据痕迹处理过程存在两种情形 , 即搜索引擎“自生型数据痕迹”处理过程中的权利义务关系以及搜索引擎“他生型数据痕迹”处理过程中的权利义务关系 。 搜索引擎数据痕迹处理过程事实上形成的是以搜索引擎为中心的三主体、两阶段的权利义务关系 。 因此 , 处理两种数据痕迹的情形可进一步细化为:第一 , 搜索引擎“自生型数据痕迹”处理过程中 , “自生型数据痕迹”制造者与搜索引擎之间的权利义务关系 , 以及搜索引擎与用户之间的权利义务关系;第二 , 搜索引擎“他生型数据痕迹”处理过程中 , “他生型数据痕迹”制造者与搜索引擎之间的权利义务关系 , 以及搜索引擎与用户之间的权利义务关系 。
同时 , 由于“自生型数据痕迹”仅为网络用户自己的网络行为产生 , 因此 , 在搜索引擎处理“自生型数据痕迹”过程中存在数据痕迹制造者与用户的混同 , 即用户就是“自生型数据痕迹”制造者 。 此种情形事实上只存在双方主体、用户与搜索引擎 。 在搜索引擎处理“自生型数据痕迹”情形下 , 仅存搜索引擎与用户之间的权利义务关系 。 综上所述 , 搜索引擎处理数据痕迹过程中权利义务关系的类型化结果为:1.搜索引擎处理“自生型数据痕迹”中形成的搜索引擎与用户之间的权利义务关系;2.搜索引擎处理“他生型数据痕迹”中形成的“他生型数据痕迹”制造者与搜索引擎之间的权利义务关系 , 以及搜索引擎与用户之间的权利义务关系 。