点了“我不是机器人”后,网站怎么知道你真的是人?( 二 )


文章图片
和英文、数字验证码不同的是 , 中文验证码更多是给人心理上的折磨 。

点了“我不是机器人”后,网站怎么知道你真的是人?
文章图片
2017年 , 成都大学的一名大四女生 , 在网上准备报名考研 。 输完用户和密码后 , 她的屏幕上弹出两个字的中文验证码:
“别考 。 ”

点了“我不是机器人”后,网站怎么知道你真的是人?
文章图片
后来官方表明“纯属巧合”
关于这种初级形态的验证码 , 类似的问题无时无刻在困扰着网民们 。 而验证码又对网络环境而言来说是个不可或缺的存在 。
每位网民都要在验证码上花费几秒时间 , 看似成本短暂 , 但叠加起来又是一个巨大的量级 。
根据统计数据 , 全球网民每天需要输入近2亿次验证码 , 每次需要花费十秒 。 算起来 , 全人类每天会在验证码上花费50万个小时 。
验证码最初的发明者 , 路易斯·冯·安恩发现这个事实后 , 深感浪费——毕竟时间就是金钱 。 而这50万小时的资源 , 就这样白白浪费掉了 。

点了“我不是机器人”后,网站怎么知道你真的是人?
文章图片
他现在是多邻国的创始人
这听起来似乎是天方夜谭 , 但路易斯·冯·安恩通过一个简单的小方法实现了 。
他把验证码需要输入的单词改为两个 , 其中一个是已知答案的单词 , 另一个是摘自旧书或手稿中的单词 。

点了“我不是机器人”后,网站怎么知道你真的是人?
文章图片
已知答案的单词是单纯的验证码 , 如果用户成功输入 , 那就已经通过了测试 。

点了“我不是机器人”后,网站怎么知道你真的是人?
文章图片
于此同时 , 这也意味着这名用户不是瞎打的字 。 那么用户所辨认的另一个截取自古书籍的单词的内容 , 也将被记录为有效答案 。 如果有3位用户对一个单词给出同样的答案 , 那么该字就将得到校验 。
这个新的验证码机制(reCaptcha)很快被各大网站利用 , 随后被谷歌收购 。 每天大约有4000万个单词就这样被辨认出来 , 这个新的验证码系统 , 靠着无穷无尽的免费人力资源 , 每年能读出数十万本书 。
这是验证码大战的另一次升级:人类创造脚本来牟利 , 脚本让人类在验证码上浪费无数时间成本 , 而聪明的人类又把这份成本有效的利用了 。
当然 , 这并不意味着这场斗争的停止 。
3
看图识字型验证码 , 仅仅维持了一段时间的互联网和平 。 验证码农场的诞生 , 开始带来一些改变 。
这种质朴的方式的确扰乱了大环境 , 但带来的改变并没有那么致命 。

点了“我不是机器人”后,网站怎么知道你真的是人?
文章图片
在2014年 , 谷歌发布新的研究成果 , 一个专门用来解读扭曲验证码内容的算法 。
最后测试的结果中 , 机器解读验证码成功率99.8% , 而人类的成功率 , 是33% 。
在绝对的技术面前 , 人力再一次落败 。 但这当然不是验证码的陌路 。
2014年 , Google发布了新一代验证码技术 , 他们将其称为:“NoCAPTCHAreCAPTCHA”——“没有验证码的验证码” 。
这个没有验证码的验证码十分简单 , 只需要你勾选一个按钮 , 来“证明”自己不是机器人 。
这就是如今我们常常看见的“我不是机器人” 。

点了“我不是机器人”后,网站怎么知道你真的是人?
文章图片
“我不是机器人”看起来简单方便 , 只需用户轻轻一点 。 但背后的逻辑要比普通验证码复杂许多 。
当你点击“我不是机器人”时 , Google将会分析你的各种行为 , 包括点验证码前、点验证码时、点验证码后的动作 , 来判断你是不是人类 。
它也会收集一些你的数据 , 比如指针移动速率 , 当前IP , 是否使用插件 , 页面使用时间 , 进行过多少次点击……

点了“我不是机器人”后,网站怎么知道你真的是人?
文章图片
如果你展现出来的行为 , 都符合一个人类的标准 , 那网页就会放行 。
基本上可以这样说:这是用一小部分隐私换来的快捷 。
而且有意思的是 , 这种测试对于真正的(物理)机器人来说反倒不太有效 。

点了“我不是机器人”后,网站怎么知道你真的是人?
文章图片
当然 , 有时Google也无法单纯从你的行为来确认你是否为人类 , 而这时就会出现图片测试 , 要求用户选择图片中出现的XX 。