点了“我不是机器人”后，网站怎么知道你真的是人？( 二 ) ：点了“我不是机器人”后

文章图片
和英文、数字验证码不同的是，中文验证码更多是给人心理上的折磨。

文章图片
2017年，成都大学的一名大四女生，在网上准备报名考研。输完用户和密码后，她的屏幕上弹出两个字的中文验证码：
“别考。 ”

文章图片
后来官方表明“纯属巧合”
关于这种初级形态的验证码，类似的问题无时无刻在困扰着网民们。而验证码又对网络环境而言来说是个不可或缺的存在。
每位网民都要在验证码上花费几秒时间，看似成本短暂，但叠加起来又是一个巨大的量级。
根据统计数据，全球网民每天需要输入近2亿次验证码，每次需要花费十秒。算起来，全人类每天会在验证码上花费50万个小时。
验证码最初的发明者，路易斯·冯·安恩发现这个事实后，深感浪费——毕竟时间就是金钱。而这50万小时的资源，就这样白白浪费掉了。

文章图片
他现在是多邻国的创始人
这听起来似乎是天方夜谭，但路易斯·冯·安恩通过一个简单的小方法实现了。
他把验证码需要输入的单词改为两个，其中一个是已知答案的单词，另一个是摘自旧书或手稿中的单词。

文章图片
已知答案的单词是单纯的验证码，如果用户成功输入，那就已经通过了测试。

文章图片
于此同时，这也意味着这名用户不是瞎打的字。那么用户所辨认的另一个截取自古书籍的单词的内容，也将被记录为有效答案。如果有3位用户对一个单词给出同样的答案，那么该字就将得到校验。
这个新的验证码机制（reCaptcha）很快被各大网站利用，随后被谷歌收购。每天大约有4000万个单词就这样被辨认出来，这个新的验证码系统，靠着无穷无尽的免费人力资源，每年能读出数十万本书。
这是验证码大战的另一次升级：人类创造脚本来牟利，脚本让人类在验证码上浪费无数时间成本，而聪明的人类又把这份成本有效的利用了。
当然，这并不意味着这场斗争的停止。
3
看图识字型验证码，仅仅维持了一段时间的互联网和平。验证码农场的诞生，开始带来一些改变。
这种质朴的方式的确扰乱了大环境，但带来的改变并没有那么致命。

文章图片
在2014年，谷歌发布新的研究成果，一个专门用来解读扭曲验证码内容的算法。
最后测试的结果中，机器解读验证码成功率99.8% ，而人类的成功率，是33% 。
在绝对的技术面前，人力再一次落败。但这当然不是验证码的陌路。
2014年， Google发布了新一代验证码技术，他们将其称为：“NoCAPTCHAreCAPTCHA”——“没有验证码的验证码” 。
这个没有验证码的验证码十分简单，只需要你勾选一个按钮，来“证明”自己不是机器人。
这就是如今我们常常看见的“我不是机器人” 。

文章图片
“我不是机器人”看起来简单方便，只需用户轻轻一点。但背后的逻辑要比普通验证码复杂许多。
当你点击“我不是机器人”时， Google将会分析你的各种行为，包括点验证码前、点验证码时、点验证码后的动作，来判断你是不是人类。
它也会收集一些你的数据，比如指针移动速率，当前IP ，是否使用插件，页面使用时间，进行过多少次点击……

文章图片
如果你展现出来的行为，都符合一个人类的标准，那网页就会放行。
基本上可以这样说：这是用一小部分隐私换来的快捷。
而且有意思的是，这种测试对于真正的（物理）机器人来说反倒不太有效。

文章图片
当然，有时Google也无法单纯从你的行为来确认你是否为人类，而这时就会出现图片测试，要求用户选择图片中出现的XX 。