Python爬取有道翻译(破解加密--js加密)
1.分析有的数据是通过加密解密得到的 。 加密:把明文变成密文解密:把密文变成明文
常见的加密方式:js加密css加密base64加密
文章插图
文章插图
尝试一下:
import requests# url = ""url = ";smartresult=rule"headers = {'X-Requested-With': 'XMLHttpRequest','User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36','Origin': '','Referer': '/','Cookie': 'OUTFOX_SEARCH_USER_ID=-1808168645@10.108.160.208; JSESSIONID=aaaRyVJv8oEwg7dPaWrux; OUTFOX_SEARCH_USER_ID_NCOO=704285648.1294403; ___rl__test__cookies=1602406917270'}data = http://kandian.youth.cn/index/{'action': 'FY_BY_CLICKBUTTION','bv': '9caf244986fe6d1de38207408302e500','client': 'fanyideskweb','doctype': 'json','from': 'AUTO','i': '你好','keyfrom': 'fanyi.web','lts': '1602406480004','salt': '16024064800043','sign': '726a3e12c15fcb8fda7dbd722a80f94b','smartresult': 'dict','to': 'AUTO','version': '2.1'}response = requests.post(url=url,headers=headers,data=http://kandian.youth.cn/index/data)print(response.content.decode("utf-8"))
文章插图
发现 , 当修改翻译内容的时候 , 得不到想要的结果 。 其实做为一个合格的爬虫开发者 , 应该有敏感性 。
文章插图
断点调试js , 查看变量值 , 再次确认 。
文章插图
var r = function(e) {var t = n.md5(navigator.appVersion)![在这里插入图片描述](,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl81MDg0MzUyMg==,size_16,color_FFFFFF,t_70#pic_center), r = "" + (new Date).getTime(), i = r + parseInt(10 * Math.random(), 10);return {ts: r,bv: t,salt: i,sign: n.md5("fanyideskweb" + e + i + "]BjuETDhU)zqSxf-=B#7m")}};
经过分析 , 确认参数:ts是当前时间戳bv是使用md5加密navigator.appVersion , 只要浏览器不变 , 其实可以是固定的
文章插图
salt是时间戳拼接0-9的随机整数字符串sgin是md5加密的这里的e通过断点调试确认e就是翻译的内容
接下来需要使用python来模拟这些信息:
文章插图
import timeimport randomits = str(round(time.time(),3)).replace(".","")salt = its+str(random.randint(0,9))print(its,salt)
md5算法一般用来做加密 , 不可逆的 。
文章插图
import hashlibcontent = "diyisiifudsifhidfhsdhfsdkhfsdkhfksdhfkshkjdhjskhfksdhfkshfdh哈哈哈哈哈哈哈一hdd"md5 = hashlib.md5()md5.update(content.encode("utf-8"))ret = md5.hexdigest()print(ret,len(ret))
- 第2天 | 12天搞定Python,运行环境(详细步骤)
- Python高级技巧:用一行代码减少一半内存占用
- 手把手教你用python编程写一款自己的音乐下载器
- Python爬虫入门第一课:如何解析网页
- 刷爆全网的动态条形图,只需5行Python代码就能实现
- 让你的输出变得更帅,Python炫酷的颜色输出与进度条打印
- 斐波那契数列:python实现和可视化
- Python 3.9 正式发布!一图秒懂新特性
- Python解决同步验证码模拟登录问题
- Python爬取lol英雄联盟全阵容皮肤