少年一梦|手把手教你如何使用Python执行js代码

为什么要引出Python执行js这个问题?都说术业有专攻 , 每个语言也都有自己的长处和短处 。 在爬虫方向 , Python绝对是扛把子 , 近几年随着AI的火爆 , 需要各种各样的数据 , 所以 , 爬虫需求也跟着水涨船高起来 。
我们做爬虫的当然是爬的爽 , 但是估计人家后台在骂街 , 毕竟谁都不希望自己的数据被弄走 , 所以后台反爬技术也在快速提升 , 一攻一防就这么在拉锯着 。
现在为了防止反爬 , 前端使用的反爬技术比较多的是js代码混淆 。
什么是js代码混淆?正常代码
我们现在看一段js代码 , 代码逻辑很简单 , 就是拼接时间返回 。
functionformatDate(now){varnow=newDate(1230999938);varyear=now.getFullYear();varmonth=now.getMonth()+1;vardate=now.getDate();varhour=now.getHours();varminute=now.getMinutes();varsecond=now.getSeconds();returnyear+"-"+month+"-"+date+""+hour+":"+minute+":"+second;}运行一下这段代码 , 如下图所示 。
js代码
functionformatDate(mz1){varKkkGDiH2=newwindow["x44x61x74x65"](1230999938);vartsk3=KkkGDiH2['x67x65x74x46x75x6cx6cx59x65x61x72']();varYMreyP4=KkkGDiH2['x67x65x74x4dx6fx6ex74x68']()+1;varOzo5=KkkGDiH2['x67x65x74x44x61x74x65']();varQMYEc$eD6=KkkGDiH2['x67x65x74x48x6fx75x72x73']();varJfXVV_Akq7=KkkGDiH2['x67x65x74x4dx69x6ex75x74x65x73']();var$mP8=KkkGDiH2['x67x65x74x53x65x63x6fx6ex64x73']();returntsk3+"x2d"+YMreyP4+"x2d"+Ozo5+""+QMYEc$eD6+"x3a"+JfXVV_Akq7+"x3a"+$mP8上面这个真的不是我瞎写的 , 混淆之后就是这样子的 , 不信看图片 。
这就造成了一个问题 , 我们在做爬虫时 , 如果需要 , 多多少少可能都要研究一下js代码 , 然后进行js解密一下 , 但是 , 但是 , 要是代码都混淆成了这了 , 还怎么解?
一点逻辑都看不通了 , 基本上不可用Python按照js逻辑重写出来了...
很巧 , 小编也是卡在这里...后来我就想 , 要是Python能执行js代码就好了 , 不用管函数里面的逻辑了 , 只拿函数返回值就好了 。
Python第三方包Execjs可能是吧 , 不止我一个人遇到了这种情况 , 所以大佬们就开发出来这种工具包 , 用于执行js代码 。
安装在安装之前 , 需要有node环境 , 这里就不举栗子了 , 下一步下一步就好了 。
pip3installPyExecJSExecjs用法超级简单的 , 几行代码 。
执行js注:由于上述js代码会生成window对象 , 并不能直接执行成功 , 需要额外的其他辅助 , 这里简单的举一下其他例子 。
正常js代码
functionadd(x,y){returnx+y;}Python执行js代码
importexecjsctx=execjs.compile("""functionadd(x,y){returnx+y;}""")print(ctx.call("add" , 1,2))执行结果如下图所示:
importexecjsctx=execjs.compile("""functionadd(bi1,Pl$2){returnbi1+Pl$2}""")print(ctx.call("add" , 1,2))执行结果如下图所示: